2010-03-12 11 views
10

Supongamos que tiene un proyecto pequeño que en la superficie parece una buena combinación para una herramienta de ETL como Talend.Straight Java/Groovy versus herramienta ETL (Talend/etc): ¿qué bibliotecas usarías?

Pero supongamos además que nunca ha usado Talend y, además, no confía en las herramientas de "programación visual" en general y prefiere codificar todo a la manera antigua (texto en un IDE agradable) con la ayuda de un lenguaje apropiado & bibliotecas de soporte.

¿Cuáles son algunos patrones de lenguaje & bibliotecas de soporte que podrían ayudarlo a mantenerse alejado de la tentación/trampa de la herramienta ETL?

+1

ETL: extraer, transformar, cargar. http://en.wikipedia.org/wiki/Etl – Thilo

+1

me encontré con este enlace útil cuando estaba tratando de tomar esa decisión: [Universidad Kimball: Los subsistemas de ETL Revisited] (http://www.informationweek.com/news/software/bi/202405400? queryText = subsystems + etl + revisited) – Bradford

Respuesta

0

Dependiendo del tamaño del esquema de base de datos, se pueden mapear todo muy rápido en Hibernate y sólo tiene que utilizar el modelo de objeto resultante para hacer su trabajo (dependiendo de lo que desea la herramienta ETL para todos modos)

2

pienso esta es una combinación bastante buena para los marcos inspirados en Rails, como Grails on Groovy o Lift on Scala.

5

Depende de si la entrega es el procesador o la salida en sí. Si solo necesita entregar la salida, no necesita mantener el código. Si el código necesita ser mantenido, ¿será usted quien lo mantenga o alguien más?

Si alguien necesita mantener que haría uso de Java o darles Talend.

Si se trata de código de usar y tirar, que haría uso de lo que será más fácil o divertido para programar con.

Si necesita mantenerla así como el tratamiento es complejo, que haría uso de Scala. Dispone de:

  • some libraries para interactuar con bases de datos
  • literales XML
  • combinadores analizador
  • características interesantes en sus paquetes de colecciones (mapa, filtro, GroupBy, partición, ...)
  • y por supuesto, cualquier otra biblioteca Java existente.
+0

He comprobado el código generado Talend ... ¿Estás seguro de que se puede mantener después de la creación? – yura

+0

@yura, Acabo de ver brevemente * Talend * y no lo he usado personalmente. Cuando quise decir que las definiciones y configuraciones de Talend podrían mantenerse (no necesariamente el código generado). – huynhjl

+0

De acuerdo, solo quería saber su opinión sobre si los lenguajes visuales (como Talend o Pentaho) se pueden usar para reglas de ETL complejas que requieren soporte y mantenimiento a largo plazo. – yura

4

Yo solía pensar que la "programación visual" es algo para las personas que no pueden programar. Luego estuve expuesto a Talend en un proyecto, y me di cuenta de que este tipo de herramienta es exactamente adecuada para el trabajo, cuando se trata de mover datos de A a B y transformarlos en el proceso. Es un diseño de software orientado a componentes, por una etiqueta más académica.

Todavía me considero un programador decente que puede hacer algo, y algo más, con un editor de texto y el intérprete de comandos. Pero también me he convertido en un gran admirador de Talend.

La revelación completa: ahora trabajo para la empresa :-)

4

Salida DataExpress. Es un kit de herramientas de ETL entre bases de datos y basado en Scala.

Cuestiones relacionadas