He leído un poco de documentación sobre hadoop y he visto los impresionantes resultados. Tengo una visión más amplia, pero me resulta difícil si se ajusta a nuestra configuración. programación isnt pregunta relacionada, pero estoy deseoso de obtener la opinión de las personas que actualmente trabajan con Hadoop y cómo encajaría nuestra configuración:pregunta de principiantes de hadoop
- Utilizamos Oracle para backend
- Java (Struts2/servlets/iBatis) para frontend
- Cada noche obtenemos datos que deben resumirse. esto se ejecuta como un proceso por lotes (toma 5 horas)
Estamos buscando una manera de reducir esas 5 horas a un tiempo más corto.
¿Dónde encajaría hadoop en esta imagen? ¿Podemos seguir usando Oracle incluso después de hadoop?
¿Qué volumen de datos [GB o TB] y qué tipo de resumen? –
sqoop es una buena herramienta si necesita datos de Oracle para importar a hadoop – wlk