Se dice que Java es 10 veces más rápido que Python en términos de rendimiento. Eso es lo que veo de los puntos de referencia también. Pero lo que realmente reduce Java es el tiempo de inicio de JVM.¿Alguna forma de aumentar la velocidad de inicio de JVM?
Ésta es una prueba que hice:
$time xlsx2csv.py Types\ of\ ESI\ v2.doc-emb-Package-9
...
<output skipped>
real 0m0.085s
user 0m0.072s
sys 0m0.013s
$time java -jar -client /usr/local/bin/tika-app-0.7.jar -m Types\ of\ ESI\ v2.doc-emb-Package-9
real 0m2.055s
user 0m2.433s
sys 0m0.078s
mismo archivo, un archivo incrustado 12 KB ms XLSX dentro docx y Python es 25 veces más rápido !! ¡¡¡WTH !!
Tarda 2.055 segundos para Java.
Sé que todo se debe al tiempo de arranque, pero lo que necesito es que debo llamarlo a través de un script para analizar algunos documentos que no quiero volver a inventar la rueda en python.
Pero a medida para analizar 10k + archivos, es simplemente no es práctico ..
De todos modos para acelerarlo (Ya he intentado opción -client y es sólo la velocidad por tan poco (20%)).
Mi otra idea? ¿Lo ejecuta como un daemon de larga ejecución, se comunica usando sockets UDP o Linux-ICP localmente?
No puedo creer que nadie haya mencionado ** utilice la última versión de Java ** – artbristol
posible duplicado de [¿Cómo acelerar el tiempo de inicio de Java VM (JVM)?] (Http://stackoverflow.com/questions/1491325/how-to-speed-up-java-vm-jvm-startup-time) –