Esto ha sido una queja de larga data con Java, pero en gran medida no tiene sentido, y generalmente se basa en buscar la información incorrecta. El fraseo habitual es algo así como "¡Hello World on Java toma 10 megabytes! ¿Por qué necesita eso?" Bueno, aquí hay una manera de hacer que Hello World en una afirmación JVM de 64 bits tome más de 4 gigabytes ... al menos en una forma de medición.
java -Xms1024m -Xmx4096m com.example.Hello
Diferentes formas de medir la memoria
En Linux, el comando top le da varios números diferentes para la memoria. Aquí está lo que dice sobre el ejemplo Hello World:
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
2120 kgregory 20 0 4373m 15m 7152 S 0 0.2 0:00.10 java
- VIRT es el espacio de memoria virtual: la suma de todo en el mapa de memoria virtual (ver más abajo). En gran medida no tiene sentido, excepto cuando no lo es (ver abajo).
- RES es el tamaño del conjunto residente: el número de páginas que actualmente residen en la memoria RAM. En casi todos los casos, este es el único número que debe usar cuando dice "demasiado grande". Pero todavía no es un número muy bueno, especialmente cuando se habla de Java.
- SHR es la cantidad de memoria residente que se comparte con otros procesos. Para un proceso de Java, esto generalmente se limita a bibliotecas compartidas y archivos JAR mapeados en memoria. En este ejemplo, solo tenía un proceso en ejecución Java, así que sospecho que el 7k es el resultado de las bibliotecas utilizadas por el sistema operativo.
- SWAP no está activado de manera predeterminada, y no se muestra aquí. Indica la cantidad de memoria virtual que reside actualmente en el disco, ya sea que esté o no en el espacio de intercambio. El sistema operativo es muy bueno para mantener páginas activas en la RAM, y las únicas soluciones para el intercambio son (1) comprar más memoria, o (2) reducir el número de procesos, por lo que es mejor ignorar este número.
La situación del Administrador de tareas de Windows es un poco más complicada. En Windows XP, hay columnas de "Uso de la memoria" y "Tamaño de la memoria virtual", pero el official documentation no dice nada sobre lo que significan. Windows Vista y Windows 7 agregan más columnas, y en realidad son documented. De estos, la medida "Working Set" es la más útil; corresponde aproximadamente a la suma de RES y SHR en Linux.
La comprensión de la memoria virtual Mapa
La memoria virtual consumida por un proceso es el total de todo lo que está en el proceso de asignación de memoria. Esto incluye datos (por ejemplo, el montón de Java), pero también todas las bibliotecas compartidas y los archivos mapeados en memoria utilizados por el programa. En Linux, puede usar el comando pmap para ver todas las cosas mapeadas en el espacio de proceso (a partir de ahora solo me voy a referir a Linux, porque es lo que uso, estoy seguro de que hay herramientas equivalentes para Windows). Aquí hay un extracto del mapa de memoria del programa "Hello World"; todo el mapa de memoria tiene más de 100 líneas, y no es inusual tener una lista de mil líneas.
0000000040000000 36K r-x-- /usr/local/java/jdk-1.6-x64/bin/java
0000000040108000 8K rwx-- /usr/local/java/jdk-1.6-x64/bin/java
0000000040eba000 676K rwx-- [ anon ]
00000006fae00000 21248K rwx-- [ anon ]
00000006fc2c0000 62720K rwx-- [ anon ]
0000000700000000 699072K rwx-- [ anon ]
000000072aab0000 2097152K rwx-- [ anon ]
00000007aaab0000 349504K rwx-- [ anon ]
00000007c0000000 1048576K rwx-- [ anon ]
...
00007fa1ed00d000 1652K r-xs- /usr/local/java/jdk-1.6-x64/jre/lib/rt.jar
...
00007fa1ed1d3000 1024K rwx-- [ anon ]
00007fa1ed2d3000 4K ----- [ anon ]
00007fa1ed2d4000 1024K rwx-- [ anon ]
00007fa1ed3d4000 4K ----- [ anon ]
...
00007fa1f20d3000 164K r-x-- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so
00007fa1f20fc000 1020K ----- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so
00007fa1f21fb000 28K rwx-- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so
...
00007fa1f34aa000 1576K r-x-- /lib/x86_64-linux-gnu/libc-2.13.so
00007fa1f3634000 2044K ----- /lib/x86_64-linux-gnu/libc-2.13.so
00007fa1f3833000 16K r-x-- /lib/x86_64-linux-gnu/libc-2.13.so
00007fa1f3837000 4K rwx-- /lib/x86_64-linux-gnu/libc-2.13.so
...
Una explicación rápida del formato: cada fila comienza con la dirección de memoria virtual del segmento. Esto es seguido por el tamaño del segmento, los permisos y el origen del segmento. Este último elemento es un archivo o "anon", que indica un bloque de memoria asignado a través del mmap.
A partir de la parte superior, que tienen
- El cargador de JVM (es decir, el programa que se ejecuta cuando se escribe
java
). Esto es muy pequeño; todo lo que hace es cargar en las bibliotecas compartidas donde se almacena el código JVM real.
- Un montón de bloques anón que contienen el montón de Java y los datos internos. Esta es una JVM de Sun, por lo que la pila se divide en varias generaciones, cada una de las cuales es su propio bloque de memoria. Tenga en cuenta que la JVM asigna espacio de memoria virtual basado en el valor
-Xmx
; esto le permite tener un montón contiguo. El valor -Xms
se usa internamente para indicar qué parte del montón está "en uso" cuando se inicia el programa y para desencadenar la recolección de elementos no utilizados cuando se llega a ese límite.
- Un archivo JAR mapeado en memoria, en este caso el archivo que contiene las "clases JDK". Cuando asigna un mapa de memoria a un JAR, puede acceder a los archivos dentro de él de manera muy eficiente (en lugar de leerlo desde el principio cada vez). Sun JVM mapeará en memoria todos los JAR en classpath; si su código de aplicación necesita acceder a un JAR, también puede mapearlo en la memoria.
- Per-thread data for two threads. El bloque de 1M es una pila de hilos; No sé lo que entra en el bloque 4K. Para una aplicación real, verá docenas o cientos de estas entradas repetidas a través del mapa de memoria.
- Una de las bibliotecas compartidas que contiene el código JVM real. Hay varios de estos.
- La biblioteca compartida para la biblioteca estándar C. Esta es solo una de las muchas cosas que carga la JVM que no son estrictamente parte de Java.
Las bibliotecas compartidas son particularmente interesantes: cada biblioteca compartida tiene al menos dos segmentos: un segmento de solo lectura que contiene el código de biblioteca y un segmento de lectura y escritura que contiene datos globales por proceso para la biblioteca (I no sé cuál es el segmento sin permisos, solo lo he visto en Linux x64). La parte de solo lectura de la biblioteca se puede compartir entre todos los procesos que usan la biblioteca; por ejemplo, libc
tiene 1.5M de espacio de memoria virtual que se puede compartir.
¿Cuándo es importante el tamaño de la memoria virtual?
El mapa de memoria virtual contiene muchas cosas. Algunos de ellos son de solo lectura, algunos de ellos son compartidos, y algunos de ellos se asignan pero nunca se tocan (por ejemplo, casi todos los 4 Gb de Heap en este ejemplo). Pero el sistema operativo es lo suficientemente inteligente como para cargar solo lo que necesita, por lo que el tamaño de la memoria virtual es en gran medida irrelevante.
Donde el tamaño de la memoria virtual es importante es si está ejecutando en un sistema operativo de 32 bits, donde solo puede asignar 2Gb (o, en algunos casos, 3Gb) de espacio de direcciones de proceso. En ese caso, se trata de un recurso escaso y podría tener que hacer concesiones, como reducir el tamaño de almacenamiento dinámico para mapear en memoria un archivo grande o crear muchos subprocesos.
Pero, dado que las máquinas de 64 bits son omnipresentes, no creo que pase mucho tiempo antes de que el Tamaño de memoria virtual sea una estadística completamente irrelevante.
¿Cuándo es importante el tamaño del conjunto de residentes?
Tamaño de conjunto de residentes es la parte del espacio de memoria virtual que está realmente en la memoria RAM. Si su RSS se convierte en una parte importante de su memoria física total, podría ser hora de comenzar a preocuparse. Si su RSS crece para ocupar toda su memoria física y su sistema comienza a intercambiarse, ya es hora de que empiece a preocuparse.
Pero RSS también es engañoso, especialmente en una máquina con poca carga. El sistema operativo no se esfuerza demasiado para reclamar las páginas utilizadas por un proceso. Se puede obtener poco beneficio al hacerlo, y la posibilidad de un costoso error de página si el proceso toca la página en el futuro. Como resultado, la estadística RSS puede incluir muchas páginas que no están en uso activo.
línea de base
A menos que estás cambiando, no se preocupa demasiado por lo que las diferentes estadísticas de memoria que le están diciendo. Con la advertencia de que un RSS cada vez mayor puede indicar algún tipo de pérdida de memoria.
Con un programa Java, es mucho más importante prestar atención a lo que está sucediendo en el montón. La cantidad total de espacio consumido es importante, y hay algunos pasos que puede seguir para reducir eso. Más importante es la cantidad de tiempo que pasas en la recolección de basura, y qué partes del montón se están recolectando.
El acceso al disco (es decir, una base de datos) es costoso y la memoria es barata. Si puede intercambiar uno por el otro, hágalo.
¿Por qué estás preocupado por el uso de memoria virtual? Si realmente quieres preocuparte, mira el uso de la memoria residente y lee los siguientes comandos: free, ps, top. – basszero
Hay varias otras aplicaciones ejecutándose en el sistema, que está incrustado. Y el sistema tiene un límite de memoria virtual. –
ahhhh, diablo está en los detalles – basszero