2009-07-27 15 views
7

Estoy construyendo algunos AMI de uno de los básicos en EC2. Uno de los tipos de instancia ejecuta Tomcat y contiene muchos índices de Lucene; otra instancia ejecutará MySQL y tendrá requisitos de datos correspondientemente grandes.¿Cuál es el punto de almacenamiento de instancia en EC2?

Estoy tratando de definir la mejor manera de incluir aquellos en las AMI que estoy creando. Si instalo /mnt/lucene y /mnt/mysql, esos no se incluyen en el AMI generado. Por lo tanto, me parece que la forma preferida de lidiar con ellos es tener un EBS para cada uno, tomar instantáneas y crear instancias que tengan su propio EBS basado en las instantáneas más recientes. ¿Es esa la mejor manera de proceder?

¿Cuál es el punto de almacenamiento de instancias? Parece que solo funcionará como un área de almacenamiento temporal, ¿qué me estoy perdiendo? Presumiblemente hay una razón por la que Amazon ofrece hasta 800 GB de almacenamiento en instancias grandes estándar ...

Respuesta

4

El almacenamiento de instancias es más rápido que EBS. No mencionas lo que harás con tus instancias, pero para algunas aplicaciones la velocidad puede ser más importante que la durabilidad. Para una aplicación que principalmente está haciendo minería de datos en una gran base de datos, tener algunos cientos de gigas de almacenamiento local y rápido para alojar la base de datos podría ser beneficioso. Los nodos de trabajo en un clúster de MapReduce también pueden ser excelentes candidatos, por ejemplo, almacenamiento, dependiendo del tipo de trabajo que sea.

+0

Eso es lo que pensé. Me vendría bien encontrar algunos números sobre cómo varía el almacenamiento de instancia frente a EBS. Ejecuté Bonnie ++ en el almacenamiento de instancias y no me quité los calcetines. – jabley

+0

Supongo que la pregunta es cuánto (no) te sacó los calcetines en comparación con el mismo punto de referencia en ebs :) Tengo la sensación de que esta es una de esas situaciones en las que la elección correcta va a ser diferente para todos, y Tendrá que descubrir qué combinación de las opciones disponibles funciona mejor para su problema particular. La belleza de la situación es que si un nodo tarda dos horas en actualizar sus datos, ¡siempre puede alquilar dos nodos y hacerlo en 1 hora! (suponiendo que seas bendecido con tareas paralelas) –

+0

Me pregunto cómo el almacenamiento de instancias se mantiene en contra de un RAID de pequeños volúmenes de EBS. Tal vez, una vez que esté utilizando RAID, no haya ninguna razón para usar el almacenamiento de instancias (al menos para el acceso a la base de datos de búsqueda pesada). –

2

Otro punto de almacenamiento de instancia es que es independiente. Ha habido muchos cortes de EBS (google, por ejemplo, "site: aws.amazon.com ebs outage"). Si la instancia se ejecuta en absoluto, tiene el almacenamiento de instancias disponible. Obviamente, si confía en el almacenamiento de instancias, debe ejecutar varias instancias (en múltiples zonas de disponibilidad) y tolerar instancias con errores únicos.

0

Sé que es tarde para el juego, pero otro hecho real poco considerada ...

almacenamiento EBS hace extremadamente fácil crear IAM de partir, mientras que, almacenamiento de instancia-tienda basada requiere que la creación de IAM de estar hecho localmente en la propia máquina con un montón de trabajo para preparar, almacenar y registrar la AMI.