2008-10-09 30 views
5

Estoy tratando de evaluar la compra de una herramienta estadística. Esto será utilizado en parte por usuarios que no están programando (haciendo estudios clínicos) y en parte por programadores, por lo que estoy tratando de encontrar un buen compromiso entre usabilidad y automatización. Por supuesto, el costo es un problema, pero si puedo construir un caso sólido, probablemente podríamos comprar un paquete comercial, por lo que no estamos totalmente limitados a las opciones gratuitas.Herramientas estadísticas para programadores

Hasta ahora, nuestras opciones son:

  • Statistica (que algunos no programadores ya saben)
  • Estadísticas Matlab caja de herramientas (programadores ya utilizan Matlab)
  • lenguaje R (necesitaría una interfaz de usuario para no programadores)
  • Hack algo en Excel (no es divertido, pero eso es lo que no programadores lo hacen en este momento)
  • ? ...

¿Qué más hay por ahí? ¿Cuál es el estándar de la industria? ¿Qué tipo de características distintivas debería buscar? ¿Que recomendaria y porque?

Idealmente, nos gustaría una herramienta que pueda ejecutarse tanto en máquinas Linux como Windows.

(yo trabajo en imágenes médicas, por lo que hacer ambas cosas bioestadística, y las estadísticas de ingeniería de software)

Respuesta

2

Stata y SPSS tienden a ser los paquetes más comúnmente utilizados en estudios clínicos. Ambos son bastante fáciles de usar y de usar para personas que no tienen una mentalidad técnica, pero en general son lo suficientemente flexibles. He usado Stata más que cualquiera de los otros y he estado muy contento con sus opciones (admite operaciones basadas en menús y en línea de comandos, un sistema de complementos suficientemente bueno para obtener nuevos módulos creados por los usuarios, buen soporte de gráficos).

R es un poco más desalentador para los usuarios novatos, aunque es popular entre los bioestadísticos. Como es gratis, ese es otro buen punto a su favor.

+0

rcar, ¿qué país hay en ti? En US Pharma, SAS es mucho más común que Stata o SPSS. –

+0

EE. UU., En un centro de salud académico. Tal vez sea algo sobre la cultura aquí, pero esos dos paquetes son utilizados por casi todos los que hacen estudios aquí si no están usando R. – Randy

+0

Me pregunto si eso implica que su gente de SAS cambió a R en algún momento. Dato interesante, gracias! –

1

Me gustaría ver S-Plus.

Obtiene un entorno de programación fuerte (S-Plus Workbench, basado en la plataforma Eclipse), una GUI intuitiva para los no programadores y una amplia comunidad de usuarios (incluidos los usuarios de R, que se basó en la S original) .

3

Recomiendo R, personalmente. Es utilizado por bioinformáticos y psicólogos, oí. No sé cuál es tu campo, así que tal vez sea una mala elección. Es razonablemente fácil de usar y aprender.

+1

R es un lenguaje muy potente para cualquier tipo de modelado estadístico. – cciotti

+0

R es accionado por línea de comandos; no tiene una GUI. –

0

Considere Excel una vez más. Es bien conocido y ampliamente disponible. Consulte esto book o este book.

+0

Hemos probado Excel y, francamente, no nos proporciona lo que necesitamos de manera eficiente. Las funciones integradas no van más allá de One-Way Anova, y a menudo es muy torpe de usar. Sí, podría volver a implementar un marco estadístico en Excel, pero no es el mejor uso de mi tiempo. – Kena

+1

Más peligrosamente, se sabe que Excel tiene errores en Analysis Toolpak que lo hacen inadecuado para la regresión. –

5

Indiscutiblemente es R. R es muy amigable con los programadores. Tiene aspectos funcionales y es GNU.

S-PLUS y R están basados ​​en el lenguaje S. Ambos son similares y en la mayoría de los casos puede ejecutar como programa S-PLUS en R y viceversa.

SAS es otra opción, aunque está más orientada hacia BI y la empresa.SAS tiene una sintaxis más simple que R y, en mi opinión, es más fácil de recuperar para un no programador.

Otras opciones incluyen SPSS, Matlab e incluso Excel.

1

Parece que está intentando maximizar múltiples objetivos. Usted dice "Esto será utilizado en parte por usuarios que no están programando (haciendo estudios clínicos) y en parte por programadores, así que estoy tratando de encontrar un buen compromiso entre la usabilidad y la automatización", con una suposición implícita de que este será el misma herramienta en ambos casos, cuando eso podría no ser realista. ¿Cuál es el compromiso de Word y LaTeX, por ejemplo?

Algunas preguntas diferentes acerca de los requisitos:

  • caso de que sea extensible para programadores
    • Capaz de utilizar extensiones de C
    • fáciles de hacer nuevos procedimientos y métodos
  • Lo análisis que los no programadores van a querer usar?
  • Gráficos?
  • Facilidad de uso para los diferentes grupos

Así que mi lectura sobre esto:

fácil de extender: R/S-plus, Matlab/Octave (Sucede que prefieren R, pero sí más estadísticas y menos elementos de la matriz) Fácil de usar para personas normales: Excel, R personalizado, SPSS

Además, R en Windows tiene una GUI limitada, que puede o no ayudar a sus usuarios.

Si fuera yo, iría con una solución híbrida. Utilice R y proporcione una hoja de trucos para tareas comunes a los no programadores que ilustren tareas comunes, o mejor aún, escriban algunas funciones de contenedor con nombres como "image_summary" que automaticen su trabajo de exploración.

Para escribir scripts de interfaz para R, las envolturas de python RPy también pueden ser útiles.

0

Este Wikipedia page compara las características disponibles para varios paquetes estadísticos, así como su compatibilidad con sistemas operativos y de información de precios (que parece un poco fuera de fecha, pero da una idea general)

2

Para un paquete estadístico con una GUI que los usuarios no técnicos pueden usar, recomendaría que vaya con "SAS Enterprise Guide". Obtendrá los procedimientos SAS comunes y avanzados, una excelente facilidad gráfica y la capacidad de programar para los usuarios técnicos. Recomiendo que empiece con la "Edición de aprendizaje de SAS" (http://support.sas.com/learn/le/), que es una versión totalmente funcional de Enterprise Guide, pero limitada a procesar 1000 filas a la vez. Es menos de $ 500, lo que lo convierte en un buen trato.

1

SAS Enterprise Guide tiene una buena usabilidad para los no programadores. Además, tiene buenas opciones para conectarse a Excel. Y para los programadores, es la opción más robusta que existe. El servidor sas se ejecuta en cualquier cosa, sin embargo, la guía empresarial es solo de Windows.

0

Terminamos en la caja de herramientas estadísticas Matlab (principalmente porque ya tenemos un poco de experiencia con Matlab en el equipo, y necesita la herramienta de todos modos)

Hasta el momento, se está haciendo lo que tenemos que hacer, y es fácil expansible. El uso se mostrará si los programadores no lo usan realmente, pero hasta ahora se ve bien.

+0

Gracias por dejarnos saber Kena. –