2010-10-02 19 views
17

Soy un estadístico de profesión y me gustaría recibir algunas recomendaciones sobre cómo configurar un sitio web que pueda recopilar datos en una base de datos. Para uso personal, uso Formularios de Google para recopilar datos y todo se completa en una hoja de cálculo. Sin embargo, esto puede no ser apropiado en un entorno más profesional, especialmente cuando tenemos múltiples páginas/formularios. Me imagino dos usos:recopilación de datos para estadísticas: de la web a una base de datos

  1. Un sitio web donde puedo enviar el enlace a otros para que puedan completar, similar a Google Forms.
  2. Un sitio web donde solo los usuarios autorizados pueden iniciar sesión para completar los datos. Piense en un entorno donde los pacientes son seguidos periódicamente en un estudio de investigación. Sería genial que el clínico ingrese los datos directamente en la base de datos a medida que llena los formularios en lugar de tener otro analista de datos que transcriba sus formularios escritos en la base de datos.

La solución obvia sería contratar un desarrollador web. Sin embargo, me gusta hacer cosas yo mismo cuando son manejables. Me imagino que un desarrollador web debería saber html, php y conocimiento de bases de datos (p. Ej., MySQL o PostgreSQL). Mi experiencia en esto se limita a configurar un blog de WordPress en mi servidor Linux. Mi experiencia con html también está limitada ya que utilizo emacs org-mode para generarlos a partir de texto sin formato. Espero escuchar soluciones con una curva de aprendizaje mínima. Mi preferencia, por supuesto, sería el software libre de código abierto y basado en Linux, pero me gustaría escuchar todas las soluciones disponibles (nuestro administrador de datos es un usuario de Windows).

Recientemente leí un post en Linux Journal que menciona REDCap, pero parece que tiene que obtener permiso institucional para su uso.

También etiqueté "R" en esta publicación porque me gustaría escuchar lo que los usuarios de R están haciendo sobre la recopilación de datos. En última instancia, analizaré los datos con R, pero todos los análisis de datos comienzan con la pregunta científica y la recopilación de datos.

Gracias!

ACTUALIZACIÓN 04/10/2010: Gracias a todos por las respuestas hasta el momento. Parece que la mayoría de las soluciones de terceros propuestas hasta el momento tienen datos alojados en una base de datos alojada por el proveedor. Me gustaría alojar todos los datos en nuestro servidor SQL. Es decir, la entrada de datos desde la web ingresa a la base de datos en tiempo real, lista para el análisis de datos.

+0

Muy buena pregunta. Aprendí mucho de las respuestas. –

+1

Hola Vinh. Si puede, sin duda, escogería redcap ya que es muy amigable con R. De hecho, las estadísticas de resumen univariados y gráficos son creados con R. Además, estoy actualmente desarrollando un paquete de R que se centrará en la API de datos de redcap. --- Descargo de responsabilidad: Estoy a cargo de los esfuerzos relacionados con R para REDCap aquí en la Universidad de Vanderbilt. – Jeff

+0

#Vinh, DASH le proporciona almacenamiento local. –

Respuesta

7

Tal vez el proyecto limesurvey.org es de interés ...

+0

Actualmente estoy usando limesurvey para una encuesta de proyecto con +100 preguntas y con +2700 encuestados. Sin problemas en absoluto. De hecho, si usted es el tipo de persona que instala wordpress en su propio servidor, entonces no veo ninguna razón para no usar limesurvey. LS incluso tienen una función de exportación R: http://docs.limesurvey.org/tiki-index.php?page=Exporting+Results&structure=English+Instructions+for+LimeSurvey#R_Export – Andreas

4

Me suena como usted se tiene un estudio de medicina. Hay una plétora de preocupaciones que vienen a la mente solo por lo que usted ha descrito que desea hacer. No menos importante es la privacidad. ¿Dónde se alojará? ¿Ha recibido el consentimiento de los pacientes para recopilar y transmitir su información electrónicamente? ¿Qué datos está almacenando, si los hay, que podrían combinarse para presentar su identidad?

Personalmente, evito las herramientas de recolección de datos en línea. Pagué a una empresa, como Ipsos, Research Now/E-Rewards, para programar y administrar la recopilación de datos mediante los cuestionarios que he diseñado. La razón es que saber cómo diseñar investigaciones y analizar datos es una cosa. Pero si has sido entrenado en estadísticas, puedo argumentar con seguridad que "no sabes nada" sobre la recopilación de datos. Seguro que puede conocer un montón acerca de la teoría del muestreo, pero cuando se trata de obtener datos, lo mejor es dejarlo en manos de los profesionales.

Hay una serie de herramientas de recopilación de datos en línea de "calidad industrial" disponibles.

  • Confirmit (Más o menos el estándar de oro para la recolección de datos en línea)
  • DASH (más pequeño siguiente, pero increíblemente flexible)

Existen también soluciones puramente basada en web, algunos de los cuales son gratuitos (no es que yo recomendaría el uso de ellas)

  • QuestionPro
  • SurveyMonkey
  • Zoomerang

Aunque, a menos que usted está haciendo un estudio con más de 50 pacientes, sólo lo recomendaría para conseguir los médicos o sus asistentes para llenar las hojas de Excel y enviarlos a su compañero.

Además, es poco probable que deba configurar un sistema de nombre de usuario/contraseña. Lo que quiere se conoce como un "enlace abierto". Cuando los encuestados hacen clic en un enlace e ingresan información, la información del identificador puede ser agregada por el encuestado. No necesita una contraseña porque las personas solo pueden INGRESAR información, no leerla.

La mayoría de los sistemas que mencioné anteriormente funcionan con la idea de enviar por correo electrónico a un encuestado (un médico) con un enlace a una encuesta basada en la web. Que podría adaptarse fácilmente a sus necesidades específicas y actuar como un recordatorio para que el clínico llene el formulario.

Si sus tipos de preguntas son simples. Estoy seguro de que podría contratar a un programador para armar un sitio web que tenga los formularios que necesita detrás de una interfaz autorizada. PHP/MySQL probablemente haga el truco. Pero, verificaría dos veces las leyes de privacidad en su jurisdicción relacionadas con la investigación médica antes de seguir adelante.

+0

Gracias por su respuesta Brandon. Probablemente tengas razón, la mayoría de nosotros probablemente "no sé nada" sobre los aspectos técnicos y la implementación de la recopilación de datos. Como dijo, usualmente otros hacen esto por nosotros. Solo estoy pidiendo mi propio enriquecimiento personal: la computadora DIY es un hobby mío. También me gusta saber qué hay para evaluar cómo hago/hacemos las cosas. Por supuesto, necesitaríamos consentimiento y las leyes de privacidad deberán respetarse. –

4

He llevado a cabo una investigación medial utilizando un formulario en línea (en realidad dos de ellos). Mis preguntas eran bastante discretas y particulares a la enfermedad que estaba investigando.

Anteriormente en un proyecto relacionado, había creado cuestionarios de dos o tres páginas que se imprimían y luego los sujetos y los cirujanos completaban los formularios y nuestro coordinador de investigación los ingresaba en nuestra base de datos. Fue mucho trabajo con mucho margen de error. No me gusta. Los formularios en línea fueron mucho mejores.

Utilicé SurveyGizmo y me complació. Miré muchas opciones hace dos años. Google Forms no existía en ese momento. Fui con SurveryGizmo principalmente porque tenían una declaración (atestación) de que cumplían con HIPAA. No pude garantizar la seguridad, como las conexiones SSL con los otros sitios web. Sin embargo, para poder acceder a esa capacidad (conexiones https) tuve que comprar el nivel empresarial aunque en todas las demás capacidades pude haber usado el servicio gratuito. Además, SurveyGizmo ofreció una reducción del 50% para las organizaciones sin fines de lucro para las cuales nuestro instituto de investigación calificó.

SurveryGizmo fue fácil de diseñar y poner en producción sin tener que programarme. Fue fácil descargar los datos en formato csv y leerlos directamente en R. Aunque tuve algunos problemas extraños con los que necesitaba ayuda. Tuve que usar el formato "antiguo" para exportar para que fuera una csv fácil de usar. Además, el archivo csv tenía la peculiaridad de que las primeras dos filas eran filas de encabezado. Pero yo solved that problem with the help of stackoverflow.

SurveryGizmo tiene una lógica fantástica y tuberías que me permitieron hacer solo preguntas relevantes y así no perder el tiempo de mis encuestados y, lo que es más importante, no hubo preguntas irrelevantes para confundir a los encuestados.

Finalmente, pude usar SurveyGizmo de tal manera que también pude seguir nuestro (el personal de investigación) el cumplimiento y la logística. Por ejemplo, recibimos una notificación cuando había nuevos sujetos potenciales que estaban interesados ​​en participar. Pudimos anotar los números de seguimiento de FedEx junto con los registros de los temas correspondientes.

Básicamente funcionó bien.

+0

+1 SurveyGizmo parece una herramienta realmente buena y económica. Gracias por compartir. –

0

La plataforma más segura para la recogida de datos de la encuesta confidencial es Confirmit. Aquí hay una curva de aprendizaje: codificará en VisualSQL, que solo se utiliza en Confirmar. Las respuestas de la encuesta se exportarán a archivos csv, donde puede analizar los resultados en R.

Si recopila datos confidenciales o datos donde los encuestados necesitan enlaces de acceso únicos para que solo puedan ver su propia versión de la encuesta, querrá usar Confirmar. Los datos se encuentra en el centro de datos Confirmit, pero sus datos es mucho más seguro que otros proveedores (es decir, un tercero no será capaz de cortar en su encuesta y ver las respuestas de un individuo, o interceptar los datos que se envía desde su respondiente a Confirmar).

Cuestiones relacionadas