13

Twitter, Google, Amazon, del.icio.us etc., todos te ofrecen una gran cantidad de datos para jugar, todo de forma gratuita. También hay una gran cantidad de datos textuales disponibles a través de iniciativas como Project Gutenberg. Y eso, parece, es solo la punta del iceberg.¿Cuáles son algunas maneras de divertirse con una gran cantidad de datos? (es decir, las API de Twitter, del.icio.us, etc.)

Me he estado preguntando cómo podría utilizar esta información para divertirse. Soy un estudiante de informática de primer año, así que no tengo conocimiento de estadísticas, aprendizaje automático, filtrado colaborativo, etc. Mi interés en esta área fue despertado por el libro Programming Collective Intelligence de Toby Segaran, y ahora quiero tomar una una mirada más profunda a lo que puedes hacer con los datos. No sé por dónde empezar ¿Algunas ideas?

También he estado pensando si debo ir y comprar algo así como Paradigmas de la Programación de Inteligencia Artificial. ¿Vale la pena el viaje por la ciudad?

+0

Amazon vende libros :) ¿por qué viajar por la ciudad? –

+0

No vende libros en la India :( –

Respuesta

6

Intente disparar libros en diferentes estilos desde Guttenberg a través de un generador de cadena Markov; hay uno en Perl here para comenzar.

+0

Me encanta. Las máquinas de Markov son muy divertidas :) –

+0

Publique los resultados en una cuenta de Twitter a través de su API y vea cuántos seguidores puede obtener en función de los tweets generados por la máquina. –

+1

¡Me gusta! Pero la mayoría de los twits parecen ser IAs pobremente programadas de todos modos. Tengo serias dudas sobre su capacidad para aprobar el examen de Turing. –

3

Visualizaciones, compártelas, compártelas.

0

Puedes hacer acertijos como los juegos del ahorcado. O un mashup o prueba las tuberías de Yahoo para unir información.

1

Puede usar algunos de esos datos para ganar dinero (si es realmente bueno) http://www.netflixprize.com/ Netflix ha puesto a disposición un conjunto de datos anónimos y está solicitando mejores algoritmos para predecir las opciones de los clientes.

+0

Sí, iba a sugerir esto. Estoy trabajando en esto ahora mismo. –

0

Predice las futuras tendencias bursátiles de los datos. ¡Lucro!

+0

Es más fácil decirlo que hacerlo. – Cerin

1

Si está familiarizado con Python, intente jugar con el nltk. Tiene toneladas de bibliotecas para minería de textos e incluso aprendizaje automático en general. Intente abrirse camino a través del nltk book.

Cuestiones relacionadas