2011-06-24 9 views
27

IMDB proporciona archivos de texto sin formato que los usuarios pueden descargar y usar que se pueden encontrar aquí: IMDB Plain Text Files, que es genial, pero no veo la ID utilizada para cada película en ninguno de los archivos.Does IMDb proporciona una API o un volcado de datos para obtener todas las identificaciones de título?

Dado que IMDB específicamente dice no usar raspadores, recolectores de datos, etc. en sus condiciones de uso, ¿cómo obtendría el título ID http://www.imdb.com/title/tt1133985/ para cada película si no están incluidos en ninguno de los archivos de texto plano.

Me he dado cuenta de que hay algunas API que otros han incorporado que sí incluyen esta identificación, así que me pregunto cómo lograron hacerlo.

Respuesta

30

Puede utilizar IMDB API situada en

www.omdbapi.com

Puede buscar nombres de películas como esto -

http://www.omdbapi.com/?t=hangover%202

{ 
"Title":"The Hangover Part II", 
"Year":"2011", 
"Rated":"R", 
"Released":"26 May 2011", 
"Genre":"Comedy", 
"Director":"Todd Phillips", 
"Writer":"Craig Mazin, Scot Armstrong", 
"Actors":"Bradley Cooper, Zach Galifianakis, Ed Helms, Justin Bartha", 
"Plot":"Right after the bachelor party in Las Vegas, Phil, Stu, Alan, and Doug jet to Thailand for Stu's wedding. Stu's plan for a subdued pre-wedding brunch, however, goes seriously awry.", 
"Poster":"http://ia.media-imdb.com/images/M/[email protected]@._V1_SX320.jpg"," 
Runtime":"1 hr 42 mins", 
"Rating":"7.1", 
"Votes":"13547", 
"ID":"tt1411697", 
"Response":"True" 
} 

Usted puede obtener el "ID" (tt1411697) de esta respuesta JSON.

+0

Conozco los servicios web ya existentes, como el que enlazó, pero qué tendría que hacer para obtener el ID yo mismo. ¿Tendría que presionar la página de búsqueda con el nombre de una película y extraer la identificación del número 1? ¿Qué tal si quiero hacer eso para 1000 películas? ¿Eso es lo que hacen imdbapi y otros servicios web? – PublicHandle

+0

Sí, tienes que hacer una por una para cada película usando la API de IMDB. ¡Ningún otro ir! – emaillenin

+0

¿Entonces imdbapi no tiene todos los ID de título almacenados en algún lado y lo extraen dinámicamente dado el nombre con el que busca? ¿No significa eso que imdbapi actúa como un raspador para cualquiera que busque una gran cantidad de películas que se supone que están en contra de las condiciones de uso de IMDB? – PublicHandle

15

Como se mencionó, IMDB no tiene un servicio web. imdbapi funciona mediante el raspado de la pantalla. Los archivos planos disponibles para descargar son un legado de los días anteriores a la Amazonía de IMDB, y la información allí es incompleta. (No se podía construir su propia IMDB con sólo los archivos que están disponibles)

Sin embargo, Rotten Tomatoes tiene una interfaz agradable web que muestra, entre otras cosas, el id imdb de las películas - en el alternate_ids sección. Por lo tanto, puede usar el Rotten Tomatoes API para obtener el idd de imdb sin screen scraping imdb directamente.

La base de datos de Rotten Tomatoes es menos extensa que la de IMDB, pero hace un trabajo bastante bueno con las versiones modernas (1995+) de EE. UU.

3

Puede probar TMDb. Puede consultar la documentación aquí: http://docs.themoviedb.apiary.io/. Puede usar append_to_response y puede obtener la identificación de IMDB junto con otros detalles. Hay una solución alternativa que yo sepa. La solución está en PHP. Aquí está el enlace - http://blogs.niteshapte.com/2013-07-01-how-to-fetch-movie-identifier-id-from-imdb-using-php.htm. Es posible que deba ajustarlo según su requisito.

+0

He oído que hay solo 80,000 títulos. IMDB cuenta en millones. –

Cuestiones relacionadas