¿Cómo puedo extraer la identificación del video del enlace de YouTube en Python?

Sé que esto se puede hacer fácilmente usando PHP de parse_urlparse_str y funciones:¿Cómo puedo extraer la identificación del video del enlace de YouTube en Python?

$subject = "http://www.youtube.com/watch?v=z_AbfPXTKms&NR=1"; 
$url = parse_url($subject); 
parse_str($url['query'], $query); 
var_dump($query);

Pero cómo lograr esto usando Python? Puedo hacer urlparse, pero ¿qué sigue?

Fuente

2010-12-04 decarbo

Python tiene a library for parsing URLs.

import urlparse 
url_data = urlparse.urlparse("http://www.youtube.com/watch?v=z_AbfPXTKms&NR=1") 
query = urlparse.parse_qs(url_data.query) 
video = query["v"][0]

Fuente

2010-12-05 00:02:43 robert

'Puedo hacer urlparse, pero ¿qué sigue? 'Sí, lo sé, pero el problema es con la parte de consulta. – decarbo

@decarbo La respuesta actualizada muestra cómo extraer solo el valor del parámetro 'v' en la cadena de consulta. – Phrogz

yap, esa es la mejor solución, supongo. – decarbo

No hay necesidad de expresiones regulares. Dividir en ?, tomar el segundo, dividir en =, tomar el segundo, dividir en &, tomar el primero.

Fuente

2010-12-05 00:00:54 thejh

trabajo. ¿Tiene alguna idea de si este método es lo suficientemente a prueba de balas para ser utilizado sin mayores preocupaciones en proyectos listos para el mercado? – decarbo

usa urlparse para esto. no enrolles los suyos con la división de cadenas o expresiones regulares. http://docs.python.org/library/urlparse.html –

urlparse da consulta en general, así que todavía tengo que dividirlo para obtener ID – decarbo

Aquí es algo que se podría tratar de usar expresiones regulares para el ID de vídeo de YouTube:

# regex for the YouTube ID: "^[^v]+v=(.{11}).*" 
result = re.match('^[^v]+v=(.{11}).*', url) 
print result.group(1)

Fuente

2010-12-05 00:18:36 VKolev

match = re.search(r"youtube\.com/.*v=([^&]*)", "http://www.youtube.com/watch?v=z_AbfPXTKms&test=123") 
if match: 
    result = match.group(1) 
else: 
    result = ""

No probado.

Fuente

2010-12-05 00:20:53

He creado youtube Identificación del analizador sin expresión regular:

def video_id(value): 
    """ 
    Examples: 
    - http://youtu.be/SA2iWivDJiE 
    - http://www.youtube.com/watch?v=_oPAwA_Udwc&feature=feedu 
    - http://www.youtube.com/embed/SA2iWivDJiE 
    - http://www.youtube.com/v/SA2iWivDJiE?version=3&amp;hl=en_US 
    """ 
    query = urlparse(value) 
    if query.hostname == 'youtu.be': 
     return query.path[1:] 
    if query.hostname in ('www.youtube.com', 'youtube.com'): 
     if query.path == '/watch': 
      p = parse_qs(query.query) 
      return p['v'][0] 
     if query.path[:7] == '/embed/': 
      return query.path.split('/')[2] 
     if query.path[:3] == '/v/': 
      return query.path.split('/')[2] 
    # fail? 
    return None

Fuente

2011-10-29 02:04:10

Este es ideal para analizar todos los posibles formatos de enlace de YouTube. – Lexo

puede usar 'query.path.startswith ('/ embed /')' para mayor legibilidad. –

La solución anterior funciona bien, excepto en un escenario. https://m.youtube.com/?#/watch?v=683hzaj3oc8 Sería muy útil si también obtuviera una solución para el escenario anterior. –

Aquí es de expresiones regulares que cubre estos casos enter image description here

((?<=(v|V)/)|(?<=be/)|(?<=(\?|\&)v=)|(?<=embed/))([\w-]+)

Fuente

2015-01-06 09:55:59 Alex

para hacer que esto funcione en python, también tuve que corregir la sintaxis: '((? <= (v | V) /) | (? <= be /) | (? <= (\? | \ &) v =) | (? <= embed /)) ([\ w -] +) '. Esta solución terminó siendo la que manejó la mayoría de los casos. –

@GusE gracias, arreglado – Alex

¿Cómo puedo extraer la identificación del video del enlace de YouTube en Python?

Respuesta

Cuestiones relacionadas