He estado armando una lista de páginas que necesitamos actualizar con nuevo contenido (estamos cambiando los formatos de los medios). En el proceso estoy catalogando páginas que tienen correctamente el nuevo contenido.Python Regex "el objeto no tiene ningún atributo"
Aquí es la idea general de lo que estoy haciendo:
- Iterar a través de una estructura de archivos y obtener una lista de archivos
- Para cada archivo leído a un búfer y, mediante la búsqueda de expresiones regulares, que coincida con una etiqueta específica
- Si coincide, prueba 2 más regex coincide
- escribir las coincidencias resultantes (uno o el otro) en una base de datos
Todo funciona bien hasta la tercera coincidencia de patrones regulares, donde me sale el siguiente:
'NoneType' object has no attribute 'group'
# only interested in embeded content
pattern = "(<embed .*?</embed>)"
# matches content pointing to our old root
pattern2 = 'data="(http://.*?/media/.*?")'
# matches content pointing to our new root
pattern3 = 'data="(http://.*?/content/.*?")'
matches = re.findall(pattern, filebuffer)
for match in matches:
if len(match) > 0:
urla = re.search(pattern2, match)
if urla.group(1) is not None:
print filename, urla.group(1)
urlb = re.search(pattern3, match)
if urlb.group(1) is not None:
print filename, urlb.group(1)
gracias.
ah. gracias. utilizo pestañas en el código, que fueron formateadas/reinterpretadas por el motor de formateo de este sitio. "url is not None lo corrigió" – ives