Descargué el archivo de títulos de artículos de Wikipedia que contiene el nombre de cada artículo de Wikipedia. Necesito buscar todos los títulos de los artículos que puedan ser una posible coincidencia. Por ejemplo, podría tener la palabra "hockey", pero el artículo de Wikipedia para hockey que me gustaría es "Ice_hockey". También debería ser una búsqueda insensible a mayúsculas y minúsculas.manera más eficiente de encontrar cadenas parciales en un archivo grande de cadenas (python)
Estoy usando Python, ¿hay una forma más eficiente que hacer una búsqueda línea por línea? Voy a realizar esta búsqueda como 500 o 1000 veces por minuto idealmente. Si línea por línea es mi única opción, ¿hay algunas optimizaciones que puedo hacer dentro de esto?
Creo que hay varios millones de líneas en el archivo.
¿Alguna idea?
Gracias.
Por favor, muestra la entrada esperada. ¿En qué formato está el archivo? no hagas que las personas que quieran ayudarte a descargar el archivo por sí mismos. – aaronasterling
es solo un archivo de texto simple con cada título en su propia línea – apexdodge