cerdo utilizando el Apache y el textocoincidencia de expresión regular en la
hahahah. my brother just didnt do anything wrong. He cheated on a test? no way!
estoy tratando de igualar "mi hermano simplemente aún no ha hecho nada malo."
Idealmente, me gustaría combinar cualquier cosa que comience con "mi hermano solo" y terminar con cualquiera de los signos de puntuación (final de la oración) o EOL.
En cuanto a los documentos de cerdo, y luego siguiendo el enlace a java.util.regex.Pattern, supongo que debería ser capaz de utilizar
extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray);
pero que parece coincidir hasta el final de la línea . ¿Alguna sugerencia para realizar este partido? Estoy listo para tirar de mi pelo, y por tirar de mi pelo, me refiero a cambiar al pitón de streaming
¿Le importaría explicar la parte codiciosos? Pensé que simplemente estaría combinando desde la palabra simplemente, cualquier texto siguiente, hasta la primera instancia de puntuación. –
Sin ser codicioso, no coincide con la primera instancia de puntuación, sino que coincide hasta el último. – Wrikken
@Neil Kodner: He actualizado la respuesta. –