2010-08-05 17 views
17

Las RFC (http://www.ietf.org/rfc.html) generalmente se publican como archivos de texto.¿Algún analizador para documentos RFC?

  • ¿Hay algún otro formato que facilite el análisis del contenido de RFC?
  • ¿Hay analizadores sintácticos para los documentos de texto RFC ampliamente utilizados?
+2

Un buen formato sería XML. Hay un RFC2629 (http://xml.resource.org/public/rfc/html/rfc2629.html) que ya especifica el formato. Lamentablemente, los RFC publicados no están en XML. Empecé algo que intenta analizar archivos de texto en ese RFC2629-XML, pero es realmente tedioso ... – jdehaan

+2

Hay un borrador más reciente: http://xml.resource.org/authoring/draft-mrose-writing-rfcs.html – jdehaan

Respuesta

8

Un número limitado de RFC se han ofrecido como XML en http://xml.resource.org/public/rfc/xml/

también se podría combinar los datos de texto utilizando babero XML desde http://xml.resource.org/public/rfc/bibxml/

+0

Usando este mismo recurso, también puede encontrar un formato HTML http://xml.resource.org/public/rfc/html/rfc2629.html Tenga en cuenta que esto está formateado correctamente como HTML (en mi opinión) en comparación con el IETF versión HTML. – styfle

+0

^^ aunque esta no es una lista exhaustiva –

6

IETF RFC mantiene minmally marcados-up-en HTML, por ejemplo:

http://tools.ietf.org/html/rfc2616.html

pero el margen de beneficio consiste sobre todo en los anclajes para implementar una tabla de contenidos; y marcado principal que es principalmente <pre> ... </pre >. Sin embargo, es posible hacer algunos análisis significativo en esos RFC.

W3C tiene algunas HTMLized RFCs, por ejemplo:

http://www.w3.org/Protocols/rfc2616/rfc2616.html

en el que el marcado es un poco más rico en su semántica y así tal vez más susceptible de análisis sintáctico.