2009-11-24 13 views
39

El análisis es algo que encontré mucho en desarrollo, pero como junior es una de esas cosas que supongo que conseguiré en algún momento, cuando sea necesario. En mi proyecto actual, me dijeron que busque y utilice un analizador HTML para una determinada función, encontré un par en la web, pero ¿qué hace realmente un analizador de HTML? ¿Y qué significa analizar un objeto?¿Qué está analizando?

+1

Creo que [este artículo de la wikipedia] (http: //en.wikipedia.org/wiki/Parsing) es un buen punto de partida. – KB22

Respuesta

56

Parsing generalmente se aplica al texto: el acto de leer texto y convertirlo en un formato de memoria más útil, "entendiendo" lo que significa en cierta medida. Entonces, por ejemplo, un analizador XML tomará la secuencia de caracteres (o bytes) y los convertirá en elementos, atributos, etc.

En algunos casos (particularmente compiladores) hay una separación entre lexical analysis y análisis sintáctico, por lo que el real " entendiendo que "parte del analizador funciona en una secuencia de tokens (identificadores, operadores, etc.) en lugar de en los caracteres brutos.

+2

+1 Respuesta de libro de texto. ¡Tu deberias escribir un libro! : p – Mike

+5

Él ya ha escrito un libro. C# en profundidad – rahul

+0

@Mike - él ya lo hizo – RobV

8

Puede comenzar aquí: http://en.wikipedia.org/wiki/Parsing. extracto corta:

de análisis o análisis sintáctico es el proceso de analizar una serie de símbolos, ya sea en lenguaje natural o en lenguajes de programación, conforme a las reglas de una gramática formal. El término de análisis viene de Latin pars (orationis), que significa parte (del habla).

+0

Si bien este enlace puede responder a la pregunta, es mejor incluir las partes esenciales de la respuesta aquí y proporcionar el enlace de referencia. Las respuestas de solo enlace pueden dejar de ser válidas si la página vinculada cambia. – DeanOC

+0

¡De acuerdo y hecho! – Konamiman

1

Es el proceso de identificación de los tokens [etiquetas, atributos] dentro de un HTML.

8

El análisis está tomando un conjunto de datos y extrayendo la información significativa del mismo. Con el análisis de HTML, está buscando leer algunos html y devolver un conjunto estructurado de etiquetas y texto.

1

En informática y lingüística, el análisis sintáctico, o más formalmente, es el proceso de análisis de un texto, realizado de una secuencia de tokens (por ejemplo, palabras), para determinar su estructura gramatical con respecto a una gramática dada (más o menos) formal.

: 0)

Wikipedia

3

Parse(computers), by Dictionary.com:

Para analizar (una cadena de caracteres) con el fin de asociar grupos de caracteres con las unidades sintácticas de la gramática subyacente.

1

No intente escribir nada más que un analizador trivial usted mismo. Hay buenas herramientas para este uso ANTLR y bison son dos que puedo pensar.

Si utiliza las herramientas, podrá pedir ayuda cuando se produzca un problema.

aplausos, Martin.

4

Un analizador es un componente de compilador/intérprete que divide los datos en elementos más pequeños para facilitar la traducción a otro idioma. Un analizador toma entrada en forma de una secuencia de tokens o instrucciones de programa y generalmente construye una estructura de datos en forma de un árbol de análisis sintáctico o un árbol de sintaxis abstracta.