Análise sintática (computação): diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Elilopes (discussão | contribs)
wikificação
Dbastro (discussão | contribs)
m ajustes usando script
Linha 1:
{{Ver desambig|este=o contexto em computação / linguística|o conceito gramatical|Sintaxe}}
{{Ver desambig|este=o contexto em computação / linguística|o conceito gramatical|Sintaxe}}{{Sem fontes|data=5 de novembro de 2004‎|Subcategoria=tec}}[[Imagem:Parsing-example.png|thumb|direita|250px|Exemplo da '''análise sintática''' de uma [[expressão matemática]]. O resultado é uma [[árvore (estrutura de dados)|árvore]] da expressão]]{{Predefinição:Execução de Programa}}Em [[ciência da computação]] e [[linguística]], a '''análise sintática''' (do [[Língua inglesa|inglês]]: '''''parsing''''') é um processo de um [[compilador]] (de uma [[linguagem de programação]]), é a segunda fase da compilação onde se analisa uma sequência que foi dada entrada (via um [[arquivo de computador]] ou via [[teclado (computador)|teclado]], por exemplo) para verificar sua estrutura gramatical segundo uma determinada [[gramática formal]]. Este processo trabalha em conjunto com o a [[análise léxica|análise lexical]] (primeira etapa, onde se verifica-se de acordo com determinado [[alfabeto]]) e [[análise semântica]] (terceira etapa, onde verificam-se os erros semânticos).
{{Sem fontes|data=junho de 2019|Subcategoria=tec}}
[[Imagem:Parsing-example.png|thumb|direita|250px|Exemplo da '''análise sintática''' de uma [[expressão matemática]]. O resultado é uma [[árvore (estrutura de dados)|árvore]] da expressão]]
{{Execução de Programa}}
{{Ver desambig|este=o contexto em computação / linguística|o conceito gramatical|Sintaxe}}{{Sem fontes|data=5 de novembro de 2004‎|Subcategoria=tec}}[[Imagem:Parsing-example.png|thumb|direita|250px|Exemplo da '''análise sintática''' de uma [[expressão matemática]]. O resultado é uma [[árvore (estrutura de dados)|árvore]] da expressão]]{{Predefinição:Execução de Programa}}Em [[ciência da computação]] e [[linguística]], a '''análise sintática''' (do [[Língua inglesa|inglês]]: '''''parsing''''') é um processo de um [[compilador]] (de uma [[linguagem de programação]]), é a segunda fase da compilação onde se analisa uma sequência que foi dada entrada (via um [[arquivo de computador]] ou via [[teclado (computador)|teclado]], por exemplo) para verificar sua estrutura gramatical segundo uma determinada [[gramática formal]]. Este processo trabalha em conjunto com o a [[análise léxica|análise lexical]] (primeira etapa, onde se verifica-se de acordo com determinado [[alfabeto]]) e [[análise semântica]] (terceira etapa, onde verificam-se os erros semânticos).
 
A análise sintática transforma um texto na entrada em uma [[estrutura de dados]], em geral uma [[Árvore (estrutura de dados)|árvore]], o que é conveniente para processamento posterior e captura a hierarquia implícita desta entrada. Através da análise lexical é obtido um grupo de [[token]]s, para que o analisador sintático use um conjunto de regras para construir uma árvore sintática da estrutura.
Linha 8 ⟶ 12:
 
== Analisador sintático ==
O "analisador sintático" é um [[programa de computador]] que realiza a função de carregar os dados de entrada e construir uma estrutura de dados com eles. Essa estrutura de dados pode se tratar de uma árvore de análise, árvore abstrata de sintaxe ou outras estruturas que dão ideia de hierarquia, para que resulte em uma representação estrutural da entrada que foi feita a análise. A análise pode proceder vários outros passos que são executados antes da própria análise, ou estes passos podem ser executados em um único passo, onde eles estarão combinados. Muitas vezes o processo realizado pelo analisador sintático é procedido pelo processo de análise lexical, já que esta análise gera como resultado uma tabela dos tokens dos dados de entrada analisados.  Os analisadores podem ser programados manualmente, ou podem ser gerados automaticamente por um gerador de analisador.   
 
A entrada de dados que é analisada pelo analisador é normalmente um código de uma linguagem de programação, mas podem ser também textos em linguagem natural, e nesse caso não é construída uma árvore de análise, mas só são extraídas algumas partes do texto. As funções dos analisadores variam desde analisar comandos simples de um código a programas muito complexos. Uma forma importante de realizar a análise é usando expressões regulares, onde uma expressão regular define uma linguagem regular e um mecanismo de expressão regular gerando automaticamente um analisador para a linguagem. Em alguns casos as expressões regulares são usadas antes da própria análise sintática, como etapa da análise lexical cuja saída será utilizada pelo analisador sintático.
Linha 14 ⟶ 18:
O dos analisadores sintáticos varia de acordo com a entrada que ele recebe, ou seja, da linguagem de programação que ele irá analisar. Para linguagens de dados o analisador é utilizado para facilitar a leitura de um programa, já para linguagens de programação o analisador faz parte de um compilador, que analisa o código para criar uma forma de representação interna. As linguagens de programação possuem uma gramática determinística, ou seja, que não possui ambiguidade, com isso é implementado o analisador sintático referente a está gramática. A análise para o compilador pode ser feita em uma ou múltiplas passagens pelo código.
 
Existem desvantagem em relação ao compilador de uma passagem, mas estas podem ser dribladas com a utilização de fix-ups, onde durante a passagem o fix-up realiza a função de voltar no código quando a análise de um segmento está incompleta, ao invés de continuar a passagem pelo código. Um exemplo de fix-up é o uso do comando GOTO, onde o destino desse comando é desconhecido até que seu segmento no programa seja concluído.  
 
Gramáticas livres do contexto são limitadas, já que podem expressar todos os requisitos de um idioma e sua memória é limitada. Então essa gramática não consegue lembrar a presença de uma construção longa da entrada. E gramáticas mais poderosas que suprem essa limitação, não podem ser analisadas de forma eficiente. Logo é uma boa estratégia que a gramática livre do contexto aceite um conjunto de construções maiores da linguagem, aceitando construções inválidas, e posteriormente as construções indesejadas serão filtradas na análise semântica. Tudo isso para se obter um analisador mais descontraído para uma gramática livre do contexto.
Linha 25 ⟶ 29:
 
== Visão geral do processo ==
[[Ficheiro:Nt-compilador.png|ligação=https://pt.wikipedia.org/wiki/Ficheiro:Nt-compilador.png|alt=|miniaturadaimagem|409x409px|O processo da compilação.]]
O caso comum de análise de uma linguagem de programação possui dois níveis de gramática: lexicais e sintáticas.
 
Linha 47 ⟶ 51:
 
==== Analisador de precedência do operador ====
Este tipo de analisador Bottom-Up interpreta uma gramática operadora de procedência. É capaz de analisar todos [[:en:LR_parser|LR(1)]] gramáticas onde dois consecutivos  não terminais nunca aparecem no lado direito de qualquer regra.
 
=== Geradores de analisadores sintáticos ===
Linha 61 ⟶ 65:
== Lookahead ==
Lookahead nada mais é do que analisar um token e ao mesmo tempo olhar um token a frente para poder decidir qual regra deve ser utilizada. Por exemplo, ao analisar o delimitador ‘/’, é necessário olhar a frente para poder saber se ele será um comentário de linha ou de bloco. Com ele, é possível ajudar o analisador a tomar a decisão correta em caso de conflitos e eliminar os estados duplicados aliviando a carga de uma pilha extra.
 
{{Referências}}
 
== Ver também ==
Linha 70 ⟶ 72:
*[[Linker]]
*[[Teoria da computação]]
 
{{Referências}}
 
== Ligações externas ==