Linguística de corpus: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Luckas-bot (discussão | contribs)
m clean up e ajustes utilizando AWB
Linha 7:
O computador desempenha um papel importante para os estudos na área. As ferramentas computacionais são geralmente utilizadas para reorganização e extração de informações no corpus para observação e interpretação de dados, fornecendo novas perspectivas para a análise [[linguística]]. As ferramentas computacionais mais comuns são:
 
* Programas para listar palavras - fazem a contagem das palavras em um corpus;
* [[Concordanciador]]es - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;
 
* Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem [[morfossintática]], [[sintática]], [[semântica]] ou [[discursiva]].
 
A Linguística de Corpus faz uso de uma abordagem [[empirista]], contrária à abordagem [[racionalista]], do ponto de vista linguístico, e tem como central a noção de [[linguagem]] enquanto sistema [[probabilístico]].
Linha 31:
* Exploração do uso de descrições baseadas em corpora para várias aplicações tal como ensino-aprendizagem de línguas, processamento de linguagem natural por máquinas, reconhecimento de voz e tradução.
 
== Histórico ==
 
A Linguística de Corpus faz extenso uso de ferramentas computacionais e sua história se confunde com o [[desenvolvimento tecnológico]], especificamente o [[computador]]. É possível identificar dois períodos importantes desde seu surgimento: antes do advento do computador e depois.
Linha 39:
Os corpora dessas épocas eram coletados, armazenados e analisados manualmente. A dificuldade de se realizar estudos desse tipo era enorme. Mesmo assim, havia grande interesse na coleta e exploração de corpora. É importante ressaltar o papel dos estudos baseados em corpora realizados manualmente pela dificuldade e pelo pioneirismo na época.
 
O período crítico para os estudos baseados em corpus se deu com a ‘mudança’ de [[paradigma]] da [[linguística]], com as idéiasideias de [[Chomsky]] por volta de 1950. Houve uma preferência muito forte por estudos baseados em [[teorias racionalistas]] da linguagem. Os estudos [[empíricos]] receberam muitas críticas nessa época. As críticas eram relacionadas à necessidade de se coletar dados empíricos e o meio pelo qual se realizava a coleta e a análise dos dados. Um dos argumentos era a falta de confiabilidade em analisar manualmente grandes quantidades de dados linguísticos.
 
Embora o cenário fosse desfavorável, os estudos baseados em corpora não pararam. Muitos pesquisadores continuaram seus estudos por meio de corpora. [[Firth]] (1957) e os [[neo-firthianos]] defendiam a descrição da linguagem por meio de dados reais. O corpus [[SEU]] (Survey of English Usage), por exemplo, foi compilado e etiquetado manualmente em 1959. O SEU influenciou a criação de corpora eletrônicos e serviu para o desenvolvimento de etiquetadores computadorizados contemporâneos.
Linha 49:
Ao final dos anos 90, a Linguística de Corpus exerce grande influência em várias áreas da Linguística Aplicada ([[Ensino de Línguas]], [[Tradução]], [[Análise do Discurso]], [[Lexicografia]], etc), fornecendo subsídios [[teóricos]] e [[metodológicos]] que possibilitam o estudo de vários aspectos da linguagem.
 
== {{Referências ==}}
 
Berber Sardinha, T. (2004). ''Lingüística de Corpus''. São Paulo: Manole.
Linha 55:
Biber, D.; Conrad, S.; Reppen, R. (1998). ''Corpus linguistics: investigating language structure and use''. Cambridge, Cambridge University Presss.
 
Hunston, S. (2002). ''Corpora in Applied Linguistics''. Cambridge : Cambridge University Press.
 
Kennedy, G. D. (1998). ''An introduction to corpus linguistics''. Nova York, Longman.
Linha 61:
=={{Ligações externas}}==
*[http://www2.lael.pucsp.br/corpora/bp Banco de Português]
*[http://www2.lael.pucsp.br/corpora/ Ferramentas computacionais ("toolkit online")]
*[http://www.corpusdoportugues.org/ Corpus do Português]
*[http://www.revel.inf.br/site2007/_pdf/3/entrevistas/revel_3_entrevista_tony_berber_sardinha.pdf Linguística de Corpus: uma entrevista com Tony Berber Sardinha. Revista Virtual de Estudos da Linguagem - ReVEL, vol. 2, n. 3, 2004]
 
[[Categoria: Linguística de corpus]]
 
[[Categoria: Linguística de corpus]]
 
[[bg:Корпусна лингвистика]]