Linguística de corpus: diferenças entre revisões
Conteúdo apagado Conteúdo adicionado
m Bot: Adicionando: hi:कॉर्पस भाषाविज्ञान |
m clean up e ajustes utilizando AWB |
||
Linha 7:
O computador desempenha um papel importante para os estudos na área. As ferramentas computacionais são geralmente utilizadas para reorganização e extração de informações no corpus para observação e interpretação de dados, fornecendo novas perspectivas para a análise [[linguística]]. As ferramentas computacionais mais comuns são:
* Programas para listar palavras - fazem a contagem das
*
* Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos)
A Linguística de Corpus faz uso de uma abordagem [[empirista]], contrária à abordagem [[racionalista]], do ponto de vista linguístico, e tem como central a noção de [[linguagem]] enquanto sistema [[probabilístico]].
Linha 31:
* Exploração do uso de descrições baseadas em corpora para várias aplicações tal como ensino-aprendizagem de línguas, processamento de linguagem natural por máquinas, reconhecimento de voz e tradução.
==
A Linguística de Corpus faz extenso uso de ferramentas computacionais e sua história se confunde com o [[desenvolvimento tecnológico]], especificamente o [[computador]]. É possível identificar dois períodos importantes desde seu surgimento: antes do advento do computador e depois.
Linha 39:
Os corpora dessas épocas eram coletados, armazenados e analisados manualmente. A dificuldade de se realizar estudos desse tipo era enorme. Mesmo assim, havia grande interesse na coleta e exploração de corpora. É importante ressaltar o papel dos estudos baseados em corpora realizados manualmente pela dificuldade e pelo pioneirismo na época.
O período crítico para os estudos baseados em corpus se deu com a ‘mudança’ de [[paradigma]] da [[linguística]], com as
Embora o cenário fosse desfavorável, os estudos baseados em corpora não pararam. Muitos pesquisadores continuaram seus estudos por meio de corpora. [[Firth]] (1957) e os [[neo-firthianos]] defendiam a descrição da linguagem por meio de dados reais. O corpus [[SEU]] (Survey of English Usage), por exemplo, foi compilado e etiquetado manualmente em 1959. O SEU influenciou a criação de corpora eletrônicos e serviu para o desenvolvimento de etiquetadores computadorizados contemporâneos.
Linha 49:
Ao final dos anos 90, a Linguística de Corpus exerce grande influência em várias áreas da Linguística Aplicada ([[Ensino de Línguas]], [[Tradução]], [[Análise do Discurso]], [[Lexicografia]], etc), fornecendo subsídios [[teóricos]] e [[metodológicos]] que possibilitam o estudo de vários aspectos da linguagem.
Berber Sardinha, T. (2004). ''Lingüística de Corpus''. São Paulo: Manole.
Linha 55:
Biber, D.; Conrad, S.; Reppen, R. (1998). ''Corpus linguistics: investigating language structure and use''. Cambridge, Cambridge University Presss.
Hunston, S. (2002). ''Corpora in Applied Linguistics''. Cambridge
Kennedy, G. D. (1998). ''An introduction to corpus linguistics''. Nova York, Longman.
Linha 61:
=={{Ligações externas}}==
*[http://www2.lael.pucsp.br/corpora/bp Banco de Português]
*[http://www2.lael.pucsp.br/corpora/ Ferramentas computacionais
*[http://www.corpusdoportugues.org/ Corpus do Português]
*[http://www.revel.inf.br/site2007/_pdf/3/entrevistas/revel_3_entrevista_tony_berber_sardinha.pdf Linguística de Corpus: uma entrevista com Tony Berber Sardinha. Revista Virtual de Estudos da Linguagem - ReVEL, vol. 2, n. 3, 2004]
▲[[Categoria: Linguística de corpus]]
[[bg:Корпусна лингвистика]]
|