CORGA

Na Galipedia, a wikipedia en galego.

O Corpus de Referencia do Galego Actual (CORGA) é unha colección de documentos que se almacenan en formato electrónico na que están representados os diferentes tipos de textos da lingua galega actual (xornalísticos, literarios, etc.). Cronoloxicamente comprende textos publicados dende 1975 ata a actualidade.

A amplitude de documentos dos que consta, así como os criterios empregados na súa selección, permite considerar este corpus representativo do uso lingüístico do galego actual.

Neste momento dispón de dúas versións en liña. Unha con 17,5 millóns de formas á que se pode acceder a través de http://corpus.cirp.es/corga, e outra con 19,8 millóns de formas á que se pode acceder a través de http://corpus.cirp.es/corgaxml.

Esta segunda versión creouse coa finalidade de adecuar o corpus existente ás tecnoloxías actuais e posibilitar un sistema de recuperación de información máis flexible e efectivo que o existente, polo que se está levando a cabo unha reestruturación da base documental seguindo o estándar XML (eXtensible Markup Language), e será a versión que irá evolucionando no tempo.

[editar] Ligazóns externas

Corpus dixitais
Galego textual: CODOLGA - TMILG - TILG - CORGA - CLUVI - CTG - TUVI
Galego oral: ASG
Portugués: CPM - CPM - DPM - AC/DC
Castelán textual: CREA - CORDE - Cumbre - Lexesp
Castelán oral: COREC - MNLCCMH - SoCREA - Val.Es.Co - C-ORAL-ROM - PRESEEA - Corpus del Español Histórico y Moderno