Nun acto celebrado no Clube Internacional de Prensa de Santiago, e no que interviu o secretario xeral de Política Lingüística, Anxo Lorenzo, o Centro Ramón Piñeiro para a investigación en humanidades presentou a nova versión do CORGA, o Corpus de Referencia do Galego Actual, alén de novas ferramentas web que permiten aproveitar estes desenvolvementos.

O CORGA consiste nun corpus de documentos en formato electrónico no que están representados os diferentes tipos de textos (xornalísticos, divulgativos, literarios, etc.) da lingua galega actual, desde 1975 ata a actualidade. Entre os principais avances que incorpora esta última versión do CORGA atópase o desenvolvemento do Etiquetador / Lematizador do Galego Actual (XIADA), que engade información gramatical sobre as palabras e un sistema de busca por palabra moito máis avanzada. Os outros dous recursos lingüísticos que se proporcionan son a lista completa de formas ortográficas diferentes (386.000) presentes no CORGA, xunto coa súa frecuencia de ocorrencias e unha ferramenta que achega diversa información sobre cada palabra.

A lista completa das formas ortográficas pode obterse cunha licenza libre, a LGPL e, asemade, as buscas realizadas a través do CORGA tamén son libres, se ben e necesario rexistrarse (de forma totalmente gratuíta) para obter un usuario e contrasinal.

Ademais, tamén está previsto que en setembro se libere o corpus etiquetado, que distingue case 260 mil formas gráficas e máis de 300 mil elementos gramaticais…
Fontes:

http://www.xunta.es/linguagalega/noticias/1045

http://www.vieiros.com/

Pin It on Pinterest

Share This