Vés al contingut

Utilitza els corpus textuals per redactar millor

Per a Català, Castellà, Anglès i Altres llengües
Menys d'1 hora

Què és un corpus?

Un corpus textual és un conjunt de textos recopilats i organitzats amb la finalitat de ser analitzats principalment per estudiar una llengua o bé per entrenar models de processament de llenguatge natural. També en pot utilitzar qualsevol persona per millorar la redacció de textos, sobretot en llengua estrangera.

Per exemple, si dubtes sobre la preposició que acompanya la paraula “associated” en anglès,  pots fer una cerca en un corpus. La cerca et donarà com a resultat el que es diuen “concordances”, és a dir, instàncies de la paraula cercada en el context més proper. Així, sabràs que la preposició adequada per acompanyar la paraula cercada és “with”.

Et presentem una llista de corpus textuals en línia elaborats per institucions que et poden ser útils:

Corpus textual informatitzat de la llengua catalana (CTIL): un corpus de la llengua catalana que compila textos de gèneres, estils i períodes diferents elaborat per l'Institut d'Estudis Catalans. La interfície permet consultar concordances i col·locacions.

Corpus of Contemporary American English: el corpus de llengua anglesa més complet i actualitzat dels corpus generalistes, amb mil milions de paraules.

English.Corpora. org: una selecció de corpus de textos escrits i orals de diverses fonts. La llista també inclou el Corpus of Contemporary American English i el British National Corpus.

Corpus of Research Articles: un corpus de 5,5 milions de paraules d’articles de recerca en 39 disciplines. Permet cercar per camps de coneixement i/o per seccions dels articles de recerca, amb la qual cosa pot resultar útil per consultar la fraseologia adequada en cada cas. 

Corpus de Referencia del Español Actual (CREA): un corpus de la llengua espanyola de 200 milions de paraules que es pot consultar com a conjunt o per diferents camps de coneixement elaborat per la Real Academia de la Lengua Española.

També pots anar més enllà i crear-te el teu corpus, amb els textos de l’àmbit que t’interessi. T’ho expliquem aquí.