Vés al contingut

Comparació de transcriptors

Per a Català, Castellà, Anglès i Altres llengües
Menys d'1 hora

Hi ha moltíssims transcriptors i sovint s'assemblen molt. Com podem saber quin hem d'escollir en cada moment? Quina diferència hi ha entre l'eina de Softcatalà i la de dictat del Windows, per exemple?

En aquest consell, fem una repassada a diversos transcriptors diferents i els posem a prova per veure quin s'adapta millor a cada situació. Tots son gratuïts i s'hi pot accedir fàcilment des del nostre ordinador o dispositiu mòbil. Com veurem, les diferències principals tenen a veure amb la mena de tasca o de situació d'ús en què s'especialitza cadascun.

Eines de Google

Amb accés a una quantitat de dades i un nombre d'usuaris impensable fa un temps, el departament d'R+D de Google té un interès especial a desenvolupar i millorar un conjunt d'eines de tractament del llenguatge que s'integri amb la resta de les seves aplicacions de manera natural. És lògic, si pensem que la gran part de la informació a internet i les xarxes socials es vehicula a través del llenguatge oral o escrit. Aquí fem una repassada a algunes d'aquestes eines.

Google Live Transcribe

Google ofereix un transcriptor automàtic en format d'app per a dispositius mòbils amb el sistema operatiu Android. Es pot descarregar des de la Play Store, tot i que alguns models de smartphone el porten instal·lat de fàbrica. Cal dir que no és una eina dissenyada per a un entorn acadèmic: el transcriptor de Google va ser creat com a part del paquet d'eines d'accessibilitat d'Android per assistir persones amb discapacitat auditiva. Això no obstant, és cert que és útil fins i tot a la universitat. De fet, Google va desenvolupar l'eina amb l'assessorament de la Universitat de Gallaudet.

L'aplicació pot mantenir les transcripcions que pren enregistrades a l'historial, des d'on es pot extreure el text còmodament per afegir-lo en un document o qualsevol altre lloc. A més, el transcriptor és capaç de detectar sons ambientals com ara música, un cotxe, el lladruc d'un gos o el riure dels interlocutors i afegir una anotació a la transcripció, una funcionalitat que moltes altres eines no tenen. També permet configurar l'idioma principal i el secundari a la conversa que es vol transcriure. És un transcriptor dissenyat per al dia a dia i és ben senzill d'utilitzar si es té el mòbil a la mà. La contrapartida, però, és que la transcripció en català és menys fiable que en anglès.

Subtítols de YouTube

Amb la voluntat d'integrar les eines pròpies entre si, Google ha afegit la transcripció automàtica als vídeos de YouTube en uns quants idiomes (de moment, no inclou el català). Això ens permet poder veure pràcticament qualsevol vídeo d'aquesta xarxa amb subtítols generats automàticament, a banda que en tinguin d'elaborats manualment. Més enllà d'això, Google permet traduir-los automàticament a qualsevol de les més de 100 llengües que admet el seu traductor, com ara el català. Ara per ara, aquesta funcionalitat està restringida als vídeos de YouTube. Si voleu saber-ne més, no deixeu de veure el nostre vídeo sobre Com treballar amb els subtítols de YouTube.

Google Meet

Arran del desenvolupament del transcriptor de Google, Google Meet ha incorporat recentment un sistema de subtitulació automàtica a les seves trucades. Aquesta funcionalitat permet seguir una classe remota o una conversa a les persones amb discapacitats auditives o si hi ha soroll de fons i és una ajuda per a les persones que no tenen un bon domini de la llengua. A la base d'aquesta funcionalitat hi ha el mateix sistema que genera els subtítols automàtics de YouTube, però en una versió que per ara és reduïda (encara no hi ha el català integrat, per exemple). És un sistema força fiable, igual que els subtítols de YouTube, i molt còmoda si fem servir aquesta eina per fer teletrucades. Com a contrapartida, però, els subtítols automàtics no es poden descarregar per llegir-los o treballar-los més endavant.

Teclat d'Android i iPhone

El teclat d'Android i el d'iPhone incorporen per defecte un transcriptor senzill per poder redactar textos amb la veu. Tot i que es va millorant progressivament i és una funcionalitat extremament útil i popular, encara no és una eina completament acurada (especialment si ha de transcriure llengües com ara el català). És una eina molt simple de fer servir: únicament cal pitjar un botó i el transcriptor s'encarrega de detectar la veu a través del micròfon del dispositiu. Un cop s'ha acabat la transcripció, el text queda escrit allà on el volíem introduir: un missatge de text, la caixa de cerca del navegador, una nota escrita... El text es pot corregir lliurement abans d'enviar-lo i també es pot copiar com qualsevol altre text per tenir la transcripció enregistrada. És una de les eines més fàcils de fer servir i no cal instal·lar-la, ja que tots els telèfons Android i iPhone la tenen de fàbrica.

Windows i Microsoft Word

Les versions 10 i 11 del sistema operatiu Windows permeten, d'una manera molt semblant als teclats dels telèfons mòbils, dictar text oral per convertir-lo en text escrit. No cal instal·lar res ni registrar-se enlloc, només cal picar la tecla de Windows + h per cridar l'eina. La versió Office 365 del programa Microsoft Word d'edició de textos també incorpora l'eina de dictat, a través del menú Inici > Dictar.

El dictat per veu utilitza el reconeixement de veu en línia, que es basa en els serveis de veu d'Azure. Com a característica destacada, aquesta eina permet dictar els signes de puntuació i també donar comandaments de desplaçament dins del text o per esborrar elements.

Funciona en diverses llengües, però no en català.

Softcatalà

Si tenim un àudio o un vídeo en català, l’eina gratuïta de Softcatalà, basada en el model lliure de llenguatge Whisper, ens pot ser molt útil. A banda que admet molts formats diferents (mp3, wav, ogg, flac, avi, mp4, mov, mkv i mts), permet descarregar-se la transcripció en format text o codificada per a subtítols. Abans de generar-la, també permet definir alguns paràmetres dels subtítols: el nombre màxim de caràcters per línia i el nombre màxim de línies per subtítol.

Aquesta eina pot trigar més o menys estona a generar el text, d’una banda, en funció de la qualitat del model que triem i, de l’altra, perquè funciona amb un sistema de cua (depèn de les peticions que tinguem al davant). Quan s’ha acabat de fer la transcripció, rebem un correu electrònic que ens avisa que ja la podem descarregar.

No cal registrar-s'hi ni iniciar-hi sessió, només s'ha d'introduir l'adreça de correu electrònic i el nom per a l'avís. 

Subtitle Edit

Tot i que és un programa de creació i edició de subtítols gratuït i de codi obert, el Subtitle Edit també pot ser molt útil per transcriure. Pel que fa a la qualitat, s’assembla molt a la que ofereix l’eina de Softcatalà perquè també es basa en els models Whisper. El Subtitle Edit, però, ofereix la transcripció en format de subtítols en més d’una cinquantena d’idiomes, inclòs el català.

Si ja d’entrada tenim previst generar uns subtítols, aquesta eina és ideal perquè en la mateixa interfície podrem fer la transcripció automàtica i editar-ne el resultat. Per fer la transcripció, cal anar al menú: Vídeo > Audio to text (Whisper). S’obre una finestra en què podem definir les opcions que volem: idioma, mida del model de llenguatge i, fins i tot, si volem que ens ho tradueixi a l’anglès.