Skip to Main Content

Catàleg d'eines digitals

Catàleg d'eines i programari destinat a la creació multimèdia i digital

Transcripció d'àudio

 

Para qué se necesita una transcripción? | Protranslate Blog

La transcripció d'àudio es basa en la conversió d'un arxiu d'àudio o vídeo a text. Aquests arxius poden ser: entrevistes, investigacions acadèmiques, converses...

Transcriure un àudio requereix molt d'esforç, ja que un mecanògraf professional té una velocitat d'escriptura d'unes 70 paraules per minut. Per tant, una transcripció d'un àudio d'una hora tarda 5 hores a redactar-lo.

Per fer una transcripció d'àudio hem de tenir en compte diferents factors que dificulten aquesta transcripció:

  • El nombre de persones que parlen durant tot el vídeo o arxiu de so, com més persones parlen més difícil és la transcripció.
  • La claredat de so, ja que poden haver-hi sorolls de fons que dificulten la transcripció.
  • La cadència de l'interlocutor o dels interlocutors com ara, els accents, la distància del micròfon.
  • La velocitat de parla dels interlocutors del vídeo o arxiu de so.

Per aquest motiu, hem fet una recerca d'eines adequades per tal de facilitar-te la transcripció d'un àudio a text, per tal d'agilitzar el procés d'escriptura. El trobaràs subdividit en diferents blocs:

  • Transcripció automàtica. En aquestes aplicacions, has de penjar el fitxer i posteriorment pots editar o bé descarregar l'arxiu amb la transcripció. La majoria d'aquestes són de pagament. Hem seleccionat les següents eines: Audiocable, Happyscribe, Sonix, Amberscript i Transcribe by Wreally.
     
  • Transcripció manual. En aquestes aplicacions, la transcripció és realitzada per tu, però disposes de certes dreceres de teclat, regulador de velocitat, de volum, entre d'altres, que faciliten la transcripció. Hem seleccionat les següents eines: oTranscribe, Express Scribe i Wetranscriber.
  •  
  • Eines de dictat per veu. Aquest programari transcriurà tot el que diguis davant el micròfon. Podràs modificar el text i descarregar l'arxiu quan ho tinguis transcrit. Hem seleccionat les següents eines: Webcaptioner, Speechnotes i Dictation.io.
  •  
  • Contractar un/a professional per fer la traducció. La transcripció en línia en mans de diferents professionals. Hem seleccionat l'eina Rev.

 

Transcripció automàtica

Softcatalà transcripció

Servei de transcripció de Softcatalà

Descripció

El servei de transcripció de Softcatalà automatitza la transcripció d'àudio i vídeo en català a format text. Per aconseguir-ho utilitza models de transcripció lliures d'intel·ligència artificial d'OpenAI, anomenats Whisper.

 

Funcionament del servei:

  • Accepta els següents formats d'àudio o vídeo: MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV. La mida màxima del fitxer és de 1 GB.
  • El fitxer és processat als servidors de Softcatalà. Aquest procés pot trigar diverses hores depenent de la mida del fitxer i del nombre de transcripcions pendents.
  • Un cop finalitza la transcripció, l'usuari rep un correu electrònic amb l'enllaç al resultat final, on hi ha disponible un editor que permet navegar entre l'àudio i la transcripció per corregir i millorar possibles errors.
  • El fitxer s'elimina dels servidors 72 hores després de ser transcrit.
  • La transcripció es pot descarregar en format text o en format str per a ser utilitzat com a subtítols.
  • Si no es vol pujar l'arxiu als servidors, hi ha disponible una aplicació anomenada Buzz per poder fer la transcripció en local al nostre ordinador. Està disponible per Windows i macOS. Això també redueix el temps d'espera en rebre la transcripció, ja que evita la cua de transcripcions dels servidors de Softcatalà.

Imatge

Mostra de transcripció del servei de Softcatalà

 

Virtual Audio Cable

Descripció

VB-Cable és un dispositiu d'àudio virtual que funciona com a cable d'àudio virtual. La seva finalitat és aconseguir que l'ordinador pugui escoltar allò que està reproduint, d'aquesta manera pot transcriure-ho a temps real amb alguna eina com Microsoft Word o Google Drive, utilitzant la seva opció de dictat.

Al final d'aquest bloc trobaràs una guia en format PDF realitzada per la Factoria de la URV on es descriuen les passes a seguir per a la seva instal·lació, configuració i el seu ús amb un document de Google Drive.

 

Imatge

Recursos d'aprenentatge

A continuació et facilitem una guia realitzada per la Factoria de la URV per utilitzar el Virtual Audio Cable:

Convierte automáticamente audio y vídeo a texto: Rápido, preciso y  asequible | Sonix

Descripció

Sonix es caracteritza per la transcripció, subtitulació i traducció automàtica en línia. És una eina de cost, tot i que els primers 30 minuts són gratuïts. El cost d'aquesta aplicació varia segons les necessitats dels clients:

  • El cost estàndard és de 10$ l'hora.
  • El cost prèmium és de 5$ l'hora més 22$ de subscripció mensual.

És una eina ràpida, precisa i assequible i disposa de més de 35 idiomes per tal de realitzar les transcripcions.

Puja un arxiu a Sonix i en menys temps que la duració de l’àudio o vídeo, rebràs un correu on et notifica que la transcripció ja ha finalitzat, i et sortirà un enllaç per accedir a la transcripció.

La transcripció inclou marques de temps, ressaltat i funcionalitat d’edició integrada a la transcripció. Es pot descarregar i exportar amb molts formats per tal de fer pública la transcripció.

Les funcions són:

  • Anàlisi de reconeixement de veu
  • Càrrega d'arxiu d'àudio/vídeo
  • Codificació de temps
  • Edició de text
  • Processament de llenguatge natural
  • Reconeixement de veu
  • Transcripció automàtica
  • Ús compartit d'arxius

Imatge

Our Toolbox of Recommended Software & Gear - ProcessDriven

Descripció

Happy Scribe és un programa de transcripció i subtitulació en més de 119 llengües. Té una interfície molt fàcil d’utilitzar. Si és la primera vegada que fas servir un d’aquests programes, és una gran opció.

Els primers trenta minuts gratuïts. Té un cost de €0,20 el minut de transcripció. Disposa d’un apartat de transcripció manual gratuït. 

 

Quan fa les transcripcions, ens marca paraules en vermell que possiblement estan mal escrites, per així facilitar-nos la tasca de correcció.

 

Es poden afegir diferents speakers i canviar el nom, ja que detecta els canvis de veu mentre està transcrivint el text. Tot i que, l’aplicació es pot arribar a confondre una mica, perquè és una transcripció automàtica. Per tant, un cop feta la transcripció automàtica és recomanable escoltar l’àudio o el vídeo, per tal de revisar que estigui tot correcte. 

 

Un cop realitzada la transcripció, es pot descarregar en format word, .srt i molts altres, per tal d’adaptar-se a les necessitats dels clients. 

 

Però també, hi ha la possibilitat d’agregar-la com subtítols al vídeo pujat. Es pot canviar el format, mida, font, posició i color de text i modificar el text si hi ha alguna errada. Així com, es pot escollir si el vols en una línia, dues o tres, el nombre de caràcters per línia i la duració d’aquests subtítols. 

Imatge

Amberscript – Media and Learning

Descripció

Amberscript és una eina per transcriure vídeos o àudios de manera automàtica o manual. Cal dir que el cost varia segons les necessitats que tingui l'usuari. Per a la transcripció automàtica hi ha dues tarifes diferents:

  • Prepagament: 15€ per hora d'àudio o vídeo.
  • Subscripció mensual: 24€ mensuals per tres hores de transcripció mensuals.

Per altra banda, pel que fa a la transcripció manual, té un cost de 1,20€ per minut d'àudio o vídeo pujat.

Penja l'arxiu d’àudio o vídeo que vulguis transcriure.  El motor de reconeixement de veu permet crear una primera versió de l'àudio, que posteriorment pots millorar amb l’editor en línia, permetent una edició cinc cops més ràpida. 

L’editor permet revisar, ressaltar i buscar amb facilitat i inclou una distinció d’interlocutors editable i marques de temps ajustables, depenent els interessos dels clients.

Un cop l’edició estigui realitzada, pots descarregar la transcripció en formats diferents, com ara en Word, on es pugui veure els interlocutors i les marques de temps afegides a l’edició.

Imatge

Transcription Software to Convert Audio to Text | Transcribe

Descripció

Transcribe by Wreally és una plataforma de transcripció automàtica i manual. Aquesta plataforma s'utilitza en línea, per tant només es necessita connexió a Internet. El preu varia segons els interessos dels usuaris. Per una banda, la transcripció manual té un cost de 20$. Per altra banda, pel que fa a la transcripció automàtica és de 20$, afegint-li 6$ per cada hora de transcripció.

Pel que fa a la transcripció automàtica, hi ha 20 idiomes disponibles, un d'ells el català. Un cop escollit l'idioma es poden aplicar diverses opcions per inserir marques de temps, escapçar l'àudio i introduir diferents veus en la transcripció.

Un cop has triat les opcions de la transcripció, es puja l'arxiu d'àudio, cal dir que, accepta molts formats d'àudio. Tot i que s'aconsella el wav, ja que el so és de millor qualitat. S'ha de tenir en compte que quan es penja un arxiu, ha de ser menor a 2000 MB, però aquesta limitació és fàcil de solucionar, pel fet que es pot escapçar l'àudio.

Quan es penja l'arxiu, Transcribe comença a processar el so en text i en pocs minuts tindràs l'arxiu disponible.  Un cop realitzada la transcripció es podrà visualitzar i revisar a la seva pàgina web.

Com hem dit anteriorment, també disposa d’una traducció manual, optimitzant i reduint el temps de transcripció, ja que disposa d’eines per alentir l’àudio i realitzar bucles per tal de no haver de fer-ho manualment.

Finalment, cal dir que té molt en compte la seguretat i confidencialitat dels seus usuaris, transmetent confiança als seus clients.

Imatge

Transcripció manual

 

 

 

Descripció

Wetranscriber és un programa per transcriure i subtitular vídeos o arxius d'àudio manualment, completament gratuït. Aquesta té totes les funcionalitats bàsiques:

  • Modificar el format del text.
  • Posicionar els subtítols a la pantalla (alineats a l'esquerra, a la dreta...)
  • Pel que fa als subtítols, es pot modificar la duració dels subtítols, el màxim de paraules per línia...
  • Modificar la velocitat de l'àudio per tal de facilitar la tasca.
  • Afegir caràcters especials als subtítols o a la transcripció.
  • Seleccionar tecles d'accés ràpid, per tal d'agilitzar el procés de transcripció.

La descàrrega de la transcripció es pot fer amb format SRT, VTT, TRS, ASS, Word i Excel. A part, també permet compartir el treball realitzat mitjançant el correu electrònic.

Imatge

 

Descripció

oTranscribe és una eina per transcriure de forma manual totalment gratuïta i no escau cap mena de registre. Permet pujar vídeos i/o àudios o pujar-los directament de la plataforma de Youtube.

Aquesta aplicació és senzilla d'utilitzar, ja que disposes d'un document en blanc on es realitzarà la transcripció i el vídeo o la línia de temps de l'àudio.

Disposa de diferents dreceres de teclat, les quals pots modificar o afegir:

  • Aturar o continuar el vídeo
  • Anar enrere
  • Saltar endavant
  • Tornar a començar
  • Reduir la velocitat
  • Augmentar la velocitat
  • Inserir marca de temps
  • Text en negreta, cursiva i/o subratllat.
  • Temps exacte de la transcripció de manera automàtica.

 

Cada 5 minuts l’eina va desant automàticament el document. Tot i això, es pot guardar quan desitgem prement Control + S.

Un cop realitzada la transcripció podem obtenir l'arxiu en els següents formats:

  • Markdown (.md)
  • Plain text (.txt)
  • oTranscribe format (.otr)

Imatge

Express Scribe Transcription en App Store

Express Scribe

Descripció

Express Scribe és un programa de transcripció manual, amb una versió gratuïta i l'altra de pagament, aquesta última més completa.

  • Permet pujar vídeos i ajustar velocitat i volum segons les necessitats que tinguéssim, així com, realitzar reduccions del soroll de fons i potenciar el volum, per així facilitar la tasca de transcripció.
  • Aquesta aplicació permet inserir el temps de forma automàtica i disposa de dreceres de teclat per tal d'agilitzar el procés de transcripció.
  • Té la funció de fer-ho directament al Word, però no disposes de la possibilitat d'inserir les marques de temps al text escrit.

Quan acabes la transcripció a la plataforma, pots seleccionar el text (CTRL+A), copiar-lo i enganxar-lo on el vulguis desar.

Imatge

Eines de dictat per veu

Speechnotes - Aplicación de escritorio para Mac, Windows (PC ...

Speechnotes

Descripció

Speechnotes és un editor de text amb reconeixement de veu ideal per a transcripcions automàtiques. Ha estat dissenyat com una eina en línia per a dictats. Obté bons resultats i un cop finalitzat es pot compartir o descarregar amb formats diferents. 

  • Aquest programa és ràpid, fàcil d’usar i gratuït. Es pot modificar el text per tal de realitzar modificacions, en el moment de parla o un cop acabat, per tal d'organitzar el text i així facilitar la comprensió d’aquest. 
  • Aquesta aplicació està disponible per a dispositius mòbils, tant Android com iOS i per a ordinadors, a través del navegador web.
  • Un altre dels seus avantatges és que no requereix descàrrega, instal·lació ni registre; pots fer ús directament, sempre connectant el micròfon.

Imatge

Dictation.io Reviews, Key Info, and FAQs

Dictation.io

Descripció

Dictation.io és una eina que transcriu tot el que dius davant el micròfon. És ideal per obtenir per escrit qualsevol fragment que es narri oralment, de forma instantània. És una eina gratuïta i disposa centenars d’idiomes, entre un d’aquests, el català.

Està disponible per utilitzar-lo al navegador, per tant no caldrà fer descarrega ni instal·lació al teu dispositiu.

Aquesta aplicació et permetrà:

  • Ressaltar paraules amb negreta, cursiva i subratllat.
  • Modificar el color del text.
  • Subratllar el text.
  • Alinear el paràgraf (centrat, esquerra, dreta o justificat)
  • Enumerar frases o paraules.
  • Crear una llista amb pics.
  • Augmentar o disminuir la sagnia del text.
  • Mostrar tots els canvis.
  • Eliminar el format.

Un cop transcrit el que has narrat, tens l’opció de guardar, enviar com a tuit, correu electrònic o directament imprimir-ho.

Imatge

 

Microsoft Word Logo - PNG y Vector

Microsoft Office Word

Descripció

L’aplicació Microsoft Office Word ens ofereix una eina de dictat per veu. Aquesta eina permet que Microsoft Word escrigui automàticament allò que diem. Cal dir que aquesta eina no està disponible en català, però sí en castellà, i solament podem executar aquesta eina a la versió de Microsoft 365.

És molt senzill d’utilitzar, ja que sol prement a l’eina “Dictar” s’obrirà una pestanya, on ens apareixerà un micròfon i el símbol de configuració, on es pot seleccionar l’idioma i altres aspectes importants per a la transcripció.

Per  la versió Word, també hi ha l'opció de carregar un arxiu de so o vídeo per tal que faci la transcripció d'aquest, permetent així facilitar aquesta tasca tant costosa.

Imatge

Contractar un/a professional per fer la traducció

Rev Announces New Languages in Automated Speech Recognition

Descripció

Rev és una eina que permet la transcripció en línia en mans de diferents professionals. Hi ha més de 60.000 professionals realitzant transcripcions i traduccions a totes hores, per tant, la transcripció la reps ràpidament. El preu d'aquesta depèn de les necessitats que tinguis amb la tasca:

  • Si necessites solament la transcripció el preu és de 1,50$ per minut.
  • Si necessites la transcripció amb subtítols estranges de 3 a 7$ per minut.

Aquesta pàgina té molt en compte la seguretat i la confidencialitat dels usuaris, per tant, els usuaris poden pujar els documents o copiar els enllaços amb total tranquil·litat. 

Les transcripcions es lliuren com un document editable, per tal de facilitar la tasca i poder veure i editar el document amb les seves eines i posteriorment compartir-ho amb qualsevol persona.

Imatge

Llicència de Creative Commons

Aquesta obra està subjecta a una llicència de Reconeixement-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons