Introducció a la IA. Aplicacions bàsiques.
El 2019, la Comissió Mundial d'Ètica del Coneixement Científic i la Tecnologia (COMEST) de la UNESCO va definir la intel·ligència artificial com un camp que involucra màquines amb capacitat d'imitar certes funcionalitats de la intel·ligència humana, incloent-hi característiques com la percepció, l'aprenentatge, el raonament, la resolució de problemes, la interacció lingüística i fins i tot la producció de treballs creatius.
Col·loquialment, el terme "intel·ligència artificial" s'utilitza quan una màquina imita les funcions "cognitives" que els humans associen com a competències humanes, com per exemple: "percebre", "raonar", "aprendre" i "resoldre problemes".
Viquipèdia
La intel·ligència artificial (IA, a partir d’ara) utilitza algoritmes i models matemàtics per processar dades i aprendre patrons. Mitjançant l'ús de xarxes neuronals i l'aprenentatge automàtic, la IA pot analitzar informació, prendre decisions i resoldre problemes de manera semblant a com ho faria un cervell humà, però amb una capacitat de càlcul més ràpida i precisa.
Fa anys que convivim amb la Intel·ligència Artificial: el reconeixement facial dels dispositius mòbils, la traducció automàtica, la detecció de correu brossa, o els assistents virtuals com Alexa o Siri en són alguns exemples.
Aquestes aplicacions estan basades en IA discriminativa, fonamentada en un sistema que aprèn a classificar les dades en categories mitjançant patrons existents. Recull dades amb etiquetes, les analitza per trobar característiques importants i pren decisions sobre noves dades. Per exemple, pot aprendre a diferenciar entre gats i gossos en imatges basant-se en trets com a formes o textures. Un altre exemple podria ser la classificació de correus electrònics com a "spam" o "no spam". La IA discriminativa analitza els correus electrònics existents etiquetats com a correu brossa, identifica característiques comunes com paraules clau o patrons en el contingut, i utilitza aquesta informació per predir si un nou correu electrònic és "spam".
La irrupció de la IA generativa a finals de l’any 2022, ha desencadenat un gran interès i popularització d'aquesta tecnologia. A diferència de la IA discriminativa, aquesta crea noves dades i contingut original a partir de l’aprenentatge obtingut d’un conjunt molt gran de dades amb el que ha sigut entrenada. Això permet generar textos, imatges, música i molts altres tipus de contingut personalitzat i adaptat a les preferències individuals, de forma automàtica.
La seva aparició i popularització s’ha vist potenciada pels avenços tecnològics que han augmentat la capacitat de càlcul de grans quantitats de dades, i la creació d’interfícies que faciliten el seu ús. La capacitat de crear nou contingut coherent a l’abast de tothom, és el que sembla portar-nos cap a un veritable canvi disruptiu.
Imatge generada per IA amb el següent prompt: "Imatge realista que mostri un robot estudiant".
L’ús de la IA generativa pot aportar molts beneficis:
La IA és un camp molt ampli i transversal, amb aplicacions a gairebé tots els àmbits i sectors, per la qual cosa tindrà un impacte significatiu en el futur de les feines i els rols dels treballadors en molts sectors.
Mentre que algunes tasques rutinàries i repetitives podrien ser automatitzades, s'espera que sorgeixin noves oportunitats de treball i rols especialitzats.
Alguns dels sectors professionals que ja s’estan veient afectats per aquest canvi de paradigma són els relacionats amb la manufactura o fabricació, l'atenció mèdica, les finances, la logística i el transport, el comerç, l'agricultura, el servei al client, l'educació, el màrqueting i la publicitat, entre molts altres. La IA en aquests sectors millora l'eficiència, automatitza tasques repetitives, optimitza processos i permet una presa de decisions més efectiva. En entorns educatius pot ajudar a la creació de recursos i activitats al professorat, i millorar la personalització de l’aprenentatge als estudiants.
Per conèixer més sobre l'impacte de la IA a l'Educació Superior, pots consultar les nostres guies "IA i docència. Una guia pel professorat URV" i "IA i aprenentatge. Una guia per l’estudiant URV". |
Molts àmbits i sectors estan començant a trobar en la IA una eina valuosa per a millorar la seva eficiència, presa de decisions i resultats finals.
A més de modificar les feines ja existents, sorgiran noves professions relacionades amb la IA, com ara enginyers de dades, científics de dades, especialistes en ètica de la IA i tècnics de suport en tecnologia de la informació.
No obstant això, també cal destacar la preocupació per la pèrdua d’ocupació en certes àrees, riscos sobre la privacitat i la seguretat de les dades, i possibles desigualtats en l'accés i l'ús de la IA, creant bretxes digitals entre diferents grups socioeconòmics. És crucial abordar aquests reptes per garantir que la IA beneficiï a tothom de manera equitativa i responsable, abordant aquests desafiaments mitjançant polítiques i regulacions adequades per garantir que la IA sigui beneficiosa per a tota la societat, fomentant la inclusió, la transparència i la responsabilitat.
Tenint en consideració aquests contextos, serà important adaptar-se als canvis tecnològics, adquirir habilitats digitals i enfortir les habilitats humanes úniques com la creativitat, l'empatia i les habilitats socials.
La IA planteja diversos riscos ètics; hi ha preocupació sobre la privacitat i seguretat de les dades, ja que la IA pot recopilar i processar informació personal. També hi ha la preocupació de discriminació i biaixos en els algoritmes que poden afectar determinades persones o grups. Altres incerteses inclouen la pèrdua de llocs de treball a causa de l'automatització, accés a aquestes eines no equitatiu i l'ús de la IA per a propòsits maliciosos com el frau o la manipulació de la informació.
És important abordar aquests i altres riscos ètics per garantir un ús responsable i ètic de la IA.
La Unió Europea està treballant en una llei d’intel·ligència artificial que busca regular l’ús de la IA a la UE. La llei se centra a classificar els riscos associats amb la IA i establir obligacions per als proveïdors i usuaris. Es classifiquen quatre nivells de risc: inacceptable, alt, limitat i mínim.
Alguns exemples de les activitats inacceptables per a la seguretat de les persones són:
Les activitats amb un alt risc per la seguretat estan permeses, però les empreses i usuaris hauran de complir proves rigoroses, documentació adequada de la qualitat de les dades i un marc de rendició de comptes que detalli la supervisió humana. Aquestes inclouen vehicles autònoms, dispositius mèdics, sistemes d'IA per influir en els votants a les campanyes polítiques i els sistemes de recomanació utilitzats per les plataformes de xarxes socials.
Segons aquesta llei, els models de base generativa, com ChatGPT, hauran de complir amb requisits addicionals de transparència, com ara revelar que el contingut ha estat generat per IA, dissenyar el model per evitar que generi contingut il·legal i publicar resums de dades amb drets d'autor utilitzats per a la formació.
Per altra banda, han aparegut diferents moviments i associacions destinades a sensibilitzar i reivindicar una regulació sobre la Intel·ligència Artificial.
En destaquem civicai.cat, que treballa en accions basades en els següents principis:
A la seva pàgina web hi ha més informació sobre la seva activitat, juntament amb la possibilitat d’associar-se per participar-hi.
Per últim, també cal destacar els comunicats publicats i signats per molts líders del mateix sector, que alerten sobre els riscos de la IA i la importància de la seva regulació. Aquesta preocupació ha estat amplament reflectida en diversos mitjans de comunicació, posant de manifest la necessitat de garantir un ús responsable, transparent i ètic de la intel·ligència artificial.
La ràpida evolució de la IA i l’aparició constant de noves eines, dificulta l'actualització i registre d'aplicacions relacionades amb la intel·ligència artificial. Per aquesta raó, a les pestanyes superiors d'aquest bloc, es presenta una catalogació que prioritza les diferents solucions i funcionalitats que ofereixen les eines d’IA, amb l’objectiu de mostrar les enormes possibilitats de creació i automatització d’aquestes eines, i per a conèixer les línies de desenvolupament que s’estan duent a terme per aprofitar al màxim les característiques de la IA generativa.
Aquestes són només algunes aplicacions d’IA en diferents sectors, però hi ha moltes més en desenvolupament que tindran un impacte determinant en el futur i en la forma en què interactuem amb la tecnologia en la nostra vida professional i quotidiana.
És important remarcar que les tecnologies d’intel·ligència artificial estan cada cop més integrades a aplicacions, eines i llocs web que utilitzem diàriament. Això permet donar suport en temps real i millorar les tasques i funcionalitats d'aquestes plataformes:
|
Aquestes eines poden comunicar-se i treballar amb textos de manera eficient i precisa, realitzant tasques com la traducció automàtica o resumir textos, articles, pàgines web, etc. Una de les funcionalitats que major interès i expectació ha suscitat és la dels assistents virtuals. Aquests assistents són capaços de respondre preguntes i interactuar amb els usuaris en llenguatge natural, tal com ho faria una persona real.
Molt útils per generar preguntes, activitats, debats, pluja d'idees o superar el bloqueig creatiu de la síndrome del full en blanc.
ChatGPT és l’eina d’IA generativa més popular actualment, ja que té la capacitat de respondre preguntes formulades en llenguatge natural sobre qualsevol tema, de manera molt semblant a com ho faria un humà.
Et recomanem que consultis la nostra “Guia tècnica de ChatGPT” que t’ajudarà a entendre millor com interactuar amb l’eina per extreure el màxim profit.
Enllaç a l'aplicació ChatGPT >>>>
Bard és l'aposta de Google per sumar-se al creixent interès de les eines de processament del llenguatge natural, amb la vista posada a l'actualització del seu buscador per adaptar-se a la irrupció de la intel·ligència artificial.
La principal diferència entre ChatGPT i Bard, és que aquesta última està connectada a Internet, pel que té accés a dades actuals i en temps real.
Enllaç a l'aplicació Bard >>>>
ChatHub és una extensió de Google Chrome que permet interactuar amb els xatbots més coneguts al mateix temps. Només cal posar el prompt que necessites i aquest tornarà la resposta de ChatGPT, Bing de Microsoft, Bard de Google i Claude. Poder conversar amb diversos xatbots al mateix temps fa que sigui fàcil comparar les seves respostes.
Enllaç a l'aplicació ChatHub >>>>
La IA pot facilitar moltes tasques quan treballem amb arxius PDF, com per exemple:
Convertir text de PDF escanejats en text editable a través de l'OCR (Reconeixement Òptic de Caràcters).
Generació automàtica de resums o síntesi de documents PDF.
Sistemes d'extracció d'informació basats en IA per identificar i classificar dades específiques en documents PDF.
Poder "conversar" amb el contingut de l'arxiu PDF per poder fer resums, extreure'n preguntes, etc.
ChatPDF analitza un arxiu pdf i permet interactuar per obtenir la informació que necessitem de l’article o document. Permet realitzar resums, explicar amb altres paraules el text, crear contingut nou basat en el de l’arxiu, o fins i tot, crear preguntes sobre el contingut del document. Tot això a través d’un xat molt similar al del ChatGPT que et fa sentir com si estiguessis conversant amb el contingut del fitxer.
Enllaç a l'aplicació ChatPDF >>>>
Algunes de les eines que han impulsat la popularització de la IA generativa, són les aplicacions que permeten crear imatges d’alta qualitat de manera automàtica a través de les descripcions i instruccions textuals que se li donen. Això és útil per a crear contingut visual de manera més ràpida i eficient sense necessitat de coneixements de disseny gràfic, ni d’edició d’imatges. També s’estan desenvolupant eines que faciliten la correcció i edició d’imatges a través de la IA automatitzant aquests processos.
DALL-E és una de les eines que han ajudat a popularitzar la IA generativa a través de la seva capacitat per crear imatges originals i realistes a partir d'una descripció de text en llenguatge natural. Desenvolupada per OpenAI, la mateixa organització que hi ha darrere del ChatGPT, té una versió gratuïta i una de pagament. A la versió gratuïta es disposa d'un nombre de crèdits limitats per crear imatges al llarg d'un mes.
Enllaç a l'aplicació DALL-E >>>>
Zoo permet generar imatges utilitzant diverses plataformes d’IA simultàniament. És gratuïta i no requereix instal·lació, únicament és necessari accedir a la seva pàgina web i escriure una definició de la imatge que es vol generar. Aquesta serà creada amb 3 alternatives per cada un dels següents models de IA: stable-diffusio, DALL-E, kandinsky-2, deepfloyd-if, material-diffusion.
Scribble Diffusion converteix el teu esbós en una imatge d'alta qualitat. Només cal dibuixar un esbós i acompanyar-lo d'un text descriptiu de la imatge que es vol aconseguir. L'aplicació s'encarrega de generar la imatge a través d'aquestes instruccions. És una eina totalment gratuïta que no necessita registre.
Enllaç a l'aplicació Scribble Diffusion >>>>
Clipdrop és molt semblant a Scribble Diffusion, ja que genera imatges a partir d'un esbós i un text descriptiu. Permet escollir diferents estils a la imatge, com per exemple: fotogràfic, origami, art digital, anime, model 3D, etc.
La intel·ligència artificial no solament pot generar imatges estàtiques, també permet generar vídeo de manera automàtica a través de la descripció d’un text. Inclús es poden crear vídeos presentats per personatges digitals que locutaran el text que els hi indiquem.
També s’estan desenvolupant aplicacions amb funcionalitats per facilitar i automatitzar el treball amb vídeos, com per exemple, crear transcripcions automàtiques en diferents idiomes o resumir el contingut d’un vídeo.
Runaway crea vídeos a través d'una descripció en text. És gratuïta, però requereix registrar-se.
Enllaç a l'aplicació Runaway >>>>
La IA està mostrant una gran capacitat per la creació d’àudio. Pot generar música mitjançant l’ús d'algoritmes de xarxes neuronals. Aquests algoritmes poden aprendre a partir de dades musicals preexistents, com ara cançons populars o clàssiques, per generar música original. Això pot resultar molt útil per crear música d’acompanyament per a vídeos o altres continguts audiovisuals, lliure de drets d’autor, per la qual cosa es pot utilitzar per a qualsevol finalitat sense necessitat de sol·licitar permís a l'autor.
Una altra aplicació de la IA al món de l'àudio és la síntesi de veu. Aquesta s’utilitza per generar veus sintètiques que sonen com persones reals, fins i tot, poden simular accents i veus de persones conegudes.
També cal destacar les aplicacions que ens faciliten l’edició d’àudio a través de la transcripció, el que ens permet retallar o afegir àudio a través de text, sense necessitat d’utilitzar un programari específic d’edició d’àudio i manipular les ones sonores.
A més, hi ha eines que ens ajuden a millorar la qualitat d’una locució per aconseguir un resultat professional. Podem corregir la reverberació, l'equalització i altres paràmetres de forma automàtica, sense necessitats de coneixements tècnics.
Voicemaker converteix un text a veu. Entre els diferents idiomes disponibles es troba el català, amb el que es poden escollir fins a 4 veus diferents. Un cop creat es pot descarregar en format MP3. A continuació es mostra un exemple:
BeatBot permet crear música a través d’una descripció de text on es pot indicar el gènere o estil musical. També genera la lletra de forma automàtica o permet crear-la un cop generada la música. A més es pot afegir la duració que ha de tenir, i per això és una bona opció per crear música que acompanyi un vídeo amb una duració determinada.
Exemple de cançó creada amb BeatBot utilitzant el següent prompt o text: Cançó alegre de 30 segons per un vídeo sobre intel·ligència artificial:
Adobe Podcast ofereix un conjunt d'eines per treballar amb àudio d'una forma innovadora gràcies a la IA. Per exemple, permet editar àudio a través de les paraules de la seva transcripció, per la qual cosa no és necessari treballar amb formes d'ona. També permet millorar la qualitat de l'enregistrament de forma automàtica, eliminant el soroll de fons i millorant la reverberació, fent que sembli que s'ha enregistrat en un estudi professional. A la seva pàgina web trobaràs moltes altres funcionalitats per descobrir com es treballarà amb àudio en el futur.
La IA és una magnífica eina per automatitzar tasques de transcripció de veu a text, com per exemple, una entrevista o gravació d’àudio de forma totalment automàtica i en diferents idiomes. També permet crear la locució d’un text que li facilitem en aquells idiomes que necessitem.
Softcatalà té un servei de transcripció que automatitza la transcripció d'àudio i vídeo en català a format text. Per aconseguir-ho utilitza models de transcripció lliures d'intel·ligència artificial d'OpenAI, anomenats Whisper. Accepta els següents formats d'àudio o vídeo: MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV. La mida màxima del fitxer és d'1 GB.
Si no es vol pujar l'arxiu als servidors, hi ha disponible una aplicació anomenada Buzz per poder fer la transcripció en local al nostre ordinador. Està disponible per Windows i macOS. Això també redueix el temps d'espera en rebre la transcripció, ja que evita la cua de transcripcions dels servidors de Softcatalà.
Totes les imatges d'aquesta guia han estat generades per IA generativa.
Les icones han estat extretes de flaticon.
ChatGPT (OpenAI)
AI Act: a step closer to the first rules on Artificial Intelligence.
Ley de IA en la Unión Europea: estas son las claves de la propuesta.
Aquesta obra està subjecta a una llicència de Reconeixement-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons