Introducció a la IA. Aplicacions bàsiques.
El 2019, la Comissió Mundial d'Ètica del Coneixement Científic i la Tecnologia (COMEST) de la UNESCO va definir la intel·ligència artificial com un camp que involucra màquines amb capacitat d'imitar certes funcionalitats de la intel·ligència humana, incloent-hi característiques com la percepció, l'aprenentatge, el raonament, la resolució de problemes, la interacció lingüística i fins i tot la producció de treballs creatius.
Col·loquialment, el terme "intel·ligència artificial" s'utilitza quan una màquina imita les funcions "cognitives" que els humans associen com a competències humanes, com per exemple: "percebre", "raonar", "aprendre" i "resoldre problemes".
Viquipèdia
La intel·ligència artificial (IA, a partir d’ara) utilitza algoritmes i models matemàtics per processar dades i aprendre patrons. Mitjançant l'ús de xarxes neuronals i l'aprenentatge automàtic, la IA pot analitzar informació, prendre decisions i resoldre problemes de manera semblant a com ho faria un cervell humà, però amb una capacitat de càlcul més ràpida i precisa.
Fa anys que convivim amb la Intel·ligència Artificial: el reconeixement facial dels dispositius mòbils, la traducció automàtica, la detecció de correu brossa, o els assistents virtuals com Alexa o Siri en són alguns exemples.
Aquestes aplicacions estan basades en IA discriminativa, fonamentada en un sistema que aprèn a classificar les dades en categories mitjançant patrons existents. Recull dades amb etiquetes, les analitza per trobar característiques importants i pren decisions sobre noves dades. Per exemple, pot aprendre a diferenciar entre gats i gossos en imatges basant-se en trets com a formes o textures. Un altre exemple podria ser la classificació de correus electrònics com a "spam" o "no spam". La IA discriminativa analitza els correus electrònics existents etiquetats com a correu brossa, identifica característiques comunes com paraules clau o patrons en el contingut, i utilitza aquesta informació per predir si un nou correu electrònic és "spam".
La irrupció de la IA generativa a finals de l’any 2022, ha desencadenat un gran interès i popularització d'aquesta tecnologia. A diferència de la IA discriminativa, aquesta crea noves dades i contingut original a partir de l’aprenentatge obtingut d’un conjunt molt gran de dades amb el que ha sigut entrenada. Això permet generar textos, imatges, música i molts altres tipus de contingut personalitzat i adaptat a les preferències individuals, de forma automàtica.
La seva aparició i popularització s’ha vist potenciada pels avenços tecnològics que han augmentat la capacitat de càlcul de grans quantitats de dades, i la creació d’interfícies que faciliten el seu ús. La capacitat de crear nou contingut coherent a l’abast de tothom, és el que sembla portar-nos cap a un veritable canvi disruptiu.
Imatge generada per IA amb el següent prompt: "Imatge realista que mostri un robot estudiant".
L’ús de la IA generativa pot aportar molts beneficis:
La IA és un camp molt ampli i transversal, amb aplicacions a gairebé tots els àmbits i sectors, per la qual cosa tindrà un impacte significatiu en el futur de les feines i els rols dels treballadors en molts sectors.
Mentre que algunes tasques rutinàries i repetitives podrien ser automatitzades, s'espera que sorgeixin noves oportunitats de treball i rols especialitzats.
Alguns dels sectors professionals que ja s’estan veient afectats per aquest canvi de paradigma són els relacionats amb la manufactura o fabricació, l'atenció mèdica, les finances, la logística i el transport, el comerç, l'agricultura, el servei al client, l'educació, el màrqueting i la publicitat, entre molts altres. La IA en aquests sectors millora l'eficiència, automatitza tasques repetitives, optimitza processos i permet una presa de decisions més efectiva. En entorns educatius pot ajudar a la creació de recursos i activitats al professorat, i millorar la personalització de l’aprenentatge als estudiants.
Per conèixer més sobre l'impacte de la IA a l'Educació Superior, pots consultar les nostres guies "IA i docència. Una guia pel professorat URV" i "IA i aprenentatge. Una guia per l’estudiant URV". |
Molts àmbits i sectors estan començant a trobar en la IA una eina valuosa per a millorar la seva eficiència, presa de decisions i resultats finals.
A més de modificar les feines ja existents, sorgiran noves professions relacionades amb la IA, com ara enginyers de dades, científics de dades, especialistes en ètica de la IA i tècnics de suport en tecnologia de la informació.
No obstant això, també cal destacar la preocupació per la pèrdua d’ocupació en certes àrees, riscos sobre la privacitat i la seguretat de les dades, i possibles desigualtats en l'accés i l'ús de la IA, creant bretxes digitals entre diferents grups socioeconòmics. És crucial abordar aquests reptes per garantir que la IA beneficiï a tothom de manera equitativa i responsable, abordant aquests desafiaments mitjançant polítiques i regulacions adequades per garantir que la IA sigui beneficiosa per a tota la societat, fomentant la inclusió, la transparència i la responsabilitat.
Tenint en consideració aquests contextos, serà important adaptar-se als canvis tecnològics, adquirir habilitats digitals i enfortir les habilitats humanes úniques com la creativitat, l'empatia i les habilitats socials.
La IA planteja diversos riscos ètics; hi ha preocupació sobre la privacitat i seguretat de les dades, ja que la IA pot recopilar i processar informació personal. També hi ha la preocupació de discriminació i biaixos en els algoritmes que poden afectar determinades persones o grups. Altres incerteses inclouen la pèrdua de llocs de treball a causa de l'automatització, accés a aquestes eines no equitatiu i l'ús de la IA per a propòsits maliciosos com el frau o la manipulació de la informació.
És important abordar aquests i altres riscos ètics per garantir un ús responsable i ètic de la IA.
La Unió Europea està treballant en una llei d’intel·ligència artificial que busca regular l’ús de la IA a la UE. La llei se centra a classificar els riscos associats amb la IA i establir obligacions per als proveïdors i usuaris. Es classifiquen quatre nivells de risc: inacceptable, alt, limitat i mínim.
Alguns exemples de les activitats inacceptables per a la seguretat de les persones són:
Les activitats amb un alt risc per la seguretat estan permeses, però les empreses i usuaris hauran de complir proves rigoroses, documentació adequada de la qualitat de les dades i un marc de rendició de comptes que detalli la supervisió humana. Aquestes inclouen vehicles autònoms, dispositius mèdics, sistemes d'IA per influir en els votants a les campanyes polítiques i els sistemes de recomanació utilitzats per les plataformes de xarxes socials.
Segons aquesta llei, els models de base generativa, com ChatGPT, hauran de complir amb requisits addicionals de transparència, com ara revelar que el contingut ha estat generat per IA, dissenyar el model per evitar que generi contingut il·legal i publicar resums de dades amb drets d'autor utilitzats per a la formació.
Per altra banda, han aparegut diferents moviments i associacions destinades a sensibilitzar i reivindicar una regulació sobre la Intel·ligència Artificial.
En destaquem civicai.cat, que treballa en accions basades en els següents principis:
A la seva pàgina web hi ha més informació sobre la seva activitat, juntament amb la possibilitat d’associar-se per participar-hi.
Per últim, també cal destacar els comunicats publicats i signats per molts líders del mateix sector, que alerten sobre els riscos de la IA i la importància de la seva regulació. Aquesta preocupació ha estat amplament reflectida en diversos mitjans de comunicació, posant de manifest la necessitat de garantir un ús responsable, transparent i ètic de la intel·ligència artificial.
La ràpida evolució de la intel·ligència artificial i l’aparició constant de noves eines dificulten l'actualització i el registre d'aplicacions que hi estan relacionades. Per aquesta raó, a les pestanyes superiors d'aquest bloc es presenta una catalogació que prioritza les diferents solucions i funcionalitats que ofereixen les eines d’IA, amb l’objectiu de mostrar les enormes possibilitats de creació i automatització d’aquestes eines, i per conèixer-ne les línies de desenvolupament, que ens permetran aprofitar al màxim les característiques de la IA generativa.
Aquestes són només algunes aplicacions de la IA en diferents sectors, però hi ha moltes més en desenvolupament que tindran un impacte determinant en el futur i en la manera com interactuem amb la tecnologia en la nostra vida professional i quotidiana.
És important remarcar que les tecnologies d’intel·ligència artificial estan cada cop més integrades en aplicacions, eines i llocs web que utilitzem diàriament. Això permet donar suport en temps real a les tasques i funcionalitats d'aquestes plataformes i millorar-les:
|
Aquestes eines poden treballar amb textos de manera eficient i precisa, com ara la traducció automàtica o el resum de textos, articles, pàgines web, etc. Una de les funcionalitats que ha suscitat més interès i expectació és la dels assistents virtuals, els quals són capaços de respondre preguntes i interactuar amb els usuaris en llenguatge natural, tal com ho faria una persona real.
Són molt útils per generar preguntes, activitats, debats o pluges d'idees, o superar el bloqueig creatiu de la síndrome del full en blanc.
ChatGPT és l’eina d’IA generativa més popular actualment, ja que té la capacitat de respondre preguntes formulades en llenguatge natural sobre qualsevol tema, de manera molt semblant a com ho faria un humà.
Et recomanem que consultis la nostra Guia tècnica de ChatGPT, que t’ajudarà a entendre millor com s’interactua amb l’eina per extreure’n el màxim profit.
Enllaç a l'aplicació ChatGPT >>>>
Enllaç a la Guia tècnica de ChatGPT >>>>
Bing Xat és un assistent virtual de xat creat per Microsoft que accedeix a la base de dades de cerca de Bing, cosa que significa que està connectat a Internet, per la qual cosa té informació recent. Utilitza el model GPT-4, una versió més nova que ChatGPT. Una altra característica és que les respostes que dona poden contenir els enllaços a les fonts utilitzades.
Enllaç a l'aplicació Bing Xat >>>>
Bard és l'aposta de Google per sumar-se al creixent interès de les eines de processament del llenguatge natural, amb la vista posada en l'actualització del seu buscador per adaptar-lo a la irrupció de la intel·ligència artificial.
La principal diferència entre ChatGPT i Bard és que Bard està connectat a Internet, per la qual cosa pot accedir a dades actuals i en temps real.
Enllaç a l'aplicació Bard >>>>
ChatHub és una extensió de Google Chrome que permet interactuar amb els xatbots més coneguts. Només cal que hi posis el text (prompt) que necessites i et tornarà la resposta de ChatGPT, Bing de Microsoft, Bard de Google i Claude. Poder conversar amb diversos xatbots alhora fa que sigui fàcil comparar-ne les respostes.
La IA pot facilitar moltes tasques quan treballem amb arxius PDF, com per exemple:
ChatPDF analitza un arxiu PDF i permet interactuar-hi per obtenir la informació que necessitem de l’article o document. Permet elaborar resums, explicar amb altres paraules el text, crear contingut nou basat en el de l’arxiu o, fins i tot, crear preguntes sobre el contingut del document. Tot això ho fa a través d’un xat molt similar al de ChatGPT que et fa sentir com si estiguessis conversant amb el contingut del fitxer.
Enllaç a l'aplicació ChatPDF >>>>
Algunes de les eines que han impulsat la popularització de la IA generativa són les aplicacions que permeten crear imatges d’alta qualitat de manera automàtica a partir de les descripcions i instruccions textuals que se’ls donen. Això és útil per crear contingut visual de manera més ràpida i eficient sense que calgui tenir coneixements de disseny gràfic ni d’edició d’imatges. També s’estan desenvolupant eines que faciliten la correcció i edició d’imatges mitjançant la IA automatitzant aquests processos.
DALL·E és una de les eines que han ajudat a popularitzar la IA generativa per la seva capacitat per crear imatges originals i realistes a partir d'una descripció de text en llenguatge natural. Desenvolupada per OpenAI, la mateixa organització que hi ha darrere de ChatGPT, té una versió gratuïta i una de pagament. En la versió gratuïta es disposa d'un nombre de crèdits limitats per crear imatges al llarg d'un mes.
Des del setembre de 2023, DALL·E està incorporat al xat Microsoft Bing i per utilitzar-la s'ha d'iniciar la sessió i accedir-hi; a continuació, només cal fer la descripció de la imatge. Aquest n’és un exemple:
"Crea una imatge amb un grup de 3 estudiants enregistrant un vídeo a l'aula, amb una càmera de vídeo, un micròfon i un fons verd":
Enllaç a l'aplicació DALL-E >>>>
Playground AI és una eina per la generació d'imatges a través de text amb molt bons resultats. A la seva versió gratuïta permet crear fins a 500 imatges al dia. També ofereix opcions per modificar les imatges generades.
Al seu canal de YouTube comparteixen guies i tutorials per aprofitar totes les seves característiques.
Zoo permet generar imatges utilitzant diverses plataformes d’IA simultàniament. És gratuïta i no cal instal·lar-la, sols cal accedir a la seva pàgina web i escriure-hi una definició de la imatge que es vol generar, que és creada amb 3 alternatives per a cada un dels següents models d'IA: stable-diffusio, DALL-E, kandinsky-2, deepfloyd-if i material-diffusion.
Scribble Diffusion converteix el teu esbós en una imatge d'alta qualitat. Només cal dibuixar un esbós i acompanyar-lo d'un text descriptiu de la imatge que es vol aconseguir. L'aplicació s'encarrega de generar la imatge a partir d'aquestes instruccions. És una eina totalment gratuïta i per fer-la servir no cal registrar-s'hi.
Enllaç a l'aplicació Scribble Diffusion >>>>
Clipdrop és molt semblant a Scribble Diffusion, ja que genera imatges a partir d'un esbós i un text descriptiu. Permet escollir diferents estils per a la imatge, com ara fotogràfic, origami, art digital, anime, model 3D, etc.
La intel·ligència artificial no solament pot generar imatges estàtiques, també permet produir vídeo de manera automàtica a partir de la descripció d’un text. Fins i tot es poden crear vídeos presentats per personatges digitals que reproduiran oralment el text que els donem.
També s’estan desenvolupant aplicacions amb funcionalitats per facilitar i automatitzar el treball amb vídeos, com per exemple crear transcripcions automàtiques en diferents idiomes o resumir el contingut d’un vídeo.
Runaway crea vídeos a partir d'una descripció de text. És gratuïta, però cal registrar-s'hi.
Enllaç a l'aplicació Runaway >>>>
La IA està demostrant que té una gran capacitat per crear àudio. Pot generar música original mitjançant l’ús d'algoritmes de xarxes neuronals, els quals poden aprendre a partir de dades musicals preexistents, com ara cançons populars o clàssiques. Això pot ser molt útil per crear música d’acompanyament per a vídeos o altres continguts audiovisuals, lliure de drets d’autor, per la qual cosa es pot utilitzar per a qualsevol finalitat sense que calgui sol·licitar cap permís per reproduir-la.
Una altra aplicació de la IA en el món de l'àudio és la síntesi de veu, que s’utilitza per generar veu sintètica que sona com la de persones reals i que fins i tot pot simular accents i veus de persones conegudes.
També cal destacar les aplicacions que ens faciliten l’edició d’àudio mitjançant la transcripció, cosa que ens permet retallar o afegir àudio a partir de text, sense haver d’utilitzar un programari específic d’edició d’àudio i manipular les ones sonores.
A més, hi ha eines que ens ajuden a millorar la qualitat d’una locució per aconseguir un resultat professional. Podem corregir la reverberació, l'equalització i altres paràmetres de manera automàtica, sense que calgui tenir coneixements tècnics.
Voicemaker converteix un text a veu. Entre els diferents idiomes disponibles hi ha el català, per la qual es poden escollir fins a quatre veus diferents. Un cop creat es pot descarregar en format MP3. A continuació se'n mostra un exemple:
BeatBot permet crear música a partir d’una descripció de text en què se’n pot especificar el gènere o estil musical. També genera la lletra de manera automàtica o permet crear-la un cop s’ha produït la música. A més, s’hi pot detallar la durada que ha de tenir, per la qual cosa és una bona opció per crear música que acompanyi un vídeo amb una durada determinada.
Exemple de cançó creada amb BeatBot utilitzant el text (prompt) següent: “Cançó alegre de 30 segons per a un vídeo sobre intel·ligència artificial”:
Adobe Podcast ofereix un conjunt d'eines per treballar amb àudio d'una manera innovadora gràcies a la IA. Per exemple, permet editar àudio a partir de les paraules d'una transcripció, per la qual cosa no cal treballar amb formes d'ona. També permet millorar la qualitat de l'enregistrament de manera automàtica, eliminant-ne el soroll de fons i millorant-ne la reverberació, la qual cosa fa que sembli que s'ha enregistrat en un estudi professional. A la seva pàgina web trobaràs moltes altres funcionalitats per descobrir com es treballarà amb àudio en el futur.
La intel·ligència artificial s'ha convertit en una eina poderosa per a la composició, la producció i la generació de música i ofereix noves perspectives creatives. Aquestes eines possibiliten una experiència col·laborativa entre l'artista i la IA, oferint suggeriments creatius i facilitant l'exploració de noves fronteres sonores. A la producció musical, optimitza la qualitat del so, proporcionant solucions automàtiques de mescla i masterització.
Aplicacions d'exemple
Soundraw és una aplicació dissenyada que permet als usuaris explorar lliurament la composició musical creada per IA. Destacant entre les seves característiques principals, la generació automàtica de música permet als usuaris experimentar amb la creació instantània de composicions originals, adaptades a les preferències musicals.
Ofereix una personalització encara més gran en permetre als usuaris seleccionar la durada desitjada de la cançó i ajustar la seva velocitat. Aquesta flexibilitat no sols potencia la creativitat, sinó que també proporciona un control precís sobre l'experiència musical, convertint Soundraw en una eina versàtil i adaptable per a músics o creadors audiovisuals de tots els nivells.
La IA és una magnífica eina per automatitzar tasques de transcripció de veu a text, com per exemple, una entrevista o una gravació d’àudio, de manera totalment automàtica i en diferents idiomes. També permet crear la locució d’un text que li facilitem en els idiomes que necessitem.
Softcatalà té un servei de transcripció que automatitza la transcripció d'àudio i vídeo en català a format text. Per aconseguir-ho, utilitza models de transcripció lliures d'intel·ligència artificial d'OpenAI, anomenats Whisper. Accepta els formats d'àudio o vídeo següents: MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV. El volum màxim del fitxer és d'1 GB.
Si no es vol pujar l'arxiu als servidors, ofereix una aplicació anomenada Buzz per poder fer la transcripció al nostre ordinador, disponible per a Windows i macOS, que redueix el temps que s'ha d'esperar a rebre la transcripció, ja que evita la cua de transcripcions dels servidors de Softcatalà.
Totes les imatges d'aquesta guia han estat generades per IA generativa.
Les icones han estat extretes de flaticon.
ChatGPT (OpenAI)
AI Act: a step closer to the first rules on Artificial Intelligence.
Ley de IA en la Unión Europea: estas son las claves de la propuesta.
Aquesta obra està subjecta a una llicència de Reconeixement-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons