Skip to Main Content

Introducció a la IA - Un recorregut ràpid per aplicacions bàsiques

Introducció a la IA. Un recorregut ràpid per aplicacions bàsiques

Col·lecció de guies sobre intel·ligència artificial i educació a la URV

IA.png

Guies sobre intel·ligència artificial i educació a la URV

  1. Introducció a la IA. ​Aplicacions bàsiques.

  2. Guia tècnica de ChatGPT​.

  3. IA i docència. Una guia pel professorat URV

  4. IA i aprenentatge. Una guia per l’estudiant URV.

Què és la Intel·ligència Artificial i com pot canviar el món

Logotip de la guia d'intel·ligència artificial

 

Què és la intel·ligència artificial i com pot canviar el món

El 2019, la Comissió Mundial d'Ètica del Coneixement Científic i la Tecnologia (COMEST) de la UNESCO va definir la intel·ligència artificial com un camp que involucra màquines amb capacitat d'imitar certes funcionalitats de la intel·ligència humana, incloent-hi característiques com la percepció, l'aprenentatge, el raonament, la resolució de problemes, la interacció lingüística i fins i tot la producció de treballs creatius.  

Col·loquialment, el terme "intel·ligència artificial" s'utilitza quan una màquina imita les funcions "cognitives" que els humans associen com a competències humanes, com per exemple: "percebre", "raonar", "aprendre" i "resoldre problemes".

Viquipèdia

La intel·ligència artificial (IA, a partir d’ara) utilitza algoritmes i models matemàtics per processar dades i aprendre patrons. Mitjançant l'ús de xarxes neuronals i l'aprenentatge automàtic, la IA pot analitzar informació, prendre decisions i resoldre problemes de manera semblant a com ho faria un cervell humà, però amb una capacitat de càlcul més ràpida i precisa. 

 

Quins són els motius del creixent interès i popularització de la IA que estem vivint?

Fa anys que convivim amb la Intel·ligència Artificial: el reconeixement facial dels dispositius mòbils, la traducció automàtica, la detecció de correu brossa, o els assistents virtuals com Alexa o Siri en són alguns exemples.  
Aquestes aplicacions estan basades en IA discriminativa, fonamentada en un sistema que aprèn a classificar les dades en categories mitjançant patrons existents. Recull dades amb etiquetes, les analitza per trobar característiques importants i pren decisions sobre noves dades. Per exemple, pot aprendre a diferenciar entre gats i gossos en imatges basant-se en trets com a formes o textures. Un altre exemple podria ser la classificació de correus electrònics com a "spam" o "no spam". La IA discriminativa analitza els correus electrònics existents etiquetats com a correu brossa, identifica característiques comunes com paraules clau o patrons en el contingut, i utilitza aquesta informació per predir si un nou correu electrònic és "spam".

La irrupció de la IA generativa a finals de l’any 2022, ha desencadenat un gran interès i popularització d'aquesta tecnologia. A diferència de la IA discriminativa, aquesta crea noves dades i contingut original a partir de l’aprenentatge obtingut d’un conjunt molt gran de dades amb el que ha sigut entrenada. Això permet generar textos, imatges, música i molts altres tipus de contingut personalitzat i adaptat a les preferències individuals, de forma automàtica

La seva aparició i popularització s’ha vist potenciada pels avenços tecnològics que han augmentat la capacitat de càlcul de grans quantitats de dades, i la creació d’interfícies que faciliten el seu ús. La capacitat de crear nou contingut coherent a l’abast de tothom, és el que sembla portar-nos cap a un veritable canvi disruptiu. 

Imatge generada per IA d'un robot estudiant

Imatge generada per IA amb el següent prompt: "Imatge realista que mostri un robot estudiant".

L’ús de la IA generativa pot aportar molts beneficis:  

  • Personalització del contingut: Pot crear contingut adaptat a les preferències individuals, proporcionant experiències personalitzades a cada persona.
  • Optimització del temps: Reduint el temps dedicat a tasques rutinàries, permetent centrar-se en tasques més importants, complexes i amb més valor afegit.  
  • Assistència a la presa de decisions: Pot ajudar a prendre decisions més ràpides i eficaces a través de l'anàlisi de grans quantitats de dades.
  • Optimització de recursos: Permet identificar patrons i tendències en les dades, permetent una millor gestió dels recursos i una millora en la presa de decisions. 
  • Font d’inspiració: generant idees noves i proporcionant fonts per estimular la creativitat.  

 

Quins sectors es veuen afectats per la IA?  

La IA és un camp molt ampli i transversal, amb aplicacions a gairebé tots els àmbits i sectors, per la qual cosa tindrà un impacte significatiu en el futur de les feines i els rols dels treballadors en molts sectors.  
Mentre que algunes tasques rutinàries i repetitives podrien ser automatitzades, s'espera que sorgeixin noves oportunitats de treball i rols especialitzats. 

Alguns dels sectors professionals que ja s’estan veient afectats per aquest canvi de paradigma són els relacionats amb la manufactura o fabricació, l'atenció mèdica, les finances, la logística i el transport, el comerç, l'agricultura, el servei al client, l'educació, el màrqueting i la publicitat, entre molts altres. La IA en aquests sectors millora l'eficiència, automatitza tasques repetitives, optimitza processos i permet una presa de decisions més efectiva. En entorns educatius pot ajudar a la creació de recursos i activitats al professorat, i millorar la personalització de l’aprenentatge als estudiants.

informació extra

Per conèixer més sobre l'impacte de la IA a l'Educació Superior, pots consultar les nostres guies "IA i docència. Una guia pel professorat URV" i "IA i aprenentatge. Una guia per l’estudiant URV".

Molts àmbits i sectors estan començant a trobar en la IA una eina valuosa per a millorar la seva eficiència, presa de decisions i resultats finals. 

A més de modificar les feines ja existents, sorgiran noves professions relacionades amb la IA, com ara enginyers de dades, científics de dades, especialistes en ètica de la IA i tècnics de suport en tecnologia de la informació.
No obstant això, també cal destacar la preocupació per la pèrdua d’ocupació en certes àrees, riscos sobre la privacitat i la seguretat de les dades, i possibles desigualtats en l'accés i l'ús de la IA, creant bretxes digitals entre diferents grups socioeconòmics. És crucial abordar aquests reptes per garantir que la IA beneficiï a tothom de manera equitativa i responsable, abordant aquests desafiaments mitjançant polítiques i regulacions adequades per garantir que la IA sigui beneficiosa per a tota la societat, fomentant la inclusió, la transparència i la responsabilitat. 

Tenint en consideració aquests contextos, serà important adaptar-se als canvis tecnològics, adquirir habilitats digitals i enfortir les habilitats humanes úniques com la creativitat, l'empatia i les habilitats socials

Riscos ètics de la IA

Imatge creada per IA, cap amb un candau al cervell

Riscos ètics de la IA

La IA planteja diversos riscos ètics; hi ha preocupació sobre la privacitat i seguretat de les dades, ja que la IA pot recopilar i processar informació personal. També hi ha la preocupació de discriminació i biaixos en els algoritmes que poden afectar determinades persones o grups. Altres incerteses inclouen la pèrdua de llocs de treball a causa de l'automatització, accés a aquestes eines no equitatiu i l'ús de la IA per a propòsits maliciosos com el frau o la manipulació de la informació

És important abordar aquests i altres riscos ètics per garantir un ús responsable i ètic de la IA.

 

Unió Europea

La Unió Europea està treballant en una llei d’intel·ligència artificial que busca regular l’ús de la IA a la UE. La llei se centra a classificar els riscos associats amb la IA i establir obligacions per als proveïdors i usuaris. Es classifiquen quatre nivells de risc: inacceptable, alt, limitat i mínim.

Alguns exemples de les activitats inacceptables per a la seguretat de les persones són:  

  • Sistemes d'identificació biomètrica remota "en temps real" en espais d'accés públic.  
  • Sistemes de categorització biomètrica que utilitzen característiques sensibles (per exemple, gènere, raça, ètnia, estat de ciutadania, religió, orientació política).
  • Sistemes de reconeixement d'emocions en l'aplicació de la llei, la gestió de fronteres, el lloc de treball i les institucions educatives.

Les activitats amb un alt risc per la seguretat estan permeses, però les empreses i usuaris hauran de complir proves rigoroses, documentació adequada de la qualitat de les dades i un marc de rendició de comptes que detalli la supervisió humana. Aquestes inclouen vehicles autònoms, dispositius mèdics, sistemes d'IA per influir en els votants a les campanyes polítiques i els sistemes de recomanació utilitzats per les plataformes de xarxes socials.  

Segons aquesta llei, els models de base generativa, com ChatGPT, hauran de complir amb requisits addicionals de transparència, com ara revelar que el contingut ha estat generat per IA, dissenyar el model per evitar que generi contingut il·legal i publicar resums de dades amb drets d'autor utilitzats per a la formació.

Civicai

Per altra banda, han aparegut diferents moviments i associacions destinades a sensibilitzar i reivindicar una regulació sobre la Intel·ligència Artificial.

En destaquem civicai.cat, que treballa en accions basades en els següents principis:

  • Regulació democràtica de la IA demanant als Governs de Catalunya, Espanya i la Unió Europea que exerceixin, amb caràcter d’urgència, la implementació pràctica (més enllà de recomanacions) de les regulacions previstes sobre l’aplicació social de la IA.  
  • Participació de la societat civil en la forma en què democràticament s’acordi, en la regulació del desplegament harmònic i ètic de la IA, més enllà de la participació d’Experts, Empreses i Governs.  
  • Constituir un consell d’entitats amb caràcter permanent per tal de col·laborar amb els Governs en la implementació pràctica d’aquesta regulació i assegurar la Participació Ciutadana en tot aquest procés. 

A la seva pàgina web hi ha més informació sobre la seva activitat, juntament amb la possibilitat d’associar-se per participar-hi.  

 

Avisos i comunicats de líders del sector

Per últim, també cal destacar els comunicats publicats i signats per molts líders del mateix sector, que alerten sobre els riscos de la IA i la importància de la seva regulació. Aquesta preocupació ha estat amplament reflectida en diversos mitjans de comunicació, posant de manifest la necessitat de garantir un ús responsable, transparent i ètic de la intel·ligència artificial.

Aplicacions d'intel·ligència artificial

Aplicacions d'intel·ligència artificial

La ràpida evolució de la IA i l’aparició constant de noves eines, dificulta l'actualització i registre d'aplicacions relacionades amb la intel·ligència artificial. Per aquesta raó, a les pestanyes superiors d'aquest bloc, es presenta una catalogació que prioritza les diferents solucions i funcionalitats que ofereixen les eines d’IA, amb l’objectiu de mostrar les enormes possibilitats de creació i automatització d’aquestes eines, i per a conèixer les línies de desenvolupament que s’estan duent a terme per aprofitar al màxim les característiques de la IA generativa.

Aquestes són només algunes aplicacions d’IA en diferents sectors, però hi ha moltes més en desenvolupament que tindran un impacte determinant en el futur i en la forma en què interactuem amb la tecnologia en la nostra vida professional i quotidiana. 

informació extra

És important remarcar que les tecnologies d’intel·ligència artificial estan cada cop més integrades a aplicacions, eines i llocs web que utilitzem diàriament. Això permet donar suport en temps real i millorar les tasques i funcionalitats d'aquestes plataformes:  

  • Eines de disseny com Photoshop o Canva utilitzen la IA per crear imatges i dissenys a través de text, suggerir estils, eliminar objectes de les imatges generant continguts totalment integrats, edició de fotografies automatitzada, etc.  

  • Cercadors per obtenir resultats de cerca més complets i acurats, resums dels continguts de pàgines i documents, etc. Les principals empreses del sector, com Google o Microsoft ja han presentat les eines d’IA que s’integraran a les seves plataformes, aquestes són Bard i Bing respectivament.  

  • Gestors de continguts, per a crear notícies, entrades, descripcions de productes i tota mena de textos tenint en compte el perfil d’usuaris, idioma, etc.   

  • Gestors de correu electrònic 

Processament de llenguatge natural

Aquestes eines poden comunicar-se i treballar amb textos de manera eficient i precisa, realitzant tasques com la traducció automàtica o resumir textos, articles, pàgines web, etc. Una de les funcionalitats que major interès i expectació ha suscitat és la dels assistents virtuals. Aquests assistents són capaços de respondre preguntes i interactuar amb els usuaris en llenguatge natural, tal com ho faria una persona real. 
Molt útils per generar preguntes, activitats, debats, pluja d'idees o superar el bloqueig creatiu de la síndrome del full en blanc.

Aplicacions d'exemple

File:ChatGPT logo.svg - Wikimedia Commons

ChatGPT

ChatGPT és l’eina d’IA generativa més popular actualment, ja que té la capacitat de respondre preguntes formulades en llenguatge natural sobre qualsevol tema, de manera molt semblant a com ho faria un humà.
Et recomanem que consultis la nostra “Guia tècnica de ChatGPT” que t’ajudarà a entendre millor com interactuar amb l’eina per extreure el màxim profit.

Icona de mà fent clicEnllaç a l'aplicació ChatGPT >>>>

 

Icona de mà fent clicEnllaç a la guia tècnica de ChatGPT >>>>


 

Bing Xat

Bing Xat és un assistent virtual de xat creat per Microsoft que té accés a la base de dades de cerca de Bing, el que significa que està connectat a internet, pel que té informació recent. Utilitza el model GPT-4, una versió més nova que ChatGPT. Una altra característica és que les respostes donades poden contenir els enllaços a les fonts utilitzades.

Icona de mà fent clicEnllaç a l'aplicació Bing Xat >>>>


 

Archivo:Google Bard logo.svg - Wikipedia, la enciclopedia libre

Bard de Google


Bard és l'aposta de Google per sumar-se al creixent interès de les eines de processament del llenguatge natural, amb la vista posada a l'actualització del seu buscador per adaptar-se a la irrupció de la intel·ligència artificial.
La principal diferència entre ChatGPT i Bard, és que aquesta última està connectada a Internet, pel que té accés a dades actuals i en temps real.

Icona de mà fent clicEnllaç a l'aplicació Bard >>>>


Logo de ChatHub

ChatHub

ChatHub és una extensió de Google Chrome que permet interactuar amb els xatbots més coneguts al mateix temps. Només cal posar el prompt que necessites i aquest tornarà la resposta de ChatGPT, Bing de Microsoft, Bard de Google i Claude. Poder conversar amb diversos xatbots al mateix temps fa que sigui fàcil comparar les seves respostes.

Icona de mà fent clicEnllaç a l'aplicació ChatHub >>>>

Captura de pantalla de ChatHub

Logo de PDF

PDF

La IA pot facilitar moltes tasques quan treballem amb arxius PDF, com per exemple:  

  • Convertir text de PDF escanejats en text editable a través de l'OCR (Reconeixement Òptic de Caràcters). 

  • Generació automàtica de resums o síntesi de documents PDF.

  • Sistemes d'extracció d'informació basats en IA per identificar i classificar dades específiques en documents PDF.

  • Poder "conversar" amb el contingut de l'arxiu PDF per poder fer resums, extreure'n preguntes, etc.

Aplicacions d'exemple

Logo de ChatPDF

ChatPDF

 

ChatPDF analitza un arxiu pdf i permet interactuar per obtenir la informació que necessitem de l’article o document. Permet realitzar resums, explicar amb altres paraules el text, crear contingut nou basat en el de l’arxiu, o fins i tot, crear preguntes sobre el contingut del document. Tot això a través d’un xat molt similar al del ChatGPT que et fa sentir com si estiguessis conversant amb el contingut del fitxer. 

Icona de mà fent clicEnllaç a l'aplicació ChatPDF >>>>

 

 

Captura de pantalla de Chatpdf

icono de imagen

Imatges

Algunes de les eines que han impulsat la popularització de la IA generativa, són les aplicacions que permeten crear imatges d’alta qualitat de manera automàtica a través de les descripcions i instruccions textuals que se li donen. Això és útil per a crear contingut visual de manera més ràpida i eficient sense necessitat de coneixements de disseny gràfic, ni d’edició d’imatges. També s’estan desenvolupant eines que faciliten la correcció i edició d’imatges a través de la IA automatitzant aquests processos. 
 

Aplicacions d'exemple

logo Dall-e

DALL-E

DALL-E és una de les eines que han ajudat a popularitzar la IA generativa a través de la seva capacitat per crear imatges originals i realistes a partir d'una descripció de text en llenguatge natural. Desenvolupada per OpenAI, la mateixa organització que hi ha darrere del ChatGPT, té una versió gratuïta i una de pagament. A la versió gratuïta es disposa d'un nombre de crèdits limitats per crear imatges al llarg d'un mes.

Des del setembre de 2023 Dall-e està incorporat al xat  microsoft bing, per utilitzar-lo s'ha d'iniciar sessió i accedir al xat. A continuació es pot posar la descripció de la imatge. Aquest és un exemple:
"Crea una imatge amb un grup de 3 estudiants enregistrant un vídeo a l'aula, amb una càmera de vídeo, un micròfon i un fons verd":

Imatge creada per Dall-e des de Bing

 

Icona de mà fent clicEnllaç a l'aplicació DALL-E >>>>


 

Playground AI Review, Features, Price, Use Cases & FAQs

Playgorund AI

Playground AI és una eina per la generació d'imatges a través de text amb molt bons resultats. A la seva versió gratuïta permet crear fins a 500 imatges al dia. També ofereix opcions per modificar les imatges generades.

Al seu canal de YouTube comparteixen guies i tutorials per aprofitar totes les seves característiques.

Camera i classe

Icona de mà fent clicEnllaç a l'aplicació Playgorund AI >>>>

Logo de Zoo

Zoo

Zoo permet generar imatges utilitzant diverses plataformes d’IA simultàniament. És gratuïta i no requereix instal·lació, únicament és necessari accedir a la seva pàgina web i escriure una definició de la imatge que es vol generar. Aquesta serà creada amb 3 alternatives per cada un dels següents models de IA: stable-diffusio, DALL-E, kandinsky-2, deepfloyd-if, material-diffusion.

Icona de mà fent clicEnllaç a l'aplicació Zoo >>>>


Scribble diffusion logo

Scribble Diffusion

Scribble Diffusion converteix el teu esbós en una imatge d'alta qualitat. Només cal dibuixar un esbós i acompanyar-lo d'un text descriptiu de la imatge que es vol aconseguir. L'aplicació s'encarrega de generar la imatge a través d'aquestes instruccions. És una eina totalment gratuïta que no necessita registre.

Exemple de dibuix creat per Scribble Diffusion

Icona de mà fent clicEnllaç a l'aplicació Scribble Diffusion >>>>


 

Clipdrop | The AI Visual Content Creator You'll Love

Clipdrop
Stable Doodle

Clipdrop és molt semblant a Scribble Diffusion, ja que genera imatges a partir d'un esbós i un text descriptiu. Permet escollir diferents estils a la imatge, com per exemple: fotogràfic, origami, art digital, anime, model 3D, etc.

Imatge creada per clipdrop d'un estudiant utilitzant ulleres de RV

Icona vídeo

Vídeo

La intel·ligència artificial no solament pot generar imatges estàtiques, també permet generar vídeo de manera automàtica a través de la descripció d’un text. Inclús es poden crear vídeos presentats per personatges digitals que locutaran el text que els hi indiquem. 

També s’estan desenvolupant aplicacions amb funcionalitats per facilitar i automatitzar el treball amb vídeos, com per exemple, crear transcripcions automàtiques en diferents idiomes o resumir el contingut d’un vídeo.

Aplicacions d'exemple

Runaway logo

Runaway

Runaway crea vídeos a través d'una descripció en text. És gratuïta, però requereix registrar-se.

Icona de mà fent clicEnllaç a l'aplicació Runaway >>>>


 

Àudio

La IA està mostrant una gran capacitat per la creació d’àudio. Pot generar música mitjançant l’ús d'algoritmes de xarxes neuronals. Aquests algoritmes poden aprendre a partir de dades musicals preexistents, com ara cançons populars o clàssiques, per generar música original. Això pot resultar molt útil per crear música d’acompanyament per a vídeos o altres continguts audiovisuals, lliure de drets d’autor, per la qual cosa es pot utilitzar per a qualsevol finalitat sense necessitat de sol·licitar permís a l'autor. 

Una altra aplicació de la IA al món de l'àudio és la síntesi de veu. Aquesta s’utilitza per generar veus sintètiques que sonen com persones reals, fins i tot, poden simular accents i veus de persones conegudes. 

També cal destacar les aplicacions que ens faciliten l’edició d’àudio a través de la transcripció, el que ens permet retallar o afegir àudio a través de text, sense necessitat d’utilitzar un programari específic d’edició d’àudio i manipular les ones sonores.  
A més, hi ha eines que ens ajuden a millorar la qualitat d’una locució per aconseguir un resultat professional. Podem corregir la reverberació, l'equalització i altres paràmetres de forma automàtica, sense necessitats de coneixements tècnics.

Aplicacions d'exemple

Voicemaker

Voicemaker converteix un text a veu. Entre els diferents idiomes disponibles es troba el català, amb el que es poden escollir fins a 4 veus diferents. Un cop creat es pot descarregar en format MP3. A continuació es mostra un exemple:

 

Beatbot logo

BeatBot

BeatBot permet crear música a través d’una descripció de text on es pot indicar el gènere o estil musical. També genera  la lletra de forma automàtica o permet crear-la un cop generada la música. A més es pot afegir la duració que ha de tenir, i per això és una bona opció per crear música que acompanyi un vídeo amb una duració determinada.

Exemple de cançó creada amb BeatBot utilitzant el següent prompt o text: Cançó alegre de 30 segons per un vídeo sobre intel·ligència artificial:

Logo d'Adobe

Adobe Podcast

Adobe Podcast ofereix un conjunt d'eines per treballar amb àudio d'una forma innovadora gràcies a la IA. Per exemple, permet editar àudio a través de les paraules de la seva transcripció, per la qual cosa no és necessari treballar amb formes d'ona. També permet millorar la qualitat de l'enregistrament de forma automàtica, eliminant el soroll de fons i millorant la reverberació, fent que sembli que s'ha enregistrat en un estudi professional. A la seva pàgina web trobaràs moltes altres funcionalitats per descobrir com es treballarà amb àudio en el futur.

Icona de mà fent clicEnllaç a l'aplicació Adobe Podcast >>>>

Música

La Intel·ligència Artificial s'ha convertit en una eina poderosa per a la composició, la producció i la generació de música, en el que ofereix noves perspectives creatives. Aquestes eines possibiliten una experiència col·laborativa entre l'artista i la IA, oferint suggeriments creatius i facilitant l'exploració de noves fronteres sonores. A la producció musical, optimitza la qualitat del so, proporcionant solucions automàtiques de mescla i masterització. 

Aplicacions d'exemple

Soundraw

Soundraw és una aplicació dissenyada que permet als usuaris explorar lliurament la composició musical creada per IA. Destacant entre les seves característiques principals, la generació automàtica de música permet als usuaris experimentar amb la creació instantània de composicions originals, adaptades a les preferències musicals.

Ofereix una personalització encara més gran en permetre als usuaris seleccionar la durada desitjada de la cançó i ajustar la seva velocitat. Aquesta flexibilitat no sols potencia la creativitat, sinó que també proporciona un control precís sobre l'experiència musical, convertint Soundraw en una eina versàtil i adaptable per a músics o creadors audiovisuals de tots els nivells. 

Icona transcripció

Transcripció

La IA és una magnífica eina per automatitzar tasques de transcripció de veu a text, com per exemple, una entrevista o gravació d’àudio de forma totalment automàtica i en diferents idiomes. També permet crear la locució d’un text que li facilitem en aquells idiomes que necessitem.

Aplicacions d'exemple

Logo de Softcatalà

Softcatalà té un servei de transcripció que automatitza la transcripció d'àudio i vídeo en català a format text. Per aconseguir-ho utilitza models de transcripció lliures d'intel·ligència artificial d'OpenAI, anomenats Whisper. Accepta els següents formats d'àudio o vídeo: MP3, WAV, OGG, FLAC, AVI, MP4, MOV o MKV. La mida màxima del fitxer és d'1 GB.

Si no es vol pujar l'arxiu als servidors, hi ha disponible una aplicació anomenada Buzz per poder fer la transcripció en local al nostre ordinador. Està disponible per Windows i macOS. Això també redueix el temps d'espera en rebre la transcripció, ja que evita la cua de transcripcions dels servidors de Softcatalà.

Icona de mà fent clicEnllaç a l'aplicació de transcripció de Softcatalà >>>>

Referències i bibliografia

Icona amb un llibre

Referències i bibliografia

Llicència de Creative Commons

Aquesta obra està subjecta a una llicència de Reconeixement-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons