Gràcies a l'empresa OpenAI avui dia podem conèixer ChatGPT.
ChatGPT és un model d’intel·ligència artificial creat per OpenAI. Es va desenvolupar a partir dels models GPT (Generative Pre-trained Transformer), que aprenen a entendre i generar llenguatge llegint enormes quantitats de text.
Procés de l'aprenentatge de ChatGPT:
Entrenament inicial: El model es va entrenar amb milions de textos (llibres, articles, webs, etc.) per aprendre patrons del llenguatge: com s’escriu, com es responen preguntes, com es connecten idees.
Aprenentatge amb supervisió humana: Persones van ajudar a ensenyar-li quines respostes eren bones i quines no.
Millora amb reforç: Es va utilitzar una tècnica anomenada reinforcement learning from human feedback (aprenentatge per reforç amb feedback humà) per fer-lo més útil, segur i coherent.
Actualitzacions contínues: Amb el temps, ChatGPT s’ha anat millorant per entendre millor el context, parlar de manera més natural i ajudar en més tasques.
(Per posar un exemple és com ensenyar des de 0 a un bebè, li has d'ensenyar els fonaments de la vida, caminar, menjar, pensar, etc.). Però en aquest cas és una IA en la qual li dones les dades perquè aprengui i també li ensenyes com ha de respondre perquè no siguin respostes inofensives o fora de lloc.
El ChatGPT que coneixem avui en dia no és el primer que va sortir, òbviament ha passat per diverses actualitzacions, transformacions i observacions per equips experts en el tema. Aquestes actualitzacions han sigut necessàries perquè al principal ChatGPT estava dissenyat per donar una resposta encara que no fos coherent. Altres vegades podia donar respostes ofensives o fora de lloc, per això tantes actualitzacions. Un exemple és un noi que li va demanar consell mèdic i ChatGPT li va recomanar que se suïcidés.