Gemini

Bard, Gemini i... fiasco

Per a Google els models de llenguatge natural representaven molt més que una curiositat intel·lectual, eren una aposta estratègica per mantenir el seu monumental negoci de la publicitat.

Al 1998 Google havia creat un imperi econòmic al voltant de centenars de tecnologies diferents, però vint-i-cinc anys després la majoria dels seus ingressos encara era la publicitat individualitzada associada amb el seu cercador.

El negoci de Google consistia a oferir el cercador de manera gratuïta perquè els usuaris busquessin continguts a internet, amb les cerques els usuaris revelaven els gustos, les seves preferències i les seves necessitats. Aleshores Google agafava tota aquesta informació i, a través de la IA identificava quins usuaris tenien la intenció de comprar determinats productes i aquesta informació la venia a les empreses perquè poguessin fer publicitat.

Fins a l'aparició de ChatGPT l'any 2022 això no semblava cap problema, el 78% de totes les cerques d'internet que es feien al món utilitzaven el seu cercador. El quasi monopoli de Google semblava garantit, ara bé, el negoci podia veure's amenaçat si algú creava un xatbot capaç de respondre acuradament totes les preguntes dels usuaris.

Si la gent substituïa les consultes al cercador per les consultes a aquell xatbot Google es quedaria sense les dades dels seus clients i no podria vendre-les al mercat de la publicitat. Per aquesta raó la IA generativa suposava un risc existencial per a l'empresa de Brin i Page. Calia que els seus investigadors fossin els primers a desenvolupar aquella mena de xatbots, és per això que Google va comprar diverses GPU i els seus investigadors havien treballat per crear els seq2seq i els mateixos Transformers.

L'abril d'aquell any Google va presentar dos models de llenguatge basats en els Transformers que ells mateixos havien inventat: Chinchilla i el PaLM . Tots dos superaven el 43% de la nota que havia tret GPT-3, que en aquell moment era millor model d'OpenAI. L'octubre d'aquell mateix any, Google va donar a conèixer una versió millorada del PaLM, anomenada FlanPaLM.

Però tot va canviar el novembre del 2022 amb la presentació de ChatGPT, la por es va apoderar dels líders de Google que van veure com el seu lideratge tecnològic podia desaparèixer. El perill era ben real perquè en aquell moment tothom sabia que, per finançar el seu projecte, Sam Altman havia aconseguit atraure una gran inversió de Microsoft a canvi d'incorporar els models d'OpenAI a les seves aplicacions i entre elles hi havia Bing, el competidor més destacat de Google. Microsoft no va trigar a afegir ChatGPT a Bing i a les diferents aplicacions d'Office, fent que Google esdevingués pànic.

A finals de 2022 els líders de Google van exigir als seus investigadors que presentessin un model al més aviat possible, ja que després de l'èxit del Chinchilla i dels PaLM, Google havia estat treballant en un nou model millorat que es deia Bard, basant en els Transformers. Fins aquell moment Google s'havia caracteritzat per no introduir al mercat productes que no fossin perfectes, però el pànic els va envair i van accelerar la presentació de Bard, encara que no estigués totalment acabat.

El febrer de 2023, quatre mesos després de la introducció del ChatGPT tothom donava per descomptat que Google mostraria un LLM molt superior al d'OpenAI, però Bard va demostrar que tenia problemes seriosos amb les al·lucinacions i allò va tenir unes conseqüències financeres per a Google. En una sola setmana, el valor de Google va caure a més de 100.000 milions de dòlars, és a més, el nom Bard va quedar tan tacat pel fiasco de la presentació que Google va decidir rebutjar-lo amb el nom de Gemini.

Google va presentar Gemini el desembre de 2023, després de gairebé un any treballant-hi i afinant-lo. Al cap d'un parell de mesos va introduir la versió millorada, Gemini 1.5. Tot i que les dues versions de Gemini eren tancades i secretes, és a dir, ningú podia veure com funcionava el model per dins ni conèixer els seus detalls tècnics, Google també va crear una versió oberta anomenada Gemma. A més de respondre amb text, Gemini era capaç de generar imatges de qualitat similar o superior a les que generava el Dall-E d'OpenAI.

Al principi, el nou xatbot va tenir una molt bona acceptació, no va ser fins que Patrick Ganley va anunciar que Gemini era un fiasco i milers de tuitaires es van abraonar contra Gemini amb l'objectiu de fer que vomités més al·lucinacions.

Aquest nou fiasco de Google va tornar a ser catastròfic per a la cotització de l'empresa, que en pocs dies va tornar a perdre el 4% del valor. Malgrat la gran quantitat de recursos que Google ha esmerçat per competir amb OpenAI, els seus models no han aconseguit superar de manera convincent i substancial el model original de San Altman.

Page updated

Report abuse