Hermoverkot ja tekoäly

Neuro- eli hermoverkot (engl. Neural Networks) ovat yksi keskeisimmistä koneoppimisen rakenteista, ja ne ovat erityisen tärkeitä syväoppimisessa.

Hermoverkot pohjautuvat biologisen aivojen toimintaan, ja ne on suunniteltu jäljittelemään tapaa, jolla ihmisaivot prosessoivat tietoa neuroneiden ja niiden välisen yhteyksien avulla. Neuroverkoissa on useita kerroksia "neuroneja" tai solmuja, jotka ovat kytketty toisiinsa kertoimilla painotettujen yhteyksien kautta.

Neuroverkko koostuu yleensä kolmesta pääkerroksesta:

Neuroverkon koulutus tapahtuu käyttämällä suurta määrää dataa ja säätämällä neuroneiden välisten yhteyksien painoarvoja siten, että virhe ennusteiden ja todellisten arvojen välillä minimoidaan.

Esimerkkejä erityyppisistä neuroverkoista:

Transformerit eroavat perinteisistä takaisinkytketyistä neuroverkoista siinä, että ne kykenevät käsittelemään sekvenssidataa, kuten tekstiä, ilman että niiden tarvitsee käydä läpi dataa tietyssä järjestyksessä. Sen sijaan transformerit käyttävät mekanismia nimeltä **attention**, joka painottaa eri osia datasekvenssistä riippuen niiden merkityksestä kulloinkin käsiteltävälle osalle. Tämä mahdollistaa tehokkaamman ja joustavamman tavan käsitellä sekvenssejä ja on johtanut merkittäviin parannuksiin monilla sovellusalueilla.

Esimerkkejä transformer-arkkitehtuurien sovelluksista:

1. Kielellisten mallien luominen: Kuten OpenAI:n GPT-sarja (engl. Generative Pre-trained Transformer), jotka kykenevät tuottamaan ymmärrettävää ja sujuvaa tekstiä.

2. Käännöspalvelut: esimerkiksi Googlen Kääntäjä, joka käyttää transformer-arkkitehtuuria monikielisten käännösten parantamiseen.

3. Tekstin ymmärtäminen ja luokittelu: Esimerkiksi BERT (engl. Bidirectional Encoder Representations from Transformers) auttaa koneita ymmärtämään tekstin merkityksen analysoimalla sitä molempiin suuntiin - sekä eteen- että taaksepäin tarkasteltavan tekstin rakenteissa.

4. Äänen tunnistus ja synteesi: Transformerit ovat tehokkaita myös puhutun kielen käsittelyssä, esimerkiksi puheentunnistuksessa ja tekstistä puheeksi -synteesissä.

5. Kuvankäsittely ja -tunnistus: Vaikka transformerit ovat erityisen vahvoja luonnollisen kielen käsittelyssä, niitä on myös sovellettu kuvankäsittelyyn, kuten Vision Transformers (ViT), jotka käsittelevät kuvia samalla tavalla kuin tekstiä ja ovat osoittautuneet erittäin tehokkaiksi monissa kuvankäsittelytehtävissä.

Kuva. Luonnollisen hermosolun eli neuronin rakenne.

Kuva. Neuronia mukailevan perseptronin malli. Aktivointifunktiota vaihtamalla voidaan puhua esim. sigmoid neuronista.

Kuva. Neuroneista koostuvan hermoverkon periaate. Kuvan neuronit on järjestetty kerroksittain (vrt. Hidden layers = piilokerrokset), mistä johtuen voidaan puhua syvästä hermoverkosta.