Osittain ohjattu oppiminen

Osittain ohjattu oppiminen, joka tunnetaan myös nimellä puoliohjattu oppiminen (engl. Semi-supervised Learning = SSL), on tekoälyn oppimismenetelmä, jossa hyödynnetään sekä merkittyä että merkitsemätöntä dataa. Tämä menetelmä yhdistää ohjatun ja ohjaamattoman oppimisen etuja ja on usein tehokas, kun käytettävissä on suuri määrä merkitsemätöntä dataa, mutta vain pieni osa datasta on merkitty.

Osittain ohjatun oppimisen lähestymistavassa järjestelmä käyttää ensin merkitsemätöntä dataa oppiakseen datan yleisistä rakenteista tai suhteista ilman erityisiä tavoitteita. Tämän jälkeen käytetään pienempää merkittyä datajoukkoa järjestelmän hienosäätämiseen, jotta se kykenee suorittamaan spesifisiä tehtäviä, kuten luokittelua tai regressiota.

Esimerkki:

Kuvitellaan, että halutaan kehittää tekoälyjärjestelmä, joka kykenee tunnistamaan kuvista koiria. Oletetaan, että käytettävissä miljoona kuvaa, mutta vain 10 000 niistä on merkitty tietoineen siitä, onko kuvassa koira vai ei.

1. Alkuvaiheessa järjestelmä käyttää suurta joukkoa merkitsemätöntä dataa - siis kuvia ilman tietoa niiden sisällöstä -  oppiakseen kuvien yleisistä ominaisuuksista, kuten muodoista ja väreistä.

2. Seuraavaksi käytetään pienempää merkittyä datajoukkoa, eli edellä mainittuja 10 000 kuvaa, joissa on tieto siitä, onko kuvassa koira. Niiden avulla järjestelmä oppii tunnistamaan juuri ominaisuudet, jotka liittyvät koiriin.

Osittain ohjattu oppiminen on usein tehokas tapa käsitellä tilanteita, joissa merkityn datan kerääminen on aikaa vievää tai kallista. Se mahdollistaa tekoälyjärjestelmän kouluttamisen korkealla tarkkuudella, vaikka käytettävissä olisi vain rajoitetusti merkittyä dataa.