Sanakirjat ovat verkon aikakaudella muuttamassa muotoaan. Sen sijaan, että käyttäjille suunnataan yksittäisen sanan käännöksiä tai selityksiä, pyritään luomaan älykkäitä käännöskoneita. Tästä yksi esimerkki on edellä mainittu Google Kääntäjä.
Käännöskoneen idea ei ole kääntää yksittäisiä sanoja, vaan kokonaisia tekstejä. Jotta kokonaisen tekstin kääntäminen olisi mahdollista, tarvitsee kone tausta-aineistoa. Tällaiseksi kelpaavat valmiit tekstit, joilla on useita kieliversioita. Mm. Euroopan unionin tuottamat tekstit ovat pääsääntöisesti saatavilla monilla kielillä. Tämäntyyppiset monikieliset tekstikokoelmat ovat konekääntämisen avain, mutta käännöstekstikokoelmien täytyy olla riittävän suuria. Niiden pohjalta koneen on mahdollista luoda käännösehdotuksia hakukenttään annetuille teksteille. Tekstimassojen varaan rakennettuja käännös- ja sanakirjakoneita voidaan nimittää korpussanakirjoiksi. Termi korpus viittaa tässä perustana toimivaan tekstikokoelmaan. Taustalla vaikuttaa tietenkin hiottu algoritmi, johon on satsattu paljon työaikaa.
Käännöskoneita on Google Kääntäjän lisäksi muitakin. Yksi näistä on DeepL (www.deepl.com). Se on monikielinen avoin käännöskone, mutta suomi tai ruotsi eivät alun perin kuuluneet sen valikoimaan. Tässä on siksi käytetty apukielenä englantia. (Vuoden 2021 maaliskuussa DeepL-kääntäjään on lisätty mm. suomi ja ruotsi.) DeepL on saksalainen kieliteknologiayritys ja samalla verkkopalvelun nimi. Esimerkkinä on DeepL-käännös englannista saksaksi.
Kyseessä on ote yhdysvaltalaisen professorin verkossa julkaistusta cv:stä. DeepL tarjoaa saksannoksen, joka on rakenteellisesti moitteeton. Jotkin termit se on kääntänyt turhan suoraan, sillä saksassa sana Titel tarkoittaa esim. akateemista titteliä, ei välttämättä juuri tässä tarkoitettua palkintoa tai kunniamainintaa. Tällaisen puutteen huomatessaan ihmiskääntäjä voi helposti muokata käännöstä. Hän voi valita käännöksestä minkä tahansa sanan, ja DeepL ehdottaa hänelle vaihtoehtoja, joista valita tuohon kohtaan parempi. Käännöksen saa ladattua omalle koneelle tekstitiedostona, ja muutenkin käyttömukavuus on hyvää tasoa. Kone ei siis osaa ratkaista kaikkia kysymyksiä, mutta se nopeuttaa huomattavasti kääntävän ihmisen työtehtäviä, kunhan kohdetekstin editoija pystyy kiinnittämään huomiota mahdollisiin puutteisiin.
DeepL-kääntäjän ilmaisversiota voivat kaikki käyttää vapaasti. He tarjoavat ammattikäyttöön maksullista versiota, joka on heidän mukaansa tietoturvallinen ja tietysti laajempi kuin perusversio.
DeepL-palvelua ei siis alun perin ollut saatavilla kotimaisilla kielillä. Tuolloin meille oli hyötyä saman yrityksen aikaisemmin luomasta sanakirjasta, jonka nimi on Linguee (www.linguee.com). Se nimittäin on alusta asti kattanut myös suomen ja ruotsin. Linguee oli DeepL-palvelun edeltäjä. Lingueen toimitaidea on tekstilähtöinen. Kun sille antaa hakusanan, se näyttää listauksen tästä sanasta alku- ja kohdekielellä tekstiyhteydessään. Näet siis pitkän listauksen tekstikatkelmia, joiden käännös näkyy vieressä. Katsotaan esimerkkinä saksan termiä Fotovoltaik.
Havaitsemme, että termiä käytetään suomessa hieman eri tavalla kuin saksassa. Suomessa on käytössä joko fotosähkö, aurinkoenergia, aurinkosähkö tai pelkkä aurinko-etuliite. Kun kyseessä on teknisiä yksityiskohtia käsittelevä teksti, on hienoa, että näemme yhdellä haulla useita käyttötapoja kummassakin kielessä, sillä se auttaa löytämään täsmällisen ilmauksen kohdekielellä. Jos et ole koskaan törmännyt fotosähkö-sanaan, sanaa ei kannata käyttää, ennen kuin olet tarkastanut, ovatko fotosähkö ja aurinkosähkö sama asia. Linguee-haku antaa siis esimerkkejä erilaisista käyttöympäristöistä, mutta joudut itse harkitsemaan, mitkä käyttötavat sopivat juuri sinun tarkoitukseesi.
Linguee on tällä hetkellä laajin saksan, suomen ja ruotsin käsittävä korpussanakirja, eli sanakirja, joka näyttää sanat aina tekstiyhteydessään. Se käyttää EU-tekstejä pohja-aineistona. Tästä syystä hallinnolliset ja taloudelliset termit ovat sille helppoja käännettäviä. Sen sijaan arkikieltä tai ihmisten vapaa-aikaa se ei juuri tunne, tai - hupaisaa kyllä - käyttää niistäkin hallinnollista kieltä. Jos vaikka yrittää saada käännöstä saksan sanalle angeln ('onkia'), tulee tuloslistuksessa paljon tietoa tonnikalan kalastustekniikasta ja sitä koskevista lainsäädännöllisistä rajoituksista, muttei termiä 'onkia'. Lingueen käyttäjän on hyvä pitää mielessä, että se toimii parhaiten juuri virallisten tekstilajien kanssa.
Jos olet jo tutustunut edellä esiteltyyn Google Kääntäjään, voit hetken pohtia Lingueen ja Kääntäjän eroa. Kääntäjä-palvelussa on vain käännöskone, joka toimii samoin kuin DeepL. Kääntäjästä kuitenkin puuttuu Linguee-palvelua vastaava puoli. Et siis pääse näkemään, mitä pohja-aineistoja Kääntäjä sisältää, ja mitä se käyttää pohjana ehdottaessaan sinulle käännöstä. Linguee on läpinäkyvämpi, koska saat näkyviin tekstien alkuperän ja hakuusi liittyviä tekstikohtia. Merkittävä ero on myös yksityisyyden suojassa. Jos käytät Linguee-palvelua, se ei säilö sinun käyttäjätietojasi omaan tietokantaansa. On kuitenkin hyvä huomioida, mitä verkkoselainta käyttää, ja onko henkilökohtaisesti kirjautuneena selaimen sisällä.
Toinen saksalainen korpussanakirja on bab.la. Tälläkin on erikseen kääntäjä- ja sanakirjapuoli. Bab.lan sanakirjalistassa on pitkä lista kielipareja, mutta suomi-saksa -pari ei ole vielä sanakirjapuolella. Sanakirjapuolella toimivat mm. kieliparit saksa-ruotsi, saksa-englanti ja saksa-venäjä. Sanakirjan syötteet ovat alun perin käyttäjien antamia, eli se toimii yhteisöpohjalta, mutta työtä ohjaa asiantuntijaryhmä.
Hienoa on, että bab.lan käännöskone osaa kääntää lauseita suomi-saksa -kieliparissa. Käännöskoneessa ei kuitenkaan ole vastaavaa editointimahdollisuutta kuin DeepL-palvelussa, joten käyttäjän on loppueditoitava tekstinsä muulla alustalla. Toinen rajoite on 1000 merkin enimmäismäärä. Minulla ei ole kokemusta bab.lan käännöspalvelusta, mutta yritys ilmoittaa olevansa "vain" sanakirja, joten oletan käännöspalvelun toimivan yksittäisten sanojen pohjalta, ei tekstilähtöisesti. Kun vertaan bab.lan ja Google Kääntäjän saksa-suomi -käännöksiä, näyttäisi Google Kääntäjä osuvan hieman paremmin kohdille kuin bab.lan kääntäjä. Bab.la ei edes pyri ammattimaiseksi käännöskoneeksi, vaan sen tavoite on auttaa kielenoppijoita.