Takaisin blogiin

Ensimmäinen tekoälyjuttu EU-tuomioistuimessa – Like vs. Google -ratkaisu määrittelee tekoälyn tulevaisuuden linjat

Oli ennustettavaa, että kestää vuosia ennen kuin saamme Euroopan unionin tuomioistuimelta (EUT) sitovia linjauksia generatiivisen tekoälyn ja tekijänoikeuden soveltamiskysymyksiin. Kohta odotus on päättymässä.

Unkarilainen tuomioistuin lähetti keväällä 2025 ennakkoratkaisupyynnön tapauksessa, jossa vastakkain ovat unkarilainen lehtikustantaja Like Company ja teknologiajätti Google (C-250/25).

Tapaus on ensimmäinen laatuaan, ja sen lopputulos tulee väistämättä muovaamaan koko Euroopan tekoälykehityksen ja medialiiketoiminnan pelisääntöjä. Tuomioistuin joutuu punnitsemaan, miten olemassa olevaa tekijänoikeuslainsäädäntöä sovelletaan teknologiaan, joka ei ollut olemassa, kun sitä koskeva sääntely kirjoitettiin.

Neljä kysymystä tekijänoikeudesta ja tekoälystä

Oikeudenkäynnin keskiössä on lehtikustantajan väite, että Googlen Gemini-tekoäly loukkaa sen tekijänoikeuksia sekä kouluttaessaan malliaan että tuottaessaan vastauksia käyttäjille. Unkarilainen tuomioistuin tiivisti erimielisyyden neljään EUT:lle esitettyyn kysymykseen:

  1. Onko lehtijulkaisun osittain identtisen tekstin näyttäminen chatbotin vastauksessa yleisölle välittämistä?
  2. Onko kielimallin koulutusprosessi kappaleen valmistamista (kopiointia)?
  3. Jos koulutus on kopiointia, soveltuuko siihen tekstin- ja tiedonlouhintaa koskeva poikkeus?
  4. Kun chatbot tuottaa käyttäjän kehotteesta vastauksen, joka sisältää osia lehtijulkaisusta, onko kyseessä palveluntarjoajan suorittama kappaleen valmistaminen?

Seuraavaksi puran auki, mitä nämä kysymykset käytännössä tarkoittavat ja miksi niihin annettavat vastaukset ovat niin tärkeitä.

Kysymykset 2 & 3: Tekoälyn koulutus – Oppimista vai luvatonta kopiointia?

Ensimmäinen ja teknisesti merkittävin kiista koskee kielimallin koulutusprosessia. Generatiiviset tekoälymallit, kuten GPT-4 tai Gemini, ovat suuria kielimalleja (LLM), joiden koulutus vaatii valtavan määrän dataa ja prosessointitehoja. Tässä prosessissa tekstit ja kuvat hajotetaan pienemmiksi paloiksi, tokeneiksi, ja malli oppii tilastollisia yhteyksiä näiden välillä. Kielimalli ei siis tallenna alkuperäistä kirjaa tai artikkelia muistiinsa sanasta sanaan. Sen sijaan LLM koostuu tokeneista ja niiden välisistä riippuvuusmääreistä.

Kustantajien mukaan tämä mallinkouluttamisprosessi edellyttää väistämättä alkuperäisen aineiston väliaikaista ja mahdollisesti pysyvää kopiointia, mikä on tekijänoikeuden tekijälle antama yksinoikeus. Ilman lupaa se olisi laitonta.

Tekstin- ja tiedonlouhinnan poikkeus (TDM)

Tekoäly-yritysten ovat nojaamassa puolustuksenaan EU:n tekijänoikeusdirektiivissä (2019/790) säädettyyn tekstin- ja tiedonlouhinnan poikkeukseen (Text and Data Mining, TDM). Direktiivin 4 artikla antaa lähtökohtaisesti luvan valmistaa kappaleita teoksista tiedonlouhintaa varten. Suomessa tämä säännös löytyy tekijänoikeuslain 13b pykälästä ja se kuuluu:

Se, jolla on laillinen pääsy teokseen, saa valmistaa siitä kappaleita käytettäväksi tekstin- ja tiedonlouhintaa varten ja säilyttää kappaleita yksinomaan kyseistä tarkoitusta varten, jollei tekijä ole nimenomaisesti ja asianmukaisella tavalla pidättänyt tätä oikeutta.

Poikkeuksessa on kuitenkin ratkaiseva ehto: oikeudenhaltijat voivat kieltää tiedonlouhinnan (opt-out). Direktiivin 4 artiklan 3 kohta täsmentää, että tämä kielto on tehtävä ”asianmukaisella tavalla, kuten koneluettavin keinoin, kun sisältö on saatettu yleisön saataviin verkossa”. Direktiivin johdanto-osan kappale 18 vahvistaa, että verkkosisällön osalta koneluettavat keinot (kuten robots.txt-tiedosto) ovat ensisijainen tapa kieltää tiedonlouhinta.

Kysymys kiellon toteuttamisesta on jutun kannalta kriittistä. Riittääkö pelkkä maininta käyttöehdoissa, vai vaaditaanko tekninen kielto? EUT on jo ottanut kantaa teknisten suojakeinojen merkitykseen. Ratkaisussa VG Bild-Kunst (C-392/19) tuomioistuin linjasi, että oikeudenhaltija voi rajoittaa teostensa käyttöä (tässä tapauksessa kehystekniikalla eli framingilla) tehokkaasti vain teknisillä toimenpiteillä. Tämä periaate on vahvistettu myös Suomessa. Helsingin hovioikeus totesi Nettiradio.fi-tapauksessa juuri VG Bild-Kunst -ratkaisuun viitaten, ettei pelkkä käyttöehdoissa tai kirjeitse esitetty kielto estänyt linkitystä, koska teknisiä suojakeinoja ei ollut käytetty. EUT joutuu miettimään tuleeko sen soveltaa samaa tiukkaa teknistä linjaa myös TDM-poikkeuksen osalta.

Kysymykset 1 & 4: Chatbotin vastaus – Uusi teos vai julkaisun välittämistä?

Toinen keskeinen kysymyspari liittyy tekoälyn tuotokseen. Kun Gemini antaa käyttäjälle tiivistelmän uutisartikkelista, loukkaako se tekijänoikeutta?

Tässä yhteydessä on muistettava tekijänoikeusdirektiivin (2019/790) lehdistökustantajille tuoma oma lähioikeus (artikla 15). Otsikoiden suoja on poikkeuksellinen vain EU-maissa sovellettava suojamuoto. Se antaa kustantajille oikeuden kieltää julkaisujensa – myös yksittäisten sanojen tai hyvin lyhyiden otteiden ylittävien osien – digitaalisen käytön. Suoja kattaa siis myös otsikot ja lyhyet ingressit.  Kustantajan argumentti on, että chatbotin vastaus on juuri tällaista luvatonta käyttöä.

Aiemmin on ajateltu, etteivät tekoälymallit kilpaile suoraan päivän uutisten kanssa, koska niiden koulutusdata on usein vanhentunutta. Tämä käsitys on kuitenkin vanhentumassa. Kuten Wikipedia selittää, modernit tekoälypalvelut hyödyntävät yhä useammin Retrieval-Augmented Generation (RAG) -tekniikkaa. Tämä tarkoittaa, että kielimalli ei luota pelkästään vanhaan koulutusdataansa, vaan hakee vastauksia varten reaaliaikaista tietoa ulkoisista lähteistä, kuten internetistä. Tämä tekee niistä suoran kilpailijan uutismedialle ja heikentää kustantajien mahdollisuuksia ohjata liikennettä omille sivuilleen.

Voiko tekoäly kiertää lehdistönsuojan uudelleenkirjoittamalla?

Tekoäly-yritysten piilevä valttikortti on, että generatiivisen tekoälyn ei tarvitse toistaa otsikoita tai ingressiä sellaisenaan. Sen vahvuus on juuri kyky ymmärtää sisältö ja muotoilla se uudelleen omin sanoin. Se voi lukea artikkelin, tuottaa siitä täysin uuden, tiiviin yhteenvedon ja tarjota lopuksi linkin alkuperäiseen lähteeseen.

Tämä asettaa artikla 15:n soveltamisen täysin uuteen valoon. Jos tekoälyn tuotos ei sisällä suoria lainauksia, jotka ylittävät ”hyvin lyhyen otteen” rajan, onko kyseessä lainkaan lähioikeuden loukkaus? Todennäköisesti ei. Tämä voisi tehdä lehdistönsuojasta käytännössä tehottoman tekoälysovelluksia vastaan ja pakottaa kustantajat turvautumaan teknisiin estokeinoihin, kuten TDM-kieltoihin.

EUT joutuu nyt arvioimaan, onko chatbotin vastaus rinnastettavissa aiemmin oikeuskäytännössä käsiteltyihin hyperlinkkeihin (Svensson [C-466/12] ja GS Media [C-160/15]) vai onko se itsenäinen välittämistoimi, joka loukkaa kustantajan oikeuksia. Jos vastaus katsotaan luvattomaksi, se voi mullistaa generatiivisen tekoälyn liiketoimintamallit täysin.

Suurempi kuva: Innovaatio vs. Oikeudenmukainen korvaus

Vaikka tapauksen osapuolet ovat unkarilainen yritys ja Googlen irlantilainen maayhtiö, sen vaikutukset ovat globaalit. Oikeuden tulee ottaa huomioon kaksi perustavanlaatuista arvoa:

  1. Luovan työn tekijöiden ja investoijien oikeus saada korvaus työstään. Ilman tätä kannustinta ammattimaisen sisällöntuotannon, kuten journalismin, tulevaisuus vaarantuu.
  2. Yhteiskunnan tarve edistää teknologista innovaatiota. Tekoälypalvelut tehostavat eurooppalaisten työtä jo nyt. Jos tekoälymallien kouluttaminen tehdään liian vaikeaksi tai kalliiksi Euroopassa, kehitys siirtyy Yhdysvaltoihin ja Kiinaan, missä sääntely on vapaampaa. EU on myös halunnut saada eurooppalaisia kilpailijoita yhdysvaltalaisille teknologiajäteille.

Päätös tulee olemaan tasapainoilua näiden kahden välillä. Liian tiukka tulkinta tekijänoikeudesta voisi tukahduttaa eurooppalaisen tekoälykehityksen. Se voisi pahimmillaan jotaa siihen, että EU-alueelle ei tarjottaisi tekoälymalleja, joita muu maailma käyttää. Toisaalta liian salliva linja voisi rapauttaa mediakentän ja muiden luovien alojen taloudellisen perustan.

Mitä tämä merkitsee yrityksille epävarmuuden aikana?

Tapauksen C-250/25 käsittely on vasta alussa ja lopullinen tuomion saaminen voi kestää vuoteen 2026 asti. Epävarmuuden aika jatkuu, mutta suunta on selvä: yritysten, jotka kehittävät tai hyödyntävät generatiivista tekoälyä, on ymmärrettävä tekijänoikeudelliset riskit. Enää ei riitä, että luotetaan tekoälypalvelun tarjoajan käyttöehtoihin. On arvioitava, millaiseen dataan malli perustuu ja miten sen tuotoksia hyödynnetään omassa liiketoiminnassa. Riskienhallinta, sopimusten selkeys ja tekoälystrategian mukaan toimiminen nousevat avainasemaan.

Ennen tuomioita yritykset joutuvat toimimaan epävarmuudessa tekijänoikeudella suojatun aineiston käyttöön liittyvien riskien kanssa. Lainsäädännön ollessa kehitystilassaon hyvä kääntyä asiantuntijoiden puoleen riskien hallitsemiseksi ja varmistaa, että tarvittavat varotoimet on tehty. Me Resonilla olemme auttaneet asiakkaitamme vastaavissa tekijänoikeuden ja teknologian risteyskohdissa. Jokaisessa toimeksiannossa neuvomme räätälöidään asiakkaan liiketoiminnallisiin tavoitteisiin ja haasteisiin sopivaksi.