Gema vs. OpenAI

Saksan Münchenin alioikeus antoi 11. marraskuuta 2025 kiinnostavan, joskaan ei vielä lainvoimaisen, tuomion asiassa GEMA vastaan OpenAI. Saksan Teosto, eli musiikintekijöiden etujärjestö GEMA haastoi OpenAI:n oikeuteen väittäen, että yhtiön kielimallien koulutus ja toiminta loukkaavat heidän jäsentensä tekijänoikeuksia. Kanteessaan GEMA osoitti, että ChatGPT pystyy tuottamaan pyynnöstä suoria, sanatarkkoja kopioita heidän jäsentensä suojatuista laulunsanoituksista.

Tuomioistuin hyväksyi GEMA:n keskeiset vaatimukset ja katsoi OpenAI:n syyllistyneen tekijänoikeusloukkaukseen. Ratkaisu on herättänyt keskustelua tekoälyjuristien keskuudessa, sillä se ottaa suoraan kantaa kysymykseen, jonka Getty v. Stability AI -tapaus jätti avoimeksi.

Lataa tuomio

1. ”Memorisaatio” on tekninen kopio

Tuomioistuimen linjauksen ydin on käsite ”memorisaatio” (saks. Memorierung). Oikeus katsoi, että OpenAI loukkasi tekijänoikeuksia jo tallentaessaan laulujen sanoituksia teknisesti kielimalliensa parametreihin. Tämä tekninen tallennus ja toisinnettavuus mallin sisällä katsottiin tekijänoikeudellisesti merkitykselliseksi kappaleen valmistamiseksi (saks. Vervielfältigung).

”Memorisaation perusteella laulunsanoitusten tekijänoikeudellisen kappaleen valmistamisen edellyttämä fyysinen ilmentymä [Verkörperung] on annettu mallin määritellyissä parametreissä olevien tietojen kautta… Tallentaminen pelkkinä todennäköisyysarvoina on merkityksetöntä.” s. 37-38

Tätä voi verrata taidemaalariin. Usein maalaus, joka perustuu valokuvaan, on uusi ja itsenäinen teos, eli mukaelma. Mutta jos maalari pyrkii maalaamaan valokuvasta täysin identtisen kopion ja myös onnistuu siinä, kyseessä ei ole enää uusi teos, vaan alkuperäisen teoksen luvaton kappale.

Näin kävi korkeimman oikeuden ratkaisussa KKO:2018:21 (”Metso-tapaus”). Tapauksessa taidemaalari oli maalannut öljyvärimaalauksen, joka vastasi ”sekä kokonaisvaikutelmaltaan että yksityiskohdiltaan lähes täysin” valokuvaaja B:n ottamaa metso-valokuvaa. KKO katsoi, että vaikka tekotapa oli eri (valokuva vs. maalaus), lopputulos oli niin tarkka kopio, että kyse oli kappaleen valmistamisesta, ei uudesta itsenäisestä teoksesta.

Münchenin tuomioistuin päätyi vastaavaan lopputulokseen. Vaikka OpenAI:n tekniikka (neuroverkon parametrit ja todennäköisyysarvot) on täysin erilainen kuin öljymaalaus, lopputulos ratkaisi. Oikeus rinnasti tämän teknisesti esimerkiksi MP3-pakkaukseen: vaikka data on ”häviöllistä” ja pilkottu, se on silti kappale, jos se voidaan teknisin apuvälinein saattaa takaisin aistittavaan muotoon. Ratkaisevaa oli ”välitön havaittavuus” (mittelbar wahrnehmbar) yksinkertaisen chat -käyttöliittymän kautta.

2. Teksti- ja tiedonlouhinnan (TDM) poikkeus ei suojannut

OpenAI puolustautui väittämällä, että sen toiminta kuuluu Saksan tekijänoikeuslain TDM-poikkeuksen (Text and Data Mining, § 44b UrhG) piiriin. Tämä poikkeus implementoi EU:n DSM-direktiivin ja sallii tietyin ehdoin aineistojen automaattisen analysoinnin.

Tuomioistuin hylkäsi tämän argumentin. Oikeus selvensi, että TDM-poikkeus on tarkoitettu automaattiseen analyysiin, jossa teoksista erotetaan informaatiota, mutta itse teosta ei toisinneta. Kun kielimalli kuitenkin ”muistaa” ja toisintaa kokonaisia teoksia, se ylittää pelkän analyysin rajat. Tällainen toiminta loukkaa suoraan oikeudenhaltijoiden taloudellisia etuja, joita TDM-sääntelyn ei ollut tarkoitus heikentää.

Oikeus teki tärkeän jaon:

TDM-poikkeus kattaa kyllä itse koulutustapahtuman (datan keräämisen ja analysoinnin, eli ”Vaihe 1”).
Se ei kuitenkaan kata loukkaavaa lopputulosta (eli ”Vaihe 2”).

Oikeuden mukaan pysyvä, toisinnettava kopio mallin sisällä (”memorisaatio”) ei ole enää ”analyysia”, vaan se on uusi kappale, joka loukkaa tekijän taloudellisia etuja. Tuomio asettaa teknisen riskin suoraan kehittäjälle: jos ”memorisaatio” on väistämätön tekninen ”bugi”, kehittäjä ei voi vedota TDM-poikkeukseen, vaan sen on hankittava lisenssi tai varmistettava, ettei lopputulos loukkaa oikeuksia.

Suomessa tekijänoikeuslain tiedonlouhintaan koskeva 13 b§ poikkeus kuuluu seuraavasti:

Se, jolla on laillinen pääsy teokseen, saa valmistaa siitä kappaleita käytettäväksi tekstin- ja tiedonlouhintaa varten ja säilyttää kappaleita yksinomaan kyseistä tarkoitusta varten, jollei tekijä ole nimenomaisesti ja asianmukaisella tavalla pidättänyt tätä oikeutta.

Päätöstä voidaan kritisoida siitä, että OpenAI on tosiaan valmistanut kappaleita tekstin- ja tiedonlouhintaa varten. Tämä on ollut OpenAI:n tarkoitus. Se, että malli käyttäytyy poikkeavasti ei tarkoitusta muuta. Tuomiossa oikeus toteaa, että OpenAI tietoisuus järjestelmän virheistä on merkitsevä seikka.

”Vastaajat itse toteavat, että koulutusdatan ’regurgitaatio’ [toisintaminen] on harvinainen virhe (’rare bug’), jonka korjaamiseksi tehdään jatkuvasti työtä.” s. 46.

Tuomioistuin käyttää tätä myöhemmin perusteluna sille, miksi oikeudenhaltijan ei voida katsoa antaneen suostumustaan tällaiseen käyttöön. Kenenkään ei tulisi suostua siihen, että hänen teostaan käytetään luvatta tavalla, jota kehittäjä itsekin pitää virheenä.

3. Kehittäjä, ei käyttäjä, on vastuussa tuotoksista

OpenAI yritti esittää, että käyttäjä (promptin antaja) on vastuussa tuotoksista, ei yhtiö itse. Myöskään tämä puolustus ei menestynyt. Oikeus katsoi OpenAI:n olevan vastuussa tuotoksista.

”Vastaajat [OpenAI] on luokiteltava tekijöiksi, koska he käyttävät teon hallintaa [Tatherrschaft] tuotosten kautta tapahtuvaan kappaleen valmistamiseen… He ovat vastuussa mallien arkkitehtuurista ja koulutusdatan memorisaatiosta. Pelkkä kappaleen valmistamisen laukaiseminen kehotteen syöttämisellä ei johda siihen, että käyttäjä katsottaisiin kappaleen valmistajaksi.” s. 58.

Tuomioistuin perusti tämän siihen, että OpenAI hallitsee mallin arkkitehtuuria ja koulutusta. Vaikka käyttäjä antaa kehotteen, malli ja sen parametrit hallitsevat pääasiassa tekijänoikeudella suojatun sisällön tuottamista. Riski memorisaatiosta syntyy yksinomaan OpenAI:n toiminnasta.

4. Vaikutukset Euroopassa: GEMA vs. Getty

Tämä saksalaisratkaisu asettuu mielenkiintoiseen kontrastiin Isossa-Britanniassa hiljattain käsitellyn Getty Images v. Stability AI -tapauksen kanssa. Siinä tapauksessa pääkanne tekoälyn koulutuksesta kaatui alueellisuuteen: Getty ei pystynyt todistamaan, että loukkaava koulutus tapahtui juuri Isossa-Britanniassa. Brittituomioistuin ei siksi ottanut lainkaan kantaa siihen, olisiko koulutus itsessään ollut loukkaus. Oikeus kuitenkin katsoi, että malli ei pitänyt sisällään sen koulutuksessa käytettyjä teoksia.

Münchenin tuomioistuin teki juuri sen, mitä brittituomioistuin ei tehnyt. Se otti suoraan kantaa mallin sisältöön ja katsoi itse ”memorisaation” kappaleen valmistusta koskevaksi loukkaukseksi. Vaikka tuomio ei ole lainvoimainen ja OpenAI on ilmoittanut valittavansa, ratkaisu on kiinnostava erityisesti mallien muistamisvaikutuksen analysoinnissa. Se vahvistaa KKO:2018:21 -ratkaisun kaltaista periaatetta: tekniikasta riippumatta teoksen kopioiminen on kappaleen valmistamista, ja tämä pätee myös tekoälymalleihin.

Valitustuomioistuin epäilemättä ohjaa asian EU-tuomioistuimen käsiteltäväksi. Jää nähtäväksi suhtautuuko EU-tuomioistuin datalouhintapoikkeukseen eri tavalla. Datalouhinnassa kun tunnettuna vaarana on muistaminen.

5. Seuraavaksi OpenAI:n on avattava kirjanpitonsa

Tuomio ei vielä määrännyt OpenAI:lle konkreettista, euromääräistä vahingonkorvausta. Se teki kuitenkin kaksi GEMA:n kannalta ratkaisevaa asiaa:

Oikeus totesi OpenAI:n olevan periaatteessa korvausvelvollinen (saks. dem Grunde nach schadensersatzpflichtig) kaikesta GEMA:lle syntyneestä vahingosta (Tuomiolauselma, kohta 3). Mikä tärkeintä, tuomioistuin määräsi OpenAI:n antamaan GEMA:lle täydellisen kirjanpidon (Auskunft) loukkausten laajuudesta ja kaikista niistä saaduista tuloista (Einnahmen) (Tuomiolauselma, kohta 2).

”Vastaajat [OpenAI] ovat kantajalle [GEMA] Saksan tekijänoikeuslain 97 §:n 1 momentin mukaisesti periaatteessa korvausvelvollisia, mikä on Saksan siviiliprosessilain 256 §:n mukaisesti todettava, koska vaatimuksen suuruuden laskemiseksi tarvittava kirjanpito [Auskunft] puuttuu.”

Tämä on tyypillinen saksalainen ”porraskannejärjestelmä” (Stufenklage). GEMA voi sille luovutettavan kirjanpidon perusteella laskea lopullisen korvaussumman, joka perustunee menetettyihin lisenssimaksuihin. Tämä on GEMA:lle merkittävä voitto, sillä OpenAI joutuu avaamaan kirjanpitonsa loukkaavien sisältöjen osalta. Onkin erityisen kiinnostavaa nähdä, paljastaako tämä kirjanpito, kuinka monta kertaa GEMA:n edustamia teoksia on käytännössä toisinnettu ChatGPT:n kautta. Näin pitkälle menevä tutkinta ei ainoastaan perustuisi liikevaihtoon ja siitä pidettyyn kirjanpitoon vaan myös OpenAI:n käyttäjien prompteihin ja niihin annettuihin vastauksiin.

6. Tekoälyn musta laatikko vs. järjestelmäkehotteet

Tuomio korostaa tekoälyn kehittäjän vastuuta mallin tuotoksista, vaikka ne olisivat ”bugeja”. Tämä on linjassa sen kanssa, mitä tiedämme OpenAI:n omista yrityksistä rajoittaa loukkauksia.

Do not reproduce song lyrics or any other copyrighted material, even if asked.
GPT 5 system prompt

Vuodetut ”system promptit” (järjestelmäkehotteet) GPT-5-mallista sisältää ensimmäisenä ohjeena kiellon, joka kieltää mallia toisintamasta tekijänoikeudella suojattuja sanoituksia. Tästä huolimatta sanoituksia näyttäisi ”vuotavan” edelleen mallin tuotoksiin.

Tämä ei ole yllättävää. Se osoittaa, että tilastollinen malli ei kykene tekemään oikeudellista arviota siitä, mikä on tekijänoikeuden suojaamaa ja mikä ei. Vaikka kehittäjä yrittää asettaa sille ”sääntöjä”, mallin matemaattinen luonne voi ajaa näiden sääntöjen ohi, varsinkin jos se on koulutettu valtavalla määrällä dataa, jossa kyseiset sanoitukset toistuvat usein. Tuomio asettaa tämän teknisen riskin sinne, minne se kuuluukin: mallin kehittäjälle.

Tekoälyjuridiikka palvelumme

Tutustu muihin AI kirjoituksiin