Tiivistelmä:
| Tuomioistuin | OLG Hamburg (Hampurin hovioikeus) |
|---|---|
| Päivämäärä | 10.12.2025 |
| Asia | 5 U 104/24 |
| Osapuolet | Valokuvaaja vs. LAION e.V. |
| Ratkaisu | Valitus hylätty – TDM-poikkeus soveltui |
| Keskeinen sisältö | Opt-out vaatii teknisen toteutuksen (esim. robots.txt), pelkkä käyttöehtovaraus ei riitä |
| Muutoksenhaku | Sallittu – BGH voi ottaa jutun käsittelyyn |
Joulukuussa 2025 Hampurin hovioikeus (Hanseatisches Oberlandesgericht) antoi merkittävän ratkaisun asiassa 5 U 104/24. Valokuvaaja vaati LAION-yhdistystä kieltämään valokuvansa käyttämisen tekoälyn koulutusdatasetin luomisessa. Datasetti sisälsi 5,85 miljardia kuva-tekstiparia hyperlinkkeinä ja metatietoina, joita voidaan käyttää generatiivisen tekoälyn kouluttamiseen.
Hovioikeus hylkäsi valituksen ja katsoi, että valokuvan lataaminen oli sallittua sekä yleisen TDM-poikkeuksen (§ 44b UrhG) että tutkimus-tiedonlouhinta-poikkeuksen (§ 60d UrhG) nojalla. Ratkaisu on ensimmäinen saksalainen hovioikeustason kannanotto tekoälyn koulutusdatan tekijänoikeuskysymyksiin – ja se vahvisti alioikeuden (LG Hamburg, 310 O 227/23, 27.9.2024) aiemman ratkaisun.
Oikeudenkäynnin vaiheet
Alioikeus: LG Hamburg (syyskuu 2024)
Hampurin alioikeus hylkäsi valokuvaajan kanteen syyskuussa 2024. Alioikeus katsoi, että LAION-yhdistyksen toiminta täytti § 60d UrhG:n tutkimuspoikkeuksen edellytykset. Tuomioistuin totesi lisäksi, että myös yleinen TDM-poikkeus (§ 44b UrhG) olisi voinut soveltua, mutta jätti kysymyksen opt-out-varauksen koneluettavuudesta avoimeksi.
Valokuvaaja valitti hovioikeuteen.
Hovioikeus: OLG Hamburg (joulukuu 2025)
Hovioikeus vahvisti alioikeuden lopputuloksen mutta meni pidemmälle perusteluissaan. Se otti nimenomaisesti kantaa sekä § 44b UrhG:n yleiseen tiedonlouhinta-poikkeukseen että koneluettavuusvaatimukseen.
Tapauksen tausta
LAION (Large-scale Artificial Intelligence Open Network) on saksalainen voittoa tavoittelematon tutkimusorganisaatio, joka luo avoimia datasettejä tekoälyn tutkimukseen. Vuoden 2021 toisella puoliskolla yhdistys latasi kantajan valokuvan kuvapankin verkkosivustolta osana datasetin luontiprosessia. Kuva analysoitiin automaattisesti sen tarkistamiseksi, vastasivatko kuvan sisältö ja siihen liitetty tekstikuvaus toisiaan. Tämän jälkeen vain metatiedot (URL ja kuvaus) tallennettiin datasettiin – itse kuvaa ei säilytetty.
Kuvapankin käyttöehdoissa oli kielto automaattiselle tiedonkeruulle:
”You may not use automated programs, applets, bots or the like to access the website or any content thereon for any purpose, including downloading content, indexing, scraping or caching.”
Kantaja väitti, että tämä varaus esti TDM-poikkeuksen soveltamisen.
Tieddonlouhinnan käsite ja tekoälyn koulutusdatan tekijänoikeus
TDM-käsite kattaa tekoälyn koulutusdatan valmistelun
Hovioikeus tulkitsi ”tekstin ja tiedonlouhinta” -käsitettä laajasti. Kuvan ja tekstin yhteensopivuuden automaattinen tarkistaminen on § 44b UrhG:n tarkoittamaa korrelaatioiden selvittämistä. Tuomioistuin korosti, että sekä EU:n että Saksan lainsäätäjä ovat nimenomaisesti tarkoittaneet TDM-säännösten soveltuvan tekoälyn koulutukseen.
Tuomioistuin viittasi EU:n tekoälyasetuksen 53 artiklan 1 kohdan c alakohtaan, joka edellyttää yleiskäyttöisten tekoälymallien tarjoajilta tekijänoikeuspolitiikkaa, joka kunnioittaa DSM-direktiivin 4 artiklan 3 kohdan mukaisia opt-out-varauksia. Tämä osoittaa, että EU-lainsäätäjä on hyväksynyt TDM-poikkeusten soveltumisen tekoälykoulutukseen.
Opt-out vaatii teknisen toteutuksen
Ratkaisun käänteentekevä osa koski koneluettavuusvaatimusta. § 44b Abs. 3 S. 2 UrhG edellyttää, että opt-out-varaus on ”maschinenlesbarer Form” – koneluettavassa muodossa.
„Bei der Frage der Maschinenlesbarkeit kommt es nicht nur darauf an, dass der Text maschinell erfasst werden kann, sondern dass er auch in dem Sinn maschinell interpretiert werden kann, dass er bei einem automatisierten Vorgehen dazu führen kann, dass die vom Vorbehalt erfassten Inhalten nicht ausgewertet werden.”
”Koneluettavuuden arvioinnissa ei ole kyse vain siitä, että teksti voidaan lukea koneellisesti, vaan myös siitä, että se voidaan tulkita koneellisesti siten, että automaattisessa prosessissa se johtaa siihen, ettei varauksella suojattuja sisältöjä käsitellä.” s. 19
Hovioikeus katsoi, ettei luonnollisella kielellä kirjoitettu käyttöehtovaraus täyttänyt tätä vaatimusta. Tuomioistuin asetti todistustaakan oikeudenomistajalle: tämän on osoitettava, että varaus oli koneluettava juuri kyseisellä hetkellä eli tässä tapauksessa vuonna 2021.
„Die Voraussetzung der Maschinenlesbarkeit ist hingegen vom Rechteinhaber darzulegen und zu beweisen. […] Der Rechteinhaber muss darlegen, dass der von ihm gewählte oder ihm jedenfalls zurechenbare Nutzungsvorbehalt zum Zeitpunkt der angegriffenen Nutzungshandlung maschinenlesbar war.”
”Koneluettavuuden edellytyksen näyttäminen kuuluu sitä vastoin oikeudenomistajalle. […] Oikeudenomistajan on osoitettava, että hänen valitsemansa tai hänelle luettava käyttövaraus oli koneluettava riitautetun käyttötoimen ajankohtana.” s.18
Kantaja oli esittänyt todisteena ChatGPT-testin, jossa tekoäly tulkitsi käyttöehdot oikein. Hovioikeus ei hyväksynyt tätä, koska testi tehtiin vasta 2023 eikä se osoittanut, että vastaava teknologia oli käytettävissä 2021. Tuomioistuin totesi, että koneluettavuus edellyttää paitsi tekstin teknistä lukemista, myös sen tulkintaa tavalla, joka johtaa automaattiseen päätökseen olla käsittelemättä kyseistä sisältöä.
„Der Kläger hat das Ergebnis einer Eingabe der Nutzungsbedingungen bei ChatGPT wiedergegeben. Diese Eingabe erfolgte aber 2023. Der Chatbot ChatGPT wurde gerichtsbekannt erst Ende 2022 veröffentlicht. […] Auch insoweit hat der Kläger nicht dargelegt, dass dieses Tool bereits in der zweiten Jahreshälfte 2021 verfügbar war.”
”Kantaja esitti tuloksen käyttöehtojen syöttämisestä ChatGPT:hen. Tämä syöttö tehtiin kuitenkin vuonna 2023. ChatGPT-chatbot julkaistiin tuomioistuimen tietojen mukaan vasta vuoden 2022 lopussa. […] Myöskään tältä osin kantaja ei ole osoittanut, että tämä työkalu olisi ollut käytettävissä jo vuoden 2021 jälkipuoliskolla.”
Huomionarvoista on, että Tanskan tuomioistuin päätyi BoligPortal v. ReData -tapauksessa päinvastaiseen tulkintaan. Tanskassa tuomioistuin katsoi, että käyttöehdoissa oleva TDM-kielto voi täyttää DSM-direktiivin ”asianmukaisen tavan” vaatimuksen – ilman erillistä teknistä toteutusta kuten robots.txt-tiedostoa. Tämä ristiriita Saksan ja Tanskan oikeuskäytännössä korostaa tarvetta EUT:n linjaukselle. Vireillä oleva Like v. Google -tapaus (C-250/25) tulee todennäköisesti ratkaisemaan, kumpi tulkinta on oikea.
Ratkaisu muistuttaa myös suomalaista nettiradio.fi-tapausta, jossa hovioikeus totesi, että oikeudenhaltija voi rajoittaa suostumustaan linkittämiseen ainoastaan tehokkailla teknisillä toimenpiteillä – pelkät käyttöehdoissa olevat kiellot eivät riitä. Hampurin hovioikeus näyttää seuraavan samaa tiukkaa linjaa TDM-poikkeuksen osalta.
Tutkimusorganisaation laaja tulkinta
Hovioikeus hyväksyi LAION-yhdistyksen tutkimusorganisaatioksi § 60d UrhG:n tarkoittamassa mielessä. Tuomioistuin katsoi, että:
- Datasetin luominen on itsessään soveltavaa tieteellistä tutkimusta
- Yhdistyksen tieteelliset julkaisut ja akateemiset palkinnot tukevat tutkimusluonnetta
- Ei-kaupallinen luonne säilyy, vaikka datasetti on vapaasti kaikkien saatavilla
- Yksittäisen kaupallisen yrityksen 5 000 dollarin maksu ennenaikaisesta pääsystä ei muuta kokonaisarviota
„Wissenschaft umfasst nicht nur Grundlagenforschung, sondern auch angewandte Forschung. Auch technologische Forschung ist wissenschaftliche Forschung.”
”Tiede ei kata vain perustutkimusta, vaan myös soveltavaa tutkimusta. Myös teknologinen tutkimus on tieteellistä tutkimusta.” s. 24
§ 60d Abs. 2 S. 3 UrhG:n poissulkemisperuste (kaupallisen yrityksen määräävä vaikutusvalta) ei täyttynyt. Tuomioistuin korosti, että pelkkä rahoitus tai yhteistyö ei riitä – vaaditaan sekä ”määräävä vaikutusvalta” että ”etuoikeutettu pääsy tuloksiin” kumulatiivisesti.
Tekoäly-tekijänoikeustapausten vertailu: Saksa, UK, USA ja Tanska
Ratkaisu asettuu osaksi laajempaa eurooppalaista ja globaalia oikeuskehitystä.
Getty vs. Stability AI -tuomiossa Iso-Britannian tuomioistuin totesi marraskuussa 2025, että tekoälymalli ei ole ”loukkaava kappale”, koska se ei tallenna tai toista koulutusdataa. Tuomioistuin ei kuitenkaan ottanut kantaa itse koulutuksen laillisuuteen, koska koulutus tapahtui Britannian ulkopuolella.
Yhdysvalloissa kesäkuun 2025 tuomiot Bartz v. Anthropic ja Kadrey v. Meta -tapauksissa kallistuivat tekoälyyhtiöiden eduksi transformatiivisen käytön perusteella. Nämä ratkaisut perustuivat kuitenkin Yhdysvaltain fair use -doktriiniin, joka on rakenteeltaan täysin erilainen kuin Euroopan opt-out-malli.
Hampurin ratkaisu on ensimmäinen, joka nimenomaisesti käsittelee EU:n DSM-direktiivin TDM-poikkeuksia tekoälykoulutuksen kontekstissa. EUT:ssa on vireillä tapaus Like v. Google (C-250/25), joka tulee linjaamaan näitä kysymyksiä unionin tasolla.
Käytännön vaikutukset tekoälykehittäjille ja oikeudenomistajille
Tekoälykehittäjille
Ratkaisu vahvistaa, että louhintapoikkeukset soveltuvat tekoälyn koulutusdatan keräämiseen ja käsittelyyn, kunhan:
- Data on laillisesti saatavilla verkossa
- Opt-out-varauksia kunnioitetaan – ainakin teknisesti toteutettuja – riski siitä, että muuten toteutetut varaukset ovat tehokkaita ei kokonaan poistunut
- Dataa ei säilytetä pysyvästi ”rinnakkaisarkistona”
Oikeudenomistajille
Pelkkä käyttöehtovaraus ei välttämättä riitä. Oikeudenomistajan on syytä toteuttaa opt-out teknisesti, esimerkiksi:
- robots.txt-tiedostolla
- TDM Reservation Protocol -metatiedoilla (TDM-AI)
- ISCC-tunnisteilla (ISO 24138)
- Muulla standardoidulla teknisellä ratkaisulla
Kopiosto ja 1001 Lakes ovat kartoittaneet näitä teknisiä ratkaisuja IPRinfon artikkelissa. Erityisen lupaavana pidetään TDM-AI-protokollaa, joka mahdollistaa oikeudenhaltijoiden koneellisesti luettavien käyttöehtojen kyselyn järjestelmien välillä, sekä ISCC-tunnistetta, joka on virallisesti hyväksytty kansainväliseksi standardiksi digitaalisten aineistojen yksilöimiseen.
Luonnollisen kielen varaus – olipa se kuinka selkeä tahansa – ei välttämättä täytä koneluettavuusvaatimusta, ellei oikeudenomistaja pysty osoittamaan, että kyseisellä hetkellä oli käytettävissä teknologia sen automaattiseen tulkintaan.
Tutkimusorganisaatioille
§ 60d UrhG:n tutkimuspoikkeus tulkittiin laajasti. Myös yksityinen yhdistys voi olla tutkimusorganisaatio, jos se:
- Harjoittaa itse tieteellistä tutkimusta
- Ei tavoittele voittoa
- Julkaisee tuloksiaan avoimesti
Yhteistyö kaupallisten toimijoiden kanssa ei automaattisesti poista tutkimusstatusta.
Mitä seuraavaksi?
Hovioikeus salli valittamisen Saksan liittovaltion korkeimpaan oikeuteen (BGH). Asialla on periaatteellista merkitystä, koska § 44b ja § 60d UrhG:n tulkinnasta tekoälykoulutuksen yhteydessä ei ole ylimmän oikeusasteen ratkaisua.
BGH:n ratkaisu tulee linjaamaan:
- Koneluettavuuden tarkan sisällön – riittääkö luonnollisella kielellä annettu kielto vai vaaditaanko kiellon olevan strukturoitua data?
- Tutkimusorganisaation käsitteen rajat avoimessa tekoälytutkimuksessa
- Kolmen askeleen testin soveltamisen, kun TDM:n tuloksia käytetään kaupalliseen tekoälykehitykseen
Merkittävä kysymys jää päätöksen saavutettua lainvoiman edelleen auki: onko varsinaisen tekoälymallin kouluttaminen tekijänoikeusloukkaus, vai vain datasetin luominen? Hampurin tapaus koski vain datasetin luontia. Kun malli koulutetaan datasetillä, syntyykö uusi tekijänoikeudellisesti relevantti käyttö? Tähän EU-tuomioistuin pääsee ottamaan kantaa Like v. Google -tapauksessa.
Usein kysytyt kysymykset
Kyllä, tietyin edellytyksin. EU:n DSM-direktiivin TDM-poikkeus (text and data mining) sallii tekoälyn koulutuksen, kunhan oikeudenomistaja ei ole tehnyt tehokasta opt-out-varausta. Hampurin hovioikeus vahvisti, että varauksen on oltava koneluettavassa muodossa.
Hampurin hovioikeuden mukaan pelkkä käyttöehtovaraus ei riitä. Oikeudenomistajan on käytettävä teknistä toteutusta, kuten robots.txt-tiedostoa, TDM-AI-protokollaa tai ISCC-tunnistetta. Tanskan tuomioistuin on tosin päätynyt toisenlaiseen tulkintaan BoligPortal-tapauksessa.
LAION (Large-scale Artificial Intelligence Open Network) on saksalainen voittoa tavoittelematon yhdistys, joka luo avoimia datasettejä tekoälyn tutkimukseen. Sen LAION-5B-datasetti sisältää 5,85 miljardia kuva-tekstiparia ja sitä on käytetty mm. Stable Diffusion -kuvageneraattorin kouluttamiseen.
Saksan Hampurin hovioikeus edellyttää teknistä toteutusta (robots.txt tms.), kun taas Tanskan tuomioistuin BoligPortal-tapauksessa katsoi, että käyttöehdoissa oleva kielto voi riittää. EU-tuomioistuimen Like v. Google -ratkaisu tulee todennäköisesti yhtenäistämään tulkinnan.