Koodin tekijänoikeus kun tekoäly on ohjelmistokehityksen apuna

Olin avustajana oikeudenkäynnissä, jossa vastaajaa syytettiin erään JavaScript-tiedoston luvattomasta kopioinnista. Tapahtumat saivat alkunsa vuonna 2018. Tuolloin keskiössä oli vielä perinteisempi pohdinta siitä, ylittikö kyseinen koodi teoskynnyksen ja kuinka samankaltaista koodi oli alkuperäiseen verrattuna. Vain muutamassa vuodessa – nyt vuonna 2025 – tekoälytyökalujen nopea kehitys on muuttanut ohjelmistokehitystä peruuttamattomasti. Sekä koodin tuottaminen että sen muokkaaminen ovat mullistuneet.

Näen, että tästä eteenpäin tekoälyn rooli tulee olemaan keskeinen lähes kaikissa tietokoneohjelmien tekijänoikeusloukkauksia koskevissa väitteissä ja oikeudenkäynneissä. Se vaikuttaa kaikkeen: miten arvioimme koodin omaperäisyyttä, miten todistamme kopiointia ja jopa siihen, kenellä ylipäätään on oikeus vaatia suojaa koodilleen. Tässä kirjoituksessa käyn läpi perustelut tälle väitteelle ja avaan, miksi koodin tekijänoikeus on entistä kimurantimpi kysymys tekoälyn aikakaudella.

Koodi kirjallisena teoksena – Laki suojaa muotoa ei lopputulosta

Aloitetaan perusteista, jotka ovat itse asiassa hyvinkin selkeät lain kirjaimessa. Suomen tekijänoikeuslaki (404/1961) ei ainoastaan mahdollista koodin suojaa yleisen kirjallisen teoksen määritelmän kautta, vaan se toteaa tämän myös nimenomaisesti. Tekijänoikeuslain 1 § :

Kirjallisena teoksena pidetään myös … tietokoneohjelmaa..

Tämä pykälä siis vahvistaa yksiselitteisesti, että tietokoneohjelmat kuuluvat kirjallisiin teoksiin. Ne saavat suojaa tekijänoikeuslain 1 §:ssä määritellyn kirjallisen teoksen tavoin.

“Sillä, joka on luonut kirjallisen tai taiteellisen teoksen, on tekijänoikeus teokseen”

Tämä antaa vahvan ja selkeän oikeudellisen perustan koodin tekijänoikeudelliselle suojalle.

Teoskynnyksen ylitys – Mikä tahansa koodinpätkä ei riitä

Vaikka laki suojaa tietokoneohjelmia kirjallisina teoksina, pelkkä koodin kirjoittaminen ei automaattisesti takaa suojaa jokaiselle koodiriville. Kuten muidenkin teosten kohdalla, myös koodin tulee ylittää niin sanottu teoskynnys. Tämä tarkoittaa, että sen on oltava riittävän itsenäinen ja omaperäinen tekijänsä luovan työn tulos.

Käytännössä tämä tarkoittaa, että täysin triviaalit, lyhyet koodinpätkät tai funktiot, jotka kuka tahansa alan ammattilainen kirjoittaisi samalla tavalla ratkaisuna tiettyyn ongelmaan, eivät todennäköisesti saa suojaa. Sen sijaan omaperäiset algoritmit, luovat ratkaisut tai monimutkaisemmat kokonaisuudet, joissa tekijällä on ollut useita vaihtoehtoja toteutustavan suhteen, voivat ylittää teoskynnyksen.

Teknisten rajoitteiden puristuksessa

Tilannetta mutkistaa se, että koodin tekemistä ohjaavat usein tiukat tekniset reunaehdot ja standardit. Joskus tiettyyn tekniseen ongelmaan on vain muutama järkevä tai tehokas tapa toteuttaa ratkaisu. Tällöin monimutkainenkin koodi ei välttämättä ole ilmentymä luovuudesta, vaan pikemminkin teknisten vaatimusten sanelema lopputulos. Tällainen koodi ei saa tekijänoikeuden suojaa, koska omaperäisyyden ja luovien valintojen osuus jää vähäiseksi.

Ohjelmointikielet itsessään tarjoavat usein monia tapoja ilmaista sama toiminnallisuus. Kuten luonnollisissa kielissä, myös koodissa voi valita eri rakenteita – onko silmukka toteutettu for– vai while-rakenteella, tai käytetäänkö valintatilanteessa if-else- vai switch-lohkoja. Nämä valinnat voivat olla osa sitä luovaa prosessia, joka nostaa koodin teoskynnyksen yli, kunhan valintoja on aidosti ollut ja ne eivät ole olleet täysin itsestään selviä tai teknisesti pakotettuja.

Teoskynnys ei ota kantaa siihen miten laadukas teos on. Laadukas hyvien tapojen ja oppaiden mukaisesti laadittu koodi voi jäädä suojatta, kun virheitä sisältävä sotkuinen spagettikoodi voi saada omaperäisenä suojan helpommin.

Tekoäly astuu kehiin – Koodin uudelleenkirjoittamisen helppous ja uudet työkalut

Tekoälytyökalut, kuten suuret kielimallit (LLM), ovat mullistamassa ohjelmistokehitystä. Tämä ei ole enää tulevaisuuden visio, vaan nopeasti valtavirtaistuva käytäntö. Siitä kertoo esimerkiksi Aalto-yliopiston ja FITech-verkoston yhteistyönä tarjoama kurssi ”Software Engineering with Large Language Models”. Se, että aihetta opetetaan jo osana insinöörikoulutusta, osoittaa selvästi, että näiden työkalujen hyödyntäminen on jo osa modernin ohjelmistoinsinöörin perustyökalupakkia.

Nämä tekoälytyökalut eivät ainoastaan kykene generoimaan uutta koodia kehotteiden perusteella, vaan ne ovat myös erittäin tehokkaita muokkaamaan ja uudelleenkirjoittamaan olemassa olevaa koodia monin eri tavoin. Kehittäjä voi pyytää tekoälyä esimerkiksi:

Listaamaan koodista osia, jotka ovat tarpeettomia tai helposti poistettavissa.
Selittämään koodin toimintaa ihmisluettavassa muodossa (dokumentaation avuksi tai ymmärryksen parantamiseksi).
Vaihtamaan systemaattisesti kaikki muuttujien ja funktioiden nimet kuvaavammiksi tai anonyymeiksi.
Järjestelemään tiedostorakenteen ja koodin sisäisen järjestyksen täysin uusiksi (refaktorointi).
Kääntämään koodin toiselle ohjelmointikielelle tai päivittämään sen uudempaan versioon.
Soveltamaan koodiin tiettyä ohjelmointityyliä, joka voi perustua annettuihin tyylioppaisiin tai jopa toisen ohjelmoijan aiemmin tuottamaan esimerkkikoodiin.

Kopioinnin todistaminen vaikeutuu entisestään

Tekoälyn kyvykkyys muokata koodia syvällisesti ja nopeasti lisää uuden haasteen tekijänoikeusloukkausten selvittelyyn. Jo entuudestaan käytössä ollut minifiointi – prosessi, jossa koodista poistetaan kaikki ylimääräinen (kommentit, rivinvaihdot, välilyönnit) ja nimet lyhennetään minimiin koodin koon pienentämiseksi – on vaikeuttanut koodien vertailua. Kun tähän yhdistetään tekoälyn kyky rakenteellisesti muokata ja uudelleenkirjoittaa koodia lähes mielivaltaisesti, alkuperäisen lähteen jäljittäminen ja kopioinnin todistaminen muuttuu merkittävästi hankalammaksi. Kahden koodinpätkän samankaltaisuuden tai erilaisuuden arviointi ei ole enää yhtä suoraviivaista.

Entä tekoälyn itse tuottama koodi? Kuka omistaa oikeudet?

Yksi keskeisimmistä uusista kysymyksistä on tekoälyn itsensä generoiman koodin tekijänoikeudellinen asema. Nykyisen tekijänoikeuslainsäädännön ja vakiintuneen kansainvälisen tulkinnan valossa tekijänoikeus syntyy ihmiselle, luonnolliselle henkilölle, joka on tehnyt luovan työn. Koska tekoäly ei ole oikeushenkilö eikä sen toimintaa (ainakaan vielä) pidetä itsenäisenä luovana työnä lain tarkoittamassa mielessä, sen täysin itsenäisesti tuottama koodi ei todennäköisesti saa tekijänoikeussuojaa.

Tämä voi johtaa tilanteisiin, joissa yritys käyttää tekoälyä tuottamaan merkittäviä osia ohjelmistostaan, mutta ei voi estää kilpailijoita kopioimasta näitä osia, koska niillä ei ole tekijänoikeussuojaa. Toki tilanne on monimutkaisempi, jos ihminen ohjaa tekoälyä tarkasti tai muokkaa merkittävästi sen tuotosta – tällöin ihmisen luova panos voi synnyttää oikeuksia. Rajanveto on kuitenkin vaikeaa ja varmasti työllistää tuomioistuimia jatkossa.

Oikeuskäytäntö muutoksen edessä: Teoskynnyksestä tekijyyteen

Kuten alussa mainitsin, vuoden 2018 tapauksessa keskiössä oli teoskynnyksen ylittyminen ihmisen tekemän ja kopioiman koodin osalta. Tekoälymurros tulee väistämättä vaikuttamaan tuleviin oikeustapauksiin. Siinä missä aiemmin oikeus saattoi pohtia teoskynnystä teknisten rajoitteiden ja triviaalisuuden näkökulmasta, tulevaisuudessa käsittelyssä voi olla yhä useammin väite siitä, että loukattu koodi ei ansaitse suojaa, koska sen onkin alun perin generoinut tekoäly, ei ihminen, tai että väitetty loukkaus on tehty tekoälyn avulla niin, ettei alkuperäistä lähdettä voi enää osoittaa. Kysymys tekijyydestä nousee uudella tavalla keskiöön.

Tekoälyn käytöstä jää usein jälkiä. Nämä jäljet voivat olla havaittavissa versionhallinnassa tai yritysten työntekijöilleen tarjoamissa työkaluissa. Voi olla vaikea esimerkiksi selittää miten koodia alkaa syntyä satoja tai tuhansia rivejä työntekijältä, joka aikaisemmin on tuottanut muutamia rivejä päivässä. Tällöin oikeudenkäynnissä tutkittavaksi tulisi ottaa kysymys siitä, miten koodi on syntynyt, kenellä on koodin tekijyys ja onko koodi tekijänoikeuden suojan piirissä lainkaan.

Lopuksi

Yritykset joutuvat painimaan tekoälyn käytössä perustavanlaatuisten kysymysten kanssa. Yhtäältä lupaus ohjelmistokehityksen tehokkuuden valtavasta loikasta ja toisaalta tekijänoikeuksien menetys painavat vaakakupissa. Koodin suojaaminen ja ajaminen palvelimilla palauttaa koodin suojan liikesalaisuudeksi. Toisaalta käyttäjien laitteilla ajettavan front-end koodin työntäminen palvelimille ei piilota ideoita, jotka on helppo kuvailla tekoälylle. Parhaimmillaan tekoäly voi luoda arkkitehtuurisuunnitelman lisäksi sekä palvelin- että selainkoodia vain katsomalla videon ohjelmiston käytöstä. Tämä toki on kaukana palvelujen onnistuneesta kopionnista. Laadukas verkkopalveluiden duplikointi vaatii myös jatkossa resursseja. Toisaalta halpojen ja nopeiden ns. temu-palvelukopioiden tekeminen on entistä helpompaa.

Uudet tavat järjestää ohjelmistotuotanto asettavat paineita sopia tekoälyn käytön pelisäännöistä ohjelmistotiimien kanssa. Nämä sopimukset koskevat sekä työsuhteessa toimivia ohjelmistokehittäjiä että ulkopuolisia tekijöitä. Näitä sopimuksia ja niissä sovittuja käytäntöjä tuomioistuimet pääsevät epäilemättä tulkitsemaan jatkossa tekijänoikeusjutuissa.