Sisällöntunnistus Content ID

Sisällöntunnistusjärjestelmä on algoritmi, joka tunnistaa tekijänoikeuden suojaamien teosten käytön videoissa, audiossa ja tekstissä. Sisällöntunnistaminen voi olla merkittävää kauppalisen tekijänoikeusloukkauksen tai esimerkiksi tieteellisen plagioinnin tunnistamiseksi.

YouTube tekee yhteistyötä merkittävien musiikki- ja elokuvateosten tekijänoikeuden haltijoiden kanssa. Palvelun tarkoituksena on tunnistaa tekijänoikeuden suojaamien teosten luvaton käyttäminen palvelun käyttäjien lataamista videoista. YouTube käyttää tähän tarkoitukseen Content ID nimellä tunnettua sisällöntunnistusjärjestelmää.

Sisällöntunnistusjärjestelmän toimintaperiaate

YouTube tarjoaa oikeudenhaltijoille alustan oikeuksien valvontaan. Alustan kautta oikeudenhaltijat voivat lähettää ContentID-valvontajärjestelmään teoksia valvottavaksi. Contend ID -järjestelmä tallentaa valvottujen teosten digitaalisen sormenjäljen tietokantaan. Digitaalinen sormenjälki on tiivistetty yhteenveto musiikkikappaleen tai elokuvan sisällöstä.

Käyttäjien ladatessa videoita YouTubeen, Content ID skannaa jokaisen videon ja vertaa tietokantaan tallennettua sormenjälkeä videoon. Järjestelmän havaitessa kaksi samankaltaista sormenjälkeä, järjestelmä tarjoaa oikeudenhaltijalle mahdollisuutta päättää, mitä palvelu tekee palvelun tunnistamalle videolle.

Oikeudenhaltija voi reagoida videoon seuraavilla tavoilla:

  1. Estää video
  2. Mykistää videon ääni kaikkialla tai joissakin maissa.
  3. Kaupallistaa video. Tällöin YouTube näyttää videon yhteydessä mainoksia, joista oikeudenhaltija saa osuutensa.
  4. Seurata videoiden katsojalukuja ja reagoida mahdollisesti myöhemmin.

Käyttäjä saa Content ID -järjestelmän havainnosta ilmoituksen. Content ID -ilmoitukset eivät aiheuta YouTuben mukaan sellaista varoitusta, joka voi johtaa käyttäjätilin sulkemiseen. Käyttäjällä on mahdollisuus kiistää Content ID ilmoitus, jos käyttäjä kokee ilmoituksen aiheettomaksi.

Content ID -ilmoitus voi johtaa videon mainostulojen menetykseen siltä ajalta, kun video on ollut estetty tai kaupallistettu ilmoituksen tehneelle oikeudenhaltijalle.

Sisällöntunnistuksen virheet

Sisällöntunnistusjärjestelmät pystyvät havaitsemaan usein tekijänoikeudellisen materiaalin käytön käyttäjän lataamassa sisällössä. YouTube on ilmoittanut Content ID sisällöntunnistusjärjestelmän yltävän 99,7 % tarkkuuteen. Sisällöntunnistusjärjestelmä ei kuitenkaan pysty ymmärtämään monimutkaista tekijänoikeusjärjestelmää, joka on yksi syy, miksi järjestelmä tekee virheitä. Identtinen ääniraita tai video ei tarkoita aina tekijänoikeuden loukkausta. Usein järjestelmä tunnistaa identtiset ääniraidat tai videot mahdollisiksi tekijänoikeuden loukkauksiksi.

Identtiseen osumaan voi kuitenkin olla useita mahdollisia syitä. Syy voi olla esimerkiksi suojatun teoksen käyttäminen parodian tai sitaatin perusteella luvallisesti.

Mikäli sinun videosi on joutunut aiheettomasti sisällöntunnistuksen leimaamaksi, voit kiistää ilmoituksen.

YouTube on ilmoittanut, että alle yksi prosentti videoista jotka sen algoritmi on tunnistanut loukkaavaksi kiistää ilmoituksen.

Linnunlaulu ja sisällöntunnistus

Julkisuudessa nousi pienoinen kohu, kun YouTubeen videon ladannut käyttäjä kertoi YouTuben julkisella kysymyspalstalla saaneensa vaatimuksen videon taustalla laulavan linnun takia. Käyttäjä oli kuvannut videon, jossa hän käveli ja puhui luonnossa kaukana mistään musiikista. Videolla ei ollut sen ladanneen käyttäjän mukaan mitään tekemistä Rumblefish yhtiön musiikin kanssa.

Rumblefish yhtiön edustaja vastasi Reddit-palvelussa, että Rumblefish ei ole vaatimuksen takana, vaan Content ID järjestelmä on tuntemattomasta syystä väittänyt linnunlaulua yhdeksi Rumblefish yhtiön edustaman artistin kappaleeksi.

Tekijänoikeus suojaa ilmaisuasua kopioinnilta. Tekijänoikeuden yksi erikoinen piirre on, että se ei estä periaatteessa kahden toisistaan tietämättä samanlaisen teoksen luonutta saamasta tekijänoikeussuojaa. Eläin ei voi saada tekijänoikeussuojaa, eikäa luonnossa laulava lintu voi loukata tekijänoikeutta. Käytännössä nykyisessä verkottuneessa maailmassa on harvoin tilanteita, joissa kaksi samanlaista teoskynnyksen ylittävää teosta voidaan väittää syntyneen toisistaan riippumatta.

ContentID on sen verran tarkka, että se on havainnut esimerkiksi kauppakeskuksen taustamusiikkia ja estänyt videoiden näytön tämän perusteella.

Remix-teokset ja sisällöntunnistus

Remix-teokset tyypillisesti hyödyntävät toisia teoksia lähdemateriaalina. Käyttö voi olla sallittua tai oikeutus voi puuttua. Jos remix-teoksen lataa palveluun, jossa on sisällöntunnistusjärjestelmä, voi remix-teos jäädä suodattimeen.

Remix-teoksen tekijän näkökulmasta tekijänoikeudellisen ongelman muodostaa ylisuodatus, jossa sallitun käytön tilanteet johtavat sisällöntunnistukseen. Remix-teoksen tekijän onkin huomioitava riski siitä, että video saatetaan suodattaa riippumatta käytön sallittavuudesta lain näkökulmasta.

Sisällöntunnistus muodostaa erityisesti ongelman siteerauksen ja parodian osalta, jossa lähdeaineistoa voi olla muuttamattomana. Lisäksi sisällöntunnistuksella voi olla vaikeuksia tunnistaa sallittua käyttöä lisenssin perusteella.

Jos lähdeaineisto on muokattu riittävästi, sisällöntunnistus ei tulkitsi yhtä helposti kahta sisältöä identtiseksi.

Ongelmaksi saattaa kuitenkin muodostua teoskynnyksen alle jäävät osat. Vaikka kaikki osat eivät saa tekijänoikeussuojaa, algoritmi saattaa tulkita osan hyödyntämisen mahdolliseksi tekijänoikeuden loukkaukseksi.

EU:n tekijänoikeusuudistus ja sisällöntunnistus

EU:n digital single market (DSM) nimellä tunnettu tekijänoikeusuudistus saattaa tuoda mukanaan mahdollisesti uutta sääntelyä, joka koskisi sisällönjakopalveluita kuten YouTubea ja Facebookia. DSM-direktiivin 13 artikla voi mahdollisesti tarkoittaa sisällönjakopalveluille sisällöntunnistusvelvollisuutta.

Katso lisätietoja tekijänoikeusdirektiivin vaikutuksesta alustojen sisällöntunnistukselle.

Direktiivin sanamuodot ovat vielä tulkinnanvaraisia. Lainsäädäntöprosessi on vielä kesken. Direktiivin lopullisesta sisällöstä ja tosiasiallisista vaikutuksista ei ole vielä tietoa.

Asiantuntijat ovat olleet kuitenkin huolissaan DSM-direktiivin mahdollisista vaikutuksista käyttäjän luomaan sisältöön. Tekijänoikeuslainsäädännön harmaalla alueella olevien remix-teoksien julkaisumahdollisuudet voivat heikentyä direktiivin mukana.

Toisaalta DSM-direktiivin Euroopan Parlamentin tarkistuksissa on kiinnitetty huomiota kuluttajien vähäisiin mahdollisuuksiin hankkia lisenssejä käyttäjän luomaan sisältöön. Yhdeksi ratkaisuksi parlamentti väläyttää käyttäjän luoman sisällön poikkeuksen sisällyttämistä tekijänoikeuslainsäädäntöön. Mitään konkreettista ehdotusta uudesta poikkeuksesta Euroopan parlamentti ei ole esittänyt.