I sitt innlegg “Døde stemmer vekkes til live” den 23. april tar Anders Toft Lothe til orde for at man ikke burde gjenskape døde stemmer. Han har rett i sin problematisering av at man ikke vet om de historiske personene man “vekker til livet” ved bruk av tekst-til-tale-teknologi ville ha ønsket det. Men poengene han trekker frem ellers, treffer et annet felt enn det vi opererer innenfor.
Hans argumentasjon kretser rundt det å ved hjelp av kunstig intelligens (KI) få en person til å synge noen andres sang. En sang vedkommende mest sannsynlig aldri har hørt. Det er vanskelig å se hvordan dette skal ha noen sammenheng med det å ta utgangspunkt i en forfatters stemme for å trene en KI-modell som leser forfatterens egne bøker.
Det ville kanskje vært mer naturlig å reagere om noen laget film av en bok fra en avdød forfatter, for i motsetning til en lydbok basert på KI, har filmer en tendens til å avvike (ganske sterkt) fra boken de hevder å være en filmatisering av. Noe som gir filmpublikum et feilaktig inntrykk av boken. Vår KI-genererte lydbok er derimot ord for ord gjengiving av boken.
Når det gjelder KI generelt, finnes det en mengde potensielle farer og åpenbare problemstillinger. Blant annet hvordan det kan brukes for å villede og manipulere befolkningen. La oss begynne der. Det er nå teknisk mulig via digital gjenskaping å legge ord i munnen på både avdøde og levende. Det er nok bare et spørsmål om tid før teknologien vil bli misbrukt, selv om man skulle være rask med å definere regelverk rundt dette.
Blant annet åpner et frislipp av denne teknologien opp for at man kan konstruere uttalelser for å f.eks påvirke opinionen ved et valg. Slik manipulasjon av realitetene kan sammenlignes med Platons hulelignelse, hvor noen er fanget og lenket fast på hendene og hodet slik at man bare ser skyggebildene på veggen foran seg, som er generert av et stort bål bak seg, utenfor synsfeltet. Er man ikke kjent med en annen virkelighet vet man ikke at man blir manipulert.
Heldigvis er dette og mange andre problematiske aspekter ved KI kjente problemstillinger og gjenstand for en stor og bred debatt. Det en også burde inkludere i denne debatten, er hvordan de store søkemotor-selskapene manipulerer søkeresultater, og den potensielle faren for blant annet politisk bias som ligger i dette om en kombinerer med KI hvor en kan konstruere meninger og “fakta”. Her vil et lovverk særlig være viktig med tanke på bruk av KI-stemmer basert på mennesker som lever i dag. Hvorvidt er det etisk riktig å bruke noens stemme til å uttale andres ord?
Toft Lothe har som sagt rett i sitt argument om at vi ikke kan vite hvorvidt Hamsun hadde satt pris på vår KI-utgivelse med en stemme som er basert på hans, leser “Sult” på engelsk. Men å bruke noens stemme for å synge en sang de ikke har hørt, eller si ting de kanskje ikke ville sagt selv, kan på ingen måte sammenlignes med å la en avdød person lese sine egne ord fra sin egen bok. Når det gjelder vår kommende KI-utgivelse av Knut Hamsuns Sult på engelsk vil vi hevde det er nettopp et eksempel på positiv anvendelse av teknologien.
På generelt grunnlag tror jeg forfattere ønsker at verkene deres skal leve videre, og følge formidlingsformene tiden bringer med seg. Jeg stiller meg spørrende til hvordan vårt prosjekt skulle føre til negative konsekvenser. Å gi Hamsuns forfatterskap et nytt liv, til glede for nye målgrupper, f.eks personer med lesevansker burde være noe vi alle kan erkjenne er udelt positivt.
Juridisk er det mye som tyder på at vi er godt innenfor vår rett å publisere KI-genererte lydbøker av forfattere som har falt i det fri. Jusprofessor Olav Torvund og advokat Jon Wessel-Aas, begge med opphavsrett som spesialfelt, argumenterer for at vårt prosjekt neppe kan stoppes eller sees som et brudd på opphavsretten. Torvund peker på at Hamsuns verker er offentlig eiendom, fordi det er over 70 år siden han døde. Hvem som helst kan nå gi ut verkene hans, også basert på Hamsuns stemme.
Vår kommende plattform “Vox Machina” (maskinens stemme) søker å demokratisere tilgjengeligheten av lydbøker ved å gi uavhengige forfattere og forlagshus muligheten til å selge sine lydbøker via vår abonnent-løsning. Her vil vi gjøre tilgjengelig både lydbøker lest av mennesker og (tydelig merket) KI-generert opplesing basert på forfatterens originale stemme.
Hamsun skrev i “Markens grøde”: “Den lange, lange sti over myrene og inn i skogene hvem har trakket opp den? Mannen, mennesket, den første som var her. Det var ingen sti før ham. Siden fulgte et og annet dyr de svake spor over moer og myrer og gjorde dem tydeligere, og siden igjen begynte en og annen lapp å snuse stien opp og gå den når han skulle fra fjell til fjell og se til sin ren. Slik ble stien til gjennom den store almenning som ingen eiet, det herreløse land.”
Før vi går opp stien videre vil vi til slutt i dette innlegget beklage at Hamsuns barnebarn ikke verdsetter vårt prosjekt med å bringe Hamsun videre til kommende generasjoner, gjennom lyden basert på hans stemme. Våre etiske avveininger ville vært enklere om hans etterkommere hadde vært takknemlig for utviklingen. Vi mener Hamsuns forfatterskap er en viktig del av norsk kulturhistorie og verdens litteraturarv og bør formidles til neste generasjon med den teknologien vi nå har til rådighet.
En forkortet versjon av dette innlegget ble publisert i Vårt Land.