Den 21. februar fejrede Dansk Oversætterforbund og Dansk PEN sammen den internationale modersmålsdag ved et velbesøgt arrangement om brugen af generativ AI i forbindelse med skrivning, oversættelse, sprogforskning og udgivervirksomhed.
Jørgen Christian Wind Nielsen fra Dansk PEN var moderator for en paneldebat og har efterfølgende skrevet om arrangementet her
Af Jørgen Christian Wind Nielsen
Den 21. februar er en festdag. Det er nemlig Den Internationale Modersmålsdag, der i år ovenikøbet kan fejre 25 års jubilæum. Vi benyttede festdagen til at debattere generativ kunstig intelligens og konsekvenserne for skrivning, forfatterskab, udgivervirksomhed, oversættelse, og for vores sprog. Det er ikke længere en given ting, at man kan få lov til at udtrykke sin mening og sine tanker på sit modersmål uden filter. Det er der mange, der ikke kan.
Generativ kunstig intelligens, Gen-AI eller GAI, kan hjælpe små sprog til tilstedeværelse og synlighed i cyberspace, og det kan hjælpe os til at kommunikere effektivt – men fungerer det i virkeligheden som en subtil måde at underminere de nationale sprog på og styrke det engelske sprog, den engelske syntaks, engelsk/amerikansk kultur, engelsk terminologi m.v.? Som en slags sproglig trojansk hest, for nu at bruge en metafor. Generativ AI har i hvert fald grundlæggende svært ved at håndtere danske metaforer – det viste flere eksempler fra Bolette S. Pedersens oplæg.
Og hvorfor skal skal vi overhovedet bruge GAI? Skal vi accelerere litteraturen, gøre oversættelser gratis, forlagsvirksomhed urentabel? Skal vi udvikle danske sprogmodeller, der bygger på engelske strukturer? Er det ikke bare kapitalistisk tech-business, der er ligeglad med alt andet end indtjening, og som ønsker at nedbryde det, de ser som sproglige barrierer, det, vi ser som sproglig diversitet? Hvor er det menneskelige element?
Ovenstående er den lige på og hårde kritik. Debatten til modersmålsdagen var langt mere nuanceret. For teknologien går ikke væk, så hvordan håndterer vi teknologien, så vores fag og arbejde ikke går væk, så vores sprog ikke bliver undermineret og udvandet?
I Danmark har vi en vejledning om brugen af AI i den offentlige sektor. USA taler omvendt om total liberalisering og deregulering af kommunikation og sociale medier, og Kina har sin egen totalregulering og styring og promoverer bl.a. DeepSeek. EU’s AI-forordning, som blev vedtaget sidste år, skal implementeres – EU har besluttet at tage konkurrencen på AI-området op.
Sproggrød
Morten Visby, formand for Dansk Forfatterforening indledte panelets oplæg med et spørgsmål:
Hvad er det vi egentlig skal med al den her underlige ensartede grød af litteratur, der ikke har noget originalt at byde på?” Jeg vil gerne se teknologien som noget positivt, men jeg frygter, at vi ikke stiller de rigtige spørgsmål …
Opfattelsen i medierne og blandt forskerne ligger ret langt fra forfatternes, sagde han videre, for eksempel med henblik på hvad teknologien kan bidrage med. Hvorfor skal vi det her? Det er et relevant spørgsmål at stille. Alle ved godt nu, at det er temmelig potent teknologi. Vi er ovre det stadie, hvor vi bare peger fingre af teknologien. Visby fortsatte:
Litteraturen er udfordret af at alle de andre ting, vi kan fylde vores hoveder med, som er frit tilgængelige. Hvad vinder vi egentlig ved at gøre teknologien så tilgængelig? Vi konkurrerer med medieindhold, som vi ellers ønsker at adskille os fra.
Videre i sit oplæg funderede Visby over, om det ikke netop er den menneskelige faktor, der adskiller sig fra medieverdenen? Og det er disse spørgsmål og mere, der hører under ”hvorfor”, og som vi bør stille os selv. Det er nemlig centralt at se på menneskelige arbejde i brugen af AI. For eksempel har mange forlag også efterhånden gjort sig erfaringer med Gen-AI og konstateret, at der er meget menneskeligt arbejde i det alligevel – her kan man for eksempel tænke på sagen med Sebastian Kleins børnebog, der udkom på Forlaget Carlsen og var fuld af fejl.
Den menneskelige faktor
Formand for Dansk Oversætterforbund, Juliane Wammen, er næste panelist og tager tråden op. Når det gælder maskinoversættelse, er den menneskelige faktor også afgørende – der skal altid et menneske til at efterredigere den tekst, som sprogmodellerne har produceret, men det krævede alligevel mennesker til at redigere det maskinskrevne. AI kan bruges nyttigt til at få indblik i en tekst, men maskinen kan ikke vide hensigten med teksten – stilleje, rytmer, følelsen af litteraturen. Wammen sagde videre:
Mange forestiller sig, at oversættelse er en form for efterligningskunst – en spejling, en matematisk ligning, men det er jo ikke ord, vi flytter, det er derimod hensigt, stil, rytme. Derfor vil teknologien ikke kunne erstatte det, mennesker kan – som oversættere kan vi bruge det som et hjælpemiddel. Den kan ”huske”, men kan ikke vide.
Den største fare ved teknologien, sådan som hun ser der, er – foruden de ret store problemer med ophavsret og store miljøbelastninger – at oversættere fortsat skal gøre deres arbejde, men med mindre praktisk arbejde med teksterne og for dårligere betaling. Efter hendes mening bliver arbejdet med teksterne mere utilfredsstillende, hvis man ikke får lov at arbejde med dem fra bunden.
Etik og ophavsret
Den tredje panelist var Henrik Schjerning, forlagschef på Samfundslitteratur, der bl.a. udgiver lærebøger til studerende. Han indledte med at påpege, at krænkelse af forfatternes og forlagenes ophavsret er et problem, fordi studerende og undervisere nogen steder er både uvidende og skruppelløse, når de indlæser bøger fra forlagene i de generative værktøjer. Det er både ulovligt og uetisk, men det breder sig.
Schjerning gav sit bud på, hvad et forlag kan bruge AI til og nævnte en lang række ting. Oversættelsesværktøjet DeepL bruges til oversættelser af manuskripter og tekster, hvor danske forfattere kan promoveres mere effektivt med maskinoversatte småtekster. Men som Schjerning understregede:
Vi kan derimod ikke bruge DeepL eller andre programmer til andet end orienterende oversættelser. De mangler præcision og sammenhæng sætning for sætning.
Til gengæld kan man kommercialiseres lydbøger med kunstig intelligens – og med forfatterens stemme efter blot 15 min. indlæsning. På den måde er det muligt at lave de lydbøger, som ellers ikke hang sammen økonomisk for et forlag som Samfundslitteratur.
Schjerning forklarer, at det er muligt at lave AI-motorer med temakoder og nøgleord. Korrekturlæsning er til gengæld ikke mulig endnu, men det vil givetvis komme – her kan der spares mange penge. Bagsidetekster kan ”spices” op, ChatGPT kan give bud på korte resumeer til kapitler. Og så kan der laves quizzer, cases og mindre redigeringsopgaver og idégenerering, den kan foreslå figurer, et omslag etc.
Alt i alt har vi fået en stærk kreativ hjælper, som vi bruger til stadig mere.
Jobs på menuen
Forperson for Translatørforeningen, Nira Glad, fik ordet og indledte med at sige, at generativ AI spiser jobs, som translatørerne og fagoversætterne har haft – men måske opstår der nye jobs, for eksempel postediting. Man må forsøge at være positiv og se, hvad der kan ske, mente hun. Robotten kan for eksempel ikke give det „seal of approval‟ endnu, som translatørerne kan. Når en oversættelse stemples betyder det, at det er en korrekt semantisk gengivelse af kildesproget.
Translatørerne er optagede af informationssikkerhed, retssikkerhed – tolkning, oversættelse, juridisk og social tolkning, etiske problemstillinger. Og i virkeligheden har forskellige former for maskinoversættelse og CAT-tools været brugt siden 1989. Med AI skal der stadigvæk tjekkes, om output er korrekt. AI kan hjælpe med snørklede ord og sætninger, vi skal tage imod det med kyshånd, men vi skal tænke os rigtig meget om hvordan vi bruger AI, slutter Glad.
Teknologigab
Sprogforsker på Københavns Universitet og leder af Center for Sprogteknologi, Bolette S. Pedersen, er den sidste panelist, der får ordet, og hun præsenterer bl.a. sine ideer på en powerpoint. Pedersen indledte med at forklare, hvordan teknologigabet til engelsk er blevet større. Når man derfor anvender de store sprogmodeller på dansk, er en stor del maskinoversat, og en oversættelse fra engelsk til dansk skaber forvitring undervejs.
Metaforer er et godt eksempel på et område, hvor det går galt, fordi metaforer på dansk er unikke og forvitrer i AI, og på den måde sker der en anglificering af metaforlandskabe. ChatGPT har desuden svært ved ironi og sarkasme og dermed svært ved dansk. Et lands ordforråd er afhængigt af landets kultur – dermed heller ikke ens. Pedersen forklarer videre:
Sproglige nuancer går tabt i systemerne, men det viser sig at sprogene har flere ligheder end først antaget – men de små forskelle er altafgørende – der er stor ulighed i AI på de forskellige europæiske sprog.
I samarbejde med Digitaliseringsstyrelsen og digitaliseringsministeren forsøger sprogforskerne at gøre sprogmodellerne bedre i.
Debat om bæredygtighed, bias og transparens
Efter panelisternes oplæg, bliver der stillet spørgsmål fra det fremmødte publikum, f. eks. om forskerne har tænkt sig at sende deres resultater videre til techgiganterne. Og dette er faktisk et centralt dilemma, der skal arbejdes videre med.
Der er en udbredt bekymring for sproget og domænetabet. For hvad er egentlig succeskriteriet? Hvis en dansk ChatGPT ikke virker optimalt på dansk, er det klart, at det er en god ting at udvikle den, men er faren ikke, at resultatet bliver for udvandet. Bliver vi så bedre til amerikansk på dansk? En af de tilstedeværende deltager, der selv er både forlægger og oversætter, siger:
Jeg er hende den sure gamle, der hader AI – mange spørgsmål bliver ikke stillet – hvorfor vil I være positivt indstillet over for teknologien? Der er f.eks. kønnede, racialiserede biases i maskinerne.
Man kan også spørge sig selv, hvem vi egl. støtter, når vi bruger maskinerne? Og så er der klimaspørgsmålet – når det stilles, siger techgiganterne blot, at det skal nok blive løst. En anden deltager kommenterer følgende:
Det er godt at træne det danske sprog. Ellers sker der en homogenisering af sproget – fordi LLM’erne har for stort fokus på genkendelighed. Desuden har en maskine ikke nogen intention – den vil ikke noget med det, den skriver, modsat en forfatter.
Som oversætter er det skræmmende at se teknologiens brug i forhold til, hvad den konkret blev skabt til. Hvis vi stiller spørgsmålet hvorfor, så er det udelukkende konkurrenceaspektet, der er gældende – cirkelslutningen mellem forfattere, der gør brug af det, forlæggere, der bruger det i arbejdet, den studerende bruger det,
En oversætter blandt tilhørerne bemærker, at der ved fagbogsoversættelse er et yderligere problem med research, fordi der er ved at ske en begrebsfattigdom på dansk, så det er svært at finde viden om, hvad ting hedder.
Grundlaget for et godt produkt er ved at forsvinde. Allerede nu er mit arbejde vanskeliggjort. Sprog er formidling mellem mennesker.
Det bliver påpeget, at det eneste, vi kan gøre kollektivt, er at levere nogle oversættelser, der er bedre end sprogmodellernes. Der er måske et håb om, at folk gerne vil betale for kvalitet – fra et menneske, der har evner og kundskaber. Forlagene har ikke et konkret stempel, sådan som translatørerne, men måske er der brug for noget tilsvarende. Der bliver i alt for høj grad fokuseret på, at noget er „godt nok‟ – men hvem er det, der skal læse alle de bøger, som bare er oversat „godt nok‟? En tilhører kommenterer:
Jeg ville da være skuffet, hvis jeg fandt ud af, det bare er en maskine, der har skrevet den – Hvorfor har vi ikke et stempel eller et kvalitetsmærke? – Kolofon: ”Denne bog er produceret helt uden brug af AI.
Til gengæld skal man også huske, at den dårlige sprogbruger kan blive bedre til sprog med AI. Og så kan man regulere markedet bedre, f.eks. med kontrakter, der stipulerer brug af AI. Transparens er i det hele taget et vigtigt aspekt i debatten.
**************
Artiklen bygger på referat af stud. mag. Anna A. Christensen.
Fotos: Jørgen Christian Wind Nielsen