Opdagelser og overvejelser fra en praktikers skrivebord, del 3
I forsommeren lavede oversætter og Babelfiskredaktør Signe Lyng sin egen praksisbaserede undersøgelse af forholdet mellem generativ kunstig intelligens og litterær oversættelse. Undervejs lagde hun sine opdagelser og overvejelser af fænomenet ud på Facebook, og Babelfisken har samlet opslagene. Vi er nået til tredje og (foreløbig) sidste del (læs første del her og anden del her).
11. juli 2023
10. Hvad sker der, når man fodrer maskinen med maskinen?
Jeg tror, mange af os automatisk ser maskinoversættelse og nu også AI som lukkede systemer med en række fejl, som vi retter lidt efter lidt, fordi vi er kloge mennesker, og de er dumme maskiner. Derfor tænker vi også, at hvis vi fodrer maskinen med maskinen, sker der ingenting – det vil jo være de samme ord, der bliver puttet ind igen. Hvis vi vil udvikle maskinen, tænker vi, må vi genfodre den med tekster, der er rettet til af os, og med helt nye tekster, som vi har skrevet. Det er grundprincippet for de fleste professionelle oversættelsesværktøjer, og AI markedsføres efter samme model.
Det, vi ikke tænker, er, at vi selv laver fejl. Og det, vi SLET ikke tænker, er, at maskinen påvirker vores sprog. At vi fodrer os selv med maskinen og tilpasser os den, så vores tilrettede tekster stadig er delvis maskintekster, og vores nye tekster får ord og vendinger, som vi har overtaget fra maskinen.
Tjek de sociale medier, tænd for radioen, tjek avisen, eller snak med din nabo. Vi har fodret både os selv og maskinen med maskinen i årevis. Google Translate kom til i 2006, og den tjeneste har allerede ændret det danske sprog.
Når vi tjekker maskinoversættelser, er det som sagt ofte de åbenlyse brølere, vi peger fingre ad. Men det er ikke de latterlige fejl, der påvirker vores sprog, for dem opdager vi jo. Det er derimod:
1. Ord, vi ikke helt selv har styr på betydningen af, hverken på kildesproget eller vores eget: Jeg har i mange år regelmæssigt tjekket, om Google Translate stadig oversætter policy briefs med politiske trusser – det er den desværre holdt op med. Til gengæld oversætter den nu til politiske briefer, hvilket bestemt heller ikke er et udtryk, der findes på dansk. Men det ser mere rigtigt ud for en, der ikke helt ved, hvad det drejer sig om (et kort resumé af en bestemt politik på et bestemt område), og så stoler man på maskinen. Det er der i skrivende stund mindst 118 personer, der har gjort, kan Google fortælle. Der skal nok komme flere til.
2. De små ord og de grå ord – dem, hvis betydning vi ikke rigtig tænker over: En af de områder, maskinoversættelse traditionelt har vist sig at være elendig til, er de små, faste vendinger, der består af et verbum med en bestemt præposition (eller flere) tilknyttet: høre efter, passe på, give op De har altid været et problembarn for oversætterne, også de menneskelige, for de kan sjældent oversættes direkte. Forhåbentlig kan du høre, at vi ender i danglish, hvis jeg siger: Listen after!, men det er ikke altid så tydeligt. Vi havde eksemplet med føde ind i i afsnit 4. Her er to til:
Stå op for dine rettigheder (stand up for your rights)
eller
Det hele kommer ned til had (it all comes down to hate)
Alle tre eksempler er fra Google Translate, og alle tre er fejloversættelser, der nu er mere eller mindre indlemmet i nudansk. Måske synes du slet ikke, at der er noget galt med nogen af dem? Personligt er jeg så gammel og stædig, at det eneste, jeg står op for, er at tisse om natten, men jeg hører jævnligt udtrykket brugt, også af jævnaldrende, i situationer, hvor jeg ville bruge kæmpe for, forsvare, bakke op om el. lign. Også kommer ned til (kan koges ned til, skyldes, ofte også kommer an på) buldrer frem. Det er et af de oversættelsesfelter, hvor sprogene slet ikke samarbejder, og det udtryk, man vælger, kan skifte radikalt alt efter sammenhæng. Så der er i og for sig ikke noget at sige til, at den dovne menneskehjerne godt kunne tænke sig en fiks lille universalløsning.
3. Ord, der ligger lige ved siden af: En moderne John Mogensen ville måske synge “derfor må du gå ad din egen sti” i Så længe jeg lever, for det engelske path – sti – er ved at fortrænge vejen som metafor for de valg vi træffer i livet. Og nej, vi har aldrig været konsekvente – tænk bare på dydens smalle sti – men der kommer flere stier til i disse år. Og nu vi er ved færdselsårerne, er korsvejen (crossroads) lige så stille ved at erstatte skillevejen, når vi skal træffe en afgørende beslutning.
4. Smarte adverbialled: “Back in the bedroom, she changed her clothes”. På maskindansk og efterhånden også nudansk: “Tilbage i soveværelset skiftede hun tøj”. På traditionelt dansk noget hen ad: “Hun gik ind i soveværelset igen og skiftede tøj”. Jeg kan godt forstå, at den konstruktion vinder frem, for den ER smart. Kort og enkelt, vupti! Og der er da også mange, der ikke studser over den, i hvert fald så længe det smarte adverbialled ikke har en bisætning tilknyttet – for vi kan godt se, at det vakler, når der står: “Tilbage i soveværelset, hvor gardinerne igen var blevet trukket for, skiftede hun tøj”.
5. Faste vendinger, vi nemt kan føje til: “Music in its essence might be divided into three classes”. Maskin- og nudansk: “Musik i sin essens kan opdeles i tre klasser”. Glem, at verbet står forkert – det er essensen, der er essensen. For vi bruger jo essens som metafor – vi har bare ikke, indtil for nylig, haft udtrykket i sin essens. Vi har sagt grundlæggende, i bund og grund, basalt set , men her er kommet endnu et udtryk til.
Om det helt og holdent er maskinernes skyld, at der er mere skred i vores sprog end sædvanligt, er svært at sige – inden for samme periode er vi jo begyndt at læse, se og lytte til mere engelsksproget materiale end nogensinde før, og nyhedsstrømmen fosser hurtigere og hurtigere og må helst ingenting koste. Vi påvirkes af de fremmedsprog, vi taler, og sådan har det altid været. Lige nu er det amerikansk, men tidligere har det været tysk og fransk, og det kan man stadig tydeligt se på det nudanske. En del af sprogforandringen har altid skyldtes sprogsjusk – slattent sprog er bestemt ikke noget moderne fænomen – men vi er også alle sammen legesyge og eksperimenterende, når vi taler og skriver, og vi efterligner det, vi synes, lyder cool. Nogle gange direkte: Forleden gik jeg bag ved en børnehave på udflugt og nåede at høre tre forskellige femårige sige “oh, my god!”, inden flokken drejede om hjørnet. Andre gange med ironi i stemmen: “Jeg har din ryg,” siger jeg ofte selv, vel vidende, at det er planket direkte fra “I’ve got your back”. Og andre gange igen måske helt ubevidst, som når vi pludselig står op for noget, vi tidligere støttede.
Men betydning har maskinerne, det er jeg ikke i tvivl om – af den simple grund, at de er konstant i brug. Vi læser maskinoversatte tekster hele tiden, mere eller mindre bevidst – på nyhedsportaler, på hjemmesider, på sociale medier, og når vi lige skal have et hurtigt overblik over en fremmedsproget tekst. Det kan ganske enkelt ikke undgå at påvirke os, for vi er bygget til at lade os påvirke af det sprog, vi præsenteres for. “Og hvad så?” vil læseren måske spørge, og jeg vil igen svare: “Så ikke noget. Det bliver, som det bliver, og kommunikationen går ikke under af den grund.”
Men vi har maskinen med i bagagen, når vi skriver nyt, og når vi tjekker gammelt. Og nu behøver vi principielt set ikke længere at skrive nyt overhovedet – vi kan bare tjekke det, AI’en skriver eller oversætter for os. Hvad får det af konsekvenser?
Det var egentlig det, afsnittet her skulle handle om. Nu er optakten løbet af med mig. Jeg forsøger igen næste gang.
16. juli 202
11. Hvad sker der, når man fodrer maskinen med maskinen? II
Selvsving er det korte svar, men noget lukket system bliver der selvfølgelig aldrig tale om. Som jeg skrev i afsnit 10, er det interessante spørgsmål jo, hvordan maskinen påvirker os og det input, vi efterfølgende kommer med. Hvordan bliver vores sprog?
Hidtil har jeg mest kigget på ChatGPT fra et dansk oversættersynspunkt. Det er dobbelt uretfærdigt, fordi det er et system, der a) slet ikke er bygget til oversættelse, eller for den sags skyld til at skrive tekster, og b) kun for alvor brillerer på amerikansk engelsk, hvor det kan skrive stort set fejlfrit, om end ret kedeligt, om det meste. Så hvis man vil kigge på den mest funktionsdygtige model, er det de amerikanske tekster, som ChatGPT selv skriver, man bør undersøge, og ikke oversættelse, for det er en proces, hvor maskinen stadig kommer til kort, medmindre der er tale om meget enkle opgaver. Så er det et problem at fodre maskinen med maskinen, hvis maskinens udgangspunkt faktisk er nogenlunde godt?
På (amerikansk) engelsk er AI’ens neurale netværk så stort, at det sjældent giver mening at tale om regulære sprogfejl. Derimod er det måske stil, man skal se på. Kig på de to tekster i rammen – den øverste er ChatGPT’s neutrale svar, den nederste dens forsøg på at skrive spændende.
Øverste tekst er lydefri set ud fra den prompt, jeg har givet maskinen: “What is the gist of Michael Pollan’s book The Omnivore’s Dilemma?” Sætningerne er enkelt opbyggede og relativt korte, alle ord er stavet korrekt, og kommaerne sidder, som de skal efter det amerikanske system. Den kan med andre ord bruges, som den er (indholdet fejler heller ikke noget – jeg har læst bogen engang, så jeg ved, at oplysningerne stemmer).
Nederste tekst er maskinens forsøg på at give teksten kulør, og den har da også fået fuld amerikansk ugebladsskrue. Teksten bugner af svulstige adjektiver (luscious, tantalizing, seductive), metaforerne snubler over hinanden (en rutsjebanetur gennem et filtret spind … hva’ba’?), og der er sågar en ægte smutter (the alluring allure).
Hvis jeg skulle redigere de tekster, er der ingen tvivl om, hvilken af dem, jeg ville vælge, selv ikke, hvis mit formål var at sælge Pollans bog. Det ville være nemmere for mig at peppe den enkle tekst op, end at afdæmpe den overpolstrede.
Men hvorfor ændre på den overhovedet, hvis den tjener sit formål? Her er jo tid at spare og dermed penge. Det er sågar en tekst, man trygt kan putte tilbage i maskinen.
Kunne man forestille sig en (amerikansk) verden, hvor teksterne faktisk bliver MERE formelt korrekte? Hvor for eksempel nyhedssproget måske er lidt gråt, men til gengæld er ekstra nemt for mennesker – og maskiner – at afkode? Hvor skoleelever og studerende giver pokker i sproget og koncentrerer sig om at tjekke indhold? For maskinen laver ikke slåfejl, den tegnsætter pålideligt, og den har aldrig problemer med at skelne mellem their og they’re. Maskinen har allerede et tilstrækkeligt amerikansk korpus til at levere den sproglige indpakning næsten problemfrit, og den kan også genkende de mønstre, der rækker ud over ord, rækkefølge og tegn.
For tekster følger jo mønstre. Indledning, skildring, afslutning. Introduktion, redegørelse, diskussion, konklusion. Mord, efterforskning, opklaring. Ingredienser, instrukser, serveringsforslag. Provokerende overskrift, rasende redegørelse, opråb til folket. Der er et utal af disse mønstre, og maskinen kan gennemskue dem alle sammen, hvis den har fået data nok.
Nærmer den sig på amerikansk en slags kritisk masse, som vil kunne fungere som et statisk sproglager, der kan genkombineres i det uendelige? Vil vi gå på kompromis med læseoplevelsen inden for visse genrer, f.eks. nyhedsjournalistik, hvis det betyder ubegrænset, billig adgang til dem? (Svaret er ja – det har vi allerede gjort). Kunne man forestille sig et frossent sprog, der netop IKKE udvikler sig, fordi vi har vedtaget, at det sprog, maskinen allerede rummer, er stort set tilstrækkeligt til at levere et billigt, pålideligt stillads for det indhold, vi vil putte i? Og hvordan vil det harmonere med det levende sprog, vi så ellers taler og skriver?
Vil vi begynde at forenkle vores ambitioner med tekster for at tækkes maskinen og slippe for at redigere for meget? Vil vi springe ting over, vi ved, maskinen har svært ved? Vil vi endda forsimple tekster ekstra meget, så de nemmere kan maskinoversættes til andre sprog? Vil maskinen ligefrem kunne skabe en slags forenklet, men nemmere oversætteligt lingua franca? Vil vi forme vores tekster, så de bevidst afspejler en bestemt holdning, fordi prompten afgør maskinens ordvalg og måske endda indholdsvalg? Vil kreative sjæle kunne spille bold med maskinens basissprog og gøre det til kunst? Vil forskere – eller kunstnere – opdage mønstre i sproget, de aldrig før har gennemskuet?
Og hvad vil vi lære om os selv undervejs? Der er så meget, maskinen kan, som vi ikke kan. Der er så meget, vi kan, som maskinen ikke kan. Vi er for længst vokset sammen, men det er ikke nogen symbiose, for maskinen har ikke noget ud af sin læring. Sproget er vores. Sproget påvirker kun os. Hvad vi vil med sproget er i sidste ende vores beslutning. Og hvis maskinen på sekunder kan levere et sprog, vi kan bruge, er der tre helt store spørgsmål, der i mine øjne trænger sig på (igen):
1. Indhold: Hvem bestemmer, hvilket indhold, maskinen leverer? Brugeren eller leverandøren? Kan man ytre sig frit, hvis bare man skriver de rette kommandoer? Hvordan undgår vi misinformation, og hvem bestemmer, hvad der er misinformation? Hvilke kilder trækker maskinen på, hvis man beder den skrive om en historisk begivenhed, f.eks. Trumps valgnederlag i 2021 og Stormen på Kongressen? Vil det ændre sig? Og hvem bestemmer i så fald det?
2. Uddannelse: Hvordan sadler vi som samfund om til en verden, hvor sproget er semiglobalt, men indholdet potentielt polariseret? Hvordan sikrer vi os læsefærdighederne til at begå os i en verden, hvor teksters troværdighed er truet? Hvordan sikrer vi os læsefærdighederne til at tjekke vores egne tekster, som vi lige har skrevet ved at trykke på en knap?
3. Hvad vil det koste? Hvem skal betale? Og hvem går pengene til?
***
29. juli 2023
12. Kontrafaktisk fremtid set fra navlen
Jeg er blevet lagt ned af arbejde og nedlægger derfor også mine AI-overvejelser. Der er ellers masser at skrive om endnu – pris, klimakonsekvenser og regulering, for eksempel, og måske først og fremmest det, der forhåbentlig er intelligensernes egentlige potentiale: mønstergenkendelsen, analysen, kondenseringen.
Men alt det ligger alligevel uden for mit specialeområde, så lad mig slutte cirklen her i håbet om, at nogen griber stafetten. Jeg slutter, som jeg begyndte: med uro over en ChatGPT-tekst om en person, der ikke er mig.
For en måneds tid siden snakkede jeg med en kollega om AI’ens stil – den der friske, optimistiske, sødladne tone, den er programmeret til. “Den skriver jo aldrig noget negativt,” sagde han. Det må efterprøves, tænkte jeg.
Så jeg gav den kommandoen: “Skriv en kritisk anmeldelse af den danske oversættelse af Claire Keegans novellesamling Walk the Blue Fields. Og den leverede varen (se billede) – i øvrigt i en tone, som om den ikke var vred, men skuffet.
Oversættelsen findes ikke – eller rettere, jeg var halvt færdig med den på det tidspunkt. Men det er ikke pointen.
Pointen er, at jeg blev ked af det – faktisk så ked, at jeg lagde oversættelsen til side og lavede noget andet de næste par dage. Og det selv om:
a) jeg selv havde bedt maskinen om teksten, og udtrykkelig bedt den om at være negativ.
b) jeg vidste, at oversættelsen ikke findes.
c) jeg vidste, at AI’en ikke skriver som sådan, men blot kondenserer mønstre fra et hav af andre kritiske anmeldelser af alt muligt andet.
Jeg vidste med andre ord, at det var løgn, og at jeg selv havde bedt om den løgn. Og alligevel blev jeg ked af det.
Det kan selvfølgelig skyldes mit sarte ego og velvoksne bedragersyndrom, men det tror jeg ikke. Vi kan simpelthen ikke lade være med at tillægge tekster betydning – faktisk er jeg i skrivende stund bange for, at også I skal tro på den forbandede tekst, selv om I har fået udtrykkeligt at vide, at den er en bevidst løgn, et eksperiment.
Og det er det, der skræmmer mig mest ved AI som sprogværktøj. Ikke, at journalister, forfattere og oversættere skal blive overflødiggjort. Ikke tyveriet af ophavsretten. Ikke den dalende sprogkvalitet eller ensretningen. Men at vi kan spytte en tekst ud om hvad som helst på bogstavelig talt to sekunder. Og tro på den, selv om vi egentlig ved bedre. At vi nu må aflære tilliden til tekster i et helt andet omfang end før.
Det tillidstab kommer til at forandre verden.