“Maskinerne kommer, men problemet er os”

Opdagelser og overvejelser fra en praktikers skrivebord, del 1

Signe Lyng. Foto: Helle Moos

I forsommeren i år, mens debatten om såkaldt kunstig intelligens i kulturbranchen begyndte at tage fart, satte oversætter og Babelfiskredaktør Signe Lyng sig for at kigge nærmere på fænomenet, åbent og nysgerrigt, og fra så mange forskellige vinkler som muligt. For teknologien kommer til at betyde ændringer for litterær oversættelse og dens udøvere, det er der ingen tvivl om.

Over de følgende uger lagde Signe sine opdagelser og overvejelser på Facebook. Babelfisken har nu samlet alle opslagene – første del kommer her.

12. maj 2023

Teksterne på de to nedenfor billeder er fra OpenAI’s chatbot ChatGpt3. Den ene handler om oversætteren Signe Lyng. Den anden handler om oversætteren Rasmus Eckardt. Der er bare ét men: Rasmus er kunstgrafiker og blændende dygtig, men oversætter har han aldrig været.

Det er med andre ord to helt tomme tekster. Ingen af dem beskriver nogen virkelig oversætter. Ingen af dem har noget egentligt indhold – kun en efterligning. Men vi tillægger dem indhold, intention, mening.

Ja, maskinerne kommer, men problemet er os.

Det handler om sprog, men først og fremmest om alt det, der følger med sproget. For big tech har tilsyneladende knækket koden: I årevis har vi grinet ad Google Translates ubehjælpsomheder, men nu har vi pludselig apps, der ser ud til at kunne føre samtaler og skrive tekster på stort set perfekt dansk. Programmerne bag er, hedder det sig, for komplekse til at kunne beskrives, endda for komplekse til, at udviklerne selv ved, hvordan de fungerer, men grundprincippet er mønstergenkendelse, og den er der i hvert fald ingen tvivl om, har taget et kvantespring det seneste års tid.

Sproget er ikke længere tydeligt ubehjælpsomt. Det ser ægte ud, og her kommer det egentlige problem – med os, ikke med maskinen. For vi har ikke sproget til at tale om sådan et program. Vi er endda blevet præget på forhånd med selve betegnelsen: kunstig intelligens. Ikke en sprogefterligner. Ikke en mønstergenkender. En intelligens. En slags væsen. Noget, der tænker. Og tænkende væseners tekst og tale har vi et sprog til at beskrive. De finder på. De svarer. De digter. De lyver. Vi tillægger dem med andre ord motiver – til at snakke os efter munden eller føre os bag lyset. Revolutionere vores arbejde. Tage vores jobs. Frelse verden. Lægge verden øde.

Og hjælpe eller ødelægge verden kan mønstergenkendelse muligvis godt, men begge dele bliver ved vores mellemkomst. Og vi skal tilpasse os i rasende fart, hvis vi vil sikre det første. For indtil videre kan vi ikke lade være med at lade os rive med. De overbevisende formuleringer løber om hjørner med os – vi kan simpelthen ikke tro andet, end at der er nogen i den anden ende. For det har der jo hidtil altid været, når nogen skrev til os eller for os.

Vi skal op på hesten i en helvedes fart. Vi skal lære at genkende kønsløst pseudosprog. Vi skal lære at tøjle vores egen iboende tillid til tekster. Vi skal lære at se igennem et tykt lag ligegyldig staffage til afsenderen bagved. Som er et menneske. Altid et menneske.

17. juni 2023

AI-tankerne vil ikke rigtig slippe taget i mig.

Hidtil har mennesker skrevet med maskiner som hjælp. Nu skriver maskiner med mennesker som hjælp. Langtidsvirkningerne – de gode og de dårlige – er svære at spå om, men nutidsvirkningerne er værd at kigge nærmere på. Det gør jeg i løbet af de næste par uger med udgangspunkt i det allerede godt slidte trick, der går ud på at bede ChatGPT kompilere, hvad andre har skrevet om AI og oversættelse.

Om AI’en har “ret” eller ej bliver ikke diskuteret. Den har hverken ret eller uret – den sammenfatter, hvad mennesker har skrevet. Det, jeg gerne vil kigge på, er kvaliteten af det produkt, man får, og konsekvenserne ved at bruge det. På godt og ondt.

Så dette er en teaser – folk, der har fået rigeligt med AI-snak herfra, kan med fordel ignorere mig det næste stykke tid.

***

18. juni 2023

1. Sprog?

Nu skal det her ikke udvikle sig til en højpandet afhandling, men lad mig alligevel lige hurtigt sige noget om, hvordan jeg ser på kommunikation og sprog. Ganske kort:

Vi vil gerne kommunikere – og vi vil bære over med meget for at komme til det. Almindelige mennesker sidder ikke og gennemanalyserer de tekster, de læser. Vi læser, fordi vi er nysgerrige, vil have noget at vide, vil opleve noget. Vi lader normalt ikke en slåfjel et glemt komma, en anglicism eller en kalkering kaste en skruenøgle i maskineriet, når vi læser (vel?). Men bliver der for mange af dem, kuldsejler kommunikationen, og så bliver vi pludselig opmærksomme på teksten, ikke budskabet (ikke?).

God kommunikation handler med andre ord om at bruge det sprog, man når sine modtagere med, og gøre det godt nok til, at de lytter til, hvad man siger, ikke hvordan man siger det. Altså så gnidningsløst som muligt, medmindre man bevidst vil provokere.

Men læsere er mangfoldige, og de læser af mange forskellige grunde. De er unge eller gamle, de er på arbejde eller holder fri, de skal til eksamen, de er vrede, de har en lang uddannelse de er stolte af, de har en dansklærer de hadede.

Og skrivere er lige så mangfoldige og skriver af lige så forskellige grunde. De vil sælge, oplyse, overbevise, underholde, undre osv.

Dertil kommer, at sproget udvikler sig, med læserne og med skriverne. Lige nu vælter engelske ord og vendinger for eksempel ind i dansk (det vender vi tilbage til), og standse dem kan vi ikke. Det skal vi heller ikke – men vi skal være opmærksomme på, hvornår vi bruger dem, og hvem vi bruger dem over for, ligesom vi skal med alle sprogets for længst vedtagne ord. Det er ikke ligegyldigt, hvem man er, og det er ikke ligegyldigt, hvem man skriver til.

Så at skrive, og oversætte, godt er at kende sin læser – hende den lækre, ham kollegaen, fodboldholdet, borgerne i kommunen, danske kvinder over 60, hele verden – og bruge det sprog, der bedst tjener det, man vil sige. (For en oversætter er “man” selvsagt forfatteren – det vender vi sikkert også tilbage til).

Det er mit sproglige ståsted, hvis en oversætter kan siges at have ét sprogligt ståsted. Herfra mit udsyn går.

19. juni 2023

2. Det ser da meget godt ud

Nå, men AI-teksten fra forleden: Ved et overfladisk kig virker den ret god – skræmmende god, ville nogen måske sige. Det ligner dansk, og opsummeringen af problemerne er da også umiddelbart glimrende, så lad os kigge på første punkt:

Alle tekster, også denne, har en stil. Jeg ville kalde den for kønsløst, vagt mærkeligt opgavesprog. Inden længe tror jeg, vi vil kalde den AI-sprog, for meget af det, ChatGPT leverer, ser sådan ud. Det må skyldes, at en stor del af databasen bagved består af halvakademiske fagtekster, der sikkert ikke er kedelige i sig selv, men har en masse ord og vendinger til fælles, som i renset form kommer til at optræde sådan her.

Men en del af den stil, det særpræg, har også at gøre med, at AI’ens grundsprog er engelsk. Som oversætter kan jeg se strukturen omme bagved – mon ikke vi er heromkring:

Loss of nuance and style: AI translations may struggle to retain the nuance and style that a human translator might add to a text. Literary works often have unique linguistic features, imagery and poetic elements that may be lost in an AI translation.

Sætningerne følger stort set samme mønster på de to sprog. Oversættelsen udnytter ikke de ting, dansk kan, som engelsk ikke kan (vi kunne for eksempel skrive nuancetab i stedet for tab af nuancer), leverer kluntede løsninger på de ting, engelsk kan, som dansk ikke kan (svært ved at bevare de nuancer og den stil – struggle to retain the nuance and style), og flytter ikke om på nogen led eller punktummer.

En god oversætter vil skrive teksten på ny med en læser i tankerne. 10 sekunder i denne oversætters hoved:

Nuance- og stiltab

– nej, vent, stiltab er svært at læse.

Stil- og nuancetab? Hmm, måske stadig svært, okay, drop det,

Stil og nuancer går tabt?, jo, måske, hvis det kan integreres med resten af listen, jeg lader det stå indtil videre.

AI-oversættelser kan have svært ved … Hva’? En oversættelse kan ikke have svært ved noget,

AI-oversættelser kan miste stil- og nuancetræk, ja, bedre og kortere, og ordene er allerede etableret, fint.

som en menneskelig oversætter kan føje til teksten … forsyne teksten med? Uanset hvad er det noget vrøvl. Oversættere forsyner ikke teksten med stil og nuancer – de forsøger at overføre stil og nuancer. Men det er, hvad der står.

Osv. Osv. Stil, ordvalg og betydningsovervejelser kan ikke skilles ad, men udgør et samlet hele, og oversætteren konfronteres i meget højere grad end læseren med tekstens manglende sammenhæng. Lagde du ved første øjekast mærke til, at sproget haltede? Nej, vel? For du var optaget af at kommunikere, ikke analysere. Oversætteren oversætter ikke bare – hun er samtidig et effektivt nonsensfilter. Det vender vi HELT sikkert tilbage til.

Men først bliver vi ved stilen, for det er et af de steder, hvor AI måske faktisk har sin berettigelse som værktøj. En tilstrækkelig stor AI vil kunne grave ting frem på sekunder, som en oversætter vil skulle slås med længe. Det kigger vi på i morgen.

20. juni 2023

3. Bro it to the max!

Jeg vil helst være oversætter, ikke redaktør af maskinoversatte tekster, og jeg vurderer ikke, at fremskridtet overhaler mig lige foreløbig – det vender vi tilbage til. Men det betyder ikke, at ChatGPT ikke kan bruges til noget.

Principielt – meget principielt – kan en AI-sprogmodel indeholde alle tekster i verden. Vi ser lige bort fra etik, copyrightlovgivning og elregning. Og det betyder, at den så at sige har lagre af stiltræk liggende, man kan hente inspiration fra. Teksten på billedet her (som jeg har hugget fra en Subreddit) viser en veloplagt ChatGPT, der giver den som bro – selv om jeg er sikker på, at bros anno 2023 vil mene, at den er pænt cringe, eller hvad det nu hedder i denne uge.

For oversættere kan det potentielt være en guldgrube. Ikke fordi vi kan bruge ChatGPT til at oversætte:

“Ingen bekymringer, broseidon. Jeg er din ultimative wingman, klar til at smide nogle vidensbomber. Hvis du er tørstig efter mere hjernebrændstof eller har brug for nogle seje råd, så bare råb, broski. Jeg er klar og parat til at være din go-to bro for al hjælp. Lad os knuse det sammen, broseph!”

Men fordi vi kan hente inspiration i den slags tekster. Hvis nu – hvis nu! – man for eksempel puttede udskrifter fra danske reality shows ind i en database, ville man få et datasæt, der ligger langt fra det rigsdanske. Tænk, hvis man kunne hente det ved et tryk på en knap! (Ja, tænk, hvis man bare kunne optage ungdommen, alderdommen, overklassen, underklassen overalt hvor de gik og stod – hov, vent …).

Men der er vi ikke. Der er vi overhovedet ikke.

Jeg lavede et lille forsøg med AI’en. Gadedansk er ikke bro-sprog, men det var, hvad jeg lige kunne finde på. Uanset hvad var den pinligere end selv den værste ung med de unge-onkel:

S: kan du tale gadedansk?

ChatGPT: Ja, jeg kan forstå og tale gadedansk. Gadedansk er en slangfuld og uformel form for dansk, der ofte bruges i bestemte sociale grupper og miljøer. Hvad vil du gerne tale om på gadedansk?

S: piger

ChatGPT: Helt i orden! Hvad vil du gerne vide eller tale om vedrørende piger på gadedansk?

S:deres udseende

ChatGPT: Når vi taler om piger og deres udseende på gadedansk, kan det handle om forskellige emner som stil, tøj, hår, makeup osv. Hvad vil du gerne diskutere specifikt vedrørende piger og deres udseende?

S: tal nu bare gadedansk!

ChatGPT: Alrigt, min ven! Vi skal snakke om udseendet på tøser. Altså, der er mange forskellige slags piger, og de har allesammen deres egen stil og look. Nogle piger er “babes” og ser bare for godt ud, mens andre er mere “edgy” med deres tøjvalg og piercinger. Nogle går all-in med makeup og har øjne, der er så skarpe, at man kan skære sig på dem, mens andre foretrækker et mere naturligt look og er stolte af deres “nofilter” vibes. Det er også vigtigt at huske, at skønhed kommer i alle former og størrelser – der er ingen regler for, hvordan man skal se ud for at være smuk. Så husk at give plads til alle slags piger og vær ikke bange for at udtrykke dig selv på din egen måde!

Ja, husk endelig at give plads til alle slags piger, og vær ikke bange for at udtrykke dig selv på din egen måde! Men bemærk, at vi allerede hvad det almindelige talesprog angår, er ude i randområdet for AI’ens formåen. Det skyldes, at dens danske datasæt stadigvæk er forsvindende lille. Så der er ikke meget inspiration at hente, eller i hvert fald bedre steder at hente den. Sådan bliver det muligvis ikke ved med at være – men hvorfor er vi så opsatte på at få den til at oversætte allerede nu?

22. juni 2023

4. Maskinen ved ikke alt – men det gør vi heller ikke

Jeg pirker til ChatGPT for at finde ud af, hvor langt dens database rækker, og hvilke fejl den begår. En af de vendinger, der er på vej ind i dansk gennem lidt for sløset oversættelse, er føde ind i, fra feed into, der betyder give næring til/understøtte/farve/bidrage til. Det er en metafor, der har med flodløb at gøre – små vandløb, der flyder ud i større – men den findes ikke på dansk, og travle tekstfolk ser åbenbart noget med fødsel for sig.

Så hvad siger AI’en? Jeg fandt et eksempel fra en avisoverskrift:

The Guardian:

Trump’s hateful rhetoric feeds into age-old west v Islam narrative

ChatGPT:

Trumps hadefulde retorik bidrager til den gammeldags fortælling om Vesten mod islam

Bestået! Og for øvrigt et solidt skridt op fra gamle Google Translate:

Trumps hadefulde retorik fødes ind i den ældgamle fortælling om vest og islam

Man kan godt forstå, at verden er imponeret over den sprogmodel! Læg f.eks. mærke til, hvordan den ubesværet får afkodet, at det enlige v står for versus.

Men hov! Den gammeldags fortælling? Der går det galt for GPT’en! Age-old betyder ældgammel, ikke gammeldags. Den kobling mangler åbenbart stadig i dens danske database.

Eksemplet peger på nogle problemer – med os, ikke med maskinen. For hvordan vurderer vi, hvad der er skidt, og hvad der er kanel? I gamle dage var oversætterens konstante dilemma, at ordbøger fungerer bedst, når man allerede kender det ord, man slår op. For hvordan bruger man et udtryk, man aldrig før har hørt, nogenlunde sikkert? Det dilemma lever i bedste velgående, men nu med hele tekster: Vi sætter en maskine til at oversætte, og kvaliteten vurderer vi bedst, hvis vi lige oversætter teksten selv for at tjekke. Det er ikke ligefrem tidsbesparende.

GPT’erne – sprogmodellerne – bliver bedre i rasende fart, selv på så små sprog som dansk, så resultaterne kommer til at se mere og mere overbevisende ud. Hvordan sikrer vi, at de sidste misforståelser bliver fanget?

For der er jo det problem med os, at vi heller ikke er perfekte sprogbrugere. Faktisk er vi rent hukommelsesmæssigt maskinerne så underlegne, at det nærmest er pinligt (siger oversætteren, der må slå visse ord op igen og igen og igen og alligevel aldrig kan huske dem næste gang). Selv den bedste oversætter i verden begår fejl eller skriver svagt hist og pist, og stort set hundrede procent af os er ikke den bedste oversætter i verden.

I forlagsverdenen har man et tredobbelt sikkerhedssystem på plads: oversætteren, redaktøren og korrekturlæseren. Tilsammen skal de gøre teksten så perfekt som muligt. Men hvad nu, hvis oversætteren er helt ny, redaktøren stresset og korrekturlæseren dårlig til sit arbejde? Det er ikke noget tænkt eksempel – alle tre led varetages af freelancere i dag, kombinationerne er uendelige, og alle oversættere – og forlagsredaktører – ved, at man nogle gange trækker ikke bare én, men tre nitter i lotteriet.

Hvad gør man, når man har middelmådige mennesker til at tjekke middelmådige maskiners arbejde? Lige nu træner vi maskinerne til at blive bedre, og det skal nok hjælpe inden for nogle felter. Til gengæld træner vi ikke menneskene længere. Sprogfagene falder væk, og både engelsk- og danskuddannelserne beskæres. Hvad nye oversættere angår, er de økonomiske udsigter desuden så dystre, at man skal være gal eller idealist for at vælge det levebrød.

Big Techs svar synes at være: Det kan maskinen løse. Hvilket rejser spørgsmålet: Hvad sker der, når man begynder at fodre maskinen med maskinen?

24. juni 2023

5. Intermezzo

Hør lige, sagde en læser forleden, du sætter ChatGPT på alle mulige umulige opgaver i din iver efter at bevise, at det er ubrugeligt – det er ikke retfærdigt.

Det har jeg tænkt en del over. Jeg er ikke blind for de muligheder, der ligger i ChatGPT som redskab, men som oversætter – oversætter! – er min grundholdning i dette nu, at det kræver absurd gode og vågne folk at bruge ChatGPT som dansk oversættelsesværktøj og at det ikke nødvendigvis sparer tid. Det kan muligvis ændre sig – lidt, i hvert fald – hvis vi har råd og får løst nogle ophavsretsproblemer.

Men det, der fik mig i gang med det her projekt, er, at systemet for længst er i brug, også til litteratur. Litteratur er det, jeg ved mest om, og inden for det snævre felt ser jeg meget få løsninger og enorme problemer, for ikke at tale om et styrtdyk i honorarer. Og det er ikke, fordi vi har fået et hjælpemiddel, der kan levere et godt resultat på en tiendedel af tiden, men fordi vi bilder os ind, at resultatet er nogenlunde og kan pudses af i en håndevending.

Foto: Dan Dumitriu, Unsplash

Men, sagde kritikeren – med rette – menneskelige oversættere er jo ikke nødvendigvis bedre!

Og det er helt rigtigt. Der findes klamphuggere i alle brancher, og lur mig i øvrigt, om ikke nogle af dem tyer til maskinoversættelse indimellem for at spare tid. Litterær oversættelse er svært at komme i gang med og stort set umuligt at leve af. Nogle steder er honorarerne så lave, at den faktiske timeløn er tocifret(!), hvis man ikke snyder lidt.

Løser ChatGPT det problem? Nej. I hvert fald ikke før vi når det illusoriske punkt, hvor maskinen leverer fejlfri oversættelser – hvilket den aldrig kommer til, for dens database består af menneskesprog, og vi er, som vi lige har slået fast, af og til en flok klamphuggere. Så lige nu flytter vi bare problemet: De potentielt elendige (eller de helt nye) oversættere bliver nu hyret som redaktører af AI-oversættelser. Hvad tror vi, det fører til?

Litteraturen har en række underkendte genrer – krimi, spænding, kærlighed, børnebøger – som mange mener, ikke er så svære. De følger groft sagt enkle plotmønstre, har et begrænset ordforråd og undgår stilistiske krumspring og eksperimentelle fiksfakserier. Folk læser dem for underholdningens skyld og stiller ikke så store krav, bare sproget er nogenlunde korrekt, tænker nogle profitbevidste forlag. Og de har sådan set noget at have det i, for særligt streamingmarkedet virker helt umætteligt i øjeblikket. Men maskinoversat fornøjelseslitteratur er en blandet fornøjelse – det kigger vi på de næste par dage.