Kan AI bevisa vem som skrivit?

Lagom till Bokmässan kunde vi läsa om misstankarna att en bok i Camilla Läckbergs produktion inte var skriven av henne utan av någon annan, en spökskrivare. Vi kunde också läsa att en AI-robot kommit fram till detta. Kan AI göra något sådant?

Det här är en debattartikel. Åsikter och idéer som framförs är skribenternas egna. Vill du svara eller har du synpunkter på debattartikeln? Mejla till: debatt@gp.se

ANNONS
|

Att en sådan misstanke sedan leder till kontroverser är givet. Om någon till äventyrs skulle hävda att jag inte skrivit den här spalten, skulle jag naturligtvis upprört förneka detta.

I själva verket är det inte något speciellt märkvärdigt AI uträttat. Det är kort och gott ett datorprogram som söker igenom ett stort antal texter.

När jag nyss skrev in ordet författarbestämning i datorns sökmotor, fick jag 2 460 träffar på 0,26 sekunder. Detta är i sig märkvärdigt, även om vi börjar bli vana vid effektiviteten i sådana här sökningar.

Man kan roa sig med att föreställa sig en armé av små tomtenissar som på en halv sekund lyckas söka igenom alla i Sveriges bibliotek. Snabbheten är enorm.

ANNONS

Det här med författarbestämning är emellertid inte något nytt utan något man ägnat sig åt långt innan det fanns datorer. Men då fick man arbeta för hand.

Ett känt exempel i Sverige är den så kallade Helanderaffären på 1950-talet. Vid en biskopstillsättning cirkulerade ett antal anonyma brev med ärekränkande påståenden om några av kandidaterna till tjänsten. En av kandidaterna, Dick Helander, anklagades för att ha skrivit breven.

Tekniken var att jämföra hur diverse småord användes i de anonyma breven jämfört med hur den misstänkte själv brukade skriva, till exempel om det stod inte, icke eller ej i texterna. Allt gjordes för hand.

Om vi går till dagens svenska texter, kan man jämföra saker som ner/ned, bägge/båda, tillbaks/tillbaka, denna/den här, för de som/för dem som och en del annat i valet av formord. Andra användbara mått är genomsnittlig meningslängd, frekvensen av kommatecken och utropstecken eller antalet så, ju, väl, nog och kanske per tusen ord.

Idén bygger på att människor är konsekventa i valet av formord. När man funderar på lämpligt ordval, handlar det om innehållsord som substantiv, verb och adjektiv.

Termen stilometri används i dag för datorprogram som visar hur en författare använder språkliga detaljer. Sedan jämför man detta med hur detaljerna används i den text man vill undersöka.

ANNONS

Nu vet jag inte vilka språkliga detaljer som användes i den nämnda undersökningen av Camilla Läckbergs texter, men något av ovanstående bör ha varit med. Den här typen av författarbestämningar är oerhört mycket enklare och snabbare i dag.

Men precis som förr fordras det en mänsklig hjärna som till sist bedömer om en viss person skrivit texten eller inte. Datorn serverar ett statistiskt underlag för bedömning.

Den här stilometriska tekniken kan emellertid med fingerfärdig programmering också användas åt andra hållet. En spökskrivare kan då be programmet skriva om en text så att den överensstämmer med Camilla Läckbergs, Kerstin Ekmans eller Jan Guillous sätt att skriva.

Grundstrukturen i berättelsen är man fortfarande tvungen att skapa själv.

Lars-Gunnar Andersson, professor i modern svenska

ANNONS