Textanalys

Min tidigare roll som systemutvecklare har åter trätt i tjänst. Med ChatGPT som programmeringskompis har jag tagit fram en applikation som analyserar en litterär text med avseende på:

  • Ordklasser (adjektiv, adverb, verb och pronomen)
  • Ord som kan vara onödiga
  • Statistik på ovanstående

Syftet är att hjälpa till med gestaltningen av en text. Anneli Holmsten, jag träffade under en gestaltningskurs i Skurup, har bidragit med förslag på funktioner och även en lista på ord som ofta är onödiga.

Applikationen är utvecklad i Python och använder bland annat Flask och Stanza. Den sistnämnda kan bland annat hitta ordklasser i en text men är inte hundraprocentig. Jag tycker den ger ett tillräckligt bra resultat.

Min arbetsgång:

  • Skriv en scen klar så att den i mitt tycke ser bra ut och klistra in den i textfältet i appen
  • Markera ordklass och onödiga ord
  • Ett högt procentutfall kan vara en indikation på att något behöver justeras
  • För varje ordklass/onödiga, gå igenom varje träff och fundera om ordet behövs över huvud taget. Kanske texten går att formulera om.

Notera att det är inte några idiotregler. Appen hjälper till att hitta ord i texten. Värderingen om de behövs eller ej måste man förstås göra själv.

Jag har roat mig med att analysera de 8000 sista orden i Kerstin Ekmans “Händelser vid vatten” och det gav följande resultat (jag använder det som “rikslikare”):

  • Adjektiv: 4.13%
  • Adverb: 8.84%
  • Pronomen: 16.48%
  • Onödiga ord: 19.33%

Appen körs på gratisvarianten av huggingface.co och kan gå ner i vila om ingen använt den på ett tag. Därmed kan det ta en stund innan den är uppe och kör igen.

Detta inlägg har följande resultat:

  • Adjektiv: 6.06%
  • Adverb: 5.15%
  • Pronomen: 8.18%
  • Onödiga ord: 16.36%

Prova här:

Leave a Reply

Your email address will not be published. Required fields are marked *