Analysera svenska ord frekvensmönster för effektiv textskrivning

Analysera svenska ord frekvensmönster för effektiv textskrivning

 

Att skriva bra svenska texter, det handlar väl i grunden om att hitta rätt ord för den som ska läsa. Man hör ibland att forskare menar att en ganska liten andel ord upprepas, ja, om och om igen, i nästan all text man stöter på – de där ovanligare orden står snarare för variation eller stil. Fokuserar man lite mer på hur de här frekvenserna ser ut, så verkar det ge en bättre känsla för uppbyggnaden, och, tja, hur texter faktiskt landar hos en läsare. 

Zipfs lag kommer ofta upp i diskussioner om svenska; det sägs att det vanligaste ordet är vansinnigt mycket vanligare än de mindre frekventa, ibland flera hundra gånger eller mer. Att känna till själva mönstret lär, för de flesta, förbättra både tydligheten och samtidigt öppna dörren till mer nyanserade texter. När språkforskare samlar statistik utgår de, nästan slentrianmässigt, från ordens frekvens och varianter.

Frekvensmönster i svenska texter


En hel del statistik tar avstamp i ett slags kärna av funktionella ord. Det handlar om exempelvis artiklar, prepositioner, konjunktioner och – kanske främst – pronomen. Tänk bara på sådant som “och”, “i”, “det”, “som” samt “att”. Enligt Språkstatistik (Wikipedia) utgör de cirka 50 vanligaste orden drygt hälften av ordanvändningen i svenska dagstidningar. Det innebär att majoriteten av en genomsnittlig text består av samma orduppsättning, oavsett om det gäller handböcker, romaner eller artiklar om online casino

Så, går man efter Zipfs lag, då hamnar mönstret någorlunda så här: det främsta ordet är ungefär dubbelt så vanligt som det därpå följande, och det fortsätter nedåt ganska snabbt. Kelly-listan, tror jag, används ofta för språkinlärning – där får man snabbt bekräftat att om man klarar av de 1500 vanligaste orden, så har man faktiskt greppet om runt tre fjärdedelar av textinnehållet. Det gör, om inget oväntat sker, både läsning och skrivande betydligt enklare i bredare sammanhang.

Vad betyder ordvariation för textens effekt?


När man diskuterar saker som stil eller läsbarhet, så dyker ofta termer som Type/Token Ratio (TTR), OVIX och OVR upp. De här måtten ger någon slags uppfattning om hur många olika ord man använder i förhållande till total ordmängd. Om variationen blir hög, då signalerar det ofta bredare ordförråd och mindre slentrianupprepning – men konsekvensen kan förstås bli att vissa texter, typ om casino eller teknik, känns svårare att tillägna sig, i synnerhet för ovana läsare. Samtidigt, om man överdriver användningen av krångliga eller ovanliga ord, riskerar förståelsen att ta stryk. 

Det finns lärarhandledningar i språkstatistik som faktiskt förespråkar det enkla, med fler funktionella ord snarare än för mycket mix. Texter som riktar sig till många, ja där vinner det enkla brukar man säga, men visst: vissa mer avancerade texter skulle nog falla platt utan lite variation och kanske en gnutta komplexitet. Läsbarhetsindex, LIX, säger för övrigt att kortare meningar kombinerat med få långa ord gör svenska texter lättare att ta till sig. Och så är det ju lite speciellt, att de vanliga småorden ger struktur, rytm, och rentav håller ihop de där längre, jobbigare partierna.

Att anpassa ordval efter målgrupp och syfte


Det skiljer rätt mycket mellan olika strategier när det gäller ordval – målet ändrar spelreglerna. Är det elever eller kanske bara läsare i största allmänhet man riktar sig till, då är det nog klokt att satsa på ett urval av vanliga och begripliga ord, gärna i något varierad tappning.Det finns flera argument för enkelhet, och man märker ju snabbt att enkel betyder allt annat än sämre.

Snarare tvärtom; faktatexter eller instruktioner funkar oftast bäst med stabila, återkommande funktionella ord för att folk ska fatta direkt. Men rör det sig om en nischad text – för experter eller, ja, väldigt insatta läsare, ofta inom casino – då kan det funka att ta ut svängarna lite med både terminologi och variation. Det handlar hela tiden om att hitta rätt tonläge: går man för hårt på variationen blir det svårt att hänga med, men drar man åt andra hållet kan texten bli ganska slätstruken och folk tappar intresset. 

OVIX-värden någonstans mellan 30 och 45 anses vara lagom enligt vissa bedömningar av svenska texter, men säkert råder det delade meningar. Att testläsa innan man skickar ut texten känns för övrigt som en vettig idé.

Sammanfattning av strategier för bättre svenska texter


Rätt ord är grundstenen – antalet ord man verkligen behöver är inte alltid så högt som man kanske tror. Försök hålla dig till de 50 till 1500 vanligaste svenska orden som bas, det räcker ofta långt. Kasta in lite försiktig variation efter behov, och glöm inte att hålla koll på meningslängden så att LIX-indexen inte sticker iväg över huvudmålgruppens nivå. Texter inom casino och liknande områden kräver ibland fler facktermer, men innehållet vinner på funktionella ord och tydlig struktur. 

Frågan om anpassning mot läsarnas nivå kan nog aldrig underskattas – det är egentligen den detaljen som i slutändan påverkar resultatet mest. Ta för vana att kika på texten med jämna mellanrum, justera enligt vad statistiken säger, och räkna inte med att det någonsin blir ett helt färdigställt facit – det brukar alltid gå att slipa lite extra runt kanterna.


Posted

in

by

Tags: