Bokstavrim og brøkdeler. Hvor ofte allittererer vi?

1. Innledning

Metrikken springer ut av språket. At språk er rytme, er tydelig helt fra den tidlige rytmiske interaksjonen mellom mor og barn til de utviklede setningenes jevne tidsintervaller – trykkbasert i noen språk, som norsk, stavelsesbasert i andre språk, som fransk, lengdebasert i atter andre.

Men er språk også rim? Er versenes rim også en regularisering av noe vi allerede finner i språket?

Bokstavrim eller allitterasjon er en klassisk rimtype karakteristisk blant annet for norrøn og annen gammelgermansk poesi, der allitterasjonen fulgte faste og strenge mønstre. Et eksempel er en ljodahått-strofe funnet som runeinnskrift på Bryggen i Bergen. I ljodahått skal en trykkstavelse i første linje stavrime med første trykkstavelse i annen linje, og så skal det være stavrim mellom to trykkstavelser i tredje linje:

Sæl(l) ek þá þóttumk,
er vit sátumsk i hjá,
ok komat okkar maðr á meðal.

‘Jeg syntes meg sæl
da vi satt  sammen
og ikke et menneske kom mellom oss.’

Det blir ofte påpekt at ordtak og faste vendinger i moderne norsk og andre språk har en tilbøyelighet til å allitterere. Hvor sterk er denne tilbøyeligheten – kan det tallfestes? Hvor mye oftere forekommer allitterasjon enn man skulle vente hvis det ikke fantes noen tilbøyelighet til å velge allittererende ordsekvenser?

I dette innlegget skal vi begrense oss til å se på koordinering av to enkle substantiver (uten adjektiver eller andre tillegg). Innenfor denne konstruksjonstypen finnes det en god del faste vendinger: sans og samling, vær og vind, kunst og kultur, ny og ne, mål og mening, munn og mæle, hud og hår, liv og lære, hui og hast, skuffer og skap, vitende og vilje, osv. Men ikke alle slike faste vendinger allittererer: sett og vis, saker og ting, fred og ro, liv og helse, kjøtt og blod, tid og rom, osv.

Hvis vi vil undersøke hvor ofte allitterasjon opptrer i slike uttrykk, blir det et problem å avgrense såkalte «faste uttrykk» fra koordinasjoner mellom to enkle substantiver i sin alminnelighet, på en tilstrekkelig presis måte til at statistikk blir informativ. Uavhengig av dette problemet kan det også være av interesse å undersøke tilbøyeligheten til å allitterere i uttrykk som ikke tilhører denne gruppen av faste vendinger. Man kan tenke seg i hvert fall to grunner til en eventuell tendens til allitterasjon. For det første kan det være at allitterasjon i faste uttrykk er noe av det som har bidradd nettopp til at de har festet seg og blir husket og gjentatt. For det annet kan man tenke seg at vi som språkbrukere har en tendens til å allitterere når anledningen byr seg. Hvis det siste er tilfellet, venter vi å finne en overvekt av allitterasjon også i koordinasjoner som ikke har etablert seg som faste uttrykk. Vi skal derfor se på hele mengden av koordinasjoner av nevnte type i vårt korpus NorGramBank.

2. Avgrensning og søk

(a)  Koordinasjoner med allitterasjon

Vi skal søke etter koordinerte substantiver med ulike konjunksjoner (og, eller osv.) der ingen av substantivene har tilknyttede bestemmere, adjektiver eller andre fraser. Det utelukker f.eks. eksempler som mindre forurensning og mindre kø, lokalsamfunnet og de regionene de betjener, osv., og inkluderer bare eksempler av den typen som er nevnt i innledningen (med og uten allitterasjon). Dette betyr koordinasjoner med c-struktur (trestruktur) som i Figur 1, der NP-nodene ikke forgrener seg. (NP = nominalfrase.)


Figur 1: Frasestrukturen i en enkel koordinasjon av substantiver

Vi begrenser oss videre til koordinasjoner der begge substantivene begynner på konsonant – ikke fordi alliterasjon med vokaler er irrelevant, men fordi den har litt andre regler enn konsonant-allitterasjon, ettersom det først og fremst er ulike vokaler som allittererer (åker og eng), og vi behøver ikke å ta høyde for den komplikasjonen for å studere tallforholdene mellom allitterasjon og manglende allitterasjon. Vi begrenser oss da til følgende 15 konsonanter:

b d f g h j k l m n p r s t v

Vi søker i hele trebanken NorGrambank (ca. 70 mill ord); delene den består av (aviser, sakprosa, skjønnlitteratur, stortingsforhandlinger, drøyt ti prosent nynorsk), beskrives på denne siden. Søkeuttrykket som plukker ut allittererende tilfeller med strukturen i Figur 1, beskrives nærmere på siden Søk etter allittererende koordinasjoner. Dette søkeuttrykket finner koordinasjoner der de to substantivene har samme initiale konsonant i skrift. Dette kommer til å omfatte en del eksempler der de likevel ikke allittererer, først og fremst ved substantiver på gj- og hj-, som ikke allittererer med andre substantiver på g- eller h-, men med substantiver på j-, og tilsvarende ved substantiver på hv- og v-. Resultatet av søket er bearbeidet for å ta hensyn til dette. Vi står da igjen med ca. 11 960 forekomster av til sammen ca. 8 020 ulike koordinasjoner der substantivene allittererer. Vi tar utgangspunkt i formene i teksten og skiller mellom f.eks. bil og buss og biler og busser som ulike koordinasjoner. Tabell 1 viser de 8 020 ulike allittererende koordinasjonene sortert etter frekvens, med de hyppigste øverst.

Tabell 1:

Tabell over 8020 allittererende substantiv-koordinasjoner sortert etter frekvens

 

Innslaget av faste uttrykk er klart sterkere jo høyere frekvenser vi betrakter. Blant de 30 mest frekvente eksemplene finner vi de 19 faste uttrykkene rekke og rad, sans og samling, vær og vind, kunst og kultur, ny og ne, mål og mening, munn og mæle, penn og papir, hud og hår, liv og lære, hui og hast, skuffer og skap, vitende og vilje, fred og forsoning, fyr og flamme, himmel og hav, punkt og prikke, tang og tare, stokk og stein, med frekvenser mellom 139 og 24. Tabellen har en lang hale på hele ca. 6 860 eksempler med frekvens 1, og der er det langt mellom faste uttrykk. Men en nøyaktig grenseoppgang mellom faste uttrykk og vanlige produktive koordinasjoner er en vanskelig oppgave; frekvens i et finitt korpus kan ikke være det eneste kriteriet. Vi skal derfor ikke forsøke en slik grenseoppgang.

(b) Koordinasjoner med og uten allitterasjon

For å finne ut om allittererende eksempler er særlig hyppige, må vi sammenligne tallene for slike koordinasjoner med tallene for koordinasjon av to substantiver i sin alminnelighet, uavhengig av allitterasjon. Søkeuttrykket som finner alle slike koordinasjoner, er presentert i avsnittet 2. Alle koordinasjoner på siden Søk etter allittererende koordinasjoner. Søket finner ca. 87 820 forekomster fordelt over ca. 59 450 ulike eksempler. Tabell 2 viser de 3 418 mest frekvente av disse eksemplene, ned til og med frekvens 3:

Tabell 2:

tabell over de 3418 mest frekvente av alle 59450 koordinasjoner (med eller uten allitterasjon) av to substantiver

 

Vi ser at koordinasjoner som mor og far, mamma og pappa, kvinner og menn, sett og vis, menn og kvinner og liv og død, med mellom 591 og 195 forekomster, forekommer oftere enn de mest frekvente allittererende koordinasjonene (der den hyppigste, rekke og rad, forekommer 139 ganger). For å vurdere om det finnes en tendens til å velge allittererende koordinasjoner, må vi se på de globale tallene.

3. Er allitterasjon hyppigere enn vi skulle vente?

Hvis null-hypotesen er at allitterasjon ikke spiller noen rolle for valg av ord i en koordinasjon, venter vi at hver initialkonsonant i første konjunkt opptrer med seg selv som partner i annet konjunkt gjennomsnittlig like ofte som den opptrer sammen med hver av de øvrige 14 konsonantene. (Siden alle konsonantene er involvert som andrekonsonanter her, spiller ulik global frekvens av de enkelte konsonantene ingen rolle. At j- er generelt sjelden og derfor stiller svakt i konkurransen med de andre konsonantene som andrekonsonant etter j-, oppveies av at f.eks.  s- er spesielt hyppig og derfor stiller sterkt i konkurransen etter en initial s-, osv.). Nullhypotesens forventning, basert på det totale antall koordinasjonsforekomster 87 820, er da at hver av de 15 konsonantene opptrer med seg selv som partner  (87 820 : 15) : 15 = 390 ganger, som da er gjennomsnittet. Det faktiske antallet koordinasjonsforekomster med alliterasjon er, som vi så ovenfor, ca. 11 960. Det betyr at hver av de 15 konsonantene gjennomsnittlig faktisk opptrer med seg selv som partner 11 960 : 15 = 797 ganger, altså over dobbelt så ofte som nullhypotesens forventning, med en faktor på 797 : 390 = 2,04.

Dette bekrefter en tydelig overvekt av allittererende koordinasjoner. Men skyldes dette en levende tendens til å allitterere, eller bare at mange nedarvede faste uttrykk faktisk allittererer og derfor bringer tallene opp fordi faste uttrykk er spesielt hyppige? En måte å kontrollere dette delvis på, er å se bort fra frekvens ved den enkelte koordinasjonen og bare telle ulike koordinasjoner, altså typer. Av koordinasjoner generelt, med eller uten allitterasjon, finner vi som nevnt ca. 59 450 ulike. Med samme nullhypotese som ovenfor venter vi at hver av de 15 konsonantene opptrer med seg selv som partner i (59 450 : 15) : 15 = 264 ganger. Av allittererende koordinasjoner har vi ca. 8 020 ulike. Det betyr at hver konsonant opptrer med seg selv som partner gjennomsnittlig 8 020 : 15 = 535 ganger, igjen over dobbelt så ofte som gjennomsnittsforventningen, med en faktor på 535 : 264 = 2,03.

En annen måte å redusere innflytelsen fra faste uttrykk på, er å bare sammenligne koordinasjoner som har frekvens 1, altså forekommer bare én gang hver. Kandidater til ‘faste uttrykk’ er sjeldnere jo lavere frekvens vi står overfor. Vi finner ca. 51 280 koordinasjoner med frekvens 1. Av disse er ca. 6 860 allittererende. Med samme utregning som ovenfor er den gjennomsnittsbaserte forventningen at hver konsonant opptrer med seg selv som partner (51 280 : 15) : 15 = 228 ganger, mens de faktisk gjør det gjennomsnittlig 6 860 : 15 = 457 ganger, denne gang overvekt med en faktor på 457 : 228 = 2. Dette gjør det ikke urimelig å opprettholde hypotesen om en generell tendens til allitterasjon (og dermed forkaste nullhypotesen om bare gjennomsnittlig frekvens).

4. Fordelingen mellom konsonantene

(a) Eksemplarer (forekomster)

Distribueres preferansen for allitterasjon jevnt blant de 15 konsonantene, eller skiller noen seg ut som særlig bokstavrimglade? Antallene forekomster av de ulike parene av første og annen initialkonsonant fremgår av Tabell 3:

Tabell 3: Eksemplarfrekvenser av hver kombinasjon av første og annen initialkonsonant
(Tabellen kan sees i større format her.)

Den loddrette aksen viser de 15 konsonantene som initialkonsonant i første konjunkt, og den vannrette aksen de samme konsonantene som initialkonsonant i andre konjunkt. Ved.v/hv og j/gj/hj er likelydende initialer slått sammen. Tallene viser frekvensene av tekstforekomster for hvert par av første og andre initialkonsonant. En overvekt av alliterasjon skulle da gi høye tall i diagonalen (markert med gult) fra øverst til venstre til nederst til høyre, altså parene b-b, d-d, f-f, g-g osv. Denne tendensen kamufleres likevel noe av ulikhetene i global frekvens mellom de 15 konsonantene, der f.eks. s globalt er flere ganger så frekvent som  j/gj/hj eller n som initialkonsonant. Dermed blir koordinasjoner med s som annen initialkonsonant nesten alltid mer frekvente enn med hver av de øvrige andrekonsonantene, uansett andre tendenser. I hver linje i tabellen, altså for hver førstekonsonant, er den mest frekvente andrekonsonanten markert med rødt, og den nest mest frekvente med grønt. Vi ser at s dominerer fullstendig som den mest frekvente andrekonsonanten. Et unntak er paret m-f, der særlig koordinasjonen mor og far har mye av ansvaret, slik det fremgår av Tabell 2 ovenfor. Men hvis vi ser på de grønne nest høyeste tallene, finner vi 7 av de 15 i den omtalte diagonalen, der vi i tillegg finner to røde, ett for p-p, og selvsagt ett for s-s. En tendens til allitterasjon skinner altså igjennom frekvensdominansen av s og andre konsonanter.

Vi kan eliminere virkningen av ulikhetene i global frekvens mellom konsonantene ved å normalisere frekvenstallene i tabellen til det de ville ha vært hvis alle konsonanter hadde hatt samme globale frekvens. Vi regner da ut den gjennomsnittlige summen g av hver av de 15 kolonnene i tabellen: g = 5 853. Så finner vi det normaliserte frekvenstallet f-norm i hver celle ved å multiplisere det faktiske frekvenstallet f med resultatet av å dividere gjennomsnittssummen g med den faktiske kolonnesummen s, altså:

f-norm f * (g/s)

Resultatet er Tabell 4, der hver kolonne har tilnærmet samme sum, omtrent lik gjennomsnittssummen g (‘omtrent’ fordi vi eliminerer desimaler).

Tabell 4: Normaliserte eksemplarfrekvenstall basert på antatt lik frekvens mellom konsonantene
(Tabellen kan sees i større format her.)

I Tabell 4 fremtrer en rimelig tydelig rød allitterasjonsdiagonal, med grønne innslag. Et unntak fra rød diagonal er d-n, som vinner over d-d på grunn av koordinasjonene dag og natt, dagene  og nettene, osv.; de er ansvarlige for over  halvparten av treffene. Men den grønne andreplassen inntas av d-d. I neste linje vinner f-g over f-f, særlig på grunn av frukt og grønt, men også frukt og grønnsaker, fryd og gammen og flasker og glass. (Det lyder forøvrig som en hyggelig og sunn fest.) Men også her inntar den allittererende f-f en grønn andreplass. Når g-g i følgende linje må se seg slått av g-j/gj/hj, ligger skylden hos gutten og jenta, guttene og jentene osv. Den allittererende g-g er en grønn nummer to også her. Det samme er tilfellet ved l-l, der vinneren l-d kan takke liv og død for seieren, mens l-l kommer på andreplass. Den eneste førstekonsonanten som hverken har rødt eller grønt tall  i diagonalen, er m, og her kan vi legge skylden på mor og far, og dernest på mat og drikke, mennesker og dyr og mor og datter.

I sum har vi 10 førsteplasser og 4 andreplasser av til sammen 15 mulige i den allittererende diagonalen (når vi altså normaliserer oss bort fra bokstavenes ulike globale frekvenser), og kan konkludere med at tendensen til allitterasjon er påtagelig på tvers av alfabetet, når vi teller teksteksemplarer.

(b) Typer

Det er høy tekstfrekvens som gjennomgående synes å være årsaken til avvikene fra allittererende vinnere i tabellene 3 og 4, og  det kan derfor være interessant å se hvordan tabellene ser ut hvis vi teller bare ulike koordinasjoner (typer), og ikke teksteksemplarer, også for de enkelte konsonantene. Antallet ulike koordinasjoner, altså typer, for hvert par av initiale konsonanter fremgår av Tabell 5:


Tabell 5: Typefrekvenser av hver kombinasjon av første og annen initialkonsonant
(Tabellen kan sees i større format her.)

Mønsteret ved unormalisertte frekvenstall avviker ikke sterkt fra det vi så i Tabell 3, der vi telte eksemplarer. Den høyfrekvente s dominerer enda litt mer som den mest frekvente andrekonsonanten, og i den gulmarkerte diagonalen, altså cellene med de allittererende parene, har vi fått én andreplass (grønt tall) mer enn vi hadde i Tabell 3, og like mange førsteplasser (røde tall). Også her er det nødvendig å fjerne virkningen av de svært ulike globale frekvensene av konsonantene ved å normalisere eller vekte frekvenstallene til det de ville ha vært hvis alle konsonanter hadde hatt samme globale frekvens. Utregningsmåten er den samme som den som beskrives over Tabell 4. Gjennomsnittet av kolonnesummene i Tabell 5 er  3 963. Resultatet er Tabell 6:

Tabell 6: Normaliserte typefrekvenstall basert på antatt lik frekvens mellom konsonantene
(Tabellen kan sees i større format her.)

I Tabell 6, med vektede frekvenstall, ligger alle de 15 maksimale frekvenstallene for andrekonsonanten i den allittererende diagonalen fra b-b til v/hv-v/hv. Det innebærer altså at for hver initial førstekonsonant (når vi eliminerer virkningen av ulike globale konsonantfrekvenser) er valget av den samme initiale konsonanten som andrekonsonant alltid det vanligste. Som vi så i avsnitt 3, der vi så på konsonantene samlet, er valget av allittererende initial 2,3 ganger så vanlig som man skulle vente hvis gjennomsnittet er forventningen; Tabell 6 viser at denne dominansen av allitterasjon faktisk også gjelder for hver enkelt konsonant.

5. Konklusjon

Studien viser en klar tendens til å velge allittererende koordinasjoner av enkle substantiver, med over dobbelt så høy forekomst som man skulle vente ut fra en nullhypotese at allitterasjon ikke spiller noen rolle for ordvalget. Vi ser også at allitterasjonstendensen ikke er begrenset til visse konsonanter, men er spredt over i hvert fall 14 av de 15 aktuelle konsonantene når vi teller teksteksemplarer (da med noen andreplasser i diagonalen), og over alle 15, med bare førsteplasser i diagonalen, når vi teller typer istedenfor eksemplarer, og normaliserer oss bort fra virkningen av konsonantenes ulike globale frekvenser. Også bokstavrim – ikke bare rytme –  synes altså å ha røtter i det alminnelige språket.

Dette kan kanskje være en kilde til kunnskap om struktur og mekanismer bak menneskets språkbeherskelse. Jeg tror lingvister ofte undervurderer betydningen av metriske egenskaper i sine teorier om språktilegnelse og språkbruk. Psykologer har vært inne på det, f.eks. Stein Bråten i Norge. Det har vært observert at preverbal kommunikasjon med spedbarn har rytmiske egenskaper, og rytme og intonasjonsmønstre tilegnes tidlig. Elementene i rytmen (i språk som norsk) er de trykksterke stavelsene, og det håndtaket vi bruker når vi griper fatt i et ord og dets trykksterke stavelse og plasserer det inn som et taktslag i talestrømmens rytmepartitur, er nettopp den initiale konsonanten. Vi føler velvære når vi eller andre får det til og det passer, og ekstra velvære når rytmepar har samme håndtak – samme initiale konsonant, eller samme fravær av initial konsonant ved vokalisk allitterasjon. En nærliggende tanke er at den initiale konsonanten er ordets adresse – omtrent som CAR i Lisp, kunne man si med en lett eksentrisk sammenligning. Å løpe gjennom alfabetet på jakt etter riktig initial er en velkjent teknikk når man ikke husker et navn. Når rytmen svikter og håndtaket glipper, kan resultatet bli stamming, som nettopp rammer den initiale konsonanten. Og det er ikke tilfeldig at sang er et velkjent remedium mot stamming; her har musikk og språk en felles kilde.

Stavrim, styrk initialen!
Rakner rytmen, tynes talen.

Far leser og mor syr?

Innledning

Far leser og mor syr? Det kan lyde som en foreldet stereotypi – men er den virkelig det? Helene Uri utgir i høst boken Hvem sa hva? Kvinner, menn og språk (Gyldendal 2018), der hun diskuterer de ulike måtene menn og kvinner mer og mindre automatisk blir omtalt på, og de ulike måtene de uttrykker seg på. Ett av de temaene hun tar opp, er de forskjellige aktivitetene og egenskapene som typisk blir tillagt henholdsvis menn og kvinner i utgitte tekster (skjønnlitteratur, aviser og sakprosa). NorGramBank viste seg som en nyttig kilde for denne typen informasjon. I dette innlegget vil jeg beskrive hvordan informasjonen er hentet ut fra NorGramBank, og se litt mer detaljert på noen av mønstrene vi finner.

Kvinnelige og mannlige verbhandlinger

Det kan være viktig å understreke at denne studien ikke viser hva menn og kvinner typisk gjør, men hva tekstforfattere fremstiller det som at de typisk gjør. Samtidig er det klart at sterke tendenser i de tekstene vi leser, bidrar til å forme vår oppfatning av virkeligheten. På mange områder former lesning vårt virkelighetsbilde minst like sterkt som erfaring. Derfor er disse tekstlige mønstrene av interesse også utover det rent språklige. Det er selvsagt også nærliggende å tenke at tekstforfatternes fremstilling ikke er uten enhver sammenheng med virkeligheten selv.

Materiale og metode

Materialet er hele trebanken NorGramBank (en trebank er et syntaktisk gjennomanalysert tekstkorpus), som består av en rekke deltrebanker innenfor teksttypene skjønnlitteratur, aviser, sakprosa og stortingsforhandlinger, slik det fremstilles på en egen side her. Omfanget er på ca. 70 mill. ord, hvorav drøyt ti prosent er nynorsk.

Hvordan fordeler så beskrevne handlinger, prosesser og tilstander seg på kvinner og menn i dette materialet? For å finne ut det, må vi først avgrense noen sentrale måter å referere til kvinner og menn på. Vi begrenser oss da til egennavn pluss et lite utvalg manns- og kvinnerefererende substantiver og pronomen, og kategoriserer dem henholdsvis som MASK og FEM:

MASK: mannsnavn + han + mann + gut(t) + far
FEM: kvinnenavn + hun/ho + kvinne + jente + mor

Trebanken inneholder 4 556 ulike mannsnavn og 3 582 ulike kvinnenavn.

Oppgaven er nå å hente ut de verbene som opptrer med tilfeller av MASK eller FEM som subjekt – eller mer presist: som ‘argument 1’ (ARG1) – og sortere verbene etter hvor ofte de tar MASK som ARG1, og hvor ofte de tar FEM som ARG1. Når vi sier ‘ARG1’ istedenfor ‘subjekt’, er det fordi subjektet ikke alltid er det handlende leddet, og det handlende leddet ikke alltid er subjekt. ‘ARG1’ står nettopp for det handlende leddet og omfatter subjekter for aktive verb, ikke for passive, og dessuten tilfeller der det handlende leddet ikke er subjekt – f.eks. av Kari i en passiv setning som Rapporten skrives av Kari, der Kari er ARG1 for skrive – hun er den som skriver – eller Per i Hun fant Per sovende i sengen, der Per er ARG1 for sove, eller far i Jeg så far løpe nedover veien, der far er ARG1 for løpe. Analysene i trebanken tillater oss å referere til ARG1 i søkeuttrykkene.

Den interesserte leser kan finne en mer detaljert omtale av trebankanalysene og søkeuttrykkene på siden Søk etter maskuline og feminine verb-argumenter. (Men det som følger her, forutsetter ikke at man har lest dette.) Det beskrevne søkeuttrykket på den nevnte siden henter ut fra trebanken alle verb som har MASK eller FEM ARG1 og lister dem ut sammen med opplysninger om hvor ofte de opptrer med MASK og hvor ofte med FEM ARG1. Søkeuttrykket får ca. 2,3 millioner treff i trebanken, fordelt på ca. 8 800 ulike verb og verbuttrykk. Tabell 1 nedenfor viser et lite utsnitt av trefflisten. Første tallkolonne viser antall treff, annen tallkolonne hvor mange av disse som har MASK ARG1, og tredje tallkolonne hvor mange som har FEM ARG1.


Tabell 1: Utsnitt av trefflisten med MASK og FEM ARG1 ved ulike verb

I den videre bearbeidelsen av disse dataene ønsker vi å rangere verbene etter hvor mange prosent kvinnelige og hvor mange prosent mannlige ARG1 de har. For å sikre en viss signifikans ser vi først bort fra verb med færre enn 10 forekomster i korpus med MASK eller FEM ARG1. Det reduserer antallet relevante verb og verbuttrykk fra  8 800 til ca. 4 220.

Hvis vi ser på den totale frekvens av MASK-uttrykk  og FEM-uttrykk i trebanken – altså ikke bare som ARG1 for verb – finner vi at MASK-uttrykk opptrer omkring 1,2 ganger så ofte som FEM-uttrykk. Dette tilsier at FEM-argumenter bør gis 1,2 ganger større vekt enn MASK-argumenter når de enkelte verbenes relative maskulinitet og femininitet skal regnes ut, for slik å kompensere for den forskjellen som skyldes ulikhet i global frekvens av de to typene. I utregningene av prosentverdiene nedenfor er derfor antallet treff med FEM ARG1 ganget med 1,2.

Resultater

For hvert av de 4 220 verbene og verbuttrykkene som har minst ti forekomster med MASK eller FEM ARG1, regner vi ut hvor mange prosent av disse treffene som har FEM ARG1, altså kvinnelige handlere. Resultatet finnes i Tabell 2 og Tabell 3. Begge tabellene viser alle verbene i kolonne 1 med antallet forekomster med MASK eller FEM ARG1 i kolonne 2 og prosentandel FEM av disse i kolonne 3. Tabell 2 er sortert etter prosentandelen, Tabell 3 er alfabetisk sortert etter verbet.

Tabell 2:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, sortert etter prosent

Tabell 3:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, alfabetisk sortert etter verb

 

Parseren produserer et antall feilanalyser, anslagsvis inntil 5 % (ulikt fordelt mellom verbene), og det har ikke vært praktisk mulig å sjekke alle de mange eksemplene manuelt. Det må derfor regnes med en feilmargin. I tabellene er det dessuten ikke skilt mellom homonymer (som f.eks. ved ulike betydninger av grunne).

Grafen i Figur 1 viser hvordan prosenten FEM fordeler seg blant de 4220 verbene, fra 100 % til 0%:


Figur 1: Fordelingen av % FEM blant 4 220 verb og verbuttrykk.

Kurven viser at et mindre antall verb og verbuttrykk skiller seg ut som tydelig maskuline eller feminine, mens de fleste tenderer mot å samle seg rundt midtlinjen på 50 %. Vi skal se nærmere på de tydeligst kvinnelige verbene fra 70 % FEM og opp, og de tydeligst mannlige verbene fra 30 % FEM og ned (markert med røde streker i Figur 1).

Kvinnelige verb

De følgende verbene og verbuttrykkene har mellom 70 og 100 % kvinnelige handlere, her listet opp fra 100 % og nedover:

100 – 91 % FEM:
abortere, knikse, rydje av, strikke på, stå brud, amme, neie, føde, sminke seg, blomstre, bysse, dåne, brodere, fortrylle, føne, sy på, bleke, fnise av, tralle, hekle, forhekse, kle på, smøre seg inn, fnise

90 – 81 % FEM:
binde opp, sminke, diske opp, strikke, sy, kneise, kurre, veve, knise, kvitre, sende med, glatte på, skingre, boble, holde sammen, glatte over, egne seg, pudre seg, blogge, daske til, klippe ut, vrikke seg, øse opp, bite seg i, flagre med, kjøle, laste ned, skjule seg for, speile, stusse på, trykke seg mot, tappe i, bære frem, bake, blunke bort, skure, pludre, gråte for

80 – 70 % FEM:
melke, dufte, dele seg, flagre, frottere, vogge, blomstre opp, svinse, hvine, skrifte, besette, bla frem, dulle med, faste, gjøre i stand, ranke, sprudle, vikle seg inn i, gyse, hulke, krølle seg sammen, geipe til, pynte, snufse, gispe, slekte på, tre inn i, truge med, klemme sammen, leggje ned, riste ut, skjemme ut, småprate, flette, slanke seg, legge på seg, engste seg, krøkje seg saman, setje inn, skifte på, snuble seg, sveipe, briste, setje fram, pynte seg, utdanne seg til, rydje, støvsuge, glatte, gråte, opne seg, plumpe ut med, prostituere seg, re, skrape sammen, sy sammen, vugge med, gråte av, spinne, verge seg, utgjøre, bere fram, glimte, kakle, kvide seg, pille, rapportere om, rydde av, skravle om, spraye, tirre, kollapse, vrikke på, kjenne, fire, flagge, formå, hysje, klemme ut, knytte sammen, krysse av, nynne med, omsetje, oppsluke, programmere, skjere seg, somle bort, sope sammen, tenje, tørre, undersøkje, vemmes, flørte, by seg, bæsje, liggje att, pudre, rope inn, tappe for, gjemme på, skjenne på, farge, snurpe, blafre, deklamere, revne, romme, strigråte, trenges, skrelle, kaste på seg, unnvære, gråte over, slikke av, feie bort, sette bort, synde, trimme, skrubbe, falle av, sole seg, vegre seg for, svimle, tilberede, vaske, tvinge seg til, re opp, bade, smøre på, dekke på, rødme, stålsette seg, bølge, forsake, forstue, korse seg, krøke seg saman, løsrive seg, sitre, skjemme bort, smøre inn, speile seg, spreie, sprelle med, bukte seg, duve, endevende, furte, glitre, komme seg etter, smørje, snøre opp, betro seg til, nynne

At abortere, knikse, stå brud, amme, neie, pudre seg og føde har hovedsakelig kvinnelige handlere, er ikke egnet til å forbause. Man kan kanskje undre seg over at et verb som føde ikke har 100 % kvinnelige handlere (verbet har 97,6 %), men det er viktig å huske at eksempler registeres også når predikatet er benektet, eller setningen er hypotetisk:

Hadde menn født barn, tror jeg ingen ville spurt om deres rett til å bestemme.
Det hadde hendt at han hørte hviskende utsagn om at hans far hadde født ham, og ikke moren.

– og når verb brukes i overført betydning:

Men det eneste han fødte var en drøm.
I havet fødte han oss til et nytt liv.

En litt annen kategori er knise, fnise, pludre, kurre, kvitre, hvine, sprudle, boble, daske til og kakle med flere. Her er det nærliggende å tenke at valget av verb har like mye å gjøre med skribentens perspektiv og kjønnsspesifikke forventninger som med de objektive handlingene som beskrives. Innholdsmessig mer interessante er eksempler som kle på, holde sammen, glatte over, egne seg, blogge, skjule seg for, stusse på, skrifte, besette, dulle med, skjemme ut, slanke seg, programmere, vemmes og deklamere. Er dette faktisk handlinger og relasjoner som særlig kvinner deltar i, eller er det særlig interessant å nevne det når det er kvinner som gjør det – eller er det statistiske tilfeldigheter i tekstene? Materialet reiser mange spørsmål som ikke blir forfulgt her.

En slik liste av spesifikt kvinnelige verb kan oppleves som lite flatterende for kvinner. Da kan de trøste seg med å se på den tilsvarende listen for menn.

Mannlige verb

Det er flere verb som har sterk overvekt av mannlige handlere enn det er verb som har sterk overvekt av kvinnelige. De følgende verbene og verbuttrykkene har bare mellom 0 og 30 % kvinnelige handlere, her listet opp fra 0 % og oppover:

0 – 9 % FEM:
anmode om, antaste, avtjene, braute, bure, eliminere, eskortere, gire ned, grunne over, junke, kjøre ut, låne fra, overta som, patruljere, pensjonere seg, ruse, rå, tjenestegjøre, tøffe seg, buldre, ekte, barbere seg, snekre, bremse ned, pisse, slakte, anslå, byggje, fri til, gapskratte, kviste, brumme, rekke over, arrestere, sverje, avhøre, forgripe seg på, bukke, knegge, referere, banke opp, dirke opp

10 – 19 % FEM:
fable om, krepere, kurtisere, stemme for, summere opp, telefonere, volde, trenge inn i, avskaffe, bryne, falle fra, hive seg, kortklippe, orsake seg, rasere, skrangle med, sperre inne, streife rundt, utnevne, utstyre med, utveksle med, gifte bort, skyte seg, humre, spikre, avlytte, blote, etterforske, gå ut frå, invadere, kjekke seg, knipse på, kristne, kryste, myke opp, rundjule, ruste, skikke seg, snåve, spre seg, tre tilbake, murre, anerkjenne, rane, spikke, onanere, tordne, skjegge, grunnlegge, tyggje, briske seg, sjå seg omkring, slå seg på, montere, utvise, okkupere, preke, smi, tale for, glise, plystre, dampe på, kidnappe, røve, mishandle, voldta, demontere, fyre av, hyre, kjøre over, oppføre, rutsje, plystre på, dømme, frakte, brøle, flire av, forfekte, hengje seg, innkalle til, komme etter, lunte, patte på, torturere, utholde, inngå, sage, herje, forhandle med, hevne, komponere, reflektere over, tukte, grynte, smatte på, fremlegge, kutte opp, plukke til seg, refse, spekulere i, trene opp, flire, fiske, forslå, holde igjen, håndhilse, male, regissere, utgi, klikke, lade, stake, erklære seg, filme, forplikte, kamuflere, markere seg, melde om, olje, ottast, preike, pågå, rigge opp, strande, tørste, lansere, drite

20 – 30 % FEM:
brøyte seg, skråle, jumpe, belære, blokkere, fortøye, krenke, kverke, laste, reparere, ause, kjøre opp, rekkje, vinne over, anse som, jakte, administrere, avansere, forlove seg med, fosse, fremsette, føre inn, hevde seg, innfri, klargjøre, konferere med, make, overbringe, pælme, råde med, saksøke, slakke, sprenge seg, stikke opp, støyte på, svindle, svive, tyrannisere, vekke opp, bremse, skjære ut, klø seg, berette om, forutsette, nedlate seg til, omgå, oppheve, skrense, spille inn, utrede, skyte, argumentere for, investere i, gaule, mobbe, skifte ut, legge om, banne, erobre, grave opp, informere om, snakke sammen, auge, bygge, stange, stifte, lange ut, jakte på, knipse, ruve, avklare, leggje inn, orientere om, støpe, supplere, videreutvikle, befale, befri seg fra, beføle, blø, blånekte, drible, fyre løs, ha tung for, kjøpe opp, kneble, køyre på, lue, lufte seg, mørkne, overdra, plugge inn, plyndre, problematisere, rasle, ratte, rigge til, rokke ved, røme, se som, ska, skurre, slåst, spenne fra, skule, luske, harke, slå til, kunngjøre, utvikle seg, rage, fordufte, skryte, sprenge, åpenbare, ringje på, bjeffe, knulle, vifte med, bla opp, hive opp, jule opp, tråkle seg, utløse, vedde på, fremstå, presentere seg som, drepe, byrje på, diktere, gje ut, rømme seg, sitte ned, spikke på, utrydde, vedta, vitse, drikke seg, fleipe med, logre, underslå, ro, håndhilse på, overfalle, sikre seg, sone, tale om, sjarmere, beregne, labbe, forske i, hente ut, mine, skubbe til, trenge seg på, slentre, grave ned, krafse, mulle, score, slipe, stinke, renske, blinke, rope opp, smadre, lyte, publisere, fri, innfinne seg, køyre, arbeide for, bale, beite, dømme til, fise, forenkle, frottere seg, kløve, offentliggjøre, oppvarte, redigere, sjonglere, skjøtte, skrue av, tegne inn, tørne, knurre, sette igjen, skygge, spyle, utrette, vippe opp, ete opp, operere, anslå til, ende med, erstatte med, farte, godtake, innkassere, plumpe, råke, saumfare, manøvrere, anvende, betegne som, formulere, gale, hogge, rave, justere, besøkje, bremse opp, investere, lirke opp, muntre opp, vrinske, foreta, fremme, sprøyte, tømme for, sette etter, geleide, lese opp, dykke, trenge seg inn, skryte av, rape, hugge, alliere seg med, avfyre, blingse, dilte etter, flerre opp, forveksle med, frata, føles, gomle på, hale inn, holde auge med, iverksette, kjøre ned, knyte opp, konstruere, leie inn, lenke, lide under, lukkast, rekne, rettferdiggjøre, sjenere, sleikje, sleppe inn, stikke seg vekk, stryke ut, tverrsnu, uttrykke seg, berømme, feie opp, file, pelle, rulle seg, røske opp, setje på seg, smiske, spurte, stavre seg, stå i, terge, tjore, vingle, kremte, beordre, karakterisere, opprette, bykse, spenne på seg, true, angripe, tromme, reinske, fikse, klappe igjen, rådføre seg med, slumre, spandere på, dure, overgi, tømme seg, vippe på, beseire

Også blant disse mannlige predikatene er det noen som i hvert fall inntil nylig er lite forbausende: avtjene, patruljere, tjenestegjøre, bukke, barbere seg, (mens det ikke-refleksive barbere har flest kvinnelige handlere).  Så er det en god del verb og verbuttrykk der det synes nærliggende å anta at skribentens eller samfunnets perspektiv i tillegg til den beskrevne handling forklarer at de særlig velges ved gutter og menn: tøffe seg, ekte, gapskratte, kurtisere, gifte bort, kjekke seg, tordne, briske seg, preke, grynte, flire, forlove seg med. Og så er det en god del der selve handlingene særlig assosieres med menn – fordi de særlig utføres av menn, eller fordi de særlig omtales når menn utfører dem. Og flatterende er de stort sett ikke: antaste, braute,  junke, forgripe seg på,  banke opp, rasere, sperre inne, invadere, rundjule, rane, okkupere, kidnappe, røve, mishandle, voldta, torturere, hevne, krenke, kverke, svindle, tyrannisere, mobbe, beføle, plyndre, skryte, jule opp, drepe, utrydde, drikke seg, overfalle,  smadre og avfyre. På den annen side er det også flest menn som i tekstene er ansvarlige for å eskortere, byggje, myke opp, anerkjenne, grunnlegge, utholde,  forhandle med, komponere, reflektere over, male, regissere, utgi, forplikte, markere seg, reparere, avansere, innfri, klargjøre, argumentere for, orientere om, støpe, videreutvikle, problematisere og publisere.

Nøytrale verb

Det kan også være av interesse å se nærmere på de verbene som ikke har skjev kjønnsfordeling, der man kanskje kunne ha mistenkt noen for å ha det. Blant verbene med mellom 55 % og 45 % feminint førsteargument finner vi for eksempel: tenke, kommunisere, filosofere, leke seg, regjere, rydde etter seg, slamre, late seg, rase mot, skoggerle, stappe i seg, øydeleggje, lyve, marsjere, bedra, skamme seg, kjefte, lese, skjønne seg på, konsentrere seg om, gruble, lære seg, fundere over, beordre til, disputere for, forsone, fantasere, sladre, oversette, forske, bable, leke, engasjere seg, krangle med, overdrive, samarbeide, lære om, konkurrere, jobbe, analysere, føye seg, argumentere, undervise, utdanne seg, kommandere til, myrde.

Det er kanskje en oppmuntring at i hvert fall i tekstene kjefter, leser, sladrer, forsker og konkurrerer kvinner og menn like mye.

Det er ikke bare å telle

Den tilgjengeligheten av store analyserte datamengder som vi ser i moderne trebanker og lignende ressurser, skaper en fristelse som det er viktig å motstå: fristelsen å presentere iøynefallende tallforhold som konklusjoner om hvordan verden er, uten nærmere analyse. Muligheten for feil i trebank-analysene er nevnt tidligere. Dessuten er de eksemplene som telles, langt mer mangfoldige og nyanserte enn hva de enkle tabellene får frem, både i innhold og i de sammenhengene eksemplene inngår i. Hundre eksempler fordelt på femti forfattere er mer tungtveiende enn hundre eksempler hos samme forfatter, som grunnlag for generaliseringer. Og de assosiasjonene vi kan få av å betrakte et isolert verb, er nesten alltid mye snevrere enn de varierte måtene verbet faktisk opptrer på i konkrete setninger. Setningene må studeres.

Som et eksempel på det siste kan vi se på fordelingen av verbet slå på de to handlerne mor og far (vi ser her bort fra de øvrige MASK- og FEM-uttrykkene). Mor er handler for slå i 30,8 % av tilfellene, og far altså i 69,2 % (når vi vekter prosentene etter de globale frekvensene til mor og far). Men før vi hopper til konklusjonen at far er brutal over dobbelt så ofte som mor, er det nyttig å konstatere at de følgende 29 setningene er å finne blant de 66 som har far som handler:

Dei ventar på at fedrane skal komma heim og slå hardt i borda.
Faren slår ut med armane, men før han får sagt noko, peikar ein av gutane på han og seier:
På dei flate strekningane slo faren varsamt med taumen mot hesteryggen, og Perle sprang.
Jamvel faren gjekk no og slo rundt seg med flosklar, enda han aldri preika over same teksten.
Men faren slo gjerne følge under mottoet:
«Skal vi ikke stoppe?» skrek Danny idet faren strakte en hånd ut for å slå av alarmen.
For så vidt var det den eneste kniven han hadde slått også, men den var nesten like fin som de faren hans slo.
Faren lo og slo hånden i bordet.
Faren stoppet bilen og hoppet ut, uten å slå av motoren.
Godefar slo ham på skuldra og sa:
Far slår armene om gutten sin og gir han en god klem.
–  Etty sier at det er enda en hemmelig gang i huset… begynte Ikaros ivrig, og skvatt høyt da faren slo hånden i bordplaten så koppene danset.
Finn begynte også å snakke om å flytte hjemmefra, men faren slo det bort.
Faren reiste seg, slo den ene hånden i den andre og gikk ut på kjøkkenet.
–  De seilte rett til helvete! brølte far og slo den digre neven sin i bordet.
Faren rullet sammen en avis og slo etter en flue.
Jeg hørte at far satt og slo skoen inn i bordbenet.
Far slo meg på skulderen og takket.
Faren var straks på beina og slo neven i disken.
Helsike, min egen far slo hånden av meg, betraktet meg som død!»
Far slo nummeret til studioet.
Det var nok til at de kunne ha levd enkelt og godt, men feilen var at far slo for stort på det.
Pappa hadde ikke nok penger, og faren slo ham konkurs.
Faren hans, fotograf Dal, slo i bordet og sa nei.
Faren satte albuene mot bordplaten og slo fingertuppene lett mot hverandre.
Faren slo nesten glasset i bordet.
Far prest slo i prekestolen igjen.
Faren slår hånden i bordet.
Mer fikk hun ikke sagt før faren slo så hardt i spisebordet at en blomstervase falt ned på gulvet og gikk i tusen knas.

Likevel leder nok far i brutal slåing i tekstene. Men tallene må nyanseres.

Konklusjon

I dette innlegget har hovedpoenget vært å presentere data for å gi et inntrykk av hva slags informasjon som kan hentes ut av denne språkressursen, og for å vise at det er mønstre i fordelingen på verb av mannlige og kvinnelige handlere som det er verd å studere nærmere. Det er fremdeles behov for å kartlegge innslaget av feilanalyser i dette materialet, og eksempler må studeres inngående for at man skal kunne konkludere noe om årsakene til den observerte fordelingen. NorGramBank vil være tilgjengelig for slike videre studier.