Far leser og mor syr?

Innledning

Far leser og mor syr? Det kan lyde som en foreldet stereotypi – men er den virkelig det? Helene Uri utgir i høst boken Hvem sa hva? Kvinner, menn og språk (Gyldendal 2018), der hun diskuterer de ulike måtene menn og kvinner mer og mindre automatisk blir omtalt på, og de ulike måtene de uttrykker seg på. Ett av de temaene hun tar opp, er de forskjellige aktivitetene og egenskapene som typisk blir tillagt henholdsvis menn og kvinner i utgitte tekster (skjønnlitteratur, aviser og sakprosa). NorGramBank viste seg som en nyttig kilde for denne typen informasjon. I dette innlegget vil jeg beskrive hvordan informasjonen er hentet ut fra NorGramBank, og se litt mer detaljert på noen av mønstrene vi finner.

Kvinnelige og mannlige verbhandlinger

Det kan være viktig å understreke at denne studien ikke viser hva menn og kvinner typisk gjør, men hva tekstforfattere fremstiller det som at de typisk gjør. Samtidig er det klart at sterke tendenser i de tekstene vi leser, bidrar til å forme vår oppfatning av virkeligheten. På mange områder former lesning vårt virkelighetsbilde minst like sterkt som erfaring. Derfor er disse tekstlige mønstrene av interesse også utover det rent språklige. Det er selvsagt også nærliggende å tenke at tekstforfatternes fremstilling ikke er uten enhver sammenheng med virkeligheten selv.

Materiale og metode

Materialet er hele trebanken NorGramBank (en trebank er et syntaktisk gjennomanalysert tekstkorpus), som består av en rekke deltrebanker innenfor teksttypene skjønnlitteratur, aviser, sakprosa og stortingsforhandlinger, slik det fremstilles på en egen side her. Omfanget er på ca. 70 mill. ord, hvorav drøyt ti prosent er nynorsk.

Hvordan fordeler så beskrevne handlinger, prosesser og tilstander seg på kvinner og menn i dette materialet? For å finne ut det, må vi først avgrense noen sentrale måter å referere til kvinner og menn på. Vi begrenser oss da til egennavn pluss et lite utvalg manns- og kvinnerefererende substantiver og pronomen, og kategoriserer dem henholdsvis som MASK og FEM:

MASK: mannsnavn + han + mann + gut(t) + far
FEM: kvinnenavn + hun/ho + kvinne + jente + mor

Trebanken inneholder 4 556 ulike mannsnavn og 3 582 ulike kvinnenavn.

Oppgaven er nå å hente ut de verbene som opptrer med tilfeller av MASK eller FEM som subjekt – eller mer presist: som ‘argument 1’ (ARG1) – og sortere verbene etter hvor ofte de tar MASK som ARG1, og hvor ofte de tar FEM som ARG1. Når vi sier ‘ARG1’ istedenfor ‘subjekt’, er det fordi subjektet ikke alltid er det handlende leddet, og det handlende leddet ikke alltid er subjekt. ‘ARG1’ står nettopp for det handlende leddet og omfatter subjekter for aktive verb, ikke for passive, og dessuten tilfeller der det handlende leddet ikke er subjekt – f.eks. av Kari i en passiv setning som Rapporten skrives av Kari, der Kari er ARG1 for skrive – hun er den som skriver – eller Per i Hun fant Per sovende i sengen, der Per er ARG1 for sove, eller far i Jeg så far løpe nedover veien, der far er ARG1 for løpe. Analysene i trebanken tillater oss å referere til ARG1 i søkeuttrykkene.

Den interesserte leser kan finne en mer detaljert omtale av trebankanalysene og søkeuttrykkene på siden Søk etter maskuline og feminine verb-argumenter. (Men det som følger her, forutsetter ikke at man har lest dette.) Det beskrevne søkeuttrykket på den nevnte siden henter ut fra trebanken alle verb som har MASK eller FEM ARG1 og lister dem ut sammen med opplysninger om hvor ofte de opptrer med MASK og hvor ofte med FEM ARG1. Søkeuttrykket får ca. 2,3 millioner treff i trebanken, fordelt på ca. 8 800 ulike verb og verbuttrykk. Tabell 1 nedenfor viser et lite utsnitt av trefflisten. Første tallkolonne viser antall treff, annen tallkolonne hvor mange av disse som har MASK ARG1, og tredje tallkolonne hvor mange som har FEM ARG1.


Tabell 1: Utsnitt av trefflisten med MASK og FEM ARG1 ved ulike verb

I den videre bearbeidelsen av disse dataene ønsker vi å rangere verbene etter hvor mange prosent kvinnelige og hvor mange prosent mannlige ARG1 de har. For å sikre en viss signifikans ser vi først bort fra verb med færre enn 10 forekomster i korpus med MASK eller FEM ARG1. Det reduserer antallet relevante verb og verbuttrykk fra  8 800 til ca. 4 220.

Hvis vi ser på den totale frekvens av MASK-uttrykk  og FEM-uttrykk i trebanken – altså ikke bare som ARG1 for verb – finner vi at MASK-uttrykk opptrer omkring 1,2 ganger så ofte som FEM-uttrykk. Dette tilsier at FEM-argumenter bør gis 1,2 ganger større vekt enn MASK-argumenter når de enkelte verbenes relative maskulinitet og femininitet skal regnes ut, for slik å kompensere for den forskjellen som skyldes ulikhet i global frekvens av de to typene. I utregningene av prosentverdiene nedenfor er derfor antallet treff med FEM ARG1 ganget med 1,2.

Resultater

For hvert av de 4 220 verbene og verbuttrykkene som har minst ti forekomster med MASK eller FEM ARG1, regner vi ut hvor mange prosent av disse treffene som har FEM ARG1, altså kvinnelige handlere. Resultatet finnes i Tabell 2 og Tabell 3. Begge tabellene viser alle verbene i kolonne 1 med antallet forekomster med MASK eller FEM ARG1 i kolonne 2 og prosentandel FEM av disse i kolonne 3. Tabell 2 er sortert etter prosentandelen, Tabell 3 er alfabetisk sortert etter verbet.

Tabell 2:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, sortert etter prosent

Tabell 3:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, alfabetisk sortert etter verb

 

Parseren produserer et antall feilanalyser, anslagsvis inntil 5 % (ulikt fordelt mellom verbene), og det har ikke vært praktisk mulig å sjekke alle de mange eksemplene manuelt. Det må derfor regnes med en feilmargin. I tabellene er det dessuten ikke skilt mellom homonymer (som f.eks. ved ulike betydninger av grunne).

Grafen i Figur 1 viser hvordan prosenten FEM fordeler seg blant de 4220 verbene, fra 100 % til 0%:


Figur 1: Fordelingen av % FEM blant 4 220 verb og verbuttrykk.

Kurven viser at et mindre antall verb og verbuttrykk skiller seg ut som tydelig maskuline eller feminine, mens de fleste tenderer mot å samle seg rundt midtlinjen på 50 %. Vi skal se nærmere på de tydeligst kvinnelige verbene fra 70 % FEM og opp, og de tydeligst mannlige verbene fra 30 % FEM og ned (markert med røde streker i Figur 1).

Kvinnelige verb

De følgende verbene og verbuttrykkene har mellom 70 og 100 % kvinnelige handlere, her listet opp fra 100 % og nedover:

100 – 91 % FEM:
abortere, knikse, rydje av, strikke på, stå brud, amme, neie, føde, sminke seg, blomstre, bysse, dåne, brodere, fortrylle, føne, sy på, bleke, fnise av, tralle, hekle, forhekse, kle på, smøre seg inn, fnise

90 – 81 % FEM:
binde opp, sminke, diske opp, strikke, sy, kneise, kurre, veve, knise, kvitre, sende med, glatte på, skingre, boble, holde sammen, glatte over, egne seg, pudre seg, blogge, daske til, klippe ut, vrikke seg, øse opp, bite seg i, flagre med, kjøle, laste ned, skjule seg for, speile, stusse på, trykke seg mot, tappe i, bære frem, bake, blunke bort, skure, pludre, gråte for

80 – 70 % FEM:
melke, dufte, dele seg, flagre, frottere, vogge, blomstre opp, svinse, hvine, skrifte, besette, bla frem, dulle med, faste, gjøre i stand, ranke, sprudle, vikle seg inn i, gyse, hulke, krølle seg sammen, geipe til, pynte, snufse, gispe, slekte på, tre inn i, truge med, klemme sammen, leggje ned, riste ut, skjemme ut, småprate, flette, slanke seg, legge på seg, engste seg, krøkje seg saman, setje inn, skifte på, snuble seg, sveipe, briste, setje fram, pynte seg, utdanne seg til, rydje, støvsuge, glatte, gråte, opne seg, plumpe ut med, prostituere seg, re, skrape sammen, sy sammen, vugge med, gråte av, spinne, verge seg, utgjøre, bere fram, glimte, kakle, kvide seg, pille, rapportere om, rydde av, skravle om, spraye, tirre, kollapse, vrikke på, kjenne, fire, flagge, formå, hysje, klemme ut, knytte sammen, krysse av, nynne med, omsetje, oppsluke, programmere, skjere seg, somle bort, sope sammen, tenje, tørre, undersøkje, vemmes, flørte, by seg, bæsje, liggje att, pudre, rope inn, tappe for, gjemme på, skjenne på, farge, snurpe, blafre, deklamere, revne, romme, strigråte, trenges, skrelle, kaste på seg, unnvære, gråte over, slikke av, feie bort, sette bort, synde, trimme, skrubbe, falle av, sole seg, vegre seg for, svimle, tilberede, vaske, tvinge seg til, re opp, bade, smøre på, dekke på, rødme, stålsette seg, bølge, forsake, forstue, korse seg, krøke seg saman, løsrive seg, sitre, skjemme bort, smøre inn, speile seg, spreie, sprelle med, bukte seg, duve, endevende, furte, glitre, komme seg etter, smørje, snøre opp, betro seg til, nynne

At abortere, knikse, stå brud, amme, neie, pudre seg og føde har hovedsakelig kvinnelige handlere, er ikke egnet til å forbause. Man kan kanskje undre seg over at et verb som føde ikke har 100 % kvinnelige handlere (verbet har 97,6 %), men det er viktig å huske at eksempler registeres også når predikatet er benektet, eller setningen er hypotetisk:

Hadde menn født barn, tror jeg ingen ville spurt om deres rett til å bestemme.
Det hadde hendt at han hørte hviskende utsagn om at hans far hadde født ham, og ikke moren.

– og når verb brukes i overført betydning:

Men det eneste han fødte var en drøm.
I havet fødte han oss til et nytt liv.

En litt annen kategori er knise, fnise, pludre, kurre, kvitre, hvine, sprudle, boble, daske til og kakle med flere. Her er det nærliggende å tenke at valget av verb har like mye å gjøre med skribentens perspektiv og kjønnsspesifikke forventninger som med de objektive handlingene som beskrives. Innholdsmessig mer interessante er eksempler som kle på, holde sammen, glatte over, egne seg, blogge, skjule seg for, stusse på, skrifte, besette, dulle med, skjemme ut, slanke seg, programmere, vemmes og deklamere. Er dette faktisk handlinger og relasjoner som særlig kvinner deltar i, eller er det særlig interessant å nevne det når det er kvinner som gjør det – eller er det statistiske tilfeldigheter i tekstene? Materialet reiser mange spørsmål som ikke blir forfulgt her.

En slik liste av spesifikt kvinnelige verb kan oppleves som lite flatterende for kvinner. Da kan de trøste seg med å se på den tilsvarende listen for menn.

Mannlige verb

Det er flere verb som har sterk overvekt av mannlige handlere enn det er verb som har sterk overvekt av kvinnelige. De følgende verbene og verbuttrykkene har bare mellom 0 og 30 % kvinnelige handlere, her listet opp fra 0 % og oppover:

0 – 9 % FEM:
anmode om, antaste, avtjene, braute, bure, eliminere, eskortere, gire ned, grunne over, junke, kjøre ut, låne fra, overta som, patruljere, pensjonere seg, ruse, rå, tjenestegjøre, tøffe seg, buldre, ekte, barbere seg, snekre, bremse ned, pisse, slakte, anslå, byggje, fri til, gapskratte, kviste, brumme, rekke over, arrestere, sverje, avhøre, forgripe seg på, bukke, knegge, referere, banke opp, dirke opp

10 – 19 % FEM:
fable om, krepere, kurtisere, stemme for, summere opp, telefonere, volde, trenge inn i, avskaffe, bryne, falle fra, hive seg, kortklippe, orsake seg, rasere, skrangle med, sperre inne, streife rundt, utnevne, utstyre med, utveksle med, gifte bort, skyte seg, humre, spikre, avlytte, blote, etterforske, gå ut frå, invadere, kjekke seg, knipse på, kristne, kryste, myke opp, rundjule, ruste, skikke seg, snåve, spre seg, tre tilbake, murre, anerkjenne, rane, spikke, onanere, tordne, skjegge, grunnlegge, tyggje, briske seg, sjå seg omkring, slå seg på, montere, utvise, okkupere, preke, smi, tale for, glise, plystre, dampe på, kidnappe, røve, mishandle, voldta, demontere, fyre av, hyre, kjøre over, oppføre, rutsje, plystre på, dømme, frakte, brøle, flire av, forfekte, hengje seg, innkalle til, komme etter, lunte, patte på, torturere, utholde, inngå, sage, herje, forhandle med, hevne, komponere, reflektere over, tukte, grynte, smatte på, fremlegge, kutte opp, plukke til seg, refse, spekulere i, trene opp, flire, fiske, forslå, holde igjen, håndhilse, male, regissere, utgi, klikke, lade, stake, erklære seg, filme, forplikte, kamuflere, markere seg, melde om, olje, ottast, preike, pågå, rigge opp, strande, tørste, lansere, drite

20 – 30 % FEM:
brøyte seg, skråle, jumpe, belære, blokkere, fortøye, krenke, kverke, laste, reparere, ause, kjøre opp, rekkje, vinne over, anse som, jakte, administrere, avansere, forlove seg med, fosse, fremsette, føre inn, hevde seg, innfri, klargjøre, konferere med, make, overbringe, pælme, råde med, saksøke, slakke, sprenge seg, stikke opp, støyte på, svindle, svive, tyrannisere, vekke opp, bremse, skjære ut, klø seg, berette om, forutsette, nedlate seg til, omgå, oppheve, skrense, spille inn, utrede, skyte, argumentere for, investere i, gaule, mobbe, skifte ut, legge om, banne, erobre, grave opp, informere om, snakke sammen, auge, bygge, stange, stifte, lange ut, jakte på, knipse, ruve, avklare, leggje inn, orientere om, støpe, supplere, videreutvikle, befale, befri seg fra, beføle, blø, blånekte, drible, fyre løs, ha tung for, kjøpe opp, kneble, køyre på, lue, lufte seg, mørkne, overdra, plugge inn, plyndre, problematisere, rasle, ratte, rigge til, rokke ved, røme, se som, ska, skurre, slåst, spenne fra, skule, luske, harke, slå til, kunngjøre, utvikle seg, rage, fordufte, skryte, sprenge, åpenbare, ringje på, bjeffe, knulle, vifte med, bla opp, hive opp, jule opp, tråkle seg, utløse, vedde på, fremstå, presentere seg som, drepe, byrje på, diktere, gje ut, rømme seg, sitte ned, spikke på, utrydde, vedta, vitse, drikke seg, fleipe med, logre, underslå, ro, håndhilse på, overfalle, sikre seg, sone, tale om, sjarmere, beregne, labbe, forske i, hente ut, mine, skubbe til, trenge seg på, slentre, grave ned, krafse, mulle, score, slipe, stinke, renske, blinke, rope opp, smadre, lyte, publisere, fri, innfinne seg, køyre, arbeide for, bale, beite, dømme til, fise, forenkle, frottere seg, kløve, offentliggjøre, oppvarte, redigere, sjonglere, skjøtte, skrue av, tegne inn, tørne, knurre, sette igjen, skygge, spyle, utrette, vippe opp, ete opp, operere, anslå til, ende med, erstatte med, farte, godtake, innkassere, plumpe, råke, saumfare, manøvrere, anvende, betegne som, formulere, gale, hogge, rave, justere, besøkje, bremse opp, investere, lirke opp, muntre opp, vrinske, foreta, fremme, sprøyte, tømme for, sette etter, geleide, lese opp, dykke, trenge seg inn, skryte av, rape, hugge, alliere seg med, avfyre, blingse, dilte etter, flerre opp, forveksle med, frata, føles, gomle på, hale inn, holde auge med, iverksette, kjøre ned, knyte opp, konstruere, leie inn, lenke, lide under, lukkast, rekne, rettferdiggjøre, sjenere, sleikje, sleppe inn, stikke seg vekk, stryke ut, tverrsnu, uttrykke seg, berømme, feie opp, file, pelle, rulle seg, røske opp, setje på seg, smiske, spurte, stavre seg, stå i, terge, tjore, vingle, kremte, beordre, karakterisere, opprette, bykse, spenne på seg, true, angripe, tromme, reinske, fikse, klappe igjen, rådføre seg med, slumre, spandere på, dure, overgi, tømme seg, vippe på, beseire

Også blant disse mannlige predikatene er det noen som i hvert fall inntil nylig er lite forbausende: avtjene, patruljere, tjenestegjøre, bukke, barbere seg, (mens det ikke-refleksive barbere har flest kvinnelige handlere).  Så er det en god del verb og verbuttrykk der det synes nærliggende å anta at skribentens eller samfunnets perspektiv i tillegg til den beskrevne handling forklarer at de særlig velges ved gutter og menn: tøffe seg, ekte, gapskratte, kurtisere, gifte bort, kjekke seg, tordne, briske seg, preke, grynte, flire, forlove seg med. Og så er det en god del der selve handlingene særlig assosieres med menn – fordi de særlig utføres av menn, eller fordi de særlig omtales når menn utfører dem. Og flatterende er de stort sett ikke: antaste, braute,  junke, forgripe seg på,  banke opp, rasere, sperre inne, invadere, rundjule, rane, okkupere, kidnappe, røve, mishandle, voldta, torturere, hevne, krenke, kverke, svindle, tyrannisere, mobbe, beføle, plyndre, skryte, jule opp, drepe, utrydde, drikke seg, overfalle,  smadre og avfyre. På den annen side er det også flest menn som i tekstene er ansvarlige for å eskortere, byggje, myke opp, anerkjenne, grunnlegge, utholde,  forhandle med, komponere, reflektere over, male, regissere, utgi, forplikte, markere seg, reparere, avansere, innfri, klargjøre, argumentere for, orientere om, støpe, videreutvikle, problematisere og publisere.

Nøytrale verb

Det kan også være av interesse å se nærmere på de verbene som ikke har skjev kjønnsfordeling, der man kanskje kunne ha mistenkt noen for å ha det. Blant verbene med mellom 55 % og 45 % feminint førsteargument finner vi for eksempel: tenke, kommunisere, filosofere, leke seg, regjere, rydde etter seg, slamre, late seg, rase mot, skoggerle, stappe i seg, øydeleggje, lyve, marsjere, bedra, skamme seg, kjefte, lese, skjønne seg på, konsentrere seg om, gruble, lære seg, fundere over, beordre til, disputere for, forsone, fantasere, sladre, oversette, forske, bable, leke, engasjere seg, krangle med, overdrive, samarbeide, lære om, konkurrere, jobbe, analysere, føye seg, argumentere, undervise, utdanne seg, kommandere til, myrde.

Det er kanskje en oppmuntring at i hvert fall i tekstene kjefter, leser, sladrer, forsker og konkurrerer kvinner og menn like mye.

Det er ikke bare å telle

Den tilgjengeligheten av store analyserte datamengder som vi ser i moderne trebanker og lignende ressurser, skaper en fristelse som det er viktig å motstå: fristelsen å presentere iøynefallende tallforhold som konklusjoner om hvordan verden er, uten nærmere analyse. Muligheten for feil i trebank-analysene er nevnt tidligere. Dessuten er de eksemplene som telles, langt mer mangfoldige og nyanserte enn hva de enkle tabellene får frem, både i innhold og i de sammenhengene eksemplene inngår i. Hundre eksempler fordelt på femti forfattere er mer tungtveiende enn hundre eksempler hos samme forfatter, som grunnlag for generaliseringer. Og de assosiasjonene vi kan få av å betrakte et isolert verb, er nesten alltid mye snevrere enn de varierte måtene verbet faktisk opptrer på i konkrete setninger. Setningene må studeres.

Som et eksempel på det siste kan vi se på fordelingen av verbet slå på de to handlerne mor og far (vi ser her bort fra de øvrige MASK- og FEM-uttrykkene). Mor er handler for slå i 30,8 % av tilfellene, og far altså i 69,2 % (når vi vekter prosentene etter de globale frekvensene til mor og far). Men før vi hopper til konklusjonen at far er brutal over dobbelt så ofte som mor, er det nyttig å konstatere at de følgende 29 setningene er å finne blant de 66 som har far som handler:

Dei ventar på at fedrane skal komma heim og slå hardt i borda.
Faren slår ut med armane, men før han får sagt noko, peikar ein av gutane på han og seier:
På dei flate strekningane slo faren varsamt med taumen mot hesteryggen, og Perle sprang.
Jamvel faren gjekk no og slo rundt seg med flosklar, enda han aldri preika over same teksten.
Men faren slo gjerne følge under mottoet:
«Skal vi ikke stoppe?» skrek Danny idet faren strakte en hånd ut for å slå av alarmen.
For så vidt var det den eneste kniven han hadde slått også, men den var nesten like fin som de faren hans slo.
Faren lo og slo hånden i bordet.
Faren stoppet bilen og hoppet ut, uten å slå av motoren.
Godefar slo ham på skuldra og sa:
Far slår armene om gutten sin og gir han en god klem.
–  Etty sier at det er enda en hemmelig gang i huset… begynte Ikaros ivrig, og skvatt høyt da faren slo hånden i bordplaten så koppene danset.
Finn begynte også å snakke om å flytte hjemmefra, men faren slo det bort.
Faren reiste seg, slo den ene hånden i den andre og gikk ut på kjøkkenet.
–  De seilte rett til helvete! brølte far og slo den digre neven sin i bordet.
Faren rullet sammen en avis og slo etter en flue.
Jeg hørte at far satt og slo skoen inn i bordbenet.
Far slo meg på skulderen og takket.
Faren var straks på beina og slo neven i disken.
Helsike, min egen far slo hånden av meg, betraktet meg som død!»
Far slo nummeret til studioet.
Det var nok til at de kunne ha levd enkelt og godt, men feilen var at far slo for stort på det.
Pappa hadde ikke nok penger, og faren slo ham konkurs.
Faren hans, fotograf Dal, slo i bordet og sa nei.
Faren satte albuene mot bordplaten og slo fingertuppene lett mot hverandre.
Faren slo nesten glasset i bordet.
Far prest slo i prekestolen igjen.
Faren slår hånden i bordet.
Mer fikk hun ikke sagt før faren slo så hardt i spisebordet at en blomstervase falt ned på gulvet og gikk i tusen knas.

Likevel leder nok far i brutal slåing i tekstene. Men tallene må nyanseres.

Konklusjon

I dette innlegget har hovedpoenget vært å presentere data for å gi et inntrykk av hva slags informasjon som kan hentes ut av denne språkressursen, og for å vise at det er mønstre i fordelingen på verb av mannlige og kvinnelige handlere som det er verd å studere nærmere. Det er fremdeles behov for å kartlegge innslaget av feilanalyser i dette materialet, og eksempler må studeres inngående for at man skal kunne konkludere noe om årsakene til den observerte fordelingen. NorGramBank vil være tilgjengelig for slike videre studier.

‘bærene’ eller ‘bæra’? Nøytrum def. pl. i bokmål

Innledning

I alle intetkjønnsord i bokmål er det valgfrihet mellom endelsene -ene og -a i bestemt flertall: bærene eller bærafolkene eller folkaunntakene eller unntakatilfellene eller tilfellastandpunktene eller standpunktapåfunnene eller påfunnaprinsippene eller prinsippa, osv. Siden normeringen av norsk etter gjeldende retningslinjer skal ta utgangspunkt i hvordan skriftspråket faktisk utvikler seg og ser ut i tekstene, er det av interesse å undersøke i hvilken grad denne valgfriheten blir utnyttet. Vi skal ta utgangspunkt i bokmålstekstene i NorGramBank og se nærmere på hvordan endelsene ser ut i ulike substantiver og hos ulike forfattere.

Fordelingen blant substantivene

Globalt

Vi ser på på de følgende delene av bokmålstekstene i NorGramBank:

Avistekst: ca. 3,2 mill. ord
Sakprosa: ca. 11,2 mill. ord
Barnebøker: ca. 4,1 mill. ord
Romaner, også oversatte: ca. 27,5 mill. ord

 Vi tar ikke med stortingsforhandlingene, ettersom de også inneholder nynorsk, og det kan foreløpig ikke skilles fra. En oversikt over deltrebankene i NorGramBank finnes her; vi legger da til grunn de deltrebankene som er prefigert med nob-.

Først ser vi på fordelingen av
-a og -ene på tvers av alle intetkjønnssord i bestemt flertall og på tvers av alle deltrebanker og forfattere. Ca. 5400 ulike intetkjønnssubstantiver (inklusive en god del sammensetninger) forekommer i bestemt form flertall i korpus. Vi ser bort fra substantiver som forekommer mindre enn 10 ganger i denne formen. Denne begrensningen reduserer antallet relevante substantiver fra ca. 5400 til 976.


Globalt er tallene på forekomster av disse 976 intetkjønnssubstantivene da slik i bestemt form flertall:

-ene: 146 347
-a:  20 606

 Det vil si at 87,66 % av forekomstene av nøytrum def. pl. har endelsen -ene. Dette er likevel svært ujevnt fordelt mellom substantivene. Hele 17 992 av de 20 606 forekomstene med -a er former av substantivene barn og bein/ben og sammensetninger med dem som siste ledd.  Disse brukes nesten utelukkende med -a i alle former for bokmål, inklusive de mest konservative, og er også normert med -a i den uoffisielle riksmålsnormen. De er derfor ikke så informative om normvalg hos skribentene. Hvis vi da ser bort fra disse to substantivene, blir tallene slik:

-ene: 146 144
-a: 2 614

 

Blant intetkjønnssubstantiver bortsett fra barn og bein/ben har dermed 98,24 % av forekomstene i bestemt form flertall endelsen -ene.

De enkelte substantivene

Hvis vi rangerer de 976 intetkjønnssubstantivene som forekommer 10 eller flere ganger i bestemt form flertall, etter prosentandelen -ene i disse forekomstene, blir resultatet grafen nedenfor. Den horisontale aksen har da substantivene fra  dem med høyest til dem med lavest prosent -ene, og den vertikale aksen har prosentverdiene.

Av de 976 substantivene har 747, eller 77 %, bare -ene i bestemt form flertall. 942 substantiver, eller 97 %, har 80 % eller mer –ene i forekomstene av bestemt form flertall.

En tabell som viser data for det enkelte av de 976 substantivene, finnes på en egen side (på grunn av størrelsen) her:

Tabell 1:

Tabell over andel -ene vs. -a ved 976 substantiver

 

Substantivene i tabellen er sortert på samme måte som i grafen. I første kolonne står lemma, i annen kolonne antall former på –a, i tredje kolonne antall former på -ene, og i fjerde kolonne hvilken prosentverdi forekomstene på -ene utgjør av  samtlige forekomster (-a eller -ene), som vist i grafen.

Fordelingen blant forfatterne

Forfatterne er representert i trebanken med tekster av svært ulik lengde. Blant romaner og barnebøker finnes det også oversettelser, så der omfatter begrepet både forfattere og oversettere. Innenfor sakprosaen er de fleste forfatterne representert med betydelig kortere tekster. Ikke alle avistekstene har forfatteropplysninger.

Blant forfatterne av de ca. 50 millioner ords tekst vi ser på her, har 2099 forfattere én eller flere forekomster av intetkjønnsord i bestemt form flertall. Av disse ser vi bort fra dem som har mindre enn 10 slike forekomster. Da står vi igjen med 818 forfattere.

Som i forrige avsnitt ser vi bort fra substativene barn og ben/bein, siden de har -a i alle varianter av bokmål/riksmål. Av de 818 forfatterne med minst 10 forekomster av de relevante formene er det da 264 forfattere, altså 32 %, som har minst én forekomst med -a. Men fordelingen av lemmaer med denne bøyningen blant disse forfatterne er langt fra jevn.

Vi skal se på to sider av fordelingen av a-former blant de nevnte 264 forfatterne:

  1. Hvor mange og hvilke ulike substantiver med -a forekommer hos den enkelte forfatter, og
  2. Hvordan er fordelingen av -a og -ene hos den enkelte forfatter?

Antall ulike substantiver med -a pr. forfatter

Siden forfatternes tekster er av svært ulik lengde, er antallet ulike intetkjønnssubstantiver med -a i bestemt form flertall hos den enkelte forfatter av begrenset informasjonsverdi, men kan likevel gi en indikasjon. (Lenger nede skal vi også se på prosentandelen slike former utgjør av det samlede antall forekomster med -a eller -ene.) En tabell som viser dette, finnes på en egen side her: (NB! Ved oversatte romaner er det originalens forfatter og ikke oversetteren som er oppført i tabellen.)

Tabell 2:

tabell over antall ulike lemmaer med -a hos den enkelte forfatter

Ingvar Ambjørnsen skiller seg ut som forfatteren med flest ulike intetkjønnssubstantiver på -a i bestemt form flertall: 48. Det omfatter de følgende substantivene:

avisutklipp, besøk, dikt, dyr, dødsfall, eventyr, femtiår, folk, forhold, forsøk, førtiår, garn, hjerteslag, hjul, hus, høns, jern, kinn, klesskap, knep, kort, krav, lys, lår, mannfolk, navn, nesebor, nummer, opphold, ord, politifolk, pulsslag, skift, skritt, skudd, smørbrød, soverom, spor, stemmebånd, stempel, svar, svin, tjueår, trinn, vindusbord, øyelokk, øyenbryn, år

Blant forfatterne med få lemmaer med -a er det i stor grad de samme substantivene som går igjen fra forfatter til forfatter. Hvis vi rangerer substantivene etter hvor mange forfattere som har dem med -a i bestemt form flertall, får vi Tabell 3 . I denne tabellen begrenser vi oss ikke til de 818 forfatterne som har minst 10 forekomster av nøytra i bestemt form flertall, men tar med alle de 2099 forfatterne som har minst én forekomst av denne formen. For hvert substantiv viser tabellen hvor mange forfattere som har det med –a i def. pl, hvor mange som overhodet har det i def. pl., og hvor mange prosent de førstnevnte utgjør av de sistnevnte.

 

Tabell 3:

tabell over antall forfattere pr. substantivlemma med -a i bestemt form flertall


Fordelingen av –
a og -ene hos den enkelte forfatter

Antallet a-former alene forteller ikke hvor konsekvent en forfatter bruker a-former. For å få et bedre bilde av det, begrenser vi oss først til  den undermengden av de 976 substantivene som overhodet forekommer med -a i bestemt form flertall i NorGramBank. Det er 207 slike substantiver (når vi ser bort fra barn og bein/ben). Dernest skal vi se hvor stor prosentandel av disse som har -a hos hver forfatter. Her ser vi på antall tekstforekomster, og ikke på antall lemma, ettersom samme forfatter noen ganger kan bruke både -a og -ene ved samme substantiv. (Dette kan være velmotivert stilistisk variasjon, eller variasjon fra en bok til en annen, og behøver ikke å bety ‘inkonsekvens’). Hvis vi rangerer forfatterne etter denne prosentandelen a-former, ser toppen av listen slik ut:

Tabell 4:

Forfattere rangert etter prosentandel a-endelse i bestemt form flertall av intetkjønnsord (toppen av listen, > 9 %):

 

# –a # –ene Forfatter % –a
36 2 Torp, Arne 94,74
130 20 Eeg, Harald Rosenløw 86,67
7 3 Tennfjord, Ingvild Wedaa 70,00
7 4 Bjånesøy, Kjartan Brügger 63,64
12 7 Sande, Hans 63,16
51 30 Hinton, Susan E. 62,96
10 6 Hobbelstad, Inger Merete 62,50
8 5 Isbrekken, Ane Teksum 61,54
24 20 Nørstebø, Øyvind 54,55
16 14 Ringheim, Trude 53,33
43 38 Blomquist, Lise 53,09
11 10 Harsson, Margit 52,38
5 5 Land, Anita 50,00
29 31 Østby, Magnus 48,33
7 8 Nilsen, Paul Torvik 46,67
20 24 Jarlsbo, Rønnaug 45,45
5 6 Bakken, Jonas 45,45
16 24 Alver, Eirik 40,00
4 6 Agjeld, Jogeir Magnar 40,00
148 236 Halstvedt, Tor 38,54
16 28 Holt, Kåre 36,36
29 53 Nielsen, Unni 35,37
7 13 Amin, Samir 35,00
41 80 Schärer, Jon 33,88
9 18 Osland, Erna 33,33
22 45 Solbu, Erlend Lånke 32,84
3 7 Lønnebotn, Lasse 30,00
3 7 Samuelsen, Reidun J. 30,00
3 7 Wictorsen, Mari Lund 30,00
26 71 Svendsen, Randi Berge 26,80
49 147 Syvertsen, Håvard 25,00
12 37 Åmotsbakken, Tormod Kvithyld 24,49
19 61 Sørlle, Steinar 23,75
3 10 Robberstad, Hege 23,08
6 21 Løes, Synne Sun 22,22
55 197 Enger, Rolf 21,83
28 105 Zameenzad, Adam 21,05
9 35 Haagensen, Nils-Øivind 20,45
22 89 Knudsen, Sverre 19,82
134 545 Ambjørnsen, Ingvar 19,73
6 25 Hansen, Bo 19,35
2 9 Alm, Birgit 18,18
300 1383 Spilde, Ingrid 17,83
8 39 Frøytlog, Bente 17,02
26 127 Kolstad, Arild 16,99
6 30 Hjukse, Aase Vallevik 16,67
6 30 Holmedahl, Jostein 16,67
3 15 Rehman, Shabana 16,67
2 10 Aasbrenn, Magne 16,67
5 26 Holm, Magnus 16,13
8 42 Jenssen, Magnhild 16,00
5 27 Lyngheim, Milly 15,63
110 607 Rønning, Asle 15,34
7 39 Hoftvedt, Stein 15,22
34 201 Sverdrup, Kari 14,47
37 221 Hauger, Torill Thorstad 14,34
26 158 Larsen, Britt Karin 14,13
3 19 Vedum, Trond Vidar 13,64
5 32 Kildahl, Mari 13,51
10 65 Grinderud, Paal-André 13,33
4 27 Stene, Morten 12,90
9 61 Knudsen, Lise 12,86
10 68 Monsen, Marianne 12,82
7 48 Sæther, Eivind 12,73
15 111 Pedersen, Erling 11,90
2 15 Opedal, Hallgeir 11,76
2 16 Eriksen, Nina 11,11
4 33 Krogedal, Else Lien 10,81
4 34 Creaghan, Alison 10,53
5 43 Mills, Magnus 10,42
57 511 Nordahl, Marianne 10,04
4 36 Bye, Anders 10,00
1 9 Førde, Lars Engh 10,00
Hvis vi tar i betraktning alle de 818 forfatterne (og ikke bare dem med mer enn 9 % -a, som i tabellen over), blir kurven som nedenfor. Den viser prosentandel forekomster med -a blant disse 818 forfatterne.

Prosentandel -a blant forekomstene av bestemt form flertall (av de 207 substantivene som overhodet forekommer med -a i korpus) hos 818 forfattere:
 Mens tabell 2 lenger oppe viste det absolutte antall ulike substantiver den enkelte forfatter gav -a i bestemt form flertall, og hadde Ingvar Ambjørnsen på topp, viser Tabell 4 og grafen ovenfor hvor konsekvent den enkelte forfatter er i valget av -a i slike substantiver. Den store forskjellen i tekstmengde mellom forfatterne gjør likevel denne sammenligningen mindre informativ. I prosenttabellen kommer Arne Torp på topp med 94,74 % -a, mens Ambjørnsen er nede på 19, 73 % –a. Men mens Torp er representert med én artikkel på 483 setninger, er Ambjørnsen representert med åtte romaner på til sammen ca. 35 000 analyserte setninger. Det gir noe større rom for språklig variasjon.
Ambjørnsen bruker -ene i 79 substantiver (av vår gruppe på 207, altså de som overhodet forekommer med -a i korpus),  og til dels i de samme substantivene der han bruker –a i andre sammenhenger.  De 79 substantivene med -ene er de følgende, der de som også opptrer med –a hos Ambjørnsen, er markert med rødt:

 

ark, avdrag, baklys, barneår, bilde, blikk, bryst, bær, dekk, dikt, dyr, erme, eventyr, fjon, folk, forhold, førtiår, glass-skår, glass, hjul, hull, hus, høns, hår, kinn, kort, krav, kryp, ledd, lys, lår, mannfolk, merke, minne, minutt, navn, nesebor, ord, papir, politifolk, problem, resultat, rom, sekstiår, skap, skinn, skrik, skritt, skudd, smil, soverom, spann, spor, spørsmål, stearinlys, stempel, svaberg, sykehus, tak, tall, telt, tjueår, toalett, tog, trappetrinn, tredveår, trekk, trinn, ungdomsår, uttrykk, vindu, vindusbord, våpen, øre, øye, øyeblikk, øyelokk, øyenbryn, år

Et utvalg eksempler fra Ambjørnsen:

Som opptakten til et av de dårlige dikta til min fiende Gregor.
Og i det samme kom jeg til å tenke på diktene til Haakon Willum.
Ikke faen om jeg ville ta imot så mye som en forpult pfennig fra disse dyra.
Vi kunne høre dyrene bevege seg et sted i halvmørket.
Vi gikk forbi disse deppa folka og henvendte oss til ei ung dame i hvit uniform.
Ei ung jente tok til og med av seg jakka og la den under hodet mitt til folkene fra legevakta kom.
Det de ville, var å rette folks oppmerksomhet mot de jævlige forholda disse pelsdyra levde under.
For i de neste sekvensene gikk han og kameramannen rundt i den enorme hallen og filma disse «naturlige» forholdene.
Knøttsmå bur der hønsa ikke kunne bevege seg skikkelig.
Håret hans var vått av svette eller vann, kanskje blod, og hønsene kaklet og bakset rundt ham.
Jeg hylte av smerte, og så at det fossa blod ut av nesebora hans da han trakk seg tilbake.
Jeg hadde lagt merke til det – at neseborene hans sitret litt når han grublet på noe.
Etter badet og all maten var hun blitt tung i øyelokka.
Øyelokkene ble tunge som bly.

Arne Torp har -a i substantivene dyr, funn, hundreår, leveår, middelhavsland, ord, språk, spørsmål, tall, tegn og tilbud, og -enebilde og resultat (blant de 227 substantivene vi tar i betraktning).

I sum

Denne oversikten viser at bruk av -a i bestemt form entall av intetkjønnsord kvantitativt sett er et svært marginalt fenomen, i hvert fall i det utsnittet av utgitt bokmål som finnes i NorGramBank, både innenfor ordforrådet og blant forfatterne. Det er begrenset til en liten del av inventaret av intetkjønnssubstantiver, og blant dem igjen til dels til en begrenset del av forfatterne. Det kan likevel tenkes at det finnes argumenter for å opprettholde valgfriheten i hele denne kategorien av substantiver, men argumentene bør da formuleres og sammenholdes med de gjeldende retningslinjene for normering.

Substantivsjuke – epidemi eller hypokonderi?

Innledning

«Substantivsjuke» er en lidelse som rådgivere i godt språk regelmessig advarer mot. Språkrådet sier blant annet dette om fenomenet, under overskriften «Substantivtunge setningar»:

«Verbale seiemåtar gjev betre språk. Her finn du råd om korleis du kan unngå substantivsjuken.

«Potetene vart gjorde til gjenstand for langvarig koking» vil seia det same som at potetene vart kokte lenge. Setninga er døme på det som gjerne blir kalla «substantivsjuke». Kjenneteikn på på substantivsjuke i ei setning, eller ei substantivtung setning, er at setninga inneheld eitt eller fleire substantiv på -ing som er danna av eit verb, og eitt eller fleire innhaldstomme verb, dvs. verb som ikkje tilfører setninga noko meiningsinnhald (t.d. å gjera).»

Kjernen i problemet er altså substantiver på ‘-ing’ (og andre endelser som vi kommer til) som er avledet av verb – såkalte nominaliseringer. Ingressen begynner med et allment og umodifisert utsagn: «Verbale seiemåtar gjev betre språk.» Vi aner med én gang at avledede substantiver – verbalsubstantiver – er en uting, en slags forurensning av språket, og de mer tenksomme blant leserne kan komme til å lure på hvorfor språk i det hele tatt har kommet til å holde seg med slikt. Det sier teksten ingenting om. Eksempelet bekrefter denne følelsen: «Potetene vart gjorde til gjenstand for langvarig koking». Her er vi på et hverdagslig kjøkken med konkrete, kanskje til og med uskrellede, poteter og skal lage middag, og så begynner noen å uttrykke seg på den måten. De har åpenbart tilbragt for mye tid bak et skrivebord – dette lyder jo parodisk.

Parodisk er vel akkurat hva det er, for det er vanskelig å tro at dette kan være et autentisk eksempel (medmindre utsagnet var spøkefullt ment). Vi skal forfølge to spørsmål i denne forbindelse, med utgangspunkt i materialet i NorGramBank: Hvor utbredt er egentlig dette fenomenet, og i den grad det forekommer, i hvilken grad er det et problem?

Akkurat uttrykket gjøre til gjenstand for er svært sjeldent i dette materialet på ca. 70 mill. ord avistekst, populærvitenskap, stortingsforhandlinger, barnebøker og romaner. Vi finner 11  eksempler:

  1. Etablerte sannheter og/eller normer blir trukket frem og gjort til gjenstand for fornyet diskusjon. (forskning.no)
  2. – Artene bør settes på en offentlig «svarteliste» og gjøres til gjenstand for langsiktige informasjonstiltak gjennom ulike medier, står det i rapporten. (forskning.no)
  3. Det viste seg vanskelig å gjøre kulturen til gjenstand for vanlig myndighetskontroll, og det var også en utfordring å finne ut akkurat hva man skulle legge i begrepet. (forskning.no)
  4. Vi ønsker å gjøre en undersøkelse som i utgangspunktet er gjort til gjenstand for eksterne kritiske vurderinger både i faglig og ikke minst i etisk og rettslig forstand. (forskning.no)
  5. For å finne ut mer om et sosialt sjikt som i liten grad er gjort til gjenstand for forskning, har 113 høyt utdannede personer i det som tilsvarer det tyske Bildungsbürgertum eller den anglosaksiske upper-middel class blitt intervjuet. (forskning.no)
  6. Påståtte grove brudd på folkeretten bør kunne gjøres til gjenstand for en uavhengig gransking, om mulig for en domstol.  (Stortingsforhandlinger)
  7. Jeg mener at gasskraftverkene også skal gjøres til gjenstand for karbonprising, ikke i form av avgifter, men i form av karbonkvoter eller klimakvoter.  (Stortingsforhandlinger)
  8. Fremskrittspartiet mener at statens tildelingspolitikk, også gjennom Norsk kulturråd, bør gjøres til gjenstand for en kritisk gjennomgang, og at en ny politisk kurs kan være nødvendig.  (Stortingsforhandlinger)
  9. Hvordan reagerte du på å bli gjort til gjenstand for en slik tilnærming?
    (Vinduet)
  10. Med det oppvurderer en film, TV og popmusikk, som tidligere ble oversett av forskere, eller i hvert fall ikke gjort til gjenstand for vitenskapelige studier. (Upublisert sakprosa)
  11. Den underforståtte delen av kulturen som ikke tematiseres eller gjøres til gjenstand for debatt. (Sakprosa, bok)

I noen av disse ville en verbal erstatning antagelig være en forbedring:

1: gjort til gjenstand for fornyet diskusjon -> diskutert på nytt.
4: gjort til gjenstand for eksterne kritiske vurderinger -> vurdert kritisk av eksterne (vurderere).
8:  gjøres til gjenstand for en kritisk gjennomgang -> gjennomgås kritisk.
10: gjort til gjenstand for vitenskapelige studier -> studert vitenskapelig.
11: gjøres til gjenstand for debatt -> debatteres.

I 9 gir uttrykket så lite informasjon at man kunne vurdere erstatningen bli gjort til gjenstand for en slik tilnærming -> bli utsatt for dette.

Ved andre eksempler er det ikke fullt så enkelt. I 3 er det litt vanskeligere å se for seg en erstatning av kontroll med verbet kontrollere, men eksempelet kunne forsåvidt omskrives til Det viste seg vanskelig å oppnå at myndighetene kunne kontrollere kulturen på vanlig måte – om det skulle ansees som en forbedring (som er tvilsomt).

Hvorfor har språket så slike avledningsmuligheter? Å avlede et substantiv av et verb (kontrollere -> kontroll, undersøke -> undersøkelse, vurdere -> vurdering) innebærer å anskue verbalhandlingen som en abstrakt gjenstand. Det kan det være gode grunner til å gjøre. Med substantivets syntaktiske muligheter kan verbalhandlingen nå refereres til i ubestemt eller bestemt form avhengig av om den er kjent eller ikke (Kartleggingen danner grunnlag for valg av behandling), det kan lett skilles mellom ett og flere tilfeller av handlingen gjennom tallbøyning av substantivet (Den nye undersøkelsen avviser at tidevannsmålingene er for høye), og verbalhandlingen kan beskrives nærmere med adjektiver (Allianser bygger på strategiske vurderinger) og med sammensetningsledd som tilføyes og for eksempel uttrykker agens eller patiens for verbalhandlingen (myndighetskontrollhelsesatsing).

Men ingen ville vel betrakte noen av disse siste eksemplene som symptomer på substantivsjuke. Den diagnosen dukker opp først når nominaliseringen – det avledede substantivet – opptrer som objekt (eller mer generelt: argument 2) for et ‘innholdstomt’ verb, slik Språkrådet også sier i sitatet ovenfor. I det følgende skal vi se nærmere på slike kombinasjoner av et mer eller mindre ‘innholdstomt’ verb med nominaliseringer i NorGramBank, og forsøke å danne oss et bilde av hvor ofte en erstatning med et verbalt uttrykk er tilrådelig.

Metode for avgrensning av materialet

En oversikt over deltrebankene i NorGramBank finnes her. Fra dette materialet skal vi samle et inventar av kandidater for ‘substantivsjuke’, nærmere bestemt eksempler der et verbalavledet substantiv, f.eks. undersøkelse, er knyttet som ‘argument 2’ til et ‘innholdstomt’ verb, f.eks. utføre. Når vi sier ‘argument 2’, er det fordi vi ikke vil begrense oss til tilfeller der det står som objekt (Politiet utførte en undersøkelse av saken), men også få med tilfeller der substantivet er subjekt for en passiv versjon av verbet (En undersøkelse av saken utføres av politiet), og tilfeller der verbet står som adjektivisk partisipp til substantivet (En utført undersøkelse av saken). I alle disse tilfellene er undersøkelse semantisk argument 2 eller ‘patiens’ til predikatet utføre.

Den interesserte leser kan finne en kort beskrivelse av hvordan dette er analysert i NorGramBank, og hvordan man kan søke etter denne og andre slike konstruksjoner, her. På den siden beskrives også kort hvordan det materialet vi skal se nærmere på, er avgrenset på grunnlag av søk etter hyppige kombinasjoner i NorGramBank. Resultatet av denne søkbaserte avgrensningen er disse listene av uttrykk:

24 sentrale ‘innholdstomme’ verb og verbaluttrykk:

begynne med, drive, drive med, forestå, foreta, fullføre, få i gang, gjennomføre, gjøre, gå i gang med, holde på med, igangsette, innlede, iverksette, komme i gang med, planlegge, påbegynne, sette i gang, sette i gang med, sette i verk, starte, starte med, ta fatt på, utføre

De 38 vanligste verbalsubstantivene etter slike verb:

avvikling, behandling, bygging, endring, etterforsking/etterforskning, evaluering, fordeling, forvaltning, gjennomføring, gransk(n)ing, innføring, justering, kartlegging/kartlegning, kvalitetssikring, modernisering, måling, nedtrapping, omlegging/omlegning, omorganisering, omstilling, oppfølging, oppgradering, opptrapping, overvåk(n)ing, planlegging/planlegning, produksjon, registrering, revisjon, sats(n)ing, styrkelse/styrking, tilpasning, undersøkelse, utbygging, utredning, utvidelse/utviding, utvikling, vurdering, øk(n)ing

I det følgende skal vi se nærmere på hvor dominerende kombinasjoner av disse verbene med disse verbalsubstantivene er i tekstene, og i hvilke tilfeller det kan være aktuelt å vurdere en mer verbal uttrykksmåte.

Verbalsubstantiver i tekstene: Når er de sykdomssymptomer?

I første omgang ser vi på bokmålsdelen av NorGramBank samlet, og skal deretter skille mellom teksttypene.

Følgende tabell viser hvor hyppige de 38 verbalsubstantivene er sammenlignet med de verbene de er avledet av. Første kolonne viser grunnverblemmaet, annen kolonne viser antall forekomster av verbet, alle bøyningsformer, tredje kolonne viser verbalsubstantivlemmaet, og fjerde kolonne antall forekomster av verbalsubstantivet, alle bøyningsformer, og uavhengig av funksjon i setningen.

V Antall V N Antall N
avvikle 985 avvikling 308
behandle 9116 behandling 15128
bygge 11165 bygging 1807
endre 6753 endring 12177
etterforske 419 etterforsk(n)ing 1065
evaluere 986 evaluering 2327
fordele 1855 fordeling 2072
forvalte 1764 forvaltning 5267
gjennomføre 9943 gjennomføring 1676
granske 1634 gransk(n)ing 406
innføre 6075 innføring 1395
justere 772 justering 602
kartlegge 1766 kartlegging/legning 1404
kvalitetssikre 265 kvalitetssikring 516
modernisere 405 modernisering 620
måle 3952 måling 1838
nedtrappe/trappe*ned 187 nedtrapping 116
omlegge/legge*om 532 omlegging/legning 1019
omorganisere 92 omorganisering 368
omstille 100 omstilling 1738
oppfølge/følge*opp 6299 oppfølging 4747
oppgradere 200 oppgradering 353
opptrappe/trappe*opp 344 opptrapping 615
overvåke 807 overvåkning 1371
planlegge 4380 planlegging/legning 1895
produsere 4090 produksjon 5772
registrere 6793 registrering 612
revidere 1338 revisjon 824
satse 1445 sats(n)ing 7799
styrke 15532 styrkelse/ing 1254
tilpasse 2613 tilpasning 1113
undersøke 5672 undersøkelse 8225
utbygge 295 utbygging 3593
utrede 1399 utredning 2653
utvide 2642 utvidelse/ing 807
utvikle 9460 utvikling 19793
vurdere 9825 vurdering 6884
øke 32328 økning 4936

Tabellen viser stor variasjon fra verb til verb i hvor ofte nominaliseringen forekommer sammenlignet med grunnverbet. Grafen nedenfor viser nominaliseringene rangert fra de sjeldneste til de hyppigste sammenlignet med grunnverbene. De blå linjene viser ikke absolutt antall, men prosent verbalsubstantiv av de samlede forekomstene av vedkommende grunnverb og verbalsubstantiv:
 Vi ser at verb som styrke, registrere, øke, bygge og gjennomføre opptrer langt oftere enn sine nominaliseringer, mens omstille, utbygge, og satse er svært sjeldne sammenlignet med sine nominaliseringer.

Det ville være ille hvis disse tallene kunne anskues som en dokumentasjon av substantivsjuke, men det kan de heldigvis ikke. Ved de aller fleste eksemplene på nominaliseringer er ikke bruk av grunnverbet noe mulig alternativ. Nominaliseringene brukes som subjekter, som objekter for preposisjoner eller for verb som ikke kan kalles ‘innholdstomme’, og på andre måter der problemstillingen ikke oppstår. Her er et utvalg eksempler:

Den kraftige økningen i antall offentlige studieplasser er naturligvis også et ledd i myndighetenes sysselsettingspolitikk.
Ved Telemark Distriktshøgskole var utviklingen tilsvarende.
Oppgraderingen har gått så sent at SINTEF Energiforskning har sammenliknet driften av nettet som å vandre langs kanten av et stup.
«Unnskyld,» sa jeg, «men er hele undersøkelsen ferdig alt?»
Så lenge behandlingen pågikk, holdt han seg hjemme fra skolen.
Det betyr ikke at gjennomføringen av ingeniørutdanningene ikke kan bli mye bedre
Vi ser resultatene av en ganske naturlig utvikling som ethvert menneske går gjennom i denne fasen av livet.
Livet skal seire gjennom en behandling som tapper meg for enhver kraft.
Kunne du finne journalen hennes og få henne inn til undersøkelse?
Men nedtrapping på sprit ble gjerne til opptrapping.
Til tross for store økninger gjennom de siste fire-fem årene har folkekulturområdet blitt liggende litt etter.
Hun har sammenlignet utviklingen i Norge og Finland etter 1990, og rapporten hennes vekker oppsikt.
Når det gjaldt vurderingen av skyldspørsmålet for den anklagde, var det litt forskjell på det voldelige og det ikke-voldelige overgrepet.
Bare ett mislykket forsøk nå kan komme til å ødelegge hele behandlingen.
Klokken fire kom en søster og sa at det likevel ikke ble noen undersøkelse.
Vi har foreløpig få løsninger, men det er ingen tvil om at framtida vil innebære store omlegginger.
Høyres innvending mot budsjettet er ikke at det er økninger.

Faren for substantivsjuke oppstår først når nominaliseringene opptrer som argument 2 (altså som objekt for aktiv eller subjekt for passiv) til ett av de ‘innholdstomme verbene’ omtalt ovenfor. Men det blir ikke alltid sykdom av det da heller – som vi ser av slike eksempler som dette:

De gjennomfører behandlinger den etablerte legestanden kritiserer og kaller eksperimentelle.
Det handler om en garanti for straffrihet, sier han, og viser til at bare en tredjedel av nederlenderne som ber om eutanasi, blir innvilget hjelp etter at legene har gjort sine vurderinger.
Anders Behring Breivik sier han gjorde grundige undersøkelser for å finne ut om det faktisk var mulig å lage en bombe basert på kunstgjødsel.
Undersøkelsen er gjennomført av Statens Arbeidsmiljøinstitutt i samarbeid med Kreftregisteret og St. Olavs Hospital.
– En slik oppfølging har ikke vært gjort før i Norge, og er unikt også i internasjonal sammenheng, sier Hjemdal.
Trolig skyldes dette i stor grad kunnskapsmangel, noe som har medført at det ikke har vært mulig å gjøre rødlistevurderinger for mange av de artene det er få registreringer av.»
Vindkraftbransjen selv krever også et støttenivå på over 20 øre/KWh for å sette i gang nyutbygginger.
– Det er ikke så lett å drive undersøkelser her i byhallen.
– Jeg har ikke bedt om det, la han til, – det er ingen etterforskning å gjøre her som vi ikke kan gjøre selv.
han dem rundt i huset, så de kunne foreta sine undersøkelser.
Han mente så at vi burde komme ganske raskt inn for å starte behandling med AZT.
Sofie og jeg har i løpet av de siste ukene gjennomført en større filosofisk undersøkelse.
«En mann som heter Leroy Bushnell driver produksjonen, og det er flere andre som holder på rundt Fromberg og Blue Creek.
Selvsagt ble det hørt av naboene, men hva er mer naturlig enn at en ung mann gjør visse endringer i en leilighet når hans mor nettopp har gått bort?
Men siden vi som regel må slippe arrestanten løs igjen, foretar vi bestandig en vurdering først.
Hjemme igjen hadde han startet moderniseringer.
Er det da primært for valgkampformål at hele denne utredningen er iverksatt?
Rødt går til Økokrim fordi partiet ikke stoler på at Stortinget selv kan gjøre en troverdig og ansvarlig gransking.
Vi foretar inspeksjoner og revisjoner og kan ta stikkprøver, men til syvende og sist er det leverandørene og de som selger kosttilskudd som har ansvaret for at produktene er trygge og dokumentasjonen i orden, understreker Sommer.

Det er ikke uten videre enkelt å erstatte verbalsubstantivene i disse eksemplene med verb, ettersom de aktuelle verbene er transitive, og det ikke foreligger noen informasjon om objektene her. Vi kan f.eks. ikke erstatte de gjennomfører behandlinger i det første eksempelet med de behandler, ettersom det ikke står noe om hva eller hvem de behandler (ettersom det er irrelevant her), og det ville dessuten være vanskelig å få uttrykt innholdet i den etterfølgende relativsetningen. Tilsvarende gjelder for de etterfølgende eksemplene, selv om noen riktignok kunne ha brukt en intransitiv versjon av verbet, f.eks. Hjemme igjen hadde han begynt å modernisere.

For å finne klare eksempler på substantivsjuke må vi derfor antagelig begrense tilfellene ytterligere, og da først og fremst til slike som har en preposisjonsfrase med preposisjonen av etter verbalsubstantivet: En setning som Han gjennomfører behandling av pasienter er en kandidat for å bli erstattet med Han behandler pasienter, for der fremskaffer av-frasen et objekt til verbet. Da begrenser vi oss altså til eksempler som disse:

– Normalt tror jeg ikke det, man foretar vurdering av situasjonen og går til de aktuelle instansene for hjelp.
Nylig sendte han en begjæring til Den rettmedisinske kommisjon om at den skulle gjøre en vurdering av Jon Leikvams sakkyndige uttalelse i 1958.
Det tok seks uker før det lokale politiet etter massivt press startet etterforskning av drapet.
Familier med ett barn i barnehage og to høye inntekter fikk den største gevinsten etter at man startet innføringen av makspris.
Det er naturlig at idrettspresidenten igangsetter ekstern gransking av disse forholdene.
NTNU vil nå gjøre en ytterligere kartlegging av arbeidsmiljøforholdene, særlig i den mest kritiske perioden fra 1985 til 1989.
– I 1983 ble ungdommer som var 11, 13 og 15 år gamle undersøkt, og deretter ble det gjort tilsvarende undersøkelser av ungdommer med samme alder hvert tredje eller fjerde år.
De fleste nødvendige justeringer av kursen var foretatt, og hastigheten var økt.
Du gjør hverken deg selv eller kundene dine noen tjeneste ved å unnlate å foreta en personlig undersøkelse av områdene hvor motivene er hentet.
Gabe Lavery og hans bror Bob har drevet produksjon av hjemmebrent i huset til Trent, og de ville vite om Trent ville ha tilbake huset sitt.
– Jeg skal foreta en rutinemessig undersøkelse av fiskebrukets fryselagre, hvis det er det De sikter til? sa Moen rolig.
Jeg vet ikke hvordan jeg skal begynne dette, men jeg synes dere gjør en urettferdig behandling av meg.
Han likte å gå der ofte, se hvordan flekkene av snø skrumpet inn og starte planleggingen av hva han skulle plante denne våren.
Som representanten Klungland er vel kjent med, startet man behandlingen av denne saken på onsdag.
Jeg må si at jeg føler at vi sett fra vårt synspunkt slett ikke fikk gjort en forsvarlig behandling av dette.
I et møte i begynnelsen av september i Bergen ble hun informert om en rekke tiltak som selskapet hadde på trappene, og som de nå har startet gjennomføringen av.
Riksrevisjonen påpeker derfor igjen at toll- og avgiftsetaten fortsatt foretar manuell registrering av innsendte avgiftsoppgaver i avgiftsfastsettelsessystemet, AFS.
Det viser jo at vi har foretatt en svært grundig og seriøs behandling av opplegget til Fotballforbundet.
Det er et sterkt økende antall veiprosjekter i Norge som er finansiert gjennom at bompengeselskaper har lånt penger i markedet, for deretter å gjennomføre utbygging av veiprosjekter.
Siden perioden for denne opptrappingsplanen ennå ikke er løpt ut, og man følgelig ikke kan foreta en endelig evaluering av virkningene av tiltakene i planen, bør saken holdes åpen.
Venstre mener nå er tidspunktet kommet for å foreta en evaluering av regelens første ti år.
Fremskrittspartiet mener at det nå er på sin plass å gjennomføre en nedtrapping av avgiftene på bensin og diesel.
Kontroll- og konstitusjonskomiteen kan imidlertid igangsette en hvilken som helst undersøkelse av forvaltningen, også underveis i gjennomføringen av offentlige prosjekter.

Her er det flere kandidater for erstatning med verb, f.eks. i de første eksemplene:  man vurderer situasjonen, den skulle vurdere Jon Leikvams sakkyndige uttalelse, det lokale politiet  begynte å etterforske drapetosv. Men noen ganger blir det ulike nyanser. At «idrettspresidenten igangsetter ekstern granskning av disse forholdene» betyr ikke det samme som at han gransker disse forholdene eksternt – å igangsette en granskning innebærer ikke nødvendigvis at man selv er agens for granskningen. I andre tilfeller har verbalsubstantivet modifikatorer som hører substantiver til, og som det ikke vil være lett å gjengi innholdet i hvis man erstatter med verb – f.eks. uttrykket hvilken som helst i eksempelet «Kontroll- og konstitusjonskomiteen kan imidlertid igangsette en hvilken som helst undersøkelse av forvaltningen».

Hvis vi nå altså begrenser tilfellene til verbalsubstantiver som opptrer som argument 2 til ‘innholdstomme’ verb, og videre til slike som dessuten har en av-frase etter seg, blir tallforholdene annerledes. I skjemaet nedenfor gjentas den totale frekvensen for verbalsubstantivene i annen kolonne. I tredje kolonne står det antallet av disse som opptrer som argument 2 til et ‘innholdstomt’ verb, og i fjerde kolonne antallet av dem som dessuten er etterfulgt av en av-frase:

N Totalt antall Antall ARG2 Antall ARG2 + av
avvikling 308 4 4
behandling 15128 273 46
bygging 1807 103 47
endring 12177 1027 24
etterforsk(n)ing 1065 101 16
evaluering 2327 228 90
fordeling 2072 22 7
forvaltning 5267 46 10
gjennomføring 1676 17 14
gransk(n)ing 406 42 12
innføring 1395 10 8
justering 602 94 10
kartlegging/-legning 1404 158 67
kvalitetssikring 516 39 10
modernisering 620 27 15
måling 1838 225 38
nedtrapping 116 6 6
omlegging/-legning 1019 54 15
omorganisering 368 25 6
omstilling 1738 121 8
oppfølging 4747 31 15
oppgradering 353 26 16
opptrapping 615 23 4
overvåkning 1371 40 14
planlegging/-legning 1895 62 19
produksjon 5772 86 22
registrering 612 38 14
revisjon 824 55 18
sats(n)ing 7799 122 5
styrkelse/ing 1254 15 9
tilpasning 1113 55 5
undersøkelse 8225 842 106
utbygging 3593 89 32
utredning 2653 191 37
utvidelse/ing 807 25 10
utvikling 19793 109 20
vurdering 6884 773 223
økning 4936 30 5

Nedenfor vises disse tallforholdene grafisk. Som i grafen ovenfor viser de blå linjene hvilken prosentandel som samtlige forekomster av et verbalsubstantiv utgjør av av det totale antallet grunnverb + verbalsubstantiv. De røde linjene viser hvilken andel av disse som står som argument 2 til et ‘innholdstomt’ verb, og de grå linjene hvilken andel av disse igjen som dertil har en av-frase og dermed er de sentrale kandidatene for diagnosen ‘substantivsjuke’. Det er viktig å huske at lengden på linjene viser prosentandel av de totale forekomstene av det enkelte verb + verbalsubstantiv, og ikke absolutte antall. Således representerer den grå linjen ved oppgradering nedenfor 16 forekomster, mens den mye kortere grå linjen ved det langt mer frekvente ordet undersøkelse representerer 106 forekomster.

Substantivsjuke er altså å finne innenfor de grå linjene, og kanskje i litt av de røde fortsettelsene. Grafen etterlater ikke et inntrykk av at vi står overfor en epidemi.

Substantivsjuke later til å være et marginalt fenomen i tekstuniverset i bokmål, men det kan være av interesse å sammenligne situasjonen i ulike teksttyper.

Rammede teksttyper

Forekomstene av den virulente konstruksjonen med verbalsubstantiv som argument 2 til et ‘innholdstomt’ verb pluss av-frase er ujevnt fordelt mellom teksttypene. Oversikten over deltrebankene i NorGramBank og hva slags teksttyper de representerer, finnes på en egen side her. Tabellen nedenfor viser hvilke deltrebanker som har den omtalte konstruksjonen. Annen kolonne viser antallet forekomster av konstruksjonen i hver deltrebank, og tredje kolonne viser hvor mange ganger fenomenet da gjennomsnittlig opptrer pr. 10 000 setninger.

Trebank Antall ARG2 +av Antall/10000 setn.
nor-stortinget 168 9,35
nor-stortinget_2 152 7,96
nor-stortinget_1 152 7,39
nor-stortinget_3 145 7,11
nor-stortinget_4 99 6,31
nob-fn 229 5,47
nob-ndt-lfg 5 2,81
nob-lbk-sa 41 2,52
nob-avis 24 1,07
nob-novel_5 4 0,09
nob-novel_3 2 0,04
nob-novel_2 2 0,04
nob-novel 1 0,04
nob-child 1 0,03
nob-novel_1 1 0,03

Det fremgår av tabellen at man ikke behøver å lese stort mer enn 1300 setninger av stortingsforhandlingene før man kommer over et tilfelle av mulig substantivsjuke. I den populærvitenskapelige forskning.no (nob-fn) må man lese 1800 setninger, mens annen sakprosa (nob-ndt-lfg, nob-lbk-sa) krever tålmodighet i oppimot 4000 setninger. Av skjønnlitteratur (når vi inkluderer nob-novel_4, som ikke hadde noen eksempler) må man utholde ca. 250 000 setninger før man kan gjøre seg håp om å oppleve fenomenet. Det samlede skjønnlitterære antall i dette materialet, 11, er ikke høyere enn at vi kan tillate oss å sitere alle:

De fleste nødvendige justeringer av kursen var foretatt, og hastigheten var økt.
Du gjør hverken deg selv eller kundene dine noen tjeneste ved å unnlate å foreta en personlig undersøkelse av områdene hvor motivene er hentet.
Ja, han fortsatte under hele eksiltiden, gjorde bare små justeringer av programmet etter hvert.
Et titalls cellulosefabrikker hadde drevet produksjon av råmaterialer til papirindustrien med dette vassdraget som hovedvei.
Gabe Lavery og hans bror Bob har drevet produksjon av hjemmebrent i huset til Trent, og de ville vite om Trent ville ha tilbake huset sitt.
– Jeg skal foreta en rutinemessig undersøkelse av fiskebrukets fryselagre, hvis det er det De sikter til? sa Moen rolig.
Jeg vet ikke hvordan jeg skal begynne dette, men jeg synes dere gjør en urettferdig behandling av meg.
Senere hadde de startet produksjon av kopra..
Jonas tar seg i å foreta vurderinger av gode og dårlige gravsteder langs veien mens han kjører.
Donald gikk ut av bilen og utførte en rask undersøkelse av Hall Bros.
Han likte å gå der ofte, se hvordan flekkene av snø skrumpet inn og starte planleggingen av hva han skulle plante denne våren.

Som konklusjon ser det ut til at vi kan friskmelde bokmål som helhet. Det er ikke en substantivsjuk målform, selv om det finnes områder i tekstuniverset som bør holdes under avslappet oppsikt.

Brukes passiv?

Innledning

Blant de mange unyanserte råd som gis til norske skoleelever, studenter og andre som skal skrive, er at de ikke bør bruke passiv. Eksemplene som listes opp til skrekk og advarsel, utstyres gjerne med noen ekstra papirknitrende ord i tillegg til selve passiven, så poenget skal bli riktig tydelig. Et par eksempler:

(1)
«Skrivetips: unngå passiv. Passivformen er farlig i dokumentasjon fordi den ikke sier hvem som gjør hva: Ikke skriv: Skifting av toner utføres etter 2000 sider . Skriv heller: Du må skifte toner etter 2000 sider.»

(2)
«Unngå passiv – ta ansvar i teksten. En aktiv setning gjør språket ditt klarere, og du unngår å bli misforstått. For at leseren din skal kunne handle riktig, må du få tydelig fram i teksten hvem som skal gjøre hva. Ikke skriv: Jeg kontaktes på telefon eller e-post med forslag til møtetidspunkter. Men slik: Du kan ringe meg eller sende en e-post med forslag til møtetidspunkter.»

I eksempel (1) ville Toner skiftes etter 2000 sider være den enkle passive versjonen av den anbefalte setningen, men verbet utføres sammen med substantiveringen skifting er egnet til å få leseren til å nikke samtykkende: Dette er tørre greier. Det samme gjelder kontaktes på telefon sammenlignet med ringe meg  i eksempel (2). Men slikt må nok til for å få passivene til å se tilstrekkelig skremmende ut. Forøvrig sies det bare generelt og uten begrunnelse at passiv er farlige greier, og at aktiv gjør språket klarere. Man kan jo undres over at så mange språk overhodet har utviklet dette dysfunksjonelle redskapet når det bare fører til elendighet, og tydeligvis unngås av dem som vil uttrykke seg klart. (Jeg har brukt ikke mindre enn fem passiver hittil i denne teksten, så jeg har åpenbart noe å skjule.)

Råd av denne art er tilnærmet grunnløse. De innebærer at viktige deler av språkets uttrykksforråd settes på en slags indeks, med et fattigere og snevrere språk som et mulig resultat, i den grad rådene følges. Nå er det riktignok ingen tvil om at passiv også kan brukes retorisk til å depresisere et innhold som skriveren ikke vil skal bli altfor avslørende detaljert – noe det kan være interessant å studere og kritisere når det forekommer. Men å la det føre til en generell fraråding av passiv er på linje med å fraråde enhver bruk av hammere fordi de kan brukes til å slå folk i hodet med.

Hva er passiv?

Verb – reparerer, arbeider, gir, antar, bruker, liker – er de sentrale ordene i sine setninger og forteller hva som foregår, gjøres, eller er situasjonen. Verbene forutsetter et større eller mindre antall deltagere i de beskrevne situasjonene, som kan identifiseres ved hjelp av subjekter, objekter og lignende. Den deltageren som identifiseres av subjektet – f.eks. Per i Per reparerer sykkelen eller læreren i Læreren liker Mozart – fremstår typisk som den mest prominente deltageren i situasjonen, den som setningen først og fremst handler om.

Passiv gjør det mulig for andre deltagere å være prominente.

Dette skjer ved at man gir verbet en passiv markering – på bokmål f.eks. med en -s eller på nynorsk en -st, eller med hjelpeverbet bli eller være Dette utstyret brukes sjelden, Sykkelen blir reparert på torsdag. Den første setningen handler nå om utstyret, ikke om dem som bruker det, og den andre om sykkelen, ikke om den som reparerer den. Dette skjer ved at passiv gjør det mulig for dette utstyret og sykkelen  å være grammatisk subjekt. Passiv lar oss med andre ord tilpasse setningens form til kommunikasjonens behov der og da. Det som er tema i kommunikasjonssituasjonen, kan gjøres til subjekt. Dette er et redskap vi ønsker å beholde.

Norsk (og til dels skandinavisk forøvrig) skiller seg ut fra mange av våre nabospråk ved å ha en særlig rik flora av passivtyper, noe som gir språket en spesiell fleksibilitet (og noe som gjør det særlig destruktivt med generelle frarådinger av passiv, istedenfor instruksjon i bruk). En konsekvens av disse mulighetene er at den talende ikke behøver å ha planlagt sin setning helt til ende før han eller hun begynner å snakke. Vi kan, enkelt sagt, bare begynne med å benevne den personen eller tingen vi vil si noe om, og så stole på at språkets passivmuligheter lar oss formulere en velformet setning deretter, nesten uansett hvilken rolle den vi snakker om, spiller i situasjonen. For det er ikke bare direkte objekter vi kan gjøre til subjekter i norske passivsetninger. To eksempler fra en nett-diskusjon:

Få personer ville ropt og klaget om man ikke ble holdt oppe døren for.
Å holde dører oppe for folk eller å bli holdt døren åpen for skaper begge store problemer

I første eksempel er få personer tema, og så skal man snakke om en situasjon der noen ikke holder døren åpen for disse få personene. Med passiv kan vi da hente dette subjektet helt nede fra objektet for preposisjonen for, og slik la temaet bli subjekt. I annet eksempel er det tale om to roller man kan ha, koordinert med eller, der det er passiven som gjør en slik koordinasjon mellom to å-infinitiver mulig, når de to rollene det er tale om, er så ulikt plassert i situasjonen. Eksemplene illustrerer den fleksibiliteten passiv gir.

Norsk tillater også passiv av intransitive verb – verb som ikke tar objekt, som arbeide, sove, leke, snakke. Det kan skje som nettopp vist ved at et preposisjonsobjekt blir subjekt:

På det tomme barnerommet, der lekene ikke blir lekt med og sengen ikke lenger blir sovet i(avistekst)
Studentene øver seg på å se hvordan menneskerettigheter kan argumenteres for i ulike situasjoner i ulike land. (sakprosa)
Selv om anlegget er enormt, er det universets minste byggesteiner – partiklene – som skal eksperimenteres med, slik at de forhåpentligvis avslører noen av sine hemmeligheter. (sakprosa)

Eller det kan skje ved at subjektet er et tomt det, når selve handlingen er tema og identiteten til de handlende er irrelevant:

Det snakkes på bygda. (romantekst)
Derfor arbeides det for å forbedre produksjonen. (sakprosa)
Men det ble arbeidet intenst med saken. (romantekst)

Nok en passivtype er den ‘komplekse’ passiven, der en serie av innordnede verbalhandlinger pakkes sammen under et felles subjekt:

De fleste er antatt dokumentert tatt av kongeørn. (stortingsforhandlinger)

Utgangspunktet er at noen antar at noen andre har dokumentert at kongeørn har tatt de fleste. Alle tre verb settes i passiv partisippform, og frasen de fleste, semantisk sett deltager bare i ta-situasjonen, blir felles subjekt for dem alle. Dette er økonomisk og kompakt uttrykt, velegnet for overskrifter, for eksempel, men det illustrerer også en lite muntlig passivtype som ikke er typisk for en ledig stil.

Også passive partisipper som brukes adjektivisk, er eksempler på passivformer av verb, selv om de ikke inngår i noe verbal og derfor ikke danner passive setninger:

Det ambisiøse målet i planperioden er å halvere antallet drepte og skadde i vegtrafikken. (stortingsforhandlinger.)
Derfor fremmer regjeringen forslag om en reform for redusert byråkrati og økt effektivitet i staten. (stortingsforhandlinger.)

Passiv i tekstene

Trebanken NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Når vi skal undersøke hvordan passiv fordeler seg på de ulike teksttypene, finnes det flere måter å telle på. Her skal vi gjøre et lite utvalg, og begynner med å se på hvor mange prosent av setningene i en tekst som inneholder minst én passiv verbform av en eller annen type. Hvis vi rangerer deltrebankene etter denne prosenten, kan det være interessant å sammenholde resultatet med det målet på syntaktisk kompleksitet som er diskutert i et annet blogginnlegg her (Setningskompleksitet: et mål på lesbarhet?), basert på antall leddsetninger og grad av underordning av leddsetningene i gjennomsnittlige helsetninger. Tabellen nedenfor viser i hvilken grad slik syntaktisk kompleksitet er korrelert med passivbruk i deltrebankene:

Deltrebankene rangert etter passivbruk

Deltrebank % setn. med passiv kompleksitet
1. nob-fn 23 82
2. nor-stortinget_1 20 112
3. nor-stortinget_2 20 113
4. nor-stortinget 19 107
5. nor-stortinget_3 19 110
6. nor-stortinget_4 18 97
7. nob-lbk-sa 17 67
8. nob-ndt-lfg 16 60
9. nob-lbk-av 15 55
10. nno-nnk-sa 14 55
11. nob-avis 12 59
12. nno-nnk-av 12 58
13. nob-novel_5 6 44
14. nob-novel_4 6 47
15. nob-novel_2 6 48
16. nob-novel 5 46
17. nob-novel_1 5 44
18. nob-novel_3 5 46
19. nob-child 5 42
20. nno-novel 4 41
21. nob-lbk-tv 4 26
22. nno-child 3 37

Tabellen viser at tekster av samme art danner klynger med tilnærmet samme verdi i rangeringsordenen for passivbruk, f.eks. stortingsforhandlingene (nor-stortinget, 2 – 6) én klynge og bokmålsromanene (nob-novel, 13 – 18) en annen. Det bestyrker inntrykket av ensartethet innenfor disse teksttypene. Grafen nedenfor viser korrespondansen mellom de to variablene passiv og kompleksitet, der blått er prosentdel setninger med passiv og orange syntaktisk kompleksitet (to forskjellige mål, så det er bare kurvenes form som er relevant for sammenligningen):

De samme klyngene som ble nevnt ovenfor – stortingsforhandlinger og skjønnlitteratur – finner vi i rangeringen av kompleksitet. Det er særlig én deltrebank der de to variablene ikke korresponderer: nr. 1 nob-fn, det populærvitenskapelige nett-tidsskriftet forskning.no. Den er på topp i frekvens av passiv, men rangerer lavere enn stortingsforhandlingene i syntaktisk kompleksitet. Det er nærliggende å tenke at temaet vitenskap, med stor vekt på å fremstille hendelser og prosesser uten aktive handlere, motiverer bruk av passiv, mens det populærvitenskapelige formålet motiverer lavere syntaktisk kompleksitet. Stortingsdebattantene (2 – 6) behøver i mindre grad å ta slike formidlingshensyn.

Det er hovedsakelig i stortingsforhandlingene at vi kan finne setninger som denne, som skårer høyt etter kompleksitetsmålet:

Det flertallet i den norske befolkningen som ser problemer med at Norge vedtar mye politikk som den norske befolkningen ikke ønsker, fordi mange partier, i motsetning til de rød-grønne, ikke tør å bruke reservasjonsretten selv når det er veldig viktig, er problemstillinger som Høyre bør tenke over.

Noen eksempler på  passivbruk i nr. 1 nob-fn – forskning.no:

Alle ble målt og veid, ulike prøver ble tatt og noen ble utstyrt med måleinstrumenter av forskjellig slag.
Forskerne mener at giften Akrylamid dannes når mat friteres, stekes eller grilles, og de tror stivelsen omdannes til akrylamid når karbohydratene i maten varmes opp.
– Dersom det da skulle bli oppdaget noe som gjør at fisken ikke kan selges og må destrueres, kan skaden begrenses til akkurat den fisken det gjelder.
De fleste stedene som er rammet av sykdommen anbefales det imidlertid at mennesker som har vært utsatt for SARS holdes i karantene i bare ti dager.
Størstedelen av avfallet må bli konsumert under operasjonen, og mesteparten av energien som produseresgjenvinnes og brukes.
Behandling som utøves i helsetjenesten eller av autorisert helsepersonell, omfattes likevel av begrepet alternativ behandling når det brukes metoder som i all vesentlighet anvendes utenfor helsetjenesten.
Alternativ medisin blir ofte definert opp mot skolemedisinen, som den medisin som er akseptert og autorisert av myndighetene og som undervises på våre universiteter..
– Grunnen er at alle ulvene som blir overkjørt og drept vil bli funnet og rapportert inn til myndighetene, sier Linder Olsen.

Også den nynorske sakprosaen bruker passiv, om enn i mindre omfang. Her er noen eksempler fra nr. 10 nno-nnk-sa (sakprosa fra korpuset til Norsk Ordbok):

Han vart både hylla og heidra og prisa med kritikarpris.
Smaksstandardar skal utviklast og hevast, folket skal utfordrast med kvalitetstilbod i foredrag, kunst og kultur.
Rett før krigen blei det utvikla ein modell som gjekk på akkumulatorbatteri og samtidig blei det laga små vindmøller som kunne brukast til å lade batteria.
Svara må forståast innanfor rammene av dei programtypane som blei ramsa opp (det manglar til dømes nyheitsprogram), og innanfor rammene av kva som faktisk blei sendt:
Fisken måtte fangast, konserverast og førast til ein marknad.
I det første svenske avtaleutkastet heitte det at Noreg vart avstått til Sverige og skulle inkorporerast eller innlemmast i det.
Ein vanleg kuppel av opalglas kastar nokre strålar mot vegg og tak slik at dei blir kasta tilbake derifrå, medan nokre strålar blir kasta direkte mot den staden som skal lysast opp.
Dei blir pressa for pengar, valdtekne og banka opp, og maten deira blir stolen frå dei.

-s/-st-passiv

Den morfologiske passiven på -s (bokmål) og -st (nynorsk) brukes i alle deltrebankene, men det er vanlig å tilskrive den ulik status i de to målformene. -s/-st kan tilføyes både finitte verbformer (presens og preteritum) og infinitivsformer:

Presens:
Maten stekes.
Om kvelden samlast bøndene på nytt til messe.

Preteritum:
Øynene fyltes av tårer.
No tømdest husa om dagen.

Infinitiv:
Hjertet slo så det måtte høres.
I kveld skal han drepast.

I nynorsk er det likevel en formidlet norm at st-passiv bør unngås i finitte former og helst bare brukes i infinitiv, altså helst bare i eksempler som det siste ovenfor. Det kan derfor være av interesse å se om denne normen har synlige utslag i tekstene. Tabellen nedenfor viser hvilken prosent av s-/st-formene i hver deltrebank som er finitt (presens eller preteritum); de resterende er da infinitiv. Det er likevel viktig å vurdere nærmere hvor mange av st-formene som virkelig er passive, og hvor mange som har andre funksjoner som ikke blir utelukket av den nevnte normen.

Prosentandel finitte -s/-st-former av samtlige -s/-st-former

Deltrebank % finitte -s/-st-former
nob-lbk-av 65,3
nob-avis 62,7
nob-fn 61,5
nob-ndt-lfg 60,1
nob-lbk-sa 59,0
nob-lbk-tv 58,1
nob-novel_3 56,0
nor-stortinget_4 53,6
nob-child 53,2
nor-stortinget_2 51,9
nor-stortinget_1 51,6
nor-stortinget_3 51,4
nob-novel_1 51,4
nor-stortinget 51,3
nob-novel_2 48,6
nob-novel_5 48,1
nob-novel 47,3
nob-novel_4 45,0
nno-child 44,8
nno-novel 37,2
nno-nnk-av 16,9
nno-nnk-sa 12,9


Noen av tallene kan være litt for høye på grunn av feilanalyser som ikke er sortert fra her, men de innbyrdes relasjonene mellom trebankene er antagelig riktige. Her samler de nynorske deltrebankene (nno-) seg i bunnen. På topp finner vi aviser og sakprosa på bokmål, og deretter skjønnlitteratur på bokmål og stortingsforhandlinger i en lite differensiert gruppe.

Eksempler på finitte st-former fra de nynorske tekstene viser at mange av dem ikke egentlig er passiver, og derfor ikke rammes av den nevnte normen. Eg minnest er ikke en passiv setning som betyr at noen minner meg, men en konstruksjon som uttrykker en ikke-agentiv tilstand eller overgang. Et utvalg eksempler, der de rimelig tydelige passivene er merket med rødt:

Men like etter hadde han sett seg ned på huk, og det høyrdest ut som han flytta eitkvart frå veska over til boksen.
Eg mintest første gongen eg fekk vita noko om han.
Litt etter litt fyltest plassen framfor bardisken opp, og inn i denne flokken kom Johan Ferdinand.
Ein stad, men ikkje i hotellet, høyrest felemusikk.
Dei som lukkast i å komme seg ut levande, klarar ikkje lenger å halde seg i ro.
Våpna rettast mot den indre fienden, som er den gode fienden.
I menneskas liv kjennest det stundom som om der var tankar bak alt som hende oss.
Kva slags personell er det som trengst for å handtera slike konfliktar?
Rundt om i landet samlast folk i studiesirklar.
Det krevst meir av dei.
Han bråbremsar, og ho høyrer noko som knusest mot fjellet.
Eit lite dyr føddest inne i meg.
Overgangen merkast knapt.
– Vi snakkast kanskje i Italia?
Slike ord kallast stikkord.
Som ville flyktningar kastast me mellom grensene for det me kan tåla.

Av de drøyt 1000 eksemplene fra de nynorske tekstene, inneholder over halvparten ett av de seks verbene synest, høyrest, kjennest, snakkast, møtest og trengst. Den nevnte normen setter dermed et rimelig tydelig preg på tekstene.

Passiv hos forfatterne

Vi skal se kort på hvordan passivbruken er fordelt mellom to grupper av forfattere: forfatterne av populærvitenskapelige tekster på forskning.no og forfatterne av bokmålsromaner. Blant de førstnevnte begrenser vi oss til forfattere som er representert med tekster på minst 20 setninger. Da er tallene 913 sakprosaforfattere og 343 skjønnlitterære forfattere.

I sammenligningen av deltrebankene sammenlignet vi prosentandelene av setninger som inneholdt minst én passiv verbform. Ved forfatterne ser vi bort fra adjektiviske partisipper (den fullførte romanen) og konsentrerer oss om verbale passiver, altså -s/-st-passiver og være/bli/vere/verte-passiver – det vil si morfologisk og perifrastisk passiv. For hver forfatter teller vi hvor mange morfologiske eller perifrastiske passiver som i gjennomsnitt opptrer pr. 100 setninger. Resultatet fremgår av grafen nedenfor, med én kurve for hver av de to forfattergruppene, der hver gruppe er ordnet langs x-aksen fra forfattere med mange til forfattere med få passiver.

Antall passiver pr. 100 setninger hos sakprosaforfattere og romanforfattere (bokmål)

Variasjonen er betydelig større hos sakprosaforfatterne, der antall morfologiske og perifrastiske passiver pr. 100 setninger går fra 74 til 0, mens romanforfatterne går fra 14 til 1. Vi skal eksemplifisere med tekstutdragfra tre av forfatterne, først Sonja Wilhelmsen (67 pr. 100 setninger):

Kunnskap og erfaring blir ofte oppnådd gjennom stor personlig og arbeidsrelatert risiko.
Imidlertid er kunnskaps- og erfaringsdeling viktig i disse organisasjonene fordi feilaktig eller villedende informasjon kan ha fatale konsekvenser.
Blant annet ses den enkelte yrkesgruppe og organisasjon som bærere av en spesifikk kultur.
Grensene mellom de ulike kulturer og organisasjoner blir identifisert som punkt der sammenbrudd i kommunikasjon og informasjonsdeling kan oppstå.
Disse funnene har ikke vært beskrevet tidligere.
Identifiseringen av disse punktene kan bidra til at misforståelser unngås og at informasjonsflyten samt kunnskaps- og erfaringsoverføringen forbedres i fremtiden.
I tillegg til identifiseringen av sammenbruddspunktene for kommunikasjon og informasjonsdeling har jeg utarbeidet en detaljert modell som viser hvordan innhentet informasjon transformeres gjennom de ulike fasene i etterforskningen.
Modellen er bygd på en klassifisering som tar hensyn til de overordnede spørsmålene i en etterforskning:
Et datamaskinbasert informasjonssystem bygd opp etter denne modellen kan brukes i opplæring av nye etterforskere samt gi støtte for den erfarne etterforskeren, spesielt i kompliserte saker der etterforskningen foregår over lang tid.
Jeg presenterte resultater fra forskningen i et prosjektarbeid der nye elektroniske hjelpemidler for politietterforskning ble vurdert.
Prosjektet var satt i gang av Politidirektoratet.
Selv om forskningen har fokusert på politietterforskning, er resultatene overførbare til andre områder som har et beslutningsgrunnlag bygd opp av ulike informasjonstyper og der informasjonen transformeres gjennom beslutningsprosessen.

Apropos de advarslene mot passiv som ble sitert innledningsvis: Det er vanskelig å se at denne teksten på noen måte lider av uklarhet, at forfatteren unnlater å «ta ansvar», eller at stilen skulle skape andre vanskeligheter. Den illustrerer heller hvordan passiv tillater at tekstens umiddelbare tema gjøres til subjekt hele veien, og hvordan dette skaper en langt smidigere informasjonsformidling enn om man hele tiden skulle ha forstyrret flyten ved å sette inn aktive subjekter.

Det neste utdraget er fra Wenche Bakkebråten Rasen, som har 0 forekomster av passiv – og illustrerer at det selvsagt er fullt mulig å skape en klar tekst også på den måten:

Læreplanen betyr lite for undervisningen
– Det kommer nye læreplaner ofte.
I sitt doktorgradsarbeid har Kleve studert matematikklæreres tolking og bruk av læreplanen L97 i ungdomsskolen.
Kleves forskning tyder på at det er for langt mellom intensjonene i læreplanene og lærernes undervisningspraksis.
Den viktigste faktoren for hvordan undervisningen foregår, avhenger mye av lærerens egne oppfatninger om hva som utgjør en god matematikkundervisning, og slike oppfatninger i møte med klasseromskulturen.
Kleve fant ulike typer føringer som påvirket lærernes tolking og bruk av læreplanen.
– Både foreldre og elever forventer en tradisjonell matematikkundervisning, med regler og øvelser.
Elevene ønsker å få ting vist på tavla, før de selv løser tilsvarende oppgaver.
Lærerne mente at tidsaspektet var viktig.
Hvis elevene skal utforske sammenhenger i matematikk selv, vil det ta lenger tid.
Læreren dominerte klasserommet på samme måte som i en mer tradisjonell undervisning.
Noen lærere hadde heller ingen tro på anbefalingene i L97, og dermed heller ikke noe ønske eller vilje til å implementere planen.
De var ikke interessert i nye undervisningsmåter, fordi de mente at den undervisningspraksisen de hadde gjennomført i mange år fungerte godt.
– Siden jeg startet ved Høgskolen i Oslo i 1994 har vi hatt tre ulike læreplaner:
– I tillegg ser jeg at etterutdanning i større grad bør ta utgangspunkt i lærernes ønsker om å utvikle sin undervisningspraksis.
Initiativet bør komme fra læreren selv. 

Til slutt tar vi med noen eksempler fra Knut Faldbakkens Insektsommer (4 pr. 100 setninger) for å illustrere passiv brukt i skjønnlitterær sammenheng. Siden passivtettheten er forholdsvis lav, er dette isolerte setninger og ikke sammenhengende tekst. Heller ikke her er det lett å finne grunner til advarsler mot passiv:

kanskje det var jeg som var i ferd med å forandres?
Forvirrende, avvikende betydninger kunne bli tolket inn i alt omkring meg, alt som hendte meg.
et kutt i fingeren var lett å hanskes med, andre anfektelser var verre.
Blikket hans som allerede var vendt innover mot egne, mer presserende anliggender.
– Og Jo ble konfirmert i vår?
Mer ble det ikke sagt om Jos konfirmasjon.
Men det var så mye som var endret siden den gang;
Hvis livet ennå dirret i et par av dem, ble seremonien gjentatt.
Etterpå ble J og P høytidelig markert på marmoren til evig tid.
Jeg hadde trodd man gikk med lange bukser når man var konfirmert.
De eldre pikene i klasser over kunne ikke regnes med, de virket storvokste og ganske fryktinngytende de aller fleste.
Film var blitt introdusert i bygda med det nye samfunnshuset.
Han adlød, og i samme øyeblikk ble min elendighet bønnhørt ved at det slo i hoveddøren og det klang stemmer over tunet.
– De vet nok hva de der skal brukes til de middelskolejentene!
Latteren til Jo var høy og skjærende, som før om årene når krefter var blitt prøvd og han så at han vant.
Jeg ville ikke flyttes opp på viderekommende-partiet.

Setningskompleksitet: et mål på lesbarhet?

Innledning

En trebank med utførlige syntaktiske analyser kan gi grunnlag for et mer nyansert mål på setningers kompleksitet enn f.eks. det mye benyttede lix, som bare tar hensyn til ren setnings- og ordlengde (se Wikipedia om lix/liks). Et slikt mer nyansert mål ville da selvsagt forutsette at de tekstene som skal måles, er analysert syntaktisk, men ved hjelp av en komputasjonell grammatikk som NorGram ville det i prinsippet være mulig å lage en trebank av en tekst tilnærmet automatisk, slik det har skjedd med NorGramBank. I dette innlegget vil jeg se nærmere på noe som kan tenkes som en komponent i et slikt mulig mål, og hvordan det slår ut på tekster fra NorGramBank.

Et mål på syntaktisk kompleksitet

En side ved syntaktisk kompleksitet som lix ikke tar hensyn til, er graden av innføying – altså i hvilken grad setningen har en hierarkisk struktur der fraser er innføyet i fraser som igjen er innføyet i fraser, osv. Her kan vi særlig tenke på en rekursiv struktur, som betyr at de omtalte frasene er av samme art – for eksempel leddsetning innføyet i leddsetning innføyet i leddsetning, osv. (Leddsetninger har alltid et finitt verb – et verb i presens eller preteritum – så vi tar ikke infinitivskonstruksjoner i betraktning her.) Blant de mange alternative målene på kompleksitet vi kunne definere, velger vi å prøve ut dette kriteriet. Vi vil da gi en setning en vekt som både tar hensyn til antallet leddsetninger i den, uavhengig av om de er innføyet i hverandre, og dessuten til dybden i en slik eventuell innføying. Vi vil anta at kompleksitetsvekten øker sterkere enn lineært med antallet «etasjer» i et slikt hierarki: Fire etasjer skal være mer enn dobbelt så tungt som to. Kompleksiteten i en tekst blir da setningenes gjennomsnittlige vekt.

I hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet, er et empirisk spørsmål som jeg ikke har undersøkt. Det kan være grunn til å mistenke at det kan bli noe for enkelt å ta denne kompleksiteten alene som et mål på lesbarhet, ettersom måten setninger er innføyet i hverandre på, åpenbart spiller en stor rolle for lesbarheten. En rent høyreforgrenet struktur, der leddsetninger står til slutt i de setningene de er innføyet i og ikke midt i eller nær begynnelsen, behøver ikke å være særlig tunglest i det hele tatt. Men det kan være interessant å utprøve en kombinasjon av slik kompleksitet med andre egenskaper ved setningen; det vil jeg komme tilbake til i senere blogginnlegg.

For å illustrere hvordan vi kan registrere antallet leddsetninger og graden av inføying gjennom søking i trebanken, må vi betrakte noen analyseeksempler. I eksemplene skal vi bruke grønn for leddsetninger på første nivå, blå for leddsetninger på annet nivå (altså innføyet i leddsetning på første nivå), rød for leddsetninger på tredje nivå, lilla for leddsetninger på fjerde nivå, grå for leddsetninger på femte nivå og fiolett for leddsetninger på sjette nivå. I en romantekst finner vi denne setningen:

(1) De så at han kvakk da hornsignalet lød

(1) inneholder to leddsetninger: (a) at han kvakk da hornsignalet lød og (b) da hornsignalet lød. (a) er innføyet i helsetningen (1), og (b) er innføyet i leddsetningen (a). (Vi ser bort fra den alternative tolkningen der begge leddsetningene står på samme (grønne) nivå og modifiserer helsetningen, altså verbet .)

Analysen av setning (1) i trebanken vises i figuren nedenfor:

C-strukturen viser setningens oppbygning av fraser og delfraser, f-strukturen viser en analyse i funksjoner og trekk. For vårt formål her skal vi konsentrere oss om c-strukturen:

Alle leddsetninger, også de uten subjunksjon (at, da, …), har en node kalt Ssub eller Ssub2. (Forskjellen mellom Ssub og Ssub2 har å gjøre med hvorvidt subjektet er obligatorisk og er ikke relevant her; vi vil referere til begge med Ssub*.) Denne noden kan vi derfor bruke til å telle leddsetninger, og til å registrere hvorvidt en leddsetning er inkludert i en annen. At en leddsetning er inkludert i en annen, fremgår av at en node Ssub* dominerer en annen node Ssub*. I tillegg til å telle leddsetninger, teller vi da også slike dominansforhold i setningen. I setning (1) har vi to noder Ssub* og ett dominansforhold mellom to slike noder, og dermed blir vekten av denne setningen 3.

For å se hvordan dypere hierarkier påvirker vekten, kan vi betrakte en mer kompleks setning fra trebanken:

(2) Metodikk som det kan dokumenteres at bidrar til en positiv utvikling for barna må få større plass i utdanningene, mens studenter i mindre grad trenger å lære om metodikk som en ikke kan dokumentere at virker.

C-strukturen for denne setningen vises nedenfor:

Grafen kan sees i større format her.

Setning (2) inneholder 5 leddsetninger, og c-strukturen har dermed 5 noder Ssub*, markert med rødt i grafen. Dessuten er det 4 dominansrelasjoner mellom Ssub*-noder (vi markerer direkte og indirekte dominans med ‘>*’):

#1 >* #2
#3 >* #4
#3 >* #5
#4 >* #5

Siden dominansforhold som det mellom #3 og #5, med en mellomliggende Ssub*-.node, også teller med, ser vi hvordan antallet dominansforhold øker mer enn lineært med tilføyelsen av nye nivåer i hierarkiet. Hvis D(n) er antallet dominansforhold i et hierarki med n nivåer, blir da forholdet slik:

D(1) = 0
D(n) for n > 1 = D(n – 1) + (n – 1)

Dette innebærer da at et hierarki av leddsetninger med f.eks. 5 nivåer vil få en dominansvekt på 10, som er verdien av D(5). Setning (2) har ett hierarki med  2 nivåer og ett med 3. Vekten for det første hierarkiet, D(2), er da 0 + (2 – 1) = 1, og for det andre, D(3), er vekten 1 + (3 – 1) = 3, til sammen for de to hierarkiene 4. Vekten for setning (2), når vi både teller leddsetninger og dominansforhold, blir dermed 5 + 4 = 9.

Vi kan nå registrere setningenes vekt ved å kombinere to søkeuttrykk. Uttrykket for å registrere dominansforhold er slik:

Ssub* >* Ssub*

Dette søkeuttrykket sier at en node Ssub* direkte eller indirekte dominerer en annen node Ssub*. Uttrykket finner alle setninger der dette er sant. Men i tillegg til å finne setningene, registrerer søkeprosessen også hvor mange treff uttrykket har i en viss setning. I setning (1) vil da uttrykket ha ett treff, og i setning (2) vil det ha 4. Antall treff kan da inngå i utregningen av vekten.

For å telle selve leddsetningene i en setning er det tilstrekkelig å skrive:

Ssub*

Dette søkeuttrykket finner alle setninger med minst én leddsetning, altså alle der minst én node har etiketten Ssub*. I tillegg, som ovenfor, registreres det hvor mange treff uttrykket har i en viss setning, altså antallet leddsetninger i dette tilfellet. Det gir 2 for setning (1) og 5 for setning (2).

Vi kan nå kombinere de to søkeuttrykkene i en enten/eller-forbindelse – en disjunksjon. I søkespråket uttrykkes disjunksjon med ( … | … ), så resultatet blir da:

( Ssub* >* Ssub* | Ssub* )

Dette uttrykket finner alle setninger der ett eller begge de to alternativene er sanne, og det registreres hvor mange treff i en setning vi da til sammen får.

Vi kan illustrere resultatet ved å bruke dette søkeuttrykket på to deltrebanker, nno-child, som er barnebøker på nynorsk, og nor-stortinget_1, som er en del av stortingsforhandlingene. Vi føyer til en referanse til ‘treebank’ for å få resultatene sortert etter trebank:

( Ssub* >* Ssub* | Ssub* ) :: treebank

Resultatet ser da slik ut:

Antall treff i de to trebankene er da summen av antall treff i hver setning, som er vårt mål på setningen kompleksitet. Vi ønsker ikke bare å registrere summen av alle setningenes vekt i en tekst, men også hvordan denne vekten forholder seg til det totale antallet setninger i teksten. Vi trenger derfor å telle de relevante setningene, som er de som har fått komplette analyser i trebanken (noen av setningene i trebanken har såkalte fragmentanalyser, men dem ser vi bort fra her). Alle slike setninger har en toppnode som heter ROOT. Vi kan da bruke søkeuttrykket:

ROOT :: treebank

Med uttrykket ROOT finner vi alle setninger med en node ROOT, det vil si alle fullstendig analyserte setninger i korpus. Resultatet ved søk i de to nevnte deltrebankene gir oss antallet relevante setninger i hver av dem:

For trebanken nor-stortinget_1 ser vi at vektsummen (193700) er større enn antallet setninger (173370), og den gjennomsnittlige vekten pr. setning er 193700 / 173370 = 1,117. For trebanken nno-child, derimot, er vektsummen (33248) mindre enn antallet setninger (90341), og gjennomsnittet pr. setning er 33248 / 90341 = 0,368. For å få måleverdier av samme størrelsesorden som lix ganger vi gjennomsnittene med 100, og får da:

Trebank

Kompleksitet

nor-stortinget_1

112

nno-child

37

Som ventet kommer stortingsforhandlingene ut med en betydelig større syntaktisk kompleksitet enn barnebøkene. En setning som (3) fra nor-stortinget_1 ligger ikke nær noe man vil vente å finne i en vanlig barnebok.

(3) Føler helseministeren at de situasjonene som har blitt beskrevet fra Ahus, tilfredsstiller det kriteriet som helseministeren da trakk opp, og som Stortinget var enig i, nemlig at det ikke skulle overføres pasienter før det var helt sikkert at pasientene skulle få et minst like godt tjenestetilbud ved Ahus som det de hadde før prosessen startet?

Som nevnt ovenfor er det et empirisk spørsmål i hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet. Men denne kompleksiteten kan likevel bidra til å karakterisere stilen hos en viss forfatter eller i en viss teksttype, og vi skal se litt nærmere på den.

Kompleksitet i deltrebankene

NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Hvis vi regner ut kompleksiteten etter våre leddsetningskriterier for hver av disse deltrebankene og rangerer dem fra mest til minst kompleks, får vi denne tabellen:

Deltrebanker rangert etter syntaktisk kompleksitet:

Deltrebank Kompleksitet
nor-stortinget_2 113
nor-stortinget_1 112
nor-stortinget_3 110
nor-stortinget 107
nor-stortinget_4 97
nob-sofie 86
nob-fn 82
nob-lbk-sa 67
nob-ndt-lfg 60
nob-avis 59
nno-nnk-av 58
nno-nnk-sa 55
nob-lbk-av 55
nob-novel_2 48
nob-novel_4 47
nob-novel_3 46
nob-novel 46
nob-novel_5 44
nob-novel_1 44
nob-child 42
nno-novel 41
nno-child 37
nob-lbk-tv 26

Rangeringen sorterer tydelig mellom de ulike teksttypene. På topp i kompleksitet kommer stortingsforhandlingene samlet. Så kommer Gaarders Sofies verden umiddelbart etter, og før sakprosa, avistekst og andre romaner. Med sitt filosofiske tema skiller den seg tydeligvis ut også syntaktisk. Etter Sofies verden kommer Forskningsnytt og annen sakprosa på bokmål, og så tre deltrebanker med avistekst med én med nynorsk sakprosa innimellom. Deretter har vi alle bokmålsromanbankene samlet, og så barnebøker på bokmål. Romaner på nynorsk kommer etter barnebøker på bokmål i syntaktisk kompleksitet, og til slutt barnebøker på nynorsk og TV-teksting. Vi ser en svak tendens til mer kompleksitet i bokmålstekster enn i nynorsktekster av samme type, men det kan være grunn til å tvile på at den er signifikant. I stortings-trebankene er det ikke skilt mellom bokmåls-og nynorskdelene.

Setningslengde varierer på lignende måte mellom trebankene, med kortere setninger nedover i hierarkiet ovenfor, og man kunne reise spørsmålet om i hvilken grad dette kompleksitetsmålet er en funksjon av setningslengde snarere enn en uavhengig egenskap. Det er åpenbart en sammenheng mellom dem (det er grenser for hvor mange selv korte leddsetninger man får plass til i en setning på 6 ord), men det er likevel ikke tale om en funksjon fra det ene til det andre – de to målene varierer også noe uavhengig av hverandre. Det kan best illustreres når vi betrakter kompleksiteten hos den enkelte forfatter.

Kompleksitet hos forfatterne

Det er også mulig å studere kompleksiteten i tekstene hos den enkelte forfatter ved de tekstene der forfatteropplysninger foreligger. Det er ikke tilfellet i stortingsforhandlingene, men forfattere er oppgitt for romanene, barnebøkene, sakprosaen og deler av avistekstene. Det totale antallet forfattere og grupper av forfattere (ved felles forfatterskap) i materialet er 2658, representert med tekster av svært varierende lengde. Hvis vi ser bort fra forfattere som er representert med færre enn 10 setninger, varierer kompleksitetsmålet fra 260 til 4.

I utregningen av setningslengde telles både ord og skilletegn. Vi kan betrakte samvariasjonen mellom kompleksitet og setningslengde ved å plotte forfatterne inn i et diagram med kompleksitetsmålet langs x-aksen og gjennomsnittlig setningslengde langs y-aksen.

Kompleksitet og setningslengde hos 2658 forfattere:

Tendensen til spredning langs en avlang sky fra nederst til venstre (lav kompleksitet, korte setninger) til øverst til høyre (høy kompleksitet, lange setninger) viser en viss samvariasjon, men det er også en del avvik fra denne linjen. Vi skal se på tekstutdrag fra de fire forfatterne som er markert med #1 – #4 i diagrammet.

#1 har verdiene 260,20 og skiller seg ut med relativt høye verdier i begge dimensjoner: høy kompleksitet og  lange setninger. Tekstutdrag:

Celler spiser kreften
Dette funnet kan bane veien for nye behandlingsformer mot kreft.
– Vi fant at selvspisingsmaskineriet, som vanligvis finnes i alle normale celler, var aktivt og bidro til å bryte ned PML-RARA i blodkreftcellene.
Akutt promyelocytisk leukemi var for bare noen få tiår siden en svært dødelig sykdom uten noe effektivt botemiddel.
– Dette er definitivt en av de største suksesshistoriene noensinne når det gjelder forskning som har ledet til effektiv kreftbehandling, uttaler Bøe.
Han forklarer videre at det er svært sjeldent at man treffer så bra med en målrettet kreftbehandling, og at han tror man ikke helt har forstått hvorfor denne terapien er så effektiv som den er.
Derfor har han lenge vært overbevist om at det her må finnes noen generelle prinsipper vi kan lære av og som kan være overførbare til behandling av andre krefttyper.
I tillegg forekommer det at pasienter med akutt promyelocytisk leukemi ikke blir fullstendig kurert av dagens behandling.
Proteinet PML-RARA holder blodkreftcellene i en umoden tilstand ved å hemme uttrykket av mange gener som er kritiske for deres normale utvikling.
Ved behandling med retinsyre blir mange av disse genene aktivert igjen. 

Setningene er informasjonsrike, men tekstutdraget illustrerer også at denne typen kompleksitet ikke har noen klart negativ virkning på lesbarheten. Det er en klar og presis fremstilling.

#2, en barneboktekst, er i motsatt ende av begge skalaer med verdiene 9,8: lav kompleksitet, korte setninger. Her er et utdrag:

Bø og Bæ i festhumør
Bø og Bæ pyntar seg.
Dei skal på fest hos Bo.
Det skal vere dans.
Bø må øve.
Kva heiter dansen?
Bø blir ør.
Han må kvile seg ei stund.
Bø og Bæ skal ha med ei gåve til festen.
Bo skal få ein båt.
Det er moro å pakke inn, synest Bø og Bæ.
Og lett når ein er to.
«Merkeleg,» seier Bø.
«Korleis gjekk dette til?»
Ein kartong er betre, synest Bæ.
Stødigare også, synest Bø.
Hyssing er finare enn teip.
Bo bur like ved.
Her bur Bo.
«Gratulerer, Bo!» seier Bø og Bæ.
Bo blir glad.
Bø og Bæ får kvar sin hatt.
Alle er der.
Bø og Bæ er svoltne.
Etterpå blir det dans.
Bø dansar godt!

#3, med verdiene 50, 24, har lav kompleksitet og høy setningslengde og illustrerer at de to verdiene i noen grad kan variere uavhengig av hverandre:

Er fiskefôret sunt?
Jeg forsker på bruk av genmodifiserte planteråvarer i fiskefôr, hovedsakelig til laks.
Dette er en svært relevant problemstilling for NIFES sin rolle som kunnskapsleverandør til forvaltningen i Norge.
Bruk av planteråvarer i fiskefôr som erstatning for fiskemel og fiskeolje er en nødvendighet både for å få til en mer bærekraftig produksjon og en videre vekst i produksjonen.
Flere av de aktuelle planteråvarene, som for eksempel soya, mais og raps, blir i stor grad dyrket som genmodifiserte (GM) varianter.
Dermed er det viktig å fremskaffe kunnskap om GM råvarene trygt kan benyttes i fôret uten noen effekt på fiskens vekst eller helse.
Kunnskap om mulige effekter av GM råvarer er svært viktig både for forvaltningen og næringa, slik at de kan ta sine avgjørelser basert på vitenskapelige data.
Fisken ble fôret gjennom 7 måneder, inkludert sensitive stadier i livssyklus som smoltifisering og utsett i sjø, og omfattende evalueringer ble gjort av fiskens vekst, utvikling og helse gjennom hele forsøket.
Jeg er oppvokst på kysten (Hvalerøyene i Østfold) med en far som er rekefisker, så det kan nok ha hatt innvirkning på interesser og utdanningsvalg (master i havbruksbiologi).
Da jeg skulle gå videre på doktorgrad, valgte jeg å spesialisere meg innen ernæring da dette gir varierte jobbmuligheter seinere, både for forskning i det offentlige og i privat industri

Her er den gjennomsnittlige setningslengden (i hele teksten) høyere enn hos #1, men innslaget av leddsetninger er betydelig mindre, og vi ser ingen eksempler på leddsetning inne i leddsetning i utdraget.

#4 med verdiene 183,15 er blant dem som kommer nærmest den siste mulige kombinasjonen – høy kompleksitet kombinert med lav setningslengde – eller i dette tilfellet middels setningslengde. Riktignok skyldes nok den lave gjennomsnittlige setningslengden i stor grad innslaget av korte overskrifter. Her er et utdrag:

Klisterforbud skaper trøbbel for Byåsen
Det skjer etter at Spektrum har tatt inn kommunens regler i hallen.
Klisteret brukes av spillerne for å få bedre tak på ballen, men setter samtidig merker på gulvet.
Sprayklister setter ikke like markante merker, men har kortere varighet.
– J12 – kamper
– Dette blir jo som å spille J12-kamper igjen, sier daglig leder i Byåsen, Torbjørn Balstad.
Argumentet til kommunen er at harpiksen som er i klisteret gjør at det blir merker på gulvet som er vanskelige å vaske vekk.
Men Balstad hevder at produsenten av klisteret de bruker nå, kan dokumentere at det ikke er harpiks i det.
– Hva skjer når det kommer motstandere hit som skal spille kamp mot oss?
Skal lag som Lubin og Larvik bruke sprayklister?
Tvilsomt, tror Balstad.
Klister av den gamle typen, som inneholder harpiks, brukes kun ved meget varme forhold i hallen, der vanlig klister kan bli for glatt.
– Det blir som å si at gutta på Lerkendal skal spille med fastknotter fordi skruknotter ødelegger gresset, sukker Balstad oppgitt.
Sier ikke kategorisk nei
Teknisk sjef i Trondheim Spektrum, Håkon Sjøhaug, avviser ikke at vanlig krukkeklister kan brukes, dersom det kan dokumenteres at det ikke inneholder harpiks.
Men vi har en god dialog med Balstad, som har gjort oss oppmerksomme på at det finnes krukkeklister uten harpiks, sier Sjøhaug.
Må ha databladet
– Ser du for deg at den kan vekke reaksjoner dersom storlag som Buducnost og Larvik kan bli nødt til å bruke sprayklister når de kommer hit for å spille kamp?
– Hehe, ja.
Og dersom vi har andre regler enn for eksempel i Larvik, så er dette uheldig.
Jeg mener vi bør få likt reglement på alle hallene i Norge.
Dersom det ikke er harpiks i klisteret, er vi åpne for å se på om det kan brukes.
Når vi får databladet fortsetter vi dialogen med Byåsen, sier Sjøhaug. 

Konklusjon

I dette innlegget har jeg sett på hvordan informasjon om en type syntaktisk kompleksitet kan hentes ut av trebanken og brukes til å karakterisere ulike teksttyper og ulike skribenter. Det gjenstår å se om akkurat denne typen kompleksitet er informativ om tekstegenskaper som er relevante for lesbarheten, men det kan være av interesse å kombinere dette kompleksitetsmålet med mål basert på andre tekstegenskaper som lar seg hente ut. Det vil jeg se på i senere innlegg.

 

 

‘den unge mannen’ eller ‘den unge mann’?

Innledning

‘Dobbelt bestemthet’ (også kalt ‘overbestemthet’) vs. ‘enkel bestemthet’ i skriftlig norsk blir noen ganger diskutert. Ved dobbelt bestemthet, som i den unge mannen, har vi en demonstrativ den eller denne, etterfulgt av et substantiv (mannen) som også står i bestemt form, eventuelt med mellomliggende adjektiver.  Ved enkel bestemthet, som i den unge mann,  står substantivet i ubestemt form.

Ulike egenskaper nevnes ofte som relevante for motsetningen mellom de to: mer norsk vs. mer dansk; mer muntlig vs. mer formell; spesifikt refererende vs. ikke-spesifikt refererende; konvensjonelt begrep eller navn vs. produktivt dannet frase. Spesifikk vs. ikke-spesifikk referanse kan illustreres med den eleven du traff i går (spesifikk elev) vs. den elev som opptrer slik (ikke spesifikk elev), eller der sitter den unge mannen (en spesifikk mann) vs. klær for den unge mann (i sin alminnelighet). Et konvensjonelt begrep har vi i den nye tid vs. den lange tiden; et navn i Det indiske hav vs. det dype havet.

Vi skal ikke gå inn på alle disse vurderingene her, men heller undersøke hva slags informasjon om denne motsetningen vi kan fremskaffe  gjennom søk i en trebank, som et mulig grunnlag for nærmere studier. Vi skal konsentrere søket om eksempler som har minst ett adjektiv mellom demonstrativen og substantivet, siden det først og fremst er ved slike eksempler at vi kan vente å finne et trykkløst (ikke-kontrastivt) den. Den som måtte være interessert i hvordan trebankanalysene ser ut, og hvordan søkeuttrykket formuleres, kan finne en kort beskrivelse av det her.

Enkel bestemthet i bokmål

Vi søker etter enkel og dobbelt bestemthet i ca. 46 mill. ord av bokmålsteksten i trebanken. Denne delen består av:

Avistekst: 3,2 mill. ord
Sakprosa: 11,5 mill. ord
Barnebøker: 4,1 mill. ord
Romaner: 27,5 mill. ord

De globale tallene i bokmålsdelen:

Frasetype Antall
Dobbelt bestemt

260 933

Enkelt bestemt

17 862

Dobbelt bestemthet er som ventet sterkt dominerende: Globalt er bare 6,4% av de relevante konstruksjonene enkeltbestemte.

Enkel og dobbelt bestemthet ved de enkelte substantiver

Et mer nyansert bilde fremkommer hvis vi undersøker hvordan denne variasjonen er korrelert med andre variabler, f.eks. type av substantiv, eller forfatter. I undersøkelsen av substantiver begrenser vi oss til slike som opptrer minst 10 ganger i denne konstruksjonen – enkelt eller dobbelt bestemt. Det gir 3 538 substantiver. For hvert substantiv kan vi nå registrere hvor mange prosent av treffene som har enkelt bestemthet. Hvis vi ordner substantivene etter denne prosentsatsen, får vi grafen nedenfor:

Andel enkel bestemthet fordelt på substantiver

 

78 av de 3538 substantivene opptrer med enkel bestemthet i mer enn 50 % avtilfellene, det vil si 2,2 % av substantivene. Det store flertall av substantiver har sterk overvekt av dobbelt bestemthet.

Tabellen nedenfor viser de 40 substantivene som har sterkest overvekt av enkel bestemthet – begynnelsen av kurven. Første kolonne viser substantivlemmaet, annen kolonne antall forekomster med enkel eller dobbelt bestemthet, og tredje kolonne den prosentandelen av disse som har enkel bestemthet.

Substantiv etter prosentandel enkel bestemthet

Substantivlemma # med demonstrativ og adjektiv % enkelt bestemt
faktum 72 100,0
intet 30 100,0
selvfølge 12 100,0
selvfølgelighet 33 100,0
anelse 34 97,1
halvkule 138 92,0
fare 22 90,9
forseelse 10 90,0
samfunnslag 10 90,0
jaktmark 12 83,3
fakultet 162 80,2
orden 61 78,7
ytre 14 78,6
fornuft 32 78,1
respekt 27 77,8
garde 13 76,9
psykologi 25 76,0
gral 12 75,0
istid 64 75,0
ære 20 75,0
vanvidd 19 73,7
snev 15 73,3
ånd 91 72,5
samaritan 18 72,2
brorskap 14 71,4
anelse 33 69,7
stadium 66 69,7
tilfeldighet 13 69,2
helvete 25 68,0
dumhet 12 66,7
legeforening 21 66,7
dagsorden 25 64,0
nullpunkt 22 63,6
publikum 44 63,6
verdighet 11 63,6
moral 19 63,2
arme 45 62,2
tidsalder 21 61,9
imperativ 13 61,5

Noen av disse substantivene inngår i navn eller navnelignende betegnelser, for eksempel Den hellige ånd, den nordlige halvkule, den lille istid, Det muslimske brorskap, den barmhjertige samaritan. Navn med denne formen har enkel bestemmelse i bokmål. Ved flere andre er det tale om ikke-spesifikk referanse til noe av en viss art, gjerne i kombinasjon med absolutt superlativ: den største selvfølgelighet, den minste forseelse, den ringeste anelse.

Et utvalg korpuseksempler:

Det fysiske faktum tok fra meg tryggheten.
Det er underlig hvordan andre husker de objektive fakta i ens liv;
Jeg følte i uklar triumf at nå hadde jeg allikevel klart å omgå det uomgjengelige faktum.
Nødlanding kunne bety at de bare forsvant – ble slukt i det store grønne intet.
da den første vognen skrattet mot det åpne intet, dundret sistemann hult i gjelet.
Den vonde hånden skalv da han forsiktig heiste seg ned i det mørke intet.
For Berkeley ville vel spillenes virtuelle virkelighet vært den største selvfølge?
Du tar det vennene dine gjør for deg som den rene selvfølge.
Hun brukte ord som ondskap, hat og kjærlighet med den største selvfølge.
Jeg skjønner det ikke – jeg har ikke den minste anelse.
Så kom dagen de hadde sett nærme seg med de verste anelser:
Han fløy over den, uten å ha den fjerneste anelse om han satte rekord eller ikke.
I tillegg er bildet på den sørlige halvkule veldig sammensatt.
Ved siden av isbjørnen er den det største landlevende rovdyret på den nordlige halvkule.
Det er i de store farer man ser det store mot.
På hospitset kom den gule fare Tom til unnsetning.
– De er derfor fullstendig uegnet i polare farvann hvis det er den minste fare for flerårig is i klumper eller store isflak i bevegelse, sier Riska.
I tillegg til å lære fransk med barnet, snakket morfaren om Trygve Lies storhet og om Den røde fare.
– Og dessuten ville det være det rene vanvidd av deg å se etter noe annet også.
Det er det glade vanvidd – og nå snør det faktisk!
Nok en by skulle ofres på ondskapens alter, i en strid der det absolutte vanvidd var opphøyet til den ypperste form for krigskunst.

Ved dette mindretallet av substantiver ved begynnelsen av kurven ser vi da grammatiske grunner (navn), semantiske grunner (ikke-spesifikk referanse) og idiomatiske grunner (faste uttrykk) til overvekten av enkel bestemthet. Men stil, sjanger og forfatteres preferanser er uten tvil også faktorer som påvirker valget av denne formen, og kan ligge bak innslagene av enkel bestemthet ved de øvrige substantivene. Vi kan nærme oss disse faktorene ved å se på hvordan valget er korrelert med forfatter, og med type av tekst.

Enkel bestemthet blant bokmålsforfatterne

På samme måte som vi kan studere fordelingen mellom enkel og dobbelt bestemthet ved det enkelte substantiv, på tvers av forfattere, kan vi gjøre det samme ved den enkelte forfatter, på tvers av substantiver. Som ved substantivene begrenser vi oss til forfattere som har minst ti forkomster av den aktuelle konstruksjonen demonstrativ + ett eller flere adjektiver + substantiv. Dette gir 895 forfattere. Grafen nedenfor viser at forfatterne fordeler seg på lignende måte som substantivene: Et lite fåtall har overvekt av enkel bestemthet, mens det store flertall har sterk overvekt av dobbelt:

Andel enkel bestemthet fordelt på forfattere, bokmål

31 av de 895 forfatterne har 50 % eller mer enkel bestemthet i de tekstene de er representert med i korpuset. Tabellen nedenfor viser disse 31 forfatterne med antall eksempler på den aktuelle konstruksjonen, og i tredje kolonne den prosentandel av disse som har enkel bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, toppen av listen

Forfatter # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Heyerdahl, Nils 46 95,7
Flemestad, Roald 117 92,3
Slagstad, Rune 12 91,7
Folven, Reiel 10 90,0
Romarheim, Arild 18 88,9
Fardal, Rune 34 88,2
Olsen, Dag Rune 14 85,7
Weisæth, Lars 26 80,8
Döderlein, Jan M. 14 78,6
Aarnes, Asbjørn 22 77,3
Næss, Per Øivind 13 76,9
Wassmann, Paul 38 76,3
Ellestad, Ole Henrik 72 73,6
Hessen, Dag Olav 26 73,1
Oftestad, Bernt Torvild 18 72,2
Waaler, Arild 42 71,4
Emilsson, Eyjólfur Kjalar 26 69,2
Egeland, Kirstin 25 68,0
Standage, Tom 30 63,3
Larsen, Alexandra Irene 18 61,1
Mevåg, Bente 15 60,0
Vasstrøm, Mikaela 10 60,0
Sr, Eystein Husebye 19 57,9
Valland, Anders 42 57,1
Thommessen, Øystein B. 11 54,5
Espedal, Bruse 13 53,8
Harris, Shane 15 53,3
Humlum, Ole 40 50,0
Kanestrøm, Ingolf 16 50,0
Wikan, Unni 12 50,0
Solli, Brit 10 50,0

Sjanger er en åpenbar faktor. Noen av de til dels korte tekstene som flere av disse forfatterne er representert med, har et religionsfilosofisk eller generelt filosofisk innhold. Det refereres derfor ofte til allmenne begreper eller ulike filosofiske posisjoner, der enkel bestemthet kan være nærliggende. Vi kan betrakte noen eksempler fra fire forfattere på toppen av listen.

Eksempler på enkel bestemthet:

Nils Heyerdahl («Avskummets verdighet. Pascal mellom skeptisisme og rasjonalisme»):
Fremgangen i disse forskningsgrener ga knapt grobunn for mistro til den menneskelige fornuft.
I vitenskapelige miljøer i Clermont og Paris finner vi Pascal som den selvsikre vitenskapsmann.
Her var Montaigne det store dannelsesideal, med sin blanding av skeptisisme, stoisisme og epikureisme.
Det fremlegges resultater, det gjøres front mot den gamle aristotelisk-skolastiske vitenskap.
Om referenten har gjengitt ham rett, stiller Pascal her datidens skeptisisme (pyrrhonisme) opp mot den rasjonalistiske dogmatisme.
Inspirert bl.a. av den gjenoppdagede hellenistiske forfatter Sextus Empiricus, hvis verk Hypotyposeon ble en hovedkilde til kunnskap om oldtidens skeptisisme, går han veier som ender i den totale uvisshet.
For dogmatikernes vedkommende fester Pascal seg ved det han kalle[r] deres eneste vektige argument: at man ikke kan tvile på «de naturlige sannheter», dersom man skal være ærlig.
Naturen kommer den avmektige fornuft til unnsetning og hindrer den i å vrøvle seg helt bort.

Roald Flemestad («Pascal som teologisk tenker for vår tid»):
I dette oppbrudd kunne man fra første stund ane en motsetning mellom den nye rasjonalistiske livsholdning og tradisjonell kristendom med dens bibelske forestillinger om Gud og menneskelivet.
I hans samtid fremstod Pascal som en skarp kritiker av den frembrytende rasjonalisme.
Mot denne tekniske prometeisme anfører Pascal i Pensées at «det stadige fremskritt ikke er menneskets vesen.
Noen sier det ligger i fullkommen uvidenhet… og de sanne skeptikere påstår at det høyeste gode ligger i den urokkelige sinnsro
Overfor de mange konkurrerende sannhetskrav konstaterer Pascal:
Overfor det politiske narrespill reiser Pascal spørsmålet:
Folk må oppdras til å anse den [hevdvundne vane] som gyldig og evig.»
Denne krise ville barokk-kulturen møte ved å skape en ny symbolsk orden som ikke bare skulle gjenskape den tapte opplevelse av virkeligheten som en helhet, men som også kunne gi de styrende en ny mulighet for sosial kontroll.
Sentralt i denne restaureringsprosess står den monarkisk-absolutte styreform som nu oppstår.

Rune Slagstad («Vitenskapen, kallet og profesjonen»):
Den vitenskapelig emansiperte elite ble en ny ledende kulturelite.
Lochmann ville holde den positivistiske og ugudelige smittebærer unna Universitetet, men lyktes ikke:
Utnevnelsen markerte Universitetets løsrivelse fra det teologiske overoppsyn;
på den annen side det moderne begrep om vitenskap, det jeg vil kalle den liberale vitenskapelighet, bestemt av noen tilgrunnliggende normer som gjør vitenskap til vitenskap:
Det nye universitet var med sine «brødstudier» med en term som ikke var i omløp på den tiden, i realiteten et […]
Det praktisk-teologiske seminar ble formelt opprettet i 1848, knyttet til så vel fakultet som kirke, med et tyngdepunkt i de gudstjenestelige oppgaver.
Velferdsstatens profesjoner produserer ideologi med tilbakevirkende kraft på de vel etablerte profesjoner.
Kanskje er det noe som går tapt med den profesjonsideologiske ekspansjon

Arild Romarheim («Førmoderne religion er atter moderne»):
Noen ser i dette et behov hos det moderne menneske for en «fortryllelse», en kompensasjon for den moderne sivilisasjons dennesidige, grå hverdag.
Dette kan muligens ha å gjøre med den kristelige interesse man gjerne forbinder med fin de siecle, avslutningen av et århundre.
Det religiøse innhold – i den grad det forekommer – er her som oftest fjernt fra kristendom.
Kjendisbladene troner høyt oppe på statistikken men disse er mindre vesentlig for vårt tema, da den religiøse tematikk her er nærmest fraværende.
Ateisten Dawkins anbefaler fornuftens opplysning som motgift til dette kulturelle forfall.
Den samme respektfulle holdning bør vi også vise overfor islam, en religion som – i økende grad – gir sitt bidrag til det førmoderne nærvær i vårt samfunn.
Forskerne tror ikke lenger på religionens generelle tilbakegang som følge av den moderne, vitenskapelige tidsalder.
Den danner en slags grasrot-religiøsitet også innenfor de store religioner som i og for seg anser ånde-kontakt som en mindre essensiell del av religionen (islam, kristendom, buddhisme).
Det virker heller ikke som viteskapelig skepsis kan kompensere for denne manglende religiøse skepsis.
Denne vage framvoksende basisreligiøsitet omtales gjerne som «spiritualitet», en åpen, individuelt tilpasset tro på at «det er mer mellom himmel og jord».
Skaperguden finnes, men er fjern og tas helst fram ved de store høytider.

Halen på kurven ovenfor omfatter forfattere som har 0 % innslag av enkel bestemthet. Tabellen nedenfor viser dem av disse som er representert med flest eksempler på konstruksjonen, da med dobbelt bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, nær bunnen av listen

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Østby, Magnus 134 0,0
Abelsen, Atle 84 0,0
Hurum, Eirin 70 0,0
Müller, Anne Marie 63 0,0
Kvalshaug, Vidar 62 0,0
Østli, Vegard 55 0,0
Sjøli, Hans Petter 54 0,0
Hjorthol, Lars Martin 50 0,0
Jenssen, Hugo Lauritz 46 0,0
Andersen, Pål Flodin 45 0,0
Valberg, Anna 44 0,0
Baksjøberg, Marianne 43 0,0
Grandaunet, Hilde Jensen 43 0,0
Hanssen, Torkil Marsdal 42 0,0
Østveit, Karine 40 0,0
Solerød, Mari 40 0,0
Karkov, Rasmus 38 0,0
Aftenposten 37 0,0
Fjellberg, Anders 37 0,0
Johnsen, Hilde Føreland 37 0,0
Kazankov, Andrey 35 0,0
Milde, Svein Harald 33 0,0
Vestergård, Gunver Lystbæk 33 0,0
Gravklev, Bente Rognan 32 0,0
Valsø, Karen 32 0,0
Vold, Henrik Brattli 32 0,0
Aall, Carlo 31 0,0
Klaveness, Luisa 31 0,0
Kagge, Gunnar 30 0,0
Lundereng, Kristine 30 0,0

Fraværet av enkel bestemthet her skyldes utvilsomt dels sjanger og innhold og dels forfatternes egne preferanser. Tekstene omfatter for eksempel avisartikler og Forskningsnytt-artikler. Referanse til konkrete gjenstander favoriserer dobbelt bestemthet, mens dobbelt bestemthet ved mer abstrakte begreper kan ha mer å gjøre med forfatterens valgte stil.  Vi tar med noen eksempler.

Eksempler på dobbelt bestemthet:

Magnus Østby (artikler i Stavanger Aftenblad):
De større modellene til John Deere som ikke har B-stolpe, har dør bare på venstre side.
De fire minste modellene, fra 83 til 115 hk, har firesylindra motorer med et sylindervolum på 4,5 liter .
Det elektriske hurtiggiret betjenes med knapper på girspaken eller bryter på betjeningskonsollen.
De små traktorene rydder småvegene og transporterer snøen til de større vegene.
Den vendbare hytta er unik.
Når spakstyringa er aktivert, styres hjula med en rullebryter på den ekstra styrespaken.
– Når du ser det er slitasje på de tverrstilte gripeelementene på kjettingen, bør du snu kjøreretningen på kjettingen.
Den manuelle delen av arbeidet er i hovedsak relatert til sluttproduksjon og herding.
Herdeovnene går tre skift, mens de øvrige maskinene går to.
Årsaken er at de kanta elementene på lettkjettingen biter seg godt fast i isen.
Når den fremste enheten er full, sendes kornet til neste enhet.
De viktigste instrumentene er plassert på høyre A-stolpe, mens resten er i konsollen på siden av førersetet.
Det betyr at hvis Søren vil ha automatisk styring, trenger han bare å montere den gule kula på taket og skjermen, samt aktivere systemet.
De to forskjellige produksjonene gir oss dessuten to bein å stå på.
De samla leasingkostnadene er 10 000 kroner per måned, forklarer Atle.


Atle Abelsen (artikler i Forskningsnytt):
Han peker på at absolutt alle kunnskapsbaserte produksjonsbedrifter over en viss størrelse på det internasjonale markedet har plassert nanoteknologi i sin bedriftsstrategi, og de fleste bruker til dels store beløp på forskning innen dette feltet.
De startet i fjor en prøveprodukjson av nanorør,
et [sic] av de viktigste byggesteinene for svært mange nanoprodukter.
Men da må de industrielle aktørene komme på banen nå.
Han forteller at flere av de internasjonale innlederne var overrasket over å treffe så mange av sine kolleger på konferansen.
Til den neste konferansen i 2005 kommer vi til å jobbe spesielt aktivt for å involvere de industrielle brukerne enda mer, sier Høvik.
Derfor må vi teknologer komme tidlig på banen og sette premissene for den etiske diskusjonen, oppfordrer han.
Statssekretær Helle Hammer i Nærings- og handelsdepartementet understreket at etablering av nye forretningsområder er det viktigste suksesskriteriet for nanoforskningen.
Professor Johan Sjøblom ved NTNU pekte for øvrig på de store mulighetene som olje- og gassutvinnerne og industrien har for økt verdiskaping ved å satse på materialteknologi i nanoskala.
Også han var opptatt av å fokusere sterkt på de etiske aspektene.
Den tørre forsommeren gjorde forholdene ideelle til å lete etter strukturer på bakken som bare kan sees fra stor høyde, forteller Raaen.
Ved å kombinere resultatene fra alle disse avanserte målemetodene, håper Stenvik og hans gruppe at det skal tre tydelig fram hustufter, ildsteder og andre ting som tyder på at det har vært folk her.

Eirin Hurum (artikler i Aftenposten):
Den blide pensjonisten, kledd i klassisk vaffeljakke og sixpence har det ærefulle oppdraget å servere jaktlaget den tradisjonsrike «stirrup cup» – en liten sterk en – før startskuddet går for dagens revejakt – den tredje denne uken.
Midt på eiendommen troner det gamle godset.
Tilhengerne hevder at jakten er den beste måten å kontrollere revebestanden på.
– Ja, det er det store spørsmålet, sier Butler og slår ut med armene.
Vi har bestemt oss for å holde oss på den sikre siden, sier han.
– Men jaktlagene hevder at dette ikke handler om dyremishandling, og at jakt med hunder er den mest humane måten man kan avlive reven på?
– For oss, og jeg tror for de fleste som bor på landet, er revejakten en del av det sosiale limet i lokalmiljøet.
Til det har den konservative regjeringen for mange andre presserende oppgaver.
Den dukker opp i horisonten, piler over de grønne gresslettene og inn i et skogholt.
Den tradisjonsrike revejakten har foregått i århundrer.
Det britiske skolesystemet har vært på politikernes agenda i årevis.
Det fastslår Den nasjonale likestillings- og diskrimineringskommisjonen i sin rapport «How fair is Britain?», den mest omfattende levekårsundersøkelsen gjort i Storbritannia de siste årene.

Anne Marie Müller (artikler i Forskningsnytt):
Bare i noen få av studiene som inngår i oversikten er det med pasienter som har gjennomgått de nye og lange behandlingsformene som gis til dagens brystkreftpasienter.
Det er i det hele tatt en slående kontrast mellom de små og spredte studiene som fins innen rehabilitering og den brede internasjonale forskningen innen behandling, og som har bidratt til de store framskrittene der.
Den amerikanske stiftelsen The Commonwealth Fund (se faktaramme) har siden 1998 gjennomført internasjonale spørreundersøkelser om helsevesenet.
Nasjonalt kunnskapssenter for helsetjenesten står for den norske delen av undersøkelsen.
Selv om spørreskjemaet er utviklet for norske forhold, er det imøtesett med betydelig interesse også innen det nordiske indikatorsamarbeidet.
De store europeiske etterkrigskullene vil snart tre ut av arbeidsstokken og tappe helsetjenesten for sykepleiere uten at en tilsvarende mengde unge sykepleierrekrutter vil erstatte dem.
Første del er den pågående spørreskjemaundersøkelsen blant sykepleiere ved medisinske og kirurgiske avdelinger.
Norge skiller seg ut med den nest laveste andelen utgifter til legemidler og medisinsk-tekniske hjelpemidler.
De lave utgiftene her skyldes blant annet lavere norske legemiddelpriser.
den andre siden skiller Norge seg ut med den høyeste andelen utgifter til pleie og omsorg.

Det er tydelig at dobbelt bestemthet er det umarkerte valg(et) i det meste av bokmålstekst. Enkel bestemthet er mest regelmessig knyttet til flerords-navn. Mindre fast, men likevel tydelig, er det knyttet til den semantiske egenskapen ikke-spesifikk referanse, til abstrakte begreper, og til en del faste uttrykk. En annen dimensjon er stil og sjanger – en konservativ forfatterstil og en filosofisk-diskursiv tekstsjanger synes begge å favorisere enkel bestemthet.

Enkel bestemthet i nynorsk

I nynorsk tekst vil de fleste vente å finne mindre innslag av enkel bestemthet enn i bokmålstekst. Den nynorske delen av NorGramBank utgjør bare 10-15 % av trebanken; vi bygger her på de følgende delene:

Avistekst: 123 400 ord
Sakprosa: 1,6 mill. ord
Barnebøker: 1,04 mill.ord
Romaner: 3,01mill. ord

De globale tallene i nynorskdelen:

Frasetype

Antall

Dobbelt bestemt

23 127

Enkelt bestemt

788

I bokmålsdelen utgjorde tilfellene av enkel bestemthet 6,4 % av alle forekomster av konstruksjonen. I nynorskdelen halveres dette nesten – 3,3 % av eksemplene har enkel bestemthet.

Enkel bestemthet blant nynorskforfatterne

72 nynorskforfattere har 10 eller flere eksempler på konstruksjonen demonstrativ + eventuelle adjektiver + substantiver. Hvis vi regner ut prosentandel enkel bestemthet for hver av disse, får vi grafen nedenfor.

Andel enkel bestemthet fordelt på forfattere, nynorsk

Bare én forfatter av de 72 har en høyere prosentandel enkel bestemthet enn 50. Tabellen viser 30 av forfatterne rangert fra den med høyest andel enkel bestemthet.

Nynorskorfatter etter prosentandel enkel bestemthet, toppen av listen

 

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Rabben, Bjarne 47 57,4
Mosdøl, Olav 19 36,8
Bruheim, Jan-Magnus 15 33,3
Bjørlo, Anne-Grete 17 29,4
Holm, Gro 27 18,5
Austrem, Liv Marie 33 12,1
Jonsmoen, Ola 129 10,1
Økland, Einar 402 9,7
Kaldestad, Per Olav 263 8,4
Helde, Einar 125 7,2
Hoem, Edvard 605 6,1
Øglænd, Finn 260 5,8
Eide, Svein 139 5,8
Heggland, Johannes 261 5,7
Starheimsæter, Hermann 176 5,7
Bukkøy, Else Karin 179 5,6
Nöstlinger, Christine 18 5,6
Sagen, Rolf 485 5,4
Ruset, Arne 191 5,2
Heie, Sigbjørn 140 5,0
Ystaas, Torunn 81 4,9
Piumini, Roberto 62 4,8
Midtun, Jarle 21 4,8
Bødtker, Marit Lund 66 4,5
Vaage, Lars Amund 355 4,5
Nysted, Liv 70 4,3
Fosse, Jon 118 4,2
Bjørkum, Ingrid 73 4,1
Hauge, Kolbjørn 345 4,1
Sæter, Alf A. 531 4,0
Teksten av den forfatteren som skiller seg ut, Bjarne Rabben, er poetisk – og, i likhet med bokmålstekstene med stort innslag av enkel bestemthet, har religiøst innhold:
Bjarne Rabben («Med himmel over»):
Den gode smil
Det er så vent ved Mjøsa den ljose sommartid.
Fjellet i sol og sommar – å, denne rike dag!
Finst ikkje venare syn enn den unge mor.
Du gav meg di gode hand i dei unge år, ei hand til å leike med og klemme om.
Din barnetanke på sin veng dei lange leier tok.
Eg metta meg med det velsigna brød, tok frakken på og lét døra opp.
Han gav oss den dyre gåve: ein helgedag for vår sjel.
Fast skal du stå i di freistings tid, glad skal du våge den gode strid tru mot det syn som di lengsle såg.
Ja, det fortel den gamle bok.
Denne reine himmel over morgonfjell med stjerner som strålar mot mørk jord
I dag vil eg minnast den namnlause kvide som Jesus, vår frelsar, for oss måtte lide.
Din lekam imellom seg vrid dei og vender og naglar til krossen dei heilage hender.
Dei gamle stigar du akte på, så du til ditt livsverk kan emne få.
Styr dine ord i den glade stund.
Dei gode ord
den gamle kyrkjetuft
Me møtest i den frie luft med rømd til alle sider på denne gamle kyrkjetuft med sus frå gamle tider.
Lat det få rom og rang i byar og i grender som setje kan i gang dei arbeidslause hender!

 Men også i andre tekster finner vi eksempler:


Og så fekk han sine eigne folk, han hyrte dei største talent og lærte dei alt dei trong å lære, men skjønte dei kor stor han var for det?
Han som nådde dei høgaste tindar.
Tannlegen tok det som ei djevelsk ironisering over den gemene hop.
Har vi alltid tankane i dei øvre sfærar?
Ho seier at han ikkje kan utrette noko på møte i Gymnassamfunnet, av den enkle grunn at han ikkje går på gymnaset.
PÅ DETTE TIDSPUNKTET hadde kunsthandlaren identifisert meg som den einaste son av presten Storm.
Vi går bort, for vi er ikkje menneske lenger, vi er teikn, vi er vitne for den forspilte tid: Vår ungdom.
Mot den uklare bakgrunn av gudfryktige fiskarmenn som eg nedstammar frå, står det brått fram ein mann som beviseleg målte tre alner på sokkeleisten og var brei som ei låvedør.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Krydderet finst i handelen og dei fleste kjøkkenhyller, men har i heile denne tida ikkje kalla fram den ringaste assosiasjon.
Inga bjølle har ringt når eg har løfta lokket av angande surkål, eller sett tennene i den herlegaste nøkkelost.
Det kunne han bevise med møteprotokollen for bedehuset som vart ført med den djupe vørdnad for det skrivne ordet som heretter alltid rådde i Karviland.
Sonen var ein overgang og eit intermesso i det store livsens spel.
Over midtgangen hang ei vakker skute med dei finaste segl.
Aldri, aldri skulle han koma til å gråte over den forgangne trollskap frå parafinlampene sin tidsalder.
Der stod bestefaren og slakta lam som i den gamle pakt.
– Dei kan seia oss korleis livet på jorda er, om dei ikkje just peikar inn i dei evige bustader.
– Ai, eg har sønner fem, sa faren, som snakka innfløkt når det gjekk på dei store ting i livet.
I dei raraste påfunn er det alltid gøymt ein grunn, og slike grunnar tok han til å grunne på.
Eldsteguten hadde greidd å lure seg unna ei mengd med fiskemåltid, men i desse tronge tider måtte sjølv han til pers.
Slik svinga han frå det svartaste mismot til den lystigaste stemning på nokre minutt.
Dersom nokon trur Bakke-merra kjem til å flytte seg før dei blæs i basun, skal vi vita kvar vi la henne på den ytterste dag!
Ei gammal leigemerr frå Malmedalen fekk vera med og bane vegen til den nye tid.
Foreldra gjorde ikkje den ringaste mine til å vakne.
Var det ikkje for dansen at den gamle felemakar Lars Hoem hadde bygd sine prektige instrument?
Det leid mot den avgjerande eksamen.

‘min sønn’ eller ‘sønnen min’?

Innledning

Det heter helst sykkelen din, sønnen hennes, den ømme samvittigheten hans og den stygge mistanken min på norsk, vil noen hevde; din sykkel, hennes sønn,  hans ømme samvittighet og min stygge mistanke er kunstig formelt eller rett og slett dansk. Og akkurat ved substantivet sykkel kan man jo skjønne at slikt blir sagt – skjønt din nye sykkel lyder kanskje straks litt bedre enn din sykkel. Intuitivt er muligens heller ikke min mistanke fullt så påfallende som din sykkel, og mange vil nok finne min stygge mistanke ganske uproblematisk. Hva slags regelmessigheter kan vi avsløre her?

Hva ‘det heter’ på skriftlig norsk, er et spørsmål om hvordan skriftlig norsk faktisk ser ut, altså hva som står i tekstene. Så la oss se på det, først og fremst i bokmål i denne omgang. Nynorsk nevnes kort mot slutten.

Foran- vs. etterstilt possessiv i bokmål

Vi søker først i bokmålsdelen av NorGramBank, i den delen som omfatter aviser, sakprosa, barnebøker og romaner (originaler og oversettelser), ca. 45 millioner ord. Søkeuttrykket inkluderer alle nominale fraser med possessiv (min, din, sin, hans, hennes, dens, vår, deres med bøyningsformer), uavhengig av om det står adjektiver eller andre ord mellom possessiven og substantivet. Uttrykket formuleres slik at vi utelater  eksempler med bestemmeren egen, som i min egen sykkel, ettersom de alltid har foranstilt possessiv, slik at det ikke foreligger noen valgmulighet der. Vi skulle også gjerne ha utelukket eksempler der den foranstilte possessiven er fokusert gjennom kontrastivt trykk (Dette er min sykkel!), men dessverre er slike eksempler ikke merket og lar seg derfor ikke skille fra.

Hvis vi teller teksteksemplene enkeltvis, finner vi at etterstilt possessiv er noe, men ikke dramatisk, vanligere enn foranstilt:

Possessivplassering i bokmål, globalt:

Possessiv-plassering

Antall

Foran

133 252

Etter

198 751

Vi ser at 40,1 % av tekstforekomstene av nominalfraser med possessiv har possessiven foranstilt, noe som antyder at fenomenet ikke er fremmed for språket. Et mer nyansert bilde fremkommer hvis vi skiller mellom de enkelte substantivene, som kan ha svært ulike fordelinger av foranstilt og etterstilt possessiv. Det er over 15 000 ulike substantiver med possessiv i dette materialet, der de fleste forekommer bare én eller to ganger. For å få et mer håndterlig materiale og mer signifikante tall, begrenser vi derfor mengden av substantiver til dem som forekommer minst 10 ganger med possessiv i korpus. Dette reduserer antallet til 1993 substantiver.

Nå kan vi regne ut for hvert av de 1993 substantivene hvor mange prosent av forekomstene som har possessiven foranstilt, og hvor mange som har den etterstilt. Hvis vi ordner disse substantivene fra dem som har flest tilfeller av foranstilt possessiv til dem som har færrest slike tilfeller, fremkommer grafen nedenfor, der substantivene er ordnet langs den horisontale aksen og prosentverdi foranstilt possessiv langs den vertikale:

Det fremgår at litt over halvparten av substantivene – 1002 av dem – har flere tilfeller av foranstilt enn av etterstilt possessiv. 119 substantiver har bare foranstilt possessiv, og 113 substantiver bare etterstilt.  Forøvrig er fordelingen jevnt fallende, med en svak antydning til polarisering i kurveformen (som ikke er en helt rett linje), altså svakt i retning av to kategorier av substantiver.

Semantiske klasser av substantiver

Et blikk på toppen og bunnen av den rangerte listen av substantiver gir et klart inntrykk av at substantivene tilhører ulike semantiske typer på ulike deler av skalaen. Tabellen nedenfor viser  60 av substantivene med bare foranstilte possessiver. Første kolonne viser substantivets lemmaform, annen kolonne viser hvor mange forekomster med possessiv som ble funnet, og tredje kolonne viser hvilken prosentandel av disse som hadde possessiven foranstilt.

Flest foranstilt:

Substantivlemma # med possessiv % foranstilt
anliggende 25 100,0
attrå 15 100,0
barneliv 10 100,0
bekostning 27 100,0
besittelse 16 100,0
besøkelsestid 16 100,0
biologi 10 100,0
borger 10 100,0
breddegrad 16 100,0
datasett 13 100,0
dimensjon 10 100,0
domene 11 100,0
dommer 12 100,0
dust 30 100,0
dødsdag 22 100,0
egenart 22 100,0
eie 18 100,0
element 30 100,0
elsk 21 100,0
enhet 11 100,0
enkelhet 21 100,0
ess 27 100,0
fanden 19 100,0
farvann 19 100,0
fatteevne 13 100,0
favør 21 100,0
feiging 12 100,0
fjols 26 100,0
forbløffelse 32 100,0
forehavende 10 100,0
forholdsregel 26 100,0
fornedrelse 12 100,0
generasjon 73 100,0
gjennomgang 16 100,0
grandonkel 19 100,0
gru 19 100,0
gunst 24 100,0
halvpart 13 100,0
helhet 78 100,0
hellighet 10 100,0
hovedpoeng 13 100,0
høyhet 50 100,0
indre 176 100,0
innblanding 10 100,0
inntog 36 100,0
ja 19 100,0
jævel 40 100,0
kjennskap 15 100,0
kjøter 24 100,0
kontekst 18 100,0
kulde 15 100,0
legitimitet 10 100,0
lengde 39 100,0
likemann 19 100,0
ludder 17 100,0
lære 18 100,0
læremester 18 100,0
majestet 37 100,0
medmenneske 84 100,0

Mange av substantivene er abstrakter (anliggende, besittelse, besøkelsestid, enkelhet, forbløffelse, legitimitet). Andre er skjellsord eller andre tiltaleformer, der bruken av possessiv (som i din tosk!, Deres Majestet) er en egen type som vi bør skille fra i en undersøkelse av allmenn possessivplassering (dust, fanden, feiging, fjols, jævel, kjøter, ludder; hellighet, høyhet, majestet).

Substantivene med bare etterstilte possessiver er annerledes; tabellen viser 60 av dem:

Færrest foranstilt:

Substantivlemma  # med possessiv  % foranstilt
malersaker 12 0,0
mappe 23 0,0
mulesel 12 0,0
mumling 10 0,0
munnhule 10 0,0
nakkegrop 13 0,0
navle 43 0,0
nesetipp 28 0,0
notatbok 15 0,0
overleppe 26 0,0
pakk 11 0,0
pickup 18 0,0
pinn 10 0,0
rull 12 0,0
rumpeballe 27 0,0
ryggrad 53 0,0
ryggsekk 35 0,0
ræv 17 0,0
saksbehandler 14 0,0
serk 41 0,0
shorts 16 0,0
skinnjakke 19 0,0
skjørtekant 13 0,0
skolesekk 10 0,0
skolisse 29 0,0
skosåle 12 0,0
skotupp 30 0,0
skuff 39 0,0
skulderblad 16 0,0
skulderveske 10 0,0
skur 11 0,0
smilehull 13 0,0
sokk 39 0,0
sovepose 27 0,0
sperma 10 0,0
spilling 10 0,0
steg 16 0,0
stereoanlegg 14 0,0
strupehode 12 0,0
sytøy 16 0,0
sølv 17 0,0
tommelfinger 12 0,0
tomt 18 0,0
trommehinne 14 0,0
truse 56 0,0
tull 10 0,0
tungespiss 24 0,0
tørkle 16 0,0
undulat 11 0,0
utgift 12 0,0
venstrehånd 11 0,0
vesla 43 0,0
vest 10 0,0
vorte 20 0,0
ytterklær 10 0,0
ølglass 14 0,0
øreflipp 43 0,0
øregang 11 0,0
ørering 13 0,0
øyekrok 39 0,0
øyenvippe 36 0,0

Substantivene med bare etterstilt possessiv har et sterkt innslag av konkreter, og særlig kroppsdeler (munnhule, nakkegrop, navle, nesetipp, overleppe, rumpeballe, ryggrad, ræv, smilehull, strupehode, tommelfinger, tungespiss, venstrehånd, øreflipp, øregang, øyekrok, øyenvippe).

Det synes derfor motivert å dele substantivene inn i et antall semantisk definerte klasser, og så se på hvordan possessivene plasseres innenfor hver av dem. En tentativ inndeling (i ikke-overlappende kategorier) er denne:

A. konkreter
B. legemsdeler
C. plagg
D. slekt- og familierelasjoner
E. andre relasjonelle personbetegnelser (arving, elev)
F. skjellsord og andre typiske tiltaleord
G. abstrakter
H. lokaliserbare, tellelige ikke-fysiske størrelser (dag, navn, begravelse) og fysiske størrelser klassifisert ut fra en relasjon (halvpart, motstykke, overflate)
I. Kollektiver (publikum)

En slik inndeling vil selvsagt alltid være diskutabel, blant annet fordi det enkelte ord ofte kan brukes på ulike måter og dermed sortere under ulike kategorier.

Vi skal se på noen få av kategoriene.

Type A: konkreter

531 substantiver ble klassifisert som konkreter. Kurven for prosentdel foranstilt possessiv i denne kategorien er som nedenfor:

Bare 49 av de 531 konkrete substantivene har en overvekt av foranstilt possessiv, og blant disse kan klassifiseringen utvilsomt diskuteres i enkelttilfeller, f.eks. vei, person, dose, distrikt, bredd, himmel, plattform, paradis, landskap, bane, utslipp. Disse kan være brukt i abstrakte betydninger, noe vi ikke har undersøkt her. Nærmere bunnen, med få eller ingen foranstilte possessiver, finner vi f.eks. bikkje, pust, lommebok, skrivebord, veske, bylt, dørstokk, gaffel, gardin, kule, leppestift, håndkle.

Det er tydelig at egenskapen ‘konkret’ favoriserer etterstilt possessiv.

Type B: legemsdeler

154 substantiver ble klassifisert som navn på legemsdeler. Denne kategorien favoriserer etterstilt possessiv enda tydeligere enn konkreter generelt gjør:

I denne kategorien har alle substantivene bortsett fra to en sterk overvekt av etterstilt possessiv. De to unntakene legeme og skjød er markert i diagrammet (hans legeme, hennes skjød), og illustrerer at stil og sjanger, i tillegg til semantikk, er en virksom faktor.

Betegnelser på legemsdeler skiller seg ofte ut grammatisk. På norsk, i motsetning til på engelsk, blir possessiv ofte ikke brukt ved slike betegnelser (Han skadet armen vs. He hurt his arm), men når de brukes, blir de altså nesten alltid etterstilt. Possessivforholdet ved legemsdeler er av den art som gjerne kalles ‘inalienable possession’ – ‘uavhendelig eiendom’: armen din er fortsatt i en viss forstand din arm om den så skulle være amputert og solgt. I en konkret sammenheng vil derfor eiendomsbesitteren være klart gitt. Det kan bidra til å forklare at possessiven ofte utelates på norsk – og antagelig også at den såpass konsekvent etterstilles når den brukes.

Type G: abstrakter

638 substantiver ble klassifisert som abstrakter: egenskaper, tilstander, handlinger og prosesser. Ved disse dominerer de foranstilte possessivene klart:

Her har 590 av de 638 substantivene overvekt av foranstilt possessiv; 72 av disse har bare foranstilt. Blant de sistnevnte, med bare foranstilt, finner vi f.eks. indre, ytre, helhet, generasjon, utspring, prakt, lengde, virke, sammenheng, inntog, visdom, forbløffelse, premiss, forholdsregel, anliggende, varetekt, gunst, årsak, egenart, motsetning, favør, tilslutning.  Lenger ned, blant dem som ligger i området 50 – 60 % foranstilt possessiv, finner vi f.eks. svik, dilemma, problem, offer, vanskelighet, utroskap, begjær, oppvekst, stolthet, hemmelighet tyngde, fremtid, unnskyldning, omtanke, nysgjerrighet, omsorg. Og nederst på listen, fra under 20 % og ned til 0 % foranstilt, finner vi abstraktene nervøsitet, erting, skriving, mas, kjøring, stahet, drikking, spilling, tull. Det er ikke vanskelig å se semantiske føringer eller sjangerføringer i denne videre inndelingen av abstraktene.

Grunnene til denne ulike behandlingen av abstrakter og konkreter, særlig kroppsdeler, er verd et videre studium. En mulig tanke er at det kan være en tendens til at det elementet – possessiven eller substantivet – som er viktigst for å identifisere den tingen det refereres til, kommer først. Konkreter identifiseres gjennom sine synlige egenskaper. Man kan først identifisere en viss kontordør, og deretter spørre hvem den tilhører. Men man kommer ikke over et tilfelle av forbløffese og spør deretter hvem sin forbløffelse dette mon være. En forbløffelse identifiseres ikke uavhengig av den som har den. Derfor, kanskje, er hennes forbløffelse, med hennes først, oftest mest funksjonelt, mens derimot kontordøren hennes naturlig nevner objektet først. Men dette kan utvilsomt diskuteres.

Fordelingen i nynorsk

Den nynorske delen av trebanken utgjør bare ca. 10 % av den, så her er tallene lavere. Som ventet finner vi en sterkere overvekt av etterstilt possessiv der:

Possessivplassering i nynorsk, globalt:

Possessiv-plassering

Antall

Foran

7 785

Etter

23 180

Mens bokmål hadde ca. 40 % foranstilte possessiver i løpende tekst, har nynorsk bare ca. 25 % foranstilt. (Dette tallet kan være enda lavere; mulige feilanalyser er ikke sortert fra her.)

Her er et lite utvalg eksempler med foranstilte possessiver i nynorsk tekst.

Nynorske eksempler på foranstilte possessiver:

Så gjekk han sin veg.
– Eg skal inn og leggja att desse pengane til mi vakre mor, sa ho.
Det låg rekkjehus på den andre sida av vegen, og kvart hus hadde sin vesle hage.
– Det er mitt motto!
Det var gått lang tid, men folk som ut frå barndommens tidsrekning skulle vore utgamle eller døde, gjekk framleis rundt i sin beste alder.
Etter Dicks tid er det absolutt ingen ting som stemmer i min bar[n]doms Karviland.
Dei grov fram sine gamle jordskiftebrev, og studerte dei gulna dokumenta.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Så hard var fødselen at minnet til sonesonen ikkje tok til å fungere før femten månader etter at han fall i sin første slumrande søvn.
Men det var eitt eller anna i lufta som var på «hans side».
Englar oppfyller dine ønske.
I sin debutroman «Kvalmen» frå 1938 er det nettopp livstrøyttleiken, den smertelege erfaringa at eksistensen går i oppløysing, som blir skildra.
Etter vår meining er det viktig å skapa eit omsorgsomgrep og ein omsorgspraksis som er ukjønna, der kvinner og menn på like vilkår kan delta i omsorga for barna sine.
Vi har vel våre partibøker, mange av oss framleis, – men dei færraste går på politiske møte.
I våre dagar har vi professorar i filosofi, men ingen filosofar.
Det kan då vere på sin plass å forfølgje diskusjonen om grensene for kva eit moderne fleirkulturelt samfunn kan vere – i forlenging av det vi ovanfor nemnde om føringar i moderne samfunn.
Fluga er vi, flaska vår sorg, vårt elende.
Dermed vart deira motstand mot arabisk styre mye meir innbiten, og kampen mye meir brutal enn i andre koloniar.
Det er altså aviser og nyheiter, kjendisar og forbruksvarer som er blitt felles referanseramme i vår tid?
Mellom desse krigsbolkane vart skattetrykket redusert, men aldri ned til sitt tidlegare nivå.
Danskane fekk sine «sterke jydar» og nordmennene sine haugianarar.
Det som er interessant med meg som forfattar, er ikkje mi livshistorie, men min forfattarprofesjonalitet.

‘ei jente’ eller ‘en jente’?

Innledning

Bruk av en som ubestemt artikkel også ved hunkjønnsord (en jente – jenta) har vært offisielt akseptert innenfor bokmål i hvert fall siden 1959, i de første årene med unntak for en viss gruppe substantiver, men i hvert fall fra 80-tallet uten slike uttrykte restriksjoner. Dette er også i overensstemmelse med talemålsutviklingen enkelte steder. I Oslomål (og ikke bare i ‘Vest’) er en blitt den dominerende artikkelformen også ved substantiver som får -a i bestemt form entall. En lignende utvikling ser vi i Tromsø. Utviklingen innebærer at artikkelformen en i disse varietetene blir umarkert for distinksjonen mellom hankjønn og hunkjønn, og bare markerer ikke-intetkjønn, slik f.eks. demonstrativen den allerede gjør.

I dette innlegget vil jeg se nærmere på hvordan situasjonen for bruk av ubestemt artikkel ved hunkjønnssubstantiver er i skriftlig bokmål, med grunnlag i tekstmaterialet i trebanken NorGramBank. (Valg mellom han- og hunkjønn i bestemt form entall – gata vs. gaten – er diskutert i et annet blogginnlegg.) Vi skal se på den delen av bokmålsmaterialet som omfatter avistekst, sakprosa, barnelitteratur og romaner (originale og oversettelser), ca. 45 millioner ord.

Tall for 200 hunkjønnsord

Vi betrakter først de globale tallene for de 200 mest frekvente hunkjønnsordene, før vi ser på fordelingen mellom forfattere ved ett utvalgt substantiv (jente). En tilbøyelighet til å bruke ubestemt artikkel en ved et substantiv selv om man ellers bruker -a i bestemt form, kan indikeres gjennom det relative antall bestemte -a-former vs. -en-former sammenlignet med det relative antall ei vs. en som ubestemt artikkel. Søket omfattet følgende 200 substantiver:

adresse, analyse, anledning, art, aske, avdeling, avhandling, avis, befolkning, behandling, bestemor, bevissthet, blokk, bluse, bok, bro, brygge, bukse, bygd, bygning, celle, dagbok, dame, datamaskin, datter, dronning, drosje, dukke, dyne, dør, elv, ensomhet, eske, evne, ferd, flaske, forestilling, forklaring, form, forretning, forsamling, forskning, fortelling, fortid, fremtid/framtid, frihet, frue, gate, glede, grav, grense, gruppe, hake, handling, havn, helg, helse, hemmelighet, hensikt, historie, hjelp, hofte, holdning, hud, hue, hule, hylle, hytte, hånd, håndflate, jakke, jakt, jente, jord, jul, kai, kasse, kirke, kiste, kjerne, kjærlighet, klasse, klokke, kone, kraft, kulde, kule, kvinne, kåpe, lampe, leilighet, lengde, leppe, linje, liste, lomme, lommebok, lue, luft, luke, lukt, lykke, lykt, løsning, makt, mark, maskin, melding, melk, menighet, mening, mor, mulighet, munnvik, natt, nese, nyhet, nærhet, næring, olje, oppgave, oppmerksomhet, ordning, overflate, pakke, panne, pike, plante, plate, postkasse, presse, prinsesse, pute, regjering, reise, rekke, retning, rettssak, ro, rolle, rute, råd, sak, samvittighet, sannhet, seng, setning, side, sjel, skjorte, skråning, skulder, skumring, skyld, skål, slekt, slette, sol, sorg, spenning, stemning, stillhet, stilling, stjerne, strand, stue, støtte, søster, tante, taushet, tegning, tekst, tid, trapp, trening, tro, tunge, tåke, uke, ulykke, undervisning, uro, usikkerhet, utdannelse/utdanning, utfordring, utsikt, utvikling, vaksine, vakt, vekt, venninne, veske, virkelighet, virkning, virksomhet, vogn, økning, øy, åpning, årsak

For disse substantivene globalt finner vi følgende tall:

Kategori

Form

Frekvens

Bestemt form

-en

296 407

-a

77 641

Ubestemt artikkel

en

63 373

ei

3 393

Dette innebærer at bestemt form på -en er 3,8 ganger så vanlig som bestemt form på -a, mens ubestemt artikkel en er hele 18,7 ganger så vanlig som ubestemt artikkel ei. Det tyder på at mange forfattere antagelig har ubestemt artikkel en og bestemt form på -a ved noen av de samme substantivene. Det ser vi nærmere på i neste avsnitt, for et utvalgt substantiv.

Substantivet jente hos forfatterne

jente er blant substantivene med færrest forekomster av -en i bestemt form entall – bare 2,49 % av tilfellene (se tabell fra blogginnlegget ‘‘‘jorda’ eller ‘jorden’?’). Vi finner følgende frekvenstall i korpus, der vi også tar med antallet forfattere eller oversettere bak formene:

 

Kategori Form Frekvens Antall forfattere
Bestemt form

jenten

102

21

jenta

4095

378

Ubestemt artikkel

en jente

1610

329

ei jente

690

190

Tendensen i tallforholdene mellom bestemt og ubestemt form fra den globale tabellen er forsterket i tabellen for substantivet jente: Bare et lite mindretall forfattere skriver jenten som alternativ til jenta, mens betydelig flere skriver en jente enn ei jente. (Noen forfattere er med i begge gruppene og skriver både en jente og ei jente; se nedenfor.) Blant de 21 forfatterne som skriver jenten, finner vi blant andre Liv Margareth Alver, Jens Bjørneboe, Tomas Espedal, Stig Holmås, Vibeke Løkkeberg, Torborg Nedreaas, Arthur Omre, Fredrik Skagen og Gunnar Staalesen.

Spørsmålet om utviklingen av den grammatiske status til ubestemt artikkelform en kan belyses ved at vi tar for oss de 378 forfatterne som skriver jenta og undersøker hvor mange av dem som bruker ubestemt artikkel en, og hvor mange som bruker ubestemt artikkel ei:

Kombinasjon hos samme forfatter Antall forfattere
1. jenta 378
2. jenta; ubest. art. + jente 284
3. jenta; en jente 199
4. jenta; ei jente 143
5. jenta; en jente; ei jente 58

I tabellen angir rad 1 antallet forfattere som bruker formen jenta. Forfatterne i de neste radene er alle undermengder av disse – de bruker altså alle formen jenta. Rad 2 viser antallet forfattere – 284 – som i tillegg til jenta også bruker ubestemt form av jente med artikkel minst én gang. Radene 3-5 angår undermengder av disse, altså bare forfattere som både skriver jenta og har minst én forekomst av ubestemt artikkel ved dette substantivet. Rad 3 viser da at kombinasjonen jenta og en jente forekommer hos 199 forfattere, og rad 4 at kombinasjonen jenta og ei jente forekommer hos 143 forfattere. Rad 5 viser antallet forfattere som bruker både en jente og ei jente (i tillegg til jenta): disse 58 forfatterne er også med i radene 3 og 4 og utgjør snittmengden av disse to mengdene.

Rad 5 viser at variasjonen mellom en og ei i kombinasjon med -a ikke bare gjelder tekstuniverset som helhet, men i noen tilfeller også den enkelte skribent. Hele 58 forfattere/oversettere bruker begge formene. Her bør riktignok den faktiske bruken vurderes nærmere – f.eks. i hvilken grad siterte replikker, stilistisk variasjon o.l. er involvert .

Blant de 199 forfatterne som bruker en jente i kombinasjon med jenta, finner vi for eksempel Ola Bauer, Ari Behn, Bjørg Bjørsvik, Finn Carling, Sigurd Evensmo, Knut Faldbakken, Jostein Gaarder, Maria Gripe, Vera Henriksen, Vigdis Hjorth, Frid Ingulstad, Erik Kullerud, Unni Lindell, Arthur Omre, Anne B. Ragde, Margit Sandemo, Fredrik Skagen, Wera Sæther og Else Marie Winsnes.

Blant de 143 som bruker ei jente i kombinasjon med jenta, finner vi for eksempel Widar Aspeli, Geir Brandstadmoen, Knut Grønvik, Eli Haugen, Ellen Hofsø, Kåre Holt, Øivind Hånes, Rønnaug Jarlsbo, Arild Kolstad, Gunnar Lunde, Øystein Lønn, Atle Næss, Mari Osmundsen, Vigdis Rabben, Kari Sverdrup og Trond Vidar Vedum.

Blant de 58 som bruker både en jente og ei jente, finner vi for eksempel Selma Lønning Aarø, Ingvar Ambjørnsen, Elin Brodin, Niels Fredrik Dahl, Torolf Elster, Nils-Petter Enstad, Karin Fossum, Jørgen Gunnerud, Klaus Hagerup, Tormod Haugen, Torill Thorstad Hauger, Anne Holt, Roy Jacobsen, Gunvor Kloster, Per Knutsen, Britt Karin Larsen, Sidsel Mørck, Erna Osland, Tande-P., Tor Torkildsen og Hanne Ørstavik.

 

‘jorda’ eller ‘jorden’?

Innledning

I offisielt bokmål er grammatisk hunkjønn valgfritt siden 1981: Alle substantiver som kan være grammatisk hunkjønn, kan alternativt være hankjønn. Det er likevel ikke slik at valget står mellom alle eller ingen – valgfriheten gjelder hvert enkelt substantiv. Noen skribenter har derfor et større innslag av hunkjønnssubstantiver enn andre. Offisielt legges det ingen begrensninger på sammenhenger mellom disse valgene, men i praksis viser de seg å ha en struktur, f.eks. slik at valg av hunkjønn ved abstrakter typisk impliserer valg av hunkjønn ved konkreter hos samme skribent, men ikke omvendt (fortellinga synes å implisere gata, men gata kan opptre sammen med fortellingen). Disse forholdene er studert nærmere med utgangspunkt i fire aviser i artikkelen «Norm clusters in written Norwegian». I dette blogginlegget skal vi se nærmere på omfanget av bruken av hunkjønn i NorGramBank.

Endelse i bestemt form entall

Oversikten nedenfor tar for seg bestemt form entall av substantiver med mulig hunkjønn og viser andelen forekomster som har hankjønnsendelsen -en. Materialet er fra bokmålsdelen av NorGramBank og omfatter:

Avistekst: ca. 3,2 mill. ord
Sakprosa: ca. 11,2 mill. ord
Barnebøker: ca. 4,1 mill. ord
Romaner, også oversatte: ca. 27,5 mill. ord

Bare substantiver som forekommer i bestemt form entall minst 10 ganger, er tatt med. Det gir 921 substantiver. Grafen nedenfor viser prosentandelen hankjønnsendelse når substantivene langs x-aksen er sortert fra maksimal til minimal andel hankjønn.

Prosentandeler -en ved 921 potensielle hunkjønnsord:

 

Kurven viser at 829 potensielle hunkjønnssubstantiver har -en i mer enn 50 % av tilfellene, det vil si 90 % av substantivene. 247 substantiver, eller 26,8 %, har bare -en.

Tabellen nedenfor viser tallene for hvert substantiv, sortert med  dem som har høyest prosent, først, slik som i diagrammet. Første kolonne viser substantivlemma, annen kolonne antall forekomster av bestemt form entall (med -a eller -en), og tredje kolonne hvor mange prosent av disse som har -en. Det kan være små innslag av feilanalyser på grunn av homonymi.

[Tallene og tabellene er oppdatert 27.04.2018.]

En alfabetisk sortert versjon av tabellen finnes her.

Mulige hunkjønnsord sortert etter prosentandel -en:

 

Substantivlemma # def. pl. % –en
adferd 73 100,0
akt 53 100,0
aldring 33 100,0
amming 43 100,0
analyse 375 100,0
anbefaling 65 100,0
annonse 162 100,0
arbeidsledighet 100 100,0
armhule 76 100,0
atferd 145 100,0
avhengighet 72 100,0
avkastning 91 100,0
avsetning 13 100,0
avsløring 55 100,0
avvisning 36 100,0
barmhjertighet 19 100,0
bedring 45 100,0
befruktning 17 100,0
begivenhet 112 100,0
begrensning 26 100,0
bemerkning 196 100,0
beretning 101 100,0
bergart 30 100,0
berøring 322 100,0
besetning 92 100,0
beskyldning 25 100,0
beslutning 298 100,0
besluttsomhet 43 100,0
bevaring 17 100,0
bevilgning 48 100,0
bitterhet 169 100,0
blodprøve 29 100,0
bomull 32 100,0
bragd 26 100,0
bregne 11 100,0
brikke 87 100,0
bølgelengde 11 100,0
cellegift 59 100,0
diskriminering 21 100,0
doktorgradsavhandling 45 100,0
dumhet 35 100,0
dyktighet 17 100,0
dødelighet 181 100,0
erindring 135 100,0
etterforskning 294 100,0
evne 1002 100,0
fatning 141 100,0
ferdighet 12 100,0
festning 221 100,0
fettsyre 11 100,0
flodbølge 34 100,0
flukt 247 100,0
forankring 15 100,0
forebygging 15 100,0
forelesning 67 100,0
forfatning 11 100,0
forfengelighet 23 100,0
forlegenhet 30 100,0
formaning 10 100,0
forretning 447 100,0
forsiktighet 15 100,0
forskrift 72 100,0
forsoning 18 100,0
fortolkning 25 100,0
fortrolighet 39 100,0
forventning 154 100,0
fregne 18 100,0
fruktbarhet 39 100,0
fuktighet 167 100,0
følge 23 100,0
følsomhet 67 100,0
gange 101 100,0
gave 348 100,0
gjerning 40 100,0
godkjennelse 14 100,0
grunnforskning 76 100,0
gruppering 11 100,0
grusomhet 19 100,0
grønnsak 19 100,0
gåsehud 20 100,0
hele 20 100,0
helhet 154 100,0
helsesøster 31 100,0
hemmelighet 502 100,0
hengivenhet 25 100,0
hensikt 579 100,0
henvisning 13 100,0
hindring 22 100,0
historie 112 100,0
hjelpeløshet 45 100,0
hodepine 137 100,0
hovedsak 94 100,0
hustru 94 100,0
hvile 63 100,0
høflighet 29 100,0
innledning 80 100,0
innsikt 83 100,0
innstilling 106 100,0
integrering 29 100,0
julegave 20 100,0
karriere 308 100,0
katastrofe 332 100,0
kjensgjerning 14 100,0
kjernekraft 34 100,0
klage 76 100,0
klimaforskning 106 100,0
kreftcelle 13 100,0
krigføring 29 100,0
krokodille 65 100,0
kylling 94 100,0
ladning 38 100,0
landing 64 100,0
ledning 123 100,0
legning 21 100,0
lengde 408 100,0
lesning 67 100,0
letthet 24 100,0
likegyldighet 75 100,0
likhet 181 100,0
livsform 15 100,0
lovgivning 129 100,0
lønnsomhet 58 100,0
løve 167 100,0
manet 40 100,0
markering 45 100,0
matvare 23 100,0
medlidenhet 57 100,0
merverdiavgift 26 100,0
messing 25 100,0
miljøgift 22 100,0
mistenksomhet 34 100,0
motsetning 68 100,0
mulighet 1824 100,0
munterhet 45 100,0
myndighet 32 100,0
mynte 55 100,0
nyhet 602 100,0
nysgjerrighet 226 100,0
nød 100 100,0
nøyaktighet 41 100,0
offentlighet 337 100,0
omskjæring 23 100,0
omsorg 281 100,0
oppløsning 56 100,0
oppmuntring 12 100,0
oppstilling 10 100,0
oppsummering 28 100,0
overbevisning 45 100,0
oversikt 190 100,0
overtro 15 100,0
overvekt 24 100,0
p-pille 27 100,0
pakt 70 100,0
personlighet 139 100,0
pleie 20 100,0
programvare 54 100,0
påkjenning 83 100,0
rad 117 100,0
registrering 60 100,0
rehabilitering 28 100,0
rein 70 100,0
rekkefølge 114 100,0
rekkevidde 68 100,0
rettferdighet 104 100,0
rettighet 13 100,0
revne 32 100,0
ri 18 100,0
rolle 1004 100,0
røst 157 100,0
samhandling 49 100,0
sannsynlighet 309 100,0
satsning 32 100,0
selvstendighet 15 100,0
selvtillit 142 100,0
sikkerhet 331 100,0
skildring 33 100,0
småpike 27 100,0
stigning 74 100,0
stolthet 234 100,0
storhet 22 100,0
strømning 14 100,0
styrketrening 11 100,0
svakhet 86 100,0
svane 32 100,0
sårbarhet 62 100,0
takknemlighet 36 100,0
tang&algae 124 100,0
taushet 512 100,0
tekst 779 100,0
tetthet 118 100,0
tilbakemelding 16 100,0
tilfeldighet 26 100,0
tilflukt 12 100,0
tilfredshet 31 100,0
tilgjengelighet 60 100,0
tilhørighet 29 100,0
tilknytning 44 100,0
tillit 264 100,0
tilrettelegging 10 100,0
tjenestepike 110 100,0
tolkning 122 100,0
tomhet 219 100,0
trekning 52 100,0
tretthet 201 100,0
tristhet 50 100,0
troverdighet 55 100,0
tulling 58 100,0
tålmodighet 156 100,0
tåre 24 100,0
uavhengighet 34 100,0
uenighet 75 100,0
ulempe 100 100,0
ulikhet 29 100,0
underskrift 41 100,0
undring 51 100,0
urettferdighet 37 100,0
urt 15 100,0
uskyld 39 100,0
utflukt 51 100,0
utgift 10 100,0
utholdenhet 33 100,0
utprøving 36 100,0
utredning 129 100,0
utsikt 494 100,0
utstrekning 18 100,0
utveksling 48 100,0
utålmodighet 54 100,0
uvitenhet 18 100,0
vaksine 466 100,0
vanskelighet 22 100,0
varighet 42 100,0
veiledning 88 100,0
velferd 45 100,0
vennlighet 109 100,0
verdighet 89 100,0
virksomhet 498 100,0
visning 33 100,0
voldtekt 75 100,0
ydmykhet 21 100,0
ytring 16 100,0
ytringsfrihet 114 100,0
ære 148 100,0
ærlighet 41 100,0
økning 547 100,0
åpenbaring 38 100,0
åpenhet 76 100,0
årsak 1564 100,0
hud 4727 99,9
virkelighet 2787 99,9
oppmerksomhet 881 99,9
sorg 863 99,9
stillhet 2212 99,9
pike 2690 99,9
nærhet 1940 99,8
bygning 1149 99,8
ferd 444 99,8
sannhet 2642 99,8
menighet 411 99,8
ro 396 99,7
glede 1180 99,7
ensomhet 386 99,7
skumring 386 99,7
usikkerhet 383 99,7
sak 6323 99,7
visshet 358 99,7
frihet 638 99,7
leilighet 3386 99,7
skjønnhet 304 99,7
bevissthet 599 99,7
utgave 280 99,6
trygghet 275 99,6
oppgave 995 99,6
evighet 240 99,6
opplysning 239 99,6
uniform 233 99,6
stilling 451 99,6
pest 218 99,5
sammensetning 217 99,5
takt 212 99,5
virkning 422 99,5
plikt 796 99,5
uro 563 99,5
gåte 187 99,5
frukt 184 99,5
setning 549 99,5
rettssak 365 99,5
plattform 363 99,4
tenkning 176 99,4
betydning 700 99,4
skam 326 99,4
oppfatning 314 99,4
kjærlighet 1720 99,4
kvinne 7961 99,4
hastighet 155 99,4
form 912 99,3
trellkvinne 149 99,3
borg 286 99,3
redning 140 99,3
holdning 406 99,3
anledning 538 99,3
vare 134 99,3
løgn 267 99,3
forskning 2923 99,2
befolkning 1989 99,2
sammenligning 129 99,2
kartlegging 253 99,2
forening 242 99,2
forutsetning 121 99,2
skråning 474 99,2
skriving 117 99,1
forestilling 580 99,1
klasse 1841 99,1
inntekt 114 99,1
etablering 112 99,1
bluse 557 99,1
skyting 104 99,0
utbygging 103 99,0
oppfølging 102 99,0
rekruttering 100 99,0
historie 4061 99,0
husholdning 98 99,0
retning 667 99,0
samvittighet 369 98,9
unnskyldning 92 98,9
bestilling 88 98,9
fyrstikk 88 98,9
sky 259 98,8
lysning 86 98,8
handling 429 98,8
dekning 84 98,8
sminke 163 98,8
endring 244 98,8
oppfordring 81 98,8
skrift 243 98,8
blødning 80 98,8
lykke 474 98,7
læring 78 98,7
antydning 77 98,7
lære 149 98,7
omsetning 149 98,7
spenning 668 98,7
evaluering 148 98,6
likestilling 74 98,6
salve 74 98,6
sikt 74 98,6
ætt 73 98,6
forurensning 72 98,6
belastning 137 98,5
datamaskin 477 98,5
kjempe 203 98,5
ordning 541 98,5
skuff 741 98,5
håndtering 67 98,5
pille 132 98,5
olje 384 98,4
avgift 61 98,4
spredning 181 98,3
vending 60 98,3
reise 1243 98,3
søyle 118 98,3
stemning 933 98,3
nytte 174 98,3
overskrift 174 98,3
påvirkning 115 98,3
drivkraft 113 98,2
erklæring 113 98,2
kjerne 498 98,2
begeistring 109 98,2
bekymring 163 98,2
tinning 325 98,2
utforskning 54 98,1
væske 214 98,1
niese 105 98,1
lyst 522 98,1
barnevakt 52 98,1
støtte 360 98,1
vandring 152 98,0
prøve 352 98,0
avhandling 502 98,0
eksponering 50 98,0
målsetting 100 98,0
forsamling 395 98,0
kvittering 48 97,9
rift 48 97,9
strekning 142 97,9
utforming 142 97,9
fortelling 513 97,9
gjennomføring 91 97,8
avmakt 45 97,8
krabbe 90 97,8
målsetning 45 97,8
trøst 134 97,8
tro 841 97,7
overføring 88 97,7
sysselsetting 44 97,7
tilpasning 44 97,7
problemstilling 219 97,7
planlegging 130 97,7
beundring 43 97,7
skisse 43 97,7
vurdering 215 97,7
barnepike 85 97,6
innvandring 84 97,6
bygging 167 97,6
åpning 874 97,6
satsing 290 97,6
behandlingsform 41 97,6
dyrkelse 41 97,6
løsning 981 97,6
art 776 97,6
dronning 889 97,5
betraktning 40 97,5
enighet 40 97,5
matlagning 40 97,5
feiring 156 97,4
innretning 39 97,4
slutning 39 97,4
synd 117 97,4
avslutning 116 97,4
forvirring 230 97,4
arbeidskraft 38 97,4
belønning 114 97,4
hjemmeside 38 97,4
innvending 38 97,4
livvakt 38 97,4
utfordring 645 97,4
brud 261 97,3
forvaltning 289 97,2
testing 72 97,2
mumling 71 97,2
oppslutning 71 97,2
samling 282 97,2
utdannelse/utdanning 448 97,1
regjering 2299 97,1
fremstilling 135 97,0
eske 805 97,0
grådighet 33 97,0
jomfru 65 96,9
slå 130 96,9
munnvik 451 96,9
ørn 225 96,9
vertinne 224 96,9
tilnærming 126 96,8
maskin 1036 96,8
kraft 530 96,8
orientering 31 96,8
simulering 31 96,8
erfaring 216 96,8
innføring 123 96,7
adresse 553 96,7
investering 61 96,7
markedsføring 61 96,7
sikring 61 96,7
undervisning 518 96,7
avdeling 840 96,7
aske 378 96,6
erstatning 29 96,6
leting 171 96,5
kappe 256 96,5
bosetning 56 96,4
bølge 280 96,4
forurensing 28 96,4
kreftbehandling 28 96,4
plage 27 96,3
høytid 53 96,2
organisering 106 96,2
tiltro 26 96,2
fortjeneste 77 96,1
nonne 128 96,1
stund 230 96,1
godhet 51 96,1
fordeling 203 96,1
prinsesse 401 96,0
betaling 125 96,0
herlighet 50 96,0
hushjelp 100 96,0
svigermor 170 95,9
oppskrift 193 95,9
hule 762 95,8
last 190 95,8
utvikling 2556 95,7
rand 231 95,7
bilulykke 23 95,7
elskerinne 69 95,7
skulder 4357 95,6
mening 1398 95,6
farmor 157 95,5
opplæring 134 95,5
byge 222 95,5
behandling 1529 95,5
gift 177 95,5
hvisking 66 95,5
håndskrift 88 95,5
strime 22 95,5
finansiering 131 95,4
gudinne 87 95,4
forandring 304 95,4
forklaring 1034 95,4
ulykke 709 95,3
hjelp 594 95,3
doktoravhandling 84 95,2
rynke 63 95,2
syke 105 95,2
plante 476 95,2
forsikring 61 95,1
regulering 81 95,1
steinblokk 20 95,0
formidling 59 94,9
frigjøring 59 94,9
bombe 196 94,9
underholdning 57 94,7
frille 37 94,6
tegning 404 94,6
vorte 55 94,5
sone 218 94,5
tran 18 94,4
blanding 213 94,4
stråling 280 94,3
takk 52 94,2
forbrenning 69 94,2
overvåkning 136 94,1
trakassering 17 94,1
varsling 17 94,1
datter 2902 94,0
spalte 83 94,0
melding 472 93,9
krykke 65 93,8
brille 16 93,8
fagforening 32 93,8
fordypning 32 93,8
sending 140 93,6
håndflate 553 93,5
binding 46 93,5
flenge 46 93,5
venninne 995 93,5
avling 107 93,5
drift 288 93,4
forsyning 15 93,3
forundring 30 93,3
føring 30 93,3
strofe 15 93,3
utstilling 329 93,3
oppvarming 313 93,3
klynge 119 93,3
kobling 172 93,0
kirke 3317 92,9
ape 126 92,9
mestring 14 92,9
skjelving 181 92,8
måling 41 92,7
drakt 307 92,5
røking 53 92,5
mappe 264 92,4
regning 328 92,4
storesøster 91 92,3
makt 945 92,3
hoppe 194 92,3
formulering 51 92,2
elendighet 190 92,1
deling 63 92,1
beregning 113 92,0
lagring 25 92,0
brystvorte 161 91,9
merking 37 91,9
mobbing 86 91,9
avføring 61 91,8
glo 85 91,8
presse 624 91,7
saft 143 91,6
nåtid 169 91,1
klimaendring 11 90,9
sene 11 90,9
søster 2858 90,8
lesing 87 90,8
rekke 480 90,6
kusine 241 90,5
måke 83 90,4
nettside 114 90,4
drosje 413 90,3
flytting 123 90,2
ramme 323 90,1
bot 40 90,0
bredd 10 90,0
ernæring 10 90,0
kongle 10 90,0
maling 253 89,7
krone 204 89,7
plassering 97 89,7
hinne 58 89,7
telling 58 89,7
side 9503 89,5
kløft 247 89,5
utgravning 38 89,5
grav 864 89,5
jakt 697 89,4
plomme 28 89,3
egg 149 89,3
flate 278 89,2
novelle 101 89,1
overflate 1564 88,9
blodåre 27 88,9
publisering 45 88,9
sidegate 18 88,9
sjel 880 88,9
lukt 2432 88,8
gjeld 176 88,6
skje 281 88,6
juling 26 88,5
istid 86 88,4
mormor 291 88,3
pakke 727 88,3
kirkeklokke 17 88,2
prioritering 25 88,0
tante 799 88,0
pressemelding 274 88,0
nattevakt 116 87,9
trening 435 87,8
trakt 41 87,8
mor 17846 87,7
sirene 57 87,7
næring 461 87,6
fjellside 313 87,5
levetid 63 87,3
bestevenninne 94 87,2
mine 85 87,1
bestemor 958 87,1
skilpadde 69 87,0
hofte 375 86,9
frue 800 86,9
sjokoladekake 15 86,7
forbedring 22 86,4
aldersgruppe 166 86,1
fortid 1264 86,1
bønn 287 86,1
tid 20138 86,0
påske 176 85,8
grense 1285 85,5
målgruppe 69 85,5
hånd 22700 85,4
trekrone 27 85,2
skål 439 85,0
kjøring 98 84,7
halvkule 13 84,6
sløyfe 123 84,6
man 141 84,4
årstid 147 84,4
lenke 86 83,7
pil 269 83,6
panne 4847 83,4
vindmølle 18 83,3
lunge 35 82,9
hake 2049 82,8
lillesøster 243 82,7
kåpe 658 82,7
perle 23 82,6
vakt 692 82,4
krukke 187 82,4
sen 17 82,4
tjære 17 82,4
arbeidstid 135 82,2
føde 39 82,1
drue 11 81,8
iling 22 81,8
rådgivning 11 81,8
badedrakt 71 81,7
avis 2875 81,6
strømpe 64 81,3
jordmor 175 81,1
stemor 196 81,1
gren 312 80,4
dukke 690 80,4
gatelykt 66 80,3
morgenkåpe 279 80,3
såpe 121 80,2
lampe 792 80,1
gulrot 25 80,0
pappeske 45 80,0
forskningsgruppe 109 79,8
ettertid 89 79,8
tåke 817 79,6
mast 100 79,0
ventetid 157 79,0
filmstjerne 19 78,9
styring 229 78,6
skoletid 83 78,3
morsmelk 46 78,3
rose 216 78,2
båre 45 77,8
flette 135 77,8
tunge 1830 77,7
maske 273 77,7
natt 9185 77,5
rifle 204 77,5
strand 2107 77,3
stripe 149 77,2
celle 683 77,0
vekt 699 77,0
rente 78 76,9
kiste 835 76,6
forskergruppe 260 76,5
oldemor 21 76,2
kake 321 76,0
ert 25 76,0
lommelykt 306 75,8
skolisse 33 75,8
hore 45 75,6
postkasse 412 75,5
tørke 53 75,5
skyld 887 75,4
gruppe 3173 75,2
dame 2959 74,9
fremtid 3250 74,8
lyspære 63 74,6
seng 10429 74,6
flaske 1574 74,2
luft 6557 74,0
lønning 19 73,7
saks 191 73,3
havn 726 73,3
skapdør 155 72,9
linje 527 72,7
melk 395 72,7
mark 545 72,5
lønn 264 72,0
vindusrute 110 71,8
kontrollgruppe 170 71,8
pumpe 60 71,7
linse 81 71,6
krise 221 71,5
snor 286 71,3
økt 38 71,1
fritid 245 71,0
glassrute 93 71,0
ferge 330 70,6
bleie 34 70,6
nese 3410 70,1
skjorte 1591 70,1
vogn 2249 70,0
gjødsling 10 70,0
hekt 10 70,0
veske 1554 69,8
jul 698 69,8
stikke 66 69,7
jakke 2244 69,4
pute 940 69,3
kulde 994 69,1
dør 24961 68,8
leppe 755 68,7
niste 41 68,3
fjær 69 68,1
stjerne 471 67,9
trapp 6350 67,7
skinnjakke 136 67,6
truse 294 67,3
gate 5448 67,1
grop 73 67,1
bjelle 82 67,1
dagbok 367 67,0
slekt 433 66,7
flaggermus 51 66,7
husmor 33 66,7
matte 180 66,7
skorpe 72 66,7
kule 649 66,6
lomme 2255 65,9
matpakke 133 65,4
bukselomme 149 65,1
enke 229 65,1
liste 1101 64,6
slette 576 64,4
barnevogn 112 64,3
bokhylle 289 63,3
kanne 163 63,2
syre 38 63,2
nål 236 63,1
due 54 63,0
rot 174 62,6
skinne 16 62,5
klokke 5557 62,4
lykt 537 62,4
uke 2951 62,3
eng 291 62,2
kasse 908 62,1
sol 6734 62,1
plate 619 61,1
helg 703 61,0
lekse 122 60,7
stue 6618 60,4
åre 334 60,2
fil 35 60,0
rute 860 59,9
frøken 67 59,7
suppe 289 59,5
lommebok 488 59,4
vise 76 59,2
rem 114 58,8
dyne 1586 58,8
hylle 777 58,6
søppelkasse 100 58,0
skive 182 57,7
brødskive 118 57,6
ordbok 66 57,6
tavle 340 57,4
bok 5329 57,1
bløtkake 23 56,5
lue 656 55,8
lisse 29 55,2
luke 527 55,0
gruve 271 55,0
stang 339 54,9
bør 31 54,8
ølflaske 86 54,7
gås 112 54,5
seter 107 54,2
bro 1120 54,1
brygge 758 54,1
hette 237 54,0
søle 165 53,9
dongeribukse 71 53,5
glassdør 129 53,5
pannekake 17 52,9
tann 61 52,5
ski 21 52,4
blokk 635 52,0
antenne 93 51,6
bølle 33 51,5
skinke 35 51,4
trøye 179 50,3
gru 133 49,6
gjørme 146 49,3
73 49,3
jord 5901 49,2
øks 297 49,2
padde 72 48,6
T-skjorte 320 48,4
vik 278 47,5
flis 59 47,5
and 110 47,3
bie 89 47,2
kai 541 47,1
gresshoppe 32 46,9
sprøyte 111 46,8
elv 3444 46,3
bukt 303 46,2
heks 325 46,2
underbukse 155 45,8
helse 584 45,5
boble 109 45,0
bukse 835 43,2
vifte 58 43,1
hakke 70 42,9
å 14 42,9
ull 100 42,0
mus 254 41,3
pipe 326 40,2
olabukse 20 40,0
grøft 228 39,5
line 151 38,4
bøtte 348 37,6
fortann 24 37,5
pære 88 37,5
felle 182 37,4
ugle 67 37,3
tønne 94 37,2
tromme 38 36,8
gryte 312 36,2
flue 191 36,1
nøtt 25 36,0
mil 17 35,3
lilje 43 32,6
tispe 109 31,2
renne 62 30,6
øgle 83 30,1
pølse 100 30,0
klo 165 29,7
skøyte 59 28,8
gjødsel 35 28,6
kone 2847 27,8
køye 236 27,5
lærebok 80 27,5
eik 65 26,2
sild 137 25,5
tue 68 25,0
hytte 2653 23,0
gran 102 22,5
li 180 22,2
myr 263 20,2
reke 35 20,0
bjørk 126 19,8
furu 64 18,8
kjerre 131 17,6
mugge 18 16,7
fjære 148 15,5
bygd 1092 14,5
ungjente 84 14,3
fille 204 13,7
høne 214 13,1
rotte 331 8,8
moro 93 8,6
gaupe 102 7,8
møkk 98 7,1
lus 50 6,0
geit 41 4,9
kjerring 216 4,2
kråke 115 3,5
grunne 29 3,4
lakselus 31 3,2
tjenestejente 82 2,4
øy 2501 2,4
jente 4197 2,4
rype 42 2,4
ku 346 2,0
leire 52 1,9
søppel 115 1,7
skute 192 1,6
bikkje 294 0,3
fitte 129 0,0
fyll 186 0,0
klemme 20 0,0
småjente 11 0,0