Brukes passiv?

Innledning

Blant de mange unyanserte råd som gis til norske skoleelever, studenter og andre som skal skrive, er at de ikke bør bruke passiv. Eksemplene som listes opp til skrekk og advarsel, utstyres gjerne med noen ekstra papirknitrende ord i tillegg til selve passiven, så poenget skal bli riktig tydelig. Et par eksempler:

(1)
«Skrivetips: unngå passiv. Passivformen er farlig i dokumentasjon fordi den ikke sier hvem som gjør hva: Ikke skriv: Skifting av toner utføres etter 2000 sider . Skriv heller: Du må skifte toner etter 2000 sider.»

(2)
«Unngå passiv – ta ansvar i teksten. En aktiv setning gjør språket ditt klarere, og du unngår å bli misforstått. For at leseren din skal kunne handle riktig, må du få tydelig fram i teksten hvem som skal gjøre hva. Ikke skriv: Jeg kontaktes på telefon eller e-post med forslag til møtetidspunkter. Men slik: Du kan ringe meg eller sende en e-post med forslag til møtetidspunkter.»

I eksempel (1) ville Toner skiftes etter 2000 sider være den enkle passive versjonen av den anbefalte setningen, men verbet utføres sammen med substantiveringen skifting er egnet til å få leseren til å nikke samtykkende: Dette er tørre greier. Det samme gjelder kontaktes på telefon sammenlignet med ringe meg  i eksempel (2). Men slikt må nok til for å få passivene til å se tilstrekkelig skremmende ut. Forøvrig sies det bare generelt og uten begrunnelse at passiv er farlige greier, og at aktiv gjør språket klarere. Man kan jo undres over at så mange språk overhodet har utviklet dette dysfunksjonelle redskapet når det bare fører til elendighet, og tydeligvis unngås av dem som vil uttrykke seg klart. (Jeg har brukt ikke mindre enn fem passiver hittil i denne teksten, så jeg har åpenbart noe å skjule.)

Råd av denne art er tilnærmet grunnløse. De innebærer at viktige deler av språkets uttrykksforråd settes på en slags indeks, med et fattigere og snevrere språk som et mulig resultat, i den grad rådene følges. Nå er det riktignok ingen tvil om at passiv også kan brukes retorisk til å depresisere et innhold som skriveren ikke vil skal bli altfor avslørende detaljert – noe det kan være interessant å studere og kritisere når det forekommer. Men å la det føre til en generell fraråding av passiv er på linje med å fraråde enhver bruk av hammere fordi de kan brukes til å slå folk i hodet med.

Hva er passiv?

Verb – reparerer, arbeider, gir, antar, bruker, liker – er de sentrale ordene i sine setninger og forteller hva som foregår, gjøres, eller er situasjonen. Verbene forutsetter et større eller mindre antall deltagere i de beskrevne situasjonene, som kan identifiseres ved hjelp av subjekter, objekter og lignende. Den deltageren som identifiseres av subjektet – f.eks. Per i Per reparerer sykkelen eller læreren i Læreren liker Mozart – fremstår typisk som den mest prominente deltageren i situasjonen, den som setningen først og fremst handler om.

Passiv gjør det mulig for andre deltagere å være prominente.

Dette skjer ved at man gir verbet en passiv markering – på bokmål f.eks. med en -s eller på nynorsk en -st, eller med hjelpeverbet bli eller være Dette utstyret brukes sjelden, Sykkelen blir reparert på torsdag. Den første setningen handler nå om utstyret, ikke om dem som bruker det, og den andre om sykkelen, ikke om den som reparerer den. Dette skjer ved at passiv gjør det mulig for dette utstyret og sykkelen  å være grammatisk subjekt. Passiv lar oss med andre ord tilpasse setningens form til kommunikasjonens behov der og da. Det som er tema i kommunikasjonssituasjonen, kan gjøres til subjekt. Dette er et redskap vi ønsker å beholde.

Norsk (og til dels skandinavisk forøvrig) skiller seg ut fra mange av våre nabospråk ved å ha en særlig rik flora av passivtyper, noe som gir språket en spesiell fleksibilitet (og noe som gjør det særlig destruktivt med generelle frarådinger av passiv, istedenfor instruksjon i bruk). En konsekvens av disse mulighetene er at den talende ikke behøver å ha planlagt sin setning helt til ende før han eller hun begynner å snakke. Vi kan, enkelt sagt, bare begynne med å benevne den personen eller tingen vi vil si noe om, og så stole på at språkets passivmuligheter lar oss formulere en velformet setning deretter, nesten uansett hvilken rolle den vi snakker om, spiller i situasjonen. For det er ikke bare direkte objekter vi kan gjøre til subjekter i norske passivsetninger. To eksempler fra en nett-diskusjon:

Få personer ville ropt og klaget om man ikke ble holdt oppe døren for.
Å holde dører oppe for folk eller å bli holdt døren åpen for skaper begge store problemer

I første eksempel er få personer tema, og så skal man snakke om en situasjon der noen ikke holder døren åpen for disse få personene. Med passiv kan vi da hente dette subjektet helt nede fra objektet for preposisjonen for, og slik la temaet bli subjekt. I annet eksempel er det tale om to roller man kan ha, koordinert med eller, der det er passiven som gjør en slik koordinasjon mellom to å-infinitiver mulig, når de to rollene det er tale om, er så ulikt plassert i situasjonen. Eksemplene illustrerer den fleksibiliteten passiv gir.

Norsk tillater også passiv av intransitive verb – verb som ikke tar objekt, som arbeide, sove, leke, snakke. Det kan skje som nettopp vist ved at et preposisjonsobjekt blir subjekt:

På det tomme barnerommet, der lekene ikke blir lekt med og sengen ikke lenger blir sovet i(avistekst)
Studentene øver seg på å se hvordan menneskerettigheter kan argumenteres for i ulike situasjoner i ulike land. (sakprosa)
Selv om anlegget er enormt, er det universets minste byggesteiner – partiklene – som skal eksperimenteres med, slik at de forhåpentligvis avslører noen av sine hemmeligheter. (sakprosa)

Eller det kan skje ved at subjektet er et tomt det, når selve handlingen er tema og identiteten til de handlende er irrelevant:

Det snakkes på bygda. (romantekst)
Derfor arbeides det for å forbedre produksjonen. (sakprosa)
Men det ble arbeidet intenst med saken. (romantekst)

Nok en passivtype er den ‘komplekse’ passiven, der en serie av innordnede verbalhandlinger pakkes sammen under et felles subjekt:

De fleste er antatt dokumentert tatt av kongeørn. (stortingsforhandlinger)

Utgangspunktet er at noen antar at noen andre har dokumentert at kongeørn har tatt de fleste. Alle tre verb settes i passiv partisippform, og frasen de fleste, semantisk sett deltager bare i ta-situasjonen, blir felles subjekt for dem alle. Dette er økonomisk og kompakt uttrykt, velegnet for overskrifter, for eksempel, men det illustrerer også en lite muntlig passivtype som ikke er typisk for en ledig stil.

Også passive partisipper som brukes adjektivisk, er eksempler på passivformer av verb, selv om de ikke inngår i noe verbal og derfor ikke danner passive setninger:

Det ambisiøse målet i planperioden er å halvere antallet drepte og skadde i vegtrafikken. (stortingsforhandlinger.)
Derfor fremmer regjeringen forslag om en reform for redusert byråkrati og økt effektivitet i staten. (stortingsforhandlinger.)

Passiv i tekstene

Trebanken NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Når vi skal undersøke hvordan passiv fordeler seg på de ulike teksttypene, finnes det flere måter å telle på. Her skal vi gjøre et lite utvalg, og begynner med å se på hvor mange prosent av setningene i en tekst som inneholder minst én passiv verbform av en eller annen type. Hvis vi rangerer deltrebankene etter denne prosenten, kan det være interessant å sammenholde resultatet med det målet på syntaktisk kompleksitet som er diskutert i et annet blogginnlegg her (Setningskompleksitet: et mål på lesbarhet?), basert på antall leddsetninger og grad av underordning av leddsetningene i gjennomsnittlige helsetninger. Tabellen nedenfor viser i hvilken grad slik syntaktisk kompleksitet er korrelert med passivbruk i deltrebankene:

Deltrebankene rangert etter passivbruk

Deltrebank % setn. med passiv kompleksitet
1. nob-fn 23 82
2. nor-stortinget_1 20 112
3. nor-stortinget_2 20 113
4. nor-stortinget 19 107
5. nor-stortinget_3 19 110
6. nor-stortinget_4 18 97
7. nob-lbk-sa 17 67
8. nob-ndt-lfg 16 60
9. nob-lbk-av 15 55
10. nno-nnk-sa 14 55
11. nob-avis 12 59
12. nno-nnk-av 12 58
13. nob-novel_5 6 44
14. nob-novel_4 6 47
15. nob-novel_2 6 48
16. nob-novel 5 46
17. nob-novel_1 5 44
18. nob-novel_3 5 46
19. nob-child 5 42
20. nno-novel 4 41
21. nob-lbk-tv 4 26
22. nno-child 3 37

Tabellen viser at tekster av samme art danner klynger med tilnærmet samme verdi i rangeringsordenen for passivbruk, f.eks. stortingsforhandlingene (nor-stortinget, 2 – 6) én klynge og bokmålsromanene (nob-novel, 13 – 18) en annen. Det bestyrker inntrykket av ensartethet innenfor disse teksttypene. Grafen nedenfor viser korrespondansen mellom de to variablene passiv og kompleksitet, der blått er prosentdel setninger med passiv og orange syntaktisk kompleksitet (to forskjellige mål, så det er bare kurvenes form som er relevant for sammenligningen):

De samme klyngene som ble nevnt ovenfor – stortingsforhandlinger og skjønnlitteratur – finner vi i rangeringen av kompleksitet. Det er særlig én deltrebank der de to variablene ikke korresponderer: nr. 1 nob-fn, det populærvitenskapelige nett-tidsskriftet forskning.no. Den er på topp i frekvens av passiv, men rangerer lavere enn stortingsforhandlingene i syntaktisk kompleksitet. Det er nærliggende å tenke at temaet vitenskap, med stor vekt på å fremstille hendelser og prosesser uten aktive handlere, motiverer bruk av passiv, mens det populærvitenskapelige formålet motiverer lavere syntaktisk kompleksitet. Stortingsdebattantene (2 – 6) behøver i mindre grad å ta slike formidlingshensyn.

Det er hovedsakelig i stortingsforhandlingene at vi kan finne setninger som denne, som skårer høyt etter kompleksitetsmålet:

Det flertallet i den norske befolkningen som ser problemer med at Norge vedtar mye politikk som den norske befolkningen ikke ønsker, fordi mange partier, i motsetning til de rød-grønne, ikke tør å bruke reservasjonsretten selv når det er veldig viktig, er problemstillinger som Høyre bør tenke over.

Noen eksempler på  passivbruk i nr. 1 nob-fn – forskning.no:

Alle ble målt og veid, ulike prøver ble tatt og noen ble utstyrt med måleinstrumenter av forskjellig slag.
Forskerne mener at giften Akrylamid dannes når mat friteres, stekes eller grilles, og de tror stivelsen omdannes til akrylamid når karbohydratene i maten varmes opp.
– Dersom det da skulle bli oppdaget noe som gjør at fisken ikke kan selges og må destrueres, kan skaden begrenses til akkurat den fisken det gjelder.
De fleste stedene som er rammet av sykdommen anbefales det imidlertid at mennesker som har vært utsatt for SARS holdes i karantene i bare ti dager.
Størstedelen av avfallet må bli konsumert under operasjonen, og mesteparten av energien som produseresgjenvinnes og brukes.
Behandling som utøves i helsetjenesten eller av autorisert helsepersonell, omfattes likevel av begrepet alternativ behandling når det brukes metoder som i all vesentlighet anvendes utenfor helsetjenesten.
Alternativ medisin blir ofte definert opp mot skolemedisinen, som den medisin som er akseptert og autorisert av myndighetene og som undervises på våre universiteter..
– Grunnen er at alle ulvene som blir overkjørt og drept vil bli funnet og rapportert inn til myndighetene, sier Linder Olsen.

Også den nynorske sakprosaen bruker passiv, om enn i mindre omfang. Her er noen eksempler fra nr. 10 nno-nnk-sa (sakprosa fra korpuset til Norsk Ordbok):

Han vart både hylla og heidra og prisa med kritikarpris.
Smaksstandardar skal utviklast og hevast, folket skal utfordrast med kvalitetstilbod i foredrag, kunst og kultur.
Rett før krigen blei det utvikla ein modell som gjekk på akkumulatorbatteri og samtidig blei det laga små vindmøller som kunne brukast til å lade batteria.
Svara må forståast innanfor rammene av dei programtypane som blei ramsa opp (det manglar til dømes nyheitsprogram), og innanfor rammene av kva som faktisk blei sendt:
Fisken måtte fangast, konserverast og førast til ein marknad.
I det første svenske avtaleutkastet heitte det at Noreg vart avstått til Sverige og skulle inkorporerast eller innlemmast i det.
Ein vanleg kuppel av opalglas kastar nokre strålar mot vegg og tak slik at dei blir kasta tilbake derifrå, medan nokre strålar blir kasta direkte mot den staden som skal lysast opp.
Dei blir pressa for pengar, valdtekne og banka opp, og maten deira blir stolen frå dei.

-s/-st-passiv

Den morfologiske passiven på -s (bokmål) og -st (nynorsk) brukes i alle deltrebankene, men det er vanlig å tilskrive den ulik status i de to målformene. -s/-st kan tilføyes både finitte verbformer (presens og preteritum) og infinitivsformer:

Presens:
Maten stekes.
Om kvelden samlast bøndene på nytt til messe.

Preteritum:
Øynene fyltes av tårer.
No tømdest husa om dagen.

Infinitiv:
Hjertet slo så det måtte høres.
I kveld skal han drepast.

I nynorsk er det likevel en formidlet norm at st-passiv bør unngås i finitte former og helst bare brukes i infinitiv, altså helst bare i eksempler som det siste ovenfor. Det kan derfor være av interesse å se om denne normen har synlige utslag i tekstene. Tabellen nedenfor viser hvilken prosent av s-/st-formene i hver deltrebank som er finitt (presens eller preteritum); de resterende er da infinitiv. Det er likevel viktig å vurdere nærmere hvor mange av st-formene som virkelig er passive, og hvor mange som har andre funksjoner som ikke blir utelukket av den nevnte normen.

Prosentandel finitte -s/-st-former av samtlige -s/-st-former

Deltrebank % finitte -s/-st-former
nob-lbk-av 65,3
nob-avis 62,7
nob-fn 61,5
nob-ndt-lfg 60,1
nob-lbk-sa 59,0
nob-lbk-tv 58,1
nob-novel_3 56,0
nor-stortinget_4 53,6
nob-child 53,2
nor-stortinget_2 51,9
nor-stortinget_1 51,6
nor-stortinget_3 51,4
nob-novel_1 51,4
nor-stortinget 51,3
nob-novel_2 48,6
nob-novel_5 48,1
nob-novel 47,3
nob-novel_4 45,0
nno-child 44,8
nno-novel 37,2
nno-nnk-av 16,9
nno-nnk-sa 12,9


Noen av tallene kan være litt for høye på grunn av feilanalyser som ikke er sortert fra her, men de innbyrdes relasjonene mellom trebankene er antagelig riktige. Her samler de nynorske deltrebankene (nno-) seg i bunnen. På topp finner vi aviser og sakprosa på bokmål, og deretter skjønnlitteratur på bokmål og stortingsforhandlinger i en lite differensiert gruppe.

Eksempler på finitte st-former fra de nynorske tekstene viser at mange av dem ikke egentlig er passiver, og derfor ikke rammes av den nevnte normen. Eg minnest er ikke en passiv setning som betyr at noen minner meg, men en konstruksjon som uttrykker en ikke-agentiv tilstand eller overgang. Et utvalg eksempler, der de rimelig tydelige passivene er merket med rødt:

Men like etter hadde han sett seg ned på huk, og det høyrdest ut som han flytta eitkvart frå veska over til boksen.
Eg mintest første gongen eg fekk vita noko om han.
Litt etter litt fyltest plassen framfor bardisken opp, og inn i denne flokken kom Johan Ferdinand.
Ein stad, men ikkje i hotellet, høyrest felemusikk.
Dei som lukkast i å komme seg ut levande, klarar ikkje lenger å halde seg i ro.
Våpna rettast mot den indre fienden, som er den gode fienden.
I menneskas liv kjennest det stundom som om der var tankar bak alt som hende oss.
Kva slags personell er det som trengst for å handtera slike konfliktar?
Rundt om i landet samlast folk i studiesirklar.
Det krevst meir av dei.
Han bråbremsar, og ho høyrer noko som knusest mot fjellet.
Eit lite dyr føddest inne i meg.
Overgangen merkast knapt.
– Vi snakkast kanskje i Italia?
Slike ord kallast stikkord.
Som ville flyktningar kastast me mellom grensene for det me kan tåla.

Av de drøyt 1000 eksemplene fra de nynorske tekstene inneholder over halvparten ett av de seks verbene synest, høyrest, kjennest, snakkast, møtest og trengst. Den nevnte normen setter dermed et rimelig tydelig preg på tekstene.

Passiv hos forfatterne

Vi skal se kort på hvordan passivbruken er fordelt mellom to grupper av forfattere: forfatterne av populærvitenskapelige tekster på forskning.no og forfatterne av bokmålsromaner. Blant de førstnevnte begrenser vi oss til forfattere som er representert med tekster på minst 20 setninger. Da er tallene 913 sakprosaforfattere og 343 skjønnlitterære forfattere.

I sammenligningen av deltrebankene sammenlignet vi prosentandelene av setninger som inneholdt minst én passiv verbform. Ved forfatterne ser vi bort fra adjektiviske partisipper (den fullførte romanen) og konsentrerer oss om verbale passiver, altså -s/-st-passiver og være/bli/vere/verte-passiver – det vil si morfologisk og perifrastisk passiv. For hver forfatter teller vi hvor mange morfologiske eller perifrastiske passiver som i gjennomsnitt opptrer pr. 100 setninger. Resultatet fremgår av grafen nedenfor, med én kurve for hver av de to forfattergruppene, der hver gruppe er ordnet langs x-aksen fra forfattere med mange til forfattere med få passiver.

Antall passiver pr. 100 setninger hos sakprosaforfattere og romanforfattere (bokmål)

Variasjonen er betydelig større hos sakprosaforfatterne, der antall morfologiske og perifrastiske passiver pr. 100 setninger går fra 74 til 0, mens romanforfatterne går fra 14 til 1. Vi skal eksemplifisere med tekstutdragfra tre av forfatterne, først Sonja Wilhelmsen (67 pr. 100 setninger):

Kunnskap og erfaring blir ofte oppnådd gjennom stor personlig og arbeidsrelatert risiko.
Imidlertid er kunnskaps- og erfaringsdeling viktig i disse organisasjonene fordi feilaktig eller villedende informasjon kan ha fatale konsekvenser.
Blant annet ses den enkelte yrkesgruppe og organisasjon som bærere av en spesifikk kultur.
Grensene mellom de ulike kulturer og organisasjoner blir identifisert som punkt der sammenbrudd i kommunikasjon og informasjonsdeling kan oppstå.
Disse funnene har ikke vært beskrevet tidligere.
Identifiseringen av disse punktene kan bidra til at misforståelser unngås og at informasjonsflyten samt kunnskaps- og erfaringsoverføringen forbedres i fremtiden.
I tillegg til identifiseringen av sammenbruddspunktene for kommunikasjon og informasjonsdeling har jeg utarbeidet en detaljert modell som viser hvordan innhentet informasjon transformeres gjennom de ulike fasene i etterforskningen.
Modellen er bygd på en klassifisering som tar hensyn til de overordnede spørsmålene i en etterforskning:
Et datamaskinbasert informasjonssystem bygd opp etter denne modellen kan brukes i opplæring av nye etterforskere samt gi støtte for den erfarne etterforskeren, spesielt i kompliserte saker der etterforskningen foregår over lang tid.
Jeg presenterte resultater fra forskningen i et prosjektarbeid der nye elektroniske hjelpemidler for politietterforskning ble vurdert.
Prosjektet var satt i gang av Politidirektoratet.
Selv om forskningen har fokusert på politietterforskning, er resultatene overførbare til andre områder som har et beslutningsgrunnlag bygd opp av ulike informasjonstyper og der informasjonen transformeres gjennom beslutningsprosessen.

Apropos de advarslene mot passiv som ble sitert innledningsvis: Det er vanskelig å se at denne teksten på noen måte lider av uklarhet, at forfatteren unnlater å «ta ansvar», eller at stilen skulle skape andre vanskeligheter. Den illustrerer heller hvordan passiv tillater at tekstens umiddelbare tema gjøres til subjekt hele veien, og hvordan dette skaper en langt smidigere informasjonsformidling enn om man hele tiden skulle ha forstyrret flyten ved å sette inn aktive subjekter.

Det neste utdraget er fra Wenche Bakkebråten Rasen, som har 0 forekomster av passiv – og illustrerer at det selvsagt er fullt mulig å skape en klar tekst også på den måten:

Læreplanen betyr lite for undervisningen
– Det kommer nye læreplaner ofte.
I sitt doktorgradsarbeid har Kleve studert matematikklæreres tolking og bruk av læreplanen L97 i ungdomsskolen.
Kleves forskning tyder på at det er for langt mellom intensjonene i læreplanene og lærernes undervisningspraksis.
Den viktigste faktoren for hvordan undervisningen foregår, avhenger mye av lærerens egne oppfatninger om hva som utgjør en god matematikkundervisning, og slike oppfatninger i møte med klasseromskulturen.
Kleve fant ulike typer føringer som påvirket lærernes tolking og bruk av læreplanen.
– Både foreldre og elever forventer en tradisjonell matematikkundervisning, med regler og øvelser.
Elevene ønsker å få ting vist på tavla, før de selv løser tilsvarende oppgaver.
Lærerne mente at tidsaspektet var viktig.
Hvis elevene skal utforske sammenhenger i matematikk selv, vil det ta lenger tid.
Læreren dominerte klasserommet på samme måte som i en mer tradisjonell undervisning.
Noen lærere hadde heller ingen tro på anbefalingene i L97, og dermed heller ikke noe ønske eller vilje til å implementere planen.
De var ikke interessert i nye undervisningsmåter, fordi de mente at den undervisningspraksisen de hadde gjennomført i mange år fungerte godt.
– Siden jeg startet ved Høgskolen i Oslo i 1994 har vi hatt tre ulike læreplaner:
– I tillegg ser jeg at etterutdanning i større grad bør ta utgangspunkt i lærernes ønsker om å utvikle sin undervisningspraksis.
Initiativet bør komme fra læreren selv. 

Til slutt tar vi med noen eksempler fra Knut Faldbakkens Insektsommer (4 pr. 100 setninger) for å illustrere passiv brukt i skjønnlitterær sammenheng. Siden passivtettheten er forholdsvis lav, er dette isolerte setninger og ikke sammenhengende tekst. Heller ikke her er det lett å finne grunner til advarsler mot passiv:

kanskje det var jeg som var i ferd med å forandres?
Forvirrende, avvikende betydninger kunne bli tolket inn i alt omkring meg, alt som hendte meg.
et kutt i fingeren var lett å hanskes med, andre anfektelser var verre.
Blikket hans som allerede var vendt innover mot egne, mer presserende anliggender.
– Og Jo ble konfirmert i vår?
Mer ble det ikke sagt om Jos konfirmasjon.
Men det var så mye som var endret siden den gang;
Hvis livet ennå dirret i et par av dem, ble seremonien gjentatt.
Etterpå ble J og P høytidelig markert på marmoren til evig tid.
Jeg hadde trodd man gikk med lange bukser når man var konfirmert.
De eldre pikene i klasser over kunne ikke regnes med, de virket storvokste og ganske fryktinngytende de aller fleste.
Film var blitt introdusert i bygda med det nye samfunnshuset.
Han adlød, og i samme øyeblikk ble min elendighet bønnhørt ved at det slo i hoveddøren og det klang stemmer over tunet.
– De vet nok hva de der skal brukes til de middelskolejentene!
Latteren til Jo var høy og skjærende, som før om årene når krefter var blitt prøvd og han så at han vant.
Jeg ville ikke flyttes opp på viderekommende-partiet.

Setningskompleksitet: et mål på lesbarhet?

Innledning

En trebank med utførlige syntaktiske analyser kan gi grunnlag for et mer nyansert mål på setningers kompleksitet enn f.eks. det mye benyttede lix, som bare tar hensyn til ren setnings- og ordlengde (se Wikipedia om lix/liks). Et slikt mer nyansert mål ville da selvsagt forutsette at de tekstene som skal måles, er analysert syntaktisk, men ved hjelp av en komputasjonell grammatikk som NorGram ville det i prinsippet være mulig å lage en trebank av en tekst tilnærmet automatisk, slik det har skjedd med NorGramBank. I dette innlegget vil jeg se nærmere på noe som kan tenkes som en komponent i et slikt mulig mål, og hvordan det slår ut på tekster fra NorGramBank.

Et mål på syntaktisk kompleksitet

En side ved syntaktisk kompleksitet som lix ikke tar hensyn til, er graden av innføying – altså i hvilken grad setningen har en hierarkisk struktur der fraser er innføyet i fraser som igjen er innføyet i fraser, osv. Her kan vi særlig tenke på en rekursiv struktur, som betyr at de omtalte frasene er av samme art – for eksempel leddsetning innføyet i leddsetning innføyet i leddsetning, osv. (Leddsetninger har alltid et finitt verb – et verb i presens eller preteritum – så vi tar ikke infinitivskonstruksjoner i betraktning her.) Blant de mange alternative målene på kompleksitet vi kunne definere, velger vi å prøve ut dette kriteriet. Vi vil da gi en setning en vekt som både tar hensyn til antallet leddsetninger i den, uavhengig av om de er innføyet i hverandre, og dessuten til dybden i en slik eventuell innføying. Vi vil anta at kompleksitetsvekten øker sterkere enn lineært med antallet «etasjer» i et slikt hierarki: Fire etasjer skal være mer enn dobbelt så tungt som to. Kompleksiteten i en tekst blir da setningenes gjennomsnittlige vekt.

I hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet, er et empirisk spørsmål som jeg ikke har undersøkt. Det kan være grunn til å mistenke at det kan bli noe for enkelt å ta denne kompleksiteten alene som et mål på lesbarhet, ettersom måten setninger er innføyet i hverandre på, åpenbart spiller en stor rolle for lesbarheten. En rent høyreforgrenet struktur, der leddsetninger står til slutt i de setningene de er innføyet i og ikke midt i eller nær begynnelsen, behøver ikke å være særlig tunglest i det hele tatt. Men det kan være interessant å utprøve en kombinasjon av slik kompleksitet med andre egenskaper ved setningen; det vil jeg komme tilbake til i senere blogginnlegg.

For å illustrere hvordan vi kan registrere antallet leddsetninger og graden av inføying gjennom søking i trebanken, må vi betrakte noen analyseeksempler. I eksemplene skal vi bruke grønn for leddsetninger på første nivå, blå for leddsetninger på annet nivå (altså innføyet i leddsetning på første nivå), rød for leddsetninger på tredje nivå, lilla for leddsetninger på fjerde nivå, grå for leddsetninger på femte nivå og fiolett for leddsetninger på sjette nivå. I en romantekst finner vi denne setningen:

(1) De så at han kvakk da hornsignalet lød

(1) inneholder to leddsetninger: (a) at han kvakk da hornsignalet lød og (b) da hornsignalet lød. (a) er innføyet i helsetningen (1), og (b) er innføyet i leddsetningen (a). (Vi ser bort fra den alternative tolkningen der begge leddsetningene står på samme (grønne) nivå og modifiserer helsetningen, altså verbet .)

Analysen av setning (1) i trebanken vises i figuren nedenfor:

C-strukturen viser setningens oppbygning av fraser og delfraser, f-strukturen viser en analyse i funksjoner og trekk. For vårt formål her skal vi konsentrere oss om c-strukturen:

Alle leddsetninger, også de uten subjunksjon (at, da, …), har en node kalt Ssub eller Ssub2. (Forskjellen mellom Ssub og Ssub2 har å gjøre med hvorvidt subjektet er obligatorisk og er ikke relevant her; vi vil referere til begge med Ssub*.) Denne noden kan vi derfor bruke til å telle leddsetninger, og til å registrere hvorvidt en leddsetning er inkludert i en annen. At en leddsetning er inkludert i en annen, fremgår av at en node Ssub* dominerer en annen node Ssub*. I tillegg til å telle leddsetninger, teller vi da også slike dominansforhold i setningen. I setning (1) har vi to noder Ssub* og ett dominansforhold mellom to slike noder, og dermed blir vekten av denne setningen 3.

For å se hvordan dypere hierarkier påvirker vekten, kan vi betrakte en mer kompleks setning fra trebanken:

(2) Metodikk som det kan dokumenteres at bidrar til en positiv utvikling for barna må få større plass i utdanningene, mens studenter i mindre grad trenger å lære om metodikk som en ikke kan dokumentere at virker.

C-strukturen for denne setningen vises nedenfor:

Grafen kan sees i større format her.

Setning (2) inneholder 5 leddsetninger, og c-strukturen har dermed 5 noder Ssub*, markert med rødt i grafen. Dessuten er det 4 dominansrelasjoner mellom Ssub*-noder (vi markerer direkte og indirekte dominans med ‘>*’):

#1 >* #2
#3 >* #4
#3 >* #5
#4 >* #5

Siden dominansforhold som det mellom #3 og #5, med en mellomliggende Ssub*-.node, også teller med, ser vi hvordan antallet dominansforhold øker mer enn lineært med tilføyelsen av nye nivåer i hierarkiet. Hvis D(n) er antallet dominansforhold i et hierarki med n nivåer, blir da forholdet slik:

D(1) = 0
D(n) for n > 1 = D(n – 1) + (n – 1)

Dette innebærer da at et hierarki av leddsetninger med f.eks. 5 nivåer vil få en dominansvekt på 10, som er verdien av D(5). Setning (2) har ett hierarki med  2 nivåer og ett med 3. Vekten for det første hierarkiet, D(2), er da 0 + (2 – 1) = 1, og for det andre, D(3), er vekten 1 + (3 – 1) = 3, til sammen for de to hierarkiene 4. Vekten for setning (2), når vi både teller leddsetninger og dominansforhold, blir dermed 5 + 4 = 9.

Vi kan nå registrere setningenes vekt ved å kombinere to søkeuttrykk. Uttrykket for å registrere dominansforhold er slik:

Ssub* >* Ssub*

Dette søkeuttrykket sier at en node Ssub* direkte eller indirekte dominerer en annen node Ssub*. Uttrykket finner alle setninger der dette er sant. Men i tillegg til å finne setningene, registrerer søkeprosessen også hvor mange treff uttrykket har i en viss setning. I setning (1) vil da uttrykket ha ett treff, og i setning (2) vil det ha 4. Antall treff kan da inngå i utregningen av vekten.

For å telle selve leddsetningene i en setning er det tilstrekkelig å skrive:

Ssub*

Dette søkeuttrykket finner alle setninger med minst én leddsetning, altså alle der minst én node har etiketten Ssub*. I tillegg, som ovenfor, registreres det hvor mange treff uttrykket har i en viss setning, altså antallet leddsetninger i dette tilfellet. Det gir 2 for setning (1) og 5 for setning (2).

Vi kan nå kombinere de to søkeuttrykkene i en enten/eller-forbindelse – en disjunksjon. I søkespråket uttrykkes disjunksjon med ( … | … ), så resultatet blir da:

( Ssub* >* Ssub* | Ssub* )

Dette uttrykket finner alle setninger der ett eller begge de to alternativene er sanne, og det registreres hvor mange treff i en setning vi da til sammen får.

Vi kan illustrere resultatet ved å bruke dette søkeuttrykket på to deltrebanker, nno-child, som er barnebøker på nynorsk, og nor-stortinget_1, som er en del av stortingsforhandlingene. Vi føyer til en referanse til ‘treebank’ for å få resultatene sortert etter trebank:

( Ssub* >* Ssub* | Ssub* ) :: treebank

Resultatet ser da slik ut:

Antall treff i de to trebankene er da summen av antall treff i hver setning, som er vårt mål på setningen kompleksitet. Vi ønsker ikke bare å registrere summen av alle setningenes vekt i en tekst, men også hvordan denne vekten forholder seg til det totale antallet setninger i teksten. Vi trenger derfor å telle de relevante setningene, som er de som har fått komplette analyser i trebanken (noen av setningene i trebanken har såkalte fragmentanalyser, men dem ser vi bort fra her). Alle slike setninger har en toppnode som heter ROOT. Vi kan da bruke søkeuttrykket:

ROOT :: treebank

Med uttrykket ROOT finner vi alle setninger med en node ROOT, det vil si alle fullstendig analyserte setninger i korpus. Resultatet ved søk i de to nevnte deltrebankene gir oss antallet relevante setninger i hver av dem:

For trebanken nor-stortinget_1 ser vi at vektsummen (193700) er større enn antallet setninger (173370), og den gjennomsnittlige vekten pr. setning er 193700 / 173370 = 1,117. For trebanken nno-child, derimot, er vektsummen (33248) mindre enn antallet setninger (90341), og gjennomsnittet pr. setning er 33248 / 90341 = 0,368. For å få måleverdier av samme størrelsesorden som lix ganger vi gjennomsnittene med 100, og får da:

Trebank

Kompleksitet

nor-stortinget_1

112

nno-child

37

Som ventet kommer stortingsforhandlingene ut med en betydelig større syntaktisk kompleksitet enn barnebøkene. En setning som (3) fra nor-stortinget_1 ligger ikke nær noe man vil vente å finne i en vanlig barnebok.

(3) Føler helseministeren at de situasjonene som har blitt beskrevet fra Ahus, tilfredsstiller det kriteriet som helseministeren da trakk opp, og som Stortinget var enig i, nemlig at det ikke skulle overføres pasienter før det var helt sikkert at pasientene skulle få et minst like godt tjenestetilbud ved Ahus som det de hadde før prosessen startet?

Som nevnt ovenfor er det et empirisk spørsmål i hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet. Men denne kompleksiteten kan likevel bidra til å karakterisere stilen hos en viss forfatter eller i en viss teksttype, og vi skal se litt nærmere på den.

Kompleksitet i deltrebankene

NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Hvis vi regner ut kompleksiteten etter våre leddsetningskriterier for hver av disse deltrebankene og rangerer dem fra mest til minst kompleks, får vi denne tabellen:

Deltrebanker rangert etter syntaktisk kompleksitet:

Deltrebank Kompleksitet
nor-stortinget_2 113
nor-stortinget_1 112
nor-stortinget_3 110
nor-stortinget 107
nor-stortinget_4 97
nob-sofie 86
nob-fn 82
nob-lbk-sa 67
nob-ndt-lfg 60
nob-avis 59
nno-nnk-av 58
nno-nnk-sa 55
nob-lbk-av 55
nob-novel_2 48
nob-novel_4 47
nob-novel_3 46
nob-novel 46
nob-novel_5 44
nob-novel_1 44
nob-child 42
nno-novel 41
nno-child 37
nob-lbk-tv 26

Rangeringen sorterer tydelig mellom de ulike teksttypene. På topp i kompleksitet kommer stortingsforhandlingene samlet. Så kommer Gaarders Sofies verden umiddelbart etter, og før sakprosa, avistekst og andre romaner. Med sitt filosofiske tema skiller den seg tydeligvis ut også syntaktisk. Etter Sofies verden kommer Forskningsnytt og annen sakprosa på bokmål, og så tre deltrebanker med avistekst med én med nynorsk sakprosa innimellom. Deretter har vi alle bokmålsromanbankene samlet, og så barnebøker på bokmål. Romaner på nynorsk kommer etter barnebøker på bokmål i syntaktisk kompleksitet, og til slutt barnebøker på nynorsk og TV-teksting. Vi ser en svak tendens til mer kompleksitet i bokmålstekster enn i nynorsktekster av samme type, men det kan være grunn til å tvile på at den er signifikant. I stortings-trebankene er det ikke skilt mellom bokmåls-og nynorskdelene.

Setningslengde varierer på lignende måte mellom trebankene, med kortere setninger nedover i hierarkiet ovenfor, og man kunne reise spørsmålet om i hvilken grad dette kompleksitetsmålet er en funksjon av setningslengde snarere enn en uavhengig egenskap. Det er åpenbart en sammenheng mellom dem (det er grenser for hvor mange selv korte leddsetninger man får plass til i en setning på 6 ord), men det er likevel ikke tale om en funksjon fra det ene til det andre – de to målene varierer også noe uavhengig av hverandre. Det kan best illustreres når vi betrakter kompleksiteten hos den enkelte forfatter.

Kompleksitet hos forfatterne

Det er også mulig å studere kompleksiteten i tekstene hos den enkelte forfatter ved de tekstene der forfatteropplysninger foreligger. Det er ikke tilfellet i stortingsforhandlingene, men forfattere er oppgitt for romanene, barnebøkene, sakprosaen og deler av avistekstene. Det totale antallet forfattere og grupper av forfattere (ved felles forfatterskap) i materialet er 2658, representert med tekster av svært varierende lengde. Hvis vi ser bort fra forfattere som er representert med færre enn 10 setninger, varierer kompleksitetsmålet fra 260 til 4.

I utregningen av setningslengde telles både ord og skilletegn. Vi kan betrakte samvariasjonen mellom kompleksitet og setningslengde ved å plotte forfatterne inn i et diagram med kompleksitetsmålet langs x-aksen og gjennomsnittlig setningslengde langs y-aksen.

Kompleksitet og setningslengde hos 2658 forfattere:

Tendensen til spredning langs en avlang sky fra nederst til venstre (lav kompleksitet, korte setninger) til øverst til høyre (høy kompleksitet, lange setninger) viser en viss samvariasjon, men det er også en del avvik fra denne linjen. Vi skal se på tekstutdrag fra de fire forfatterne som er markert med #1 – #4 i diagrammet.

#1 har verdiene 260,20 og skiller seg ut med relativt høye verdier i begge dimensjoner: høy kompleksitet og  lange setninger. Tekstutdrag:

Celler spiser kreften
Dette funnet kan bane veien for nye behandlingsformer mot kreft.
– Vi fant at selvspisingsmaskineriet, som vanligvis finnes i alle normale celler, var aktivt og bidro til å bryte ned PML-RARA i blodkreftcellene.
Akutt promyelocytisk leukemi var for bare noen få tiår siden en svært dødelig sykdom uten noe effektivt botemiddel.
– Dette er definitivt en av de største suksesshistoriene noensinne når det gjelder forskning som har ledet til effektiv kreftbehandling, uttaler Bøe.
Han forklarer videre at det er svært sjeldent at man treffer så bra med en målrettet kreftbehandling, og at han tror man ikke helt har forstått hvorfor denne terapien er så effektiv som den er.
Derfor har han lenge vært overbevist om at det her må finnes noen generelle prinsipper vi kan lære av og som kan være overførbare til behandling av andre krefttyper.
I tillegg forekommer det at pasienter med akutt promyelocytisk leukemi ikke blir fullstendig kurert av dagens behandling.
Proteinet PML-RARA holder blodkreftcellene i en umoden tilstand ved å hemme uttrykket av mange gener som er kritiske for deres normale utvikling.
Ved behandling med retinsyre blir mange av disse genene aktivert igjen. 

Setningene er informasjonsrike, men tekstutdraget illustrerer også at denne typen kompleksitet ikke har noen klart negativ virkning på lesbarheten. Det er en klar og presis fremstilling.

#2, en barneboktekst, er i motsatt ende av begge skalaer med verdiene 9,8: lav kompleksitet, korte setninger. Her er et utdrag:

Bø og Bæ i festhumør
Bø og Bæ pyntar seg.
Dei skal på fest hos Bo.
Det skal vere dans.
Bø må øve.
Kva heiter dansen?
Bø blir ør.
Han må kvile seg ei stund.
Bø og Bæ skal ha med ei gåve til festen.
Bo skal få ein båt.
Det er moro å pakke inn, synest Bø og Bæ.
Og lett når ein er to.
«Merkeleg,» seier Bø.
«Korleis gjekk dette til?»
Ein kartong er betre, synest Bæ.
Stødigare også, synest Bø.
Hyssing er finare enn teip.
Bo bur like ved.
Her bur Bo.
«Gratulerer, Bo!» seier Bø og Bæ.
Bo blir glad.
Bø og Bæ får kvar sin hatt.
Alle er der.
Bø og Bæ er svoltne.
Etterpå blir det dans.
Bø dansar godt!

#3, med verdiene 50, 24, har lav kompleksitet og høy setningslengde og illustrerer at de to verdiene i noen grad kan variere uavhengig av hverandre:

Er fiskefôret sunt?
Jeg forsker på bruk av genmodifiserte planteråvarer i fiskefôr, hovedsakelig til laks.
Dette er en svært relevant problemstilling for NIFES sin rolle som kunnskapsleverandør til forvaltningen i Norge.
Bruk av planteråvarer i fiskefôr som erstatning for fiskemel og fiskeolje er en nødvendighet både for å få til en mer bærekraftig produksjon og en videre vekst i produksjonen.
Flere av de aktuelle planteråvarene, som for eksempel soya, mais og raps, blir i stor grad dyrket som genmodifiserte (GM) varianter.
Dermed er det viktig å fremskaffe kunnskap om GM råvarene trygt kan benyttes i fôret uten noen effekt på fiskens vekst eller helse.
Kunnskap om mulige effekter av GM råvarer er svært viktig både for forvaltningen og næringa, slik at de kan ta sine avgjørelser basert på vitenskapelige data.
Fisken ble fôret gjennom 7 måneder, inkludert sensitive stadier i livssyklus som smoltifisering og utsett i sjø, og omfattende evalueringer ble gjort av fiskens vekst, utvikling og helse gjennom hele forsøket.
Jeg er oppvokst på kysten (Hvalerøyene i Østfold) med en far som er rekefisker, så det kan nok ha hatt innvirkning på interesser og utdanningsvalg (master i havbruksbiologi).
Da jeg skulle gå videre på doktorgrad, valgte jeg å spesialisere meg innen ernæring da dette gir varierte jobbmuligheter seinere, både for forskning i det offentlige og i privat industri

Her er den gjennomsnittlige setningslengden (i hele teksten) høyere enn hos #1, men innslaget av leddsetninger er betydelig mindre, og vi ser ingen eksempler på leddsetning inne i leddsetning i utdraget.

#4 med verdiene 183,15 er blant dem som kommer nærmest den siste mulige kombinasjonen – høy kompleksitet kombinert med lav setningslengde – eller i dette tilfellet middels setningslengde. Riktignok skyldes nok den lave gjennomsnittlige setningslengden i stor grad innslaget av korte overskrifter. Her er et utdrag:

Klisterforbud skaper trøbbel for Byåsen
Det skjer etter at Spektrum har tatt inn kommunens regler i hallen.
Klisteret brukes av spillerne for å få bedre tak på ballen, men setter samtidig merker på gulvet.
Sprayklister setter ikke like markante merker, men har kortere varighet.
– J12 – kamper
– Dette blir jo som å spille J12-kamper igjen, sier daglig leder i Byåsen, Torbjørn Balstad.
Argumentet til kommunen er at harpiksen som er i klisteret gjør at det blir merker på gulvet som er vanskelige å vaske vekk.
Men Balstad hevder at produsenten av klisteret de bruker nå, kan dokumentere at det ikke er harpiks i det.
– Hva skjer når det kommer motstandere hit som skal spille kamp mot oss?
Skal lag som Lubin og Larvik bruke sprayklister?
Tvilsomt, tror Balstad.
Klister av den gamle typen, som inneholder harpiks, brukes kun ved meget varme forhold i hallen, der vanlig klister kan bli for glatt.
– Det blir som å si at gutta på Lerkendal skal spille med fastknotter fordi skruknotter ødelegger gresset, sukker Balstad oppgitt.
Sier ikke kategorisk nei
Teknisk sjef i Trondheim Spektrum, Håkon Sjøhaug, avviser ikke at vanlig krukkeklister kan brukes, dersom det kan dokumenteres at det ikke inneholder harpiks.
Men vi har en god dialog med Balstad, som har gjort oss oppmerksomme på at det finnes krukkeklister uten harpiks, sier Sjøhaug.
Må ha databladet
– Ser du for deg at den kan vekke reaksjoner dersom storlag som Buducnost og Larvik kan bli nødt til å bruke sprayklister når de kommer hit for å spille kamp?
– Hehe, ja.
Og dersom vi har andre regler enn for eksempel i Larvik, så er dette uheldig.
Jeg mener vi bør få likt reglement på alle hallene i Norge.
Dersom det ikke er harpiks i klisteret, er vi åpne for å se på om det kan brukes.
Når vi får databladet fortsetter vi dialogen med Byåsen, sier Sjøhaug. 

Konklusjon

I dette innlegget har jeg sett på hvordan informasjon om en type syntaktisk kompleksitet kan hentes ut av trebanken og brukes til å karakterisere ulike teksttyper og ulike skribenter. Det gjenstår å se om akkurat denne typen kompleksitet er informativ om tekstegenskaper som er relevante for lesbarheten, men det kan være av interesse å kombinere dette kompleksitetsmålet med mål basert på andre tekstegenskaper som lar seg hente ut. Det vil jeg se på i senere innlegg.

 

 

‘den unge mannen’ eller ‘den unge mann’?

Innledning

‘Dobbelt bestemthet’ (også kalt ‘overbestemthet’) vs. ‘enkel bestemthet’ i skriftlig norsk blir noen ganger diskutert. Ved dobbelt bestemthet, som i den unge mannen, har vi en demonstrativ den eller denne, etterfulgt av et substantiv (mannen) som også står i bestemt form, eventuelt med mellomliggende adjektiver.  Ved enkel bestemthet, som i den unge mann,  står substantivet i ubestemt form.

Ulike egenskaper nevnes ofte som relevante for motsetningen mellom de to: mer norsk vs. mer dansk; mer muntlig vs. mer formell; spesifikt refererende vs. ikke-spesifikt refererende; konvensjonelt begrep eller navn vs. produktivt dannet frase. Spesifikk vs. ikke-spesifikk referanse kan illustreres med den eleven du traff i går (spesifikk elev) vs. den elev som opptrer slik (ikke spesifikk elev), eller der sitter den unge mannen (en spesifikk mann) vs. klær for den unge mann (i sin alminnelighet). Et konvensjonelt begrep har vi i den nye tid vs. den lange tiden; et navn i Det indiske hav vs. det dype havet.

Vi skal ikke gå inn på alle disse vurderingene her, men heller undersøke hva slags informasjon om denne motsetningen vi kan fremskaffe  gjennom søk i en trebank, som et mulig grunnlag for nærmere studier. Vi skal konsentrere søket om eksempler som har minst ett adjektiv mellom demonstrativen og substantivet, siden det først og fremst er ved slike eksempler at vi kan vente å finne et trykkløst (ikke-kontrastivt) den. Den som måtte være interessert i hvordan trebankanalysene ser ut, og hvordan søkeuttrykket formuleres, kan finne en kort beskrivelse av det her.

Enkel bestemthet i bokmål

Vi søker etter enkel og dobbelt bestemthet i ca. 46 mill. ord av bokmålsteksten i trebanken. Denne delen består av:

Avistekst: 3,2 mill. ord
Sakprosa: 11,5 mill. ord
Barnebøker: 4,1 mill. ord
Romaner: 27,5 mill. ord

De globale tallene i bokmålsdelen:

Frasetype Antall
Dobbelt bestemt

260 933

Enkelt bestemt

17 862

Dobbelt bestemthet er som ventet sterkt dominerende: Globalt er bare 6,4% av de relevante konstruksjonene enkeltbestemte.

Enkel og dobbelt bestemthet ved de enkelte substantiver

Et mer nyansert bilde fremkommer hvis vi undersøker hvordan denne variasjonen er korrelert med andre variabler, f.eks. type av substantiv, eller forfatter. I undersøkelsen av substantiver begrenser vi oss til slike som opptrer minst 10 ganger i denne konstruksjonen – enkelt eller dobbelt bestemt. Det gir 3 538 substantiver. For hvert substantiv kan vi nå registrere hvor mange prosent av treffene som har enkelt bestemthet. Hvis vi ordner substantivene etter denne prosentsatsen, får vi grafen nedenfor:

Andel enkel bestemthet fordelt på substantiver

 

78 av de 3538 substantivene opptrer med enkel bestemthet i mer enn 50 % avtilfellene, det vil si 2,2 % av substantivene. Det store flertall av substantiver har sterk overvekt av dobbelt bestemthet.

Tabellen nedenfor viser de 40 substantivene som har sterkest overvekt av enkel bestemthet – begynnelsen av kurven. Første kolonne viser substantivlemmaet, annen kolonne antall forekomster med enkel eller dobbelt bestemthet, og tredje kolonne den prosentandelen av disse som har enkel bestemthet.

Substantiv etter prosentandel enkel bestemthet

Substantivlemma # med demonstrativ og adjektiv % enkelt bestemt
faktum 72 100,0
intet 30 100,0
selvfølge 12 100,0
selvfølgelighet 33 100,0
anelse 34 97,1
halvkule 138 92,0
fare 22 90,9
forseelse 10 90,0
samfunnslag 10 90,0
jaktmark 12 83,3
fakultet 162 80,2
orden 61 78,7
ytre 14 78,6
fornuft 32 78,1
respekt 27 77,8
garde 13 76,9
psykologi 25 76,0
gral 12 75,0
istid 64 75,0
ære 20 75,0
vanvidd 19 73,7
snev 15 73,3
ånd 91 72,5
samaritan 18 72,2
brorskap 14 71,4
anelse 33 69,7
stadium 66 69,7
tilfeldighet 13 69,2
helvete 25 68,0
dumhet 12 66,7
legeforening 21 66,7
dagsorden 25 64,0
nullpunkt 22 63,6
publikum 44 63,6
verdighet 11 63,6
moral 19 63,2
arme 45 62,2
tidsalder 21 61,9
imperativ 13 61,5

Noen av disse substantivene inngår i navn eller navnelignende betegnelser, for eksempel Den hellige ånd, den nordlige halvkule, den lille istid, Det muslimske brorskap, den barmhjertige samaritan. Navn med denne formen har enkel bestemmelse i bokmål. Ved flere andre er det tale om ikke-spesifikk referanse til noe av en viss art, gjerne i kombinasjon med absolutt superlativ: den største selvfølgelighet, den minste forseelse, den ringeste anelse.

Et utvalg korpuseksempler:

Det fysiske faktum tok fra meg tryggheten.
Det er underlig hvordan andre husker de objektive fakta i ens liv;
Jeg følte i uklar triumf at nå hadde jeg allikevel klart å omgå det uomgjengelige faktum.
Nødlanding kunne bety at de bare forsvant – ble slukt i det store grønne intet.
da den første vognen skrattet mot det åpne intet, dundret sistemann hult i gjelet.
Den vonde hånden skalv da han forsiktig heiste seg ned i det mørke intet.
For Berkeley ville vel spillenes virtuelle virkelighet vært den største selvfølge?
Du tar det vennene dine gjør for deg som den rene selvfølge.
Hun brukte ord som ondskap, hat og kjærlighet med den største selvfølge.
Jeg skjønner det ikke – jeg har ikke den minste anelse.
Så kom dagen de hadde sett nærme seg med de verste anelser:
Han fløy over den, uten å ha den fjerneste anelse om han satte rekord eller ikke.
I tillegg er bildet på den sørlige halvkule veldig sammensatt.
Ved siden av isbjørnen er den det største landlevende rovdyret på den nordlige halvkule.
Det er i de store farer man ser det store mot.
På hospitset kom den gule fare Tom til unnsetning.
– De er derfor fullstendig uegnet i polare farvann hvis det er den minste fare for flerårig is i klumper eller store isflak i bevegelse, sier Riska.
I tillegg til å lære fransk med barnet, snakket morfaren om Trygve Lies storhet og om Den røde fare.
– Og dessuten ville det være det rene vanvidd av deg å se etter noe annet også.
Det er det glade vanvidd – og nå snør det faktisk!
Nok en by skulle ofres på ondskapens alter, i en strid der det absolutte vanvidd var opphøyet til den ypperste form for krigskunst.

Ved dette mindretallet av substantiver ved begynnelsen av kurven ser vi da grammatiske grunner (navn), semantiske grunner (ikke-spesifikk referanse) og idiomatiske grunner (faste uttrykk) til overvekten av enkel bestemthet. Men stil, sjanger og forfatteres preferanser er uten tvil også faktorer som påvirker valget av denne formen, og kan ligge bak innslagene av enkel bestemthet ved de øvrige substantivene. Vi kan nærme oss disse faktorene ved å se på hvordan valget er korrelert med forfatter, og med type av tekst.

Enkel bestemthet blant bokmålsforfatterne

På samme måte som vi kan studere fordelingen mellom enkel og dobbelt bestemthet ved det enkelte substantiv, på tvers av forfattere, kan vi gjøre det samme ved den enkelte forfatter, på tvers av substantiver. Som ved substantivene begrenser vi oss til forfattere som har minst ti forkomster av den aktuelle konstruksjonen demonstrativ + ett eller flere adjektiver + substantiv. Dette gir 895 forfattere. Grafen nedenfor viser at forfatterne fordeler seg på lignende måte som substantivene: Et lite fåtall har overvekt av enkel bestemthet, mens det store flertall har sterk overvekt av dobbelt:

Andel enkel bestemthet fordelt på forfattere, bokmål

31 av de 895 forfatterne har 50 % eller mer enkel bestemthet i de tekstene de er representert med i korpuset. Tabellen nedenfor viser disse 31 forfatterne med antall eksempler på den aktuelle konstruksjonen, og i tredje kolonne den prosentandel av disse som har enkel bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, toppen av listen

Forfatter # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Heyerdahl, Nils 46 95,7
Flemestad, Roald 117 92,3
Slagstad, Rune 12 91,7
Folven, Reiel 10 90,0
Romarheim, Arild 18 88,9
Fardal, Rune 34 88,2
Olsen, Dag Rune 14 85,7
Weisæth, Lars 26 80,8
Döderlein, Jan M. 14 78,6
Aarnes, Asbjørn 22 77,3
Næss, Per Øivind 13 76,9
Wassmann, Paul 38 76,3
Ellestad, Ole Henrik 72 73,6
Hessen, Dag Olav 26 73,1
Oftestad, Bernt Torvild 18 72,2
Waaler, Arild 42 71,4
Emilsson, Eyjólfur Kjalar 26 69,2
Egeland, Kirstin 25 68,0
Standage, Tom 30 63,3
Larsen, Alexandra Irene 18 61,1
Mevåg, Bente 15 60,0
Vasstrøm, Mikaela 10 60,0
Sr, Eystein Husebye 19 57,9
Valland, Anders 42 57,1
Thommessen, Øystein B. 11 54,5
Espedal, Bruse 13 53,8
Harris, Shane 15 53,3
Humlum, Ole 40 50,0
Kanestrøm, Ingolf 16 50,0
Wikan, Unni 12 50,0
Solli, Brit 10 50,0

Sjanger er en åpenbar faktor. Noen av de til dels korte tekstene som flere av disse forfatterne er representert med, har et religionsfilosofisk eller generelt filosofisk innhold. Det refereres derfor ofte til allmenne begreper eller ulike filosofiske posisjoner, der enkel bestemthet kan være nærliggende. Vi kan betrakte noen eksempler fra fire forfattere på toppen av listen.

Eksempler på enkel bestemthet:

Nils Heyerdahl («Avskummets verdighet. Pascal mellom skeptisisme og rasjonalisme»):
Fremgangen i disse forskningsgrener ga knapt grobunn for mistro til den menneskelige fornuft.
I vitenskapelige miljøer i Clermont og Paris finner vi Pascal som den selvsikre vitenskapsmann.
Her var Montaigne det store dannelsesideal, med sin blanding av skeptisisme, stoisisme og epikureisme.
Det fremlegges resultater, det gjøres front mot den gamle aristotelisk-skolastiske vitenskap.
Om referenten har gjengitt ham rett, stiller Pascal her datidens skeptisisme (pyrrhonisme) opp mot den rasjonalistiske dogmatisme.
Inspirert bl.a. av den gjenoppdagede hellenistiske forfatter Sextus Empiricus, hvis verk Hypotyposeon ble en hovedkilde til kunnskap om oldtidens skeptisisme, går han veier som ender i den totale uvisshet.
For dogmatikernes vedkommende fester Pascal seg ved det han kalle[r] deres eneste vektige argument: at man ikke kan tvile på «de naturlige sannheter», dersom man skal være ærlig.
Naturen kommer den avmektige fornuft til unnsetning og hindrer den i å vrøvle seg helt bort.

Roald Flemestad («Pascal som teologisk tenker for vår tid»):
I dette oppbrudd kunne man fra første stund ane en motsetning mellom den nye rasjonalistiske livsholdning og tradisjonell kristendom med dens bibelske forestillinger om Gud og menneskelivet.
I hans samtid fremstod Pascal som en skarp kritiker av den frembrytende rasjonalisme.
Mot denne tekniske prometeisme anfører Pascal i Pensées at «det stadige fremskritt ikke er menneskets vesen.
Noen sier det ligger i fullkommen uvidenhet… og de sanne skeptikere påstår at det høyeste gode ligger i den urokkelige sinnsro
Overfor de mange konkurrerende sannhetskrav konstaterer Pascal:
Overfor det politiske narrespill reiser Pascal spørsmålet:
Folk må oppdras til å anse den [hevdvundne vane] som gyldig og evig.»
Denne krise ville barokk-kulturen møte ved å skape en ny symbolsk orden som ikke bare skulle gjenskape den tapte opplevelse av virkeligheten som en helhet, men som også kunne gi de styrende en ny mulighet for sosial kontroll.
Sentralt i denne restaureringsprosess står den monarkisk-absolutte styreform som nu oppstår.

Rune Slagstad («Vitenskapen, kallet og profesjonen»):
Den vitenskapelig emansiperte elite ble en ny ledende kulturelite.
Lochmann ville holde den positivistiske og ugudelige smittebærer unna Universitetet, men lyktes ikke:
Utnevnelsen markerte Universitetets løsrivelse fra det teologiske overoppsyn;
på den annen side det moderne begrep om vitenskap, det jeg vil kalle den liberale vitenskapelighet, bestemt av noen tilgrunnliggende normer som gjør vitenskap til vitenskap:
Det nye universitet var med sine «brødstudier» med en term som ikke var i omløp på den tiden, i realiteten et […]
Det praktisk-teologiske seminar ble formelt opprettet i 1848, knyttet til så vel fakultet som kirke, med et tyngdepunkt i de gudstjenestelige oppgaver.
Velferdsstatens profesjoner produserer ideologi med tilbakevirkende kraft på de vel etablerte profesjoner.
Kanskje er det noe som går tapt med den profesjonsideologiske ekspansjon

Arild Romarheim («Førmoderne religion er atter moderne»):
Noen ser i dette et behov hos det moderne menneske for en «fortryllelse», en kompensasjon for den moderne sivilisasjons dennesidige, grå hverdag.
Dette kan muligens ha å gjøre med den kristelige interesse man gjerne forbinder med fin de siecle, avslutningen av et århundre.
Det religiøse innhold – i den grad det forekommer – er her som oftest fjernt fra kristendom.
Kjendisbladene troner høyt oppe på statistikken men disse er mindre vesentlig for vårt tema, da den religiøse tematikk her er nærmest fraværende.
Ateisten Dawkins anbefaler fornuftens opplysning som motgift til dette kulturelle forfall.
Den samme respektfulle holdning bør vi også vise overfor islam, en religion som – i økende grad – gir sitt bidrag til det førmoderne nærvær i vårt samfunn.
Forskerne tror ikke lenger på religionens generelle tilbakegang som følge av den moderne, vitenskapelige tidsalder.
Den danner en slags grasrot-religiøsitet også innenfor de store religioner som i og for seg anser ånde-kontakt som en mindre essensiell del av religionen (islam, kristendom, buddhisme).
Det virker heller ikke som viteskapelig skepsis kan kompensere for denne manglende religiøse skepsis.
Denne vage framvoksende basisreligiøsitet omtales gjerne som «spiritualitet», en åpen, individuelt tilpasset tro på at «det er mer mellom himmel og jord».
Skaperguden finnes, men er fjern og tas helst fram ved de store høytider.

Halen på kurven ovenfor omfatter forfattere som har 0 % innslag av enkel bestemthet. Tabellen nedenfor viser dem av disse som er representert med flest eksempler på konstruksjonen, da med dobbelt bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, nær bunnen av listen

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Østby, Magnus 134 0,0
Abelsen, Atle 84 0,0
Hurum, Eirin 70 0,0
Müller, Anne Marie 63 0,0
Kvalshaug, Vidar 62 0,0
Østli, Vegard 55 0,0
Sjøli, Hans Petter 54 0,0
Hjorthol, Lars Martin 50 0,0
Jenssen, Hugo Lauritz 46 0,0
Andersen, Pål Flodin 45 0,0
Valberg, Anna 44 0,0
Baksjøberg, Marianne 43 0,0
Grandaunet, Hilde Jensen 43 0,0
Hanssen, Torkil Marsdal 42 0,0
Østveit, Karine 40 0,0
Solerød, Mari 40 0,0
Karkov, Rasmus 38 0,0
Aftenposten 37 0,0
Fjellberg, Anders 37 0,0
Johnsen, Hilde Føreland 37 0,0
Kazankov, Andrey 35 0,0
Milde, Svein Harald 33 0,0
Vestergård, Gunver Lystbæk 33 0,0
Gravklev, Bente Rognan 32 0,0
Valsø, Karen 32 0,0
Vold, Henrik Brattli 32 0,0
Aall, Carlo 31 0,0
Klaveness, Luisa 31 0,0
Kagge, Gunnar 30 0,0
Lundereng, Kristine 30 0,0

Fraværet av enkel bestemthet her skyldes utvilsomt dels sjanger og innhold og dels forfatternes egne preferanser. Tekstene omfatter for eksempel avisartikler og Forskningsnytt-artikler. Referanse til konkrete gjenstander favoriserer dobbelt bestemthet, mens dobbelt bestemthet ved mer abstrakte begreper kan ha mer å gjøre med forfatterens valgte stil.  Vi tar med noen eksempler.

Eksempler på dobbelt bestemthet:

Magnus Østby (artikler i Stavanger Aftenblad):
De større modellene til John Deere som ikke har B-stolpe, har dør bare på venstre side.
De fire minste modellene, fra 83 til 115 hk, har firesylindra motorer med et sylindervolum på 4,5 liter .
Det elektriske hurtiggiret betjenes med knapper på girspaken eller bryter på betjeningskonsollen.
De små traktorene rydder småvegene og transporterer snøen til de større vegene.
Den vendbare hytta er unik.
Når spakstyringa er aktivert, styres hjula med en rullebryter på den ekstra styrespaken.
– Når du ser det er slitasje på de tverrstilte gripeelementene på kjettingen, bør du snu kjøreretningen på kjettingen.
Den manuelle delen av arbeidet er i hovedsak relatert til sluttproduksjon og herding.
Herdeovnene går tre skift, mens de øvrige maskinene går to.
Årsaken er at de kanta elementene på lettkjettingen biter seg godt fast i isen.
Når den fremste enheten er full, sendes kornet til neste enhet.
De viktigste instrumentene er plassert på høyre A-stolpe, mens resten er i konsollen på siden av førersetet.
Det betyr at hvis Søren vil ha automatisk styring, trenger han bare å montere den gule kula på taket og skjermen, samt aktivere systemet.
De to forskjellige produksjonene gir oss dessuten to bein å stå på.
De samla leasingkostnadene er 10 000 kroner per måned, forklarer Atle.


Atle Abelsen (artikler i Forskningsnytt):
Han peker på at absolutt alle kunnskapsbaserte produksjonsbedrifter over en viss størrelse på det internasjonale markedet har plassert nanoteknologi i sin bedriftsstrategi, og de fleste bruker til dels store beløp på forskning innen dette feltet.
De startet i fjor en prøveprodukjson av nanorør,
et [sic] av de viktigste byggesteinene for svært mange nanoprodukter.
Men da må de industrielle aktørene komme på banen nå.
Han forteller at flere av de internasjonale innlederne var overrasket over å treffe så mange av sine kolleger på konferansen.
Til den neste konferansen i 2005 kommer vi til å jobbe spesielt aktivt for å involvere de industrielle brukerne enda mer, sier Høvik.
Derfor må vi teknologer komme tidlig på banen og sette premissene for den etiske diskusjonen, oppfordrer han.
Statssekretær Helle Hammer i Nærings- og handelsdepartementet understreket at etablering av nye forretningsområder er det viktigste suksesskriteriet for nanoforskningen.
Professor Johan Sjøblom ved NTNU pekte for øvrig på de store mulighetene som olje- og gassutvinnerne og industrien har for økt verdiskaping ved å satse på materialteknologi i nanoskala.
Også han var opptatt av å fokusere sterkt på de etiske aspektene.
Den tørre forsommeren gjorde forholdene ideelle til å lete etter strukturer på bakken som bare kan sees fra stor høyde, forteller Raaen.
Ved å kombinere resultatene fra alle disse avanserte målemetodene, håper Stenvik og hans gruppe at det skal tre tydelig fram hustufter, ildsteder og andre ting som tyder på at det har vært folk her.

Eirin Hurum (artikler i Aftenposten):
Den blide pensjonisten, kledd i klassisk vaffeljakke og sixpence har det ærefulle oppdraget å servere jaktlaget den tradisjonsrike «stirrup cup» – en liten sterk en – før startskuddet går for dagens revejakt – den tredje denne uken.
Midt på eiendommen troner det gamle godset.
Tilhengerne hevder at jakten er den beste måten å kontrollere revebestanden på.
– Ja, det er det store spørsmålet, sier Butler og slår ut med armene.
Vi har bestemt oss for å holde oss på den sikre siden, sier han.
– Men jaktlagene hevder at dette ikke handler om dyremishandling, og at jakt med hunder er den mest humane måten man kan avlive reven på?
– For oss, og jeg tror for de fleste som bor på landet, er revejakten en del av det sosiale limet i lokalmiljøet.
Til det har den konservative regjeringen for mange andre presserende oppgaver.
Den dukker opp i horisonten, piler over de grønne gresslettene og inn i et skogholt.
Den tradisjonsrike revejakten har foregått i århundrer.
Det britiske skolesystemet har vært på politikernes agenda i årevis.
Det fastslår Den nasjonale likestillings- og diskrimineringskommisjonen i sin rapport «How fair is Britain?», den mest omfattende levekårsundersøkelsen gjort i Storbritannia de siste årene.

Anne Marie Müller (artikler i Forskningsnytt):
Bare i noen få av studiene som inngår i oversikten er det med pasienter som har gjennomgått de nye og lange behandlingsformene som gis til dagens brystkreftpasienter.
Det er i det hele tatt en slående kontrast mellom de små og spredte studiene som fins innen rehabilitering og den brede internasjonale forskningen innen behandling, og som har bidratt til de store framskrittene der.
Den amerikanske stiftelsen The Commonwealth Fund (se faktaramme) har siden 1998 gjennomført internasjonale spørreundersøkelser om helsevesenet.
Nasjonalt kunnskapssenter for helsetjenesten står for den norske delen av undersøkelsen.
Selv om spørreskjemaet er utviklet for norske forhold, er det imøtesett med betydelig interesse også innen det nordiske indikatorsamarbeidet.
De store europeiske etterkrigskullene vil snart tre ut av arbeidsstokken og tappe helsetjenesten for sykepleiere uten at en tilsvarende mengde unge sykepleierrekrutter vil erstatte dem.
Første del er den pågående spørreskjemaundersøkelsen blant sykepleiere ved medisinske og kirurgiske avdelinger.
Norge skiller seg ut med den nest laveste andelen utgifter til legemidler og medisinsk-tekniske hjelpemidler.
De lave utgiftene her skyldes blant annet lavere norske legemiddelpriser.
den andre siden skiller Norge seg ut med den høyeste andelen utgifter til pleie og omsorg.

Det er tydelig at dobbelt bestemthet er det umarkerte valg(et) i det meste av bokmålstekst. Enkel bestemthet er mest regelmessig knyttet til flerords-navn. Mindre fast, men likevel tydelig, er det knyttet til den semantiske egenskapen ikke-spesifikk referanse, til abstrakte begreper, og til en del faste uttrykk. En annen dimensjon er stil og sjanger – en konservativ forfatterstil og en filosofisk-diskursiv tekstsjanger synes begge å favorisere enkel bestemthet.

Enkel bestemthet i nynorsk

I nynorsk tekst vil de fleste vente å finne mindre innslag av enkel bestemthet enn i bokmålstekst. Den nynorske delen av NorGramBank utgjør bare 10-15 % av trebanken; vi bygger her på de følgende delene:

Avistekst: 123 400 ord
Sakprosa: 1,6 mill. ord
Barnebøker: 1,04 mill.ord
Romaner: 3,01mill. ord

De globale tallene i nynorskdelen:

Frasetype

Antall

Dobbelt bestemt

23 127

Enkelt bestemt

788

I bokmålsdelen utgjorde tilfellene av enkel bestemthet 6,4 % av alle forekomster av konstruksjonen. I nynorskdelen halveres dette nesten – 3,3 % av eksemplene har enkel bestemthet.

Enkel bestemthet blant nynorskforfatterne

72 nynorskforfattere har 10 eller flere eksempler på konstruksjonen demonstrativ + eventuelle adjektiver + substantiver. Hvis vi regner ut prosentandel enkel bestemthet for hver av disse, får vi grafen nedenfor.

Andel enkel bestemthet fordelt på forfattere, nynorsk

Bare én forfatter av de 72 har en høyere prosentandel enkel bestemthet enn 50. Tabellen viser 30 av forfatterne rangert fra den med høyest andel enkel bestemthet.

Nynorskorfatter etter prosentandel enkel bestemthet, toppen av listen

 

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Rabben, Bjarne 47 57,4
Mosdøl, Olav 19 36,8
Bruheim, Jan-Magnus 15 33,3
Bjørlo, Anne-Grete 17 29,4
Holm, Gro 27 18,5
Austrem, Liv Marie 33 12,1
Jonsmoen, Ola 129 10,1
Økland, Einar 402 9,7
Kaldestad, Per Olav 263 8,4
Helde, Einar 125 7,2
Hoem, Edvard 605 6,1
Øglænd, Finn 260 5,8
Eide, Svein 139 5,8
Heggland, Johannes 261 5,7
Starheimsæter, Hermann 176 5,7
Bukkøy, Else Karin 179 5,6
Nöstlinger, Christine 18 5,6
Sagen, Rolf 485 5,4
Ruset, Arne 191 5,2
Heie, Sigbjørn 140 5,0
Ystaas, Torunn 81 4,9
Piumini, Roberto 62 4,8
Midtun, Jarle 21 4,8
Bødtker, Marit Lund 66 4,5
Vaage, Lars Amund 355 4,5
Nysted, Liv 70 4,3
Fosse, Jon 118 4,2
Bjørkum, Ingrid 73 4,1
Hauge, Kolbjørn 345 4,1
Sæter, Alf A. 531 4,0
Teksten av den forfatteren som skiller seg ut, Bjarne Rabben, er poetisk – og, i likhet med bokmålstekstene med stort innslag av enkel bestemthet, har religiøst innhold:
Bjarne Rabben («Med himmel over»):
Den gode smil
Det er så vent ved Mjøsa den ljose sommartid.
Fjellet i sol og sommar – å, denne rike dag!
Finst ikkje venare syn enn den unge mor.
Du gav meg di gode hand i dei unge år, ei hand til å leike med og klemme om.
Din barnetanke på sin veng dei lange leier tok.
Eg metta meg med det velsigna brød, tok frakken på og lét døra opp.
Han gav oss den dyre gåve: ein helgedag for vår sjel.
Fast skal du stå i di freistings tid, glad skal du våge den gode strid tru mot det syn som di lengsle såg.
Ja, det fortel den gamle bok.
Denne reine himmel over morgonfjell med stjerner som strålar mot mørk jord
I dag vil eg minnast den namnlause kvide som Jesus, vår frelsar, for oss måtte lide.
Din lekam imellom seg vrid dei og vender og naglar til krossen dei heilage hender.
Dei gamle stigar du akte på, så du til ditt livsverk kan emne få.
Styr dine ord i den glade stund.
Dei gode ord
den gamle kyrkjetuft
Me møtest i den frie luft med rømd til alle sider på denne gamle kyrkjetuft med sus frå gamle tider.
Lat det få rom og rang i byar og i grender som setje kan i gang dei arbeidslause hender!

 Men også i andre tekster finner vi eksempler:


Og så fekk han sine eigne folk, han hyrte dei største talent og lærte dei alt dei trong å lære, men skjønte dei kor stor han var for det?
Han som nådde dei høgaste tindar.
Tannlegen tok det som ei djevelsk ironisering over den gemene hop.
Har vi alltid tankane i dei øvre sfærar?
Ho seier at han ikkje kan utrette noko på møte i Gymnassamfunnet, av den enkle grunn at han ikkje går på gymnaset.
PÅ DETTE TIDSPUNKTET hadde kunsthandlaren identifisert meg som den einaste son av presten Storm.
Vi går bort, for vi er ikkje menneske lenger, vi er teikn, vi er vitne for den forspilte tid: Vår ungdom.
Mot den uklare bakgrunn av gudfryktige fiskarmenn som eg nedstammar frå, står det brått fram ein mann som beviseleg målte tre alner på sokkeleisten og var brei som ei låvedør.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Krydderet finst i handelen og dei fleste kjøkkenhyller, men har i heile denne tida ikkje kalla fram den ringaste assosiasjon.
Inga bjølle har ringt når eg har løfta lokket av angande surkål, eller sett tennene i den herlegaste nøkkelost.
Det kunne han bevise med møteprotokollen for bedehuset som vart ført med den djupe vørdnad for det skrivne ordet som heretter alltid rådde i Karviland.
Sonen var ein overgang og eit intermesso i det store livsens spel.
Over midtgangen hang ei vakker skute med dei finaste segl.
Aldri, aldri skulle han koma til å gråte over den forgangne trollskap frå parafinlampene sin tidsalder.
Der stod bestefaren og slakta lam som i den gamle pakt.
– Dei kan seia oss korleis livet på jorda er, om dei ikkje just peikar inn i dei evige bustader.
– Ai, eg har sønner fem, sa faren, som snakka innfløkt når det gjekk på dei store ting i livet.
I dei raraste påfunn er det alltid gøymt ein grunn, og slike grunnar tok han til å grunne på.
Eldsteguten hadde greidd å lure seg unna ei mengd med fiskemåltid, men i desse tronge tider måtte sjølv han til pers.
Slik svinga han frå det svartaste mismot til den lystigaste stemning på nokre minutt.
Dersom nokon trur Bakke-merra kjem til å flytte seg før dei blæs i basun, skal vi vita kvar vi la henne på den ytterste dag!
Ei gammal leigemerr frå Malmedalen fekk vera med og bane vegen til den nye tid.
Foreldra gjorde ikkje den ringaste mine til å vakne.
Var det ikkje for dansen at den gamle felemakar Lars Hoem hadde bygd sine prektige instrument?
Det leid mot den avgjerande eksamen.

‘min sønn’ eller ‘sønnen min’?

Innledning

Det heter helst sykkelen din, sønnen hennes, den ømme samvittigheten hans og den stygge mistanken min på norsk, vil noen hevde; din sykkel, hennes sønn,  hans ømme samvittighet og min stygge mistanke er kunstig formelt eller rett og slett dansk. Og akkurat ved substantivet sykkel kan man jo skjønne at slikt blir sagt – skjønt din nye sykkel lyder kanskje straks litt bedre enn din sykkel. Intuitivt er muligens heller ikke min mistanke fullt så påfallende som din sykkel, og mange vil nok finne min stygge mistanke ganske uproblematisk. Hva slags regelmessigheter kan vi avsløre her?

Hva ‘det heter’ på skriftlig norsk, er et spørsmål om hvordan skriftlig norsk faktisk ser ut, altså hva som står i tekstene. Så la oss se på det, først og fremst i bokmål i denne omgang. Nynorsk nevnes kort mot slutten.

Foran- vs. etterstilt possessiv i bokmål

Vi søker først i bokmålsdelen av NorGramBank, i den delen som omfatter aviser, sakprosa, barnebøker og romaner (originaler og oversettelser), ca. 45 millioner ord. Søkeuttrykket inkluderer alle nominale fraser med possessiv (min, din, sin, hans, hennes, dens, vår, deres med bøyningsformer), uavhengig av om det står adjektiver eller andre ord mellom possessiven og substantivet. Uttrykket formuleres slik at vi utelater  eksempler med bestemmeren egen, som i min egen sykkel, ettersom de alltid har foranstilt possessiv, slik at det ikke foreligger noen valgmulighet der. Vi skulle også gjerne ha utelukket eksempler der den foranstilte possessiven er fokusert gjennom kontrastivt trykk (Dette er min sykkel!), men dessverre er slike eksempler ikke merket og lar seg derfor ikke skille fra.

Hvis vi teller teksteksemplene enkeltvis, finner vi at etterstilt possessiv er noe, men ikke dramatisk, vanligere enn foranstilt:

Possessivplassering i bokmål, globalt:

Possessiv-plassering

Antall

Foran

133 252

Etter

198 751

Vi ser at 40,1 % av tekstforekomstene av nominalfraser med possessiv har possessiven foranstilt, noe som antyder at fenomenet ikke er fremmed for språket. Et mer nyansert bilde fremkommer hvis vi skiller mellom de enkelte substantivene, som kan ha svært ulike fordelinger av foranstilt og etterstilt possessiv. Det er over 15 000 ulike substantiver med possessiv i dette materialet, der de fleste forekommer bare én eller to ganger. For å få et mer håndterlig materiale og mer signifikante tall, begrenser vi derfor mengden av substantiver til dem som forekommer minst 10 ganger med possessiv i korpus. Dette reduserer antallet til 1993 substantiver.

Nå kan vi regne ut for hvert av de 1993 substantivene hvor mange prosent av forekomstene som har possessiven foranstilt, og hvor mange som har den etterstilt. Hvis vi ordner disse substantivene fra dem som har flest tilfeller av foranstilt possessiv til dem som har færrest slike tilfeller, fremkommer grafen nedenfor, der substantivene er ordnet langs den horisontale aksen og prosentverdi foranstilt possessiv langs den vertikale:

Det fremgår at litt over halvparten av substantivene – 1002 av dem – har flere tilfeller av foranstilt enn av etterstilt possessiv. 119 substantiver har bare foranstilt possessiv, og 113 substantiver bare etterstilt.  Forøvrig er fordelingen jevnt fallende, med en svak antydning til polarisering i kurveformen (som ikke er en helt rett linje), altså svakt i retning av to kategorier av substantiver.

***
Tilføyelse november 2018:

Tabellen bak grafen ovenfor, med samtlige 1 993 substantiver og deres prosentandel foranstilt possessiv, kan leses på denne siden:

Tabell over 1 993 substantiver med prosentandeler foranstilt possessiv 

***

Semantiske klasser av substantiver

Et blikk på toppen og bunnen av den rangerte listen av substantiver gir et klart inntrykk av at substantivene tilhører ulike semantiske typer på ulike deler av skalaen. Tabellen nedenfor viser  60 av substantivene med bare foranstilte possessiver. Første kolonne viser substantivets lemmaform, annen kolonne viser hvor mange forekomster med possessiv som ble funnet, og tredje kolonne viser hvilken prosentandel av disse som hadde possessiven foranstilt.

Flest foranstilt:

Substantivlemma # med possessiv % foranstilt
anliggende 25 100,0
attrå 15 100,0
barneliv 10 100,0
bekostning 27 100,0
besittelse 16 100,0
besøkelsestid 16 100,0
biologi 10 100,0
borger 10 100,0
breddegrad 16 100,0
datasett 13 100,0
dimensjon 10 100,0
domene 11 100,0
dommer 12 100,0
dust 30 100,0
dødsdag 22 100,0
egenart 22 100,0
eie 18 100,0
element 30 100,0
elsk 21 100,0
enhet 11 100,0
enkelhet 21 100,0
ess 27 100,0
fanden 19 100,0
farvann 19 100,0
fatteevne 13 100,0
favør 21 100,0
feiging 12 100,0
fjols 26 100,0
forbløffelse 32 100,0
forehavende 10 100,0
forholdsregel 26 100,0
fornedrelse 12 100,0
generasjon 73 100,0
gjennomgang 16 100,0
grandonkel 19 100,0
gru 19 100,0
gunst 24 100,0
halvpart 13 100,0
helhet 78 100,0
hellighet 10 100,0
hovedpoeng 13 100,0
høyhet 50 100,0
indre 176 100,0
innblanding 10 100,0
inntog 36 100,0
ja 19 100,0
jævel 40 100,0
kjennskap 15 100,0
kjøter 24 100,0
kontekst 18 100,0
kulde 15 100,0
legitimitet 10 100,0
lengde 39 100,0
likemann 19 100,0
ludder 17 100,0
lære 18 100,0
læremester 18 100,0
majestet 37 100,0
medmenneske 84 100,0

Mange av substantivene er abstrakter (anliggende, besittelse, besøkelsestid, enkelhet, forbløffelse, legitimitet). Andre er skjellsord eller andre tiltaleformer, der bruken av possessiv (som i din tosk!, Deres Majestet) er en egen type som vi bør skille fra i en undersøkelse av allmenn possessivplassering (dust, fanden, feiging, fjols, jævel, kjøter, ludder; hellighet, høyhet, majestet).

Substantivene med bare etterstilte possessiver er annerledes; tabellen viser 60 av dem:

Færrest foranstilt:

Substantivlemma  # med possessiv  % foranstilt
malersaker 12 0,0
mappe 23 0,0
mulesel 12 0,0
mumling 10 0,0
munnhule 10 0,0
nakkegrop 13 0,0
navle 43 0,0
nesetipp 28 0,0
notatbok 15 0,0
overleppe 26 0,0
pakk 11 0,0
pickup 18 0,0
pinn 10 0,0
rull 12 0,0
rumpeballe 27 0,0
ryggrad 53 0,0
ryggsekk 35 0,0
ræv 17 0,0
saksbehandler 14 0,0
serk 41 0,0
shorts 16 0,0
skinnjakke 19 0,0
skjørtekant 13 0,0
skolesekk 10 0,0
skolisse 29 0,0
skosåle 12 0,0
skotupp 30 0,0
skuff 39 0,0
skulderblad 16 0,0
skulderveske 10 0,0
skur 11 0,0
smilehull 13 0,0
sokk 39 0,0
sovepose 27 0,0
sperma 10 0,0
spilling 10 0,0
steg 16 0,0
stereoanlegg 14 0,0
strupehode 12 0,0
sytøy 16 0,0
sølv 17 0,0
tommelfinger 12 0,0
tomt 18 0,0
trommehinne 14 0,0
truse 56 0,0
tull 10 0,0
tungespiss 24 0,0
tørkle 16 0,0
undulat 11 0,0
utgift 12 0,0
venstrehånd 11 0,0
vesla 43 0,0
vest 10 0,0
vorte 20 0,0
ytterklær 10 0,0
ølglass 14 0,0
øreflipp 43 0,0
øregang 11 0,0
ørering 13 0,0
øyekrok 39 0,0
øyenvippe 36 0,0

Substantivene med bare etterstilt possessiv har et sterkt innslag av konkreter, og særlig kroppsdeler (munnhule, nakkegrop, navle, nesetipp, overleppe, rumpeballe, ryggrad, ræv, smilehull, strupehode, tommelfinger, tungespiss, venstrehånd, øreflipp, øregang, øyekrok, øyenvippe).

Det synes derfor motivert å dele substantivene inn i et antall semantisk definerte klasser, og så se på hvordan possessivene plasseres innenfor hver av dem. En tentativ inndeling (i ikke-overlappende kategorier) er denne:

A. konkreter
B. legemsdeler
C. plagg
D. slekt- og familierelasjoner
E. andre relasjonelle personbetegnelser (arving, elev)
F. skjellsord og andre typiske tiltaleord
G. abstrakter
H. lokaliserbare, tellelige ikke-fysiske størrelser (dag, navn, begravelse) og fysiske størrelser klassifisert ut fra en relasjon (halvpart, motstykke, overflate)
I. Kollektiver (publikum)

En slik inndeling vil selvsagt alltid være diskutabel, blant annet fordi det enkelte ord ofte kan brukes på ulike måter og dermed sortere under ulike kategorier.

Vi skal se på noen få av kategoriene.

Type A: konkreter

531 substantiver ble klassifisert som konkreter. Kurven for prosentdel foranstilt possessiv i denne kategorien er som nedenfor:

Bare 49 av de 531 konkrete substantivene har en overvekt av foranstilt possessiv, og blant disse kan klassifiseringen utvilsomt diskuteres i enkelttilfeller, f.eks. vei, person, dose, distrikt, bredd, himmel, plattform, paradis, landskap, bane, utslipp. Disse kan være brukt i abstrakte betydninger, noe vi ikke har undersøkt her. Nærmere bunnen, med få eller ingen foranstilte possessiver, finner vi f.eks. bikkje, pust, lommebok, skrivebord, veske, bylt, dørstokk, gaffel, gardin, kule, leppestift, håndkle.

Det er tydelig at egenskapen ‘konkret’ favoriserer etterstilt possessiv.

Type B: legemsdeler

154 substantiver ble klassifisert som navn på legemsdeler. Denne kategorien favoriserer etterstilt possessiv enda tydeligere enn konkreter generelt gjør:

I denne kategorien har alle substantivene bortsett fra to en sterk overvekt av etterstilt possessiv. De to unntakene legeme og skjød er markert i diagrammet (hans legeme, hennes skjød), og illustrerer at stil og sjanger, i tillegg til semantikk, er en virksom faktor.

Betegnelser på legemsdeler skiller seg ofte ut grammatisk. På norsk, i motsetning til på engelsk, blir possessiv ofte ikke brukt ved slike betegnelser (Han skadet armen vs. He hurt his arm), men når de brukes, blir de altså nesten alltid etterstilt. Possessivforholdet ved legemsdeler er av den art som gjerne kalles ‘inalienable possession’ – ‘uavhendelig eiendom’: armen din er fortsatt i en viss forstand din arm om den så skulle være amputert og solgt. I en konkret sammenheng vil derfor eiendomsbesitteren være klart gitt. Det kan bidra til å forklare at possessiven ofte utelates på norsk – og antagelig også at den såpass konsekvent etterstilles når den brukes.

Type G: abstrakter

638 substantiver ble klassifisert som abstrakter: egenskaper, tilstander, handlinger og prosesser. Ved disse dominerer de foranstilte possessivene klart:

Her har 590 av de 638 substantivene overvekt av foranstilt possessiv; 72 av disse har bare foranstilt. Blant de sistnevnte, med bare foranstilt, finner vi f.eks. indre, ytre, helhet, generasjon, utspring, prakt, lengde, virke, sammenheng, inntog, visdom, forbløffelse, premiss, forholdsregel, anliggende, varetekt, gunst, årsak, egenart, motsetning, favør, tilslutning.  Lenger ned, blant dem som ligger i området 50 – 60 % foranstilt possessiv, finner vi f.eks. svik, dilemma, problem, offer, vanskelighet, utroskap, begjær, oppvekst, stolthet, hemmelighet tyngde, fremtid, unnskyldning, omtanke, nysgjerrighet, omsorg. Og nederst på listen, fra under 20 % og ned til 0 % foranstilt, finner vi abstraktene nervøsitet, erting, skriving, mas, kjøring, stahet, drikking, spilling, tull. Det er ikke vanskelig å se semantiske føringer eller sjangerføringer i denne videre inndelingen av abstraktene.

Grunnene til denne ulike behandlingen av abstrakter og konkreter, særlig kroppsdeler, er verd et videre studium. En mulig tanke er at det kan være en tendens til at det elementet – possessiven eller substantivet – som er viktigst for å identifisere den tingen det refereres til, kommer først. Konkreter identifiseres gjennom sine synlige egenskaper. Man kan først identifisere en viss kontordør, og deretter spørre hvem den tilhører. Men man kommer ikke over et tilfelle av forbløffese og spør deretter hvem sin forbløffelse dette mon være. En forbløffelse identifiseres ikke uavhengig av den som har den. Derfor, kanskje, er hennes forbløffelse, med hennes først, oftest mest funksjonelt, mens derimot kontordøren hennes naturlig nevner objektet først. Men dette kan utvilsomt diskuteres.

Fordelingen i nynorsk

Den nynorske delen av trebanken utgjør bare ca. 10 % av den, så her er tallene lavere. Som ventet finner vi en sterkere overvekt av etterstilt possessiv der:

Possessivplassering i nynorsk, globalt:

Possessiv-plassering

Antall

Foran

7 785

Etter

23 180

Mens bokmål hadde ca. 40 % foranstilte possessiver i løpende tekst, har nynorsk bare ca. 25 % foranstilt. (Dette tallet kan være enda lavere; mulige feilanalyser er ikke sortert fra her.)

Her er et lite utvalg eksempler med foranstilte possessiver i nynorsk tekst.

Nynorske eksempler på foranstilte possessiver:

Så gjekk han sin veg.
– Eg skal inn og leggja att desse pengane til mi vakre mor, sa ho.
Det låg rekkjehus på den andre sida av vegen, og kvart hus hadde sin vesle hage.
– Det er mitt motto!
Det var gått lang tid, men folk som ut frå barndommens tidsrekning skulle vore utgamle eller døde, gjekk framleis rundt i sin beste alder.
Etter Dicks tid er det absolutt ingen ting som stemmer i min bar[n]doms Karviland.
Dei grov fram sine gamle jordskiftebrev, og studerte dei gulna dokumenta.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Så hard var fødselen at minnet til sonesonen ikkje tok til å fungere før femten månader etter at han fall i sin første slumrande søvn.
Men det var eitt eller anna i lufta som var på «hans side».
Englar oppfyller dine ønske.
I sin debutroman «Kvalmen» frå 1938 er det nettopp livstrøyttleiken, den smertelege erfaringa at eksistensen går i oppløysing, som blir skildra.
Etter vår meining er det viktig å skapa eit omsorgsomgrep og ein omsorgspraksis som er ukjønna, der kvinner og menn på like vilkår kan delta i omsorga for barna sine.
Vi har vel våre partibøker, mange av oss framleis, – men dei færraste går på politiske møte.
I våre dagar har vi professorar i filosofi, men ingen filosofar.
Det kan då vere på sin plass å forfølgje diskusjonen om grensene for kva eit moderne fleirkulturelt samfunn kan vere – i forlenging av det vi ovanfor nemnde om føringar i moderne samfunn.
Fluga er vi, flaska vår sorg, vårt elende.
Dermed vart deira motstand mot arabisk styre mye meir innbiten, og kampen mye meir brutal enn i andre koloniar.
Det er altså aviser og nyheiter, kjendisar og forbruksvarer som er blitt felles referanseramme i vår tid?
Mellom desse krigsbolkane vart skattetrykket redusert, men aldri ned til sitt tidlegare nivå.
Danskane fekk sine «sterke jydar» og nordmennene sine haugianarar.
Det som er interessant med meg som forfattar, er ikkje mi livshistorie, men min forfattarprofesjonalitet.

‘ei jente’ eller ‘en jente’?

Innledning

Bruk av en som ubestemt artikkel også ved hunkjønnsord (en jente – jenta) har vært offisielt akseptert innenfor bokmål i hvert fall siden 1959, i de første årene med unntak for en viss gruppe substantiver, men i hvert fall fra 80-tallet uten slike uttrykte restriksjoner. Dette er også i overensstemmelse med talemålsutviklingen enkelte steder. I oslomål (og ikke bare i ‘Vest’) er en blitt den dominerende artikkelformen også ved substantiver som får -a i bestemt form entall. En lignende utvikling ser vi i Tromsø. Utviklingen innebærer at artikkelformen en i disse varietetene blir umarkert for distinksjonen mellom hankjønn og hunkjønn, og bare markerer ikke-intetkjønn, slik f.eks. demonstrativen den allerede gjør.

I dette innlegget vil jeg se nærmere på hvordan situasjonen for bruk av ubestemt artikkel ved hunkjønnssubstantiver er i skriftlig bokmål, med grunnlag i tekstmaterialet i trebanken NorGramBank. (Valg mellom han- og hunkjønn i bestemt form entall – gata vs. gaten – er diskutert i et annet blogginnlegg.) Vi skal se på den delen av bokmålsmaterialet som omfatter avistekst, sakprosa, barnelitteratur og romaner (originale og oversettelser), ca. 45 millioner ord.

Tall for 200 hunkjønnsord

Vi betrakter først de globale tallene for de 200 mest frekvente hunkjønnsordene, før vi ser på fordelingen mellom forfattere ved ett utvalgt substantiv (jente). En tilbøyelighet til å bruke ubestemt artikkel en ved et substantiv selv om man ellers bruker -a i bestemt form, kan indikeres gjennom det relative antall bestemte -a-former vs. -en-former sammenlignet med det relative antall ei vs. en som ubestemt artikkel. Søket omfattet følgende 200 substantiver:

adresse, analyse, anledning, art, aske, avdeling, avhandling, avis, befolkning, behandling, bestemor, bevissthet, blokk, bluse, bok, bro, brygge, bukse, bygd, bygning, celle, dagbok, dame, datamaskin, datter, dronning, drosje, dukke, dyne, dør, elv, ensomhet, eske, evne, ferd, flaske, forestilling, forklaring, form, forretning, forsamling, forskning, fortelling, fortid, fremtid/framtid, frihet, frue, gate, glede, grav, grense, gruppe, hake, handling, havn, helg, helse, hemmelighet, hensikt, historie, hjelp, hofte, holdning, hud, hue, hule, hylle, hytte, hånd, håndflate, jakke, jakt, jente, jord, jul, kai, kasse, kirke, kiste, kjerne, kjærlighet, klasse, klokke, kone, kraft, kulde, kule, kvinne, kåpe, lampe, leilighet, lengde, leppe, linje, liste, lomme, lommebok, lue, luft, luke, lukt, lykke, lykt, løsning, makt, mark, maskin, melding, melk, menighet, mening, mor, mulighet, munnvik, natt, nese, nyhet, nærhet, næring, olje, oppgave, oppmerksomhet, ordning, overflate, pakke, panne, pike, plante, plate, postkasse, presse, prinsesse, pute, regjering, reise, rekke, retning, rettssak, ro, rolle, rute, råd, sak, samvittighet, sannhet, seng, setning, side, sjel, skjorte, skråning, skulder, skumring, skyld, skål, slekt, slette, sol, sorg, spenning, stemning, stillhet, stilling, stjerne, strand, stue, støtte, søster, tante, taushet, tegning, tekst, tid, trapp, trening, tro, tunge, tåke, uke, ulykke, undervisning, uro, usikkerhet, utdannelse/utdanning, utfordring, utsikt, utvikling, vaksine, vakt, vekt, venninne, veske, virkelighet, virkning, virksomhet, vogn, økning, øy, åpning, årsak

For disse substantivene globalt finner vi følgende tall:

Kategori

Form

Frekvens

Bestemt form

-en

296 407

-a

77 641

Ubestemt artikkel

en

63 373

ei

3 393

Dette innebærer at bestemt form på -en er 3,8 ganger så vanlig som bestemt form på -a, mens ubestemt artikkel en er hele 18,7 ganger så vanlig som ubestemt artikkel ei. Det tyder på at mange forfattere antagelig har ubestemt artikkel en og bestemt form på -a ved noen av de samme substantivene. Det ser vi nærmere på i neste avsnitt, for et utvalgt substantiv.

Substantivet jente hos forfatterne

jente er blant substantivene med færrest forekomster av -en i bestemt form entall – bare 2,49 % av tilfellene (se tabell fra blogginnlegget ‘‘‘jorda’ eller ‘jorden’?’). Vi finner følgende frekvenstall i korpus, der vi også tar med antallet forfattere eller oversettere bak formene:

 

Kategori Form Frekvens Antall forfattere
Bestemt form

jenten

102

21

jenta

4095

378

Ubestemt artikkel

en jente

1610

329

ei jente

690

190

Tendensen i tallforholdene mellom bestemt og ubestemt form fra den globale tabellen er forsterket i tabellen for substantivet jente: Bare et lite mindretall forfattere skriver jenten som alternativ til jenta, mens betydelig flere skriver en jente enn ei jente. (Noen forfattere er med i begge gruppene og skriver både en jente og ei jente; se nedenfor.) Blant de 21 forfatterne som skriver jenten, finner vi blant andre Liv Margareth Alver, Jens Bjørneboe, Tomas Espedal, Stig Holmås, Vibeke Løkkeberg, Torborg Nedreaas, Arthur Omre, Fredrik Skagen og Gunnar Staalesen.

Spørsmålet om utviklingen av den grammatiske status til ubestemt artikkelform en kan belyses ved at vi tar for oss de 378 forfatterne som skriver jenta og undersøker hvor mange av dem som bruker ubestemt artikkel en, og hvor mange som bruker ubestemt artikkel ei:

Kombinasjon hos samme forfatter Antall forfattere
1. jenta 378
2. jenta; ubest. art. + jente 284
3. jenta; en jente 199
4. jenta; ei jente 143
5. jenta; en jente; ei jente 58

I tabellen angir rad 1 antallet forfattere som bruker formen jenta. Forfatterne i de neste radene er alle undermengder av disse – de bruker altså alle formen jenta. Rad 2 viser antallet forfattere – 284 – som i tillegg til jenta også bruker ubestemt form av jente med artikkel minst én gang. Radene 3-5 angår undermengder av disse, altså bare forfattere som både skriver jenta og har minst én forekomst av ubestemt artikkel ved dette substantivet. Rad 3 viser da at kombinasjonen jenta og en jente forekommer hos 199 forfattere, og rad 4 at kombinasjonen jenta og ei jente forekommer hos 143 forfattere. Rad 5 viser antallet forfattere som bruker både en jente og ei jente (i tillegg til jenta): disse 58 forfatterne er også med i radene 3 og 4 og utgjør snittmengden av disse to mengdene.

Rad 5 viser at variasjonen mellom en og ei i kombinasjon med -a ikke bare gjelder tekstuniverset som helhet, men i noen tilfeller også den enkelte skribent. Hele 58 forfattere/oversettere bruker begge formene. Her bør riktignok den faktiske bruken vurderes nærmere – f.eks. i hvilken grad siterte replikker, stilistisk variasjon o.l. er involvert .

Blant de 199 forfatterne som bruker en jente i kombinasjon med jenta, finner vi for eksempel Ola Bauer, Ari Behn, Bjørg Bjørsvik, Finn Carling, Sigurd Evensmo, Knut Faldbakken, Jostein Gaarder, Maria Gripe, Vera Henriksen, Vigdis Hjorth, Frid Ingulstad, Erik Kullerud, Unni Lindell, Arthur Omre, Anne B. Ragde, Margit Sandemo, Fredrik Skagen, Wera Sæther og Else Marie Winsnes.

Blant de 143 som bruker ei jente i kombinasjon med jenta, finner vi for eksempel Widar Aspeli, Geir Brandstadmoen, Knut Grønvik, Eli Haugen, Ellen Hofsø, Kåre Holt, Øivind Hånes, Rønnaug Jarlsbo, Arild Kolstad, Gunnar Lunde, Øystein Lønn, Atle Næss, Mari Osmundsen, Vigdis Rabben, Kari Sverdrup og Trond Vidar Vedum.

Blant de 58 som bruker både en jente og ei jente, finner vi for eksempel Selma Lønning Aarø, Ingvar Ambjørnsen, Elin Brodin, Niels Fredrik Dahl, Torolf Elster, Nils-Petter Enstad, Karin Fossum, Jørgen Gunnerud, Klaus Hagerup, Tormod Haugen, Torill Thorstad Hauger, Anne Holt, Roy Jacobsen, Gunvor Kloster, Per Knutsen, Britt Karin Larsen, Sidsel Mørck, Erna Osland, Tande-P., Tor Torkildsen og Hanne Ørstavik.

 

‘jorda’ eller ‘jorden’? Hunkjønn i bokmål

Innledning

I offisielt bokmål er grammatisk hunkjønn valgfritt siden 1981: Alle substantiver som kan være grammatisk hunkjønn, kan alternativt være hankjønn. Det er likevel ikke slik at valget står mellom alle eller ingen – valgfriheten gjelder hvert enkelt substantiv. Noen skribenter har derfor et større innslag av hunkjønnssubstantiver enn andre. Offisielt legges det ingen begrensninger på sammenhenger mellom disse valgene, men i praksis viser de seg å ha en struktur, f.eks. slik at valg av hunkjønn ved abstrakter typisk impliserer valg av hunkjønn ved konkreter hos samme skribent, men ikke omvendt (fortellinga synes å implisere gata, men gata kan opptre sammen med fortellingen). Disse forholdene er studert nærmere med utgangspunkt i fire aviser i arttikkelen «Norm clusters in written Norwegian». I dette blogginlegget skal vi se nærmere på omfanget av bruken av hunkjønn i NorGramBank.

Endelse i bestemt form entall

Oversikten nedenfor tar for seg bestemt form entall av substantiver med mulig hunkjønn og viser andelen forekomster som har hankjønnsendelsen -en. Materialet er fra bokmålsdelen av NorGramBank og omfatter:

Avistekst: ca. 3,2 mill. ord
Sakprosa: ca. 11,2 mill. ord
Barnebøker: ca. 4,1 mill. ord
Romaner, også oversatte: ca. 27,5 mill. ord

Bare substantiver som forekommer i bestemt form entall minst 10 ganger, er tatt med. Det gir 921 substantiver. Grafen nedenfor viser prosentandelen hankjønnsendelse når substantivene langs x-aksen er sortert fra maksimal til minimal andel hankjønn.

Prosentandeler -en ved 921 potensielle hunkjønnsord:

 

Kurven viser at 829 potensielle hunkjønnssubstantiver har -en i mer enn 50 % av tilfellene, det vil si 90 % av substantivene. 247 substantiver, eller 26,8 %, har bare -en.

Tabellen nedenfor viser tallene for hvert substantiv, sortert med  dem som har høyest prosent, først, slik som i diagrammet. Første kolonne viser substantivlemma, annen kolonne antall forekomster av bestemt form entall (med -a eller -en), og tredje kolonne hvor mange prosent av disse som har -en. Det kan være små innslag av feilanalyser på grunn av homonymi.

[Tallene og tabellene er oppdatert 27.04.2018.]

En alfabetisk sortert versjon av tabellen finnes her.

Mulige hunkjønnsord sortert etter prosentandel -en:

 

Substantivlemma # def. sg. % –en
adferd 73 100,0
akt 53 100,0
aldring 33 100,0
amming 43 100,0
analyse 375 100,0
anbefaling 65 100,0
annonse 162 100,0
arbeidsledighet 100 100,0
armhule 76 100,0
atferd 145 100,0
avhengighet 72 100,0
avkastning 91 100,0
avsetning 13 100,0
avsløring 55 100,0
avvisning 36 100,0
barmhjertighet 19 100,0
bedring 45 100,0
befruktning 17 100,0
begivenhet 112 100,0
begrensning 26 100,0
bemerkning 196 100,0
beretning 101 100,0
bergart 30 100,0
berøring 322 100,0
besetning 92 100,0
beskyldning 25 100,0
beslutning 298 100,0
besluttsomhet 43 100,0
bevaring 17 100,0
bevilgning 48 100,0
bitterhet 169 100,0
blodprøve 29 100,0
bomull 32 100,0
bragd 26 100,0
bregne 11 100,0
brikke 87 100,0
bølgelengde 11 100,0
cellegift 59 100,0
diskriminering 21 100,0
doktorgradsavhandling 45 100,0
dumhet 35 100,0
dyktighet 17 100,0
dødelighet 181 100,0
erindring 135 100,0
etterforskning 294 100,0
evne 1002 100,0
fatning 141 100,0
ferdighet 12 100,0
festning 221 100,0
fettsyre 11 100,0
flodbølge 34 100,0
flukt 247 100,0
forankring 15 100,0
forebygging 15 100,0
forelesning 67 100,0
forfatning 11 100,0
forfengelighet 23 100,0
forlegenhet 30 100,0
formaning 10 100,0
forretning 447 100,0
forsiktighet 15 100,0
forskrift 72 100,0
forsoning 18 100,0
fortolkning 25 100,0
fortrolighet 39 100,0
forventning 154 100,0
fregne 18 100,0
fruktbarhet 39 100,0
fuktighet 167 100,0
følge 23 100,0
følsomhet 67 100,0
gange 101 100,0
gave 348 100,0
gjerning 40 100,0
godkjennelse 14 100,0
grunnforskning 76 100,0
gruppering 11 100,0
grusomhet 19 100,0
grønnsak 19 100,0
gåsehud 20 100,0
hele 20 100,0
helhet 154 100,0
helsesøster 31 100,0
hemmelighet 502 100,0
hengivenhet 25 100,0
hensikt 579 100,0
henvisning 13 100,0
hindring 22 100,0
historie 112 100,0
hjelpeløshet 45 100,0
hodepine 137 100,0
hovedsak 94 100,0
hustru 94 100,0
hvile 63 100,0
høflighet 29 100,0
innledning 80 100,0
innsikt 83 100,0
innstilling 106 100,0
integrering 29 100,0
julegave 20 100,0
karriere 308 100,0
katastrofe 332 100,0
kjensgjerning 14 100,0
kjernekraft 34 100,0
klage 76 100,0
klimaforskning 106 100,0
kreftcelle 13 100,0
krigføring 29 100,0
krokodille 65 100,0
kylling 94 100,0
ladning 38 100,0
landing 64 100,0
ledning 123 100,0
legning 21 100,0
lengde 408 100,0
lesning 67 100,0
letthet 24 100,0
likegyldighet 75 100,0
likhet 181 100,0
livsform 15 100,0
lovgivning 129 100,0
lønnsomhet 58 100,0
løve 167 100,0
manet 40 100,0
markering 45 100,0
matvare 23 100,0
medlidenhet 57 100,0
merverdiavgift 26 100,0
messing 25 100,0
miljøgift 22 100,0
mistenksomhet 34 100,0
motsetning 68 100,0
mulighet 1824 100,0
munterhet 45 100,0
myndighet 32 100,0
mynte 55 100,0
nyhet 602 100,0
nysgjerrighet 226 100,0
nød 100 100,0
nøyaktighet 41 100,0
offentlighet 337 100,0
omskjæring 23 100,0
omsorg 281 100,0
oppløsning 56 100,0
oppmuntring 12 100,0
oppstilling 10 100,0
oppsummering 28 100,0
overbevisning 45 100,0
oversikt 190 100,0
overtro 15 100,0
overvekt 24 100,0
p-pille 27 100,0
pakt 70 100,0
personlighet 139 100,0
pleie 20 100,0
programvare 54 100,0
påkjenning 83 100,0
rad 117 100,0
registrering 60 100,0
rehabilitering 28 100,0
rein 70 100,0
rekkefølge 114 100,0
rekkevidde 68 100,0
rettferdighet 104 100,0
rettighet 13 100,0
revne 32 100,0
ri 18 100,0
rolle 1004 100,0
røst 157 100,0
samhandling 49 100,0
sannsynlighet 309 100,0
satsning 32 100,0
selvstendighet 15 100,0
selvtillit 142 100,0
sikkerhet 331 100,0
skildring 33 100,0
småpike 27 100,0
stigning 74 100,0
stolthet 234 100,0
storhet 22 100,0
strømning 14 100,0
styrketrening 11 100,0
svakhet 86 100,0
svane 32 100,0
sårbarhet 62 100,0
takknemlighet 36 100,0
tang&algae 124 100,0
taushet 512 100,0
tekst 779 100,0
tetthet 118 100,0
tilbakemelding 16 100,0
tilfeldighet 26 100,0
tilflukt 12 100,0
tilfredshet 31 100,0
tilgjengelighet 60 100,0
tilhørighet 29 100,0
tilknytning 44 100,0
tillit 264 100,0
tilrettelegging 10 100,0
tjenestepike 110 100,0
tolkning 122 100,0
tomhet 219 100,0
trekning 52 100,0
tretthet 201 100,0
tristhet 50 100,0
troverdighet 55 100,0
tulling 58 100,0
tålmodighet 156 100,0
tåre 24 100,0
uavhengighet 34 100,0
uenighet 75 100,0
ulempe 100 100,0
ulikhet 29 100,0
underskrift 41 100,0
undring 51 100,0
urettferdighet 37 100,0
urt 15 100,0
uskyld 39 100,0
utflukt 51 100,0
utgift 10 100,0
utholdenhet 33 100,0
utprøving 36 100,0
utredning 129 100,0
utsikt 494 100,0
utstrekning 18 100,0
utveksling 48 100,0
utålmodighet 54 100,0
uvitenhet 18 100,0
vaksine 466 100,0
vanskelighet 22 100,0
varighet 42 100,0
veiledning 88 100,0
velferd 45 100,0
vennlighet 109 100,0
verdighet 89 100,0
virksomhet 498 100,0
visning 33 100,0
voldtekt 75 100,0
ydmykhet 21 100,0
ytring 16 100,0
ytringsfrihet 114 100,0
ære 148 100,0
ærlighet 41 100,0
økning 547 100,0
åpenbaring 38 100,0
åpenhet 76 100,0
årsak 1564 100,0
hud 4727 99,9
virkelighet 2787 99,9
oppmerksomhet 881 99,9
sorg 863 99,9
stillhet 2212 99,9
pike 2690 99,9
nærhet 1940 99,8
bygning 1149 99,8
ferd 444 99,8
sannhet 2642 99,8
menighet 411 99,8
ro 396 99,7
glede 1180 99,7
ensomhet 386 99,7
skumring 386 99,7
usikkerhet 383 99,7
sak 6323 99,7
visshet 358 99,7
frihet 638 99,7
leilighet 3386 99,7
skjønnhet 304 99,7
bevissthet 599 99,7
utgave 280 99,6
trygghet 275 99,6
oppgave 995 99,6
evighet 240 99,6
opplysning 239 99,6
uniform 233 99,6
stilling 451 99,6
pest 218 99,5
sammensetning 217 99,5
takt 212 99,5
virkning 422 99,5
plikt 796 99,5
uro 563 99,5
gåte 187 99,5
frukt 184 99,5
setning 549 99,5
rettssak 365 99,5
plattform 363 99,4
tenkning 176 99,4
betydning 700 99,4
skam 326 99,4
oppfatning 314 99,4
kjærlighet 1720 99,4
kvinne 7961 99,4
hastighet 155 99,4
form 912 99,3
trellkvinne 149 99,3
borg 286 99,3
redning 140 99,3
holdning 406 99,3
anledning 538 99,3
vare 134 99,3
løgn 267 99,3
forskning 2923 99,2
befolkning 1989 99,2
sammenligning 129 99,2
kartlegging 253 99,2
forening 242 99,2
forutsetning 121 99,2
skråning 474 99,2
skriving 117 99,1
forestilling 580 99,1
klasse 1841 99,1
inntekt 114 99,1
etablering 112 99,1
bluse 557 99,1
skyting 104 99,0
utbygging 103 99,0
oppfølging 102 99,0
rekruttering 100 99,0
historie 4061 99,0
husholdning 98 99,0
retning 667 99,0
samvittighet 369 98,9
unnskyldning 92 98,9
bestilling 88 98,9
fyrstikk 88 98,9
sky 259 98,8
lysning 86 98,8
handling 429 98,8
dekning 84 98,8
sminke 163 98,8
endring 244 98,8
oppfordring 81 98,8
skrift 243 98,8
blødning 80 98,8
lykke 474 98,7
læring 78 98,7
antydning 77 98,7
lære 149 98,7
omsetning 149 98,7
spenning 668 98,7
evaluering 148 98,6
likestilling 74 98,6
salve 74 98,6
sikt 74 98,6
ætt 73 98,6
forurensning 72 98,6
belastning 137 98,5
datamaskin 477 98,5
kjempe 203 98,5
ordning 541 98,5
skuff 741 98,5
håndtering 67 98,5
pille 132 98,5
olje 384 98,4
avgift 61 98,4
spredning 181 98,3
vending 60 98,3
reise 1243 98,3
søyle 118 98,3
stemning 933 98,3
nytte 174 98,3
overskrift 174 98,3
påvirkning 115 98,3
drivkraft 113 98,2
erklæring 113 98,2
kjerne 498 98,2
begeistring 109 98,2
bekymring 163 98,2
tinning 325 98,2
utforskning 54 98,1
væske 214 98,1
niese 105 98,1
lyst 522 98,1
barnevakt 52 98,1
støtte 360 98,1
vandring 152 98,0
prøve 352 98,0
avhandling 502 98,0
eksponering 50 98,0
målsetting 100 98,0
forsamling 395 98,0
kvittering 48 97,9
rift 48 97,9
strekning 142 97,9
utforming 142 97,9
fortelling 513 97,9
gjennomføring 91 97,8
avmakt 45 97,8
krabbe 90 97,8
målsetning 45 97,8
trøst 134 97,8
tro 841 97,7
overføring 88 97,7
sysselsetting 44 97,7
tilpasning 44 97,7
problemstilling 219 97,7
planlegging 130 97,7
beundring 43 97,7
skisse 43 97,7
vurdering 215 97,7
barnepike 85 97,6
innvandring 84 97,6
bygging 167 97,6
åpning 874 97,6
satsing 290 97,6
behandlingsform 41 97,6
dyrkelse 41 97,6
løsning 981 97,6
art 776 97,6
dronning 889 97,5
betraktning 40 97,5
enighet 40 97,5
matlagning 40 97,5
feiring 156 97,4
innretning 39 97,4
slutning 39 97,4
synd 117 97,4
avslutning 116 97,4
forvirring 230 97,4
arbeidskraft 38 97,4
belønning 114 97,4
hjemmeside 38 97,4
innvending 38 97,4
livvakt 38 97,4
utfordring 645 97,4
brud 261 97,3
forvaltning 289 97,2
testing 72 97,2
mumling 71 97,2
oppslutning 71 97,2
samling 282 97,2
utdannelse/utdanning 448 97,1
regjering 2299 97,1
fremstilling 135 97,0
eske 805 97,0
grådighet 33 97,0
jomfru 65 96,9
slå 130 96,9
munnvik 451 96,9
ørn 225 96,9
vertinne 224 96,9
tilnærming 126 96,8
maskin 1036 96,8
kraft 530 96,8
orientering 31 96,8
simulering 31 96,8
erfaring 216 96,8
innføring 123 96,7
adresse 553 96,7
investering 61 96,7
markedsføring 61 96,7
sikring 61 96,7
undervisning 518 96,7
avdeling 840 96,7
aske 378 96,6
erstatning 29 96,6
leting 171 96,5
kappe 256 96,5
bosetning 56 96,4
bølge 280 96,4
forurensing 28 96,4
kreftbehandling 28 96,4
plage 27 96,3
høytid 53 96,2
organisering 106 96,2
tiltro 26 96,2
fortjeneste 77 96,1
nonne 128 96,1
stund 230 96,1
godhet 51 96,1
fordeling 203 96,1
prinsesse 401 96,0
betaling 125 96,0
herlighet 50 96,0
hushjelp 100 96,0
svigermor 170 95,9
oppskrift 193 95,9
hule 762 95,8
last 190 95,8
utvikling 2556 95,7
rand 231 95,7
bilulykke 23 95,7
elskerinne 69 95,7
skulder 4357 95,6
mening 1398 95,6
farmor 157 95,5
opplæring 134 95,5
byge 222 95,5
behandling 1529 95,5
gift 177 95,5
hvisking 66 95,5
håndskrift 88 95,5
strime 22 95,5
finansiering 131 95,4
gudinne 87 95,4
forandring 304 95,4
forklaring 1034 95,4
ulykke 709 95,3
hjelp 594 95,3
doktoravhandling 84 95,2
rynke 63 95,2
syke 105 95,2
plante 476 95,2
forsikring 61 95,1
regulering 81 95,1
steinblokk 20 95,0
formidling 59 94,9
frigjøring 59 94,9
bombe 196 94,9
underholdning 57 94,7
frille 37 94,6
tegning 404 94,6
vorte 55 94,5
sone 218 94,5
tran 18 94,4
blanding 213 94,4
stråling 280 94,3
takk 52 94,2
forbrenning 69 94,2
overvåkning 136 94,1
trakassering 17 94,1
varsling 17 94,1
datter 2902 94,0
spalte 83 94,0
melding 472 93,9
krykke 65 93,8
brille 16 93,8
fagforening 32 93,8
fordypning 32 93,8
sending 140 93,6
håndflate 553 93,5
binding 46 93,5
flenge 46 93,5
venninne 995 93,5
avling 107 93,5
drift 288 93,4
forsyning 15 93,3
forundring 30 93,3
føring 30 93,3
strofe 15 93,3
utstilling 329 93,3
oppvarming 313 93,3
klynge 119 93,3
kobling 172 93,0
kirke 3317 92,9
ape 126 92,9
mestring 14 92,9
skjelving 181 92,8
måling 41 92,7
drakt 307 92,5
røking 53 92,5
mappe 264 92,4
regning 328 92,4
storesøster 91 92,3
makt 945 92,3
hoppe 194 92,3
formulering 51 92,2
elendighet 190 92,1
deling 63 92,1
beregning 113 92,0
lagring 25 92,0
brystvorte 161 91,9
merking 37 91,9
mobbing 86 91,9
avføring 61 91,8
glo 85 91,8
presse 624 91,7
saft 143 91,6
nåtid 169 91,1
klimaendring 11 90,9
sene 11 90,9
søster 2858 90,8
lesing 87 90,8
rekke 480 90,6
kusine 241 90,5
måke 83 90,4
nettside 114 90,4
drosje 413 90,3
flytting 123 90,2
ramme 323 90,1
bot 40 90,0
bredd 10 90,0
ernæring 10 90,0
kongle 10 90,0
maling 253 89,7
krone 204 89,7
plassering 97 89,7
hinne 58 89,7
telling 58 89,7
side 9503 89,5
kløft 247 89,5
utgravning 38 89,5
grav 864 89,5
jakt 697 89,4
plomme 28 89,3
egg 149 89,3
flate 278 89,2
novelle 101 89,1
overflate 1564 88,9
blodåre 27 88,9
publisering 45 88,9
sidegate 18 88,9
sjel 880 88,9
lukt 2432 88,8
gjeld 176 88,6
skje 281 88,6
juling 26 88,5
istid 86 88,4
mormor 291 88,3
pakke 727 88,3
kirkeklokke 17 88,2
prioritering 25 88,0
tante 799 88,0
pressemelding 274 88,0
nattevakt 116 87,9
trening 435 87,8
trakt 41 87,8
mor 17846 87,7
sirene 57 87,7
næring 461 87,6
fjellside 313 87,5
levetid 63 87,3
bestevenninne 94 87,2
mine 85 87,1
bestemor 958 87,1
skilpadde 69 87,0
hofte 375 86,9
frue 800 86,9
sjokoladekake 15 86,7
forbedring 22 86,4
aldersgruppe 166 86,1
fortid 1264 86,1
bønn 287 86,1
tid 20138 86,0
påske 176 85,8
grense 1285 85,5
målgruppe 69 85,5
hånd 22700 85,4
trekrone 27 85,2
skål 439 85,0
kjøring 98 84,7
halvkule 13 84,6
sløyfe 123 84,6
man 141 84,4
årstid 147 84,4
lenke 86 83,7
pil 269 83,6
panne 4847 83,4
vindmølle 18 83,3
lunge 35 82,9
hake 2049 82,8
lillesøster 243 82,7
kåpe 658 82,7
perle 23 82,6
vakt 692 82,4
krukke 187 82,4
sen 17 82,4
tjære 17 82,4
arbeidstid 135 82,2
føde 39 82,1
drue 11 81,8
iling 22 81,8
rådgivning 11 81,8
badedrakt 71 81,7
avis 2875 81,6
strømpe 64 81,3
jordmor 175 81,1
stemor 196 81,1
gren 312 80,4
dukke 690 80,4
gatelykt 66 80,3
morgenkåpe 279 80,3
såpe 121 80,2
lampe 792 80,1
gulrot 25 80,0
pappeske 45 80,0
forskningsgruppe 109 79,8
ettertid 89 79,8
tåke 817 79,6
mast 100 79,0
ventetid 157 79,0
filmstjerne 19 78,9
styring 229 78,6
skoletid 83 78,3
morsmelk 46 78,3
rose 216 78,2
båre 45 77,8
flette 135 77,8
tunge 1830 77,7
maske 273 77,7
natt 9185 77,5
rifle 204 77,5
strand 2107 77,3
stripe 149 77,2
celle 683 77,0
vekt 699 77,0
rente 78 76,9
kiste 835 76,6
forskergruppe 260 76,5
oldemor 21 76,2
kake 321 76,0
ert 25 76,0
lommelykt 306 75,8
skolisse 33 75,8
hore 45 75,6
postkasse 412 75,5
tørke 53 75,5
skyld 887 75,4
gruppe 3173 75,2
dame 2959 74,9
fremtid 3250 74,8
lyspære 63 74,6
seng 10429 74,6
flaske 1574 74,2
luft 6557 74,0
lønning 19 73,7
saks 191 73,3
havn 726 73,3
skapdør 155 72,9
linje 527 72,7
melk 395 72,7
mark 545 72,5
lønn 264 72,0
vindusrute 110 71,8
kontrollgruppe 170 71,8
pumpe 60 71,7
linse 81 71,6
krise 221 71,5
snor 286 71,3
økt 38 71,1
fritid 245 71,0
glassrute 93 71,0
ferge 330 70,6
bleie 34 70,6
nese 3410 70,1
skjorte 1591 70,1
vogn 2249 70,0
gjødsling 10 70,0
hekt 10 70,0
veske 1554 69,8
jul 698 69,8
stikke 66 69,7
jakke 2244 69,4
pute 940 69,3
kulde 994 69,1
dør 24961 68,8
leppe 755 68,7
niste 41 68,3
fjær 69 68,1
stjerne 471 67,9
trapp 6350 67,7
skinnjakke 136 67,6
truse 294 67,3
gate 5448 67,1
grop 73 67,1
bjelle 82 67,1
dagbok 367 67,0
slekt 433 66,7
flaggermus 51 66,7
husmor 33 66,7
matte 180 66,7
skorpe 72 66,7
kule 649 66,6
lomme 2255 65,9
matpakke 133 65,4
bukselomme 149 65,1
enke 229 65,1
liste 1101 64,6
slette 576 64,4
barnevogn 112 64,3
bokhylle 289 63,3
kanne 163 63,2
syre 38 63,2
nål 236 63,1
due 54 63,0
rot 174 62,6
skinne 16 62,5
klokke 5557 62,4
lykt 537 62,4
uke 2951 62,3
eng 291 62,2
kasse 908 62,1
sol 6734 62,1
plate 619 61,1
helg 703 61,0
lekse 122 60,7
stue 6618 60,4
åre 334 60,2
fil 35 60,0
rute 860 59,9
frøken 67 59,7
suppe 289 59,5
lommebok 488 59,4
vise 76 59,2
rem 114 58,8
dyne 1586 58,8
hylle 777 58,6
søppelkasse 100 58,0
skive 182 57,7
brødskive 118 57,6
ordbok 66 57,6
tavle 340 57,4
bok 5329 57,1
bløtkake 23 56,5
lue 656 55,8
lisse 29 55,2
luke 527 55,0
gruve 271 55,0
stang 339 54,9
bør 31 54,8
ølflaske 86 54,7
gås 112 54,5
seter 107 54,2
bro 1120 54,1
brygge 758 54,1
hette 237 54,0
søle 165 53,9
dongeribukse 71 53,5
glassdør 129 53,5
pannekake 17 52,9
tann 61 52,5
ski 21 52,4
blokk 635 52,0
antenne 93 51,6
bølle 33 51,5
skinke 35 51,4
trøye 179 50,3
gru 133 49,6
gjørme 146 49,3
73 49,3
jord 5901 49,2
øks 297 49,2
padde 72 48,6
T-skjorte 320 48,4
vik 278 47,5
flis 59 47,5
and 110 47,3
bie 89 47,2
kai 541 47,1
gresshoppe 32 46,9
sprøyte 111 46,8
elv 3444 46,3
bukt 303 46,2
heks 325 46,2
underbukse 155 45,8
helse 584 45,5
boble 109 45,0
bukse 835 43,2
vifte 58 43,1
hakke 70 42,9
å 14 42,9
ull 100 42,0
mus 254 41,3
pipe 326 40,2
olabukse 20 40,0
grøft 228 39,5
line 151 38,4
bøtte 348 37,6
fortann 24 37,5
pære 88 37,5
felle 182 37,4
ugle 67 37,3
tønne 94 37,2
tromme 38 36,8
gryte 312 36,2
flue 191 36,1
nøtt 25 36,0
mil 17 35,3
lilje 43 32,6
tispe 109 31,2
renne 62 30,6
øgle 83 30,1
pølse 100 30,0
klo 165 29,7
skøyte 59 28,8
gjødsel 35 28,6
kone 2847 27,8
køye 236 27,5
lærebok 80 27,5
eik 65 26,2
sild 137 25,5
tue 68 25,0
hytte 2653 23,0
gran 102 22,5
li 180 22,2
myr 263 20,2
reke 35 20,0
bjørk 126 19,8
furu 64 18,8
kjerre 131 17,6
mugge 18 16,7
fjære 148 15,5
bygd 1092 14,5
ungjente 84 14,3
fille 204 13,7
høne 214 13,1
rotte 331 8,8
moro 93 8,6
gaupe 102 7,8
møkk 98 7,1
lus 50 6,0
geit 41 4,9
kjerring 216 4,2
kråke 115 3,5
grunne 29 3,4
lakselus 31 3,2
tjenestejente 82 2,4
øy 2501 2,4
jente 4197 2,4
rype 42 2,4
ku 346 2,0
leire 52 1,9
søppel 115 1,7
skute 192 1,6
bikkje 294 0,3
fitte 129 0,0
fyll 186 0,0
klemme 20 0,0
småjente 11 0,0