Er vi fokusert eller fokuserte? Partisippenes indre kamp i bokmål

1. Innledning: fenomenet

En forskjell mellom nynorsk og bokmål som ofte blir nevnt, er at nynorsk bøyer ordformer som plassert, drepen/drept og skjult i tall og kjønn i samsvar med subjektet i setningen, mens bokmål lar dem være ubøyd i den samme stillingen – altså når de står predikativt (f.eks. etter vere/være). Noen eksempler med flertallssubjekter:

(1) Nynorsk:
(a) Det var noko med korleis dei to setta av fingeravtrykk var plasserte.
(b) I Bulgaria er tolv idrettsleiarar drepne i samband med kampfiksing.
(c) Politibilane var skjulte bak trea.

(2) Bokmål:
(a) Begrunnelsen for dette har blant annet vært at de er midlertidig plassert.
(b) I Bahrain har vi sett at to demonstranter er drept av opprørspolitiet.
(c) Hun finner to hustufter som er skjult i gresset.

Verbformer som plassert, drept og skjult er partisipper (her perfektum partisipper). Denne mangelen på samsvarsbøyning i bokmål gjelder bare partisipper, og ikke adjektiver som står i samme stilling: I de er ulykkelige, demonstrantene er aggressive, hustuftene er store får vi flertallsbøyning av adjektivene. Mangelen på flertallsbøyning gjelder også bare partisipper som står predikativt – hvis partisippene står foran de substantivene de beskriver (attributivt), får de flertallsbøyning også i bokmål, i likhet med adjektiver:

(3)
(a) Hva vil statsråden foreta seg for at midlertidig plasserte barn får en forutsigbar og best mulig bosituasjon?
(b) Han forteller at tall på drepte mediearbeidere ofte er svært omstridte.
(c) Farvannet foran er uoversiktlig og med en rekke skjulte farer.

Hva er grunnen til dette unntaket for predikative partisipper i bokmål?

2. Partisippenes indre kamp: Er jeg verb eller adjektiv?

Partisipper er verbformer som brukes adjektivisk. Det er denne dobbeltheten som har gitt dem navn: De heter ‘partisipper’ fordi de tar del (‘participerer’) i to ordklasser, verb og adjektiv. Som vi skal se mer utførlig på i det som følger, er det særlig denne verbsiden av partisippenes natur som bryter igjennom når de gir avkall på den adjektiviske flertallsbøyningen i bokmål. Det typiske innholdet i verb og adjektiver er ulikt – verb beskriver typisk handlinger og prosesser, mens adjektiver typisk beskriver mer konstante egenskaper ved ting. I partisippene kan disse to semantiske typene komme til å kjempe om overtaket. Da kan samsvarsbøyningen være et signal om hvilken av de to som vinner. For beskrivelsen av forskjellen mellom nynorsk og bokmål ovenfor er for enkel: Det er mange unntak å finne i begge målformene. I nynorsk (som ikke er hovedtema for dette innlegget) er samsvarsbøyning av predikative partisipper i stor grad offisielt valgfritt, og også underlagt til dels intrikate regler der sterke og svake verb i noen tilfeller behandles ulikt. Gjennomført samsvarsbøyning blir da en markør av tradisjonell eller konservativ nynorsk. For bokmål sies det gjerne ganske enkelt at samsvarsbøyning mangler i predikativ stilling – når uttrykkene er ‘verbale’. I Norsk Referansegrammatikk (s. 518) står det: «I bokmål har perfektum partisipp ingen bøyning når det står som hovedverb innenfor sammensatte verbalformer.» Et eksempel som nevnes, er: De ble ikke bedt.

Likevel finner vi mange tilsynelatende moteksempler (men se nedenfor) i bokmålstekster. Her er et lite utvalg:

(4)
(a) Vi vet at mange er drepte, og en ny dag uten svar forsterker denne bekymringen.
(b) Selv om de var plasserte der oppe, var de godt synlige, både i huset og på bygda.
(c) Vi skimtet det hvite i øynene, tennene var skjulte, ingen smilte.
(d) Men sosiologene ved Columbia University er altså ikke helt overbeviste.
(e) I tillegg vil en trenge flere dagsenterplasser som er spesialiserte på disse pasienter.
(f) Men i realiteten er vi ikke så likestilte, sier forskeren.
(g) De hadde behagelige stemmer, de var kultiverte.
(h) De er frustrerte, de føler seg sviktet, og de er usikre på om framtidsplanene legges i grus.

(i) – Ja, vi er jo berømte, sa han og løftet et rustfarget øyenbryn.
(j) Store, omfattende samferdselsprosjekter som skal planlegges, kan være kompliserte.
(k) I begynnelsen hadde de vært sjenerte.
(l) – Både hunder og andre pattedyr er sannsynligvis mye mer avanserte enn vi hittil har trodd.

Hvis vi leser eksemplene under (4) nedover fra (a) til (l), vil antagelig mange finne at flertallsformene blir mindre og mindre påfallende jo lenger ned vi kommer. De to-tre, kanskje fire første kan vi stusse over, men så blir de mer kurante. Alle er perfektum partisipp-former av verb, men mens noen av dem kan sies å beskrive resultatet av en handling eller prosess (drept, plassert), er det ved flere av de andre mer nærliggende å si at de beskriver en egenskap uten tanke på noen prosess som har forårsaket den (komplisert, sjenertfrustrert). At noe er drept eller plassert, innebærer normalt at noen eller noe har drept eller plassert det. Han er dreptHan er blitt drept av noe(n). At noe er skjult, kan også bety at noen har skjult det, men ting kan dessuten være skjult(e) uten at det har skjedd. Og at noen er sjenert eller avansert, uttrykker normalt ikke noen forutsetning om at noen andre eller noe annet ‘har sjenert’ eller  ‘har avansert’ dem. Han er avansert er ikke lik (≠) Han er blitt avansert av noe(n). De sistnevnte er dermed mer adjektiv-aktige – og da blir flertallsbøyningen mer naturlig, fordi den nettopp hører hjemme hos adjektiver.

Tallforholdene støtter en slik rangering. Hvis vi samler alle eksemplene i bokmålsdelen av trebanken NorGramBank der disse partisippene står  predikativt til flertallssubjekt etter verbet være, finner vi f.eks. at drept opptrer med flertallsbøyning i bare 1 % av tilfellene, plassert opptrer med flertallsbøyning i 1,5 % av tilfellene, og skjult i 3,1 %. overbevist beskriver i større grad en egenskap (man kan være overbevist om noe uten å ha vært utsatt for at noen har overbevist en), og her har 9,1 % av tilfellene flertallsbøyning. Videre nedover finner vi at spesialisert har flertallsbøyning i 46,2 %, likestilt i 53,6 %, kultivert i 60 %, frustrert i 68,2 %, berømt i 83,3 %, komplisert i 85,7 %,  sjenert i 90 % og avansert i 95,2 % av tilfellene.

Vi skal lete mer utførlig etter tellbare utslag av semantiske egenskaper på dette området.

3. Grammatisk analyse og søk

Motsier disse eksemplene med flertallsbøyning sitatet fra Norsk Referansegrammatikk ovenfor? («I bokmål har perfektum partisipp ingen bøyning når det står som hovedverb innenfor sammensatte verbalformer.») Nei, ikke nødvendigvis – det avhenger av hvordan vi analyserer disse konstruksjonene grammatisk. Den grammatisk interesserte kan finne dette utdypet på siden Partisipper: analyse og søkeuttrykk. Der beskriver vi hvordan de aktuelle konstruksjonene er analysert i trebanken NorGramBank og hvordan søkeuttrykkene bak dette blogginnlegget er formulert. Den som er mindre interessert i grammatiske detaljer, kan trygt bare lese videre.

Trebanken NorGramBank er et syntaktisk gjennomanalysert tekstkorpus med knapt 90 % bokmålstekster og resten nynorsktekster. Omfanget er på ca. 80 millioner ord. En oversikt over delene av denne trebanken finnes på siden Deltrebankene i NorGramBank. Den syntaktiske analysen har skjedd automatisk ved hjelp av den komputasjonelle grammatikken NorGram.

4. Globale tall

Ved hjelp av søkeuttrykket beskrevet på siden nevnt ovenfor (Partisipper: analyse og søkeuttrykk) har vi hentet ut alle relevante eksempler i trebanken – det vil si eksempler der en partisippform står predikativt eller som hovedverb etter være til et subjekt i flertall – og sortert dem etter hvorvidt partisippet er samsvarsbøyd i flertall eller ikke. Dette søket finner 42 900 eksempler fordelt på 2 600 ulike verb og verbuttrykk i partisippform. Verbuttrykkene er såpass mange fordi de også omfatter  kombinasjoner av verb og tilknyttede preposisjoner, f.eks. basere*på, utsette*for, utstyre*med, forberede*på osv., i tillegg til basere, utsette osv. Når vi så

  • slår de komplekse verbuttrykkene sammen med grunnverbene,
  • eliminerer feilanalyser,
  • ser bort fra partisipper som forekommer mindre enn fem ganger i denne posisjonen i trebanken,
  • og inkluderer setninger som har fått alternative analyser (dette gjelder i første rekke setninger med partisippformer som er klassifisert som adjektiver i tillegg til verbformer i vår leksikalske database, f.eks. berømt, stengt, sykemeldt),

står vi igjen med 39 474 eksempler fordelt på 792 ulike verb i partisippform. Av disse 39 474 eksemplene har 38 179 ubøyd supinumsform og 1 295 eksempler, fordelt på 184 ulike verb, samsvarsbøyning. Med andre ord samsvarsbøyes 3,28 % av eksemplene. Vi skal se nærmere på hvordan disse tilfellene fordeler seg på ulike verb, og i hvilken grad de er korrelert med andre egenskaper ved setningene.

5. Fordeling på verbene

Av de 792 ulike verbene i partisippform opptrer altså 184 med samsvarsbøyning én eller flere ganger. Kurven i Figur 1 viser hvordan de 792 verbene fordeler seg fra dem med høyest prosent samsvarsbøyning til dem med lavest prosent samsvarsbøyning.

Figur 1. Prosent samsvarsbøyde eksempler i 792 verb.

Som Figur 1 viser, er det et mindretall av de 184 verbene med samsvarsbøyning som har det i mer enn halvparten av tilfellene. Tabell 1 nedenfor (egen side) viser de 184 verbene ordnet etter prosentandel med samsvarsbøyning, som i Figur 1. Ved hvert verb er det angitt i annen kolonne hvor mange ganger partisippet forekommer predikativt/som hovedverb etter være med flertallssubjekt, og i tredje kolonne hvilken prosentandel av disse som har samsvarsbøyning (de er vettskremte, de er forlikte, de er avanserte osv.)

Tabell 1:

Verb som som forekommer samsvarsbøyd som paRtisipp etter være

 

Det er tydelig at fravær av samsvarsbøyning etter være er normen i bokmål – samsvarsbøyning fremstår som det markerte eller det mer spesielle. Derfor venter vi at det særlig er blant de samsvarsbøyde at vi kan finne egenskaper som motiverer dette avviket fra normen. Eksemplene uten samsvarsbøyning representerer ‘normalen’, så der er det rimelig å tenke seg at spesielle korrelerte egenskaper mindre tydelig vil skille seg ut.

Intuitivt venter vi at samsvarsbøyde partisipper typisk vil betegne egenskaper eller tilstander uten noen underforstått tilknytning til handlinger  som har skapt dem. Hvis vi ser på partisippene med 40 % eller mer samsvarsbøyning i (5) og sammenligner med et utvalg av de mest frekvente partisippene uten samsvarsbøyning i trebanken i (6), er vel førsteinntrykket at dette i stor grad stemmer.

(5) Partisipper med 40 % eller mer samsvarsbøyning etter være:
vettskremt, forlikt, avansert, deprimert, variert, sjenert, samstemt, komplisert, balansert, berømt, interessert, samkjørt, frustrert, spent, irritert, kultivert, standardisert, fornøyd, likestilt, sjokkert, markert, blankpusset, strukturert, lakkert, slitt, spesialisert, fordrevet, brukt, forbannet, manipulert, koordinert, reservert, undertrykt, håndplukket

(6) De vanligste partisippene uten samsvarsbøyning etter være:
 gjort, tatt, satt, samlet, lagt, trukket, dekket, tjent,  bygget, fylt, begynt, rettet, kledd, nevnt, preget, gjennomført, gitt, rammet, skrevet, smittet, funnet, festet, registrert, pålagt, fordelt, hentet, foreslått, sagt, slått, stilt, oppfylt, utstyrt, utviklet, dradd, sett, sikret, ment, dømt, skuffet, fulgt, glemt, sendt, forbundet, iverksatt, reist, falt, omfattet, ivaretatt, øket, forpliktet, fremmet, omtalt, beregnet

Å fortelle at noen er deprimert, frustrert, sjenert, balansert eller berømt, er ikke å underforstå at noen har deprimert, frustrert, sjenert, balansert eller berømmet dem. Men å nevne at noen eller noe er  gjort, tatt, samlet, hentet eller oppfylt, er klart å underforstå at noen har gjort, tatt, samlet, hentet eller oppfylt dem eller det. Andre verb kan være mer eller mindre ambivalente med hensyn til denne distinksjonen.

6. Eksempler

(a) reservert

Et tydelig eksempel på et mer ambivalent verb er reservert, som dels kan bety ‘tilbakeholden’ – en egenskap – og dels at noen har foretatt en reservasjon – et handlingsresultat. Eksemplene med og uten samsvarsbøyning fordeler seg nesten helt etter denne distinksjonen; se eksemplene i (7) og (8):

(7) reservert med samsvarsbøyning:
(a) Mens mange prater i vei om alt mellom himmel og jord, er noen reserverte, og det tar tid før blikket møter ditt.
(b) her var det i tillegg de med middels kunnskapsnivå som var mest positive, mens de mest kunnskapsrike var reserverte.
(c) Vi er reserverte.
(d) De fleste er reserverte første gang de skal inn i et fjernsynsstudio.
(e) Ved et par tomme parkeringsplasser stod det nummerskilter som viste at plassene var reserverte, men siden ingen av bilene stod der nå, lånte jeg plassen deres med god samvittighet.
(f) Ingen måtte sette seg på de plassene, for de var reserverte, sa Preben.

(8) reservert uten samsvarsbøyning:
(a) I parlamentet er 25 prosent av plassene reservert for kvinner.
(b) Også der er øyet og hjernen reservert for hedersgjesten.
(c) På S-K var systemet helt rettferdig og fornuftig: prisforskjellen var ubetydelig, men enerommene er reservert for dem som gjennomgår benmargstransplantasjoner.
(d) De fleste bordene var opptatt, som han hadde fryktet, og de øvrige lot til å være reservert.
(e) De nederste bordene var reservert til de voksne og resten var til pionérene.
(f) Hun sa at de plasser som er reservert er merket på stolryggen.
(g) En av grunnene til at internasjonal bilindustri er interessert i Norge som foregangsland, er jo nettopp at kollektivfeltene er reservert for elektriske biler, som Inga Marte Thorkildsen var inne på.
(h) I dag er det allment akseptert og forventet at far tar ut de ukene som er reservert for ham.

(7a-d) betyr ‘tilbakeholden’, mens de to siste, (7e-f), har betydningen ‘å være satt til side’, i likhet med alle de åtte ikke-samsvarsbøyde i (8). To av fjorten avviker dermed fra forventningen. Men vi kan observere en forskjell mellom de to avvikende (7e-f) og de fleste i (8). I alle eksemplene i (8) bortsett fra (8d,f) har partisippet en tilknyttet preposisjonsfrase med preposisjon selektert av verbet reservere (reservert for, reservert til). Et slikt verbalkomplement kan tenkes å være en sperre mot samsvarsbøyning fordi det betoner partisippets verbale innhold. Vi ser nærmere på denne muligheten nedenfor.

(b) lakkert

lakkert er ikke tvetydig mellom to klart distinkte betydninger, slik reservert er, men kan likevel alternativt betone prosess eller tilstand. De seks eksemplene med dette partisippet fordeler seg som i (9) og (10):

(9) lakkert med samsvarsbøyning:
(a) Rensen fjerner bare skitten og kan brukes uavhengig av tidligere behandling, men ikke på møbler som er lakkerte eller malte.
(b) De var lakkerte for anledningen, en svak rosa lakk.
(c) Hummerne var glinsende svarte, som om de var spraylakkerte.

(10) lakkert uten samsvarsbøyning:
(a) Tåneglene er lakkert blå.
(b) Hun tar på seg en av mine skjorter, neglene hennes er lakkert svarte som lakrispastillene hun lever på.
(c) Neglene er lakkert korallrøde.

Her skulle vi etter hypotesen vente at eksemplene under (9) betoner lakkert mest som en varig egenskap ved et objekt, mens eksemplene under (10) betoner at en prosess har funnet sted.  Dette blir fort en subjektiv vurdering ved dette verbet, men kan hevdes å stemme for (9a), der det er tale om egenskaper som motiverer en viss behandling av møblene. For (9b), derimot, er det mindre tydelig, særlig med tilføyelsen for anledningen. Hvis det er slik at samsvarsbøyning faktisk betoner innholdet ‘stabil egenskap’, kan setningen forsåvidt leses med den nyansen (sml. neglene var røde for anledningen), men eksempelet kan ikke selv brukes til å dokumentere at samsvarsbøyning har denne virkningen. Noe lignende gjelder (9c), men der kan vi merke oss at lakkerte inngår i en sammensetning spraylakkerte. Virkningen av slike sammensetninger vender vi tilbake til nedenfor.

Alle eksemplene under (10) har såkalte resultative komplementer (blå, svarte, korallrøde). lakkere er blant de verbene som kan ta slike resultativer, eller objektspredikativer, som beskriver en resulterende egenskap ved objektet (i de passive eksemplene subjektet): Hun lakkerte neglene korallrøde. Objektspredikativet er et verbalkomplement som klart betoner det verbale, prosessuelle innholdet i lakkere. Det kan da tenkes å motivere fravær av samsvarsbøyning. Igjen skal vi vende tilbake til virkningen av slike verbalkomplementer nedenfor.

(c) fokusert

Det er ingen iøynefallende flertydighet i verbet fokusere i dets vanlige overførte betydning: Det betyr å konsentrere oppmerksomheten om noe. Men det ligger likevel en tvetydighet i den passive formen. ‘Å være fokusert’ kan sies om to forskjellige deltagere i situasjonen: den som konsentrerer sin oppmerksomhet (Han er svært fokusert) og det som oppmerksomheten blir konsentrert om (Dette problemområdet er ofte fokusert). I den siste betydningen er det tydelig at selve prosessen, og dermed det verbale innholdet, står i sentrum. Denne distinksjonen reflekteres i noen grad i korpuseksemplene:

(11) fokusert med samsvarsbøyning:
(a) Det kan ikke helt utelukkes at en enda høyere prosentandel av alle saker med om innvandring og integrasjon med nyhetsverdi burde være problemfokuserte.
(b) De er mer fokuserte på å oppnå fremtidige mål og krever mye av seg selv.
(c) Dette kan hunder lære fordi de er så fokuserte på å forstå oss menneskene, og gjøre som vi ønsker.
(d) – Vi har funnet ut at sangerne må være helt fokuserte og se på skjermen hele tiden uten å ta selv et sekunds pause slik de vanligvis kan.
(e) De fleste kvinnene i vår studie var karrierefokuserte.
(f) Det bør vi ha et våkent blikk til, og vi bør diskutere hvordan dette samarbeidet skal fungere framover, og vi må være reformfokuserte.
(g) Brukerne kunne fortelle at de setter stor pris på meningsfylte møter med ansatte som har kunnskap og er løsningsfokuserte.

(12) fokusert uten samsvarsbøyning:
(a) Steinbruddene i Egypt, Jordan og Tyrkia er gamle industrilandskaper som hittil har vært lite fokusert, sier Heldal.
(b) Han likte ikke grove filmer hvor bare kjønnsorganenes bevegelser var fokusert.
(c) Personvern og rettssikkerhet er høyt fokusert i Skatteetaten.
(d) Ledelse, holdninger og kultur i politi- og beredskapssammenheng har vært underfokusert i mange år.
(e) – Dette er et prosjekt der vi må være spesielt fokusert på sikkerheten.
(f) – En innsats som monner krever nok at strategiene for rettshåndhevelse må være mindre ensidig fokusert på straffeansvar.
(g) – Mine funn tyder på at fatwaene ikke i seg selv er fokusert på å løse kvinnenes dilemmaer, de motstridende forventningene til dem som de ulike synene representerer.
(h) Middelklasseforeldre er istedet mer fokusert på å være involvert i barnets prosjekter, og ser barnas frihet mer som deres mulighet til å utforske verden og forberede dem for framtiden sammen med en involvert voksen.

Det er fire eksempler der det som ‘er fokusert’, er det forholdet som oppmerksomheten blir konsentrert om: (12a-d). De er alle uten samsvarsbøyning, i overensstemmelse med forventningen, siden prosessen snarere enn en egenskap åpenbart står i sentrum her. De øvrige eksemplene beskriver alle den som konsentrerer sin oppmerksomhet, som den ‘fokuserte’ part, og de fordeler seg mellom samsvarsbøyde og ikke-samsvarsbøyde. Men vi ser at alle de øvrige ikke-samsvarsbøyde eksemplene, (12e-h), opptrer med den selekterte preposisjonen . Som nevnt ovenfor betoner antagelig slike selekterte preposisjonsfraser, i likhet med andre verbale komplementer, det verbale, prosessuelle innholdet i partisippene, og hemmer derfor tilbøyeligheten til samsvarsbøyning. Riktignok har to av de syv samsvarsbøyde eksemplene under (11) også selektert . Dette er åpenbart ikke absolutte regler – det er statistiske tilbøyeligheter det er aktuelt å se etter.

Vi kan også merke oss at det samsvarsbøyde eksempelet (11c) har gradsadverbet  knyttet til partisippet. Gradsadverb kan tenkes å favorisere adjektivlesning, og dermed samsvarsbøyning. Samtidig finner vi tilknyttede adverb også blant de ikke-samsvarsbøyde i (12), f.eks. lite, høyt, spesielt, ensidig og mer. Men disse adverbene kan også brukes som måtesadverb til verb: Han fokuserte lite/høyt/spesielt/ensidig/mer på utdannelse. Da er mer entydig et gradsadverb.

En annen egenskap ved de samsvarsbøyde eksemplene i (11) som det er verd å se nærmere på, er sammensetning. I fire av de syv eksemplene er partisippet sammensatt med et foranstilt substantiv.  Siden ordet dermed får en stamme som ikke tilsvarer noe verb (vi har ingen verb å problemfokusere, å karrierefokusere, å reformfokusere eller å løsningsfokusere), er det nærliggende å analysere sammensetningen som en relasjon mellom substantivet og et allerede derivert partisipp. Derfor kan slik sammensetning tenkes å favorisere adjektivtolkningen og dermed samsvarsbøyning.

7. Hvilke trekk korrelerer med samsvarsbøyning?

Under gjennomgangen av de tre eksemplene reservert, lakkert og fokusert har vi notert et antall grammatiske egenskaper ved setningene som ser ut til å være korrelert med henholdsvis samsvarsbøyning og fravær av samsvarsbøyning – i hvert fall i noen grad. Vi skal se nærmere på i hvilken grad dette er tilfellet. De egenskapene vi noterte, var:

  1. Ulike verbalkomplementer tilknyttet partisippet ser ut til å disfavorisere samsvarsbøyning (I parlamentet er 25 prosent av plassene reservert for kvinner; – Dette er et prosjekt der vi må være spesielt fokusert på sikkerheten).
  2. Sammensetninger av substantiv + partisipp ser ut til å favorisere samsvarsbøyning (De fleste kvinnene i vår studie var karrierefokuserte).
  3. Visse gradsadverb tilknyttet partisippet kan tenkes å favorisere samsvarsbøyning fordi de betoner adjektivegenskaper (grad av den resulterende egenskapen) (Dette kan hunder lære fordi de er så fokuserte på å forstå oss menneskene, og gjøre som vi ønsker).

Vi skal konsentrere oss om de 184 verbene som overhodet opptrer i samsvarsbøyd partisippform og sammenligne forekomsten av de nevnte egenskapene i samsvarsbøyde og ikke-samsvarsbøyde eksempler. Av samsvarsbøyde eksempler finnes totalt 1 295, av ikke-samsvarsbøyde eksempler med de samme 184 verbene finnes 11 550.

7.1 Verbalkomplementer

Verb opptrer med ulike typer komplementer eller utfyllinger som gir ytterligere informasjon om den handlingen eller prosessen som verbet beskriver. Noen av disse kan også opptre ved verb i partisippform, og vil da typisk fremheve det verbale innholdet i partisippet. Dette skulle etter hypotesen da disfavorisere samsvarsbøyning. Av slike komplementer skal vi ta de følgende typene i betraktning:

(a) Agensfraser: logisk subjekt uttrykt med preposisjonen av.

Eksempler:

  • – Det er en av grunnene til at mennesker gjennom historien har vært fascinert av speil.
  • Begge elvene har vært infisert av Gyrodactylus tidligere.

Moteksempler med samsvarsbøyning:

  • Ved hjelp av Rushdie-saken får vi dessuten satt søkelyset på andre som er forfulgte av det ortodokse islam.
  • I tillegg er en del sorter i omsetning selv om de ikke er godkjente av noen myndigheter.

(b) Indirekte objekter

Eksempler:

  • Til klemmen og ordene er overlevert den som skal ha dem.
  • Betalingsforetak lokalisert i Norge er underlagt hvitvaskingsloven og valutaregisterloven.

Ingen moteksempler med samsvarsbøyning.

(c) Frie predikativer/resultativer

Eksempler:

  • De kjøligere områdene er farget grønne på bildet.
  • Vi mener norske pasienter må få raskere tilgang til nye behandlingstilbud som er dokumentert trygge og kostnadseffektive.

Ingen moteksempler med samsvarsbøyning.

(d) Preposisjonsfraser selektert av verbet

Eksempler:

  • En annen forklaring er at mange av kvinnene ikke er likestilt med partneren sin.
  • – Hvis dere fremdeles er innstilt på det, har jeg mest lyst til å fortsette litt til.
  • Da må rådighetsinnskrenkningene være basert på kunnskap.

Moteksempler med samsvarsbøyning:

  • De anser kvinnene for å være likestilte med mennene, og de er tolerante overfor andre religioner:
  • Hvis den viser at du er gravid, må dere dessverre være innstilte på abort.
  • Noen begrensninger kan det likevel være for karriereverktøy som er baserte på bilder fremfor tekst.

Ved søk i trebanken etter samtlige eksempler på partisipper (blant dem som overhodet opptrer med samsvarsbøyning etter være og flertallssubjekt) med en av de nevnte fire typene verbalkomplementer fremkommer følgende tall:

Ikke-samsvarsbøyde partisipper:

2 589 av 11 550 eksempler, 22,4 %, har verbalkomplement.

Samsvarsbøyde partisipper:

19 av 1 295 eksempler, 1,5 %,har verbalkomplement.

Dette viser en signifikant korrelasjon mellom verbalkomplement og fravær av samsvarsbøyning.

7.2 Sammensetninger

Sammensetninger av substantiv (eller en sjelden gang adverb) + partisipp (som i problemorientert) kan fremheve de adjektiviske egenskapene ved partisippet fordi vi ikke har noe verb å problemorientere osv., noe som kan tenkes å vanskeliggjøre en tolkning av partisippet problemorientert som en del av en kompleks verbalform. Det blir da ikke oppfattet som en partisippform av et sammensatt verb, men som en adjektivisk sammensetning med en enkel partisippform. Dette skulle da favorisere samsvarsbøyning.

Eksempler:

  • Sjøl om det i dag ikke er lønnsomt, vet du at de som er odelsberettigede, under nye og bedre forhold kan få glede av dine investeringer.
  • Per Arild Garnåsjordet, forsker ved Statistisk Sentralbyrå, er enig i at nordmenn ikke er så miljøengasjerte som politikerne skulle ønske.
  • Vi er løsningsorienterte, vi har en sterk indre drivkraft, vi er begge sta, vi tror på det vi driver med.
  • I dag er våpnene mye mer presisjonsstyrte, og man får mindre «collateral damage» – uønskede skader.

Moteksempler uten samsvarsbøyning:

  • Dere vet vel at de eplene som er røde utenpå og brune inni er strålebehandlet? [Riktignok finnes verbet å strålebehandle.]
  • «Det ble ikke presisert hvilke anlegg som skulle være sertifikatberettiget
  • I Trondheim er alle skolene helseverngodkjent.

Ved søk i trebanken etter samtlige eksempler på sammensatte partisipper blant dem som overhodet opptrer med samsvarsbøyning etter være og flertallssubjekt fremkommer følgende tall:

Samsvarsbøyde partisipper:

161 av 1 295 eksempler, 12,4 %, er sammensatte.

Ikke-samsvarsbøyde partisipper:

48 av 11 550 eksempler, 0,4 %, er sammensatte.

Dette viser en signifikant korrelasjon mellom sammensatt partisipp og samsvarsbøyning.

7.3 Gradsadverb

Gradsadverb som svært, så, veldig, like knytter seg til adjektiver og sjelden eller aldri til verb. Slike adverb kunne derfor tenkes å favorisere adjektivtolkning og dermed samsvarsbøyning av partisippene. Enkelte adverb kan være både gradsadverb knyttet til et adjektiv og måtesadverb knyttet til et verb (f.eks. fryktelig, som i Hun var fryktelig sint vs. Han skrek fryktelig). Vi ser bort fra slike og velger ut de mest frekvente mer entydige gradsadverbene så, veldig, svært, like, helt, ganske, litt, særlig, for, temmelig, meget, altfor.

Eksempler:

  • De moderne formene, de er jo så kompliserte nå.
  • – Menn som har valgt disse studieprogrammene, er veldig motiverte.
  • Vi var begge svært reduserte og forsov oss grundig, og det ble klart at den optimistiske avtalen hadde vært et utslag av purt overmot.
  • Alle tre var like spente.
  • Men sosiologene ved Columbia University er altså ikke helt overbeviste.
  • Når det gjelder de konkrete avveiningene, mener jeg at de til tider er ganske kompliserte.

Moteksempler uten samsvarsbøyning:

  • – Synes du ting er så komplisert nå da? spurte han.
  • – Selv om det var de konkrete praktiske utfordringene som var utgangspunktet for tiltaket, var informantene samtidig veldig motivert av å få bedre kontakt med familie og venner og gjenopprette kontakt med tapte nettverksforbindelser, sier stipendiat Sissel Johansen ved Høgskolen i Oslo.
  • Utdanningstilbud innen marin biologi i området rundt Sognefjorden er nå ikke-eksisterende om ikke svært redusert.
  • De var like spent som henne.
  • Juristene er imidlertid ikke helt overbevist.
  • Jeg vil heller si det sånn at de faktisk er ganske fornøyd.

Andelen moteksempler ved gradsadverb er høyere enn ved de to foregående egenskapene (verbalkomplementer og sammensetninger). Tallene for de nevnte gradsadverbene så, veldig, svært, like, helt, ganske, litt, særlig, for, temmelig, meget, altfor er:

Samsvarsbøyde partisipper:

252 av 1 295 eksempler, 19,5 %, har gradsadverb.

Ikke-samsvarsbøyde partisipper:

508 av 11 550 eksempler, 4,4 %, har gradsadverb.

Forekomsten av gradsadverb er altså bare knapt fem ganger så hyppig ved samsvarsbøyde som ved ikke-samsvarsbøyde partisipper. Forskjellen er riktignok tydelig, men det er langt fra en kategorisk motsetning. Denne variasjonen kunne fortjene et nærmere studium – er det fri variasjon hos de fleste, eller ulike grammatikalitetsvurderinger? Man kunne også se nærmere på avgrensningen av gradsadverb. I et moteksempel som Juristene er imidlertid ikke helt overbevist kunne man reise spørsmålet om ikke helt her kunne  sies å modifisere verbalhandlingen snarere enn den resulterende tilstanden (Vi overbeviste dem ikke helt).

8. Konklusjon

Variasjonen mellom samsvarsbøyning og fravær av samsvarsbøyning av partisipper etter være og flertallssubjekt i bokmål kan i liten grad avskrives som bare usikkerhet og inkonsekvens. Fravær av samsvarsbøyning er klart normen, det umarkerte valget, som dekker det store flertallet av verb. I det mindretallet av verb som noen ganger viser samsvarsbøyning, er det en graduell overgang mellom de verbene som har det sjelden og dem som har det ofte. Men denne overgangen er forholdvis klart korrelert med semantiske egenskaper: betegnelse av sluttproduktet av en handling eller prosess (ikke samsvarsbøyning) versus betegnelse av en egenskap uavhengig av noen forutgående handling eller prosess som har frembragt den (samsvarsbøyning). Denne distinksjonen kan i noen grad dokumenteres gjennom formelle egenskaper ved setningene: Ulike verbalkomplementer knyttet til partisippene betoner et verbalt innhold og er en effektiv sperre mot samsvarsbøyning, mens sammensatte partisipper, og i noen grad gradsadverber, favoriserer samsvarsbøyning.

 

Bokstavrim og brøkdeler. Hvor ofte allittererer vi?

1. Innledning

Metrikken springer ut av språket. At språk er rytme, er tydelig helt fra den tidlige rytmiske interaksjonen mellom mor og barn til de utviklede setningenes jevne tidsintervaller – trykkbasert i noen språk, som norsk, stavelsesbasert i andre språk, som fransk, lengdebasert i atter andre.

Men er språk også rim? Er versenes rim også en regularisering av noe vi allerede finner i språket?

Bokstavrim eller allitterasjon er en klassisk rimtype karakteristisk blant annet for norrøn og annen gammelgermansk poesi, der allitterasjonen fulgte faste og strenge mønstre. Et eksempel er en ljodahått-strofe funnet som runeinnskrift på Bryggen i Bergen. I ljodahått skal en trykkstavelse i første linje stavrime med første trykkstavelse i annen linje, og så skal det være stavrim mellom to trykkstavelser i tredje linje:

Sæl(l) ek þá þóttumk,
er vit sátumsk i hjá,
ok komat okkar maðr á meðal.

‘Jeg syntes meg sæl
da vi satt  sammen
og ikke et menneske kom mellom oss.’

Det blir ofte påpekt at ordtak og faste vendinger i moderne norsk og andre språk har en tilbøyelighet til å allitterere. Hvor sterk er denne tilbøyeligheten – kan det tallfestes? Hvor mye oftere forekommer allitterasjon enn man skulle vente hvis det ikke fantes noen tilbøyelighet til å velge allittererende ordsekvenser?

I dette innlegget skal vi begrense oss til å se på koordinering av to enkle substantiver (uten adjektiver eller andre tillegg). Innenfor denne konstruksjonstypen finnes det en god del faste vendinger: sans og samling, vær og vind, kunst og kultur, ny og ne, mål og mening, munn og mæle, hud og hår, liv og lære, hui og hast, skuffer og skap, vitende og vilje, osv. Men ikke alle slike faste vendinger allittererer: sett og vis, saker og ting, fred og ro, liv og helse, kjøtt og blod, tid og rom, osv.

Hvis vi vil undersøke hvor ofte allitterasjon opptrer i slike uttrykk, blir det et problem å avgrense såkalte «faste uttrykk» fra koordinasjoner mellom to enkle substantiver i sin alminnelighet, på en tilstrekkelig presis måte til at statistikk blir informativ. Uavhengig av dette problemet kan det også være av interesse å undersøke tilbøyeligheten til å allitterere i uttrykk som ikke tilhører denne gruppen av faste vendinger. Man kan tenke seg i hvert fall to grunner til en eventuell tendens til allitterasjon. For det første kan det være at allitterasjon i faste uttrykk er noe av det som har bidradd nettopp til at de har festet seg og blir husket og gjentatt. For det annet kan man tenke seg at vi som språkbrukere har en tendens til å allitterere når anledningen byr seg. Hvis det siste er tilfellet, venter vi å finne en overvekt av allitterasjon også i koordinasjoner som ikke har etablert seg som faste uttrykk. Vi skal derfor se på hele mengden av koordinasjoner av nevnte type i vårt korpus NorGramBank.

2. Avgrensning og søk

(a)  Koordinasjoner med allitterasjon

Vi skal søke etter koordinerte substantiver med ulike konjunksjoner (og, eller osv.) der ingen av substantivene har tilknyttede bestemmere, adjektiver eller andre fraser. Det utelukker f.eks. eksempler som mindre forurensning og mindre kø, lokalsamfunnet og de regionene de betjener, osv., og inkluderer bare eksempler av den typen som er nevnt i innledningen (med og uten allitterasjon). Dette betyr koordinasjoner med c-struktur (trestruktur) som i Figur 1, der NP-nodene ikke forgrener seg. (NP = nominalfrase.)


Figur 1: Frasestrukturen i en enkel koordinasjon av substantiver

Vi begrenser oss videre til koordinasjoner der begge substantivene begynner på konsonant – ikke fordi alliterasjon med vokaler er irrelevant, men fordi den har litt andre regler enn konsonant-allitterasjon, ettersom det først og fremst er ulike vokaler som allittererer (åker og eng), og vi behøver ikke å ta høyde for den komplikasjonen for å studere tallforholdene mellom allitterasjon og manglende allitterasjon. Vi begrenser oss da til følgende 15 konsonanter:

b d f g h j k l m n p r s t v

Vi søker i hele trebanken NorGrambank (ca. 70 mill ord); delene den består av (aviser, sakprosa, skjønnlitteratur, stortingsforhandlinger, drøyt ti prosent nynorsk), beskrives på denne siden. Søkeuttrykket som plukker ut allittererende tilfeller med strukturen i Figur 1, beskrives nærmere på siden Søk etter allittererende koordinasjoner. Dette søkeuttrykket finner koordinasjoner der de to substantivene har samme initiale konsonant i skrift. Dette kommer til å omfatte en del eksempler der de likevel ikke allittererer, først og fremst ved substantiver på gj- og hj-, som ikke allittererer med andre substantiver på g- eller h-, men med substantiver på j-, og tilsvarende ved substantiver på hv- og v-. Resultatet av søket er bearbeidet for å ta hensyn til dette. Vi står da igjen med ca. 11 960 forekomster av til sammen ca. 8 020 ulike koordinasjoner der substantivene allittererer. Vi tar utgangspunkt i formene i teksten og skiller mellom f.eks. bil og buss og biler og busser som ulike koordinasjoner. Tabell 1 viser de 8 020 ulike allittererende koordinasjonene sortert etter frekvens, med de hyppigste øverst.

Tabell 1:

Tabell over 8020 allittererende substantiv-koordinasjoner sortert etter frekvens

 

Innslaget av faste uttrykk er klart sterkere jo høyere frekvenser vi betrakter. Blant de 30 mest frekvente eksemplene finner vi de 19 faste uttrykkene rekke og rad, sans og samling, vær og vind, kunst og kultur, ny og ne, mål og mening, munn og mæle, penn og papir, hud og hår, liv og lære, hui og hast, skuffer og skap, vitende og vilje, fred og forsoning, fyr og flamme, himmel og hav, punkt og prikke, tang og tare, stokk og stein, med frekvenser mellom 139 og 24. Tabellen har en lang hale på hele ca. 6 860 eksempler med frekvens 1, og der er det langt mellom faste uttrykk. Men en nøyaktig grenseoppgang mellom faste uttrykk og vanlige produktive koordinasjoner er en vanskelig oppgave; frekvens i et finitt korpus kan ikke være det eneste kriteriet. Vi skal derfor ikke forsøke en slik grenseoppgang.

(b) Koordinasjoner med og uten allitterasjon

For å finne ut om allittererende eksempler er særlig hyppige, må vi sammenligne tallene for slike koordinasjoner med tallene for koordinasjon av to substantiver i sin alminnelighet, uavhengig av allitterasjon. Søkeuttrykket som finner alle slike koordinasjoner, er presentert i avsnittet 2. Alle koordinasjoner på siden Søk etter allittererende koordinasjoner. Søket finner ca. 87 820 forekomster fordelt over ca. 59 450 ulike eksempler. Tabell 2 viser de 3 418 mest frekvente av disse eksemplene, ned til og med frekvens 3:

Tabell 2:

tabell over de 3418 mest frekvente av alle 59450 koordinasjoner (med eller uten allitterasjon) av to substantiver

 

Vi ser at koordinasjoner som mor og far, mamma og pappa, kvinner og menn, sett og vis, menn og kvinner og liv og død, med mellom 591 og 195 forekomster, forekommer oftere enn de mest frekvente allittererende koordinasjonene (der den hyppigste, rekke og rad, forekommer 139 ganger). For å vurdere om det finnes en tendens til å velge allittererende koordinasjoner, må vi se på de globale tallene.

3. Er allitterasjon hyppigere enn vi skulle vente?

Hvis null-hypotesen er at allitterasjon ikke spiller noen rolle for valg av ord i en koordinasjon, venter vi at hver initialkonsonant i første konjunkt opptrer med seg selv som partner i annet konjunkt gjennomsnittlig like ofte som den opptrer sammen med hver av de øvrige 14 konsonantene. (Siden alle konsonantene er involvert som andrekonsonanter her, spiller ulik global frekvens av de enkelte konsonantene ingen rolle. At j- er generelt sjelden og derfor stiller svakt i konkurransen med de andre konsonantene som andrekonsonant etter j-, oppveies av at f.eks.  s- er spesielt hyppig og derfor stiller sterkt i konkurransen etter en initial s-, osv.). Nullhypotesens forventning, basert på det totale antall koordinasjonsforekomster 87 820, er da at hver av de 15 konsonantene opptrer med seg selv som partner  (87 820 : 15) : 15 = 390 ganger, som da er gjennomsnittet. Det faktiske antallet koordinasjonsforekomster med alliterasjon er, som vi så ovenfor, ca. 11 960. Det betyr at hver av de 15 konsonantene gjennomsnittlig faktisk opptrer med seg selv som partner 11 960 : 15 = 797 ganger, altså over dobbelt så ofte som nullhypotesens forventning, med en faktor på 797 : 390 = 2,04.

Dette bekrefter en tydelig overvekt av allittererende koordinasjoner. Men skyldes dette en levende tendens til å allitterere, eller bare at mange nedarvede faste uttrykk faktisk allittererer og derfor bringer tallene opp fordi faste uttrykk er spesielt hyppige? En måte å kontrollere dette delvis på, er å se bort fra frekvens ved den enkelte koordinasjonen og bare telle ulike koordinasjoner, altså typer. Av koordinasjoner generelt, med eller uten allitterasjon, finner vi som nevnt ca. 59 450 ulike. Med samme nullhypotese som ovenfor venter vi at hver av de 15 konsonantene opptrer med seg selv som partner i (59 450 : 15) : 15 = 264 ganger. Av allittererende koordinasjoner har vi ca. 8 020 ulike. Det betyr at hver konsonant opptrer med seg selv som partner gjennomsnittlig 8 020 : 15 = 535 ganger, igjen over dobbelt så ofte som gjennomsnittsforventningen, med en faktor på 535 : 264 = 2,03.

En annen måte å redusere innflytelsen fra faste uttrykk på, er å bare sammenligne koordinasjoner som har frekvens 1, altså forekommer bare én gang hver. Kandidater til ‘faste uttrykk’ er sjeldnere jo lavere frekvens vi står overfor. Vi finner ca. 51 280 koordinasjoner med frekvens 1. Av disse er ca. 6 860 allittererende. Med samme utregning som ovenfor er den gjennomsnittsbaserte forventningen at hver konsonant opptrer med seg selv som partner (51 280 : 15) : 15 = 228 ganger, mens de faktisk gjør det gjennomsnittlig 6 860 : 15 = 457 ganger, denne gang overvekt med en faktor på 457 : 228 = 2. Dette gjør det ikke urimelig å opprettholde hypotesen om en generell tendens til allitterasjon (og dermed forkaste nullhypotesen om bare gjennomsnittlig frekvens).

4. Fordelingen mellom konsonantene

(a) Eksemplarer (forekomster)

Distribueres preferansen for allitterasjon jevnt blant de 15 konsonantene, eller skiller noen seg ut som særlig bokstavrimglade? Antallene forekomster av de ulike parene av første og annen initialkonsonant fremgår av Tabell 3:

Tabell 3: Eksemplarfrekvenser av hver kombinasjon av første og annen initialkonsonant
(Tabellen kan sees i større format her.)

Den loddrette aksen viser de 15 konsonantene som initialkonsonant i første konjunkt, og den vannrette aksen de samme konsonantene som initialkonsonant i andre konjunkt. Ved.v/hv og j/gj/hj er likelydende initialer slått sammen. Tallene viser frekvensene av tekstforekomster for hvert par av første og andre initialkonsonant. En overvekt av alliterasjon skulle da gi høye tall i diagonalen (markert med gult) fra øverst til venstre til nederst til høyre, altså parene b-b, d-d, f-f, g-g osv. Denne tendensen kamufleres likevel noe av ulikhetene i global frekvens mellom de 15 konsonantene, der f.eks. s globalt er flere ganger så frekvent som  j/gj/hj eller n som initialkonsonant. Dermed blir koordinasjoner med s som annen initialkonsonant nesten alltid mer frekvente enn med hver av de øvrige andrekonsonantene, uansett andre tendenser. I hver linje i tabellen, altså for hver førstekonsonant, er den mest frekvente andrekonsonanten markert med rødt, og den nest mest frekvente med grønt. Vi ser at s dominerer fullstendig som den mest frekvente andrekonsonanten. Et unntak er paret m-f, der særlig koordinasjonen mor og far har mye av ansvaret, slik det fremgår av Tabell 2 ovenfor. Men hvis vi ser på de grønne nest høyeste tallene, finner vi 7 av de 15 i den omtalte diagonalen, der vi i tillegg finner to røde, ett for p-p, og selvsagt ett for s-s. En tendens til allitterasjon skinner altså igjennom frekvensdominansen av s og andre konsonanter.

Vi kan eliminere virkningen av ulikhetene i global frekvens mellom konsonantene ved å normalisere frekvenstallene i tabellen til det de ville ha vært hvis alle konsonanter hadde hatt samme globale frekvens. Vi regner da ut den gjennomsnittlige summen g av hver av de 15 kolonnene i tabellen: g = 5 853. Så finner vi det normaliserte frekvenstallet f-norm i hver celle ved å multiplisere det faktiske frekvenstallet f med resultatet av å dividere gjennomsnittssummen g med den faktiske kolonnesummen s, altså:

f-norm f * (g/s)

Resultatet er Tabell 4, der hver kolonne har tilnærmet samme sum, omtrent lik gjennomsnittssummen g (‘omtrent’ fordi vi eliminerer desimaler).

Tabell 4: Normaliserte eksemplarfrekvenstall basert på antatt lik frekvens mellom konsonantene
(Tabellen kan sees i større format her.)

I Tabell 4 fremtrer en rimelig tydelig rød allitterasjonsdiagonal, med grønne innslag. Et unntak fra rød diagonal er d-n, som vinner over d-d på grunn av koordinasjonene dag og natt, dagene  og nettene, osv.; de er ansvarlige for over  halvparten av treffene. Men den grønne andreplassen inntas av d-d. I neste linje vinner f-g over f-f, særlig på grunn av frukt og grønt, men også frukt og grønnsaker, fryd og gammen og flasker og glass. (Det lyder forøvrig som en hyggelig og sunn fest.) Men også her inntar den allittererende f-f en grønn andreplass. Når g-g i følgende linje må se seg slått av g-j/gj/hj, ligger skylden hos gutten og jenta, guttene og jentene osv. Den allittererende g-g er en grønn nummer to også her. Det samme er tilfellet ved l-l, der vinneren l-d kan takke liv og død for seieren, mens l-l kommer på andreplass. Den eneste førstekonsonanten som hverken har rødt eller grønt tall  i diagonalen, er m, og her kan vi legge skylden på mor og far, og dernest på mat og drikke, mennesker og dyr og mor og datter.

I sum har vi 10 førsteplasser og 4 andreplasser av til sammen 15 mulige i den allittererende diagonalen (når vi altså normaliserer oss bort fra bokstavenes ulike globale frekvenser), og kan konkludere med at tendensen til allitterasjon er påtagelig på tvers av alfabetet, når vi teller teksteksemplarer.

(b) Typer

Det er høy tekstfrekvens som gjennomgående synes å være årsaken til avvikene fra allittererende vinnere i tabellene 3 og 4, og  det kan derfor være interessant å se hvordan tabellene ser ut hvis vi teller bare ulike koordinasjoner (typer), og ikke teksteksemplarer, også for de enkelte konsonantene. Antallet ulike koordinasjoner, altså typer, for hvert par av initiale konsonanter fremgår av Tabell 5:


Tabell 5: Typefrekvenser av hver kombinasjon av første og annen initialkonsonant
(Tabellen kan sees i større format her.)

Mønsteret ved unormalisertte frekvenstall avviker ikke sterkt fra det vi så i Tabell 3, der vi telte eksemplarer. Den høyfrekvente s dominerer enda litt mer som den mest frekvente andrekonsonanten, og i den gulmarkerte diagonalen, altså cellene med de allittererende parene, har vi fått én andreplass (grønt tall) mer enn vi hadde i Tabell 3, og like mange førsteplasser (røde tall). Også her er det nødvendig å fjerne virkningen av de svært ulike globale frekvensene av konsonantene ved å normalisere eller vekte frekvenstallene til det de ville ha vært hvis alle konsonanter hadde hatt samme globale frekvens. Utregningsmåten er den samme som den som beskrives over Tabell 4. Gjennomsnittet av kolonnesummene i Tabell 5 er  3 963. Resultatet er Tabell 6:

Tabell 6: Normaliserte typefrekvenstall basert på antatt lik frekvens mellom konsonantene
(Tabellen kan sees i større format her.)

I Tabell 6, med vektede frekvenstall, ligger alle de 15 maksimale frekvenstallene for andrekonsonanten i den allittererende diagonalen fra b-b til v/hv-v/hv. Det innebærer altså at for hver initial førstekonsonant (når vi eliminerer virkningen av ulike globale konsonantfrekvenser) er valget av den samme initiale konsonanten som andrekonsonant alltid det vanligste. Som vi så i avsnitt 3, der vi så på konsonantene samlet, er valget av allittererende initial 2,3 ganger så vanlig som man skulle vente hvis gjennomsnittet er forventningen; Tabell 6 viser at denne dominansen av allitterasjon faktisk også gjelder for hver enkelt konsonant.

5. Konklusjon

Studien viser en klar tendens til å velge allittererende koordinasjoner av enkle substantiver, med over dobbelt så høy forekomst som man skulle vente ut fra en nullhypotese at allitterasjon ikke spiller noen rolle for ordvalget. Vi ser også at allitterasjonstendensen ikke er begrenset til visse konsonanter, men er spredt over i hvert fall 14 av de 15 aktuelle konsonantene når vi teller teksteksemplarer (da med noen andreplasser i diagonalen), og over alle 15, med bare førsteplasser i diagonalen, når vi teller typer istedenfor eksemplarer, og normaliserer oss bort fra virkningen av konsonantenes ulike globale frekvenser. Også bokstavrim – ikke bare rytme –  synes altså å ha røtter i det alminnelige språket.

Dette kan kanskje være en kilde til kunnskap om struktur og mekanismer bak menneskets språkbeherskelse. Jeg tror lingvister ofte undervurderer betydningen av metriske egenskaper i sine teorier om språktilegnelse og språkbruk. Psykologer har vært inne på det, f.eks. Stein Bråten i Norge. Det har vært observert at preverbal kommunikasjon med spedbarn har rytmiske egenskaper, og rytme og intonasjonsmønstre tilegnes tidlig. Elementene i rytmen (i språk som norsk) er de trykksterke stavelsene, og det håndtaket vi bruker når vi griper fatt i et ord og dets trykksterke stavelse og plasserer det inn som et taktslag i talestrømmens rytmepartitur, er nettopp den initiale konsonanten. Vi føler velvære når vi eller andre får det til og det passer, og ekstra velvære når rytmepar har samme håndtak – samme initiale konsonant, eller samme fravær av initial konsonant ved vokalisk allitterasjon. En nærliggende tanke er at den initiale konsonanten er ordets adresse – omtrent som CAR i Lisp, kunne man si med en lett eksentrisk sammenligning. Å løpe gjennom alfabetet på jakt etter riktig initial er en velkjent teknikk når man ikke husker et navn. Når rytmen svikter og håndtaket glipper, kan resultatet bli stamming, som nettopp rammer den initiale konsonanten. Og det er ikke tilfeldig at sang er et velkjent remedium mot stamming; her har musikk og språk en felles kilde.

Stavrim, styrk initialen!
Rakner rytmen, tynes talen.

Far leser og mor syr?

Innledning

Far leser og mor syr? Det kan lyde som en foreldet stereotypi – men er den virkelig det? Helene Uri utgir i høst boken Hvem sa hva? Kvinner, menn og språk (Gyldendal 2018), der hun diskuterer de ulike måtene menn og kvinner mer og mindre automatisk blir omtalt på, og de ulike måtene de uttrykker seg på. Ett av de temaene hun tar opp, er de forskjellige aktivitetene og egenskapene som typisk blir tillagt henholdsvis menn og kvinner i utgitte tekster (skjønnlitteratur, aviser og sakprosa). NorGramBank viste seg som en nyttig kilde for denne typen informasjon. I dette innlegget vil jeg beskrive hvordan informasjonen er hentet ut fra NorGramBank, og se litt mer detaljert på noen av mønstrene vi finner.

Kvinnelige og mannlige verbhandlinger

Det kan være viktig å understreke at denne studien ikke viser hva menn og kvinner typisk gjør, men hva tekstforfattere fremstiller det som at de typisk gjør. Samtidig er det klart at sterke tendenser i de tekstene vi leser, bidrar til å forme vår oppfatning av virkeligheten. På mange områder former lesning vårt virkelighetsbilde minst like sterkt som erfaring. Derfor er disse tekstlige mønstrene av interesse også utover det rent språklige. Det er selvsagt også nærliggende å tenke at tekstforfatternes fremstilling ikke er uten enhver sammenheng med virkeligheten selv.

Materiale og metode

Materialet er hele trebanken NorGramBank (en trebank er et syntaktisk gjennomanalysert tekstkorpus), som består av en rekke deltrebanker innenfor teksttypene skjønnlitteratur, aviser, sakprosa og stortingsforhandlinger, slik det fremstilles på en egen side her. Omfanget er på ca. 70 mill. ord, hvorav drøyt ti prosent er nynorsk.

Hvordan fordeler så beskrevne handlinger, prosesser og tilstander seg på kvinner og menn i dette materialet? For å finne ut det, må vi først avgrense noen sentrale måter å referere til kvinner og menn på. Vi begrenser oss da til egennavn pluss et lite utvalg manns- og kvinnerefererende substantiver og pronomen, og kategoriserer dem henholdsvis som MASK og FEM:

MASK: mannsnavn + han + mann + gut(t) + far
FEM: kvinnenavn + hun/ho + kvinne + jente + mor

Trebanken inneholder 4 556 ulike mannsnavn og 3 582 ulike kvinnenavn.

Oppgaven er nå å hente ut de verbene som opptrer med tilfeller av MASK eller FEM som subjekt – eller mer presist: som ‘argument 1’ (ARG1) – og sortere verbene etter hvor ofte de tar MASK som ARG1, og hvor ofte de tar FEM som ARG1. Når vi sier ‘ARG1’ istedenfor ‘subjekt’, er det fordi subjektet ikke alltid er det handlende leddet, og det handlende leddet ikke alltid er subjekt. ‘ARG1’ står nettopp for det handlende leddet og omfatter subjekter for aktive verb, ikke for passive, og dessuten tilfeller der det handlende leddet ikke er subjekt – f.eks. av Kari i en passiv setning som Rapporten skrives av Kari, der Kari er ARG1 for skrive – hun er den som skriver – eller Per i Hun fant Per sovende i sengen, der Per er ARG1 for sove, eller far i Jeg så far løpe nedover veien, der far er ARG1 for løpe. Analysene i trebanken tillater oss å referere til ARG1 i søkeuttrykkene.

Den interesserte leser kan finne en mer detaljert omtale av trebankanalysene og søkeuttrykkene på siden Søk etter maskuline og feminine verb-argumenter. (Men det som følger her, forutsetter ikke at man har lest dette.) Det beskrevne søkeuttrykket på den nevnte siden henter ut fra trebanken alle verb som har MASK eller FEM ARG1 og lister dem ut sammen med opplysninger om hvor ofte de opptrer med MASK og hvor ofte med FEM ARG1. Søkeuttrykket får ca. 2,3 millioner treff i trebanken, fordelt på ca. 8 800 ulike verb og verbuttrykk. Tabell 1 nedenfor viser et lite utsnitt av trefflisten. Første tallkolonne viser antall treff, annen tallkolonne hvor mange av disse som har MASK ARG1, og tredje tallkolonne hvor mange som har FEM ARG1.


Tabell 1: Utsnitt av trefflisten med MASK og FEM ARG1 ved ulike verb

I den videre bearbeidelsen av disse dataene ønsker vi å rangere verbene etter hvor mange prosent kvinnelige og hvor mange prosent mannlige ARG1 de har. For å sikre en viss signifikans ser vi først bort fra verb med færre enn 10 forekomster i korpus med MASK eller FEM ARG1. Det reduserer antallet relevante verb og verbuttrykk fra  8 800 til ca. 4 220.

Hvis vi ser på den totale frekvens av MASK-uttrykk  og FEM-uttrykk i trebanken – altså ikke bare som ARG1 for verb – finner vi at MASK-uttrykk opptrer omkring 1,2 ganger så ofte som FEM-uttrykk. Dette tilsier at FEM-argumenter bør gis 1,2 ganger større vekt enn MASK-argumenter når de enkelte verbenes relative maskulinitet og femininitet skal regnes ut, for slik å kompensere for den forskjellen som skyldes ulikhet i global frekvens av de to typene. I utregningene av prosentverdiene nedenfor er derfor antallet treff med FEM ARG1 ganget med 1,2.

Resultater

For hvert av de 4 220 verbene og verbuttrykkene som har minst ti forekomster med MASK eller FEM ARG1, regner vi ut hvor mange prosent av disse treffene som har FEM ARG1, altså kvinnelige handlere. Resultatet finnes i Tabell 2 og Tabell 3. Begge tabellene viser alle verbene i kolonne 1 med antallet forekomster med MASK eller FEM ARG1 i kolonne 2 og prosentandel FEM av disse i kolonne 3. Tabell 2 er sortert etter prosentandelen, Tabell 3 er alfabetisk sortert etter verbet.

Tabell 2:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, sortert etter prosent

Tabell 3:

Tabell over prosentandel kvinnelige ARG1 ved 4 220 verb og verbuttrykk, alfabetisk sortert etter verb

 

Parseren produserer et antall feilanalyser, anslagsvis inntil 5 % (ulikt fordelt mellom verbene), og det har ikke vært praktisk mulig å sjekke alle de mange eksemplene manuelt. Det må derfor regnes med en feilmargin. I tabellene er det dessuten ikke skilt mellom homonymer (som f.eks. ved ulike betydninger av grunne).

Grafen i Figur 1 viser hvordan prosenten FEM fordeler seg blant de 4220 verbene, fra 100 % til 0%:


Figur 1: Fordelingen av % FEM blant 4 220 verb og verbuttrykk.

Kurven viser at et mindre antall verb og verbuttrykk skiller seg ut som tydelig maskuline eller feminine, mens de fleste tenderer mot å samle seg rundt midtlinjen på 50 %. Vi skal se nærmere på de tydeligst kvinnelige verbene fra 70 % FEM og opp, og de tydeligst mannlige verbene fra 30 % FEM og ned (markert med røde streker i Figur 1).

Kvinnelige verb

De følgende verbene og verbuttrykkene har mellom 70 og 100 % kvinnelige handlere, her listet opp fra 100 % og nedover:

100 – 91 % FEM:
abortere, knikse, rydje av, strikke på, stå brud, amme, neie, føde, sminke seg, blomstre, bysse, dåne, brodere, fortrylle, føne, sy på, bleke, fnise av, tralle, hekle, forhekse, kle på, smøre seg inn, fnise

90 – 81 % FEM:
binde opp, sminke, diske opp, strikke, sy, kneise, kurre, veve, knise, kvitre, sende med, glatte på, skingre, boble, holde sammen, glatte over, egne seg, pudre seg, blogge, daske til, klippe ut, vrikke seg, øse opp, bite seg i, flagre med, kjøle, laste ned, skjule seg for, speile, stusse på, trykke seg mot, tappe i, bære frem, bake, blunke bort, skure, pludre, gråte for

80 – 70 % FEM:
melke, dufte, dele seg, flagre, frottere, vogge, blomstre opp, svinse, hvine, skrifte, besette, bla frem, dulle med, faste, gjøre i stand, ranke, sprudle, vikle seg inn i, gyse, hulke, krølle seg sammen, geipe til, pynte, snufse, gispe, slekte på, tre inn i, truge med, klemme sammen, leggje ned, riste ut, skjemme ut, småprate, flette, slanke seg, legge på seg, engste seg, krøkje seg saman, setje inn, skifte på, snuble seg, sveipe, briste, setje fram, pynte seg, utdanne seg til, rydje, støvsuge, glatte, gråte, opne seg, plumpe ut med, prostituere seg, re, skrape sammen, sy sammen, vugge med, gråte av, spinne, verge seg, utgjøre, bere fram, glimte, kakle, kvide seg, pille, rapportere om, rydde av, skravle om, spraye, tirre, kollapse, vrikke på, kjenne, fire, flagge, formå, hysje, klemme ut, knytte sammen, krysse av, nynne med, omsetje, oppsluke, programmere, skjere seg, somle bort, sope sammen, tenje, tørre, undersøkje, vemmes, flørte, by seg, bæsje, liggje att, pudre, rope inn, tappe for, gjemme på, skjenne på, farge, snurpe, blafre, deklamere, revne, romme, strigråte, trenges, skrelle, kaste på seg, unnvære, gråte over, slikke av, feie bort, sette bort, synde, trimme, skrubbe, falle av, sole seg, vegre seg for, svimle, tilberede, vaske, tvinge seg til, re opp, bade, smøre på, dekke på, rødme, stålsette seg, bølge, forsake, forstue, korse seg, krøke seg saman, løsrive seg, sitre, skjemme bort, smøre inn, speile seg, spreie, sprelle med, bukte seg, duve, endevende, furte, glitre, komme seg etter, smørje, snøre opp, betro seg til, nynne

At abortere, knikse, stå brud, amme, neie, pudre seg og føde har hovedsakelig kvinnelige handlere, er ikke egnet til å forbause. Man kan kanskje undre seg over at et verb som føde ikke har 100 % kvinnelige handlere (verbet har 97,6 %), men det er viktig å huske at eksempler registeres også når predikatet er benektet, eller setningen er hypotetisk:

Hadde menn født barn, tror jeg ingen ville spurt om deres rett til å bestemme.
Det hadde hendt at han hørte hviskende utsagn om at hans far hadde født ham, og ikke moren.

– og når verb brukes i overført betydning:

Men det eneste han fødte var en drøm.
I havet fødte han oss til et nytt liv.

En litt annen kategori er knise, fnise, pludre, kurre, kvitre, hvine, sprudle, boble, daske til og kakle med flere. Her er det nærliggende å tenke at valget av verb har like mye å gjøre med skribentens perspektiv og kjønnsspesifikke forventninger som med de objektive handlingene som beskrives. Innholdsmessig mer interessante er eksempler som kle på, holde sammen, glatte over, egne seg, blogge, skjule seg for, stusse på, skrifte, besette, dulle med, skjemme ut, slanke seg, programmere, vemmes og deklamere. Er dette faktisk handlinger og relasjoner som særlig kvinner deltar i, eller er det særlig interessant å nevne det når det er kvinner som gjør det – eller er det statistiske tilfeldigheter i tekstene? Materialet reiser mange spørsmål som ikke blir forfulgt her.

En slik liste av spesifikt kvinnelige verb kan oppleves som lite flatterende for kvinner. Da kan de trøste seg med å se på den tilsvarende listen for menn.

Mannlige verb

Det er flere verb som har sterk overvekt av mannlige handlere enn det er verb som har sterk overvekt av kvinnelige. De følgende verbene og verbuttrykkene har bare mellom 0 og 30 % kvinnelige handlere, her listet opp fra 0 % og oppover:

0 – 9 % FEM:
anmode om, antaste, avtjene, braute, bure, eliminere, eskortere, gire ned, grunne over, junke, kjøre ut, låne fra, overta som, patruljere, pensjonere seg, ruse, rå, tjenestegjøre, tøffe seg, buldre, ekte, barbere seg, snekre, bremse ned, pisse, slakte, anslå, byggje, fri til, gapskratte, kviste, brumme, rekke over, arrestere, sverje, avhøre, forgripe seg på, bukke, knegge, referere, banke opp, dirke opp

10 – 19 % FEM:
fable om, krepere, kurtisere, stemme for, summere opp, telefonere, volde, trenge inn i, avskaffe, bryne, falle fra, hive seg, kortklippe, orsake seg, rasere, skrangle med, sperre inne, streife rundt, utnevne, utstyre med, utveksle med, gifte bort, skyte seg, humre, spikre, avlytte, blote, etterforske, gå ut frå, invadere, kjekke seg, knipse på, kristne, kryste, myke opp, rundjule, ruste, skikke seg, snåve, spre seg, tre tilbake, murre, anerkjenne, rane, spikke, onanere, tordne, skjegge, grunnlegge, tyggje, briske seg, sjå seg omkring, slå seg på, montere, utvise, okkupere, preke, smi, tale for, glise, plystre, dampe på, kidnappe, røve, mishandle, voldta, demontere, fyre av, hyre, kjøre over, oppføre, rutsje, plystre på, dømme, frakte, brøle, flire av, forfekte, hengje seg, innkalle til, komme etter, lunte, patte på, torturere, utholde, inngå, sage, herje, forhandle med, hevne, komponere, reflektere over, tukte, grynte, smatte på, fremlegge, kutte opp, plukke til seg, refse, spekulere i, trene opp, flire, fiske, forslå, holde igjen, håndhilse, male, regissere, utgi, klikke, lade, stake, erklære seg, filme, forplikte, kamuflere, markere seg, melde om, olje, ottast, preike, pågå, rigge opp, strande, tørste, lansere, drite

20 – 30 % FEM:
brøyte seg, skråle, jumpe, belære, blokkere, fortøye, krenke, kverke, laste, reparere, ause, kjøre opp, rekkje, vinne over, anse som, jakte, administrere, avansere, forlove seg med, fosse, fremsette, føre inn, hevde seg, innfri, klargjøre, konferere med, make, overbringe, pælme, råde med, saksøke, slakke, sprenge seg, stikke opp, støyte på, svindle, svive, tyrannisere, vekke opp, bremse, skjære ut, klø seg, berette om, forutsette, nedlate seg til, omgå, oppheve, skrense, spille inn, utrede, skyte, argumentere for, investere i, gaule, mobbe, skifte ut, legge om, banne, erobre, grave opp, informere om, snakke sammen, auge, bygge, stange, stifte, lange ut, jakte på, knipse, ruve, avklare, leggje inn, orientere om, støpe, supplere, videreutvikle, befale, befri seg fra, beføle, blø, blånekte, drible, fyre løs, ha tung for, kjøpe opp, kneble, køyre på, lue, lufte seg, mørkne, overdra, plugge inn, plyndre, problematisere, rasle, ratte, rigge til, rokke ved, røme, se som, ska, skurre, slåst, spenne fra, skule, luske, harke, slå til, kunngjøre, utvikle seg, rage, fordufte, skryte, sprenge, åpenbare, ringje på, bjeffe, knulle, vifte med, bla opp, hive opp, jule opp, tråkle seg, utløse, vedde på, fremstå, presentere seg som, drepe, byrje på, diktere, gje ut, rømme seg, sitte ned, spikke på, utrydde, vedta, vitse, drikke seg, fleipe med, logre, underslå, ro, håndhilse på, overfalle, sikre seg, sone, tale om, sjarmere, beregne, labbe, forske i, hente ut, mine, skubbe til, trenge seg på, slentre, grave ned, krafse, mulle, score, slipe, stinke, renske, blinke, rope opp, smadre, lyte, publisere, fri, innfinne seg, køyre, arbeide for, bale, beite, dømme til, fise, forenkle, frottere seg, kløve, offentliggjøre, oppvarte, redigere, sjonglere, skjøtte, skrue av, tegne inn, tørne, knurre, sette igjen, skygge, spyle, utrette, vippe opp, ete opp, operere, anslå til, ende med, erstatte med, farte, godtake, innkassere, plumpe, råke, saumfare, manøvrere, anvende, betegne som, formulere, gale, hogge, rave, justere, besøkje, bremse opp, investere, lirke opp, muntre opp, vrinske, foreta, fremme, sprøyte, tømme for, sette etter, geleide, lese opp, dykke, trenge seg inn, skryte av, rape, hugge, alliere seg med, avfyre, blingse, dilte etter, flerre opp, forveksle med, frata, føles, gomle på, hale inn, holde auge med, iverksette, kjøre ned, knyte opp, konstruere, leie inn, lenke, lide under, lukkast, rekne, rettferdiggjøre, sjenere, sleikje, sleppe inn, stikke seg vekk, stryke ut, tverrsnu, uttrykke seg, berømme, feie opp, file, pelle, rulle seg, røske opp, setje på seg, smiske, spurte, stavre seg, stå i, terge, tjore, vingle, kremte, beordre, karakterisere, opprette, bykse, spenne på seg, true, angripe, tromme, reinske, fikse, klappe igjen, rådføre seg med, slumre, spandere på, dure, overgi, tømme seg, vippe på, beseire

Også blant disse mannlige predikatene er det noen som i hvert fall inntil nylig er lite forbausende: avtjene, patruljere, tjenestegjøre, bukke, barbere seg, (mens det ikke-refleksive barbere har flest kvinnelige handlere).  Så er det en god del verb og verbuttrykk der det synes nærliggende å anta at skribentens eller samfunnets perspektiv i tillegg til den beskrevne handling forklarer at de særlig velges ved gutter og menn: tøffe seg, ekte, gapskratte, kurtisere, gifte bort, kjekke seg, tordne, briske seg, preke, grynte, flire, forlove seg med. Og så er det en god del der selve handlingene særlig assosieres med menn – fordi de særlig utføres av menn, eller fordi de særlig omtales når menn utfører dem. Og flatterende er de stort sett ikke: antaste, braute,  junke, forgripe seg på,  banke opp, rasere, sperre inne, invadere, rundjule, rane, okkupere, kidnappe, røve, mishandle, voldta, torturere, hevne, krenke, kverke, svindle, tyrannisere, mobbe, beføle, plyndre, skryte, jule opp, drepe, utrydde, drikke seg, overfalle,  smadre og avfyre. På den annen side er det også flest menn som i tekstene er ansvarlige for å eskortere, byggje, myke opp, anerkjenne, grunnlegge, utholde,  forhandle med, komponere, reflektere over, male, regissere, utgi, forplikte, markere seg, reparere, avansere, innfri, klargjøre, argumentere for, orientere om, støpe, videreutvikle, problematisere og publisere.

Nøytrale verb

Det kan også være av interesse å se nærmere på de verbene som ikke har skjev kjønnsfordeling, der man kanskje kunne ha mistenkt noen for å ha det. Blant verbene med mellom 55 % og 45 % feminint førsteargument finner vi for eksempel: tenke, kommunisere, filosofere, leke seg, regjere, rydde etter seg, slamre, late seg, rase mot, skoggerle, stappe i seg, øydeleggje, lyve, marsjere, bedra, skamme seg, kjefte, lese, skjønne seg på, konsentrere seg om, gruble, lære seg, fundere over, beordre til, disputere for, forsone, fantasere, sladre, oversette, forske, bable, leke, engasjere seg, krangle med, overdrive, samarbeide, lære om, konkurrere, jobbe, analysere, føye seg, argumentere, undervise, utdanne seg, kommandere til, myrde.

Det er kanskje en oppmuntring at i hvert fall i tekstene kjefter, leser, sladrer, forsker og konkurrerer kvinner og menn like mye.

Det er ikke bare å telle

Den tilgjengeligheten av store analyserte datamengder som vi ser i moderne trebanker og lignende ressurser, skaper en fristelse som det er viktig å motstå: fristelsen å presentere iøynefallende tallforhold som konklusjoner om hvordan verden er, uten nærmere analyse. Muligheten for feil i trebank-analysene er nevnt tidligere. Dessuten er de eksemplene som telles, langt mer mangfoldige og nyanserte enn hva de enkle tabellene får frem, både i innhold og i de sammenhengene eksemplene inngår i. Hundre eksempler fordelt på femti forfattere er mer tungtveiende enn hundre eksempler hos samme forfatter, som grunnlag for generaliseringer. Og de assosiasjonene vi kan få av å betrakte et isolert verb, er nesten alltid mye snevrere enn de varierte måtene verbet faktisk opptrer på i konkrete setninger. Setningene må studeres.

Som et eksempel på det siste kan vi se på fordelingen av verbet slå på de to handlerne mor og far (vi ser her bort fra de øvrige MASK- og FEM-uttrykkene). Mor er handler for slå i 30,8 % av tilfellene, og far altså i 69,2 % (når vi vekter prosentene etter de globale frekvensene til mor og far). Men før vi hopper til konklusjonen at far er brutal over dobbelt så ofte som mor, er det nyttig å konstatere at de følgende 29 setningene er å finne blant de 66 som har far som handler:

Dei ventar på at fedrane skal komma heim og slå hardt i borda.
Faren slår ut med armane, men før han får sagt noko, peikar ein av gutane på han og seier:
På dei flate strekningane slo faren varsamt med taumen mot hesteryggen, og Perle sprang.
Jamvel faren gjekk no og slo rundt seg med flosklar, enda han aldri preika over same teksten.
Men faren slo gjerne følge under mottoet:
«Skal vi ikke stoppe?» skrek Danny idet faren strakte en hånd ut for å slå av alarmen.
For så vidt var det den eneste kniven han hadde slått også, men den var nesten like fin som de faren hans slo.
Faren lo og slo hånden i bordet.
Faren stoppet bilen og hoppet ut, uten å slå av motoren.
Godefar slo ham på skuldra og sa:
Far slår armene om gutten sin og gir han en god klem.
–  Etty sier at det er enda en hemmelig gang i huset… begynte Ikaros ivrig, og skvatt høyt da faren slo hånden i bordplaten så koppene danset.
Finn begynte også å snakke om å flytte hjemmefra, men faren slo det bort.
Faren reiste seg, slo den ene hånden i den andre og gikk ut på kjøkkenet.
–  De seilte rett til helvete! brølte far og slo den digre neven sin i bordet.
Faren rullet sammen en avis og slo etter en flue.
Jeg hørte at far satt og slo skoen inn i bordbenet.
Far slo meg på skulderen og takket.
Faren var straks på beina og slo neven i disken.
Helsike, min egen far slo hånden av meg, betraktet meg som død!»
Far slo nummeret til studioet.
Det var nok til at de kunne ha levd enkelt og godt, men feilen var at far slo for stort på det.
Pappa hadde ikke nok penger, og faren slo ham konkurs.
Faren hans, fotograf Dal, slo i bordet og sa nei.
Faren satte albuene mot bordplaten og slo fingertuppene lett mot hverandre.
Faren slo nesten glasset i bordet.
Far prest slo i prekestolen igjen.
Faren slår hånden i bordet.
Mer fikk hun ikke sagt før faren slo så hardt i spisebordet at en blomstervase falt ned på gulvet og gikk i tusen knas.

Likevel leder nok far i brutal slåing i tekstene. Men tallene må nyanseres.

Konklusjon

I dette innlegget har hovedpoenget vært å presentere data for å gi et inntrykk av hva slags informasjon som kan hentes ut av denne språkressursen, og for å vise at det er mønstre i fordelingen på verb av mannlige og kvinnelige handlere som det er verd å studere nærmere. Det er fremdeles behov for å kartlegge innslaget av feilanalyser i dette materialet, og eksempler må studeres inngående for at man skal kunne konkludere noe om årsakene til den observerte fordelingen. NorGramBank vil være tilgjengelig for slike videre studier.

‘bærene’ eller ‘bæra’? Nøytrum def. pl. i bokmål

Innledning

I alle intetkjønnsord i bokmål er det valgfrihet mellom endelsene -ene og -a i bestemt flertall: bærene eller bærafolkene eller folkaunntakene eller unntakatilfellene eller tilfellastandpunktene eller standpunktapåfunnene eller påfunnaprinsippene eller prinsippa, osv. Siden normeringen av norsk etter gjeldende retningslinjer skal ta utgangspunkt i hvordan skriftspråket faktisk utvikler seg og ser ut i tekstene, er det av interesse å undersøke i hvilken grad denne valgfriheten blir utnyttet. Vi skal ta utgangspunkt i bokmålstekstene i NorGramBank og se nærmere på hvordan endelsene ser ut i ulike substantiver og hos ulike forfattere.

Fordelingen blant substantivene

Globalt

Vi ser på på de følgende delene av bokmålstekstene i NorGramBank:

Avistekst: ca. 3,2 mill. ord
Sakprosa: ca. 11,2 mill. ord
Barnebøker: ca. 4,1 mill. ord
Romaner, også oversatte: ca. 27,5 mill. ord

 Vi tar ikke med stortingsforhandlingene, ettersom de også inneholder nynorsk, og det kan foreløpig ikke skilles fra. En oversikt over deltrebankene i NorGramBank finnes her; vi legger da til grunn de deltrebankene som er prefigert med nob-.

Først ser vi på fordelingen av
-a og -ene på tvers av alle intetkjønnssord i bestemt flertall og på tvers av alle deltrebanker og forfattere. Ca. 5400 ulike intetkjønnssubstantiver (inklusive en god del sammensetninger) forekommer i bestemt form flertall i korpus. Vi ser bort fra substantiver som forekommer mindre enn 10 ganger i denne formen. Denne begrensningen reduserer antallet relevante substantiver fra ca. 5400 til 976.


Globalt er tallene på forekomster av disse 976 intetkjønnssubstantivene da slik i bestemt form flertall:

-ene: 146 347
-a:  20 606

 Det vil si at 87,66 % av forekomstene av nøytrum def. pl. har endelsen -ene. Dette er likevel svært ujevnt fordelt mellom substantivene. Hele 17 992 av de 20 606 forekomstene med -a er former av substantivene barn og bein/ben og sammensetninger med dem som siste ledd.  Disse brukes nesten utelukkende med -a i alle former for bokmål, inklusive de mest konservative, og er også normert med -a i den uoffisielle riksmålsnormen. De er derfor ikke så informative om normvalg hos skribentene. Hvis vi da ser bort fra disse to substantivene, blir tallene slik:

-ene: 146 144
-a: 2 614

 

Blant intetkjønnssubstantiver bortsett fra barn og bein/ben har dermed 98,24 % av forekomstene i bestemt form flertall endelsen -ene.

De enkelte substantivene

Hvis vi rangerer de 976 intetkjønnssubstantivene som forekommer 10 eller flere ganger i bestemt form flertall, etter prosentandelen -ene i disse forekomstene, blir resultatet grafen nedenfor. Den horisontale aksen har da substantivene fra  dem med høyest til dem med lavest prosent -ene, og den vertikale aksen har prosentverdiene.

Av de 976 substantivene har 747, eller 77 %, bare -ene i bestemt form flertall. 942 substantiver, eller 97 %, har 80 % eller mer –ene i forekomstene av bestemt form flertall.

En tabell som viser data for det enkelte av de 976 substantivene, finnes på en egen side (på grunn av størrelsen) her:

Tabell 1:

Tabell over andel -ene vs. -a ved 976 substantiver

 

Substantivene i tabellen er sortert på samme måte som i grafen. I første kolonne står lemma, i annen kolonne antall former på –a, i tredje kolonne antall former på -ene, og i fjerde kolonne hvilken prosentverdi forekomstene på -ene utgjør av  samtlige forekomster (-a eller -ene), som vist i grafen.

Fordelingen blant forfatterne

Forfatterne er representert i trebanken med tekster av svært ulik lengde. Blant romaner og barnebøker finnes det også oversettelser, så der omfatter begrepet både forfattere og oversettere. Innenfor sakprosaen er de fleste forfatterne representert med betydelig kortere tekster. Ikke alle avistekstene har forfatteropplysninger.

Blant forfatterne av de ca. 50 millioner ords tekst vi ser på her, har 2099 forfattere én eller flere forekomster av intetkjønnsord i bestemt form flertall. Av disse ser vi bort fra dem som har mindre enn 10 slike forekomster. Da står vi igjen med 818 forfattere.

Som i forrige avsnitt ser vi bort fra substativene barn og ben/bein, siden de har -a i alle varianter av bokmål/riksmål. Av de 818 forfatterne med minst 10 forekomster av de relevante formene er det da 264 forfattere, altså 32 %, som har minst én forekomst med -a. Men fordelingen av lemmaer med denne bøyningen blant disse forfatterne er langt fra jevn.

Vi skal se på to sider av fordelingen av a-former blant de nevnte 264 forfatterne:

  1. Hvor mange og hvilke ulike substantiver med -a forekommer hos den enkelte forfatter, og
  2. Hvordan er fordelingen av -a og -ene hos den enkelte forfatter?

Antall ulike substantiver med -a pr. forfatter

Siden forfatternes tekster er av svært ulik lengde, er antallet ulike intetkjønnssubstantiver med -a i bestemt form flertall hos den enkelte forfatter av begrenset informasjonsverdi, men kan likevel gi en indikasjon. (Lenger nede skal vi også se på prosentandelen slike former utgjør av det samlede antall forekomster med -a eller -ene.) En tabell som viser dette, finnes på en egen side her: (NB! Ved oversatte romaner er det originalens forfatter og ikke oversetteren som er oppført i tabellen.)

Tabell 2:

tabell over antall ulike lemmaer med -a hos den enkelte forfatter

Ingvar Ambjørnsen skiller seg ut som forfatteren med flest ulike intetkjønnssubstantiver på -a i bestemt form flertall: 48. Det omfatter de følgende substantivene:

avisutklipp, besøk, dikt, dyr, dødsfall, eventyr, femtiår, folk, forhold, forsøk, førtiår, garn, hjerteslag, hjul, hus, høns, jern, kinn, klesskap, knep, kort, krav, lys, lår, mannfolk, navn, nesebor, nummer, opphold, ord, politifolk, pulsslag, skift, skritt, skudd, smørbrød, soverom, spor, stemmebånd, stempel, svar, svin, tjueår, trinn, vindusbord, øyelokk, øyenbryn, år

Blant forfatterne med få lemmaer med -a er det i stor grad de samme substantivene som går igjen fra forfatter til forfatter. Hvis vi rangerer substantivene etter hvor mange forfattere som har dem med -a i bestemt form flertall, får vi Tabell 3 . I denne tabellen begrenser vi oss ikke til de 818 forfatterne som har minst 10 forekomster av nøytra i bestemt form flertall, men tar med alle de 2099 forfatterne som har minst én forekomst av denne formen. For hvert substantiv viser tabellen hvor mange forfattere som har det med –a i def. pl, hvor mange som overhodet har det i def. pl., og hvor mange prosent de førstnevnte utgjør av de sistnevnte.

 

Tabell 3:

tabell over antall forfattere pr. substantivlemma med -a i bestemt form flertall


Fordelingen av –
a og -ene hos den enkelte forfatter

Antallet a-former alene forteller ikke hvor konsekvent en forfatter bruker a-former. For å få et bedre bilde av det, begrenser vi oss først til  den undermengden av de 976 substantivene som overhodet forekommer med -a i bestemt form flertall i NorGramBank. Det er 207 slike substantiver (når vi ser bort fra barn og bein/ben). Dernest skal vi se hvor stor prosentandel av disse som har -a hos hver forfatter. Her ser vi på antall tekstforekomster, og ikke på antall lemma, ettersom samme forfatter noen ganger kan bruke både -a og -ene ved samme substantiv. (Dette kan være velmotivert stilistisk variasjon, eller variasjon fra en bok til en annen, og behøver ikke å bety ‘inkonsekvens’). Hvis vi rangerer forfatterne etter denne prosentandelen a-former, ser toppen av listen slik ut:

Tabell 4:

Forfattere rangert etter prosentandel a-endelse i bestemt form flertall av intetkjønnsord (toppen av listen, > 9 %):

 

# –a # –ene Forfatter % –a
36 2 Torp, Arne 94,74
130 20 Eeg, Harald Rosenløw 86,67
7 3 Tennfjord, Ingvild Wedaa 70,00
7 4 Bjånesøy, Kjartan Brügger 63,64
12 7 Sande, Hans 63,16
51 30 Hinton, Susan E. 62,96
10 6 Hobbelstad, Inger Merete 62,50
8 5 Isbrekken, Ane Teksum 61,54
24 20 Nørstebø, Øyvind 54,55
16 14 Ringheim, Trude 53,33
43 38 Blomquist, Lise 53,09
11 10 Harsson, Margit 52,38
5 5 Land, Anita 50,00
29 31 Østby, Magnus 48,33
7 8 Nilsen, Paul Torvik 46,67
20 24 Jarlsbo, Rønnaug 45,45
5 6 Bakken, Jonas 45,45
16 24 Alver, Eirik 40,00
4 6 Agjeld, Jogeir Magnar 40,00
148 236 Halstvedt, Tor 38,54
16 28 Holt, Kåre 36,36
29 53 Nielsen, Unni 35,37
7 13 Amin, Samir 35,00
41 80 Schärer, Jon 33,88
9 18 Osland, Erna 33,33
22 45 Solbu, Erlend Lånke 32,84
3 7 Lønnebotn, Lasse 30,00
3 7 Samuelsen, Reidun J. 30,00
3 7 Wictorsen, Mari Lund 30,00
26 71 Svendsen, Randi Berge 26,80
49 147 Syvertsen, Håvard 25,00
12 37 Åmotsbakken, Tormod Kvithyld 24,49
19 61 Sørlle, Steinar 23,75
3 10 Robberstad, Hege 23,08
6 21 Løes, Synne Sun 22,22
55 197 Enger, Rolf 21,83
28 105 Zameenzad, Adam 21,05
9 35 Haagensen, Nils-Øivind 20,45
22 89 Knudsen, Sverre 19,82
134 545 Ambjørnsen, Ingvar 19,73
6 25 Hansen, Bo 19,35
2 9 Alm, Birgit 18,18
300 1383 Spilde, Ingrid 17,83
8 39 Frøytlog, Bente 17,02
26 127 Kolstad, Arild 16,99
6 30 Hjukse, Aase Vallevik 16,67
6 30 Holmedahl, Jostein 16,67
3 15 Rehman, Shabana 16,67
2 10 Aasbrenn, Magne 16,67
5 26 Holm, Magnus 16,13
8 42 Jenssen, Magnhild 16,00
5 27 Lyngheim, Milly 15,63
110 607 Rønning, Asle 15,34
7 39 Hoftvedt, Stein 15,22
34 201 Sverdrup, Kari 14,47
37 221 Hauger, Torill Thorstad 14,34
26 158 Larsen, Britt Karin 14,13
3 19 Vedum, Trond Vidar 13,64
5 32 Kildahl, Mari 13,51
10 65 Grinderud, Paal-André 13,33
4 27 Stene, Morten 12,90
9 61 Knudsen, Lise 12,86
10 68 Monsen, Marianne 12,82
7 48 Sæther, Eivind 12,73
15 111 Pedersen, Erling 11,90
2 15 Opedal, Hallgeir 11,76
2 16 Eriksen, Nina 11,11
4 33 Krogedal, Else Lien 10,81
4 34 Creaghan, Alison 10,53
5 43 Mills, Magnus 10,42
57 511 Nordahl, Marianne 10,04
4 36 Bye, Anders 10,00
1 9 Førde, Lars Engh 10,00
Hvis vi tar i betraktning alle de 818 forfatterne (og ikke bare dem med mer enn 9 % -a, som i tabellen over), blir kurven som nedenfor. Den viser prosentandel forekomster med -a blant disse 818 forfatterne.

Prosentandel -a blant forekomstene av bestemt form flertall (av de 207 substantivene som overhodet forekommer med -a i korpus) hos 818 forfattere:
 Mens tabell 2 lenger oppe viste det absolutte antall ulike substantiver den enkelte forfatter gav -a i bestemt form flertall, og hadde Ingvar Ambjørnsen på topp, viser Tabell 4 og grafen ovenfor hvor konsekvent den enkelte forfatter er i valget av -a i slike substantiver. Den store forskjellen i tekstmengde mellom forfatterne gjør likevel denne sammenligningen mindre informativ. I prosenttabellen kommer Arne Torp på topp med 94,74 % -a, mens Ambjørnsen er nede på 19, 73 % –a. Men mens Torp er representert med én artikkel på 483 setninger, er Ambjørnsen representert med åtte romaner på til sammen ca. 35 000 analyserte setninger. Det gir noe større rom for språklig variasjon.
Ambjørnsen bruker -ene i 79 substantiver (av vår gruppe på 207, altså de som overhodet forekommer med -a i korpus),  og til dels i de samme substantivene der han bruker –a i andre sammenhenger.  De 79 substantivene med -ene er de følgende, der de som også opptrer med –a hos Ambjørnsen, er markert med rødt:

 

ark, avdrag, baklys, barneår, bilde, blikk, bryst, bær, dekk, dikt, dyr, erme, eventyr, fjon, folk, forhold, førtiår, glass-skår, glass, hjul, hull, hus, høns, hår, kinn, kort, krav, kryp, ledd, lys, lår, mannfolk, merke, minne, minutt, navn, nesebor, ord, papir, politifolk, problem, resultat, rom, sekstiår, skap, skinn, skrik, skritt, skudd, smil, soverom, spann, spor, spørsmål, stearinlys, stempel, svaberg, sykehus, tak, tall, telt, tjueår, toalett, tog, trappetrinn, tredveår, trekk, trinn, ungdomsår, uttrykk, vindu, vindusbord, våpen, øre, øye, øyeblikk, øyelokk, øyenbryn, år

Et utvalg eksempler fra Ambjørnsen:

Som opptakten til et av de dårlige dikta til min fiende Gregor.
Og i det samme kom jeg til å tenke på diktene til Haakon Willum.
Ikke faen om jeg ville ta imot så mye som en forpult pfennig fra disse dyra.
Vi kunne høre dyrene bevege seg et sted i halvmørket.
Vi gikk forbi disse deppa folka og henvendte oss til ei ung dame i hvit uniform.
Ei ung jente tok til og med av seg jakka og la den under hodet mitt til folkene fra legevakta kom.
Det de ville, var å rette folks oppmerksomhet mot de jævlige forholda disse pelsdyra levde under.
For i de neste sekvensene gikk han og kameramannen rundt i den enorme hallen og filma disse «naturlige» forholdene.
Knøttsmå bur der hønsa ikke kunne bevege seg skikkelig.
Håret hans var vått av svette eller vann, kanskje blod, og hønsene kaklet og bakset rundt ham.
Jeg hylte av smerte, og så at det fossa blod ut av nesebora hans da han trakk seg tilbake.
Jeg hadde lagt merke til det – at neseborene hans sitret litt når han grublet på noe.
Etter badet og all maten var hun blitt tung i øyelokka.
Øyelokkene ble tunge som bly.

Arne Torp har -a i substantivene dyr, funn, hundreår, leveår, middelhavsland, ord, språk, spørsmål, tall, tegn og tilbud, og -enebilde og resultat (blant de 227 substantivene vi tar i betraktning).

I sum

Denne oversikten viser at bruk av -a i bestemt form entall av intetkjønnsord kvantitativt sett er et svært marginalt fenomen, i hvert fall i det utsnittet av utgitt bokmål som finnes i NorGramBank, både innenfor ordforrådet og blant forfatterne. Det er begrenset til en liten del av inventaret av intetkjønnssubstantiver, og blant dem igjen til dels til en begrenset del av forfatterne. Det kan likevel tenkes at det finnes argumenter for å opprettholde valgfriheten i hele denne kategorien av substantiver, men argumentene bør da formuleres og sammenholdes med de gjeldende retningslinjene for normering.

Substantivsjuke – epidemi eller hypokondri?

Innledning

«Substantivsjuke» er en lidelse som rådgivere i godt språk regelmessig advarer mot. Språkrådet sier blant annet dette om fenomenet, under overskriften «Substantivtunge setningar»:

«Verbale seiemåtar gjev betre språk. Her finn du råd om korleis du kan unngå substantivsjuken.

«Potetene vart gjorde til gjenstand for langvarig koking» vil seia det same som at potetene vart kokte lenge. Setninga er døme på det som gjerne blir kalla «substantivsjuke». Kjenneteikn på på substantivsjuke i ei setning, eller ei substantivtung setning, er at setninga inneheld eitt eller fleire substantiv på -ing som er danna av eit verb, og eitt eller fleire innhaldstomme verb, dvs. verb som ikkje tilfører setninga noko meiningsinnhald (t.d. å gjera).»

Kjernen i problemet er altså substantiver på ‘-ing’ (og andre endelser som vi kommer til) som er avledet av verb – såkalte nominaliseringer. Ingressen begynner med et allment og umodifisert utsagn: «Verbale seiemåtar gjev betre språk.» Vi aner med én gang at avledede substantiver – verbalsubstantiver – er en uting, en slags forurensning av språket, og de mer tenksomme blant leserne kan komme til å lure på hvorfor språk i det hele tatt har kommet til å holde seg med slikt. Det sier teksten ingenting om. Eksempelet bekrefter denne følelsen: «Potetene vart gjorde til gjenstand for langvarig koking». Her er vi på et hverdagslig kjøkken med konkrete, kanskje til og med uskrellede, poteter og skal lage middag, og så begynner noen å uttrykke seg på den måten. De har åpenbart tilbragt for mye tid bak et skrivebord – dette lyder jo parodisk.

Parodisk er vel akkurat hva det er, for det er vanskelig å tro at dette kan være et autentisk eksempel (medmindre utsagnet var spøkefullt ment). Vi skal forfølge to spørsmål i denne forbindelse, med utgangspunkt i materialet i NorGramBank: Hvor utbredt er egentlig dette fenomenet, og i den grad det forekommer, i hvilken grad er det et problem?

Akkurat uttrykket gjøre til gjenstand for er svært sjeldent i dette materialet på ca. 70 mill. ord avistekst, populærvitenskap, stortingsforhandlinger, barnebøker og romaner. Vi finner 11  eksempler:

  1. Etablerte sannheter og/eller normer blir trukket frem og gjort til gjenstand for fornyet diskusjon. (forskning.no)
  2. – Artene bør settes på en offentlig «svarteliste» og gjøres til gjenstand for langsiktige informasjonstiltak gjennom ulike medier, står det i rapporten. (forskning.no)
  3. Det viste seg vanskelig å gjøre kulturen til gjenstand for vanlig myndighetskontroll, og det var også en utfordring å finne ut akkurat hva man skulle legge i begrepet. (forskning.no)
  4. Vi ønsker å gjøre en undersøkelse som i utgangspunktet er gjort til gjenstand for eksterne kritiske vurderinger både i faglig og ikke minst i etisk og rettslig forstand. (forskning.no)
  5. For å finne ut mer om et sosialt sjikt som i liten grad er gjort til gjenstand for forskning, har 113 høyt utdannede personer i det som tilsvarer det tyske Bildungsbürgertum eller den anglosaksiske upper-middel class blitt intervjuet. (forskning.no)
  6. Påståtte grove brudd på folkeretten bør kunne gjøres til gjenstand for en uavhengig gransking, om mulig for en domstol.  (Stortingsforhandlinger)
  7. Jeg mener at gasskraftverkene også skal gjøres til gjenstand for karbonprising, ikke i form av avgifter, men i form av karbonkvoter eller klimakvoter.  (Stortingsforhandlinger)
  8. Fremskrittspartiet mener at statens tildelingspolitikk, også gjennom Norsk kulturråd, bør gjøres til gjenstand for en kritisk gjennomgang, og at en ny politisk kurs kan være nødvendig.  (Stortingsforhandlinger)
  9. Hvordan reagerte du på å bli gjort til gjenstand for en slik tilnærming?
    (Vinduet)
  10. Med det oppvurderer en film, TV og popmusikk, som tidligere ble oversett av forskere, eller i hvert fall ikke gjort til gjenstand for vitenskapelige studier. (Upublisert sakprosa)
  11. Den underforståtte delen av kulturen som ikke tematiseres eller gjøres til gjenstand for debatt. (Sakprosa, bok)

I noen av disse ville en verbal erstatning antagelig være en forbedring:

1: gjort til gjenstand for fornyet diskusjon -> diskutert på nytt.
4: gjort til gjenstand for eksterne kritiske vurderinger -> vurdert kritisk av eksterne (vurderere).
8:  gjøres til gjenstand for en kritisk gjennomgang -> gjennomgås kritisk.
10: gjort til gjenstand for vitenskapelige studier -> studert vitenskapelig.
11: gjøres til gjenstand for debatt -> debatteres.

I 9 gir uttrykket så lite informasjon at man kunne vurdere erstatningen bli gjort til gjenstand for en slik tilnærming -> bli utsatt for dette.

Ved andre eksempler er det ikke fullt så enkelt. I 3 er det litt vanskeligere å se for seg en erstatning av kontroll med verbet kontrollere, men eksempelet kunne forsåvidt omskrives til Det viste seg vanskelig å oppnå at myndighetene kunne kontrollere kulturen på vanlig måte – om det skulle ansees som en forbedring (som er tvilsomt).

Hvorfor har språket så slike avledningsmuligheter? Å avlede et substantiv av et verb (kontrollere -> kontroll, undersøke -> undersøkelse, vurdere -> vurdering) innebærer å anskue verbalhandlingen som en abstrakt gjenstand. Det kan det være gode grunner til å gjøre. Med substantivets syntaktiske muligheter kan verbalhandlingen nå refereres til i ubestemt eller bestemt form avhengig av om den er kjent eller ikke (Kartleggingen danner grunnlag for valg av behandling), det kan lett skilles mellom ett og flere tilfeller av handlingen gjennom tallbøyning av substantivet (Den nye undersøkelsen avviser at tidevannsmålingene er for høye), og verbalhandlingen kan beskrives nærmere med adjektiver (Allianser bygger på strategiske vurderinger) og med sammensetningsledd som tilføyes og for eksempel uttrykker agens eller patiens for verbalhandlingen (myndighetskontrollhelsesatsing).

Men ingen ville vel betrakte noen av disse siste eksemplene som symptomer på substantivsjuke. Den diagnosen dukker opp først når nominaliseringen – det avledede substantivet – opptrer som objekt (eller mer generelt: argument 2) for et ‘innholdstomt’ verb, slik Språkrådet også sier i sitatet ovenfor. I det følgende skal vi se nærmere på slike kombinasjoner av et mer eller mindre ‘innholdstomt’ verb med nominaliseringer i NorGramBank, og forsøke å danne oss et bilde av hvor ofte en erstatning med et verbalt uttrykk er tilrådelig.

Metode for avgrensning av materialet

En oversikt over deltrebankene i NorGramBank finnes her. Fra dette materialet skal vi samle et inventar av kandidater for ‘substantivsjuke’, nærmere bestemt eksempler der et verbalavledet substantiv, f.eks. undersøkelse, er knyttet som ‘argument 2’ til et ‘innholdstomt’ verb, f.eks. utføre. Når vi sier ‘argument 2’, er det fordi vi ikke vil begrense oss til tilfeller der det står som objekt (Politiet utførte en undersøkelse av saken), men også få med tilfeller der substantivet er subjekt for en passiv versjon av verbet (En undersøkelse av saken utføres av politiet), og tilfeller der verbet står som adjektivisk partisipp til substantivet (En utført undersøkelse av saken). I alle disse tilfellene er undersøkelse semantisk argument 2 eller ‘patiens’ til predikatet utføre.

Den interesserte leser kan finne en kort beskrivelse av hvordan dette er analysert i NorGramBank, og hvordan man kan søke etter denne og andre slike konstruksjoner, her. På den siden beskrives også kort hvordan det materialet vi skal se nærmere på, er avgrenset på grunnlag av søk etter hyppige kombinasjoner i NorGramBank. Resultatet av denne søkbaserte avgrensningen er disse listene av uttrykk:

24 sentrale ‘innholdstomme’ verb og verbaluttrykk:

begynne med, drive, drive med, forestå, foreta, fullføre, få i gang, gjennomføre, gjøre, gå i gang med, holde på med, igangsette, innlede, iverksette, komme i gang med, planlegge, påbegynne, sette i gang, sette i gang med, sette i verk, starte, starte med, ta fatt på, utføre

De 38 vanligste verbalsubstantivene etter slike verb:

avvikling, behandling, bygging, endring, etterforsking/etterforskning, evaluering, fordeling, forvaltning, gjennomføring, gransk(n)ing, innføring, justering, kartlegging/kartlegning, kvalitetssikring, modernisering, måling, nedtrapping, omlegging/omlegning, omorganisering, omstilling, oppfølging, oppgradering, opptrapping, overvåk(n)ing, planlegging/planlegning, produksjon, registrering, revisjon, sats(n)ing, styrkelse/styrking, tilpasning, undersøkelse, utbygging, utredning, utvidelse/utviding, utvikling, vurdering, øk(n)ing

I det følgende skal vi se nærmere på hvor dominerende kombinasjoner av disse verbene med disse verbalsubstantivene er i tekstene, og i hvilke tilfeller det kan være aktuelt å vurdere en mer verbal uttrykksmåte.

Verbalsubstantiver i tekstene: Når er de sykdomssymptomer?

I første omgang ser vi på bokmålsdelen av NorGramBank samlet, og skal deretter skille mellom teksttypene.

Følgende tabell viser hvor hyppige de 38 verbalsubstantivene er sammenlignet med de verbene de er avledet av. Første kolonne viser grunnverblemmaet, annen kolonne viser antall forekomster av verbet, alle bøyningsformer, tredje kolonne viser verbalsubstantivlemmaet, og fjerde kolonne antall forekomster av verbalsubstantivet, alle bøyningsformer, og uavhengig av funksjon i setningen.

V Antall V N Antall N
avvikle 985 avvikling 308
behandle 9116 behandling 15128
bygge 11165 bygging 1807
endre 6753 endring 12177
etterforske 419 etterforsk(n)ing 1065
evaluere 986 evaluering 2327
fordele 1855 fordeling 2072
forvalte 1764 forvaltning 5267
gjennomføre 9943 gjennomføring 1676
granske 1634 gransk(n)ing 406
innføre 6075 innføring 1395
justere 772 justering 602
kartlegge 1766 kartlegging/legning 1404
kvalitetssikre 265 kvalitetssikring 516
modernisere 405 modernisering 620
måle 3952 måling 1838
nedtrappe/trappe*ned 187 nedtrapping 116
omlegge/legge*om 532 omlegging/legning 1019
omorganisere 92 omorganisering 368
omstille 100 omstilling 1738
oppfølge/følge*opp 6299 oppfølging 4747
oppgradere 200 oppgradering 353
opptrappe/trappe*opp 344 opptrapping 615
overvåke 807 overvåkning 1371
planlegge 4380 planlegging/legning 1895
produsere 4090 produksjon 5772
registrere 6793 registrering 612
revidere 1338 revisjon 824
satse 1445 sats(n)ing 7799
styrke 15532 styrkelse/ing 1254
tilpasse 2613 tilpasning 1113
undersøke 5672 undersøkelse 8225
utbygge 295 utbygging 3593
utrede 1399 utredning 2653
utvide 2642 utvidelse/ing 807
utvikle 9460 utvikling 19793
vurdere 9825 vurdering 6884
øke 32328 økning 4936

Tabellen viser stor variasjon fra verb til verb i hvor ofte nominaliseringen forekommer sammenlignet med grunnverbet. Grafen nedenfor viser nominaliseringene rangert fra de sjeldneste til de hyppigste sammenlignet med grunnverbene. De blå linjene viser ikke absolutt antall, men prosent verbalsubstantiv av de samlede forekomstene av vedkommende grunnverb og verbalsubstantiv:
 Vi ser at verb som styrke, registrere, øke, bygge og gjennomføre opptrer langt oftere enn sine nominaliseringer, mens omstille, utbygge, og satse er svært sjeldne sammenlignet med sine nominaliseringer.

Det ville være ille hvis disse tallene kunne anskues som en dokumentasjon av substantivsjuke, men det kan de heldigvis ikke. Ved de aller fleste eksemplene på nominaliseringer er ikke bruk av grunnverbet noe mulig alternativ. Nominaliseringene brukes som subjekter, som objekter for preposisjoner eller for verb som ikke kan kalles ‘innholdstomme’, og på andre måter der problemstillingen ikke oppstår. Her er et utvalg eksempler:

Den kraftige økningen i antall offentlige studieplasser er naturligvis også et ledd i myndighetenes sysselsettingspolitikk.
Ved Telemark Distriktshøgskole var utviklingen tilsvarende.
Oppgraderingen har gått så sent at SINTEF Energiforskning har sammenliknet driften av nettet som å vandre langs kanten av et stup.
«Unnskyld,» sa jeg, «men er hele undersøkelsen ferdig alt?»
Så lenge behandlingen pågikk, holdt han seg hjemme fra skolen.
Det betyr ikke at gjennomføringen av ingeniørutdanningene ikke kan bli mye bedre
Vi ser resultatene av en ganske naturlig utvikling som ethvert menneske går gjennom i denne fasen av livet.
Livet skal seire gjennom en behandling som tapper meg for enhver kraft.
Kunne du finne journalen hennes og få henne inn til undersøkelse?
Men nedtrapping på sprit ble gjerne til opptrapping.
Til tross for store økninger gjennom de siste fire-fem årene har folkekulturområdet blitt liggende litt etter.
Hun har sammenlignet utviklingen i Norge og Finland etter 1990, og rapporten hennes vekker oppsikt.
Når det gjaldt vurderingen av skyldspørsmålet for den anklagde, var det litt forskjell på det voldelige og det ikke-voldelige overgrepet.
Bare ett mislykket forsøk nå kan komme til å ødelegge hele behandlingen.
Klokken fire kom en søster og sa at det likevel ikke ble noen undersøkelse.
Vi har foreløpig få løsninger, men det er ingen tvil om at framtida vil innebære store omlegginger.
Høyres innvending mot budsjettet er ikke at det er økninger.

Faren for substantivsjuke oppstår først når nominaliseringene opptrer som argument 2 (altså som objekt for aktiv eller subjekt for passiv) til ett av de ‘innholdstomme verbene’ omtalt ovenfor. Men det blir ikke alltid sykdom av det da heller – som vi ser av slike eksempler som dette:

De gjennomfører behandlinger den etablerte legestanden kritiserer og kaller eksperimentelle.
Det handler om en garanti for straffrihet, sier han, og viser til at bare en tredjedel av nederlenderne som ber om eutanasi, blir innvilget hjelp etter at legene har gjort sine vurderinger.
Anders Behring Breivik sier han gjorde grundige undersøkelser for å finne ut om det faktisk var mulig å lage en bombe basert på kunstgjødsel.
Undersøkelsen er gjennomført av Statens Arbeidsmiljøinstitutt i samarbeid med Kreftregisteret og St. Olavs Hospital.
– En slik oppfølging har ikke vært gjort før i Norge, og er unikt også i internasjonal sammenheng, sier Hjemdal.
Trolig skyldes dette i stor grad kunnskapsmangel, noe som har medført at det ikke har vært mulig å gjøre rødlistevurderinger for mange av de artene det er få registreringer av.»
Vindkraftbransjen selv krever også et støttenivå på over 20 øre/KWh for å sette i gang nyutbygginger.
– Det er ikke så lett å drive undersøkelser her i byhallen.
– Jeg har ikke bedt om det, la han til, – det er ingen etterforskning å gjøre her som vi ikke kan gjøre selv.
han dem rundt i huset, så de kunne foreta sine undersøkelser.
Han mente så at vi burde komme ganske raskt inn for å starte behandling med AZT.
Sofie og jeg har i løpet av de siste ukene gjennomført en større filosofisk undersøkelse.
«En mann som heter Leroy Bushnell driver produksjonen, og det er flere andre som holder på rundt Fromberg og Blue Creek.
Selvsagt ble det hørt av naboene, men hva er mer naturlig enn at en ung mann gjør visse endringer i en leilighet når hans mor nettopp har gått bort?
Men siden vi som regel må slippe arrestanten løs igjen, foretar vi bestandig en vurdering først.
Hjemme igjen hadde han startet moderniseringer.
Er det da primært for valgkampformål at hele denne utredningen er iverksatt?
Rødt går til Økokrim fordi partiet ikke stoler på at Stortinget selv kan gjøre en troverdig og ansvarlig gransking.
Vi foretar inspeksjoner og revisjoner og kan ta stikkprøver, men til syvende og sist er det leverandørene og de som selger kosttilskudd som har ansvaret for at produktene er trygge og dokumentasjonen i orden, understreker Sommer.

Det er ikke uten videre enkelt å erstatte verbalsubstantivene i disse eksemplene med verb, ettersom de aktuelle verbene er transitive, og det ikke foreligger noen informasjon om objektene her. Vi kan f.eks. ikke erstatte de gjennomfører behandlinger i det første eksempelet med de behandler, ettersom det ikke står noe om hva eller hvem de behandler (ettersom det er irrelevant her), og det ville dessuten være vanskelig å få uttrykt innholdet i den etterfølgende relativsetningen. Tilsvarende gjelder for de etterfølgende eksemplene, selv om noen riktignok kunne ha brukt en intransitiv versjon av verbet, f.eks. Hjemme igjen hadde han begynt å modernisere.

For å finne klare eksempler på substantivsjuke må vi derfor antagelig begrense tilfellene ytterligere, og da først og fremst til slike som har en preposisjonsfrase med preposisjonen av etter verbalsubstantivet: En setning som Han gjennomfører behandling av pasienter er en kandidat for å bli erstattet med Han behandler pasienter, for der fremskaffer av-frasen et objekt til verbet. Da begrenser vi oss altså til eksempler som disse:

– Normalt tror jeg ikke det, man foretar vurdering av situasjonen og går til de aktuelle instansene for hjelp.
Nylig sendte han en begjæring til Den rettmedisinske kommisjon om at den skulle gjøre en vurdering av Jon Leikvams sakkyndige uttalelse i 1958.
Det tok seks uker før det lokale politiet etter massivt press startet etterforskning av drapet.
Familier med ett barn i barnehage og to høye inntekter fikk den største gevinsten etter at man startet innføringen av makspris.
Det er naturlig at idrettspresidenten igangsetter ekstern gransking av disse forholdene.
NTNU vil nå gjøre en ytterligere kartlegging av arbeidsmiljøforholdene, særlig i den mest kritiske perioden fra 1985 til 1989.
– I 1983 ble ungdommer som var 11, 13 og 15 år gamle undersøkt, og deretter ble det gjort tilsvarende undersøkelser av ungdommer med samme alder hvert tredje eller fjerde år.
De fleste nødvendige justeringer av kursen var foretatt, og hastigheten var økt.
Du gjør hverken deg selv eller kundene dine noen tjeneste ved å unnlate å foreta en personlig undersøkelse av områdene hvor motivene er hentet.
Gabe Lavery og hans bror Bob har drevet produksjon av hjemmebrent i huset til Trent, og de ville vite om Trent ville ha tilbake huset sitt.
– Jeg skal foreta en rutinemessig undersøkelse av fiskebrukets fryselagre, hvis det er det De sikter til? sa Moen rolig.
Jeg vet ikke hvordan jeg skal begynne dette, men jeg synes dere gjør en urettferdig behandling av meg.
Han likte å gå der ofte, se hvordan flekkene av snø skrumpet inn og starte planleggingen av hva han skulle plante denne våren.
Som representanten Klungland er vel kjent med, startet man behandlingen av denne saken på onsdag.
Jeg må si at jeg føler at vi sett fra vårt synspunkt slett ikke fikk gjort en forsvarlig behandling av dette.
I et møte i begynnelsen av september i Bergen ble hun informert om en rekke tiltak som selskapet hadde på trappene, og som de nå har startet gjennomføringen av.
Riksrevisjonen påpeker derfor igjen at toll- og avgiftsetaten fortsatt foretar manuell registrering av innsendte avgiftsoppgaver i avgiftsfastsettelsessystemet, AFS.
Det viser jo at vi har foretatt en svært grundig og seriøs behandling av opplegget til Fotballforbundet.
Det er et sterkt økende antall veiprosjekter i Norge som er finansiert gjennom at bompengeselskaper har lånt penger i markedet, for deretter å gjennomføre utbygging av veiprosjekter.
Siden perioden for denne opptrappingsplanen ennå ikke er løpt ut, og man følgelig ikke kan foreta en endelig evaluering av virkningene av tiltakene i planen, bør saken holdes åpen.
Venstre mener nå er tidspunktet kommet for å foreta en evaluering av regelens første ti år.
Fremskrittspartiet mener at det nå er på sin plass å gjennomføre en nedtrapping av avgiftene på bensin og diesel.
Kontroll- og konstitusjonskomiteen kan imidlertid igangsette en hvilken som helst undersøkelse av forvaltningen, også underveis i gjennomføringen av offentlige prosjekter.

Her er det flere kandidater for erstatning med verb, f.eks. i de første eksemplene:  man vurderer situasjonen, den skulle vurdere Jon Leikvams sakkyndige uttalelse, det lokale politiet  begynte å etterforske drapetosv. Men noen ganger blir det ulike nyanser. At «idrettspresidenten igangsetter ekstern granskning av disse forholdene» betyr ikke det samme som at han gransker disse forholdene eksternt – å igangsette en granskning innebærer ikke nødvendigvis at man selv er agens for granskningen. I andre tilfeller har verbalsubstantivet modifikatorer som hører substantiver til, og som det ikke vil være lett å gjengi innholdet i hvis man erstatter med verb – f.eks. uttrykket hvilken som helst i eksempelet «Kontroll- og konstitusjonskomiteen kan imidlertid igangsette en hvilken som helst undersøkelse av forvaltningen».

Hvis vi nå altså begrenser tilfellene til verbalsubstantiver som opptrer som argument 2 til ‘innholdstomme’ verb, og videre til slike som dessuten har en av-frase etter seg, blir tallforholdene annerledes. I skjemaet nedenfor gjentas den totale frekvensen for verbalsubstantivene i annen kolonne. I tredje kolonne står det antallet av disse som opptrer som argument 2 til et ‘innholdstomt’ verb, og i fjerde kolonne antallet av dem som dessuten er etterfulgt av en av-frase:

N Totalt antall Antall ARG2 Antall ARG2 + av
avvikling 308 4 4
behandling 15128 273 46
bygging 1807 103 47
endring 12177 1027 24
etterforsk(n)ing 1065 101 16
evaluering 2327 228 90
fordeling 2072 22 7
forvaltning 5267 46 10
gjennomføring 1676 17 14
gransk(n)ing 406 42 12
innføring 1395 10 8
justering 602 94 10
kartlegging/-legning 1404 158 67
kvalitetssikring 516 39 10
modernisering 620 27 15
måling 1838 225 38
nedtrapping 116 6 6
omlegging/-legning 1019 54 15
omorganisering 368 25 6
omstilling 1738 121 8
oppfølging 4747 31 15
oppgradering 353 26 16
opptrapping 615 23 4
overvåkning 1371 40 14
planlegging/-legning 1895 62 19
produksjon 5772 86 22
registrering 612 38 14
revisjon 824 55 18
sats(n)ing 7799 122 5
styrkelse/ing 1254 15 9
tilpasning 1113 55 5
undersøkelse 8225 842 106
utbygging 3593 89 32
utredning 2653 191 37
utvidelse/ing 807 25 10
utvikling 19793 109 20
vurdering 6884 773 223
økning 4936 30 5

Nedenfor vises disse tallforholdene grafisk. Som i grafen ovenfor viser de blå linjene hvilken prosentandel som samtlige forekomster av et verbalsubstantiv utgjør av av det totale antallet grunnverb + verbalsubstantiv. De røde linjene viser hvilken andel av disse som står som argument 2 til et ‘innholdstomt’ verb, og de grå linjene hvilken andel av disse igjen som dertil har en av-frase og dermed er de sentrale kandidatene for diagnosen ‘substantivsjuke’. Det er viktig å huske at lengden på linjene viser prosentandel av de totale forekomstene av det enkelte verb + verbalsubstantiv, og ikke absolutte antall. Således representerer den grå linjen ved oppgradering nedenfor 16 forekomster, mens den mye kortere grå linjen ved det langt mer frekvente ordet undersøkelse representerer 106 forekomster.

Substantivsjuke er altså å finne innenfor de grå linjene, og kanskje i litt av de røde fortsettelsene. Grafen etterlater ikke et inntrykk av at vi står overfor en epidemi.

Substantivsjuke later til å være et marginalt fenomen i tekstuniverset i bokmål, men det kan være av interesse å sammenligne situasjonen i ulike teksttyper.

Rammede teksttyper

Forekomstene av den virulente konstruksjonen med verbalsubstantiv som argument 2 til et ‘innholdstomt’ verb pluss av-frase er ujevnt fordelt mellom teksttypene. Oversikten over deltrebankene i NorGramBank og hva slags teksttyper de representerer, finnes på en egen side her. Tabellen nedenfor viser hvilke deltrebanker som har den omtalte konstruksjonen. Annen kolonne viser antallet forekomster av konstruksjonen i hver deltrebank, og tredje kolonne viser hvor mange ganger fenomenet da gjennomsnittlig opptrer pr. 10 000 setninger.

Trebank Antall ARG2 +av Antall/10000 setn.
nor-stortinget 168 9,35
nor-stortinget_2 152 7,96
nor-stortinget_1 152 7,39
nor-stortinget_3 145 7,11
nor-stortinget_4 99 6,31
nob-fn 229 5,47
nob-ndt-lfg 5 2,81
nob-lbk-sa 41 2,52
nob-avis 24 1,07
nob-novel_5 4 0,09
nob-novel_3 2 0,04
nob-novel_2 2 0,04
nob-novel 1 0,04
nob-child 1 0,03
nob-novel_1 1 0,03

Det fremgår av tabellen at man ikke behøver å lese stort mer enn 1300 setninger av stortingsforhandlingene før man kommer over et tilfelle av mulig substantivsjuke. I den populærvitenskapelige forskning.no (nob-fn) må man lese 1800 setninger, mens annen sakprosa (nob-ndt-lfg, nob-lbk-sa) krever tålmodighet i oppimot 4000 setninger. Av skjønnlitteratur (når vi inkluderer nob-novel_4, som ikke hadde noen eksempler) må man utholde ca. 250 000 setninger før man kan gjøre seg håp om å oppleve fenomenet. Det samlede skjønnlitterære antall i dette materialet, 11, er ikke høyere enn at vi kan tillate oss å sitere alle:

De fleste nødvendige justeringer av kursen var foretatt, og hastigheten var økt.
Du gjør hverken deg selv eller kundene dine noen tjeneste ved å unnlate å foreta en personlig undersøkelse av områdene hvor motivene er hentet.
Ja, han fortsatte under hele eksiltiden, gjorde bare små justeringer av programmet etter hvert.
Et titalls cellulosefabrikker hadde drevet produksjon av råmaterialer til papirindustrien med dette vassdraget som hovedvei.
Gabe Lavery og hans bror Bob har drevet produksjon av hjemmebrent i huset til Trent, og de ville vite om Trent ville ha tilbake huset sitt.
– Jeg skal foreta en rutinemessig undersøkelse av fiskebrukets fryselagre, hvis det er det De sikter til? sa Moen rolig.
Jeg vet ikke hvordan jeg skal begynne dette, men jeg synes dere gjør en urettferdig behandling av meg.
Senere hadde de startet produksjon av kopra..
Jonas tar seg i å foreta vurderinger av gode og dårlige gravsteder langs veien mens han kjører.
Donald gikk ut av bilen og utførte en rask undersøkelse av Hall Bros.
Han likte å gå der ofte, se hvordan flekkene av snø skrumpet inn og starte planleggingen av hva han skulle plante denne våren.

Som konklusjon ser det ut til at vi kan friskmelde bokmål som helhet. Det er ikke en substantivsjuk målform, selv om det finnes områder i tekstuniverset som bør holdes under avslappet oppsikt.

Brukes passiv?

Innledning

Blant de mange unyanserte råd som gis til norske skoleelever, studenter og andre som skal skrive, er at de ikke bør bruke passiv. Eksemplene som listes opp til skrekk og advarsel, utstyres gjerne med noen ekstra papirknitrende ord i tillegg til selve passiven, så poenget skal bli riktig tydelig. Et par eksempler:

(1)
«Skrivetips: unngå passiv. Passivformen er farlig i dokumentasjon fordi den ikke sier hvem som gjør hva: Ikke skriv: Skifting av toner utføres etter 2000 sider . Skriv heller: Du må skifte toner etter 2000 sider.»

(2)
«Unngå passiv – ta ansvar i teksten. En aktiv setning gjør språket ditt klarere, og du unngår å bli misforstått. For at leseren din skal kunne handle riktig, må du få tydelig fram i teksten hvem som skal gjøre hva. Ikke skriv: Jeg kontaktes på telefon eller e-post med forslag til møtetidspunkter. Men slik: Du kan ringe meg eller sende en e-post med forslag til møtetidspunkter.»

I eksempel (1) ville Toner skiftes etter 2000 sider være den enkle passive versjonen av den anbefalte setningen, men verbet utføres sammen med substantiveringen skifting er egnet til å få leseren til å nikke samtykkende: Dette er tørre greier. Det samme gjelder kontaktes på telefon sammenlignet med ringe meg  i eksempel (2). Men slikt må nok til for å få passivene til å se tilstrekkelig skremmende ut. Forøvrig sies det bare generelt og uten begrunnelse at passiv er farlige greier, og at aktiv gjør språket klarere. Man kan jo undres over at så mange språk overhodet har utviklet dette dysfunksjonelle redskapet når det bare fører til elendighet, og tydeligvis unngås av dem som vil uttrykke seg klart. (Jeg har brukt ikke mindre enn fem passiver hittil i denne teksten, så jeg har åpenbart noe å skjule.)

Råd av denne art er tilnærmet grunnløse. De innebærer at viktige deler av språkets uttrykksforråd settes på en slags indeks, med et fattigere og snevrere språk som et mulig resultat, i den grad rådene følges. Nå er det riktignok ingen tvil om at passiv også kan brukes retorisk til å depresisere et innhold som skriveren ikke vil skal bli altfor avslørende detaljert – noe det kan være interessant å studere og kritisere når det forekommer. Men å la det føre til en generell fraråding av passiv er på linje med å fraråde enhver bruk av hammere fordi de kan brukes til å slå folk i hodet med.

Hva er passiv?

Verb – reparerer, arbeider, gir, antar, bruker, liker – er de sentrale ordene i sine setninger og forteller hva som foregår, gjøres, eller er situasjonen. Verbene forutsetter et større eller mindre antall deltagere i de beskrevne situasjonene, som kan identifiseres ved hjelp av subjekter, objekter og lignende. Den deltageren som identifiseres av subjektet – f.eks. Per i Per reparerer sykkelen eller læreren i Læreren liker Mozart – fremstår typisk som den mest prominente deltageren i situasjonen, den som setningen først og fremst handler om.

Passiv gjør det mulig for andre deltagere å være prominente.

Dette skjer ved at man gir verbet en passiv markering – på bokmål f.eks. med en -s eller på nynorsk en -st, eller med hjelpeverbet bli eller være Dette utstyret brukes sjelden, Sykkelen blir reparert på torsdag. Den første setningen handler nå om utstyret, ikke om dem som bruker det, og den andre om sykkelen, ikke om den som reparerer den. Dette skjer ved at passiv gjør det mulig for dette utstyret og sykkelen  å være grammatisk subjekt. Passiv lar oss med andre ord tilpasse setningens form til kommunikasjonens behov der og da. Det som er tema i kommunikasjonssituasjonen, kan gjøres til subjekt. Dette er et redskap vi ønsker å beholde.

Norsk (og til dels skandinavisk forøvrig) skiller seg ut fra mange av våre nabospråk ved å ha en særlig rik flora av passivtyper, noe som gir språket en spesiell fleksibilitet (og noe som gjør det særlig destruktivt med generelle frarådinger av passiv, istedenfor instruksjon i bruk). En konsekvens av disse mulighetene er at den talende ikke behøver å ha planlagt sin setning helt til ende før han eller hun begynner å snakke. Vi kan, enkelt sagt, bare begynne med å benevne den personen eller tingen vi vil si noe om, og så stole på at språkets passivmuligheter lar oss formulere en velformet setning deretter, nesten uansett hvilken rolle den vi snakker om, spiller i situasjonen. For det er ikke bare direkte objekter vi kan gjøre til subjekter i norske passivsetninger. To eksempler fra en nett-diskusjon:

Få personer ville ropt og klaget om man ikke ble holdt oppe døren for.
Å holde dører oppe for folk eller å bli holdt døren åpen for skaper begge store problemer

I første eksempel er få personer tema, og så skal man snakke om en situasjon der noen ikke holder døren åpen for disse få personene. Med passiv kan vi da hente dette subjektet helt nede fra objektet for preposisjonen for, og slik la temaet bli subjekt. I annet eksempel er det tale om to roller man kan ha, koordinert med eller, der det er passiven som gjør en slik koordinasjon mellom to å-infinitiver mulig, når de to rollene det er tale om, er så ulikt plassert i situasjonen. Eksemplene illustrerer den fleksibiliteten passiv gir.

Norsk tillater også passiv av intransitive verb – verb som ikke tar objekt, som arbeide, sove, leke, snakke. Det kan skje som nettopp vist ved at et preposisjonsobjekt blir subjekt:

På det tomme barnerommet, der lekene ikke blir lekt med og sengen ikke lenger blir sovet i(avistekst)
Studentene øver seg på å se hvordan menneskerettigheter kan argumenteres for i ulike situasjoner i ulike land. (sakprosa)
Selv om anlegget er enormt, er det universets minste byggesteiner – partiklene – som skal eksperimenteres med, slik at de forhåpentligvis avslører noen av sine hemmeligheter. (sakprosa)

Eller det kan skje ved at subjektet er et tomt det, når selve handlingen er tema og identiteten til de handlende er irrelevant:

Det snakkes på bygda. (romantekst)
Derfor arbeides det for å forbedre produksjonen. (sakprosa)
Men det ble arbeidet intenst med saken. (romantekst)

Nok en passivtype er den ‘komplekse’ passiven, der en serie av innordnede verbalhandlinger pakkes sammen under et felles subjekt:

De fleste er antatt dokumentert tatt av kongeørn. (stortingsforhandlinger)

Utgangspunktet er at noen antar at noen andre har dokumentert at kongeørn har tatt de fleste. Alle tre verb settes i passiv partisippform, og frasen de fleste, semantisk sett deltager bare i ta-situasjonen, blir felles subjekt for dem alle. Dette er økonomisk og kompakt uttrykt, velegnet for overskrifter, for eksempel, men det illustrerer også en lite muntlig passivtype som ikke er typisk for en ledig stil.

Også passive partisipper som brukes adjektivisk, er eksempler på passivformer av verb, selv om de ikke inngår i noe verbal og derfor ikke danner passive setninger:

Det ambisiøse målet i planperioden er å halvere antallet drepte og skadde i vegtrafikken. (stortingsforhandlinger.)
Derfor fremmer regjeringen forslag om en reform for redusert byråkrati og økt effektivitet i staten. (stortingsforhandlinger.)

Passiv i tekstene

Trebanken NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Når vi skal undersøke hvordan passiv fordeler seg på de ulike teksttypene, finnes det flere måter å telle på. Her skal vi gjøre et lite utvalg, og begynner med å se på hvor mange prosent av setningene i en tekst som inneholder minst én passiv verbform av en eller annen type. Hvis vi rangerer deltrebankene etter denne prosenten, kan det være interessant å sammenholde resultatet med det målet på syntaktisk kompleksitet som er diskutert i et annet blogginnlegg her (Setningskompleksitet: et mål på lesbarhet?), basert på antall leddsetninger og grad av underordning av leddsetningene i gjennomsnittlige helsetninger. Tabellen nedenfor viser i hvilken grad slik syntaktisk kompleksitet er korrelert med passivbruk i deltrebankene:

Deltrebankene rangert etter passivbruk

Deltrebank % setn. med passiv kompleksitet
1. nob-fn 23 82
2. nor-stortinget_1 20 112
3. nor-stortinget_2 20 113
4. nor-stortinget 19 107
5. nor-stortinget_3 19 110
6. nor-stortinget_4 18 97
7. nob-lbk-sa 17 67
8. nob-ndt-lfg 16 60
9. nob-lbk-av 15 55
10. nno-nnk-sa 14 55
11. nob-avis 12 59
12. nno-nnk-av 12 58
13. nob-novel_5 6 44
14. nob-novel_4 6 47
15. nob-novel_2 6 48
16. nob-novel 5 46
17. nob-novel_1 5 44
18. nob-novel_3 5 46
19. nob-child 5 42
20. nno-novel 4 41
21. nob-lbk-tv 4 26
22. nno-child 3 37

Tabellen viser at tekster av samme art danner klynger med tilnærmet samme verdi i rangeringsordenen for passivbruk, f.eks. stortingsforhandlingene (nor-stortinget, 2 – 6) én klynge og bokmålsromanene (nob-novel, 13 – 18) en annen. Det bestyrker inntrykket av ensartethet innenfor disse teksttypene. Grafen nedenfor viser korrespondansen mellom de to variablene passiv og kompleksitet, der blått er prosentdel setninger med passiv og orange syntaktisk kompleksitet (to forskjellige mål, så det er bare kurvenes form som er relevant for sammenligningen):

De samme klyngene som ble nevnt ovenfor – stortingsforhandlinger og skjønnlitteratur – finner vi i rangeringen av kompleksitet. Det er særlig én deltrebank der de to variablene ikke korresponderer: nr. 1 nob-fn, det populærvitenskapelige nett-tidsskriftet forskning.no. Den er på topp i frekvens av passiv, men rangerer lavere enn stortingsforhandlingene i syntaktisk kompleksitet. Det er nærliggende å tenke at temaet vitenskap, med stor vekt på å fremstille hendelser og prosesser uten aktive handlere, motiverer bruk av passiv, mens det populærvitenskapelige formålet motiverer lavere syntaktisk kompleksitet. Stortingsdebattantene (2 – 6) behøver i mindre grad å ta slike formidlingshensyn.

Det er hovedsakelig i stortingsforhandlingene at vi kan finne setninger som denne, som skårer høyt etter kompleksitetsmålet:

Det flertallet i den norske befolkningen som ser problemer med at Norge vedtar mye politikk som den norske befolkningen ikke ønsker, fordi mange partier, i motsetning til de rød-grønne, ikke tør å bruke reservasjonsretten selv når det er veldig viktig, er problemstillinger som Høyre bør tenke over.

Noen eksempler på  passivbruk i nr. 1 nob-fn – forskning.no:

Alle ble målt og veid, ulike prøver ble tatt og noen ble utstyrt med måleinstrumenter av forskjellig slag.
Forskerne mener at giften Akrylamid dannes når mat friteres, stekes eller grilles, og de tror stivelsen omdannes til akrylamid når karbohydratene i maten varmes opp.
– Dersom det da skulle bli oppdaget noe som gjør at fisken ikke kan selges og må destrueres, kan skaden begrenses til akkurat den fisken det gjelder.
De fleste stedene som er rammet av sykdommen anbefales det imidlertid at mennesker som har vært utsatt for SARS holdes i karantene i bare ti dager.
Størstedelen av avfallet må bli konsumert under operasjonen, og mesteparten av energien som produseresgjenvinnes og brukes.
Behandling som utøves i helsetjenesten eller av autorisert helsepersonell, omfattes likevel av begrepet alternativ behandling når det brukes metoder som i all vesentlighet anvendes utenfor helsetjenesten.
Alternativ medisin blir ofte definert opp mot skolemedisinen, som den medisin som er akseptert og autorisert av myndighetene og som undervises på våre universiteter..
– Grunnen er at alle ulvene som blir overkjørt og drept vil bli funnet og rapportert inn til myndighetene, sier Linder Olsen.

Også den nynorske sakprosaen bruker passiv, om enn i mindre omfang. Her er noen eksempler fra nr. 10 nno-nnk-sa (sakprosa fra korpuset til Norsk Ordbok):

Han vart både hylla og heidra og prisa med kritikarpris.
Smaksstandardar skal utviklast og hevast, folket skal utfordrast med kvalitetstilbod i foredrag, kunst og kultur.
Rett før krigen blei det utvikla ein modell som gjekk på akkumulatorbatteri og samtidig blei det laga små vindmøller som kunne brukast til å lade batteria.
Svara må forståast innanfor rammene av dei programtypane som blei ramsa opp (det manglar til dømes nyheitsprogram), og innanfor rammene av kva som faktisk blei sendt:
Fisken måtte fangast, konserverast og førast til ein marknad.
I det første svenske avtaleutkastet heitte det at Noreg vart avstått til Sverige og skulle inkorporerast eller innlemmast i det.
Ein vanleg kuppel av opalglas kastar nokre strålar mot vegg og tak slik at dei blir kasta tilbake derifrå, medan nokre strålar blir kasta direkte mot den staden som skal lysast opp.
Dei blir pressa for pengar, valdtekne og banka opp, og maten deira blir stolen frå dei.

-s/-st-passiv

Den morfologiske passiven på -s (bokmål) og -st (nynorsk) brukes i alle deltrebankene, men det er vanlig å tilskrive den ulik status i de to målformene. -s/-st kan tilføyes både finitte verbformer (presens og preteritum) og infinitivsformer:

Presens:
Maten stekes.
Om kvelden samlast bøndene på nytt til messe.

Preteritum:
Øynene fyltes av tårer.
No tømdest husa om dagen.

Infinitiv:
Hjertet slo så det måtte høres.
I kveld skal han drepast.

I nynorsk er det likevel en formidlet norm at st-passiv bør unngås i finitte former og helst bare brukes i infinitiv, altså helst bare i eksempler som det siste ovenfor. Det kan derfor være av interesse å se om denne normen har synlige utslag i tekstene. Tabellen nedenfor viser hvilken prosent av s-/st-formene i hver deltrebank som er finitt (presens eller preteritum); de resterende er da infinitiv. Det er likevel viktig å vurdere nærmere hvor mange av st-formene som virkelig er passive, og hvor mange som har andre funksjoner som ikke blir utelukket av den nevnte normen.

Prosentandel finitte -s/-st-former av samtlige -s/-st-former

Deltrebank % finitte -s/-st-former
nob-lbk-av 65,3
nob-avis 62,7
nob-fn 61,5
nob-ndt-lfg 60,1
nob-lbk-sa 59,0
nob-lbk-tv 58,1
nob-novel_3 56,0
nor-stortinget_4 53,6
nob-child 53,2
nor-stortinget_2 51,9
nor-stortinget_1 51,6
nor-stortinget_3 51,4
nob-novel_1 51,4
nor-stortinget 51,3
nob-novel_2 48,6
nob-novel_5 48,1
nob-novel 47,3
nob-novel_4 45,0
nno-child 44,8
nno-novel 37,2
nno-nnk-av 16,9
nno-nnk-sa 12,9


Noen av tallene kan være litt for høye på grunn av feilanalyser som ikke er sortert fra her, men de innbyrdes relasjonene mellom trebankene er antagelig riktige. Her samler de nynorske deltrebankene (nno-) seg i bunnen. På topp finner vi aviser og sakprosa på bokmål, og deretter skjønnlitteratur på bokmål og stortingsforhandlinger i en lite differensiert gruppe.

Eksempler på finitte st-former fra de nynorske tekstene viser at mange av dem ikke egentlig er passiver, og derfor ikke rammes av den nevnte normen. Eg minnest er ikke en passiv setning som betyr at noen minner meg, men en konstruksjon som uttrykker en ikke-agentiv tilstand eller overgang. Et utvalg eksempler, der de rimelig tydelige passivene er merket med rødt:

Men like etter hadde han sett seg ned på huk, og det høyrdest ut som han flytta eitkvart frå veska over til boksen.
Eg mintest første gongen eg fekk vita noko om han.
Litt etter litt fyltest plassen framfor bardisken opp, og inn i denne flokken kom Johan Ferdinand.
Ein stad, men ikkje i hotellet, høyrest felemusikk.
Dei som lukkast i å komme seg ut levande, klarar ikkje lenger å halde seg i ro.
Våpna rettast mot den indre fienden, som er den gode fienden.
I menneskas liv kjennest det stundom som om der var tankar bak alt som hende oss.
Kva slags personell er det som trengst for å handtera slike konfliktar?
Rundt om i landet samlast folk i studiesirklar.
Det krevst meir av dei.
Han bråbremsar, og ho høyrer noko som knusest mot fjellet.
Eit lite dyr føddest inne i meg.
Overgangen merkast knapt.
– Vi snakkast kanskje i Italia?
Slike ord kallast stikkord.
Som ville flyktningar kastast me mellom grensene for det me kan tåla.

Av de drøyt 1000 eksemplene fra de nynorske tekstene inneholder over halvparten ett av de seks verbene synest, høyrest, kjennest, snakkast, møtest og trengst. Den nevnte normen setter dermed et rimelig tydelig preg på tekstene.

Passiv hos forfatterne

Vi skal se kort på hvordan passivbruken er fordelt mellom to grupper av forfattere: forfatterne av populærvitenskapelige tekster på forskning.no og forfatterne av bokmålsromaner. Blant de førstnevnte begrenser vi oss til forfattere som er representert med tekster på minst 20 setninger. Da er tallene 913 sakprosaforfattere og 343 skjønnlitterære forfattere.

I sammenligningen av deltrebankene sammenlignet vi prosentandelene av setninger som inneholdt minst én passiv verbform. Ved forfatterne ser vi bort fra adjektiviske partisipper (den fullførte romanen) og konsentrerer oss om verbale passiver, altså -s/-st-passiver og være/bli/vere/verte-passiver – det vil si morfologisk og perifrastisk passiv. For hver forfatter teller vi hvor mange morfologiske eller perifrastiske passiver som i gjennomsnitt opptrer pr. 100 setninger. Resultatet fremgår av grafen nedenfor, med én kurve for hver av de to forfattergruppene, der hver gruppe er ordnet langs x-aksen fra forfattere med mange til forfattere med få passiver.

Antall passiver pr. 100 setninger hos sakprosaforfattere og romanforfattere (bokmål)

Variasjonen er betydelig større hos sakprosaforfatterne, der antall morfologiske og perifrastiske passiver pr. 100 setninger går fra 74 til 0, mens romanforfatterne går fra 14 til 1. Vi skal eksemplifisere med tekstutdragfra tre av forfatterne, først Sonja Wilhelmsen (67 pr. 100 setninger):

Kunnskap og erfaring blir ofte oppnådd gjennom stor personlig og arbeidsrelatert risiko.
Imidlertid er kunnskaps- og erfaringsdeling viktig i disse organisasjonene fordi feilaktig eller villedende informasjon kan ha fatale konsekvenser.
Blant annet ses den enkelte yrkesgruppe og organisasjon som bærere av en spesifikk kultur.
Grensene mellom de ulike kulturer og organisasjoner blir identifisert som punkt der sammenbrudd i kommunikasjon og informasjonsdeling kan oppstå.
Disse funnene har ikke vært beskrevet tidligere.
Identifiseringen av disse punktene kan bidra til at misforståelser unngås og at informasjonsflyten samt kunnskaps- og erfaringsoverføringen forbedres i fremtiden.
I tillegg til identifiseringen av sammenbruddspunktene for kommunikasjon og informasjonsdeling har jeg utarbeidet en detaljert modell som viser hvordan innhentet informasjon transformeres gjennom de ulike fasene i etterforskningen.
Modellen er bygd på en klassifisering som tar hensyn til de overordnede spørsmålene i en etterforskning:
Et datamaskinbasert informasjonssystem bygd opp etter denne modellen kan brukes i opplæring av nye etterforskere samt gi støtte for den erfarne etterforskeren, spesielt i kompliserte saker der etterforskningen foregår over lang tid.
Jeg presenterte resultater fra forskningen i et prosjektarbeid der nye elektroniske hjelpemidler for politietterforskning ble vurdert.
Prosjektet var satt i gang av Politidirektoratet.
Selv om forskningen har fokusert på politietterforskning, er resultatene overførbare til andre områder som har et beslutningsgrunnlag bygd opp av ulike informasjonstyper og der informasjonen transformeres gjennom beslutningsprosessen.

Apropos de advarslene mot passiv som ble sitert innledningsvis: Det er vanskelig å se at denne teksten på noen måte lider av uklarhet, at forfatteren unnlater å «ta ansvar», eller at stilen skulle skape andre vanskeligheter. Den illustrerer heller hvordan passiv tillater at tekstens umiddelbare tema gjøres til subjekt hele veien, og hvordan dette skaper en langt smidigere informasjonsformidling enn om man hele tiden skulle ha forstyrret flyten ved å sette inn aktive subjekter.

Det neste utdraget er fra Wenche Bakkebråten Rasen, som har 0 forekomster av passiv – og illustrerer at det selvsagt er fullt mulig å skape en klar tekst også på den måten:

Læreplanen betyr lite for undervisningen
– Det kommer nye læreplaner ofte.
I sitt doktorgradsarbeid har Kleve studert matematikklæreres tolking og bruk av læreplanen L97 i ungdomsskolen.
Kleves forskning tyder på at det er for langt mellom intensjonene i læreplanene og lærernes undervisningspraksis.
Den viktigste faktoren for hvordan undervisningen foregår, avhenger mye av lærerens egne oppfatninger om hva som utgjør en god matematikkundervisning, og slike oppfatninger i møte med klasseromskulturen.
Kleve fant ulike typer føringer som påvirket lærernes tolking og bruk av læreplanen.
– Både foreldre og elever forventer en tradisjonell matematikkundervisning, med regler og øvelser.
Elevene ønsker å få ting vist på tavla, før de selv løser tilsvarende oppgaver.
Lærerne mente at tidsaspektet var viktig.
Hvis elevene skal utforske sammenhenger i matematikk selv, vil det ta lenger tid.
Læreren dominerte klasserommet på samme måte som i en mer tradisjonell undervisning.
Noen lærere hadde heller ingen tro på anbefalingene i L97, og dermed heller ikke noe ønske eller vilje til å implementere planen.
De var ikke interessert i nye undervisningsmåter, fordi de mente at den undervisningspraksisen de hadde gjennomført i mange år fungerte godt.
– Siden jeg startet ved Høgskolen i Oslo i 1994 har vi hatt tre ulike læreplaner:
– I tillegg ser jeg at etterutdanning i større grad bør ta utgangspunkt i lærernes ønsker om å utvikle sin undervisningspraksis.
Initiativet bør komme fra læreren selv. 

Til slutt tar vi med noen eksempler fra Knut Faldbakkens Insektsommer (4 pr. 100 setninger) for å illustrere passiv brukt i skjønnlitterær sammenheng. Siden passivtettheten er forholdsvis lav, er dette isolerte setninger og ikke sammenhengende tekst. Heller ikke her er det lett å finne grunner til advarsler mot passiv:

kanskje det var jeg som var i ferd med å forandres?
Forvirrende, avvikende betydninger kunne bli tolket inn i alt omkring meg, alt som hendte meg.
et kutt i fingeren var lett å hanskes med, andre anfektelser var verre.
Blikket hans som allerede var vendt innover mot egne, mer presserende anliggender.
– Og Jo ble konfirmert i vår?
Mer ble det ikke sagt om Jos konfirmasjon.
Men det var så mye som var endret siden den gang;
Hvis livet ennå dirret i et par av dem, ble seremonien gjentatt.
Etterpå ble J og P høytidelig markert på marmoren til evig tid.
Jeg hadde trodd man gikk med lange bukser når man var konfirmert.
De eldre pikene i klasser over kunne ikke regnes med, de virket storvokste og ganske fryktinngytende de aller fleste.
Film var blitt introdusert i bygda med det nye samfunnshuset.
Han adlød, og i samme øyeblikk ble min elendighet bønnhørt ved at det slo i hoveddøren og det klang stemmer over tunet.
– De vet nok hva de der skal brukes til de middelskolejentene!
Latteren til Jo var høy og skjærende, som før om årene når krefter var blitt prøvd og han så at han vant.
Jeg ville ikke flyttes opp på viderekommende-partiet.

Setningskompleksitet: et mål på lesbarhet?

Innledning

En trebank med utførlige syntaktiske analyser kan gi grunnlag for et mer nyansert mål på setningers kompleksitet enn f.eks. det mye benyttede lix, som bare tar hensyn til ren setnings- og ordlengde (se Wikipedia om lix/liks). Et slikt mer nyansert mål ville da selvsagt forutsette at de tekstene som skal måles, er analysert syntaktisk, men ved hjelp av en komputasjonell grammatikk som NorGram ville det i prinsippet være mulig å lage en trebank av en tekst tilnærmet automatisk, slik det har skjedd med NorGramBank. I dette innlegget vil jeg se nærmere på noe som kan tenkes som en komponent i et slikt mulig mål, og hvordan det slår ut på tekster fra NorGramBank.

Et mål på syntaktisk kompleksitet

En side ved syntaktisk kompleksitet som lix ikke tar hensyn til, er graden av innføying – altså i hvilken grad setningen har en hierarkisk struktur der fraser er innføyet i fraser som igjen er innføyet i fraser, osv. Her kan vi særlig tenke på en rekursiv struktur, som betyr at de omtalte frasene er av samme art – for eksempel leddsetning innføyet i leddsetning innføyet i leddsetning, osv. (Leddsetninger har alltid et finitt verb – et verb i presens eller preteritum – så vi tar ikke infinitivskonstruksjoner i betraktning her.) Blant de mange alternative målene på kompleksitet vi kunne definere, velger vi å prøve ut dette kriteriet. Vi vil da gi en setning en vekt som både tar hensyn til antallet leddsetninger i den, uavhengig av om de er innføyet i hverandre, og dessuten til dybden i en slik eventuell innføying. Vi vil anta at kompleksitetsvekten øker sterkere enn lineært med antallet «etasjer» i et slikt hierarki: Fire etasjer skal være mer enn dobbelt så tungt som to. Kompleksiteten i en tekst blir da setningenes gjennomsnittlige vekt.

I hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet, er et empirisk spørsmål som jeg ikke har undersøkt. Det kan være grunn til å mistenke at det kan bli noe for enkelt å ta denne kompleksiteten alene som et mål på lesbarhet, ettersom måten setninger er innføyet i hverandre på, åpenbart spiller en stor rolle for lesbarheten. En rent høyreforgrenet struktur, der leddsetninger står til slutt i de setningene de er innføyet i og ikke midt i eller nær begynnelsen, behøver ikke å være særlig tunglest i det hele tatt. Men det kan være interessant å utprøve en kombinasjon av slik kompleksitet med andre egenskaper ved setningen; det vil jeg komme tilbake til i senere blogginnlegg.

For å illustrere hvordan vi kan registrere antallet leddsetninger og graden av inføying gjennom søking i trebanken, må vi betrakte noen analyseeksempler. I eksemplene skal vi bruke grønn for leddsetninger på første nivå, blå for leddsetninger på annet nivå (altså innføyet i leddsetning på første nivå), rød for leddsetninger på tredje nivå, lilla for leddsetninger på fjerde nivå, grå for leddsetninger på femte nivå og fiolett for leddsetninger på sjette nivå. I en romantekst finner vi denne setningen:

(1) De så at han kvakk da hornsignalet lød

(1) inneholder to leddsetninger: (a) at han kvakk da hornsignalet lød og (b) da hornsignalet lød. (a) er innføyet i helsetningen (1), og (b) er innføyet i leddsetningen (a). (Vi ser bort fra den alternative tolkningen der begge leddsetningene står på samme (grønne) nivå og modifiserer helsetningen, altså verbet .)

Analysen av setning (1) i trebanken vises i figuren nedenfor:

C-strukturen viser setningens oppbygning av fraser og delfraser, f-strukturen viser en analyse i funksjoner og trekk. For vårt formål her skal vi konsentrere oss om c-strukturen:

Alle leddsetninger, også de uten subjunksjon (at, da, …), har en node kalt Ssub eller Ssub2. (Forskjellen mellom Ssub og Ssub2 har å gjøre med hvorvidt subjektet er obligatorisk og er ikke relevant her; vi vil referere til begge med Ssub*.) Denne noden kan vi derfor bruke til å telle leddsetninger, og til å registrere hvorvidt en leddsetning er inkludert i en annen. At en leddsetning er inkludert i en annen, fremgår av at en node Ssub* dominerer en annen node Ssub*. I tillegg til å telle leddsetninger, teller vi da også slike dominansforhold i setningen. I setning (1) har vi to noder Ssub* og ett dominansforhold mellom to slike noder, og dermed blir vekten av denne setningen 3.

For å se hvordan dypere hierarkier påvirker vekten, kan vi betrakte en mer kompleks setning fra trebanken:

(2) Metodikk som det kan dokumenteres at bidrar til en positiv utvikling for barna må få større plass i utdanningene, mens studenter i mindre grad trenger å lære om metodikk som en ikke kan dokumentere at virker.

C-strukturen for denne setningen vises nedenfor:

Grafen kan sees i større format her.

Setning (2) inneholder 5 leddsetninger, og c-strukturen har dermed 5 noder Ssub*, markert med rødt i grafen. Dessuten er det 4 dominansrelasjoner mellom Ssub*-noder (vi markerer direkte og indirekte dominans med ‘>*’):

#1 >* #2
#3 >* #4
#3 >* #5
#4 >* #5

Siden dominansforhold som det mellom #3 og #5, med en mellomliggende Ssub*-.node, også teller med, ser vi hvordan antallet dominansforhold øker mer enn lineært med tilføyelsen av nye nivåer i hierarkiet. Hvis D(n) er antallet dominansforhold i et hierarki med n nivåer, blir da forholdet slik:

D(1) = 0
D(n) for n > 1 = D(n – 1) + (n – 1)

Dette innebærer da at et hierarki av leddsetninger med f.eks. 5 nivåer vil få en dominansvekt på 10, som er verdien av D(5). Setning (2) har ett hierarki med  2 nivåer og ett med 3. Vekten for det første hierarkiet, D(2), er da 0 + (2 – 1) = 1, og for det andre, D(3), er vekten 1 + (3 – 1) = 3, til sammen for de to hierarkiene 4. Vekten for setning (2), når vi både teller leddsetninger og dominansforhold, blir dermed 5 + 4 = 9.

Vi kan nå registrere setningenes vekt ved å kombinere to søkeuttrykk. Uttrykket for å registrere dominansforhold er slik:

Ssub* >* Ssub*

Dette søkeuttrykket sier at en node Ssub* direkte eller indirekte dominerer en annen node Ssub*. Uttrykket finner alle setninger der dette er sant. Men i tillegg til å finne setningene, registrerer søkeprosessen også hvor mange treff uttrykket har i en viss setning. I setning (1) vil da uttrykket ha ett treff, og i setning (2) vil det ha 4. Antall treff kan da inngå i utregningen av vekten.

For å telle selve leddsetningene i en setning er det tilstrekkelig å skrive:

Ssub*

Dette søkeuttrykket finner alle setninger med minst én leddsetning, altså alle der minst én node har etiketten Ssub*. I tillegg, som ovenfor, registreres det hvor mange treff uttrykket har i en viss setning, altså antallet leddsetninger i dette tilfellet. Det gir 2 for setning (1) og 5 for setning (2).

Vi kan nå kombinere de to søkeuttrykkene i en enten/eller-forbindelse – en disjunksjon. I søkespråket uttrykkes disjunksjon med ( … | … ), så resultatet blir da:

( Ssub* >* Ssub* | Ssub* )

Dette uttrykket finner alle setninger der ett eller begge de to alternativene er sanne, og det registreres hvor mange treff i en setning vi da til sammen får.

Vi kan illustrere resultatet ved å bruke dette søkeuttrykket på to deltrebanker, nno-child, som er barnebøker på nynorsk, og nor-stortinget_1, som er en del av stortingsforhandlingene. Vi føyer til en referanse til ‘treebank’ for å få resultatene sortert etter trebank:

( Ssub* >* Ssub* | Ssub* ) :: treebank

Resultatet ser da slik ut:

Antall treff i de to trebankene er da summen av antall treff i hver setning, som er vårt mål på setningen kompleksitet. Vi ønsker ikke bare å registrere summen av alle setningenes vekt i en tekst, men også hvordan denne vekten forholder seg til det totale antallet setninger i teksten. Vi trenger derfor å telle de relevante setningene, som er de som har fått komplette analyser i trebanken (noen av setningene i trebanken har såkalte fragmentanalyser, men dem ser vi bort fra her). Alle slike setninger har en toppnode som heter ROOT. Vi kan da bruke søkeuttrykket:

ROOT :: treebank

Med uttrykket ROOT finner vi alle setninger med en node ROOT, det vil si alle fullstendig analyserte setninger i korpus. Resultatet ved søk i de to nevnte deltrebankene gir oss antallet relevante setninger i hver av dem:

For trebanken nor-stortinget_1 ser vi at vektsummen (193700) er større enn antallet setninger (173370), og den gjennomsnittlige vekten pr. setning er 193700 / 173370 = 1,117. For trebanken nno-child, derimot, er vektsummen (33248) mindre enn antallet setninger (90341), og gjennomsnittet pr. setning er 33248 / 90341 = 0,368. For å få måleverdier av samme størrelsesorden som lix ganger vi gjennomsnittene med 100, og får da:

Trebank

Kompleksitet

nor-stortinget_1

112

nno-child

37

Som ventet kommer stortingsforhandlingene ut med en betydelig større syntaktisk kompleksitet enn barnebøkene. En setning som (3) fra nor-stortinget_1 ligger ikke nær noe man vil vente å finne i en vanlig barnebok.

(3) Føler helseministeren at de situasjonene som har blitt beskrevet fra Ahus, tilfredsstiller det kriteriet som helseministeren da trakk opp, og som Stortinget var enig i, nemlig at det ikke skulle overføres pasienter før det var helt sikkert at pasientene skulle få et minst like godt tjenestetilbud ved Ahus som det de hadde før prosessen startet?

Som nevnt ovenfor er det et empirisk spørsmål i hvilken grad denne typen kompleksitet faktisk er korrelert med lesbarhet. Men denne kompleksiteten kan likevel bidra til å karakterisere stilen hos en viss forfatter eller i en viss teksttype, og vi skal se litt nærmere på den.

Kompleksitet i deltrebankene

NorGramBank består av flere deltrebanker av ulik art og ulik størrelse, se oversikten her.

Hvis vi regner ut kompleksiteten etter våre leddsetningskriterier for hver av disse deltrebankene og rangerer dem fra mest til minst kompleks, får vi denne tabellen:

Deltrebanker rangert etter syntaktisk kompleksitet:

Deltrebank Kompleksitet
nor-stortinget_2 113
nor-stortinget_1 112
nor-stortinget_3 110
nor-stortinget 107
nor-stortinget_4 97
nob-sofie 86
nob-fn 82
nob-lbk-sa 67
nob-ndt-lfg 60
nob-avis 59
nno-nnk-av 58
nno-nnk-sa 55
nob-lbk-av 55
nob-novel_2 48
nob-novel_4 47
nob-novel_3 46
nob-novel 46
nob-novel_5 44
nob-novel_1 44
nob-child 42
nno-novel 41
nno-child 37
nob-lbk-tv 26

Rangeringen sorterer tydelig mellom de ulike teksttypene. På topp i kompleksitet kommer stortingsforhandlingene samlet. Så kommer Gaarders Sofies verden umiddelbart etter, og før sakprosa, avistekst og andre romaner. Med sitt filosofiske tema skiller den seg tydeligvis ut også syntaktisk. Etter Sofies verden kommer Forskningsnytt og annen sakprosa på bokmål, og så tre deltrebanker med avistekst med én med nynorsk sakprosa innimellom. Deretter har vi alle bokmålsromanbankene samlet, og så barnebøker på bokmål. Romaner på nynorsk kommer etter barnebøker på bokmål i syntaktisk kompleksitet, og til slutt barnebøker på nynorsk og TV-teksting. Vi ser en svak tendens til mer kompleksitet i bokmålstekster enn i nynorsktekster av samme type, men det kan være grunn til å tvile på at den er signifikant. I stortings-trebankene er det ikke skilt mellom bokmåls-og nynorskdelene.

Setningslengde varierer på lignende måte mellom trebankene, med kortere setninger nedover i hierarkiet ovenfor, og man kunne reise spørsmålet om i hvilken grad dette kompleksitetsmålet er en funksjon av setningslengde snarere enn en uavhengig egenskap. Det er åpenbart en sammenheng mellom dem (det er grenser for hvor mange selv korte leddsetninger man får plass til i en setning på 6 ord), men det er likevel ikke tale om en funksjon fra det ene til det andre – de to målene varierer også noe uavhengig av hverandre. Det kan best illustreres når vi betrakter kompleksiteten hos den enkelte forfatter.

Kompleksitet hos forfatterne

Det er også mulig å studere kompleksiteten i tekstene hos den enkelte forfatter ved de tekstene der forfatteropplysninger foreligger. Det er ikke tilfellet i stortingsforhandlingene, men forfattere er oppgitt for romanene, barnebøkene, sakprosaen og deler av avistekstene. Det totale antallet forfattere og grupper av forfattere (ved felles forfatterskap) i materialet er 2658, representert med tekster av svært varierende lengde. Hvis vi ser bort fra forfattere som er representert med færre enn 10 setninger, varierer kompleksitetsmålet fra 260 til 4.

I utregningen av setningslengde telles både ord og skilletegn. Vi kan betrakte samvariasjonen mellom kompleksitet og setningslengde ved å plotte forfatterne inn i et diagram med kompleksitetsmålet langs x-aksen og gjennomsnittlig setningslengde langs y-aksen.

Kompleksitet og setningslengde hos 2658 forfattere:

Tendensen til spredning langs en avlang sky fra nederst til venstre (lav kompleksitet, korte setninger) til øverst til høyre (høy kompleksitet, lange setninger) viser en viss samvariasjon, men det er også en del avvik fra denne linjen. Vi skal se på tekstutdrag fra de fire forfatterne som er markert med #1 – #4 i diagrammet.

#1 har verdiene 260,20 og skiller seg ut med relativt høye verdier i begge dimensjoner: høy kompleksitet og  lange setninger. Tekstutdrag:

Celler spiser kreften
Dette funnet kan bane veien for nye behandlingsformer mot kreft.
– Vi fant at selvspisingsmaskineriet, som vanligvis finnes i alle normale celler, var aktivt og bidro til å bryte ned PML-RARA i blodkreftcellene.
Akutt promyelocytisk leukemi var for bare noen få tiår siden en svært dødelig sykdom uten noe effektivt botemiddel.
– Dette er definitivt en av de største suksesshistoriene noensinne når det gjelder forskning som har ledet til effektiv kreftbehandling, uttaler Bøe.
Han forklarer videre at det er svært sjeldent at man treffer så bra med en målrettet kreftbehandling, og at han tror man ikke helt har forstått hvorfor denne terapien er så effektiv som den er.
Derfor har han lenge vært overbevist om at det her må finnes noen generelle prinsipper vi kan lære av og som kan være overførbare til behandling av andre krefttyper.
I tillegg forekommer det at pasienter med akutt promyelocytisk leukemi ikke blir fullstendig kurert av dagens behandling.
Proteinet PML-RARA holder blodkreftcellene i en umoden tilstand ved å hemme uttrykket av mange gener som er kritiske for deres normale utvikling.
Ved behandling med retinsyre blir mange av disse genene aktivert igjen. 

Setningene er informasjonsrike, men tekstutdraget illustrerer også at denne typen kompleksitet ikke har noen klart negativ virkning på lesbarheten. Det er en klar og presis fremstilling.

#2, en barneboktekst, er i motsatt ende av begge skalaer med verdiene 9,8: lav kompleksitet, korte setninger. Her er et utdrag:

Bø og Bæ i festhumør
Bø og Bæ pyntar seg.
Dei skal på fest hos Bo.
Det skal vere dans.
Bø må øve.
Kva heiter dansen?
Bø blir ør.
Han må kvile seg ei stund.
Bø og Bæ skal ha med ei gåve til festen.
Bo skal få ein båt.
Det er moro å pakke inn, synest Bø og Bæ.
Og lett når ein er to.
«Merkeleg,» seier Bø.
«Korleis gjekk dette til?»
Ein kartong er betre, synest Bæ.
Stødigare også, synest Bø.
Hyssing er finare enn teip.
Bo bur like ved.
Her bur Bo.
«Gratulerer, Bo!» seier Bø og Bæ.
Bo blir glad.
Bø og Bæ får kvar sin hatt.
Alle er der.
Bø og Bæ er svoltne.
Etterpå blir det dans.
Bø dansar godt!

#3, med verdiene 50, 24, har lav kompleksitet og høy setningslengde og illustrerer at de to verdiene i noen grad kan variere uavhengig av hverandre:

Er fiskefôret sunt?
Jeg forsker på bruk av genmodifiserte planteråvarer i fiskefôr, hovedsakelig til laks.
Dette er en svært relevant problemstilling for NIFES sin rolle som kunnskapsleverandør til forvaltningen i Norge.
Bruk av planteråvarer i fiskefôr som erstatning for fiskemel og fiskeolje er en nødvendighet både for å få til en mer bærekraftig produksjon og en videre vekst i produksjonen.
Flere av de aktuelle planteråvarene, som for eksempel soya, mais og raps, blir i stor grad dyrket som genmodifiserte (GM) varianter.
Dermed er det viktig å fremskaffe kunnskap om GM råvarene trygt kan benyttes i fôret uten noen effekt på fiskens vekst eller helse.
Kunnskap om mulige effekter av GM råvarer er svært viktig både for forvaltningen og næringa, slik at de kan ta sine avgjørelser basert på vitenskapelige data.
Fisken ble fôret gjennom 7 måneder, inkludert sensitive stadier i livssyklus som smoltifisering og utsett i sjø, og omfattende evalueringer ble gjort av fiskens vekst, utvikling og helse gjennom hele forsøket.
Jeg er oppvokst på kysten (Hvalerøyene i Østfold) med en far som er rekefisker, så det kan nok ha hatt innvirkning på interesser og utdanningsvalg (master i havbruksbiologi).
Da jeg skulle gå videre på doktorgrad, valgte jeg å spesialisere meg innen ernæring da dette gir varierte jobbmuligheter seinere, både for forskning i det offentlige og i privat industri

Her er den gjennomsnittlige setningslengden (i hele teksten) høyere enn hos #1, men innslaget av leddsetninger er betydelig mindre, og vi ser ingen eksempler på leddsetning inne i leddsetning i utdraget.

#4 med verdiene 183,15 er blant dem som kommer nærmest den siste mulige kombinasjonen – høy kompleksitet kombinert med lav setningslengde – eller i dette tilfellet middels setningslengde. Riktignok skyldes nok den lave gjennomsnittlige setningslengden i stor grad innslaget av korte overskrifter. Her er et utdrag:

Klisterforbud skaper trøbbel for Byåsen
Det skjer etter at Spektrum har tatt inn kommunens regler i hallen.
Klisteret brukes av spillerne for å få bedre tak på ballen, men setter samtidig merker på gulvet.
Sprayklister setter ikke like markante merker, men har kortere varighet.
– J12 – kamper
– Dette blir jo som å spille J12-kamper igjen, sier daglig leder i Byåsen, Torbjørn Balstad.
Argumentet til kommunen er at harpiksen som er i klisteret gjør at det blir merker på gulvet som er vanskelige å vaske vekk.
Men Balstad hevder at produsenten av klisteret de bruker nå, kan dokumentere at det ikke er harpiks i det.
– Hva skjer når det kommer motstandere hit som skal spille kamp mot oss?
Skal lag som Lubin og Larvik bruke sprayklister?
Tvilsomt, tror Balstad.
Klister av den gamle typen, som inneholder harpiks, brukes kun ved meget varme forhold i hallen, der vanlig klister kan bli for glatt.
– Det blir som å si at gutta på Lerkendal skal spille med fastknotter fordi skruknotter ødelegger gresset, sukker Balstad oppgitt.
Sier ikke kategorisk nei
Teknisk sjef i Trondheim Spektrum, Håkon Sjøhaug, avviser ikke at vanlig krukkeklister kan brukes, dersom det kan dokumenteres at det ikke inneholder harpiks.
Men vi har en god dialog med Balstad, som har gjort oss oppmerksomme på at det finnes krukkeklister uten harpiks, sier Sjøhaug.
Må ha databladet
– Ser du for deg at den kan vekke reaksjoner dersom storlag som Buducnost og Larvik kan bli nødt til å bruke sprayklister når de kommer hit for å spille kamp?
– Hehe, ja.
Og dersom vi har andre regler enn for eksempel i Larvik, så er dette uheldig.
Jeg mener vi bør få likt reglement på alle hallene i Norge.
Dersom det ikke er harpiks i klisteret, er vi åpne for å se på om det kan brukes.
Når vi får databladet fortsetter vi dialogen med Byåsen, sier Sjøhaug. 

Konklusjon

I dette innlegget har jeg sett på hvordan informasjon om en type syntaktisk kompleksitet kan hentes ut av trebanken og brukes til å karakterisere ulike teksttyper og ulike skribenter. Det gjenstår å se om akkurat denne typen kompleksitet er informativ om tekstegenskaper som er relevante for lesbarheten, men det kan være av interesse å kombinere dette kompleksitetsmålet med mål basert på andre tekstegenskaper som lar seg hente ut. Det vil jeg se på i senere innlegg.

 

 

‘den unge mannen’ eller ‘den unge mann’?

Innledning

‘Dobbelt bestemthet’ (også kalt ‘overbestemthet’) vs. ‘enkel bestemthet’ i skriftlig norsk blir noen ganger diskutert. Ved dobbelt bestemthet, som i den unge mannen, har vi en demonstrativ den eller denne, etterfulgt av et substantiv (mannen) som også står i bestemt form, eventuelt med mellomliggende adjektiver.  Ved enkel bestemthet, som i den unge mann,  står substantivet i ubestemt form.

Ulike egenskaper nevnes ofte som relevante for motsetningen mellom de to: mer norsk vs. mer dansk; mer muntlig vs. mer formell; spesifikt refererende vs. ikke-spesifikt refererende; konvensjonelt begrep eller navn vs. produktivt dannet frase. Spesifikk vs. ikke-spesifikk referanse kan illustreres med den eleven du traff i går (spesifikk elev) vs. den elev som opptrer slik (ikke spesifikk elev), eller der sitter den unge mannen (en spesifikk mann) vs. klær for den unge mann (i sin alminnelighet). Et konvensjonelt begrep har vi i den nye tid vs. den lange tiden; et navn i Det indiske hav vs. det dype havet.

Vi skal ikke gå inn på alle disse vurderingene her, men heller undersøke hva slags informasjon om denne motsetningen vi kan fremskaffe  gjennom søk i en trebank, som et mulig grunnlag for nærmere studier. Vi skal konsentrere søket om eksempler som har minst ett adjektiv mellom demonstrativen og substantivet, siden det først og fremst er ved slike eksempler at vi kan vente å finne et trykkløst (ikke-kontrastivt) den. Den som måtte være interessert i hvordan trebankanalysene ser ut, og hvordan søkeuttrykket formuleres, kan finne en kort beskrivelse av det her.

Enkel bestemthet i bokmål

Vi søker etter enkel og dobbelt bestemthet i ca. 46 mill. ord av bokmålsteksten i trebanken. Denne delen består av:

Avistekst: 3,2 mill. ord
Sakprosa: 11,5 mill. ord
Barnebøker: 4,1 mill. ord
Romaner: 27,5 mill. ord

De globale tallene i bokmålsdelen:

Frasetype Antall
Dobbelt bestemt

260 933

Enkelt bestemt

17 862

Dobbelt bestemthet er som ventet sterkt dominerende: Globalt er bare 6,4% av de relevante konstruksjonene enkeltbestemte.

Enkel og dobbelt bestemthet ved de enkelte substantiver

Et mer nyansert bilde fremkommer hvis vi undersøker hvordan denne variasjonen er korrelert med andre variabler, f.eks. type av substantiv, eller forfatter. I undersøkelsen av substantiver begrenser vi oss til slike som opptrer minst 10 ganger i denne konstruksjonen – enkelt eller dobbelt bestemt. Det gir 3 538 substantiver. For hvert substantiv kan vi nå registrere hvor mange prosent av treffene som har enkelt bestemthet. Hvis vi ordner substantivene etter denne prosentsatsen, får vi grafen nedenfor:

Andel enkel bestemthet fordelt på substantiver

 

78 av de 3538 substantivene opptrer med enkel bestemthet i mer enn 50 % avtilfellene, det vil si 2,2 % av substantivene. Det store flertall av substantiver har sterk overvekt av dobbelt bestemthet.

Tabellen nedenfor viser de 40 substantivene som har sterkest overvekt av enkel bestemthet – begynnelsen av kurven. Første kolonne viser substantivlemmaet, annen kolonne antall forekomster med enkel eller dobbelt bestemthet, og tredje kolonne den prosentandelen av disse som har enkel bestemthet.

Substantiv etter prosentandel enkel bestemthet

Substantivlemma # med demonstrativ og adjektiv % enkelt bestemt
faktum 72 100,0
intet 30 100,0
selvfølge 12 100,0
selvfølgelighet 33 100,0
anelse 34 97,1
halvkule 138 92,0
fare 22 90,9
forseelse 10 90,0
samfunnslag 10 90,0
jaktmark 12 83,3
fakultet 162 80,2
orden 61 78,7
ytre 14 78,6
fornuft 32 78,1
respekt 27 77,8
garde 13 76,9
psykologi 25 76,0
gral 12 75,0
istid 64 75,0
ære 20 75,0
vanvidd 19 73,7
snev 15 73,3
ånd 91 72,5
samaritan 18 72,2
brorskap 14 71,4
anelse 33 69,7
stadium 66 69,7
tilfeldighet 13 69,2
helvete 25 68,0
dumhet 12 66,7
legeforening 21 66,7
dagsorden 25 64,0
nullpunkt 22 63,6
publikum 44 63,6
verdighet 11 63,6
moral 19 63,2
arme 45 62,2
tidsalder 21 61,9
imperativ 13 61,5

Noen av disse substantivene inngår i navn eller navnelignende betegnelser, for eksempel Den hellige ånd, den nordlige halvkule, den lille istid, Det muslimske brorskap, den barmhjertige samaritan. Navn med denne formen har enkel bestemmelse i bokmål. Ved flere andre er det tale om ikke-spesifikk referanse til noe av en viss art, gjerne i kombinasjon med absolutt superlativ: den største selvfølgelighet, den minste forseelse, den ringeste anelse.

Et utvalg korpuseksempler:

Det fysiske faktum tok fra meg tryggheten.
Det er underlig hvordan andre husker de objektive fakta i ens liv;
Jeg følte i uklar triumf at nå hadde jeg allikevel klart å omgå det uomgjengelige faktum.
Nødlanding kunne bety at de bare forsvant – ble slukt i det store grønne intet.
da den første vognen skrattet mot det åpne intet, dundret sistemann hult i gjelet.
Den vonde hånden skalv da han forsiktig heiste seg ned i det mørke intet.
For Berkeley ville vel spillenes virtuelle virkelighet vært den største selvfølge?
Du tar det vennene dine gjør for deg som den rene selvfølge.
Hun brukte ord som ondskap, hat og kjærlighet med den største selvfølge.
Jeg skjønner det ikke – jeg har ikke den minste anelse.
Så kom dagen de hadde sett nærme seg med de verste anelser:
Han fløy over den, uten å ha den fjerneste anelse om han satte rekord eller ikke.
I tillegg er bildet på den sørlige halvkule veldig sammensatt.
Ved siden av isbjørnen er den det største landlevende rovdyret på den nordlige halvkule.
Det er i de store farer man ser det store mot.
På hospitset kom den gule fare Tom til unnsetning.
– De er derfor fullstendig uegnet i polare farvann hvis det er den minste fare for flerårig is i klumper eller store isflak i bevegelse, sier Riska.
I tillegg til å lære fransk med barnet, snakket morfaren om Trygve Lies storhet og om Den røde fare.
– Og dessuten ville det være det rene vanvidd av deg å se etter noe annet også.
Det er det glade vanvidd – og nå snør det faktisk!
Nok en by skulle ofres på ondskapens alter, i en strid der det absolutte vanvidd var opphøyet til den ypperste form for krigskunst.

Ved dette mindretallet av substantiver ved begynnelsen av kurven ser vi da grammatiske grunner (navn), semantiske grunner (ikke-spesifikk referanse) og idiomatiske grunner (faste uttrykk) til overvekten av enkel bestemthet. Men stil, sjanger og forfatteres preferanser er uten tvil også faktorer som påvirker valget av denne formen, og kan ligge bak innslagene av enkel bestemthet ved de øvrige substantivene. Vi kan nærme oss disse faktorene ved å se på hvordan valget er korrelert med forfatter, og med type av tekst.

Enkel bestemthet blant bokmålsforfatterne

På samme måte som vi kan studere fordelingen mellom enkel og dobbelt bestemthet ved det enkelte substantiv, på tvers av forfattere, kan vi gjøre det samme ved den enkelte forfatter, på tvers av substantiver. Som ved substantivene begrenser vi oss til forfattere som har minst ti forkomster av den aktuelle konstruksjonen demonstrativ + ett eller flere adjektiver + substantiv. Dette gir 895 forfattere. Grafen nedenfor viser at forfatterne fordeler seg på lignende måte som substantivene: Et lite fåtall har overvekt av enkel bestemthet, mens det store flertall har sterk overvekt av dobbelt:

Andel enkel bestemthet fordelt på forfattere, bokmål

31 av de 895 forfatterne har 50 % eller mer enkel bestemthet i de tekstene de er representert med i korpuset. Tabellen nedenfor viser disse 31 forfatterne med antall eksempler på den aktuelle konstruksjonen, og i tredje kolonne den prosentandel av disse som har enkel bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, toppen av listen

Forfatter # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Heyerdahl, Nils 46 95,7
Flemestad, Roald 117 92,3
Slagstad, Rune 12 91,7
Folven, Reiel 10 90,0
Romarheim, Arild 18 88,9
Fardal, Rune 34 88,2
Olsen, Dag Rune 14 85,7
Weisæth, Lars 26 80,8
Döderlein, Jan M. 14 78,6
Aarnes, Asbjørn 22 77,3
Næss, Per Øivind 13 76,9
Wassmann, Paul 38 76,3
Ellestad, Ole Henrik 72 73,6
Hessen, Dag Olav 26 73,1
Oftestad, Bernt Torvild 18 72,2
Waaler, Arild 42 71,4
Emilsson, Eyjólfur Kjalar 26 69,2
Egeland, Kirstin 25 68,0
Standage, Tom 30 63,3
Larsen, Alexandra Irene 18 61,1
Mevåg, Bente 15 60,0
Vasstrøm, Mikaela 10 60,0
Sr, Eystein Husebye 19 57,9
Valland, Anders 42 57,1
Thommessen, Øystein B. 11 54,5
Espedal, Bruse 13 53,8
Harris, Shane 15 53,3
Humlum, Ole 40 50,0
Kanestrøm, Ingolf 16 50,0
Wikan, Unni 12 50,0
Solli, Brit 10 50,0

Sjanger er en åpenbar faktor. Noen av de til dels korte tekstene som flere av disse forfatterne er representert med, har et religionsfilosofisk eller generelt filosofisk innhold. Det refereres derfor ofte til allmenne begreper eller ulike filosofiske posisjoner, der enkel bestemthet kan være nærliggende. Vi kan betrakte noen eksempler fra fire forfattere på toppen av listen.

Eksempler på enkel bestemthet:

Nils Heyerdahl («Avskummets verdighet. Pascal mellom skeptisisme og rasjonalisme»):
Fremgangen i disse forskningsgrener ga knapt grobunn for mistro til den menneskelige fornuft.
I vitenskapelige miljøer i Clermont og Paris finner vi Pascal som den selvsikre vitenskapsmann.
Her var Montaigne det store dannelsesideal, med sin blanding av skeptisisme, stoisisme og epikureisme.
Det fremlegges resultater, det gjøres front mot den gamle aristotelisk-skolastiske vitenskap.
Om referenten har gjengitt ham rett, stiller Pascal her datidens skeptisisme (pyrrhonisme) opp mot den rasjonalistiske dogmatisme.
Inspirert bl.a. av den gjenoppdagede hellenistiske forfatter Sextus Empiricus, hvis verk Hypotyposeon ble en hovedkilde til kunnskap om oldtidens skeptisisme, går han veier som ender i den totale uvisshet.
For dogmatikernes vedkommende fester Pascal seg ved det han kalle[r] deres eneste vektige argument: at man ikke kan tvile på «de naturlige sannheter», dersom man skal være ærlig.
Naturen kommer den avmektige fornuft til unnsetning og hindrer den i å vrøvle seg helt bort.

Roald Flemestad («Pascal som teologisk tenker for vår tid»):
I dette oppbrudd kunne man fra første stund ane en motsetning mellom den nye rasjonalistiske livsholdning og tradisjonell kristendom med dens bibelske forestillinger om Gud og menneskelivet.
I hans samtid fremstod Pascal som en skarp kritiker av den frembrytende rasjonalisme.
Mot denne tekniske prometeisme anfører Pascal i Pensées at «det stadige fremskritt ikke er menneskets vesen.
Noen sier det ligger i fullkommen uvidenhet… og de sanne skeptikere påstår at det høyeste gode ligger i den urokkelige sinnsro
Overfor de mange konkurrerende sannhetskrav konstaterer Pascal:
Overfor det politiske narrespill reiser Pascal spørsmålet:
Folk må oppdras til å anse den [hevdvundne vane] som gyldig og evig.»
Denne krise ville barokk-kulturen møte ved å skape en ny symbolsk orden som ikke bare skulle gjenskape den tapte opplevelse av virkeligheten som en helhet, men som også kunne gi de styrende en ny mulighet for sosial kontroll.
Sentralt i denne restaureringsprosess står den monarkisk-absolutte styreform som nu oppstår.

Rune Slagstad («Vitenskapen, kallet og profesjonen»):
Den vitenskapelig emansiperte elite ble en ny ledende kulturelite.
Lochmann ville holde den positivistiske og ugudelige smittebærer unna Universitetet, men lyktes ikke:
Utnevnelsen markerte Universitetets løsrivelse fra det teologiske overoppsyn;
på den annen side det moderne begrep om vitenskap, det jeg vil kalle den liberale vitenskapelighet, bestemt av noen tilgrunnliggende normer som gjør vitenskap til vitenskap:
Det nye universitet var med sine «brødstudier» med en term som ikke var i omløp på den tiden, i realiteten et […]
Det praktisk-teologiske seminar ble formelt opprettet i 1848, knyttet til så vel fakultet som kirke, med et tyngdepunkt i de gudstjenestelige oppgaver.
Velferdsstatens profesjoner produserer ideologi med tilbakevirkende kraft på de vel etablerte profesjoner.
Kanskje er det noe som går tapt med den profesjonsideologiske ekspansjon

Arild Romarheim («Førmoderne religion er atter moderne»):
Noen ser i dette et behov hos det moderne menneske for en «fortryllelse», en kompensasjon for den moderne sivilisasjons dennesidige, grå hverdag.
Dette kan muligens ha å gjøre med den kristelige interesse man gjerne forbinder med fin de siecle, avslutningen av et århundre.
Det religiøse innhold – i den grad det forekommer – er her som oftest fjernt fra kristendom.
Kjendisbladene troner høyt oppe på statistikken men disse er mindre vesentlig for vårt tema, da den religiøse tematikk her er nærmest fraværende.
Ateisten Dawkins anbefaler fornuftens opplysning som motgift til dette kulturelle forfall.
Den samme respektfulle holdning bør vi også vise overfor islam, en religion som – i økende grad – gir sitt bidrag til det førmoderne nærvær i vårt samfunn.
Forskerne tror ikke lenger på religionens generelle tilbakegang som følge av den moderne, vitenskapelige tidsalder.
Den danner en slags grasrot-religiøsitet også innenfor de store religioner som i og for seg anser ånde-kontakt som en mindre essensiell del av religionen (islam, kristendom, buddhisme).
Det virker heller ikke som viteskapelig skepsis kan kompensere for denne manglende religiøse skepsis.
Denne vage framvoksende basisreligiøsitet omtales gjerne som «spiritualitet», en åpen, individuelt tilpasset tro på at «det er mer mellom himmel og jord».
Skaperguden finnes, men er fjern og tas helst fram ved de store høytider.

Halen på kurven ovenfor omfatter forfattere som har 0 % innslag av enkel bestemthet. Tabellen nedenfor viser dem av disse som er representert med flest eksempler på konstruksjonen, da med dobbelt bestemthet.

Bokmålsforfatter etter prosentandel enkel bestemthet, nær bunnen av listen

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Østby, Magnus 134 0,0
Abelsen, Atle 84 0,0
Hurum, Eirin 70 0,0
Müller, Anne Marie 63 0,0
Kvalshaug, Vidar 62 0,0
Østli, Vegard 55 0,0
Sjøli, Hans Petter 54 0,0
Hjorthol, Lars Martin 50 0,0
Jenssen, Hugo Lauritz 46 0,0
Andersen, Pål Flodin 45 0,0
Valberg, Anna 44 0,0
Baksjøberg, Marianne 43 0,0
Grandaunet, Hilde Jensen 43 0,0
Hanssen, Torkil Marsdal 42 0,0
Østveit, Karine 40 0,0
Solerød, Mari 40 0,0
Karkov, Rasmus 38 0,0
Aftenposten 37 0,0
Fjellberg, Anders 37 0,0
Johnsen, Hilde Føreland 37 0,0
Kazankov, Andrey 35 0,0
Milde, Svein Harald 33 0,0
Vestergård, Gunver Lystbæk 33 0,0
Gravklev, Bente Rognan 32 0,0
Valsø, Karen 32 0,0
Vold, Henrik Brattli 32 0,0
Aall, Carlo 31 0,0
Klaveness, Luisa 31 0,0
Kagge, Gunnar 30 0,0
Lundereng, Kristine 30 0,0

Fraværet av enkel bestemthet her skyldes utvilsomt dels sjanger og innhold og dels forfatternes egne preferanser. Tekstene omfatter for eksempel avisartikler og Forskningsnytt-artikler. Referanse til konkrete gjenstander favoriserer dobbelt bestemthet, mens dobbelt bestemthet ved mer abstrakte begreper kan ha mer å gjøre med forfatterens valgte stil.  Vi tar med noen eksempler.

Eksempler på dobbelt bestemthet:

Magnus Østby (artikler i Stavanger Aftenblad):
De større modellene til John Deere som ikke har B-stolpe, har dør bare på venstre side.
De fire minste modellene, fra 83 til 115 hk, har firesylindra motorer med et sylindervolum på 4,5 liter .
Det elektriske hurtiggiret betjenes med knapper på girspaken eller bryter på betjeningskonsollen.
De små traktorene rydder småvegene og transporterer snøen til de større vegene.
Den vendbare hytta er unik.
Når spakstyringa er aktivert, styres hjula med en rullebryter på den ekstra styrespaken.
– Når du ser det er slitasje på de tverrstilte gripeelementene på kjettingen, bør du snu kjøreretningen på kjettingen.
Den manuelle delen av arbeidet er i hovedsak relatert til sluttproduksjon og herding.
Herdeovnene går tre skift, mens de øvrige maskinene går to.
Årsaken er at de kanta elementene på lettkjettingen biter seg godt fast i isen.
Når den fremste enheten er full, sendes kornet til neste enhet.
De viktigste instrumentene er plassert på høyre A-stolpe, mens resten er i konsollen på siden av førersetet.
Det betyr at hvis Søren vil ha automatisk styring, trenger han bare å montere den gule kula på taket og skjermen, samt aktivere systemet.
De to forskjellige produksjonene gir oss dessuten to bein å stå på.
De samla leasingkostnadene er 10 000 kroner per måned, forklarer Atle.


Atle Abelsen (artikler i Forskningsnytt):
Han peker på at absolutt alle kunnskapsbaserte produksjonsbedrifter over en viss størrelse på det internasjonale markedet har plassert nanoteknologi i sin bedriftsstrategi, og de fleste bruker til dels store beløp på forskning innen dette feltet.
De startet i fjor en prøveprodukjson av nanorør,
et [sic] av de viktigste byggesteinene for svært mange nanoprodukter.
Men da må de industrielle aktørene komme på banen nå.
Han forteller at flere av de internasjonale innlederne var overrasket over å treffe så mange av sine kolleger på konferansen.
Til den neste konferansen i 2005 kommer vi til å jobbe spesielt aktivt for å involvere de industrielle brukerne enda mer, sier Høvik.
Derfor må vi teknologer komme tidlig på banen og sette premissene for den etiske diskusjonen, oppfordrer han.
Statssekretær Helle Hammer i Nærings- og handelsdepartementet understreket at etablering av nye forretningsområder er det viktigste suksesskriteriet for nanoforskningen.
Professor Johan Sjøblom ved NTNU pekte for øvrig på de store mulighetene som olje- og gassutvinnerne og industrien har for økt verdiskaping ved å satse på materialteknologi i nanoskala.
Også han var opptatt av å fokusere sterkt på de etiske aspektene.
Den tørre forsommeren gjorde forholdene ideelle til å lete etter strukturer på bakken som bare kan sees fra stor høyde, forteller Raaen.
Ved å kombinere resultatene fra alle disse avanserte målemetodene, håper Stenvik og hans gruppe at det skal tre tydelig fram hustufter, ildsteder og andre ting som tyder på at det har vært folk her.

Eirin Hurum (artikler i Aftenposten):
Den blide pensjonisten, kledd i klassisk vaffeljakke og sixpence har det ærefulle oppdraget å servere jaktlaget den tradisjonsrike «stirrup cup» – en liten sterk en – før startskuddet går for dagens revejakt – den tredje denne uken.
Midt på eiendommen troner det gamle godset.
Tilhengerne hevder at jakten er den beste måten å kontrollere revebestanden på.
– Ja, det er det store spørsmålet, sier Butler og slår ut med armene.
Vi har bestemt oss for å holde oss på den sikre siden, sier han.
– Men jaktlagene hevder at dette ikke handler om dyremishandling, og at jakt med hunder er den mest humane måten man kan avlive reven på?
– For oss, og jeg tror for de fleste som bor på landet, er revejakten en del av det sosiale limet i lokalmiljøet.
Til det har den konservative regjeringen for mange andre presserende oppgaver.
Den dukker opp i horisonten, piler over de grønne gresslettene og inn i et skogholt.
Den tradisjonsrike revejakten har foregått i århundrer.
Det britiske skolesystemet har vært på politikernes agenda i årevis.
Det fastslår Den nasjonale likestillings- og diskrimineringskommisjonen i sin rapport «How fair is Britain?», den mest omfattende levekårsundersøkelsen gjort i Storbritannia de siste årene.

Anne Marie Müller (artikler i Forskningsnytt):
Bare i noen få av studiene som inngår i oversikten er det med pasienter som har gjennomgått de nye og lange behandlingsformene som gis til dagens brystkreftpasienter.
Det er i det hele tatt en slående kontrast mellom de små og spredte studiene som fins innen rehabilitering og den brede internasjonale forskningen innen behandling, og som har bidratt til de store framskrittene der.
Den amerikanske stiftelsen The Commonwealth Fund (se faktaramme) har siden 1998 gjennomført internasjonale spørreundersøkelser om helsevesenet.
Nasjonalt kunnskapssenter for helsetjenesten står for den norske delen av undersøkelsen.
Selv om spørreskjemaet er utviklet for norske forhold, er det imøtesett med betydelig interesse også innen det nordiske indikatorsamarbeidet.
De store europeiske etterkrigskullene vil snart tre ut av arbeidsstokken og tappe helsetjenesten for sykepleiere uten at en tilsvarende mengde unge sykepleierrekrutter vil erstatte dem.
Første del er den pågående spørreskjemaundersøkelsen blant sykepleiere ved medisinske og kirurgiske avdelinger.
Norge skiller seg ut med den nest laveste andelen utgifter til legemidler og medisinsk-tekniske hjelpemidler.
De lave utgiftene her skyldes blant annet lavere norske legemiddelpriser.
den andre siden skiller Norge seg ut med den høyeste andelen utgifter til pleie og omsorg.

Det er tydelig at dobbelt bestemthet er det umarkerte valg(et) i det meste av bokmålstekst. Enkel bestemthet er mest regelmessig knyttet til flerords-navn. Mindre fast, men likevel tydelig, er det knyttet til den semantiske egenskapen ikke-spesifikk referanse, til abstrakte begreper, og til en del faste uttrykk. En annen dimensjon er stil og sjanger – en konservativ forfatterstil og en filosofisk-diskursiv tekstsjanger synes begge å favorisere enkel bestemthet.

Enkel bestemthet i nynorsk

I nynorsk tekst vil de fleste vente å finne mindre innslag av enkel bestemthet enn i bokmålstekst. Den nynorske delen av NorGramBank utgjør bare 10-15 % av trebanken; vi bygger her på de følgende delene:

Avistekst: 123 400 ord
Sakprosa: 1,6 mill. ord
Barnebøker: 1,04 mill.ord
Romaner: 3,01mill. ord

De globale tallene i nynorskdelen:

Frasetype

Antall

Dobbelt bestemt

23 127

Enkelt bestemt

788

I bokmålsdelen utgjorde tilfellene av enkel bestemthet 6,4 % av alle forekomster av konstruksjonen. I nynorskdelen halveres dette nesten – 3,3 % av eksemplene har enkel bestemthet.

Enkel bestemthet blant nynorskforfatterne

72 nynorskforfattere har 10 eller flere eksempler på konstruksjonen demonstrativ + eventuelle adjektiver + substantiver. Hvis vi regner ut prosentandel enkel bestemthet for hver av disse, får vi grafen nedenfor.

Andel enkel bestemthet fordelt på forfattere, nynorsk

Bare én forfatter av de 72 har en høyere prosentandel enkel bestemthet enn 50. Tabellen viser 30 av forfatterne rangert fra den med høyest andel enkel bestemthet.

Nynorskorfatter etter prosentandel enkel bestemthet, toppen av listen

 

Forfatter  # demonstrativ
+ adj.* + subst.
% enkelt bestemt
Rabben, Bjarne 47 57,4
Mosdøl, Olav 19 36,8
Bruheim, Jan-Magnus 15 33,3
Bjørlo, Anne-Grete 17 29,4
Holm, Gro 27 18,5
Austrem, Liv Marie 33 12,1
Jonsmoen, Ola 129 10,1
Økland, Einar 402 9,7
Kaldestad, Per Olav 263 8,4
Helde, Einar 125 7,2
Hoem, Edvard 605 6,1
Øglænd, Finn 260 5,8
Eide, Svein 139 5,8
Heggland, Johannes 261 5,7
Starheimsæter, Hermann 176 5,7
Bukkøy, Else Karin 179 5,6
Nöstlinger, Christine 18 5,6
Sagen, Rolf 485 5,4
Ruset, Arne 191 5,2
Heie, Sigbjørn 140 5,0
Ystaas, Torunn 81 4,9
Piumini, Roberto 62 4,8
Midtun, Jarle 21 4,8
Bødtker, Marit Lund 66 4,5
Vaage, Lars Amund 355 4,5
Nysted, Liv 70 4,3
Fosse, Jon 118 4,2
Bjørkum, Ingrid 73 4,1
Hauge, Kolbjørn 345 4,1
Sæter, Alf A. 531 4,0
Teksten av den forfatteren som skiller seg ut, Bjarne Rabben, er poetisk – og, i likhet med bokmålstekstene med stort innslag av enkel bestemthet, har religiøst innhold:
Bjarne Rabben («Med himmel over»):
Den gode smil
Det er så vent ved Mjøsa den ljose sommartid.
Fjellet i sol og sommar – å, denne rike dag!
Finst ikkje venare syn enn den unge mor.
Du gav meg di gode hand i dei unge år, ei hand til å leike med og klemme om.
Din barnetanke på sin veng dei lange leier tok.
Eg metta meg med det velsigna brød, tok frakken på og lét døra opp.
Han gav oss den dyre gåve: ein helgedag for vår sjel.
Fast skal du stå i di freistings tid, glad skal du våge den gode strid tru mot det syn som di lengsle såg.
Ja, det fortel den gamle bok.
Denne reine himmel over morgonfjell med stjerner som strålar mot mørk jord
I dag vil eg minnast den namnlause kvide som Jesus, vår frelsar, for oss måtte lide.
Din lekam imellom seg vrid dei og vender og naglar til krossen dei heilage hender.
Dei gamle stigar du akte på, så du til ditt livsverk kan emne få.
Styr dine ord i den glade stund.
Dei gode ord
den gamle kyrkjetuft
Me møtest i den frie luft med rømd til alle sider på denne gamle kyrkjetuft med sus frå gamle tider.
Lat det få rom og rang i byar og i grender som setje kan i gang dei arbeidslause hender!

 Men også i andre tekster finner vi eksempler:


Og så fekk han sine eigne folk, han hyrte dei største talent og lærte dei alt dei trong å lære, men skjønte dei kor stor han var for det?
Han som nådde dei høgaste tindar.
Tannlegen tok det som ei djevelsk ironisering over den gemene hop.
Har vi alltid tankane i dei øvre sfærar?
Ho seier at han ikkje kan utrette noko på møte i Gymnassamfunnet, av den enkle grunn at han ikkje går på gymnaset.
PÅ DETTE TIDSPUNKTET hadde kunsthandlaren identifisert meg som den einaste son av presten Storm.
Vi går bort, for vi er ikkje menneske lenger, vi er teikn, vi er vitne for den forspilte tid: Vår ungdom.
Mot den uklare bakgrunn av gudfryktige fiskarmenn som eg nedstammar frå, står det brått fram ein mann som beviseleg målte tre alner på sokkeleisten og var brei som ei låvedør.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Krydderet finst i handelen og dei fleste kjøkkenhyller, men har i heile denne tida ikkje kalla fram den ringaste assosiasjon.
Inga bjølle har ringt når eg har løfta lokket av angande surkål, eller sett tennene i den herlegaste nøkkelost.
Det kunne han bevise med møteprotokollen for bedehuset som vart ført med den djupe vørdnad for det skrivne ordet som heretter alltid rådde i Karviland.
Sonen var ein overgang og eit intermesso i det store livsens spel.
Over midtgangen hang ei vakker skute med dei finaste segl.
Aldri, aldri skulle han koma til å gråte over den forgangne trollskap frå parafinlampene sin tidsalder.
Der stod bestefaren og slakta lam som i den gamle pakt.
– Dei kan seia oss korleis livet på jorda er, om dei ikkje just peikar inn i dei evige bustader.
– Ai, eg har sønner fem, sa faren, som snakka innfløkt når det gjekk på dei store ting i livet.
I dei raraste påfunn er det alltid gøymt ein grunn, og slike grunnar tok han til å grunne på.
Eldsteguten hadde greidd å lure seg unna ei mengd med fiskemåltid, men i desse tronge tider måtte sjølv han til pers.
Slik svinga han frå det svartaste mismot til den lystigaste stemning på nokre minutt.
Dersom nokon trur Bakke-merra kjem til å flytte seg før dei blæs i basun, skal vi vita kvar vi la henne på den ytterste dag!
Ei gammal leigemerr frå Malmedalen fekk vera med og bane vegen til den nye tid.
Foreldra gjorde ikkje den ringaste mine til å vakne.
Var det ikkje for dansen at den gamle felemakar Lars Hoem hadde bygd sine prektige instrument?
Det leid mot den avgjerande eksamen.

‘min sønn’ eller ‘sønnen min’?

Innledning

Det heter helst sykkelen din, sønnen hennes, den ømme samvittigheten hans og den stygge mistanken min på norsk, vil noen hevde; din sykkel, hennes sønn,  hans ømme samvittighet og min stygge mistanke er kunstig formelt eller rett og slett dansk. Og akkurat ved substantivet sykkel kan man jo skjønne at slikt blir sagt – skjønt din nye sykkel lyder kanskje straks litt bedre enn din sykkel. Intuitivt er muligens heller ikke min mistanke fullt så påfallende som din sykkel, og mange vil nok finne min stygge mistanke ganske uproblematisk. Hva slags regelmessigheter kan vi avsløre her?

Hva ‘det heter’ på skriftlig norsk, er et spørsmål om hvordan skriftlig norsk faktisk ser ut, altså hva som står i tekstene. Så la oss se på det, først og fremst i bokmål i denne omgang. Nynorsk nevnes kort mot slutten.

Foran- vs. etterstilt possessiv i bokmål

Vi søker først i bokmålsdelen av NorGramBank, i den delen som omfatter aviser, sakprosa, barnebøker og romaner (originaler og oversettelser), ca. 45 millioner ord. Søkeuttrykket inkluderer alle nominale fraser med possessiv (min, din, sin, hans, hennes, dens, vår, deres med bøyningsformer), uavhengig av om det står adjektiver eller andre ord mellom possessiven og substantivet. Uttrykket formuleres slik at vi utelater  eksempler med bestemmeren egen, som i min egen sykkel, ettersom de alltid har foranstilt possessiv, slik at det ikke foreligger noen valgmulighet der. Vi skulle også gjerne ha utelukket eksempler der den foranstilte possessiven er fokusert gjennom kontrastivt trykk (Dette er min sykkel!), men dessverre er slike eksempler ikke merket og lar seg derfor ikke skille fra.

Hvis vi teller teksteksemplene enkeltvis, finner vi at etterstilt possessiv er noe, men ikke dramatisk, vanligere enn foranstilt:

Possessivplassering i bokmål, globalt:

Possessiv-plassering

Antall

Foran

133 252

Etter

198 751

Vi ser at 40,1 % av tekstforekomstene av nominalfraser med possessiv har possessiven foranstilt, noe som antyder at fenomenet ikke er fremmed for språket. Et mer nyansert bilde fremkommer hvis vi skiller mellom de enkelte substantivene, som kan ha svært ulike fordelinger av foranstilt og etterstilt possessiv. Det er over 15 000 ulike substantiver med possessiv i dette materialet, der de fleste forekommer bare én eller to ganger. For å få et mer håndterlig materiale og mer signifikante tall, begrenser vi derfor mengden av substantiver til dem som forekommer minst 10 ganger med possessiv i korpus. Dette reduserer antallet til 1993 substantiver.

Nå kan vi regne ut for hvert av de 1993 substantivene hvor mange prosent av forekomstene som har possessiven foranstilt, og hvor mange som har den etterstilt. Hvis vi ordner disse substantivene fra dem som har flest tilfeller av foranstilt possessiv til dem som har færrest slike tilfeller, fremkommer grafen nedenfor, der substantivene er ordnet langs den horisontale aksen og prosentverdi foranstilt possessiv langs den vertikale:

Det fremgår at litt over halvparten av substantivene – 1002 av dem – har flere tilfeller av foranstilt enn av etterstilt possessiv. 119 substantiver har bare foranstilt possessiv, og 113 substantiver bare etterstilt.  Forøvrig er fordelingen jevnt fallende, med en svak antydning til polarisering i kurveformen (som ikke er en helt rett linje), altså svakt i retning av to kategorier av substantiver.

***
Tilføyelse november 2018:

Tabellen bak grafen ovenfor, med samtlige 1 993 substantiver og deres prosentandel foranstilt possessiv, kan leses på denne siden:

Tabell over 1 993 substantiver med prosentandeler foranstilt possessiv 

***

Semantiske klasser av substantiver

Et blikk på toppen og bunnen av den rangerte listen av substantiver gir et klart inntrykk av at substantivene tilhører ulike semantiske typer på ulike deler av skalaen. Tabellen nedenfor viser  60 av substantivene med bare foranstilte possessiver. Første kolonne viser substantivets lemmaform, annen kolonne viser hvor mange forekomster med possessiv som ble funnet, og tredje kolonne viser hvilken prosentandel av disse som hadde possessiven foranstilt.

Flest foranstilt:

Substantivlemma # med possessiv % foranstilt
anliggende 25 100,0
attrå 15 100,0
barneliv 10 100,0
bekostning 27 100,0
besittelse 16 100,0
besøkelsestid 16 100,0
biologi 10 100,0
borger 10 100,0
breddegrad 16 100,0
datasett 13 100,0
dimensjon 10 100,0
domene 11 100,0
dommer 12 100,0
dust 30 100,0
dødsdag 22 100,0
egenart 22 100,0
eie 18 100,0
element 30 100,0
elsk 21 100,0
enhet 11 100,0
enkelhet 21 100,0
ess 27 100,0
fanden 19 100,0
farvann 19 100,0
fatteevne 13 100,0
favør 21 100,0
feiging 12 100,0
fjols 26 100,0
forbløffelse 32 100,0
forehavende 10 100,0
forholdsregel 26 100,0
fornedrelse 12 100,0
generasjon 73 100,0
gjennomgang 16 100,0
grandonkel 19 100,0
gru 19 100,0
gunst 24 100,0
halvpart 13 100,0
helhet 78 100,0
hellighet 10 100,0
hovedpoeng 13 100,0
høyhet 50 100,0
indre 176 100,0
innblanding 10 100,0
inntog 36 100,0
ja 19 100,0
jævel 40 100,0
kjennskap 15 100,0
kjøter 24 100,0
kontekst 18 100,0
kulde 15 100,0
legitimitet 10 100,0
lengde 39 100,0
likemann 19 100,0
ludder 17 100,0
lære 18 100,0
læremester 18 100,0
majestet 37 100,0
medmenneske 84 100,0

Mange av substantivene er abstrakter (anliggende, besittelse, besøkelsestid, enkelhet, forbløffelse, legitimitet). Andre er skjellsord eller andre tiltaleformer, der bruken av possessiv (som i din tosk!, Deres Majestet) er en egen type som vi bør skille fra i en undersøkelse av allmenn possessivplassering (dust, fanden, feiging, fjols, jævel, kjøter, ludder; hellighet, høyhet, majestet).

Substantivene med bare etterstilte possessiver er annerledes; tabellen viser 60 av dem:

Færrest foranstilt:

Substantivlemma  # med possessiv  % foranstilt
malersaker 12 0,0
mappe 23 0,0
mulesel 12 0,0
mumling 10 0,0
munnhule 10 0,0
nakkegrop 13 0,0
navle 43 0,0
nesetipp 28 0,0
notatbok 15 0,0
overleppe 26 0,0
pakk 11 0,0
pickup 18 0,0
pinn 10 0,0
rull 12 0,0
rumpeballe 27 0,0
ryggrad 53 0,0
ryggsekk 35 0,0
ræv 17 0,0
saksbehandler 14 0,0
serk 41 0,0
shorts 16 0,0
skinnjakke 19 0,0
skjørtekant 13 0,0
skolesekk 10 0,0
skolisse 29 0,0
skosåle 12 0,0
skotupp 30 0,0
skuff 39 0,0
skulderblad 16 0,0
skulderveske 10 0,0
skur 11 0,0
smilehull 13 0,0
sokk 39 0,0
sovepose 27 0,0
sperma 10 0,0
spilling 10 0,0
steg 16 0,0
stereoanlegg 14 0,0
strupehode 12 0,0
sytøy 16 0,0
sølv 17 0,0
tommelfinger 12 0,0
tomt 18 0,0
trommehinne 14 0,0
truse 56 0,0
tull 10 0,0
tungespiss 24 0,0
tørkle 16 0,0
undulat 11 0,0
utgift 12 0,0
venstrehånd 11 0,0
vesla 43 0,0
vest 10 0,0
vorte 20 0,0
ytterklær 10 0,0
ølglass 14 0,0
øreflipp 43 0,0
øregang 11 0,0
ørering 13 0,0
øyekrok 39 0,0
øyenvippe 36 0,0

Substantivene med bare etterstilt possessiv har et sterkt innslag av konkreter, og særlig kroppsdeler (munnhule, nakkegrop, navle, nesetipp, overleppe, rumpeballe, ryggrad, ræv, smilehull, strupehode, tommelfinger, tungespiss, venstrehånd, øreflipp, øregang, øyekrok, øyenvippe).

Det synes derfor motivert å dele substantivene inn i et antall semantisk definerte klasser, og så se på hvordan possessivene plasseres innenfor hver av dem. En tentativ inndeling (i ikke-overlappende kategorier) er denne:

A. konkreter
B. legemsdeler
C. plagg
D. slekt- og familierelasjoner
E. andre relasjonelle personbetegnelser (arving, elev)
F. skjellsord og andre typiske tiltaleord
G. abstrakter
H. lokaliserbare, tellelige ikke-fysiske størrelser (dag, navn, begravelse) og fysiske størrelser klassifisert ut fra en relasjon (halvpart, motstykke, overflate)
I. Kollektiver (publikum)

En slik inndeling vil selvsagt alltid være diskutabel, blant annet fordi det enkelte ord ofte kan brukes på ulike måter og dermed sortere under ulike kategorier.

Vi skal se på noen få av kategoriene.

Type A: konkreter

531 substantiver ble klassifisert som konkreter. Kurven for prosentdel foranstilt possessiv i denne kategorien er som nedenfor:

Bare 49 av de 531 konkrete substantivene har en overvekt av foranstilt possessiv, og blant disse kan klassifiseringen utvilsomt diskuteres i enkelttilfeller, f.eks. vei, person, dose, distrikt, bredd, himmel, plattform, paradis, landskap, bane, utslipp. Disse kan være brukt i abstrakte betydninger, noe vi ikke har undersøkt her. Nærmere bunnen, med få eller ingen foranstilte possessiver, finner vi f.eks. bikkje, pust, lommebok, skrivebord, veske, bylt, dørstokk, gaffel, gardin, kule, leppestift, håndkle.

Det er tydelig at egenskapen ‘konkret’ favoriserer etterstilt possessiv.

Type B: legemsdeler

154 substantiver ble klassifisert som navn på legemsdeler. Denne kategorien favoriserer etterstilt possessiv enda tydeligere enn konkreter generelt gjør:

I denne kategorien har alle substantivene bortsett fra to en sterk overvekt av etterstilt possessiv. De to unntakene legeme og skjød er markert i diagrammet (hans legeme, hennes skjød), og illustrerer at stil og sjanger, i tillegg til semantikk, er en virksom faktor.

Betegnelser på legemsdeler skiller seg ofte ut grammatisk. På norsk, i motsetning til på engelsk, blir possessiv ofte ikke brukt ved slike betegnelser (Han skadet armen vs. He hurt his arm), men når de brukes, blir de altså nesten alltid etterstilt. Possessivforholdet ved legemsdeler er av den art som gjerne kalles ‘inalienable possession’ – ‘uavhendelig eiendom’: armen din er fortsatt i en viss forstand din arm om den så skulle være amputert og solgt. I en konkret sammenheng vil derfor eiendomsbesitteren være klart gitt. Det kan bidra til å forklare at possessiven ofte utelates på norsk – og antagelig også at den såpass konsekvent etterstilles når den brukes.

Type G: abstrakter

638 substantiver ble klassifisert som abstrakter: egenskaper, tilstander, handlinger og prosesser. Ved disse dominerer de foranstilte possessivene klart:

Her har 590 av de 638 substantivene overvekt av foranstilt possessiv; 72 av disse har bare foranstilt. Blant de sistnevnte, med bare foranstilt, finner vi f.eks. indre, ytre, helhet, generasjon, utspring, prakt, lengde, virke, sammenheng, inntog, visdom, forbløffelse, premiss, forholdsregel, anliggende, varetekt, gunst, årsak, egenart, motsetning, favør, tilslutning.  Lenger ned, blant dem som ligger i området 50 – 60 % foranstilt possessiv, finner vi f.eks. svik, dilemma, problem, offer, vanskelighet, utroskap, begjær, oppvekst, stolthet, hemmelighet tyngde, fremtid, unnskyldning, omtanke, nysgjerrighet, omsorg. Og nederst på listen, fra under 20 % og ned til 0 % foranstilt, finner vi abstraktene nervøsitet, erting, skriving, mas, kjøring, stahet, drikking, spilling, tull. Det er ikke vanskelig å se semantiske føringer eller sjangerføringer i denne videre inndelingen av abstraktene.

Grunnene til denne ulike behandlingen av abstrakter og konkreter, særlig kroppsdeler, er verd et videre studium. En mulig tanke er at det kan være en tendens til at det elementet – possessiven eller substantivet – som er viktigst for å identifisere den tingen det refereres til, kommer først. Konkreter identifiseres gjennom sine synlige egenskaper. Man kan først identifisere en viss kontordør, og deretter spørre hvem den tilhører. Men man kommer ikke over et tilfelle av forbløffese og spør deretter hvem sin forbløffelse dette mon være. En forbløffelse identifiseres ikke uavhengig av den som har den. Derfor, kanskje, er hennes forbløffelse, med hennes først, oftest mest funksjonelt, mens derimot kontordøren hennes naturlig nevner objektet først. Men dette kan utvilsomt diskuteres.

Fordelingen i nynorsk

Den nynorske delen av trebanken utgjør bare ca. 10 % av den, så her er tallene lavere. Som ventet finner vi en sterkere overvekt av etterstilt possessiv der:

Possessivplassering i nynorsk, globalt:

Possessiv-plassering

Antall

Foran

7 785

Etter

23 180

Mens bokmål hadde ca. 40 % foranstilte possessiver i løpende tekst, har nynorsk bare ca. 25 % foranstilt. (Dette tallet kan være enda lavere; mulige feilanalyser er ikke sortert fra her.)

Her er et lite utvalg eksempler med foranstilte possessiver i nynorsk tekst.

Nynorske eksempler på foranstilte possessiver:

Så gjekk han sin veg.
– Eg skal inn og leggja att desse pengane til mi vakre mor, sa ho.
Det låg rekkjehus på den andre sida av vegen, og kvart hus hadde sin vesle hage.
– Det er mitt motto!
Det var gått lang tid, men folk som ut frå barndommens tidsrekning skulle vore utgamle eller døde, gjekk framleis rundt i sin beste alder.
Etter Dicks tid er det absolutt ingen ting som stemmer i min bar[n]doms Karviland.
Dei grov fram sine gamle jordskiftebrev, og studerte dei gulna dokumenta.
Frå denne dagen var han opptatt av å snu lagnaden til sine etterkommarar frå dei blinde katastrofar som råkar oss.
Så hard var fødselen at minnet til sonesonen ikkje tok til å fungere før femten månader etter at han fall i sin første slumrande søvn.
Men det var eitt eller anna i lufta som var på «hans side».
Englar oppfyller dine ønske.
I sin debutroman «Kvalmen» frå 1938 er det nettopp livstrøyttleiken, den smertelege erfaringa at eksistensen går i oppløysing, som blir skildra.
Etter vår meining er det viktig å skapa eit omsorgsomgrep og ein omsorgspraksis som er ukjønna, der kvinner og menn på like vilkår kan delta i omsorga for barna sine.
Vi har vel våre partibøker, mange av oss framleis, – men dei færraste går på politiske møte.
I våre dagar har vi professorar i filosofi, men ingen filosofar.
Det kan då vere på sin plass å forfølgje diskusjonen om grensene for kva eit moderne fleirkulturelt samfunn kan vere – i forlenging av det vi ovanfor nemnde om føringar i moderne samfunn.
Fluga er vi, flaska vår sorg, vårt elende.
Dermed vart deira motstand mot arabisk styre mye meir innbiten, og kampen mye meir brutal enn i andre koloniar.
Det er altså aviser og nyheiter, kjendisar og forbruksvarer som er blitt felles referanseramme i vår tid?
Mellom desse krigsbolkane vart skattetrykket redusert, men aldri ned til sitt tidlegare nivå.
Danskane fekk sine «sterke jydar» og nordmennene sine haugianarar.
Det som er interessant med meg som forfattar, er ikkje mi livshistorie, men min forfattarprofesjonalitet.

‘ei jente’ eller ‘en jente’?

Innledning

Bruk av en som ubestemt artikkel også ved hunkjønnsord (en jente – jenta) har vært offisielt akseptert innenfor bokmål i hvert fall siden 1959, i de første årene med unntak for en viss gruppe substantiver, men i hvert fall fra 80-tallet uten slike uttrykte restriksjoner. Dette er også i overensstemmelse med talemålsutviklingen enkelte steder. I Oslomål (og ikke bare i ‘Vest’) er en blitt den dominerende artikkelformen også ved substantiver som får -a i bestemt form entall. En lignende utvikling ser vi i Tromsø. Utviklingen innebærer at artikkelformen en i disse varietetene blir umarkert for distinksjonen mellom hankjønn og hunkjønn, og bare markerer ikke-intetkjønn, slik f.eks. demonstrativen den allerede gjør.

I dette innlegget vil jeg se nærmere på hvordan situasjonen for bruk av ubestemt artikkel ved hunkjønnssubstantiver er i skriftlig bokmål, med grunnlag i tekstmaterialet i trebanken NorGramBank. (Valg mellom han- og hunkjønn i bestemt form entall – gata vs. gaten – er diskutert i et annet blogginnlegg.) Vi skal se på den delen av bokmålsmaterialet som omfatter avistekst, sakprosa, barnelitteratur og romaner (originale og oversettelser), ca. 45 millioner ord.

Tall for 200 hunkjønnsord

Vi betrakter først de globale tallene for de 200 mest frekvente hunkjønnsordene, før vi ser på fordelingen mellom forfattere ved ett utvalgt substantiv (jente). En tilbøyelighet til å bruke ubestemt artikkel en ved et substantiv selv om man ellers bruker -a i bestemt form, kan indikeres gjennom det relative antall bestemte -a-former vs. -en-former sammenlignet med det relative antall ei vs. en som ubestemt artikkel. Søket omfattet følgende 200 substantiver:

adresse, analyse, anledning, art, aske, avdeling, avhandling, avis, befolkning, behandling, bestemor, bevissthet, blokk, bluse, bok, bro, brygge, bukse, bygd, bygning, celle, dagbok, dame, datamaskin, datter, dronning, drosje, dukke, dyne, dør, elv, ensomhet, eske, evne, ferd, flaske, forestilling, forklaring, form, forretning, forsamling, forskning, fortelling, fortid, fremtid/framtid, frihet, frue, gate, glede, grav, grense, gruppe, hake, handling, havn, helg, helse, hemmelighet, hensikt, historie, hjelp, hofte, holdning, hud, hue, hule, hylle, hytte, hånd, håndflate, jakke, jakt, jente, jord, jul, kai, kasse, kirke, kiste, kjerne, kjærlighet, klasse, klokke, kone, kraft, kulde, kule, kvinne, kåpe, lampe, leilighet, lengde, leppe, linje, liste, lomme, lommebok, lue, luft, luke, lukt, lykke, lykt, løsning, makt, mark, maskin, melding, melk, menighet, mening, mor, mulighet, munnvik, natt, nese, nyhet, nærhet, næring, olje, oppgave, oppmerksomhet, ordning, overflate, pakke, panne, pike, plante, plate, postkasse, presse, prinsesse, pute, regjering, reise, rekke, retning, rettssak, ro, rolle, rute, råd, sak, samvittighet, sannhet, seng, setning, side, sjel, skjorte, skråning, skulder, skumring, skyld, skål, slekt, slette, sol, sorg, spenning, stemning, stillhet, stilling, stjerne, strand, stue, støtte, søster, tante, taushet, tegning, tekst, tid, trapp, trening, tro, tunge, tåke, uke, ulykke, undervisning, uro, usikkerhet, utdannelse/utdanning, utfordring, utsikt, utvikling, vaksine, vakt, vekt, venninne, veske, virkelighet, virkning, virksomhet, vogn, økning, øy, åpning, årsak

For disse substantivene globalt finner vi følgende tall:

Kategori

Form

Frekvens

Bestemt form

-en

296 407

-a

77 641

Ubestemt artikkel

en

63 373

ei

3 393

Dette innebærer at bestemt form på -en er 3,8 ganger så vanlig som bestemt form på -a, mens ubestemt artikkel en er hele 18,7 ganger så vanlig som ubestemt artikkel ei. Det tyder på at mange forfattere antagelig har ubestemt artikkel en og bestemt form på -a ved noen av de samme substantivene. Det ser vi nærmere på i neste avsnitt, for et utvalgt substantiv.

Substantivet jente hos forfatterne

jente er blant substantivene med færrest forekomster av -en i bestemt form entall – bare 2,49 % av tilfellene (se tabell fra blogginnlegget ‘‘‘jorda’ eller ‘jorden’?’). Vi finner følgende frekvenstall i korpus, der vi også tar med antallet forfattere eller oversettere bak formene:

 

Kategori Form Frekvens Antall forfattere
Bestemt form

jenten

102

21

jenta

4095

378

Ubestemt artikkel

en jente

1610

329

ei jente

690

190

Tendensen i tallforholdene mellom bestemt og ubestemt form fra den globale tabellen er forsterket i tabellen for substantivet jente: Bare et lite mindretall forfattere skriver jenten som alternativ til jenta, mens betydelig flere skriver en jente enn ei jente. (Noen forfattere er med i begge gruppene og skriver både en jente og ei jente; se nedenfor.) Blant de 21 forfatterne som skriver jenten, finner vi blant andre Liv Margareth Alver, Jens Bjørneboe, Tomas Espedal, Stig Holmås, Vibeke Løkkeberg, Torborg Nedreaas, Arthur Omre, Fredrik Skagen og Gunnar Staalesen.

Spørsmålet om utviklingen av den grammatiske status til ubestemt artikkelform en kan belyses ved at vi tar for oss de 378 forfatterne som skriver jenta og undersøker hvor mange av dem som bruker ubestemt artikkel en, og hvor mange som bruker ubestemt artikkel ei:

Kombinasjon hos samme forfatter Antall forfattere
1. jenta 378
2. jenta; ubest. art. + jente 284
3. jenta; en jente 199
4. jenta; ei jente 143
5. jenta; en jente; ei jente 58

I tabellen angir rad 1 antallet forfattere som bruker formen jenta. Forfatterne i de neste radene er alle undermengder av disse – de bruker altså alle formen jenta. Rad 2 viser antallet forfattere – 284 – som i tillegg til jenta også bruker ubestemt form av jente med artikkel minst én gang. Radene 3-5 angår undermengder av disse, altså bare forfattere som både skriver jenta og har minst én forekomst av ubestemt artikkel ved dette substantivet. Rad 3 viser da at kombinasjonen jenta og en jente forekommer hos 199 forfattere, og rad 4 at kombinasjonen jenta og ei jente forekommer hos 143 forfattere. Rad 5 viser antallet forfattere som bruker både en jente og ei jente (i tillegg til jenta): disse 58 forfatterne er også med i radene 3 og 4 og utgjør snittmengden av disse to mengdene.

Rad 5 viser at variasjonen mellom en og ei i kombinasjon med -a ikke bare gjelder tekstuniverset som helhet, men i noen tilfeller også den enkelte skribent. Hele 58 forfattere/oversettere bruker begge formene. Her bør riktignok den faktiske bruken vurderes nærmere – f.eks. i hvilken grad siterte replikker, stilistisk variasjon o.l. er involvert .

Blant de 199 forfatterne som bruker en jente i kombinasjon med jenta, finner vi for eksempel Ola Bauer, Ari Behn, Bjørg Bjørsvik, Finn Carling, Sigurd Evensmo, Knut Faldbakken, Jostein Gaarder, Maria Gripe, Vera Henriksen, Vigdis Hjorth, Frid Ingulstad, Erik Kullerud, Unni Lindell, Arthur Omre, Anne B. Ragde, Margit Sandemo, Fredrik Skagen, Wera Sæther og Else Marie Winsnes.

Blant de 143 som bruker ei jente i kombinasjon med jenta, finner vi for eksempel Widar Aspeli, Geir Brandstadmoen, Knut Grønvik, Eli Haugen, Ellen Hofsø, Kåre Holt, Øivind Hånes, Rønnaug Jarlsbo, Arild Kolstad, Gunnar Lunde, Øystein Lønn, Atle Næss, Mari Osmundsen, Vigdis Rabben, Kari Sverdrup og Trond Vidar Vedum.

Blant de 58 som bruker både en jente og ei jente, finner vi for eksempel Selma Lønning Aarø, Ingvar Ambjørnsen, Elin Brodin, Niels Fredrik Dahl, Torolf Elster, Nils-Petter Enstad, Karin Fossum, Jørgen Gunnerud, Klaus Hagerup, Tormod Haugen, Torill Thorstad Hauger, Anne Holt, Roy Jacobsen, Gunvor Kloster, Per Knutsen, Britt Karin Larsen, Sidsel Mørck, Erna Osland, Tande-P., Tor Torkildsen og Hanne Ørstavik.