Søk etter enkel og dobbelt bestemthet

Analysen i trebanken av en frase som det perfekte skjulested ser ut som nedenfor, der vi har tilføyet noen markeringer i rødt for å lette beskrivelsen under.

Analysen består av to deler som er forbundet med hverandre, en konstituentstruktur (c-struktur) og en funksjonell struktur (f-struktur). C-strukturen viser hvordan uttrykket er bygget opp av fraser og delfraser. Toppnoden DP står for ‘determiner phrase’, der determinativen (D) den er hodet. Den knytter til seg en nominalfrase (NP)  med substantivet (N) skjulested som hode. Der er også en attributiv adjektivfrase (AP). F-strukturen består av attributter med verdier og beskriver syntaktiske funksjoner og grammatiske trekk. Øverst ser vi det sentrale predikatet (PRED) ‘skjulested’. Videre ser vi at det har tilknyttet en spesifikator (SPEC) av typen determinativ (DET), nemlig ‘den’. Så er det markert at skjulested er av typen tellbart appellativ (fellesnavn): det har en NTYPE med verdiene ‘count’ og ‘common’. Kjønn er markert som NEUT = + under GEND. Adjektivet er analysert som et ADJUNCT – en modifiserer – med egne trekk, blant annet ATYPE = attributive. Endelig ser vi at substantivet har verdier for person, tall og definitthet.

Verd å merke seg i vår forbindelse er trekker DEF-MORPH, som står for bestemt form. Her er verdien minus: -; hadde det stått skjulestedet, ville den ha vært +. At hele frasen uansett er definitt, er markert med DEF = +.

Vi ønsker da å søke etter slike fraser, og få dem sortert etter hvorvidt de er enkelt eller dobbelt bestemt, altså etter hvorvidt DEF-MORPH er – eller +, og dessuten sortert på de substantivene som opptrer i dem. Det siste fremgår av verdien av PRED øverst i f-strukturen, der markert med variabelnavnet #p. Uttrykket kan for eksempel formuleres slik:

DP >> #f_ >DEF-MORPH #def & #f_ >PRED #p & #f_ >(ADJUNCT $) #g_ >ATYPE ‘attributive’

Uttrykket sier at vi har en node DP i c-strukturen, og den ‘projiserer’(>>), altså er knyttet til, en f-struktur som vi kaller #f_. Denne #f_ har et attributt DEF-MORPH med en verdi vi kaller #def (og som vil være + eller -), og denne verdien vil vi ha skrevet ut. Det fremgår av at variabelnavnet #def ikke inneholder noen understrekning. Videre har #f_ et attributt PRED (substantivets predikatnavn), som vi kaller #p og også vil ha skrevet ut. Endelig har #f_ også et ADJUNCT #g_ som har ATYPE attributive.

Hvis vi søker i en del av trebanken med dette uttrykket, kan toppen av trefflisten f.eks. se slik ut:

For hvert substantiv står her total frekvens for enkelt og dobbelt bestemte fraser  til venstre, deretter frekvensen  for de dobbelt bestemte (under + som verdi til #def), så frekvensen for de enkelt bestemte (under – som verdi til #def), og så substantivets eget predikat.