Struktur der Wortverbindungsfelder

Die Strukturierung der Wortverbindungen erfolgt auf verschiedenen Abstraktionsebenen, die das analytische Vorgehen gemäß des UWV-Analysemodells nachzeichnen. Die folgenden Angaben stellen nur einen kurzen Überblick dar. Ausführliche Informationen zu den Wortverbindungsfeldern und ihren Elementen finden Sie in Steyer/Brunner 2009 (Online-Publikation der OPAL-Reihe des IDS).

Wortverbindungsmuster

Ein Wortverbindungsmuster fasst mehrere Wortverbindungen zusammen, die strukturelle und gebrauchssemantische Gemeinsamkeiten aufweisen. Ihre lexikalischen Komponenten sind austauschbar innerhalb eines Paradigmas.

Wortverbindung

Eine Wortverbindung umfasst alle lexikalischen Realisierungen einer rekurrenten syntagmatischen Einheit, für die sich eine stabile Gebrauchsbedeutung feststellen lässt. Mindestens zwei Elemente einer Wortverbindung stehen in einem statistisch signifikanten Verhältnis zueinander.

LR-Gruppe und LR

Die lexikalischen Realisierungen (LR), die jeder Wortverbindung zugeordnet sind, repräsentieren jeweils typische Formen, in denen die Wortverbindung in konkreten Texten realisiert wird. LRs sind in einer Baumstruktur organisiert und gliedern sich in vier Typen:

Wurzelelement jeder LR-Struktur ist eine LR-Gruppe, der allgemeine WV-Suchmuster zugeordnet sind mit dem Ziel, die Gesamtheit der Realisierungen der Wortverbindung zu umfassen.

Bei LR, die Realisierungen abbilden, die im Korpus zwar vorkommen, aber deren Usualität nicht als gesichert angesehen werden kann, wird der LR-Name grau dargestellt.

Füllerangaben

Füllerangaben können sowohl Wortverbindungen als auch LR zugeordnet werden. Sie enthalten eine kompetenzbasiert zusammengestellte Auswahl von möglichen Elementen oder Elementtypen, die eine systematische Lücke in der rekurrenten Form einer LR oder WV ausfüllen. Solche systematischen Lücken sind im Namen der LR oder WV durch Buchstaben gekennzeichnet.

WV-Suchmuster

Jeder LR und LR-Gruppe sind WV-Suchmuster zugeordnet. Die Suchmuster werden verwendet, um Belegzeilen (KWIC-Cluster) mit ähnlichen rekurrenten Oberflächenmustern zu erkennen und zusammenzufassen. In der Darstellung der Suchmuster sind das Bezugswort des zugrunde liegenden Kookkurrenzprofils grau und primäre Kookkurrenzpartner (also Elemente, die mit statistisch signifikanter Häufigkeit in der Umgebung dieses Bezugswortes vorkommen) orange eingefärbt. Ein hoher Anteil an orangefarbenen Elementen legt also nahe, dass das Muster als besonders fest betrachtet werden kann.

WV-Suchmuster basieren auf regulären Ausdrücken und bestehen aus fest spezifizierten Zeichenketten ('Wörtern') und Lückenelementen. Folgende Lückenelemente stehen aktuell zur Verfügung:

#steht für ein einzelnes, unspezifiziertes Wort
#* steht für eine Folge von 0 bis beliebig vielen unspezifizierten Wörtern
#+ steht für eine Folge von 1 bis beliebig vielen unspezifizierten Wörtern
N(wort) steht für ein unspezifiziertes Wort, dessen Oberfläche nicht mit 'wort' übereinstimmt
wort1|wort2 steht für die Zeichenkette 'wort1' oder die Zeichenkette 'wort2'

Hinter jedem WV-Suchmuster sind Verweise auf seine Treffermenge (KWIC-Belege) und ggf. Lückenfüller angegeben.

KWIC-Belege

KWIC-Belege sind Textausschnitte, welche bei der Suche nach dem Bezugswort in DeReKo gefunden wurden. Wir stellen Tabellen mit den originalen Belegen zur Verfügung, die durch das jeweilige WV-Suchmuster erfasst werden.

Da es sich bei den KWIC-Belegen um automatisch durch die Suchmuster zusammengefasste Sammlungen handelt, ist nicht immer gewährleistet, dass diese nur Instanzen der aktuellen Wortverbindung enthalten. Auch solche 'Fehler' sind jedoch interessante Befunde, da sie die Grenzen eines rein oberflächenbasierten Identifikationsprinzips illustrieren.

Lückenfüller-Tabellen

Lückenfüller-Tabellen sind zu unterscheiden von den Füllerangaben auf LR- oder WV-Ebene. Es handelt sich hier um rein automatisch generierte Tabellen, in denen die Elemente, die von den Lückenelementen in einem bestimmten Suchmuster erfasst wurden, mit ihrer absoluten und relativen Häufigkeit aufgeführt werden. Die Zeilen dieser Tabellen können durch einen Klick auf die Spaltennamen sortiert werden.