Die Beschreibung der Wortverbindungen erfolgt auf verschiedenen Abstraktionsebenen. Diese sind in der Darstellung anhand der Farben der Knoten in der Überblicksgraphik sowie der Artikel selbst unterscheidbar.
Den Kern des Wortverbindungsfeldes bilden WV(-Muster), die eine "Grund"-Wortform in Kombination mit einer der Präpositionen "auf", "aus", "in", "mit" und "ohne" enthalten. An mehreren Stellen sind darüber hinaus abstraktere WV-Muster angegeben, bei denen die "Grund"-Wortform durch andere lexikalische Komponenten austauschbar ist. Diese Erweiterungen vermitteln einen Eindruck von der Vernetztheit sprachlicher Bausteine auf verschiedenen Abstraktionsebenen und über das eigentliche "Grund"-Feld hinausgehend.
In der Überblicksgraphik ist jede Präposition+Grund-Gruppe in einem Kasten eingefasst, die externen Muster stehen außerhalb der Kästen.
Die Artikel zu den Wortverbindungen und WV-Mustern können folgende Angaben enthalten:
Neben narrativen Beschreibungselementen und manuell ausgewählten Korpusbelegen enthalten die Artikel des Grund-Feldes einige semi-automatisch generierte Angaben, die den Zweck haben, den Gebrauch der beschriebenen Einheit im Korpus quantitativ zu illustrieren.
Bei unseren Analysen verwenden wir Suchmuster, um KWIC-Belege mit ähnlichen rekurrenten Oberflächenmustern zu erkennen und zusammenzufassen. Die Suchmuster basieren auf regulären Ausdrücken und bestehen aus fest spezifizierten Zeichenketten ('Wörtern') und Lückenelementen. Folgende Lückenelemente stehen aktuell zur Verfgung:
# | steht für ein einzelnes, unspezifiziertes Wort |
#* | steht für eine Folge von 0 bis beliebig vielen unspezifizierten Wörtern |
#+ | steht für eine Folge von 1 bis beliebig vielen unspezifizierten Wörtern |
N(wort) | steht für ein unspezifiziertes Wort, dessen Oberfläche nicht mit 'wort' übereinstimmt |
wort1|wort2 | steht für die Zeichenkette 'wort1' oder die Zeichenkette 'wort2' |
Die Suchmuster bilden die Grundlage für die Angabe Automatisch erstellte Füllertabelle. In dieser Angabe werden die Frequenzen der Elemente ausgewertet, die die unspezifizierten Stellen - die 'Lücken' oder Slots - der Suchmuster ausfüllen. Dies vermittelt einen Eindruck davon, welche lexikalischen Realisierungen von Wortverbindungsmustern dominant sind. Lückenfüllertabellen können zudem auch Schreibungs- und Flexionsvarianz abbilden.
Jeder automatischen Füllertabelle folgt die Angabe KWIC. Diese zeigt die KWIC-Belegzeilen, die von dem Suchmuster erfasst wurden und Grundlage der Füllertabelle sind. Wenn die KWIC-Menge sehr groß ist, ist im ersten Schritt nur eine Auswahl zu sehen. Es besteht die Möglichkeit, sich die Slots in den KWIC alphabetisch sortiert anzeigen zu lassen.
Auch diese Tabellen basieren ausschließlich auf automatischen Füllertabellen. Die darin aufgelisteten Füller sind jedoch manuell ausgewählt, sortiert und kommentiert.
Die Artikel binden auch die Ergebnisse von Kookkurrenzanalysen ein, um das Kontextverhalten bestimmter Wortverbindungen zu illustrieren. Die Kookkurrenzanalyse ist ein automatisches Verfahren, das zeigt, welche Wörter überproportional häufig in der Umgebung einer Einheit auftreten. Genauere Erläuterungen zur Kookkurrenzanalyse finden Sie hier.