Datengrundlage

Die Studie zu ‚groß‘ und ‚klein‘ beruht auf Daten aus DeReKo (Deutsches Referenzkorpus), die mit Hilfe der Statistischen Kookkurrenzanalyse (Belica 1995) vorstrukturiert wurden. Auf dieser Basis wurden die Wortverbindungen und Wortverbindungsmuster der Wortformen ‚groß‘ und ‚klein‘ herausgearbeitet und analysiert, die auf diesen Seiten dargestellt sind.

Die zwei Grundabfragen zu ‚groß‘ und ‚klein‘ beruhen dabei auf der Gesamtmenge des Archivs der geschriebenen Sprache des DeReKo. Die Treffermengen wurden per Zufallsauswahl auf jeweils 20 000 KWIC-Belege reduziert.

Die Zusatzabfragen zu anderen Adjektiven wurden auf Basis der öffentlichen Korpora des Archivs gemacht und per Zufallsauswahl auf jeweils 10 000 Treffer reduziert. Alle Abfragen stammen aus dem Zeitraum Juni bis Oktober 2010.

Aufgrund von Urheberrechtsbestimmungen können in der Onlineversion der Wortverbindungsfelder allerdings nicht alle aus DeReKo gewonnenen KWIC-Belege angezeigt werden. Die Systematisierung der Wortverbindungen sowie alle Mengen- und Prozentangaben beruhen jedoch auf der Gesamtmenge der untersuchten Belege.

Darstellung und Struktur

Die Wortverbindungen und Wortverbindungsmuster von ‚groß‘ und ‚klein‘ wurden in jeweils drei große Gruppen eingeteilt, die sie nach dem Grad ihrer Fixiertheit zusammenfassen. Dieser bezieht sich auf die Auswechselbarkeit des Elements ‚groß‘ bzw. ‚klein‘ in der jeweiligen Wortverbindung/dem jeweiligen Wortverbindungsmuster. Der Grad der Auswechselbarkeit von ‚groß‘ und ‚klein‘ wurde über COSMAS-Zusatzabfragen ermittelt, die mithilfe des UWV-Tools hinsichtlich potenzieller anderer adjektivischer ‚Lückenfüller‘ analysiert wurden. Die genaue Form der Zusatzabfragen ist im Kommentar-Feld der jeweiligen Wortverbindung angegeben.

Was die weitere Darstellung und Struktur der Wortverbindungen betrifft, verweise ich auf die Benutzerhinweise zu den WV-Feldern.