childLex (German Children‘s Book Corpus)
Das Kinder-Korpus childLEX
Wann und wie häufig lesen Kinder verschiedene Wörter und Wortverbindungen? Wie entwickelt sich die Schriftsprache für Kinder im Deutschen? Das Kinder-Korpus childLex beantwortet diese Fragen.
childLex ist ein Kooperationsprojekt mit der Universität Potsdam und der Berlin-Brandenburgischen Akademie der Wissenschaften. Das Korpus umfasst über 10 Millionen Wörter, die in einer Auswahl von 500 Kinder- und Lesebüchern enthalten sind. Die Bücher decken den Altersbereich von 6-12 Jahre ab und können entweder insgesamt oder in drei verschiedenen Altersgruppen (6-8, 9-10, 11-12 Jahre) getrennt abgefragt werden. Dabei werden die meisten linguistisch und psychologisch relevanten Variablen für ca. 200.000 unterschiedliche Wörter zur Verfügung gestellt.
childLex ist frei zugänglich und kann sowohl von interessierten Forscherinnen und Forschern als auch von Lehrkräften, Sprachtherapeuten oder Logopäden dazu genutzt werden, bessere, kindgerechte Untersuchungs- und Trainingsmaterialien für das Deutsche zu erstellen.
Die aktuellste Fassung von childLex (Version 0.15.01, Januar 2015) ist in zwei verschiedenen Formen verfügbar. In einer Excel-Tabelle (42 MB) ist eine Auswahl von Variablen für eine reduzierte Anzahl von Wörtern verfügbar (s. Download). Gleichzeitig kann childLex auf eine Online-Plattform abgefragt werden, die zusätzliche Variablen und Abfragemöglichkeiten zur Verfügung stellt. Die Seite befindet sich gerade im Aufbau, eine vorläufige und vom Inhalt leicht veraltete Version ist unter http://alpha.dlexdb.de/query/childlex/childlex/typ/filter/ verfügbar. Bald wird aber eine aktuelle Version unter www.childlex.de voll verfügbar sein.
Wenn Sie childLex in Ihrer Arbeit verwenden, beziehen Sie sich bitte auf folgenden Artikel, in dem das childLex-Korpus näher beschrieben wird (s. Downloads):
Schroeder, S., Würzner, K.-M., Heister, J., Geyken, A., & Kliegl, R. (2015). childLex: A lexical database of German read by children. Behavior Research Methods, 47, 1085-1094. doi:10.3758/s13428-014-0528-1
Zum Artikel
Ein deutschsprachiger Artikel, das einen etwas anderen Schwerpunkt hat, ist ebenfalls verfügbar (s. Downloads):
Schroeder, S., Würzner, K.-M., Heister, J., Geyken, A., & Kliegl, R. (2015). childLex: Eine lexikalische Datenbank zur Schriftsprache für Kinder im Deutschen. Psychologische Rundschau, 66, 155-165. doi:10.1026/0033-3042/a000275
Downloads
Die Excel-Tabelle ist im Download-Bereich mit dem Passwort "read" zu finden.
Max-Planck-Institut für Bildungsforschung · Lentzeallee 94 · 14195 Berlin · +49 30 82406-0 · info [at] mpib-berlin.mpg [dot] de
Kontakt
Bei Fragen oder Anregungen zu childLex wenden Sie sich bitte an
sascha [dot] schroeder [at] mpib-berlin [dot] mpg [dot] de