Linguistically annotated corpora are becoming a central part of the corpus linguistics field. One of their main strengths is the level of searchability they offer, but with the annotation come problems of the initial complexity of queries and query tools. This book gives a full, pedagogic account of this burgeoning field. Beginning with an overview of corpus linguistics, its prerequisites and goals, the book then introduces linguistically annotated corpora. It explores the different levels of linguistic annotation, including morphological, parts of speech, syntactic, semantic and discourse-level, as well as advantages and challenges for such annotations. It covers the main annotated corpora for English, the Penn Treebank, the International Corpus of English, and OntoNotes, as well as a wide range of corpora for other languages. In its third part, search strategies required for different types of data are explored. All chapters are accompanied by exercises and by sections on further reading.
Die Korpuslinguistik analysiert Sammlungen authentischer gesprochener und geschriebener Sprache, sog. Korpora, auf überwiegend quantitative Weise. In diesem Band wird anhand konkreter Beispiele gezeigt, welche Korpora des Deutschen es gibt, wie man sie durchsuchen kann und wie man bei Bedarf ein eigenes erstellt. Ein Schwerpunkt liegt dabei auf linguistischen Annotationen, die die Texte beispielsweise um Informationen zu Wortarten, Syntax oder Diskursphänomenen ergänzen und dadurch die Bearbeitung weiterer linguistischer Fragestellungen ermöglichen. Diese Einführung stellt Abfrage und Auswertung vorhandener Annotationen sowie manuelle und automatische Möglichkeiten für eine eigene Annotation Schritt für Schritt vor. Ein abschließendes Kapitel ist der Frage gewidmet, wie man korpuslinguistische Ergebnisse z. B. in einer germanistischen Hausarbeit präsentiert. Das Buch richtet sich primär an Studierende der (germanistischen) Sprachwissenschaft einschließlich Lehramt und bietet einen ersten, praktischen Zugang zur Korpuslinguistik.
No image available
· 2014
Zum Lehramtsstudium im Fach Deutsch gehört ein solides Basiswissen der Sprachwissenschaft. "Sprachwissenschaft für das Lehramt" erklärt alles, was L.
No image available
No image available
No image available
No image available
No image available
· 2006
This report explores the question of compatibility between annotation projects including translating annotation formalisms to each other or to common forms. Compatibility issues are crucial for systems that use the results of multiple annotation projects. We hope that this report will begin a concerted effort in the field to track the compatibility of annotation schemes for part of speech tagging, time annotation, treebanking, role labeling and other phenomena.
No image available