Computerlinguistische Methoden durchdringen unseren Alltag, etwa in Form von Suchmaschinen und Chatbots. Aber auch für die geisteswissenschaftliche Textanalyse bieten sie große Potenziale, die unter anderem in den Digital Humanities erschlossen werden. Der Band bietet eine niedrigschwellige Einführung in die Computerlinguistik für Geisteswissenschaftler:innen, ohne Erfahrungen mit Mathematik oder Programmieren vorauszusetzen. Es wird gezeigt, wie distributionelle Semantik, Sentimentanalyse, Named Entity Recognition, manuelle Annotation, maschinelles Lernen und Co. neue Zugänge zu Texten eröffnen und wie diese Methoden gewinnbringend für geisteswissenschaftliche Fragestellungen eingesetzt werden können. Alle Kapitel werden von Übungen und einem digitalen Anhang mit Musterlösungen und Beispielskripten in Python begleitet. Vom theoretischen Fundament bis zu den Werkzeugen für die praktische Umsetzung vermittelt der Band alle Grundlagen für den Einstieg in dieses spannende interdisziplinäre Forschungsfeld.
Cuprins
1 Einleitung
Teil I: Linguistische Ausgangspunkte
2 Lexik
3 Wortarten
4 Syntax
5 Semantik: Wortfelder
6 Semantik: Sentimentanalyse
7 Semantik: Distributionelle Semantik
8 Pragmatik: Referenz
Teil 2: Methoden
9 Korpussuche und -statistik
10 Manuelle Annotation
11 Maschinelles Lernen
12 Deep Learning
Teil 3: Gesellschaft
13 Computerlinguistik und Ethik
Ressourcenverzeichnis
Literaturverzeichnis
Sachregister
Despre autor
Dr. Melanie Andresen hat über neun Jahre an den Universitäten Hamburg und Stuttgart in der Linguistik, Computerlinguistik und den Digital Humanities gelehrt und geforscht. Seit 2024 arbeitet sie bei Deep L an der Verbesserung maschineller Übersetzung.