Was ist Computerlinguistik?
Die Computerlinguistik ist noch ein verhältnismäßig junges Fach: Die ersten Studiengänge sind weltweit in den achtziger Jahren entstanden. Computerlinguisten erforschen menschliche Sprache, wofür sie formale Modelle verwenden, die auf dem Computer realisiert werden können.
Computerlinguistik verbindet also Inhalte und Methoden aus der Informatik und der Sprachwissenschaft und benutzt dabei Teile der Mathematik (vor allem formale Logik und Statistik) als Grundlage. Auf diese Weise gewinnt sie Erkenntnisse über die Lautstruktur, die Satzstruktur und die Bedeutungsstruktur von Sprachen und über die Art und Weise, wie Menschen Sprache verstehen, produzieren und lernen.
Diese Erkenntnisse werden zur Entwicklung von Computersystemen angewendet. Beispiele für sprachverarbeitende Systeme sind:
- Natürlichsprachliche Zugangssysteme, die den Dialog mit dem Computer in gesprochener und geschriebener Sprache ermöglichen – z.B. unser sprechender Fahrstuhl :-)
- Textverstehende Systeme, die automatisch Wissen aus Dokumenten extrahieren – mit der Frage, wie man Grammatik aus Texten extrahiert, befasst sich zum Beispiel das NEGRA-Projekt.
- Maschinelle übersetzungssysteme wie das System des berühmten Verbmobil-Projektes.
- Systeme für Rechtschreib-, Grammatik- und Stilkorrektur, die das Formulieren in einer Fremdsprache erleichtern.
Wenn man ehrlich ist, muss man allerdings hinzufügen, dass die heute verfügbaren Systeme noch nicht der Weisheit letzter Schluss sind. Es muss also noch viel Grundlagenforschung betrieben werden. Auch in diesem Bereich gibt es in Saarbrücken einige Projekte (zum Beispiel diese hier).
Wer sollte Computerlinguistik studieren?
Wer gerne Rechner programmiert, mit mathematischer Methodik arbeitet und Freude am Umgang mit lebendiger Sprache hat, ist ein idealer Anwärter für das Studium der Computerlinguistik!
Wichtig ist die Bereitschaft, sich auf die verschiedenen Teilbereiche des Studiums einzulassen. Ihr werdet linguistische Formalismen und mathematische Verfahren, aber auch Hilfsmittel wie Unix-/Linux-Werkzeuge verwenden und auch Programmierkursen folgen.
Besondere Vorkenntnisse sind dazu nicht nötig – das Abitur und Aufgeschlossenheit gegenüber Sprachen, Mathematik und Computern genügen, den Rest lernt ihr beim Studium. Ihr solltet außerdem Englisch verstehen, da Literatur und teilweise ganze Vorlesungen in englischer Sprache sein können.
Berufsbild und Berufsaussichten für Computerlinguisten
Forschung
Auch wenn computerlinguistische Produkte zunehmend von Firmen eingesetzt und entwickelt werden, ist Computerlinguistik immer noch eine Schwellentechnologie
: Die Techniken und Arbeitsmittel zum Bau sprachverarbeitender Systeme werden gerade an Forschungsinstituten und Universitäten noch intensiv erforscht und verbessert. Zur Zeit gibt es eine ganze Reihe von computerlinguistischen Forschungsvorhaben dort und in der EDV-Industrie.
Language Engineering
- Kodierung des grammatischen Wissens für eine bestimmte Sprache (Grammatikentwicklung)
- Erfassung des Wortschatzes mit den für die Verarbeitung notwendigen Informationen
- Entwicklung von Transferlexika, die in maschinellen Übersetzungssystemen die Strukturen einer Sprache in die Strukturen einer anderen Sprache überführen.
Zukunftsaussichten
- In den nächsten Jahren wird sich der Markt für die Sprachtechnologie enorm ausweiten und verschiedene Lebensbereiche nachhaltig verändern. Die Nachfrage nach Wissenschaftlern mit Computerlinguistik-Abschluss wird dann stark steigen.
- Das Berufsbild wird sich stärker in den Servicebereich verlagern, wie Wartung und Update von Sprachtechnologiesystemen und Kundenberatung (z.B. beim Zuschnitt von Lexika und Datenbasen für ein persönliches Übersetzungssystem).
Hier eine Präsentation zum Thema "Was ist Computerlinguistik?":