Transliteration natürlichsprachlicher Texte

Der Begriff Transliteration beschreibt die Umschrift von Schriftzeichen von einem Alphabet in ein anderes, wie z.B. vom griechischen ins lateinische Alphabet. Darüber hinaus wird der Begriff aber auch dann verwendet, wenn eine Umschrift innerhalb des selben Alphabets erfolgt, beispielsweise um durch eine Transliteration diakritische Zeichen durch eine Sequenz von Zeichen zu ersetzen, die ihnen im Basisalphabet am nächsten sind (beispielsweise "Ä" zu "ae" im Deutschen).

Die Software Lingua::Translit ist ein Perl Modul mit dessen Hilfe sich natürlichsprachlicher Text anhand verschiedener nationaler und internationaler Standards von einem Schriftsystem in ein anderes transliterieren lässt. Das Modul ist, wie in der Perl Community üblich, auf CPAN veröffentlicht worden und steht unter einer Open Source/Free Software Lizenz zur Verfügung. Eine detaillierte Lizenzbeschreibung findet sich unter Lizenz.

Zeitungen in einer Vielzahl an Sprachen und Schriftsystemen

Lingua::Translit unterstützt eine Vielzahl sowohl nationaler alsauch internationaler Standards, wie z.B. ISO 9 und DIN 31634. Eine vollständige Liste findet sich unter "Unterstütze Standards".

Das Lingua::Translit Perl Modul verfügt über eine einfach zu benutzende, objektorientierte Schnittstelle (API) und lässt sich mit geringem Aufwand durch das Erstellen eigener Zeichentabellen in einer dazu geschaffenen XML-Sprache intuitiv erweitern. Weitere diesbezügliche Details, Beispiele und Vorlagen sind im Entwicklerhandbuch zu finden.

Lingua::Translit wird aktiv weiterentwickelt - sowohl von Lingua-Systems, als auch durch Beiträge aus der Perl Community. Für den kommerziellen Einsatz bieten wir zusätzlichen Support an.

Für Anregungen, Fehlerbeschreibungen, Patches und eigene Transliterationstabellen stehen wir Ihnen unter der Kontaktadresse perl@lingua-systems.com zur Verfügung.

Danksagung

Vielen Dank an Dr. Daniel Eiwen vom Romanischen Semniar der Universität Köln für seine Unterstützung bei der Implementierung der Transliterationstabellen für das Rumänische ("Common RON").

Vielen Dank an Bayanzul Lodoysamba für das Beisteuern der Transliterationstabelle für das klassische Mongolisch ("Common Classical Mongolian").