Sprachidentifizierer / Zeichenkodierungsidentifizierer
Lingua-Systems' Sprachidentifizierer stellen Ihnen zwei wichtige
Informationen zur Verfügung: die Sprache und die Zeichenkodierung eines
Textes.
Wenn Sie Text verarbeiten bedeutet das für Sie, dass sie mit diesen
Informationen die Möglichkeit bekommen, alle weiteren Schritte darauf
abzustimmen.
Sie können sprachspezifisch arbeiten, Besonderheiten berücksichtigen,
gezielter vorgehen und damit die Qualität Ihrer Anwendungen steigern.
Identifizieren Sie Sprache und Zeichenkodierung, und setzen Sie diese
Informationen ein, um sich und Ihren Kunden neue Möglichkeiten zu eröffnen.
Die Einsatzmöglichkeiten sind vielfältig!
Um verschiedenen Einsatzmöglichkeiten gerecht zu werden, stehen Lingua-Systems' Sprachidentifizierer in verschiedenen Varianten zur Verfügung:
- lid
- C/C++ Bibliothek zur Bestimmung von Sprache und Zeichenkodierung eines Textes
- lidc
- Programm zur Bestimmung von Sprache und Zeichenkodierung
- Lingua::Lid (Open Source)
- Perl Schnittstelle zur C/C++ Bibliothek lid
Weitere Informationen zu allen verfügbaren Sprachidentifizierern finden Sie hier. Das was Sie suchen ist nicht dabei? Sprechen Sie uns an, wenn Sie an einer weiteren Variante interessiert sind.
Transliteration / Umschrift
Transliteration ist die Übertragung eines Textes von einem Schriftsystem in ein anderes Schriftsystem, wie zum Beispiel die Übertragung vom griechischen in das lateinische Alphabet. In der Praxis fällt allerdings noch viel mehr unter diesen Oberbegriff: jegliche Umschrift in eine andere Form, wie zum Beispiel das Auslassen von Sonderzeichen.
Mit dieser Software können Sie die Umschrift von Texten verschiedener Schriftsysteme ganz einfach automatisiert vornehmen. Es sind bereits viele Tabellen zur Umschrift nach internationalen und nationalen Standards integriert. Darüber hinaus stehen Tools zur Verfügung, mit deren Hilfe Sie leicht eigene Regeln im XML Format schreiben und integrieren können.
- Lingua::Translit (Open Source)
- Perl Modul zur Transliteration von Text verschiedener Schriftsysteme








