Produktinformationen

lidc zeichnet sich dadurch aus, dass es schnell und zuverlässig die Sprache und die Zeichenkodierung eines Textes bestimmt.

Das Programm unterstützt verschiedene Eingabeformate: E-Mail, HTML, XML und Plain Text. Dadurch kann lidc in vielen Anwendungsbereichen gewinnbringend eingesetzt werden. Die Ausgabe der Ergebnisse kann mit Hilfe eines Formatstrings ganz nach Ihren Wünschen angepasst werden. Diese Möglichkeit eröffnet zusätzlich ein breites Spektrum an Verwendungsmöglichkeiten. lidc als Anwendung für die Kommandozeile macht es ganz einfach möglich, wiederkehrende Abläufe auch automatisiert umzusetzen und damit die Effektivität Ihrer Prozesse zu steigern.

Eigenschaften

Mit lidc haben Sie ein einfach zu verwendendes, sehr flexibles Tool zur Sprachbestimmung zur Hand, das Sie bei Ihrer Arbeit unterstützt.

  • einfach zu benutzen und mit einer überschaubaren und intuitiven Menge an Optionen.
  • ermöglicht über den Aufruf mittels Verkettung (Pipe) einen effektiven Einsatz in komplexeren Abläufen.
  • unterstützt verschiedene Eingabe-Formate.
  • bietet Ihnen maximale Flexibilität bei der Ausgabe der Ergebnisse.
  • erlaubt eine automatisierte Verarbeitung (z.B. in Shell-Skripten).
  • liefert zuverlässige Ergebnisse mit einer hohen Erkennungsrate - und bereits eine kurze Eingabe von etwa fünf Wörtern reicht meist aus, um die Sprache richtig zu bestimmen.
  • kann auch die Sprache bestimmen, wenn ein Text in einer transliterierten Form vorliegt - viele verbreitete Transliterationen werden unterstützt.
  • erkennt eine Vielzahl von Zeichenkodierungen und unterstützt alle gängigen Unicode Kodierungen (außer für E-Mail).

Einen ersten Eindruck über die Leistung der Sprachbestimmung können Sie sich mit der Online-Demonstration der zugrundeliegenden Bibliothek lid verschaffen. In den Anwendungsbeispielen sehen Sie, wie einfach lidc einzusetzen ist.

Ihre Vorteile

lidc kann vielseitig eingesetzt werden. Die daraus resultierenden Vorteile variieren mit ihrem Einsatzzweck - sehen Sie hier drei Beispiele aus einer Vielzahl von Einsatzmöglichkeiten.

Beispiel 1: Datenbanken

Bevor Sie Datensätze in einer Datenbank ablegen, fügen Sie als zusätzliche Information die verwendete Zeichenkodierung hinzu. Damit stellen Sie sicher, dass die Einträge immer wieder korrekt verarbeitet werden können.

Beispiel 2: E-Mail Tagging und Routing

Integrieren Sie lidc in Ihre E-Mail-Abläufe und erweitern Sie Ihre E-Mails um Sprachinformationen (z.B. "X-Language"-Tag). Dadurch lassen sich E-Mails zuverlässig nach Sprachinformationen an zuständige Personen oder Zweigstellen routen. Darüber hinaus können diese Informationen auch nützlich sein, um bestehende Spamfilter zu optimieren.

Beispiel 3: Korporasammlung

Wenn Sie für die Entwicklung Ihrer Software große Mengen an Sprachdaten benötigen, können Sie lidc bei einer automatischen Korporasammlung einsetzen, um jeweils die Sprache und Zeichenkodierung zu bestimmen und Ihre Daten entsprechend zu taggen, bzw. zu sortieren. Das Sammeln großer Mengen an Daten wird dadurch erheblich erleichtert.

Unterstützte Plattformen

lidc wird für verschiedene Unix-Betriebssysteme zur Verfügung gestellt und im jeweils nativen Paket angeboten.

Betriebssystem Distribution/Version Architektur
Linux Debian Etch (4.0) x86/IA-32
Linux Debian Lenny (5.0) x86/IA-32
Linux Ubuntu LTS (10.04) x86/IA-32
Solaris 10 Sparc
FreeBSD 6 x86/IA-32
FreeBSD 7 x86/IA-32
FreeBSD 8 x86/IA-32

Sollten Sie die Software für ein anderes Betriebssystem oder eine andere Distribution benötigen, nehmen Sie Kontakt mit uns auf.

Voraussetzungen

lidc kommt mit sehr wenig Ressourcen aus und benötigt lediglich die vorhandene C-Bibliothek des jeweiligen Betriebssystems.

  • C-Bibliothek
  • 250 KiB Arbeitsspeicher
  • 1,5 MB Festplattenspeicher

Ausschlaggebend für die Menge an benötigtem Arbeitsspeicher ist die Größe der Eingabe: je größer die Eingabe, desto mehr Arbeitsspeicher wird benötigt.

Ausführliche technische Details entnehmen Sie bitte der Software-Spezifikation.