Produktinformationen

Textweiser Software zur Textklassfifikation

Textweiser ist eine Software, die Texte automatisch kategorisiert. Dafür werden in einem ersten Schritt Kategorien angelegt, die im nächsten Schritt mit exemplarischen Dokumenten trainiert werden. Im Anschluss daran können unbekannte Texte automatisch den Kategorien zugewiesen werden (siehe auch Arbeitsablauf).

Texte nach Kategorien zu strukturieren hilft, das enthaltene Wissen besser zu verwalten und die Verarbeitung zu optimieren. So können zum Beispiel E-Mails gezielt an den passenden Ansprechpartner weitergeleitet werden. Durch Kategorien wird auch ein erweiterter Kontext geschaffen, der eine Suche effektiver machen kann - einen Begriff nur in bestimmten Kategorien liefert gezieltere Suchergebnisse.

Textweiser als Software-Bibliothek ermöglicht es Ihnen, Textkategorisierung als Bestandteil Ihrer eigenen Produkte anzubieten.

Eigenschaften

  • Flexibel einsetzbar
    Textweiser liefert eine Liste mit wahrscheinlichen Kategorien. Ihre Anwendung entscheidet, wie die Ergebnisse zu verwenden sind, zum Beispiel zur automatischen Zuordnung oder als Unterstützung zum manuellen Tagging.
  • Unterstützung für flache oder monohierarchische Kategoriestrukturen (Taxonomien)
    Je nach Anwendungsfall können sowohl flache Strukturen als auch Taxonomien verwendet werden.
  • Linguistische Aufbereitung
    Durch eine linguistische Aufbereitung der Daten werden die Ergebnisse optimiert. Die Aufbereitung ist sprachabhängig und kann bei Bedarf leicht um weitere Sprachen ergänzt werden.
  • Verwendet Unicode
    Mit einem Unicode-Zeichensatz können Texte aller Sprachen verarbeitet werden.
  • Benötigt wenig Trainingsdaten
    Textweiser kommt mit wenig Trainingsdaten aus (ab zehn Dokumenten pro Kategorie).
  • Schnelle Verarbeitung
    Durch optimierte Algorithmen ist die Textkategorisierung schnell und effizient.
  • Leicht zu migrieren
    Die trainierten Klassifikationsdaten werden in einer Datenbank abgelegt. Eine Migration zwischen verschieden Datenbanken oder Betriebssystemen ist leicht möglich.

Lesen Sie mehr über Textweiser in den ergänzenden Produktinformationen für Entwickler und für Entscheider.

Unterstützte Plattformen

Betriebssystem Distribution/Version Architektur
Linux Debian Lenny (5.0) x86, x86_64
Linux Debian Squeeze (6.0) x86, x86_64
Linux Ubuntu LTS (10.04) x86, x86_64
Linux Red Hat Enterprise 5 x86, x86_64
FreeBSD 7 x86
FreeBSD 8 x86
FreeBSD 9 x86
Windows XP x86
Windows Server 2003 x86
Windows Server 2008 x86
Windows 7 x86, x86_64
Windows Server 2008 R2 x86, x86_64

Sollten Sie die Software für ein anderes Betriebssystem oder eine andere Distribution benötigen, nehmen Sie Kontakt mit uns auf.

Unterstützte Datenbanken

Textweiser kann mit verschiedenen Datenbanken verwendet werden. Der Wechsel von einer Datenbank zu einer anderen kann durch mitgelieferte Tools und/oder Bibliotheksfunktionen schnell und einfach vollzogen werden.

Datenbank Version Betriebssystem
SQLite 3 (enthalten) alle
Microsoft SQL Server 2008, 2008 R2 Windows

Die Verwendung von Microsoft SQL Server wird nur auf Microsoft Windows Betriebssystemen unterstützt.

Sollten Sie eine Datenbankanbindung benötigen, die Textweiser derzeit nicht unterstützt, nehmen sie Kontakt mit uns auf.

Schnittstellen

  • C/C++
  • Java (in Kürze verfügbar)
  • Perl (in Kürze verfügbar)

Voraussetzungen

Textweiser benötigt die vorhandene C- und Thread-Bibliothek des jeweiligen Betriebssystems.

Zum Speichern der Daten wird eine Datenbank verwendet. Weitere Abhängigkeiten ergeben sich daher durch die verwendete Datenbank. Wird als Datenbank SQLite verwendet, entstehen keine weiteren Abhängigkeiten, da diese Datenbanksoftware mit ausgeliefert wird.

Alle technischen Details finden Sie in der Software-Spezifikation zusammengefasst.