Produktinformationen
Textweiser ist eine Software, die Texte automatisch kategorisiert. Dafür werden in einem ersten Schritt Kategorien angelegt, die im nächsten Schritt mit exemplarischen Dokumenten trainiert werden. Im Anschluss daran können unbekannte Texte automatisch den Kategorien zugewiesen werden (siehe auch Arbeitsablauf).
Texte nach Kategorien zu strukturieren hilft, das enthaltene Wissen besser zu verwalten und die Verarbeitung zu optimieren. So können zum Beispiel E-Mails gezielt an den passenden Ansprechpartner weitergeleitet werden. Durch Kategorien wird auch ein erweiterter Kontext geschaffen, der eine Suche effektiver machen kann - einen Begriff nur in bestimmten Kategorien liefert gezieltere Suchergebnisse.
Textweiser als Software-Bibliothek ermöglicht es Ihnen, Textkategorisierung als Bestandteil Ihrer eigenen Produkte anzubieten.
Eigenschaften
-
Flexibel einsetzbar
Textweiser liefert eine Liste mit wahrscheinlichen Kategorien. Ihre Anwendung entscheidet, wie die Ergebnisse zu verwenden sind, zum Beispiel zur automatischen Zuordnung oder als Unterstützung zum manuellen Tagging. -
Unterstützung für flache oder monohierarchische Kategoriestrukturen
(Taxonomien)
Je nach Anwendungsfall können sowohl flache Strukturen als auch Taxonomien verwendet werden. -
Linguistische Aufbereitung
Durch eine linguistische Aufbereitung der Daten werden die Ergebnisse optimiert. Die Aufbereitung ist sprachabhängig und kann bei Bedarf leicht um weitere Sprachen ergänzt werden. -
Verwendet Unicode
Mit einem Unicode-Zeichensatz können Texte aller Sprachen verarbeitet werden. -
Benötigt wenig Trainingsdaten
Textweiser kommt mit wenig Trainingsdaten aus (ab zehn Dokumenten pro Kategorie). -
Schnelle Verarbeitung
Durch optimierte Algorithmen ist die Textkategorisierung schnell und effizient. -
Leicht zu migrieren
Die trainierten Klassifikationsdaten werden in einer Datenbank abgelegt. Eine Migration zwischen verschieden Datenbanken oder Betriebssystemen ist leicht möglich.
Lesen Sie mehr über Textweiser in den ergänzenden Produktinformationen für Entwickler und für Entscheider.
Unterstützte Plattformen
| Betriebssystem | Distribution/Version | Architektur |
|---|---|---|
| Linux | Debian Lenny (5.0) | x86, x86_64 |
| Linux | Debian Squeeze (6.0) | x86, x86_64 |
| Linux | Ubuntu LTS (10.04) | x86, x86_64 |
| Linux | Red Hat Enterprise 5 | x86, x86_64 |
| FreeBSD | 7 | x86 |
| FreeBSD | 8 | x86 |
| FreeBSD | 9 | x86 |
| Windows | XP | x86 |
| Windows | Server 2003 | x86 |
| Windows | Server 2008 | x86 |
| Windows | 7 | x86, x86_64 |
| Windows | Server 2008 R2 | x86, x86_64 |
Sollten Sie die Software für ein anderes Betriebssystem oder eine andere Distribution benötigen, nehmen Sie Kontakt mit uns auf.
Unterstützte Datenbanken
Textweiser kann mit verschiedenen Datenbanken verwendet werden. Der Wechsel von einer Datenbank zu einer anderen kann durch mitgelieferte Tools und/oder Bibliotheksfunktionen schnell und einfach vollzogen werden.
| Datenbank | Version | Betriebssystem |
|---|---|---|
| SQLite | 3 (enthalten) | alle |
| Microsoft SQL Server | 2008, 2008 R2 | Windows |
Die Verwendung von Microsoft SQL Server wird nur auf Microsoft Windows Betriebssystemen unterstützt.
Sollten Sie eine Datenbankanbindung benötigen, die Textweiser derzeit nicht unterstützt, nehmen sie Kontakt mit uns auf.
Schnittstellen
- C/C++
- Java (in Kürze verfügbar)
- Perl (in Kürze verfügbar)
Voraussetzungen
Textweiser benötigt die vorhandene C- und Thread-Bibliothek des jeweiligen Betriebssystems.
Zum Speichern der Daten wird eine Datenbank verwendet. Weitere Abhängigkeiten ergeben sich daher durch die verwendete Datenbank. Wird als Datenbank SQLite verwendet, entstehen keine weiteren Abhängigkeiten, da diese Datenbanksoftware mit ausgeliefert wird.
Alle technischen Details finden Sie in der Software-Spezifikation zusammengefasst.


