Textmining und -analyse


Relevante Informationen auch dann finden, wenn das Gesuchte nicht bekannt ist

Die Textanalyse ist der nächste logische Schritt der Suchtechnologie und bezieht sich auf den Vorgang der Extraktion interessanter, nicht-trivialer Informationen und Wissen aus unstrukturiertem Text. Die Textanalyse von ZyLAB unterscheidet sich von traditionellen Suchen insofern, als der Suchende normalerweise wissen muss, wonach er sucht. Die Textanalyse dagegen versucht, Informationen aus bis dato unbekannten Mustern zu erkennen. Dies wird durch den Einsatz erweiterter Techniken wie der Mustererkennung, Sprachverarbeitung, Maschinenlernen etc. erzielt. Durch die Fokussierung auf Muster und Charakteristiken kann die Textanalyse bessere Suchergebnisse und eine tiefergehende Datenanalyse erzielen. Dadurch lassen sich auch jene Informationen rasch finden, die sonst verborgen bleiben würden.

Textanalyse für eine hohe Aufrufquote und optimale Genauigkeit

Die Textanalyse von ZyLAB ist insbesondere dann interessant, wenn Anwender neue Informationen auffinden müssen, wie bei strafrechtlichen Ermittlungen, juristischen E-Discovery-Prozessen und bei Untersuchungen zur Einhaltung der Sorgfaltspflicht (Due Diligence). Diese Fälle erfordern einen 100prozentigen Wiederaufruf, da es sich die Anwender nicht leisten können, auch nur irgendeine relevante Information zu übersehen. Im Gegensatz dazu werden mit einer Standard-Suchmaschine bei der Suche nach Hintergrundinformationen im Internet wahllos jegliche Treffer angezeigt. Im Fall von E-Discovery- oder Due Diligence-Verfahren muss ein Rechtsanwalt oder Ermittler aber sämtliche möglichen Haftpflichten finden, nicht nur die offensichtlichen.

Die Textanalyse-Technologie von ZyLAB wird durch verschiedene Tools abgerundet, die die Ergebnisse verfeinern und filtern, nach Relevanz ordnen, Doppeltreffer entfernen, Muster finden und ganz allgemein Nutzer davor bewahren, sich durch riesige Mengen irrelevanter Informationen durcharbeiten zu müssen. Unsere Technologie setzt verschiedene mathematische, statistische, linguistische und Mustererkennungstechniken ein, mit deren Hilfe sich unstrukturierte Informationen automatisiert analysieren sowie hochqualitative und relevante Daten extrahieren lassen.

Textanalyse Support von ZyLAB

Beispiele für Textmining und -analyse mit der Software von ZyLAB sind: Automatisierte Zusammenfassungen, Extraktion von Entitys und Begriffen für mehr als 200 verschiedene Entity-Typen (Namen, Positionen, Unternehmen, Adressen, Länder, Sozialversicherungsnummer, Kreditkartennummern, Daten, Zahlungen, Kontoverbindungen uvm.), Auffinden von Ereignissen und Fakten, Konzept-Extraktion, Extraktion von Dokument-sowie von Dateieigenschaften, Auffindung grafischer Dateien, automatische Spracherkennung (auch für die OCR nicht per OCR erfasster Bitmaps) sowie die exakte und annähernde Identifizierung von Duplikaten. ZyLABs ständigen Forschungen und Entwicklungen im Bereich Textmining ist es zu verdanken, dass wir jede größere Folgeversion unserer Systeme mit mehr analytischer Funktionalität ausstatten konnten.

Textanalyse für mehrsprachige Sammlungen

Die Textanalyse von ZyLAB unterstützt zahlreiche Sprachen, was insbesondere dann essentiell ist, wenn Ermittlungen grenzübergreifend durchgeführt werden und Informationssammlungen in vielen Sprachen betroffen sind. ZyLAB bringt Unterschiede in Zeichensätzen und Wörtern in Einklang, nutzt aber gleichzeitig auch intensiv statistische sowie linguistische Eigenschaften (z. B. Konjugation, Grammatik, Sinn oder Bedeutungen) einer Sprache.