Automatisches Indexieren mit dem Cogito Studio Express: Machine Learning in der Praxis

Datum
26.01.2017 - 15:30 - 16:30 Uhr

Kategorien

Termin: Outlook: iCal


Ein Expertsystem Webinar

Suche und Navigation in großen Informationsbeständen wird durch die Erschließung mit aussagekräftigen Schlüsselbegriffen erheblich verbessert. Der Einsatz von strukturierten Vokabularen (Thesauri) und automatischen Verfahren zur Indexierung ist hier sinnvoll.

Wir beschreiben mit dem Cogito Studio eine webbasierte Umgebung, die Erstellung, Wartung und Einsatz von Thesauri für die Indexierung von großen Dokumentenbeständen erlaubt. Von besonderem Interesse sind hier Verfahren des Maschinellen Lernens, die die Qualität der Indexierung erheblich verbessern und dabei keine manuelle Vorarbeit erfordern.

Wir beschreiben kurz den Nutzen der Erschließung von Dokumenten mit Thesauri und das Cogito Studio und vergleichen sodann Ergebnisse vor sowie nach dem Einsatz von Maschinellem Lernen.

Das Webinar findet in deutscher Sprache statt.

 

Abstract

Das Cogito Studio Express von Expert System ist eine leistungsfähige Anwendung zur Verwaltung von großen Thesauri für automatisches Indexieren von Texten. Es erlaubt den Import von bestehenden Thesauri ebenso wie deren Aktualisierung und Erweiterung oder sogar der Erstellung vollkommen neuer Thesauri.  Aber die nötige Qualität und Trennschärfe bei der Anwendung der Thesauri für die Erschließung von Dokumenten ist oft nicht gegeben, wenn die entsprechenden Wortschätze ohne weitere Vorkehrungen verwendet werden. Die Erstellung zusätzlichen manueller Regeln wäre eine Option, stößt jedoch angesichts von oft vielen tausend und zehntausend Termen rasch an Grenzen.

Wir stellen Verfahren des unüberwachten Lernens (Machine Learning) vor, die es dem Cogito Studio Express erlauben, ohne die manuelle Erstellung von Regeln die Qualität der Indexierung signifikant anzuheben.

Sprecher

Stefan Geissler, Geschäftsführer, Expert System Deutschland GmbH

Anmeldung

Über die Website

 

 

Schreibe einen Kommentar

Deine Email-Adresse wird nicht veröffentlicht.