Praxisbeispiel Scan- & OCR-Erweiterungen für SharePoint Teil 1

Marco Schmucker, Principal Consultant SharePoint Business Consulting bei der Alegri International Group stellt in dieser dreiteiligen Artikelserie eine Lösung für eine Scan- & OCR Erweiterung für SharePoint vor.

 

Schneller finden, effizienter arbeiten und intelligenter steuern mit Scan- & OCR-Erweiterungen für SharePoint – Teil 1

Sie nutzen bereits SharePoint-Technologien mit Workflows, um Ihre administrativen Prozesse einfacher zu gestalten? Papierbasierte Informationen werden aber als reine Bilder eingescannt und als TIFF- oder PDF-Datei in SharePoint-Aktenlösungen und ‑Teamsites abgelegt? Wie werden diese Dokumente zumindest verschlagwortet, um sie später gezielt zu finden oder automatisch auflisten zu lassen, wenn eine Volltextsuche fehlt? Durch rein manuelle Eingabe?

Dies ist sicherlich oft der Fall bei kleineren Lösungen oder im Mittelstand, wenn es um Themen wie zusätzliche Personal- und Bewerber-Dokumente oder Fuhrpark-Informationen geht. In dieser Artikelserie wollen wir uns anschauen, welche solcher Dokumente im Bereich Personal und der Fuhrparkverwaltung anfallen, und wie sogar kleine Abteilungen oder Firmen kostengünstig diese wichtigen Informationen einfach ablegen, verschlagworten und wiederfinden können.

Vorteile und Nutzen einer OCR-Lösung in SharePoint

Eine Lösung, die einen Scanvorgang direkt in SharePoint-Bibliotheken unterstützt und in dessen Web-Oberfläche integriert ist, ist ein erster Schritt Richtung Arbeitsersparnis. Unterstützt sie dann noch die automatische Texterkennung (OCR = Optical Character Recognition) und Erstellung eines PDF/ A Dokuments, in dem man über SharePoint-Volltextsuche oder direkt in der PDF-Datei suchen kann, bietet sie enorme Vorteile in der täglichen Recherche. Kann man aus dem Text dann noch einfach Textpassagen in SharePoint-Eigenschaftsfelder übernehmen, sind komplexere Workflow- und suchbasierte Lösungen realisierbar.

Ein möglicher Anbieter einer solchen Lösung, die gerade für wenige Arbeitsplätze oder Nutzer von OCR-Funktionen interessant ist, ist aus meiner Sicht die Firma GRADIENT.

Sie bietet mit ihren Produkten Unterstützung im gesamten Prozess der Erfassung, Klassifikation und Nutzbarmachung von Texten aus gescannten Dokumenten:

GSO01

Abbildung 1: Quelle GRADIENT Capture Suite,

Das Interessante an diesem Anbieter: Seine SharePoint-integrierte Lösung GScan Online ermöglicht das Betreiben der Lösung on premise auf einer internen SharePoint 2010/ 2013 Farm als eigenen Dienst. Alternativ kann aber die Nutzung eines Cloud-basierten OCR Services von Gradient als SharePoint App eingestellt werden. Durch dieses Modell ist es Gradient möglich, ihre Lösung auch in Office 365 über den SharePoint App Store anzubieten.

 

GSO02

Es ist dabei keine Client-Installation notwendig. Die GScan Online Funktionen sind mit HTML5 in die SharePoint Menüs voll integriert. Aktuell werden 23 Sprachen unterstützt.

Der Scan-Vorgang (Capture) kann über Ihre vorhandenen Scan-Treiber gestartet werden. Andere Quellen sind aber auch vorhandene Bilddateien in Fileshares, SharePoint, Office 365/ SharePoint Online, OneDrive oder Dropbox; sogar Bilderfassung über eine verfügbare Windows Phone App ist möglich. Um nach SharePoint zu scannen, sind allerdings GScan Online Lizenzen notwendig.

So werden viele Szenarien möglich, bei denen mobile Mitarbeiter schnell Bilder erfassen, diese hochladen und durch den workflow-unterstützten Vorgang eine automatisierte OCR und Verschlagwortung (Extract) erfolgt.

Für begrenzte Anwendungen besonders interessant: Es erfolgt eine pro-User Lizensierung ohne Volumenstaffelung. Daher können zum Beispiel kleine Service-Büros im firmeneigenen Fuhrpark oder Teile der Personalabteilung mit begrenztem Budget einfach und schnell versorgt werden.