UNTERNEHMENSZWECK

Unternehmen werden mit Informationen geradezu überschwemmt - aus allen Richtungen und schneller als je zuvor. Keine Suche mehr nach fehlenden Dokumenten. Enterprise Content Management Systems (ECM), Document Management Systems (DMS) and Electronische Archive garantieren heutzutage die sofortige Verfügbarkeit aller Informationen. Briefpost, Faxdokumente, E-Mail und WEB-basierte Informationen sind per Mausklick für Ihr Personal erreichbar.

 

Und wir sind die Profis für diese Themen und sowohl mit ECM/DMS-Systemen als auch mit WEB-basierten Medien bestens vertraut.


Automatisches Dokumenten-Eingangsmanagement & Erfassung ("Capturing")

Die DocStream GmbH wurde im März 2002 als Softwarehaus und Dienstleister mit Schwerpunkt dokumentenzentrierter Anwendungen unterschiedlicher Branchen gegründet („Document-Related-Input-Technologies“). Unser Fokus ist die automatische Erfassung und elektronische Verarbeitung von Geschäftsdokumenten.

Als Softwarehaus für Projektlösungen der Dokumentenverarbeitung realisieren wir in unserem Arbeitsgebiet kundenspezifische Projekte. Mit unserem Angebot als Dienstleister für „Document-Capture Services“ übernehmen wir auch das Scannen und das automatische Auswerten von Kundendokumenten, insbesondere aus Formularen, aus Texten der Altarchive oder für Posteingangsstellen. Für unsere angebotenen Scan-Services verwenden wir professionelle Dokumenten-Produktions-Scanner. Durch modernste Technik und professionelle Software erzielen wir eine optimale Imagequalität - die Voraussetzung für Weiterverarbeitungs- und Archivfunktionen. Mit unseren Produkten zur Dokumenten-Interpretation / Schriftenlesung und Dokumenten-Klassifikation (Sortierung) bieten wir die Kompetenz eines erfahrenen Spezialisten.

Basierend auf einer kleinen Kernmannschaft plus einem Team via Internet verbundener, erfahrener internationaler Realisierungspartner ("E-Lancer"), also mit Experten rund um die Welt, von Indien über die Vereinigten Staaten, über Kanada und die Schweiz nach Deutschland gelingt es uns, nicht nur Bekanntes zu wiederholen und effizient umzusetzen, sondern auch immer wieder neue Wege zu gehen.

„Das DocStream-Team, Ihre Ansprechpartner für alle Fragen der elektronischen Dokumentenverarbeitung“.

KERNKOMPETENZEN

In der Welt der elektronischen Dokumentenverarbeitung kennen wir die führenden Hardware- und Softwareprodukte am Markt. Wir verfügen über langjährige Praxiserfahrung bei der elektronischen Dokumentenverarbeitung.

Aus der Historie sind wir bestens vertraut mit allen Aufgabenstellungen und Fragen der automatischen Zeichenerkennung / Schriftenlesung und Dokumenteninterpretation. DocStream-Mitarbeiter und -Realisierungspartner verfügen über profunde Erfahrungen und Software Know-How bei Dokumentenklassifikation und -Interpretation. Und wir entwickeln eigene Produkte, aktuell das textbasierte Klassifikationsverfahren d-Class und d-Xtract.

Automatisierte Daten-, Datei- und Dokumentenklassifikation ist unser Hauptfokus

Ein bedeutender Teil der entscheidungsrelevanten Informationen liegt in unstrukturierten Dokumenten vor, hauptsächlich in Form von Texten. Schätzungen gehen von einem Anteil von rund 80% unstrukturierter Information in Unternehmen aus. Oder in Form von Dokumentenbildern, die per OCR in codierte Informationen gewandelt werden müssen, um inhaltlich verarbeitbar zu sein.
Die Masse der anfallenden Dokumente macht eine manuelle Strukturierung und Auswertung beider Informationsarten oft unzureichend und teuer, wenn nicht gar unmöglich. Das Management dieser unstrukturierten oder image-basierten Information stellt alle Organisationen vor zunehmend größere Probleme, weshalb heutzutage im ersten Schritt kein Weg an automatischer Klassifikation der Eingangsdokumente mehr vorbei geht.

Deswegen haben wir in die Eigenentwicklung von Algorithmen und Technologien der automatisierten Klassifikation für beides, image- und textbasierte Dokumentenklassifikation investiert. Dabei werden an den professionellem Einsatz höchste Ansprüche gestellt. Bei „d-Class“ bedienen wir uns hauptsächlich hochwertiger statistischer Verfahren, die kontrollierbar bleiben und auch nachbelehrt werden können (also keine Verfahren auf Basis neuronaler Netze). Unser Anspruch ist es, höchst mögliche Klassifikationsqualität zu liefern.

Der Kern von d-Class basiert auf einem Verfahren, welches die relevanten Zeichengruppen, Worte oder Textsequenzen (UTF-8) identifiziert und in ihrer Gesamtheit mit dem gelernten Wissen vergleicht, Ähnlichkeiten feststellt und dem entsprechend klassifiziert. Je höher die Zahl vorgestellter und belehrter, repräsentativer Dokumente desto besser (Einstiegsschwelle sind 500 Belehrdokumente pro Klasse).

Hinsichtlich der Anzahl der Dokumentenkategorien ist eine Obergrenze in technischer Hinsicht nicht erkennbar. Ein Training durch den Anwender ist nicht nötig. d-Class ist sprachunabhängig und sowohl für originäres, weitgehend ungestörtes ASCII-Textmaterial (wie z. B. eMails) als auch in Verbindung mit störanfälligen Verfahren (wie z. B. durch OCR-Falschlesungen) einsetzbar.

Zielsetzung dieses Portals ist, Ihnen unter Verwendung Ihrer eigenen Testdateien einen Eindruck von der hohen Qualität unserer textbasierten Dokumentenklassifikation zu vermitteln:

d-Class klassifiziert Texte vollautomatisch und sprachunabhängig nach vorgegebenen Kategorien. Das „Aschenputtel“ der Neuzeit.