Wirtschaftsinformatik (Bachelor-Studiengang): Grundlagen der Kommunikationstechnik (4. Semester)

Sie sind hier: StartseiteWirtschaftsinformatikGrundlagen der Kommunikationstechnologie: Document Related Technologies (Archivierung, Dokumenten-Management)

HH / CM, Kurs vom 01.10.2003 - 31.03.2004

Grundlagen der Kommunikationstechnologie: Document Related Technologies (Archivierung, Dokumenten-Management): Document Related Technologies (Archivierung) (Was ist ein Dokument, Dokumenterscheinungsformen, Optische Archive, Datenbank, Scanner-Technologie, COLD, Dateiimport, Infrastruktur, Speichertechnologie, Archivierungskonzepte), Document Related Technologies (Dokumenten-Management) (DMS-Begriffe, Prozess der Informationsverarbeitung, Recherche-Index, DMS-Konzepte).

  1. Document Related Technologies (Archivierung)
  2. Document Related Technologies (Dokumenten-Management)

Document Related Technologies (Archivierung)

Was ist ein Dokument

Im DMS wird als Dokument jede Art von permanenter Aufzeichnung verstanden. Ein Dokument ist eine Kombination aus gespeicherten Daten, Datenträger (z.B. Papier oder optische Platte) und der für das jeweilige Dokument typischen Struktur. Heterogen aufgebaute Dokumente (Text, Graphik, Tabellen) werden als Einheit betrachtet.

Nach herkömmlicher Auffassung sind Dokumente "Mitteilungsmittel mit unbefristet gespeicherter, schwer veränderbarer authentischer und sichtbarer Mitteilung in der Gestalt von Texten oder Festbildern mit gerichtlicher Beweiskraft".

Dokumenterscheinungsformen

Coded Information (CI):

Maschinelesbare Daten und Dokumente

Beispiele:

Non Coded Information (NCI):

Bildinformationen, bzw. Image-Dateien

Beispiele:

Optische Archive

Funktionalitäten:

Motivation zum Einsatz:

Ein elektronisches oder optisches Archiv verwaltet tote Dokumente bzw. Dateien (tiff, pdf), die also nicht mehr geändert oder bearbeitet werden.

Datenbank

Grundlage eines elektronischen Archivs.

Übersicht über Datenbankfunktionalitäten:

Datenbank für

Scanner-Technologie

Dokumententypen:

Verarbeitung beliebiger Dokumententypen

Scan-Verfahren:

Ablageformate:

Image Processing Komponenten:

Hersteller:

  1. Kofax
    • Hardware-Komponenten
      (hohe Geschwindigkeit, eigenes Interface, keine Unterstützung für NT)
    • Software-Unterstützung
      (SCSI Interface Voraussetzung, langsamere Verarbeitung)
  2. Xionics

Scanner:

  1. Low End:
    • max. 10 Seiten pro Minute,
    • SCSI Interface mit TWAIN-Schnittstelle, ISIS
    • Sekretariat,
    • Persönliche Scanner
    Hersteller: Hewlett Packard, Canon
  2. Midrange:
    • 40 Seiten pro Minute
    • Anschluss über Videointerface oder SCSI
    • Automatische Blattdichteneinstellung und Belichtung
    • Paginierfunktionen
    • Doppelseiten-Scanner
    Hersteller: Bell & Howell, Fujitsu
  3. Highend:
    • 100 Seiten pro Minute
    • Höhere Standzeiten
    Hersteller: Bangtek (Lufteinzug für Papier), Agfa (Rollketteneinzug), Kodak (ImagelinkSerie), Scamax (Spezialmaschinenbau)

Scanner - Checkliste:

Verarbeitbare Dokumente:

Formate DIN A4 - DIN A0: häufig keine Zwischenformate
Papierqualitäten: Papierstärke 60 g - 120 g

Betriebsbedingungen für Scanner:

Temperatur: normale Zimmertemperatur
Feuchtigkeit: vereinzelt nur 50 % nicht kondensierend

Feinde des Scanner: Staubanfall, Büroklammern, Klebenähte

Imagepreprocessing:

Steigerung der Erkennungsqualität

Imageverarbeitung:

OCR Methoden:

Barcodeerkennung:

Barcode:

Barcodetypen:

COLD

COLD Grundfunktionalität:

COLD-Grundfunktionalität

Bildbeschreibung "COLD Grundfunktionalität": Dokumentablagen, COLD, Datenbank / Archiv.

COLD Konzept:

  1. Primär: Umleitung der Ausgabe auf einen Host-Drucker in die Archiv-Umgebung
    • Filterung + COLD
  2. Darüber hinaus: automatische Bearbeitung
    • von CI- und NCI-Dokumenten
    • Bearbeitungsregeln
    • Erweiterung durch projektspezifische Module

COLD Dokumentarten (Organisatorische Einordnung):

  1. Ausgangsbelege
    • Einzelne in sich abgeschlossene Dokumente
    • Suche nach Dokument
  2. Drucklisten
    • Suche innerhalb eines Dokumentes

COLD Dokumenttypen (Technischer Dateityp):

  1. Spoolübernahme Line Printer Datenstrom
  2. Spezialdruckersprachen
    • AFP (IBM: Advanced Function Printing)
    • Fole (Océ)
    • Xerox
  3. Windows-Dateien
  4. Ablage in "unabhängigem Format"

COLD Verarbeitungsschritte:

  1. Dokumentermittlung
  2. Dokumenttrennung
  3. Seitentrennung
  4. Konvertierung, Eliminierung von Steuerzeichen (Mehrfachdruck)
  5. Indexermittlung
  6. Erzeugung Parameter-Files
  7. Archivierung
  8. Einfügen von Indexdaten
  9. Bearbeitungsregeln, Protokollierung

COLD Indexermittlung:

  1. Statische Suche nach Indexbegriffen
    • Datum, Belegnummer, Kundennummer, Mandant
    • Rechnungsnummer (Stelle 10-15, Zeile 4)
  2. Dynamische Suche
    • Seriennummer (Stelle 1-10 nach Snr)

COLD Formularüberlagerung:

Listenarchivierung:

COLD Stolpersteine:

  1. Transaktionshandling
    • Liste mit 30.000 Seiten als eine Transaktion (z.B. 40 Minuten zur Archivierung, bei Fehlschlag bis 40 Minuten Rollback)
  2. Performance
  3. Änderung in Listen
    • Feldverschiebung
  4. Verbindungsstabilität
    • Host- Verfügbarkeit

Dateiimport

Elektronische Dokumente - CI:

  1. Quellen
    • Textverarbeitung, Rechnungswesen, Tabellenkalkulationen, Datenbanken, CAD
  2. Integration mittels API oder asynchron per Zwischenablage
  3. Ablageformate in Abhängigkeit ihrer Verwendung
    • Templates als Originalformat
    • Langzeitdokumente in Langzeitformaten
    • Verschiedene Verwendungszwecke als Rendition

Infrastruktur

Typische DV-Elemente eines DMS:

Speichertechnologie

Medienarten:

  1. WORM-Platten
    • Write Once Read Multiple
    • Plattengröße: 5.25" bis 12"
    • Plattenkapazitäten: 1,2 bis 9,1 GB für 5.25
  2. ROD-Platten
    • Rewritable Optical Disk
    • Plattengröße: bis 5.25"
    • Plattenkapazitäten: bis 1,2 bis 9,1 GB

Speichermedien:

Magneto-optische Platten:

Vorteile: bewährt und sicher, Archivierungszeitraum > 10 Jahre, preisgünstig

Phase-Change-Medien:

Vorteile: Archivierungszeitraum bis mehr als 50 Jahre, höhere Schreibgeschwindigkeit als bei MO, bewährt und sicher, Hardware-WORM

Hinweis: Wird nicht mehr verwendet!

CD-Recordable Medium:

Vorteile: Archivierungszeitraum > 10 Jahre, schnellerer Schreibvorgang als bei MO, bewährt und sicher, sehr preisgünstig

DVD-Medium Digital Versatile Disk:

Recordable:

Rewritable:

Vorteile: Archivierungszeitraum > 10 Jahre, schnellerer Schreibvorgang als bei MO, bewährt und sicher, sehr preisgünstig

Schreibverfahren im Vergleich:

  1. Schreibverfahren CD-R und DVD-R
    • Single-Session/Disk-at-Once auf Medium Level (vorherige Datenansammlung)
    • Packet- bzw. Incremental Recording auf Block Level (sofortiger Schreibvorgang)
  2. Schreibverfahren MO-WORM
    • auf Sektor Level

Sicherheit und Robustheit des Speichermediums:

  1. MO-WORM
    • Begrenzte Zahl von bekannten Anbietern mit hoher Qualitätskontrolle.
    • Lesefähigkeit bei Wechsel des Laufwerksherstellers nicht immer gegeben.
  2. CD-R
    • Empfindlichkeit gegen Licht und sonstige chemische/physikalische Einwirkungen.
      Lösung: Caddy-Mechanismus
    • Zahlreiche/anonyme Anbieter von Rohlingen erschweren die Qualitätskontrolle.
      Lösung: Festlegung auf einen Hersteller
    • Derzeit vier-Dye Grundstoffe (gold, grün, blau, silber). Unterscheidung für den Endkunden ist schwer.
  3. DVD-R oder DVD+R
    • Äquivalent zur CD
    • Technologie ist noch nicht sicher

Wesentliche Unterscheidungsmerkmale für Jukeboxen:

Speichermedien - Anwendungsbereiche:

  1. Festplatte
    • Pufferung (Caching)
  2. MO (Magneto-Optisch) ROD (Rewritable Optical Disk)
    • kurze Aufbewahrungsfristen (< 2 Jahre)
    • veränderbar
  3. MO-WORM (Write Once, Read-Many)
    • sichere Langzeitaufbewahrung
  4. CD-R ROD/WORM
    • Datendistribution, Dienstleistung
  5. DVD
    • Zukunft?

Archivierungskonzepte

Technische Veränderungen bestimmen die Strategie der Archivierung:

In 3 Jahren verändert sich eine Technologie teilweise und nach 10 Jahren wird sie vollständig durch neue Technologien ersetzt.

Kritische Technologien: Standards vereinfachen die Migration:

Format Standards:

  1. Longterm Formats:
    • Tiff Group4 (Image)
    • Jpeg (Image)
    • ASCII (Text)
  2. Rendition Formats:
    1. Presentation:
      • PDF (Adobe)
      • XML
    2. CAD:
      • Step
      • IGES
      • DXF

Index Standards:

  1. Common Indexes:
    • Process
    • Object
    • Document type
    • storage rule
  2. Process Indexes:
    • Lot number
    • Product status
    • purchasing document
  3. Special/User Indexes:
    • Invoice number

Unabhängiger Zugriff auf Dokumente durch das Archiv:

Unabhängiger Zugriff auf Dokumente durch das Archiv

Bildbeschreibung "Unabhängiger Zugriff auf Dokumente durch das Archiv": Das Archiv bildet einen eigenen Index für Dokumentenzugriffe, unabhängig von den durch SAP oder DMS erstellten Indices.

Strategie für das Archivieren von Datenbankinformationen:

Datenbanken

Nicht die Datenbank soll archiviert werden, sondern die Information.

Die Anforderungen an die Dateien / Dokumente bestimmen die Ablageformate:

Zum Menü Wirtschaftsinformatik | Zum Seitenanfang

Document Related Technologies (Dokumenten-Management)

DMS-Begriffe

Unter Dokumenten-Management werden häufig auch andere Begriffe subsumiert:

Definitionen:

"Ein Dokumenten-Management-System sammelt interne und externe Dokumente, bereitet sie elektronisch auf, archiviert sie, bzw. legt sie ab und stellt sie bei Rechercheanfragen zur Verfügung. Dokumenten-Management-Systeme halten außerdem Informationen über den Bearbeitungsstatus dieser Dokumente vor." (nach Gulbins et al)

Dokumenten-Management:

Funktionalitäten:

Motivation zum Einsatz:

Prozess der Informationsverarbeitung

Ziele von Dokumenten-Management:

Bereitstellung der benötigten Informationen zur richtigen Zeit, am richtigen Ort, der richtigen Person.

Ebenen der Informationskette:

Ebenen der Informationskette

Bildbeschreibung "Ebenen der Informationskette": Informationserfassung durch Scanner, EDI/ISDN (Lesen, Empfangen, Erkennen). Interpretation durch Indizes, Codierungen (Zuordnen, Sortieren, Verteilen). Informationsverarbeitung durch DMS-Intergration, Intranetanwendungen, PPS-Systeme, Fertigungssysteme (Verkaufen, Bearbeiten, Buchen, Fakturieren, Zahlen, Beraten). Informationsspeicherung durch Drucker, Internet, In-Boxes, File-Systems, Optische Archive (Ausgeben, Versenden, Ablegen, Weiterleiten, Archivieren).

Die technische Unterstützung der Informationsprozesse ist durchgängig.

Prozesse und Technologie:

Informationsverarbeitung:

Informations-"Verwaltung":

Informations-"Nutzung":

Recherche-Index

Die Metainformationen von Dokumenten:

Die Metainformationen beinhalten für Dokumenten-Management mindestens drei Aspekte:

Die Nutzer benötigen eine mehrdimensionale Klassifizierung in Datenbanken:

Fragestellungen "Ich suche...

Die Suchanforderungen bestimmen die Ablageart:

Hinweis: So wenig Indizes wie möglich und soviel wie notwendig verwenden!!!

Vorteile:

Nachteile:

Dokumenten-Verweis:

Vorteile:

Nachteile:

Typische Einsatzgebiete: SAP (und vergleichbare Verwaltungssysteme), Workflow, Image Enabling

DMS-Konzepte

Bei der Auswahl einesDMS sollten die zentralen Anforderungen überprüft werden.

Sicherheit:

Einfache Bedienung:

Integrationsfähigkeit:

Schnittstellen - Kopplung zu den Bereichen/Lösungen:

Rentabilität:

Skalierbarkeit: