Erweitert - Dateitypen
![]() |
|
Erweitert / Dateitypen | ![]() |
Einstellungen von Dateitypen |
In diesem Bereich können Dateitypen beschrieben werden. Zudem können Angeben zur Anzeige und zum Öffnen bestimmter Dateitypen gemacht werden.
Auf der linken Seite werden die verschiedenen Dateitypen mit ihrer Nummer der Datei-Erweiterung und ihrer Bezeichnung angezeigt. Neue Dateitypen können über die Schaltfläche [Neu...] hinzugefügt werden. Wird ein noch nicht bekannter Dateityp in ArcFlow archiviert, wird der Dateityp in der Liste eingetragen. Die Bezeichnung ist dann die Dateierweiterung gefolgt von "-Datei" (zum Beispiel ASC-Datei). Bestehende Dateitypen können mit der Schaltfläche [Löschen] wieder entfernt werden.
Die Bezeichnung der Dateitypen wird im Bereich der Suche verwendet.
Für die verschiedenen Dateitypen können unterschiedliche Programme zur Anzeige und zum Bearbeiten angegeben werden. Folgende Einstellungen stehen zur Verfügung:
- HTML-Ansicht
Zur Anzeige von Microsoft Excel- und Word-Dokumenten kann eine HTML-Ansicht ausgewählt werden. Zur Anzeige des Dokuments muss auf dem System kein Microsoft Office installiert sein. Bei der Anzeige von Excel-Dokumenten kann dann zeitgleich Excel gestartet werden.
- Office
Zur Anzeige des Dokuments wird ein integriertes Office-Objekt verwendet. Damit Microsoft Office-Dokumente angezeigt werden können, muss das Office-Paket installiert sein. Das entsprechende Programm wird im Hintergrund gestartet. Während der Anzeige eines Excel-Dokuments, kann Excel nicht noch einmal gestartet werden.
- Rtf-Editor
Zur Anzeige oder zum Bearbeiten wird der integrierte RTF-Editor verwendet. In dem Editor können nur Texte im RTF-Format angezeigt werden.
- Text-Editor
Zur Anzeige oder zum Bearbeiten wird der integrierte Text-Editor verwendet. In dem Editor können alle ASCII-Formate angezeigt werden.
- Bildanzeige
Anzeige mit der integrierten Bildanzeige.
- PDF und Bildanzeige
Anzeige mit der integrierten PDF und Bildanzeige.
- WebNavigator
Innerhalb von ArcFlow wird der Microsoft Internet Explorer zur Anzeige der Anhangdatei verwendet. Im Gegensatz zu dem Standard-Programm unter Windows können hier weitere PlugIns installiert sein. Standardmäßig können HTML-Seiten oder XML-Dateien angezeigt werden. Mit entsprechenden Plug-Ins ist auch die Anzeige von PDF- oder anderen Dateien möglich.
- Mailanzeige
Der Anzeigebereich wird aufgeteilt. Die Kopf-Informationen (Absender, Empfänger, Betreff usw.) werden im oberen Teil angezeigt. Der Mail-Text wird darunter in einem WebNavigator-Objekt angezeigt.
- Standard-Programm (Windows)
Zur Anzeige oder zum Bearbeiten der Anhangdatei wird das Programm verwendet, das beim Betriebssystem mit der Datei-Erweiterung verknüpft ist.
- Programm auswählen...
In einem Auswahldialog kann ein Programm ausgewählt werden, das zur Anzeige oder zum Bearbeiten der Anhangdatei verwendet werden soll. Die Anhangdatei wird exportiert und an das Programm als Parameter übergeben. Weitere Parameter können im Feld "Parameter" angegeben werden.
- Nicht ausführbar
Die Anhangdatei kann nicht aus ArcFlow heraus angezeigt oder bearbeitet werden. Der Export der Datei und das Öffnen mit Hilfe eines anderen Programms ist möglich.
In dem Feld "Parameter" können weitere Angaben gemacht werden, die einem externen Programm ("Programm auswählen..." oder "Standard-Programm (Windows)") mit übergeben werden.
Die Texterkennung kann für bestimmte Dateierweiterungen deaktiviert werden. Dazu muss der Haken in "Texterkennung" entfernt werden. Die Einstellung sollte für Dokumente entfernt werden, die keinen Text enthalten (zum Beispiel ausführbare Dateien). Der Suchindex enthält dann neben den Stammdaten des Archivs, noch den Dateinamen der Anhangdatei.
Soll eine Datei texterkannt werden, wird zunächst versucht den Text direkt der Datei zu entnehmen. Das funktioniert bei Dateien im ASCII Format (zum Beispiel TXT, ASC oder CFG). Die OCR-Software wird in diesem Fall nicht verwendet.
Bei Bildern wird automatisch die OCR-Software verwendet. Standardmäßig wird dann ein unformatierter Text und die Barcodes zurückgegeben.
Einen Sonderfall stellen Dokumente im PDF-Format dar. Ein PDF-Dokument enthält immer ein Bild von jeder Seite. Zusätzlich kann es aber noch den Text der Seite beinhalten. Ist nur die Option "Texterkennung" aktiviert, wird der Text dem PDF entnommen und keine weitere Prüfung durch die OCR-Software durchgeführt. Der Text wird damit nicht durch Fehler bei der Erkennung verfälscht und enthält auch Texte, die in der Hintergrundfarbe geschrieben wurden. Durch die Aktivierung von "durch OCR" werden die Bilder der Seiten von der OCR-Software erkannt. Dabei werden unterschiedliche Formate erzeugt, die in ArcFlow gespeichert werden können. Ebenso kann festgelegt werden, welcher Text auf der Seite "Text" beim Archiv angezeigt werden soll:
- Text aus Datei der im Dokument enthaltenen Text
- unformatierter Text erkannter Text ohne zusätzliche Leerzeichen
- formatierter Text erkannter Text mit Leerzeichen zur Positionierung der verschiedenen Textbereiche zueinander
- Text mit Position XML-Datei mit genauen Positionen von Wörtern auf der Seite
- Barcode erkannte Barcodes
Durch Klicken in der Spalte "Mark" wird ausgewählt, welche Texte in ArcFlow gespeichert werden. Die entsprechenden Texte können in Skripten über den Befehl AfArcFileMetaGet() exportiert und ausgewertet werden.
In der Spalte "Text" kann ausgewählt werden, welcher der Texte auf der Seite "Text" des Archivs angezeigt wird. Dabei kann nur einer der ersten drei Einträge ausgewählt werden.
Die Optionen sind insbesondere bei der Erkennung von PDF-Dokumenten hilfreich. Dateien dieses Typs enthalten immer Bilder der Seiten, können aber auch Text enthalten. Von außen ist das meist nur erkennbar, wenn in einem Anzeigeprogramm Textpassagen markiert werden können. Ist nur die Option "Texterkennung" aktiviert, wird der Text aus dem PDF extrahiert, ohne die OCR-Software zu verwenden. Dieser Weg ist schnell, ermittelt auch unsichtbare Schrift, erkennt aber keine Barcodes.
Wird die Option "durch OCR" aktiviert, erfolgt die Texterkennung mit der OCR-Software. Hierbei können verschiedene Ergebnisse (auch alle) zurückgegeben werden. Die OCR-Software kann allerdings keinen unsichtbaren Text erkennen. Je nach weiterer Verarbeitung haben die verschiedenen Ergebnisse Vor- und Nachteile. Der Aufbau der XML-Datei mit den Positionen der Wörter auf der Seite ist unter AFArcFileXmlTextRead() beschrieben.
Die Standardeinstellungen können durch individuelle Einstellungen beim Arbeitsplatz überschrieben werden. Eintragungen, die hier mit "Zwingend" markiert werden, werden durch andere Einstellungen nicht geändert.