Ja! Dateien, die sich in lexiCan einfügen werden von der Volltextsuche berücksichtigt.

Grundsätzlich müssen Dateien, die durchsucht werden sollen, textbasiert sein. Unter bestimmten Voraussetzungen können aber auch gescannte Texte ausgelesen werden. Probleme können auftreten, wenn der Autor einer Datei das Durchsuchen untersagt hat, was bei PDF-Dateien häufiger der Fall ist.

Grundlegend für eine erfolgreiche Indizierung von Dateien und die Suche darin ist die Installation eines Hilfsprogramms zum Auslesen der Datei, diese werden als "iFilter" bezeichnet.

In den meisten Fällen werden iFilter bei der Installation der für das jeweilige Dateiformat zuständigen Software mit installiert. Microsoft stellt jedoch auch ein spezielles Filterpaket insbesondere für Server zur Verfügung:

http://www.microsoft.com 

Es beinhaltet Filter für ältere Office-Versionen (97-2003; .DOC, .PPT, .XLS), Metro-Office (2007; .DOCX, .PPTX, .XLSX), ZIP-, OneNote-, Visio-, sowie Publisher-Dateien und Open Document-Dateien.

Für PDF-Dateien steht systemseitig erst seit Windows 8 ein für lexiCan nutzbarer iFilter zur Verfügung. Auch die Installation des Adobe Readers beinhaltet keinen geeigneten Filter. Für ältere Betriebssysteme und Problemfälle empfehlen wir die folgenden iFilter:

(1) Foxit PDF iFilter unter http://www.foxitsoftware.com (Trialversion)
(2) PDFlib TET PDF iFilter unter http://www.pdflib.com (für privaten Gebrauch kostenlos)
(3) Adobe PDF iFilter 6 für 32-Bit Systeme http://www.adobe.com (kostenlos)
(4) Adobe PDF iFilter 9 für 64-Bit Systeme http://wiki.lexican.de (der aktuelle iFilter 11 von Adobe kann nicht genutzt werden!)

Der iFilter von Foxit soll gescannte Dokumente indizieren können. In dieser Hinsicht haben wir aber auch die iFilter von PDFlib und Adobe erfolgreich testen können. Generell aber ist eine erfolgreiche Indizierung von der Qualität der Scans abhängig und kann nicht garantiert werden.

Viele PDF-Dateien werden mittels Scanner erzeugt. Solche PDF-Dateien werden nur dann indiziert, wenn das Scannen mit Texterkennung erfolgte. Ob dem so ist, lässt sich recht einfach ermitteln: Nur wenn Sie in der PDF-Datei Text markieren und mittels Zwischenspeicher in ein anderes Dokument übertragen können, kann die PDF-Datei indiziert werden.

Weitere umfangreiche Informationen zu iFiltern finden Sie im (englischsprachigen) Wikipedia Artikel unter http://en.wikipedia.org/wiki/IFilter

Anwender von lexiCan Business weisen wir noch darauf hin, dass die für eine erfolgreiche Volltextsuche nötigen iFilter auf der jeweiligen Serverhardware installiert werden müssen.

Für die optimale Nutzung unserer Webseite verwenden wie Cookies. Durch die weitere Nutzung der Webseite stimmen Sie der Verwendung von Cookies zu.
Datenschutz Ok