OCR
Gescannten Seiten können in durchsuchbaren Text umgewandelt werden, der unsichtbar in der PDF-Datei gespeichert wird, wenn sie gespeichert wird. Dadurch können Leser der PDF-Datei die PDF-Datei nach dem Text durchsuchen und den konvertierten Text auch kopieren und einfügen. pdfMachine verwendet optische Zeichenerkennung (OCR)-Technologie, um die gescannten Seiten in Text umzuwandeln. Die Umwandlung in Text durch OCR ist nicht 100% genau. pdfMachine ermöglicht es Ihnen, die Sprache auszuwählen, in der Sie OCR durchführen.
OCR kann durchgeführt werden :
- Automatisch aus pdfScanMachine, nachdem eine Seite gescannt wurde.
- Auf Bildern/gescannten Seiten in einer PDF aus pdfMachine.
- Auf Bildern/gescannten Seiten in vorhandenen PDFs von der Kommandozeile, ohne Benutzereingabe. Dies ermöglicht es, OCR stapelweise durchzuführen.
- Automatisch nach dem Drucken zum Erstellen einer PDF, für PDFs ohne durchsuchbaren Text.
Um eine gescannte Seite in Text umzuwandeln, öffnen Sie sie zunächst in pdfMachine. Sie können pdfScanMachine verwenden, um eine Seite in pdfMachine zu scannen. OCR kann sogar während des Scanvorgangs durchgeführt werden, indem das OCR-Kontrollkästchen im Scandialog aktiviert wird. Sie können jede Seite aus dem Menü Werkzeuge in pdfMachine OCR verwenden. Wählen Sie im Modus Viewer oder Bearbeiten "OCR ausführen (alle Seiten)", um OCR auf allen Seiten durchzuführen.
Das allererste Mal, wenn Sie OCR von pdfMachine ausführen, müssen Sie die Sprache der Datei auswählen, die Sie konvertieren möchten. Beispielsweise, wenn Ihre gescannte Seite englischen Text enthält, wählen Sie "Englisch". pdfMachine wird fortfahren, die benötigten Sprachdateien herunterzuladen und zu installieren, um die Konvertierung durchzuführen.
Hinweis: Die Sprachauswahl wird für zukünftige Konvertierungen gespeichert. Die Sprachdateien müssen nicht jedes Mal heruntergeladen werden. Wenn Sie die Sprache ändern möchten, können Sie dies über "OCR-Sprache ändern" im Werkzeugmenü tun.
pdfMachine wird dann die gescannten Seiten konvertieren.
Führen Sie ein Speichern oder Speichern unter aus, um den unsichtbaren Text mit dem PDF zu speichern.
Der Text ist jetzt von PDF-Readern mit Suchfunktion durchsuchbar. Der Text kann auch kopiert und eingefügt werden.
Nach OCR wird pdfMachine unsichtbaren Text mit dem PDF einfügen. Der Text ist jetzt von PDF-Readern mit Suchfunktion durchsuchbar. Der Text kann auch kopiert und eingefügt werden.
OCR-Methoden
OCR während des Scanvorgangs
Verwenden Sie pdfScanMachine, um eine Seite in pdfMachine zu scannen. Aktivieren Sie das OCR-Kontrollkästchen im Scan-Dialog.
OCR aus dem pdfMachine-Werkzeugmenü
Sie können jede Seite aus dem Menü "Werkzeuge" in pdfMachine OCR durchführen. Wählen Sie "OCR ausführen (alle Seiten)", um OCR auf allen Seiten durchzuführen.
OCR beim Umwandeln eines Bildes in PDF
Wenn Sie das pdfMachine Rechtsklick-Kontextmenü im Windows Explorer verwenden, um ein Bild in PDF umzuwandeln, können Sie das Kästchen für OCR auswählen, um das konvertierte Bild ebenfalls zu OCRen.
OCR von der Befehlszeile
OCR kann mit dem pdfMachine-Befehlszeilen-Tool pdfMachineOCR durchgeführt werden. Dies ermöglicht die Durchführung von OCR in Batches.
OCR nach jedem Druck zur Erstellung von PDF
Im Bereich "Nächste Aktion" der pdfMachine-Optionen können Sie pdfMachine so konfigurieren, dass nach dem Drucken OCR durchgeführt wird, um ein PDF zu erstellen, für PDFs ohne durchsuchbaren Text.
Sprachauswahl
Wenn Sie das erste Mal OCR von pdfMachine ausführen, müssen Sie die Sprache der Datei auswählen, aus der Sie konvertieren. pdfMachine wird die benötigten Sprachdateien herunterladen und installieren, um die Konvertierung durchzuführen. Die Sprachauswahl wird für zukünftige Konvertierungen gespeichert. Sie können sie auch über das Menü "Werkzeuge" ändern.