PDF in Text konvertieren: So geht's richtig
Es gibt viele Möglichkeiten, um PDF in Text zu konvertieren, aber einige dieser Methoden werden Ihnen einfach nicht die gewünschten Ergebnisse liefern.
Die einfachsten Wege zur Konvertierung von PDF in Text auf Mac
In diesem Artikel zeigen wir Ihnen, wie Sie PDFs in Text konvertieren und stellen Ihnen einige Apps zur Konvertierung von PDF in Text vor, die uns wirklich gut gefallen.
PDF zu Text mit optischer Zeichenerkennung
Prizmo ist ein sehr leistungsfähiger Dokumentenscanner und PDF-Exporter für Mac. Die App ist hervorragend, wenn Sie gescannte PDF-Dateien auf Ihrem Desktop in Text konvertieren müssen, aber kann noch viel mehr als das!
Prizmo konvertiert PDFs in Text mit Hilfe einer fortschrittlichen OCR oder optischen Zeichenerkennung. Sein "Erkennungs"-Feature scannt Ihre PDFs nach Zeichen und weiß dadurch, was in eine Textdatei konvertiert werden sollte und was ein Bild oder eine Formatierung sein könnte, die weggelassen werden kann.
Wir mögen Prizmo, weil seine PDF-zu-Text-OCR wirklich clever ist und Formatierungen auslässt, die andere Konverter möglicherweise hinterlassen. In Vergleichstests haben wir festgestellt, dass die App bessere Echttext-Dokumente produziert als viele andere Dienste.
So wandeln Sie mit Prizmo Ihr PDF-Dokument in eine Textdatei um:
- Öffnen Sie Prizmo. Wählen Sie "New File".
- Wählen Sie "Open Image File".
- Wählen Sie die PDF-Datei aus, die Sie von Ihrem Computer in Text konvertieren möchten.
- Wählen Sie "Recognize" in der oberen rechten Ecke des Bildschirms.
- Gehen Sie in der Menüleiste auf "File" > "Export".
- Wählen Sie aus dem Dropdown-Menü "Rich Text".
- Wählen Sie "Export to File".
- Benennen Sie Ihre neue Textdatei und entscheiden Sie, wo Sie sie speichern möchten.
PDF in durchsuchbaren Text konvertieren
Wenn Sie riesige PDFs haben, die Sie in Textdokumente umwandeln, möchten Sie wahrscheinlich, dass diese neuen Dateien genauso durchsuchbar sind, wie Ihre PDF. Dies ist besonders kritisch bei wortreichen PDF-Dateien, da Textdokumente nicht formatiert sind. Anstelle von visuellen Hinweisen, die Ihnen sagen, wo Sie suchen müssen, haben Sie einen riesigen Textblock.
NitroPDF ist eine großartige App, die dafür sorgt, dass PDFs bearbeitet werden können. Das ist großartig, wenn Sie Unterschriften auf Dokumenten benötigen oder wenn Menschen Formulare ausfüllen sollen. Aber die App ist auch ein wirklich leistungsfähiger PDF-zu-txt-Konverter und ermöglicht die Stapelkonvertierung, wenn Sie diese Funktionalität benötigen.
So konvertieren Sie eine PDF-Datei mit Nitro PDF Pro in Text:
- Öffnen Sie Nitro PDF Pro und wählen Sie das Dokument, das Sie konvertieren möchten. Klicken Sie auf "Open".
- Gehen Sie in der Menüleiste auf "File" > "Export".
- Wählen Sie "Rich Text" aus dem Dropdown-Menü.
- Klicken Sie auf "export" und schon sind Sie fertig!
Das war wirklich schon alles! Jetzt haben Sie aus Ihrer PDF-Datei ein durchsuchbares Textdokument erstellt.
Wenn Sie Nitro PDF Pro verwenden, um PDF-Dokumente in Textdateien umzuwandeln, sollten Sie ein paar Dinge beachten. Die App behält einige Formatierungen bei, was in bestimmten Fällen nützlich sein kann. Es gibt zwar Zeiten, in denen Sie definitiv alle Formatierungen einer PDF-Datei entfernen möchten, aber manchmal sind Objekte tatsächlich notwendige Informationen.
Wir haben ein Finanzdokument mit nullprozentigen Einführungsraten für eine Kreditkarte konvertiert, und die meisten Textkonverter ließen die "0" aus dem Dokument einfach weg, weil es sich dabei um ein Objekt und nicht um ein Zeichen handelte. Nitro PDF Pro hatte kein Problem damit, behielt aber nach der Konvertierung der PDF-Datei in ein Textdokument einige Formatierungen bei, was möglicherweise nicht das ist, was Sie suchen.
PDF in Text konvertieren mit Automator – eine native macOS-Lösung
Sie können Vorschau verwenden, um Textdateien als PDF-Dateien zu speichern, aber nicht PDF als txt. Stattdessen ist Apples eingebauter Automator die Lösung. Denken Sie nur daran, dass Automator ein "Profi"-Tool ist. Folgen Sie der Anleitung also genau, um keine Fehler zu machen:
- Öffnen Sie Automator auf Ihrem Mac.
- Wählen Sie "Neues Dokument".
- Wählen Sie "Arbeitsablauf" aus dem erscheinenden Menü.
- Wählen Sie aus dem Menü auf der linken Seite "Dateien und Ordner".
- Im Untermenü auf der rechten Seite des Hauptmenüs finden Sie "Nach Finder-Objekten fragen". Ziehen Sie das auf die offene Fläche ganz rechts im Fenster.
- Wählen Sie in dem Menü nun "PDFs".
- Wählen Sie "PDF-Text extrahieren" aus dem angezeigten Untermenü. Ziehen Sie dieses auch auf die rechte Seite des Bildschirms, unter "Nach Finder-Objekten fragen".
- Wählen Sie unter "PDF-Text extrahieren" als Ausgabeart "Formatierter Text (RTF)" aus.
Ihr Automator-Bildschirm sollte wie folgt aussehen:
- Gehen Sie in der Menüleiste auf Ablage > Sichern.
- Geben Sie den Namen Ihrer neuen App ein.
- Wählen Sie, wo Sie Ihre App speichern möchten.
- Wählen Sie "Programm" als Dateiformat. (Die Voreinstellung ist "Arbeitsablauf".)
Das ist alles, was Sie tun müssen, um Ihre neue Automator-App einzurichten. Führen Sie sie nun aus und extrahieren Sie Text aus einer PDF:
- Doppelklicken Sie auf Ihre App.
- Wählen Sie die PDF-Datei, die Sie konvertieren möchten, und wählen Sie "Auswählen" unten rechts im Fenster.
Ihre PDF-Datei wurde nun in ein Textdokument konvertiert und auf Ihrem Desktop gespeichert. Sie brauchen es nur zu öffnen, und Ihre PDF-Datei ist als Textdokument lesbar!
Ein paar Dinge sind zu beachten. Erstens wird Ihre PDF-Datei nicht zerstört oder in irgendeiner Weise verändert. Diese Automator-App extrahiert nur Text aus der PDF-Datei und speichert diesen Text als neue Datei.
Da die App nur PDF nach txt konvertiert, werden keine Bilder konvertiert.
Text in PDF konvertieren mit Adobe Acrobat
Sie können OCR mit Adobe Acrobat verwenden, allerdings gibt es dabei auch einiges zu beachten. Acrobat ist ein professionelles Tool und kann für Neueinsteiger oder Anfänger wirklich schwierig sein. Da es von Profis entwickelt wurde, werden diejenigen, die keinen leistungsfähigen PDF-Viewer benötigen, Adobe Acrobat in den meisten Fällen zu umfassend und umständlich finden.
Und denken Sie daran: Wir sprechen bei der Konvertierung von PDFs in Textdokumente zwar über einen spezifischen Anwendungsfall, das bedeutet aber nicht, dass es schwierig sein muss. Aus diesem Grund empfehlen wir Prizmo und Nitro PDF Pro. Eine dieser Apps ist sehr wahrscheinlich viel besser auf Ihre Bedürfnisse zugeschnitten als Adobe Acrobat.
Aber wenn Sie die OCR-Funktionalität von Adobe Acrobat nutzen möchten, dann folgen Sie diesen Schritten:
- Öffnen Sie eine PDF-Datei in Acrobat.
- Wählen Sie "Werkzeuge" in der oberen rechten Ecke des Fensters.
- Wählen Sie "Text erkennen".
- Wählen Sie "In dieser Datei".
- Wählen Sie auf dem nächsten Bildschirm aus, wie viele Seiten Ihres Dokuments gescannt werden sollen. Sie können auch Änderungen an der Sprache oder den Ausgabeeinstellungen vornehmen, indem Sie auf "Bearbeiten" klicken.
Das ist wirklich alles, was Sie tun müssen, um das Dokument zu scannen, aber es ist deutlich granularer als andere Apps.
Denken Sie auch daran, dass Ihr Dokument auf diese Weise nicht exportiert wird. Sie haben Ihre PDF-Datei mit Adobe Acrobat lediglich durchsuchbar und jedes Zeichen erkennbar gemacht.
Und die Online Optionen für PDFs mit OCR?
Es gibt mehrere Online-Dienste zum Scannen von PDFs mit einem OCR-Feature. Ihre Fähigkeiten sind ähnlich – alle scannen Ihre PDFs und wandeln sie mit Hilfe eines optischen Zeichenerkennungsdienstes in Textdokumente um, aber man sollte ein paar Dinge bedenken.
Erstens verwenden Sie einen Cloud-basierten Dienst, und es gibt keine Möglichkeit zu erfahren, was hinter den Kulissen geschieht. Auch wenn wir nicht bezweifeln, dass die meisten PDFs einfach als Dienstleistung in Text konvertieren, fragen wir uns doch, warum sie dies kostenlos anbieten. Es kann sein, dass sie einen Algorithmus für maschinelles Lernen trainieren wollen, indem sie mit Massen-Daten arbeiten, oder sie könnten Kopien Ihrer PDFs oder Textdateien zu irgendeinem anderen Zweck speichern.
Online-Dienste sind manchmal auch eine Fassade für die Erfassung Ihrer E-Mail-Adresse zu Marketingzwecken. Es gibt auch ein Modell, bei dem Ihr erster Scan kostenlos ist und nachfolgende Scans Geld kosten, oder Sie den Dienst abonnieren müssen. Viele tun dies vielleicht, um schnell ein paar Scans durchzuführen, aber wenn Sie Ihr Abonnement vergessen, summieren sich die Kosten mit der Zeit.
Einfach gesagt: Wir ziehen wir es vor, native Apps für diese Arbeit zu verwenden.
Die Konvertierung einer PDF-Datei in eine Textdatei ist einer jener Anwendungsfälle, bei denen Ihre Bedürfnisse so einzigartig sind, dass es schwierig sein kann, eine Lösung zu finden, aber gleichzeitig so dringend, dass Sie schnell eine Lösung benötigen.
Es fällt uns schwer, Adobe Acrobat zu empfehlen. Es ist zwar robust, aber für die meisten von uns einfach zu umfangreich. Adobe lebt von älteren Unternehmensumgebungen, in denen Unternehmen die Leistung benötigen, die Acrobat bietet.
Automator ist handlich und lieferte gute Ergebnisse. Es behielt für unseren Geschmack zu viele Formatierungen bei und gab einige Texte in Farben wieder. Textdokumente wurden in der App TextEdit auf dem Mac geöffnet, und es war schwierig, einen Großteil des von Automator bereitgestellten Textes zu lesen. Wir wollten einen klaren, prägnanten, genauen Text aus einer PDF-Datei, der lesbar und durchsuchbar ist.
Genau das zeichnet Prizmo und Nitro PDF Pro aus. Uns gefallen beide Apps, weil sie Ihnen die Arbeit deutlich erleichtern. Prizmo verfügt über eine viel strengere OCR-Engine, während Nitro PDF Pro mehr von den Seiteninformationen erfasst. Wir haben drei Dokumente nebeneinander getestet und festgestellt, dass dies für alle von uns verwendeten PDF-Dokumente zutrifft.
Es gibt keine besondere Empfehlung von uns. Wir sind der Meinung, dass beide Apps einfach genug zu handhaben sind, so dass eine Entscheidung für die eine oder die andere nicht gerechtfertigt scheint. Wenn eine nicht funktioniert, kann die andere App Ihre Bedürfnisse schnell und einfach erfüllen.
Das Beste von allem ist, dass Prizmo und Nitro PDF Pro alle kostenlos erhältlich sind – als Teil einer kostenlosen Testversion von Setapp, der vielseitigsten Suite von Produktivitäts-Apps für Mac.