Linux & Co.Office & BusinessSoftware

PDF im Linux-Terminal stapelweise nach TXT konvertieren (+ pdftotext-GUI)

PDFs wandelt Ihr unter Linux am einfachsten mit dem Standard-Tool pdftotext ins TXT-Format. Leider beherrscht das Kommandozeilen-Tool keine Funktion, um mehrere Dateien auf einmal zu verarbeiten. Mit einem kleinen, einfachen Kniff geht es aber dennoch – der sogar jedem beliebigen CLI-Programm einen Batch-Modus verschafft. Und falls Ihr die Kommandozeile nicht so sehr mögt, nutzt einfach die kleine GUI, die wir für Euch gebastelt haben – PDFs wählen, Konverter starten, TXTs landen im selben Verzeichnis. Wozu das ganze? Mit Textdateien lässt sich beispielsweise besser verfahren, wenn Ihr größere Textmengen analysieren oder visualisieren wollt (Word Clouds, Wort-Statistiken, Indexe).

PDFtoText richtig nutzen

Hier zunächst mal der Standardaufruf von pdftotext:
$ pdftotext hallo.txt
Sollen viele Dateien konvertiert werden, muss pdftotext über eine Schleife für jede einzelne erneut gestartet werden:
$ for f in $(ls *.pdf); do pdftotext $f; done
Schritt für Schritt: Für jeden Dateinamen (gespeichert in der Variablen „f“), der sich in der mit „ls *.pdf“ erstellten Liste befindet, führt die Schleife den Befehl „pdftotext $f“ aus, wobei eben $f mit dem jeweiligen Dateinamen ersetzt wird. Das Praktische: Mit dieser Schleife spendiert Ihr jedem beliebigen Tool einen Batch-Modus. Alternativ könnt Ihr hier bei uns die kleine GUI namens B2T Batch Lite herunterladen – den gesamten Funktionsumfang seht Ihr bereits im Bild.

p2tbatchlite
Die getippte Schleife ist schicker, aber falls Ihr Euch den Befehl nicht merken könnt, hilft die GUI Gelegenheitsnutzern.
p2tbatchfull
Zukunftsmusik: Mehr Dateiformate und statistische Analysen.

Mirco Lang

Freier Journalist, Exil-Sauerländer, (ziemlich alter) Skateboarder, Dipl.-Inf.-Wirt, Einzelhandelskaufmann, Open-Source-Nerd, Checkmk-Handbuchschreiber. Ex-Saturn'ler, Ex-Data-Becker'ler, Ex-BSI'ler. Computer-Erstkontakt: ca. 1982 - der C64 des großen Bruders eines Freunds. Wenn Ihr hier mehr über Open Source, Linux und Bastelkram lesen und Tutonaut unterstützen möchtet: Über Kaffeesponsoring via Paypal.freue ich mich immer. Schon mal im Voraus: Danke! Nicht verpassen: cli.help und VoltAmpereWatt.de. Neu: Mastodon

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Schaltfläche "Zurück zum Anfang"
Schließen

Ooopsi!

Bitte deaktiviere Deinen Adblocker.