Help:Konvertieren

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting and have to be approved by a translation administrator.

Konvertierung ein Dokument von einem Format in ein anderes für Commons kann nützlich sein

  • um Derivate leichter zugänglich zu machen;
  • weil jedes Format seine eigenen Vorteile hat;
  • wenn du 2 oder mehr Bücher gleichzeitig geöffnet haben mußt, in verschiedenen Anzeigeprogrammen.

Es kann also eine gute Idee sein, Bücher in mehr als einem Format zu haben.

PDF konvertieren

  • Obwohl PDF-Dokumente von Commons akzeptiert werden, können sie dennoch schwer zugänglich sein.

Konvertieren von PDF nach DJVU

Siehe Konvertieren von PDF nach DjVu.

Konvertieren von PDF nach Bilder

Siehe Commons:Extracting_images_from_PDF#Extract_PDF_pages_as_images.

Text aus PDF extrahieren

Wenn die PDF-Datei den Text in einer leicht zu extrahierenden Form enthält, dann verwende einige der folgenden Möglichkeiten:

  • „Als Text speichern“ des Adobe Acrobat-Viewers
  • GSview's „Bearbeiten“ / „Textauszug...“
  • STDUViewer's Menüpunkt Datei -> Exportieren -> in Text
  • XPdf-Befehlszeilen-Tools pdftotext, pdftohtml.

Andernfalls, wenn die PDF-Datei Text als Bilder enthält:

  • Befolge die Ratschläge unter „PDF in Bilder konvertieren“ oben, dann folge den Ratschlägen unter „Konvertieren von Bildformaten in Text (OCR)“ unten.

DjVu konvertieren

Das Konvertieren von DjVu in andere Formate ist nützlich, weil jemand vielleicht keinen DjVu-Viewer installiert hat und andere Formate leicht im Browser angezeigt werden können.

Konvertieren von DjVu nach PDF

Siehe Seite Help:Converting DjVu to PDF

Konvertieren von DjVu nach Bilder

Verwende die DjVuLibre-Befehlszeilen-Dienstprogramme ddjvu (DjVu-Decoder) oder djvups (zur Konvertierung in PostScript).

Text aus DjVu extrahieren

WinDjView kann das oder das DjVuLibre-Befehlszeilen-Tool djvutxt.

Bilder konvertieren

Konvertierung zwischen Bildformaten

  • Verwende die (für den persönlichen Gebrauch kostenlose) Shareware IrfanView oder XnView (und das zugehörige Kommandozeilen-Werkzeug NConvert), jpegcrop oder die freie Software ImageMagick für fortgeschrittene Transformationen

Verarbeitung der vom Scanner erhaltenen Bilder

Bilder, die mit einem Scanner gemacht werden, müssen normalerweise bearbeitet werden, bevor daraus ein PDF oder DJVU erstellt werden kann: Beschneiden, Drehen, Teilen, Verkleinern, Konvertieren in TIFF usw. Die Open-Source-Anwendung [https:/github.comtrufanov-nokscantailor-universal ScanTailor-Universal] ist für diesen Zweck konzipiert. Sie kann von der [https:/github.comtrufanov-nokscantailor-universalreleases Releases]-Seite des Projekts heruntergeladen werden.

Erzeugung von PDF aus Bildern

  • img2pdf, ein Open-Source-Befehlszeilenprogramm; es wurde entwickelt, um Bilder verlustfrei in PDF zu konvertieren. Es kann auch Metadaten (wie z. B. den Titel und den Autor) festlegen und wie die resultierende PDF-Datei von einem PDF-Anzeigeprogramm dargestellt werden soll.

Der folgende Befehl nimmt alle Dateien im aktuellen Ordner und konvertiert sie in eine einzelne PDF-Datei mit dem Namen test.pdf mit Titel- und Autoren-Metadaten:

img2pdf --title "My First PDF" --author "Jack Example" --output test.pdf *

Beachte, dass dies voraussetzt, dass das aktuelle Verzeichnis keine Nicht-Bilddateien oder Unterordner enthält. Wenn alle Quelldateien von einem einzigen Typ sind, wie z. B. JPEGs, kannst du stattdessen *.jpg als Eingabe angeben. Du kannst auch mehrere Eingabedateien einzeln angeben.

Siehe img2pdf --help für alles, was img2pdf tun kann.

img2pdf ist über den Python Package Index verfügbar und ist auch in den Repositories vieler Linux-Distributionen enthalten. Eine ausführbare Windows-Version ist auch über das Projekt Appveyor verfügbar.

Der folgende Befehl wandelt mit dem ImageMagick-Werkzeug mogrify alle JPEG-Dateien in einzelne PDF-Dateien um und legt sie in einem Unterordner mit dem Namen „pdf“ ab:

mogrify -format pdf -path pdf/ *.jpg

Bei einigen Linux-Distributionen blockiert die standardmäßige ImageMagick-Sicherheitsrichtlinie das Programm für die Verarbeitung von PDF-Dateien. Diese StackOverflow-Frage erklärt, wie du die Sicherheitsrichtlinie ändern kannst.

Erzeugung von PDF aus bitonalen Bildern

Bitonale Bilder (d. h. Bilder, die nur eine einzige Schwarz-Weiß-Schattierung enthalten) sind eine sehr effiziente Methode zum Speichern gescannter Dokumente, die nur Text oder andere einfache Elemente enthalten, die nur zwei Farben benötigen, um klar dargestellt zu werden. Eine hochwertige bitonale Textseite ist in der Regel nur einige zehn Kilobyte groß.

Es gibt zwei bitonale Kompressionsverfahren, die in PDF-Dateien verwendet werden, nämlich die CCITT Gruppe 4 Fax-Kompression und die JBIG2-Kompression. Letztere ist effizienter, aber mit einigen vermeintlichen Patentproblemen verbunden, was dazu führt, dass die JBIG2-Kodierungsfunktionalität in Software zur PDF-Erstellung oft fehlt oder deaktiviert ist. Es ist jedoch manchmal möglich, diese Funktionalität zu aktivieren, indem der Encoder selbst installiert wird.

Es gibt eine Reihe von Tools zum Konvertieren von Bildern für die Bitonal-Komprimierung. ScanTailor-Universal ist ein Open-Source-Werkzeug zur Verarbeitung gescannter Seiten, das bitonale Bilder ausgeben kann. Auch ImageMagick und GraphicsMagick können dies mit der Option threshold.

Der folgende ImageMagick-Befehl konvertiert alle .jpg-Dateien in einem Ordner in bitonale TIF-Dateien mit der Komprimierung der Gruppe 4 und legt sie in einem Ordner mit dem Namen „bitonal“ ab:

mogrify -format tif -compress Group4 -path bitonal/ -threshold 50% *.jpg

Spiele mit dem Wert von -threshold herum, um einen Wert zu finden, der bei deinen Inhalten gute Ergebnisse liefert.

JBIG2-Konvertierung

OCRmyPDF ist ein Open-Source-Befehlszeilenprogramm, das hauptsächlich zum Hinzufügen einer OCR-Textebene zu gescannten PDF-Dateien dient. Eine seiner zusätzlichen Funktionen ist die Möglichkeit, PDF-Dateien zu optimieren, wozu auch die Konvertierung anderer bitonaler Bildformate nach JBIG2 gehört. Dies erfordert die Installation des jbig2enc-Encoders. Kompilierungs- und Installationsanweisungen für Linux-Benutzer sind hier verfügbar, und eine ausführbare Windows-Version eines Drittanbieters ist hier erhältlich. Die in Homebrew verpackte MacOS-Version enthält bereits jbig2enc.

Siehe hier für die Installation von OCRmyPDF unter Windows. Bei vielen Linux-Distributionen ist ein OCRmyPDF-Paket in den Repositories enthalten, das allerdings veraltet sein kann. OCRmyPDF ist auch auf pip verfügbar.

Der folgende Befehl verwendet OCRmyPDF, um eine OCR-Textebene zu einer PDF-Datei hinzuzufügen und die PDF-Datei so anzuordnen, dass ein Webbrowser mit der Anzeige beginnen kann, bevor sie vollständig heruntergeladen wurde:

ocrmypdf --output-type pdf --fast-web-view 0 test.pdf test-OCR.pdf

OCRmyPDF optimiert das PDF standardmäßig verlustfrei, so dass bitonale Bilder automatisch nach JBIG2 konvertiert werden, wenn jbig2enc installiert ist.

Wenn du den OCR-Vorgang überspringen möchtest, weil du die PDF nicht mit OCR bearbeiten möchtest, verwende --tesseract-timeout 0, um den OCR-Prozess ganz zu überspringen.

Weitere Anwendungsbeispiele findest du in der Dokumentation von OCRmyPDF.

DjVu aus Bildern erzeugen

Verwenden die DjVuLibre-Befehlszeilen-Tools c44 (für Farbbilder) und cjb2 (für bitonale Bilder), um Bilder in einseitige DjVu-Dateien zu konvertieren, dann füge sie mit djvm zusammen.

Beispiel c44-Befehlszeile: c44 [options] pnm-or-jpeg-file [djvufile]
Die wichtigsten Optionen sind -slice, -dpi und -mask. -slice legt die Anzahl der „slices“ in jedem „chuck“ fest (das sind einige komplizierte DjVu-Begriffe). Die Angabe von drei Zahlen bedeutet, dass es drei „chucks“ gibt, und vier Zahlen ergeben vier Chunks. Diese Zahlen haben beträchtliche Auswirkungen auf Qualität und Größe - experimentiere damit und lies die Dokumentation.
c44 -slice -slice 74+13+10 -dpi 150 pnm-or-jpeg-file [djvufile]


Aus der selbsterklärenden Hilfe des bitonalen cjb2-Encoders:

Usage: cjb2 [options] <input-pbm-or-tiff> <output-djvu>
Options are:
 -verbose        Display additional messages.
 -dpi <n>        Specify image resolution (default 300).
 -clean          Cleanup image by removing small flyspecks.
 -lossy          Lossy compression (implies -clean as well)
 -losslevel <n>  Loss factor (implies -lossy, default 100)
Encoding is lossless unless a lossy options is selected.

In vielen Fällen kann -losslevel problemlos auf bis zu 50 festgelegt werden.

Einzelheiten in der DjVuLibre-Dokumentation.

Minidjvu ermöglicht die Konvertierung von schwarzweißen ein- und mehrseitigen TIFF-, BMP- und PBM-Dateien in DjVu und umgekehrt. Es hat eine einfache grafische Oberfläche. Seine Unterstützung für mehrseitige TIFF-Dateien ist ein beträchtlicher Vorteil gegenüber den DjVuLibre-Tools.

minidjvu 0.8 - encode/decode bitonal DjVu files
Usage:
single page encoding/decoding:
    minidjvu [options] <input file> <output file>
multiple pages encoding:
    minidjvu [options] <input file> ... <output file>
Formats supported:
    DjVu (single-page bitonal), PBM, Windows BMP, TIFF.
Options:
    -A, --Averaging:               compute "average" representatives
    -a <n>, --aggression <n>:      set aggression level (default 100)
    -c, --clean                    remove small black pieces
    -d <n> --dpi <n>:              set resolution in dots per inch
    -e, --erosion                  sacrifice quality to gain in size
    -i, --indirect:                generate an indirect multipage document
    -l, --lossy:                   use all lossy options (-s -c -m -e -A)
    -m, --match:                   match and substitute patterns
    -n, --no-prototypes:           do not search for prototypes
    -p <n>, --pages-per-dict <n>:  pages per dictionary (default 10)
    -r, --report:                  report multipage coding progress
    -s, --smooth:                  remove some badly looking pixels

Konvertierung von Bildformaten in Text (optische Zeichenerkennung)

gImageReader

  • gImageReader ist eine Open-Source-Anwendung zum Extrahieren von Text aus Bildern und bildbasierten PDF-Dokumenten. Es ist in der Lage, das Layout von Text automatisch zu erkennen und den erkannten Text nachzubearbeiten, einschließlich Rechtschreibprüfung und Entfernung von Zeilenumbrüchen. Es verwendet Tesseract zur Texterkennung und unterstützt daher jede Sprache, die Tesseract unterstützt.

IrfanView

  • Verwende in IrfanView die Option „OCR starten" (OCR ist Optische Zeichenerkennung), um den Text zu extrahieren. Seit dem 20.02.2010 ist das KADMOS OCR-Plugin für Irfanview auf etwa sechs Seiten begrenzt, abhängig vom freien Speicher deines Computers (etwa ein Gigabyte pro 10 Seiten).

Pdf X-Change Viewer

Tesseract

  • Verwende die Open-Source-Software Tesseract (Linux, Mac OS X oder Windows):
  • Lade sowohl die „tesseract“-Software als auch die „tessdata“-Sprachpakete herunter, die für die im gescannten Dokument vorkommenden Sprachen oder Skripte relevant sind, und entpacke sie in denselben Ordner; für die ausführbare Windows-Datei ist keine Installation erforderlich.
  • Erhalte einen Scan mit der höchstmöglichen Auflösung und vergrößere gegebenenfalls das Scan-Bild weiter (verwende eine schnelle Größenänderung, vermeide Resample-Filter), bis die Zeichen über 20 Pixel hoch sind (experimentiere für beste Ergebnisse) und speichere es (verwende ImageMagick oder IrfanView)
  • verwende den Befehl tesseract IMAGEFILE OUTPUT

eScriptorium

  • Verwende die Open-Source-Software eScriptorium mit Kraken. Die Serverkomponente kann auf Linux, macOS oder Windows (mit WSL) installiert werden. Die Client-Seite ist eine Web-Anwendung, die in jedem modernen Web-Browser funktioniert. Sie ermöglicht die Segmentierung von Textregionen und Zeilen sowie die Erkennung von gedrucktem Text und Handschrift. Sowohl die Segmentierung als auch die Erkennung können trainiert werden.

Google

Google verfügt über OCR. Siehe:

In allen Fällen kann es sein, dass du in Abschnitten konvertieren musst. Du musst den generierten Text manuell korrigieren, da die Konvertierung nicht perfekt ist.

Video konvertieren

Siehe Help:Converting video.

Weiterführende Hilfe

Du kannst auf Commons:Help desk um Hilfe bitten.

Siehe auch