Erweiterte Optionen
Erweiterte Optionen > Erweiterte Optionen (aktuell)
Inhaltsverzeichnis
- Kommandozeilen-Argumente
- Teilweise Übersetzung
- Quell- und Zielsprachen angeben
- Übersetzen mit Ausnahmen
- Benutzerdefinierte Eingabeaufforderung
- Benutzerdefinierte Konfiguration
- Bereinigung überspringen
- Übersetzungscache
- Bereitstellung als öffentlicher Dienst
- Authentifizierung und Willkommensseite
- Unterstützung für das Glossar
Kommandozeilen-Argumente
Führen Sie den Übersetzungsbefehl in der Kommandozeile aus, um das übersetzte Dokument example-mono.pdf
und das zweisprachige Dokument example-dual.pdf
im aktuellen Arbeitsverzeichnis zu generieren. Verwenden Sie Google als Standard-Übersetzungsdienst. Weitere unterstützte Übersetzungsdienste finden Sie HIER.
In der folgenden Tabelle listen wir alle erweiterten Optionen zur Referenz auf:
Argumente
Option | Function | Example |
---|---|---|
files | Lokaler PDF-Dateipfad | pdf2zh ~/local.pdf |
links | Online-Dateien | pdf2zh http://arxiv.org/paper.pdf |
--output | Ausgabeverzeichnis für Dateien | pdf2zh example.pdf --output /outputpath |
--<Services> | Verwenden Sie einen bestimmten Dienst für die Übersetzung | pdf2zh example.pdf --openai pdf2zh example.pdf --deepseek |
--help , -h | Hilfe-Nachricht anzeigen und beenden | pdf2zh -h |
--config-file | Pfad zur Konfigurationsdatei | pdf2zh --config-file /path/to/config/config.toml |
--report-interval | Fortschrittsberichtsintervall in Sekunden | pdf2zh example.pdf --report-interval 5 |
--debug | Debug-Logging-Level verwenden | pdf2zh example.pdf --debug |
--gui | Interaktion mit der GUI | pdf2zh --gui |
--warmup | Lädt und überprüft nur die erforderlichen Assets und beendet dann den Vorgang | pdf2zh example.pdf --warmup |
--generate-offline-assets | Erzeugt ein Offline-Asset-Paket im angegebenen Verzeichnis | pdf2zh example.pdf --generate-offline-assets /path |
--restore-offline-assets | Offline-Assets-Paket aus dem angegebenen Verzeichnis wiederherstellen | pdf2zh example.pdf --restore-offline-assets /pfad |
--version | Version anzeigen und beenden | pdf2zh --version |
--pages | Teilweise Übersetzung des Dokuments | pdf2zh example.pdf --pages 1,2,1-,-3,3-5 |
--lang-in | Der Code der Quellsprache | pdf2zh example.pdf --lang-in en |
--lang-out | Der Code der Zielsprache | pdf2zh example.pdf --lang-out zh-CN |
--min-text-length | Minimale Textlänge für die Übersetzung | pdf2zh example.pdf --min-text-length 5 |
--rpc-doclayout | RPC-Service-Hostadresse für die Dokumentlayoutanalyse | |
--qps | QPS-Limit für den Übersetzungsdienst | pdf2zh example.pdf --qps 200 |
--ignore-cache | Übersetzungscache ignorieren | pdf2zh example.pdf --ignore-cache |
--custom-system-prompt | Benutzerdefinierte Eingabeaufforderung für die Übersetzung. Wird für /no_think in Qwen 3 verwendet | pdf2zh example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine" |
--pool-max-worker | Maximale Anzahl der Worker für den Übersetzungspool. Wenn nicht gesetzt, wird qps als Anzahl der Worker verwendet | pdf2zh example.pdf --pool-max-worker 100 |
--no-auto-extract-glossary | Automatische Glossarextraktion deaktivieren | pdf2zh example.pdf --no-auto-extract-glossary |
--primary-font-family | Überschreibt die primäre Schriftfamilie für übersetzten Text. Optionen: 'serif' für Serifenschriften, 'sans-serif' für serifenlose Schriften, 'script' für Schreibschrift/kursive Schriften. Falls nicht angegeben, wird eine automatische Schriftauswahl basierend auf den Eigenschaften des Originaltextes verwendet. | pdf2zh example.pdf --primary-font-family serif |
--no-dual | Gibt keine zweisprachigen PDF-Dateien aus | pdf2zh example.pdf --no-dual |
--no-mono | Gibt keine einsprachigen PDF-Dateien aus | pdf2zh example.pdf --no-mono |
--formular-font-pattern | Schriftmuster zur Identifizierung von Formeltext | pdf2zh example.pdf --formular-font-pattern "(MS.*)" |
--formular-char-pattern | Zeichenmuster zur Identifizierung von Formeltext | pdf2zh example.pdf --formular-char-pattern "(MS.*)" |
--split-short-line | Erzwingt die Aufteilung kurzer Zeilen in verschiedene Absätze | pdf2zh example.pdf --split-short-line |
--short-line-split-factor | Teilungsschwellenfaktor für kurze Zeilen | |
--skip-clean | Schritt zur PDF-Bereinigung überspringen | pdf2zh example.pdf --skip-clean |
--dual-translate-first | Im Dual-PDF-Modus die Übersetzungsseite priorisieren | pdf2zh example.pdf --dual-translate-first |
--disable-rich-text-translate | Deaktiviert die Übersetzung von formatiertem Text | pdf2zh example.pdf --disable-rich-text-translate |
--enhance-compatibility | Alle Optionen zur Kompatibilitätsverbesserung aktivieren | pdf2zh example.pdf --enhance-compatibility |
--use-alternating-pages-dual | Verwendung des Seitenwechselmodus für duale PDFs | pdf2zh example.pdf --use-alternating-pages-dual |
--watermark-output-mode | Wasserzeichen-Ausgabemodus für PDF-Dateien | pdf2zh example.pdf --watermark-output-mode "NoWaterMark" |
--max-pages-per-part | Maximale Seiten pro Teil für die Aufteilung der Übersetzung | pdf2zh example.pdf --max-pages-per-part 1 |
--translate-table-text | Tabellentext übersetzen (experimentell) | pdf2zh example.pdf --translate-table-text |
--skip-scanned-detection | Erkennung gescannter Dokumente überspringen | pdf2zh example.pdf --skip-scanned-detection |
--ocr-workaround | Erzwingt, dass übersetzter Text schwarz ist und fügt einen weißen Hintergrund hinzu | pdf2zh example.pdf --ocr-workaround |
--auto-enable-ocr-workaround | Aktiviert die automatische OCR-Umgehung. Wenn ein Dokument als stark gescannt erkannt wird, wird versucht, die OCR-Verarbeitung zu aktivieren und die weitere Scan-Erkennung zu überspringen. Siehe Dokumentation für Details. (Standard: False) | pdf2zh example.pdf --auto-enable-ocr-workaround True |
--only-include-translated-page | Nur übersetzte Seiten in die Ausgabe-PDF aufnehmen. Wirkt nur, wenn --pages verwendet wird. | pdf2zh example.pdf --pages 1-5 --only-include-translated-page |
--glossaries | Benutzerdefiniertes Glossar für die Übersetzung. | pdf2zh example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv" |
--save-auto-extracted-glossary | automatisch extrahiertes Glossar speichern. | pdf2zh example.pdf --save-auto-extracted-glossary |
GUI-Argumente
Option | Funktion | Beispiel |
---|---|---|
--share | Freigabemodus aktivieren | pdf2zh --gui --share |
--auth-file | Pfad zur Authentifizierungsdatei | pdf2zh --gui --auth-file /pfad |
--welcome-page | Pfad zur Willkommens-HTML-Datei | pdf2zh --gui --welcome-page /path |
--enabled-services | Aktivierte Übersetzungsdienste | pdf2zh --gui --enabled-services "Bing,OpenAI" |
--disable-gui-sensitive-input | Deaktiviert die GUI-sensible Eingabe | pdf2zh --gui --disable-gui-sensitive-input |
--disable-config-auto-save | Automatisches Speichern der Konfiguration deaktivieren | pdf2zh --gui --disable-config-auto-save |
--server-port | WebUI-Port | pdf2zh --gui --server-port 7860 |
Teilweise Übersetzung
Verwenden Sie den Parameter --pages
, um einen Teil eines Dokuments zu übersetzen.
- Wenn die Seitenzahlen aufeinanderfolgend sind, können Sie es so schreiben:
Tip
25-
schließt alle Seiten nach Seite 25 ein. Wenn Ihr Dokument 100 Seiten hat, entspricht dies 25-100
.
Ebenso schließt -25
alle Seiten vor Seite 25 ein, was 1-25
entspricht.
- Wenn die Seiten nicht aufeinanderfolgend sind, können Sie ein Komma
,
verwenden, um sie zu trennen.
Beispielsweise, wenn Sie die erste und dritte Seite übersetzen möchten, können Sie den folgenden Befehl verwenden:
- Wenn die Seiten sowohl aufeinanderfolgende als auch nicht aufeinanderfolgende Bereiche enthalten, können Sie diese auch mit einem Komma verbinden, wie folgt:
Dieser Befehl übersetzt die erste Seite, die dritte Seite, die Seiten 10 bis 20 und alle Seiten von 25 bis zum Ende.
Quell- und Zielsprachen angeben
Siehe Google Sprachcodes, DeepL Sprachcodes
Übersetzen mit Ausnahmen
Verwenden Sie reguläre Ausdrücke, um Formelschriften und Zeichen anzugeben, die erhalten bleiben müssen:
pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
Erhalte standardmäßig die Schriftarten Latex
, Mono
, Code
, Italic
, Symbol
und Math
:
pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"
Benutzerdefinierte Eingabeaufforderung
Benutzerdefinierte Systemeingabeaufforderung für die Übersetzung. Sie wird hauptsächlich verwendet, um die '/no_think'-Anweisung von Qwen 3 in die Eingabeaufforderung einzufügen.
pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"
Benutzerdefinierte Konfiguration
Es gibt mehrere Möglichkeiten, die Konfigurationsdatei zu ändern und zu importieren.
Note
Hierarchie der Konfigurationsdateien
Wenn derselbe Parameter mit verschiedenen Methoden geändert wird, wendet die Software die Änderungen gemäß der folgenden Prioritätsreihenfolge an.
Änderungen mit höherer Priorität überschreiben solche mit niedrigerer Priorität.
cli/gui > env > Benutzerkonfigurationsdatei > Standardkonfigurationsdatei
- Konfiguration über Kommandozeilen-Argumente ändern
In den meisten Fällen können Sie Ihre gewünschten Einstellungen direkt über Kommandozeilen-Argumente übergeben. Weitere Informationen finden Sie unter Kommandozeilen-Argumente.
Wenn Sie beispielsweise ein GUI-Fenster aktivieren möchten, können Sie den folgenden Befehl verwenden:
- Konfiguration über Umgebungsvariablen ändern
Sie können die --
in Kommandozeilen-Argumenten durch PDF2ZH_
ersetzen, Parameter mit =
verbinden und -
durch _
als Umgebungsvariablen ersetzen.
Beispielsweise, wenn Sie ein GUI-Fenster aktivieren möchten, können Sie den folgenden Befehl verwenden:
- Benutzerdefinierte Konfigurationsdatei
Sie können eine Konfigurationsdatei mit dem folgenden Kommandozeilen-Argument angeben:
Wenn Sie sich über das Format der Konfigurationsdatei unsicher sind, lesen Sie bitte die unten beschriebene Standardkonfigurationsdatei.
- Standardkonfigurationsdatei
Die Standardkonfigurationsdatei befindet sich unter ~/.config/pdf2zh
. Bitte ändern Sie die Konfigurationsdateien im Verzeichnis default
nicht. Es wird dringend empfohlen, sich auf den Inhalt dieser Konfigurationsdatei zu beziehen und die Benutzerdefinierte Konfigurationsdatei zu verwenden, um Ihre eigene Konfigurationsdatei zu implementieren.
Tip
- Standardmäßig speichert pdf2zh 2.0 die aktuelle Konfiguration automatisch in
~/.config/pdf2zh/config.v3.toml
jedes Mal, wenn Sie auf die Übersetzungsschaltfläche in der GUI klicken. Diese Konfigurationsdatei wird beim nächsten Start standardmäßig geladen. - Die Konfigurationsdateien im Verzeichnis
default
werden automatisch vom Programm generiert. Sie können sie zur Modifikation kopieren, aber bitte ändern Sie sie nicht direkt. - Konfigurationsdateien können Versionsnummern wie "v2", "v3" usw. enthalten. Dies sind Versionsnummern der Konfigurationsdatei, nicht die Versionsnummer von pdf2zh selbst.
Bereinigung überspringen
Wenn dieser Parameter auf True gesetzt wird, wird der Schritt zur PDF-Bereinigung übersprungen, was die Kompatibilität verbessern und einige Probleme bei der Schriftverarbeitung vermeiden kann.
Verwendung:
Oder Umgebungsvariablen verwenden:
Tip
Wenn --enhance-compatibility
aktiviert ist, wird die Bereinigung automatisch übersprungen.
Übersetzungscache
PDFMathTranslate speichert übersetzte Texte zwischen, um die Geschwindigkeit zu erhöhen und unnötige API-Aufrufe für gleiche Inhalte zu vermeiden. Sie können die Option --ignore-cache
verwenden, um den Übersetzungscache zu ignorieren und eine erneute Übersetzung zu erzwingen.
Bereitstellung als öffentlicher Dienst
Wenn Sie eine pdf2zh GUI auf öffentlichen Diensten bereitstellen, sollten Sie die Konfigurationsdatei wie unten beschrieben anpassen.
Tip
- Bei der öffentlichen Bereitstellung sollten sowohl
disable_gui_sensitive_input
als auchdisable_config_auto_save
aktiviert sein. - Trennen Sie verschiedene verfügbare Dienste mit englischen Kommas , .
Eine nutzbare Konfiguration ist wie folgt:
[basic]
gui = true
[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true
Authentifizierung und Willkommensseite
Bei Verwendung von Authentifizierung und Willkommensseite, um festzulegen, welcher Benutzer die Web-Oberfläche nutzen und die Anmeldeseite anpassen kann:
Beispiel auth.txt Jede Zeile enthält zwei Elemente, Benutzername und Passwort, getrennt durch ein Komma.
Beispiel welcome.html
<!DOCTYPE html>
<html>
<head>
<title>Simple HTML</title>
</head>
<body>
<h1>Hello, World!</h1>
<p>Welcome to my simple HTML page.</p>
</body>
</html>
Note
Die Willkommensseite wird nur funktionieren, wenn die Authentifizierungsdatei nicht leer ist. Wenn die Authentifizierungsdatei leer ist, gibt es keine Authentifizierung. :)
Eine nutzbare Konfiguration ist wie folgt:
[basic]
gui = true
[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"
Unterstützung für das Glossar
PDFMathTranslate unterstützt die Glossartabelle. Die Glossartabellendatei sollte eine csv
-Datei sein. Die Datei enthält drei Spalten. Hier ist eine Demo-Glossardatei:
source | target | tgt_lng |
---|---|---|
AutoML | 自动 ML | zh-CN |
a,a | a | zh-CN |
" | " | zh-CN |
Für CLI-Benutzer: Sie können mehrere Dateien für das Glossar verwenden. Unterschiedliche Dateien sollten durch ,
getrennt werden.
Für WebUI-Benutzer:
Sie können jetzt Ihre eigene Glossardatei hochladen. Nachdem Sie die Datei hochgeladen haben, können Sie sie überprüfen, indem Sie auf ihren Namen klicken und der Inhalt wird unten angezeigt.