跳轉到

Erweiterte Optionen

Erweiterte Optionen > Erweiterte Optionen (aktuell)


Inhaltsverzeichnis


Kommandozeilen-Argumente

Führen Sie den Übersetzungsbefehl in der Kommandozeile aus, um das übersetzte Dokument example-mono.pdf und das zweisprachige Dokument example-dual.pdf im aktuellen Arbeitsverzeichnis zu generieren. Verwenden Sie Google als Standard-Übersetzungsdienst. Weitere unterstützte Übersetzungsdienste finden Sie HIER.

cmd

In der folgenden Tabelle listen wir alle erweiterten Optionen zur Referenz auf:

Argumente
Option Funktion Beispiel
files Lokaler PDF-Dateipfad pdf2zh ~/local.pdf
links Online-Dateien pdf2zh http://arxiv.org/paper.pdf
--output Ausgabeverzeichnis für Dateien pdf2zh example.pdf --output /outputpath
--<Services> Verwenden Sie einen bestimmten Dienst für die Übersetzung pdf2zh example.pdf --openai
pdf2zh example.pdf --deepseek
--help, -h Hilfe-Nachricht anzeigen und beenden pdf2zh -h
--config-file Pfad zur Konfigurationsdatei pdf2zh --config-file /path/to/config/config.toml
--report-interval Fortschrittsberichtsintervall in Sekunden pdf2zh example.pdf --report-interval 5
--debug Debug-Protokollierungsebene verwenden pdf2zh example.pdf --debug
--gui Interaktion mit der GUI pdf2zh --gui
--warmup Lädt nur die erforderlichen Assets herunter und überprüft sie, dann wird beendet pdf2zh example.pdf --warmup
--generate-offline-assets Offline-Assets-Paket im angegebenen Verzeichnis generieren pdf2zh example.pdf --generate-offline-assets /path
--restore-offline-assets Stellt das Offline-Asset-Paket aus dem angegebenen Verzeichnis wieder her pdf2zh example.pdf --restore-offline-assets /pfad
--version Version anzeigen und beenden pdf2zh --version
--pages Teilweise Dokumentübersetzung pdf2zh example.pdf --pages 1,2,1-,-3,3-5
--lang-in Der Code der Quellsprache pdf2zh example.pdf --lang-in en
--lang-out Der Code der Zielsprache pdf2zh example.pdf --lang-out zh-CN
--min-text-length Minimale Textlänge für die Übersetzung pdf2zh example.pdf --min-text-length 5
--rpc-doclayout RPC-Service-Hostadresse für die Dokumentlayoutanalyse
--qps QPS-Limit für den Übersetzungsdienst pdf2zh example.pdf --qps 200
--ignore-cache Übersetzungscache ignorieren pdf2zh example.pdf --ignore-cache
--custom-system-prompt Benutzerdefinierte Systemeingabeaufforderung für die Übersetzung. Wird für /no_think in Qwen 3 verwendet pdf2zh example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"
--pool-max-worker Maximale Anzahl der Worker für den Übersetzungspool. Wenn nicht gesetzt, wird qps als Anzahl der Worker verwendet pdf2zh example.pdf --pool-max-worker 100
--no-auto-extract-glossary Deaktiviert die automatische Glossarextraktion pdf2zh example.pdf --no-auto-extract-glossary
--primary-font-family Überschreibt die primäre Schriftfamilie für übersetzten Text. Optionen: 'serif' für Serifenschriften, 'sans-serif' für serifenlose Schriften, 'script' für Schreibschrift/kursive Schriften. Wenn nicht angegeben, wird automatisch eine Schrift basierend auf den Eigenschaften des Originaltexts ausgewählt. pdf2zh example.pdf --primary-font-family serif
--no-dual Erzeugt keine zweisprachigen PDF-Dateien pdf2zh example.pdf --no-dual
--no-mono Geben Sie keine einsprachigen PDF-Dateien aus pdf2zh example.pdf --no-mono
--formular-font-pattern Schriftmuster zur Identifizierung von Formeltext pdf2zh example.pdf --formular-font-pattern "(MS.*)"
--formular-char-pattern Zeichenmuster zur Identifizierung von Formeltext pdf2zh example.pdf --formular-char-pattern "(MS.*)"
--split-short-line Erzwingt die Aufteilung kurzer Zeilen in verschiedene Absätze pdf2zh example.pdf --split-short-line
--short-line-split-factor Teilungsschwellenfaktor für kurze Zeilen
--skip-clean PDF-Bereinigungsschritt überspringen pdf2zh example.pdf --skip-clean
--dual-translate-first Im Dual-PDF-Modus die Übersetzungsseite priorisiert platzieren pdf2zh example.pdf --dual-translate-first
--disable-rich-text-translate Deaktiviert die Übersetzung von formatiertem Text pdf2zh example.pdf --disable-rich-text-translate
--enhance-compatibility Alle Kompatibilitätsverbesserungsoptionen aktivieren pdf2zh example.pdf --enhance-compatibility
--use-alternating-pages-dual Verwenden Sie den Modus für abwechselnde Seiten für duale PDFs pdf2zh example.pdf --use-alternating-pages-dual
--watermark-output-mode Wasserzeichen-Ausgabemodus für PDF-Dateien pdf2zh example.pdf --watermark-output-mode "NoWaterMark"
--max-pages-per-part Maximale Seiten pro Teil für geteilte Übersetzung pdf2zh example.pdf --max-pages-per-part 1
--translate-table-text Tabellentext übersetzen (experimentell) pdf2zh example.pdf --translate-table-text
--skip-scanned-detection Scannenerkennung überspringen pdf2zh example.pdf --skip-scanned-detection
--ocr-workaround Erzwingt, dass übersetzter Text schwarz ist und fügt einen weißen Hintergrund hinzu pdf2zh example.pdf --ocr-workaround
--auto-enable-ocr-workaround Automatische OCR-Umgehung aktivieren. Wenn ein Dokument als stark gescannt erkannt wird, wird versucht, die OCR-Verarbeitung zu aktivieren und die weitere Scan-Erkennung zu überspringen. Weitere Details finden Sie in der Dokumentation. (Standard: False) pdf2zh example.pdf --auto-enable-ocr-workaround True
--only-include-translated-page Fügt nur übersetzte Seiten in die Ausgabe-PDF ein. Wirksam nur, wenn --pages verwendet wird. pdf2zh example.pdf --pages 1-5 --only-include-translated-page
--glossaries Benutzerdefiniertes Glossar für die Übersetzung. pdf2zh example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"
--save-auto-extracted-glossary speichert automatisch extrahiertes Glossar. pdf2zh example.pdf --save-auto-extracted-glossary
--no-merge-alternating-line-numbers Deaktiviert das Zusammenführen von alternierenden Zeilennummern und Textabsätzen in Dokumenten mit Zeilennummern pdf2zh example.pdf --no-merge-alternating-line-numbers
--no-remove-non-formula-lines Deaktiviert die Entfernung von Nicht-Formel-Zeilen innerhalb von Absatzbereichen pdf2zh example.pdf --no-remove-non-formula-lines
--non-formula-line-iou-threshold Setze den IoU-Schwellenwert für die Identifizierung von Nicht-Formel-Zeilen (0.0-1.0) pdf2zh example.pdf --non-formula-line-iou-threshold 0.85
--figure-table-protection-threshold Legen Sie den Schutzschwellenwert für Abbildungen und Tabellen fest (0.0-1.0). Zeilen innerhalb von Abbildungen/Tabellen werden nicht verarbeitet pdf2zh example.pdf --figure-table-protection-threshold 0.95
--skip-formula-offset-calculation Überspringen der Formel-Offset-Berechnung während der Verarbeitung pdf2zh example.pdf --skip-formula-offset-calculation
GUI-Argumente
Option Funktion Beispiel
--share Freigabemodus aktivieren pdf2zh --gui --share
--auth-file Pfad zur Authentifizierungsdatei pdf2zh --gui --auth-file /path
--welcome-page Pfad zur Willkommens-HTML-Datei pdf2zh --gui --welcome-page /pfad
--enabled-services Aktivierte Übersetzungsdienste pdf2zh --gui --enabled-services "Bing,OpenAI"
--disable-gui-sensitive-input Deaktiviert sensible Eingaben in der GUI pdf2zh --gui --disable-gui-sensitive-input
--disable-config-auto-save Automatisches Speichern der Konfiguration deaktivieren pdf2zh --gui --disable-config-auto-save
--server-port WebUI-Port pdf2zh --gui --server-port 7860

⬆️ Zurück zum Anfang


Anleitung zur Ratenbegrenzungskonfiguration

Bei der Verwendung von Übersetzungsdiensten ist eine korrekte Ratenbegrenzungskonfiguration entscheidend, um API-Fehler zu vermeiden und die Leistung zu optimieren. Diese Anleitung erklärt, wie die Parameter --qps und --pool-max-worker basierend auf den verschiedenen Einschränkungen des Upstream-Dienstes konfiguriert werden.

Tip

Es wird empfohlen, dass die pool_size 1000 nicht überschreitet. Wenn die nach folgender Methode berechnete pool_size 1000 überschreitet, verwenden Sie bitte 1000.

RPM (Anfragen pro Minute) Ratenbegrenzung

Wenn der Upstream-Dienst RPM-Beschränkungen hat, verwenden Sie die folgende Berechnung:

Berechnungsformel: - qps = floor(rpm / 60) - pool_size = qps * 10

Note

Der Faktor 10 ist ein empirischer Koeffizient, der in den meisten Szenarien gut funktioniert.

Beispiel: Wenn Ihr Übersetzungsdienst eine Begrenzung von 600 RPM hat: - qps = floor(600 / 60) = 10 - pool_size = 10 * 10 = 100

pdf2zh example.pdf --qps 10 --pool-max-worker 100
Begrenzung gleichzeitiger Verbindungen

Wenn der Upstream-Dienst Einschränkungen bei gleichzeitigen Verbindungen hat (wie der offizielle GLM-Dienst), verwenden Sie diesen Ansatz:

Berechnungsformel: - pool_size = max(floor(0.9 * official_concurrent_limit), official_concurrent_limit - 20) - qps = pool_size

Beispiel: Wenn Ihr Übersetzungsdienst 50 gleichzeitige Verbindungen zulässt: - pool_size = max(floor(0.9 * 50), 50 - 20) = max(45, 30) = 45 - qps = 45

pdf2zh example.pdf --qps 45 --pool-max-worker 45
Best Practices

Tip

  • Beginnen Sie immer mit konservativen Werten und erhöhen Sie diese schrittweise, falls erforderlich
  • Überwachen Sie die Antwortzeiten und Fehlerraten Ihres Dienstes
  • Unterschiedliche Dienste können unterschiedliche Optimierungsstrategien erfordern
  • Berücksichtigen Sie Ihren spezifischen Anwendungsfall und die Dokumentgröße bei der Festlegung dieser Parameter

⬆️ Zurück zum Anfang


Teilweise Übersetzung

Verwenden Sie den --pages-Parameter, um einen Teil eines Dokuments zu übersetzen.

  • Wenn die Seitenzahlen aufeinanderfolgend sind, können Sie es so schreiben:
pdf2zh_next example.pdf --pages 1-3
pdf2zh_next example.pdf --pages 25-

Tip

25- schließt alle Seiten ab Seite 25 ein. Wenn Ihr Dokument 100 Seiten hat, entspricht dies 25-100.

Ebenso schließt -25 alle Seiten vor Seite 25 ein, was 1-25 entspricht.

  • Wenn die Seiten nicht aufeinanderfolgend sind, können Sie ein Komma , verwenden, um sie zu trennen.

Zum Beispiel, wenn Sie die erste und dritte Seite übersetzen möchten, können Sie den folgenden Befehl verwenden:

pdf2zh_next example.pdf --pages "1,3"
  • Wenn die Seiten sowohl aufeinanderfolgende als auch nicht aufeinanderfolgende Bereiche enthalten, können Sie diese auch mit einem Komma verbinden, wie folgt:
pdf2zh_next example.pdf --pages "1,3,10-20,25-"

Dieser Befehl übersetzt die erste Seite, die dritte Seite, die Seiten 10-20 und alle Seiten von 25 bis zum Ende.

⬆️ Zurück zum Anfang


Quell- und Zielsprachen angeben

Siehe Google Languages Codes, DeepL Languages Codes

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ Zurück zum Anfang


Übersetzen mit Ausnahmen

Verwenden Sie reguläre Ausdrücke, um Formelschriften und Zeichen anzugeben, die erhalten bleiben sollen:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

Standardmäßig werden Latex, Mono, Code, Italic, Symbol und Math Schriftarten beibehalten:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ Zurück zum Anfang


Benutzerdefinierte Eingabeaufforderung

Benutzerdefinierte Systemeingabeaufforderung für die Übersetzung. Sie wird hauptsächlich verwendet, um die '/no_think'-Anweisung von Qwen 3 in die Eingabeaufforderung einzufügen.

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ Zurück zum Anfang


Benutzerdefinierte Konfiguration

Es gibt mehrere Möglichkeiten, die Konfigurationsdatei zu ändern und zu importieren.

Note

Konfigurationsdatei-Hierarchie

Wenn derselbe Parameter mit verschiedenen Methoden geändert wird, wendet die Software die Änderungen gemäß der folgenden Prioritätsreihenfolge an.

Höherrangige Änderungen überschreiben niedrigerrangige.

cli/gui > env > Benutzerkonfigurationsdatei > Standardkonfigurationsdatei

  • Konfiguration über Kommandozeilen-Argumente ändern

In den meisten Fällen können Sie Ihre gewünschten Einstellungen direkt über Kommandozeilen-Argumente übergeben. Weitere Informationen finden Sie unter Kommandozeilen-Argumente.

Beispielsweise können Sie mit dem folgenden Befehl ein GUI-Fenster aktivieren:

pdf2zh_next --gui
  • Konfiguration über Umgebungsvariablen anpassen

Sie können das -- in Kommandozeilen-Argumenten durch PDF2ZH_ ersetzen, Parameter mit = verbinden und - durch _ als Umgebungsvariablen ersetzen.

Zum Beispiel, wenn Sie ein GUI-Fenster aktivieren möchten, können Sie den folgenden Befehl verwenden:

PDF2ZH_GUI=TRUE pdf2zh_next

env

  • Benutzerdefinierte Konfigurationsdatei

Sie können eine Konfigurationsdatei mit dem folgenden Kommandozeilen-Argument angeben:

pdf2zh_next --config-file '/path/config.toml'

Wenn Sie sich über das Format der Konfigurationsdatei unsicher sind, lesen Sie bitte die unten beschriebene Standardkonfigurationsdatei.

  • Standardkonfigurationsdatei

Die Standardkonfigurationsdatei befindet sich unter ~/.config/pdf2zh.
Bitte ändern Sie die Konfigurationsdateien im Verzeichnis default nicht.
Es wird dringend empfohlen, sich auf den Inhalt dieser Konfigurationsdatei zu beziehen und Benutzerdefinierte Konfigurationsdatei zu verwenden, um Ihre eigene Konfigurationsdatei zu implementieren.

Tip

  • Standardmäßig speichert pdf2zh 2.0 die aktuelle Konfiguration automatisch in ~/.config/pdf2zh/config.v3.toml jedes Mal, wenn Sie im GUI auf die Übersetzungsschaltfläche klicken. Diese Konfigurationsdatei wird beim nächsten Start standardmäßig geladen.
  • Die Konfigurationsdateien im Verzeichnis default werden automatisch vom Programm generiert. Sie können sie zur Modifikation kopieren, aber bitte ändern Sie sie nicht direkt.
  • Konfigurationsdateien können Versionsnummern wie "v2", "v3" usw. enthalten. Dies sind Versionsnummern der Konfigurationsdatei, nicht die Versionsnummer von pdf2zh selbst.

⬆️ Zurück zum Anfang


Bereinigung überspringen

Wenn dieser Parameter auf True gesetzt wird, wird der Schritt zur PDF-Bereinigung übersprungen, was die Kompatibilität verbessern und einige Probleme bei der Schriftverarbeitung vermeiden kann.

Verwendung:

pdf2zh_next example.pdf --skip-clean

Oder Umgebungsvariablen verwenden:

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

Wenn --enhance-compatibility aktiviert ist, wird die Bereinigung automatisch übersprungen.


Übersetzungscache

PDFMathTranslate speichert übersetzte Texte zwischen, um die Geschwindigkeit zu erhöhen und unnötige API-Aufrufe für dieselben Inhalte zu vermeiden. Sie können die Option --ignore-cache verwenden, um den Übersetzungscache zu ignorieren und eine erneute Übersetzung zu erzwingen.

pdf2zh_next example.pdf --ignore-cache

⬆️ Zurück zum Anfang


Bereitstellung als öffentlicher Dienst

Wenn Sie eine pdf2zh-GUI auf öffentlichen Diensten bereitstellen, sollten Sie die Konfigurationsdatei wie unten beschrieben anpassen.

Warning

Dieses Projekt wurde nicht professionell auf Sicherheit überprüft und könnte Sicherheitslücken enthalten. Bitte bewerten Sie die Risiken und ergreifen Sie die notwendigen Sicherheitsmaßnahmen, bevor Sie es in öffentlichen Netzwerken bereitstellen.

Tip

  • Bei der öffentlichen Bereitstellung sollten sowohl disable_gui_sensitive_input als auch disable_config_auto_save aktiviert sein.
  • Trennen Sie verschiedene verfügbare Dienste mit englischen Kommas , .

Eine brauchbare Konfiguration ist wie folgt:

config.toml
[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ Zurück zum Anfang


Authentifizierung und Willkommensseite

Bei Verwendung von Authentifizierung und Willkommensseite, um festzulegen, welcher Benutzer die Web UI nutzen und die Login-Seite anpassen kann:

Beispiel auth.txt Jede Zeile enthält zwei Elemente, Benutzername und Passwort, getrennt durch ein Komma.

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

Beispiel welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

Die Willkommensseite funktioniert nur, wenn die Authentifizierungsdatei nicht leer ist. Wenn die Authentifizierungsdatei leer ist, gibt es keine Authentifizierung. :)

Eine brauchbare Konfiguration ist wie folgt:

config.toml
[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ Zurück zum Anfang


Glossar-Unterstützung

PDFMathTranslate unterstützt die Glossartabelle. Die Glossartabellendatei sollte eine csv-Datei sein. Die Datei enthält drei Spalten. Hier ist eine Demo-Glossardatei:

source target tgt_lng
AutoML Automatisches ML de
a,a a de
" " de

Für CLI-Benutzer: Sie können mehrere Dateien für das Glossar verwenden. Und verschiedene Dateien sollten durch , getrennt werden.

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

Für WebUI-Benutzer:

Sie können jetzt Ihre eigene Glossardatei hochladen. Nachdem Sie die Datei hochgeladen haben, können Sie sie überprüfen, indem Sie auf ihren Namen klicken und der Inhalt wird unten angezeigt.

⬆️ Zurück zum Anfang

Ein Teil des Inhalts dieser Seite wurde von GPT übersetzt und kann Fehler enthalten.