跳轉到

高度な設定

高度な設定 > 高度な設定 (現在)


目次


コマンドライン引数

コマンドラインで翻訳コマンドを実行し、現在の作業ディレクトリに翻訳済みドキュメント example-mono.pdf とバイリンガルドキュメント example-dual.pdf を生成します。デフォルトの翻訳サービスとして Google を使用します。その他のサポート翻訳サービスは HERE で確認できます。

cmd

以下の表に、すべての高度なオプションを参考として記載します:

引数
オプション 機能
files ローカル PDF ファイルのパス pdf2zh ~/local.pdf
links オンラインファイル pdf2zh http://arxiv.org/paper.pdf
--output ファイルの出力ディレクトリ pdf2zh example.pdf --output /outputpath
--<Services> 特定のサービス を使用して翻訳する pdf2zh example.pdf --openai
pdf2zh example.pdf --deepseek
--help, -h ヘルプメッセージを表示して終了 pdf2zh -h
--config-file 設定ファイルのパス pdf2zh --config-file /path/to/config/config.toml
--report-interval 進捗報告の間隔(秒単位) pdf2zh example.pdf --report-interval 5
--debug デバッグログレベルを使用する pdf2zh example.pdf --debug
--gui GUI と対話する pdf2zh --gui
--warmup 必要なアセットをダウンロードして検証した後、終了するのみ pdf2zh example.pdf --warmup
--generate-offline-assets 指定されたディレクトリにオフラインアセットパッケージを生成する pdf2zh example.pdf --generate-offline-assets /path
--restore-offline-assets 指定されたディレクトリからオフラインアセットパッケージを復元する pdf2zh example.pdf --restore-offline-assets /path
--version バージョンを表示して終了 pdf2zh --version
--pages ドキュメントの部分翻訳 pdf2zh example.pdf --pages 1,2,1-,-3,3-5
--lang-in ソース言語のコード pdf2zh example.pdf --lang-in en
--lang-out ターゲット言語のコード pdf2zh example.pdf --lang-out zh-CN
--min-text-length 翻訳する最小テキスト長 pdf2zh example.pdf --min-text-length 5
--rpc-doclayout ドキュメントレイアウト分析用の RPC サービスホストアドレス
--qps 翻訳サービスの QPS 制限 pdf2zh example.pdf --qps 200
--ignore-cache 翻訳キャッシュを無視する pdf2zh example.pdf --ignore-cache
--custom-system-prompt 翻訳用のカスタムシステムプロンプト。Qwen 3 の /no_think で使用されます pdf2zh example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"
--pool-max-worker 翻訳プールの最大ワーカー数。設定されていない場合、qps をワーカー数として使用します pdf2zh example.pdf --pool-max-worker 100
--no-auto-extract-glossary 用語集の自動抽出を無効にする pdf2zh example.pdf --no-auto-extract-glossary
--primary-font-family 翻訳テキストのプライマリフォントファミリーを上書きします。選択肢:'serif' はセリフフォント、'sans-serif' はサンセリフフォント、'script' はスクリプト/イタリックフォント。指定しない場合、元のテキストプロパティに基づいて自動フォント選択が使用されます。 pdf2zh example.pdf --primary-font-family serif
--no-dual バイリンガル PDF ファイルを出力しない pdf2zh example.pdf --no-dual
--no-mono 単一言語の PDF ファイルを出力しない pdf2zh example.pdf --no-mono
--formular-font-pattern 数式テキストを識別するためのフォントパターン pdf2zh example.pdf --formular-font-pattern "(MS.*)"
--formular-char-pattern 数式テキストを識別するための文字パターン pdf2zh example.pdf --formular-char-pattern "(MS.*)"
--split-short-line 短い行を強制的に異なる段落に分割する pdf2zh example.pdf --split-short-line
--short-line-split-factor 短い行の分割閾値係数
--skip-clean PDF クリーンステップをスキップ pdf2zh example.pdf --skip-clean
--dual-translate-first デュアル PDF モードで翻訳ページを優先的に配置する pdf2zh example.pdf --dual-translate-first
--disable-rich-text-translate リッチテキスト翻訳を無効にする pdf2zh example.pdf --disable-rich-text-translate
--enhance-compatibility すべての互換性向上オプションを有効にする pdf2zh example.pdf --enhance-compatibility
--use-alternating-pages-dual デュアル PDF 用に交互ページモードを使用する pdf2zh example.pdf --use-alternating-pages-dual
--watermark-output-mode PDF ファイルの透かし出力モード pdf2zh example.pdf --watermark-output-mode "NoWaterMark"
--max-pages-per-part 分割翻訳のパートごとの最大ページ数 pdf2zh example.pdf --max-pages-per-part 1
--translate-table-text テーブルテキストを翻訳する(実験的機能) pdf2zh example.pdf --translate-table-text
--skip-scanned-detection スキャンされた検出をスキップ pdf2zh example.pdf --skip-scanned-detection
--ocr-workaround 翻訳されたテキストを強制的に黒色にし、白い背景を追加する pdf2zh example.pdf --ocr-workaround
--auto-enable-ocr-workaround 自動 OCR 回避策を有効化します。文書が高度にスキャンされていると検出された場合、OCR 処理を有効化し、さらなるスキャン検出をスキップしようとします。詳細はドキュメントを参照してください。(デフォルト:False) pdf2zh example.pdf --auto-enable-ocr-workaround True
--only-include-translated-page 出力 PDF に翻訳済みのページのみを含める。--pages が使用されている場合のみ有効。 pdf2zh example.pdf --pages 1-5 --only-include-translated-page
--glossaries 翻訳用のカスタム用語集。 pdf2zh example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"
--save-auto-extracted-glossary 自動抽出された用語集を保存します。 pdf2zh example.pdf --save-auto-extracted-glossary
--no-merge-alternating-line-numbers 行番号付き文書において、行番号とテキスト段落の交互マージを無効化します pdf2zh example.pdf --no-merge-alternating-line-numbers
--no-remove-non-formula-lines 段落エリア内の非数式行の削除を無効化 pdf2zh example.pdf --no-remove-non-formula-lines
--non-formula-line-iou-threshold 非数式行を識別するための IoU 閾値を設定 (0.0-1.0) pdf2zh example.pdf --non-formula-line-iou-threshold 0.85
--figure-table-protection-threshold 図表の保護閾値を設定(0.0-1.0)。図表内の行は処理されません pdf2zh example.pdf --figure-table-protection-threshold 0.95
--skip-formula-offset-calculation 処理中の数式オフセット計算をスキップ pdf2zh example.pdf --skip-formula-offset-calculation
GUI 引数
オプション 機能
--share 共有モードを有効にする pdf2zh --gui --share
--auth-file 認証ファイルへのパス pdf2zh --gui --auth-file /path
--welcome-page ウェルカム HTML ファイルのパス pdf2zh --gui --welcome-page /path
--enabled-services 有効な翻訳サービス pdf2zh --gui --enabled-services "Bing,OpenAI"
--disable-gui-sensitive-input GUI のセンシティブ入力を無効にする pdf2zh --gui --disable-gui-sensitive-input
--disable-config-auto-save 自動設定保存を無効にする pdf2zh --gui --disable-config-auto-save
--server-port WebUI ポート pdf2zh --gui --server-port 7860

⬆️ トップに戻る


レート制限設定ガイド

翻訳サービスを利用する際、適切なレート制限設定は API エラーを回避し、パフォーマンスを最適化するために重要です。このガイドでは、異なる上流サービスの制限に基づいて --qps--pool-max-worker パラメータを設定する方法を説明します。

Tip

pool_size は 1000 を超えないことが推奨されます。以下の方法で計算された pool_size が 1000 を超える場合は、1000 を使用してください。

RPM (リクエスト毎分) レート制限

上流サービスに RPM 制限がある場合、以下の計算式を使用します:

計算式: - qps = floor(rpm / 60) - pool_size = qps * 10

Note

10 という係数は、ほとんどのシナリオでうまく機能する経験的な係数です。

例: 翻訳サービスの制限が 600 RPM の場合: - qps = floor(600 / 60) = 10 - pool_size = 10 * 10 = 100

pdf2zh example.pdf --qps 10 --pool-max-worker 100
同時接続制限

上流サービスに同時接続制限がある場合(GLM 公式サービスなど)、この方法を使用します:

計算式: - pool_size = max(floor(0.9 * official_concurrent_limit), official_concurrent_limit - 20) - qps = pool_size

例: 翻訳サービスが 50 の同時接続を許可している場合: - pool_size = max(floor(0.9 * 50), 50 - 20) = max(45, 30) = 45 - qps = 45

pdf2zh example.pdf --qps 45 --pool-max-worker 45
ベストプラクティス

Tip

  • 常に控えめな値から始め、必要に応じて徐々に増やしてください
  • サービスの応答時間とエラーレートを監視してください
  • サービスによって最適化戦略が異なる場合があります
  • これらのパラメータを設定する際は、具体的なユースケースとドキュメントサイズを考慮してください

⬆️ トップに戻る


部分翻訳

--pages パラメータを使用して、ドキュメントの一部を翻訳します。

  • ページ番号が連続している場合、以下のように記述できます:
pdf2zh_next example.pdf --pages 1-3
pdf2zh_next example.pdf --pages 25-

Tip

25- は 25 ページ以降のすべてのページを含みます。ドキュメントが 100 ページある場合、これは 25-100 と同じです。

同様に、-25 は 25 ページより前のすべてのページを含み、これは 1-25 と同じです。

  • ページが連続していない場合は、カンマ , を使用して区切ることができます。

例えば、最初と 3 ページ目を翻訳したい場合、次のコマンドを使用できます:

pdf2zh_next example.pdf --pages "1,3"
  • ページに連続した範囲と非連続した範囲の両方が含まれている場合、以下のようにカンマで接続することもできます:
pdf2zh_next example.pdf --pages "1,3,10-20,25-"

このコマンドは、最初のページ、3 ページ目、10~20 ページ、および 25 ページから最後までのすべてのページを翻訳します。

⬆️ トップに戻る


ソース言語とターゲット言語の指定

Google 言語コードDeepL 言語コード を参照してください

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ トップに戻る


例外付きで翻訳する

正規表現を使用して、保持する必要がある数式フォントと文字を指定します:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

デフォルトで LatexMonoCodeItalicSymbolMath フォントを保持します:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ トップに戻る


カスタムプロンプト

翻訳用のカスタムシステムプロンプト。主に Qwen 3 の /no_think 命令をプロンプトに追加するために使用されます。

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ トップに戻る


カスタム設定

設定ファイルを変更およびインポートする方法は複数あります。

Note

設定ファイルの階層

同じパラメータを異なる方法で変更する場合、ソフトウェアは以下の優先順位に従って変更を適用します。

上位の変更は下位の変更を上書きします。

cli/gui > env > ユーザー設定ファイル > デフォルト設定ファイル

  • コマンドライン引数 を介した設定の変更

ほとんどの場合、コマンドライン引数を通じて希望の設定を直接渡すことができます。詳細については、コマンドライン引数 を参照してください。

例えば、GUI ウィンドウを有効にしたい場合は、次のコマンドを使用できます:

pdf2zh_next --gui
  • 環境変数 を介した設定の変更

コマンドライン引数の --PDF2ZH_ に置き換え、パラメータを = で接続し、-_ に置き換えて環境変数として使用できます。

例えば、GUI ウィンドウを有効にする場合は、以下のコマンドを使用できます:

PDF2ZH_GUI=TRUE pdf2zh_next

env

  • ユーザー指定の 設定ファイル

以下のコマンドライン引数を使用して設定ファイルを指定できます:

pdf2zh_next --config-file '/path/config.toml'

設定ファイルの形式が分からない場合は、以下のデフォルト設定ファイルを参照してください。

  • デフォルト設定ファイル

デフォルトの設定ファイルは ~/.config/pdf2zh にあります。
default ディレクトリ内の設定ファイルは変更しないでください。
この設定ファイルの内容を参照し、ユーザー指定の設定ファイルを使用して独自の設定ファイルを実装することを強くお勧めします。

Tip

  • デフォルトでは、pdf2zh 2.0 は GUI で翻訳ボタンをクリックするたびに現在の設定を ~/.config/pdf2zh/config.v3.toml に自動的に保存します。この設定ファイルは次回起動時にデフォルトで読み込まれます。
  • default ディレクトリ内の設定ファイルはプログラムによって自動生成されます。修正のためにコピーすることは可能ですが、直接編集しないでください。
  • 設定ファイルには「v2」「v3」などのバージョン番号が含まれる場合があります。これらは設定ファイルのバージョン番号であり、pdf2zh 自体のバージョン番号ではありません

⬆️ トップに戻る


クリーンをスキップ

このパラメータが True に設定されている場合、PDF のクリーンアップステップがスキップされ、互換性が向上し、一部のフォント処理の問題を回避できます。

使い方:

pdf2zh_next example.pdf --skip-clean

または環境変数を使用する:

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

--enhance-compatibility が有効な場合、クリーンをスキップは自動的に有効になります。


翻訳キャッシュ

PDFMathTranslate は翻訳済みのテキストをキャッシュし、同じ内容に対する不要な API 呼び出しを避けつつ速度を向上させます。--ignore-cache オプションを使用すると、翻訳キャッシュを無視して強制的に再翻訳を行うことができます。

pdf2zh_next example.pdf --ignore-cache

⬆️ トップに戻る


公開サービスとしてのデプロイ

公開サービスで pdf2zh GUI をデプロイする場合、以下のように設定ファイルを変更する必要があります。

Warning

このプロジェクトはセキュリティに関する専門的な監査を受けておらず、セキュリティ上の脆弱性が含まれている可能性があります。パブリックネットワークにデプロイする前に、リスクを評価し、必要なセキュリティ対策を講じてください。

Tip

  • 公開デプロイ時には、disable_gui_sensitive_inputdisable_config_auto_save の両方を有効にする必要があります。
  • 利用可能な異なるサービスは 英語のカンマ , で区切ってください。

以下の設定が利用可能です:

config.toml
[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ トップに戻る


認証とウェルカムページ

認証とウェルカムページを使用して、どのユーザーが Web UI を使用し、ログインページをカスタマイズするかを指定する場合:

例 auth.txt 各行には、ユーザー名とパスワードの 2 つの要素が含まれており、カンマで区切られています。

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

例 welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

認証ファイルが空白でない場合のみ、ウェルカムページが機能します。 認証ファイルが空白の場合、認証は行われません。 :)

以下の設定が利用可能です:

config.toml
[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ トップに戻る


用語集サポート

PDFMathTranslate は用語集テーブルをサポートしています。用語集テーブルファイルは csv ファイルである必要があります。 ファイルには 3 つの列があります。以下はデモ用の用語集ファイルです:

source target tgt_lng
AutoML 自動 ML zh-CN
a,a a zh-CN
" " zh-CN

CLI ユーザー向け: 用語集に複数のファイルを使用できます。異なるファイルは , で区切る必要があります。

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

WebUI ユーザー向け:

独自の用語集ファイルをアップロードできるようになりました。ファイルをアップロードした後、名前をクリックして内容を確認できます。内容は下に表示されます。

⬆️ トップに戻る

このページの一部のコンテンツは GPT によって翻訳されており、エラーが含まれている可能性があります。