跳轉到

高度な設定

高度な設定 > 高度な設定 (現在のページ)


目次


コマンドライン引数

コマンドラインで翻訳コマンドを実行すると、現在の作業ディレクトリに翻訳済みドキュメント example-mono.pdf とバイリンガルドキュメント example-dual.pdf が生成されます。デフォルトの翻訳サービスとして Google を使用します。その他のサポート翻訳サービスはこちらで確認できます。

cmd

以下の表では、すべての高度な設定オプションを参考としてリストアップしています:

引数
オプション 機能
files ローカル PDF ファイルのパス pdf2zh ~/local.pdf
links オンラインファイル pdf2zh http://arxiv.org/paper.pdf
--output ファイルの出力ディレクトリ pdf2zh example.pdf --output /outputpath
--<Services> 翻訳に特定のサービスを使用する pdf2zh example.pdf --openai
pdf2zh example.pdf --deepseek
--help, -h ヘルプメッセージを表示して終了 pdf2zh -h
--config-file 設定ファイルへのパス pdf2zh --config-file /path/to/config/config.toml
--report-interval 進捗レポートの間隔(秒単位) pdf2zh example.pdf --report-interval 5
--debug デバッグログレベルを使用する pdf2zh example.pdf --debug
--gui GUI と対話する pdf2zh --gui
--warmup 必要なアセットをダウンロードして検証した後に終了する pdf2zh example.pdf --warmup
--generate-offline-assets 指定されたディレクトリにオフラインアセットパッケージを生成する pdf2zh example.pdf --generate-offline-assets /path
--restore-offline-assets 指定されたディレクトリからオフラインアセットパッケージを復元する pdf2zh example.pdf --restore-offline-assets /path
--version バージョンを表示して終了 pdf2zh --version
--pages ドキュメントの部分翻訳 pdf2zh example.pdf --pages 1,2,1-,-3,3-5
--lang-in ソース言語のコード pdf2zh example.pdf --lang-in en
--lang-out ターゲット言語のコード pdf2zh example.pdf --lang-out zh-CN
--min-text-length 翻訳する最小テキスト長 pdf2zh example.pdf --min-text-length 5
--rpc-doclayout ドキュメントレイアウト分析用の RPC サービスホストアドレス
--qps 翻訳サービスの QPS 制限 pdf2zh example.pdf --qps 200
--ignore-cache 翻訳キャッシュを無視する pdf2zh example.pdf --ignore-cache
--custom-system-prompt 翻訳用のカスタムシステムプロンプト。Qwen 3 の/no_thinkで使用 pdf2zh example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"
--pool-max-worker 翻訳プールの最大ワーカー数。設定されていない場合、qps をワーカー数として使用します pdf2zh example.pdf --pool-max-worker 100
--no-auto-extract-glossary 用語集の自動抽出を無効にする pdf2zh example.pdf --no-auto-extract-glossary
--primary-font-family 翻訳テキストのプライマリフォントファミリーを上書きします。選択肢:'serif'(セリフフォント)、'sans-serif'(サンセリフフォント)、'script'(スクリプト/イタリックフォント)。指定しない場合、元のテキストプロパティに基づいて自動フォント選択が使用されます。 pdf2zh example.pdf --primary-font-family serif
--no-dual バイリンガル PDF ファイルを出力しない pdf2zh example.pdf --no-dual
--no-mono 単一言語の PDF ファイルを出力しない pdf2zh example.pdf --no-mono
--formular-font-pattern 数式テキストを識別するためのフォントパターン pdf2zh example.pdf --formular-font-pattern "(MS.*)"
--formular-char-pattern 数式テキストを識別するための文字パターン pdf2zh example.pdf --formular-char-pattern "(MS.*)"
--split-short-line 短い行を強制的に異なる段落に分割する pdf2zh example.pdf --split-short-line
--short-line-split-factor 短い行の分割閾値係数
--skip-clean PDF のクリーン処理ステップをスキップ pdf2zh example.pdf --skip-clean
--dual-translate-first デュアル PDF モードで翻訳ページを優先的に配置する pdf2zh example.pdf --dual-translate-first
--disable-rich-text-translate リッチテキスト翻訳を無効にする pdf2zh example.pdf --disable-rich-text-translate
--enhance-compatibility すべての互換性向上オプションを有効にする pdf2zh example.pdf --enhance-compatibility
--use-alternating-pages-dual デュアル PDF 用に交互ページモードを使用する pdf2zh example.pdf --use-alternating-pages-dual
--watermark-output-mode PDF ファイルの透かし出力モード pdf2zh example.pdf --watermark-output-mode "NoWaterMark"
--max-pages-per-part 分割翻訳におけるパートごとの最大ページ数 pdf2zh example.pdf --max-pages-per-part 1
--translate-table-text テーブルテキストを翻訳する(実験的機能) pdf2zh example.pdf --translate-table-text
--skip-scanned-detection スキャンされた検出をスキップ pdf2zh example.pdf --skip-scanned-detection
--ocr-workaround 翻訳されたテキストを強制的に黒色にし、白い背景を追加する pdf2zh example.pdf --ocr-workaround
--auto-enable-ocr-workaround 自動 OCR 回避策を有効化。文書が高度にスキャンされていると検出された場合、OCR 処理を有効化し、さらなるスキャン検出をスキップしようとします。詳細はドキュメントを参照してください。(デフォルト:False) pdf2zh example.pdf --auto-enable-ocr-workaround True
--only-include-translated-page 出力 PDF に翻訳済みページのみを含める。--pages が使用された場合のみ有効。 pdf2zh example.pdf --pages 1-5 --only-include-translated-page
--glossaries 翻訳用のカスタム用語集。 pdf2zh example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"
--save-auto-extracted-glossary 自動抽出された用語集を保存する。 pdf2zh example.pdf --save-auto-extracted-glossary
GUI 引数
オプション 機能
--share 共有モードを有効化 pdf2zh --gui --share
--auth-file 認証ファイルへのパス pdf2zh --gui --auth-file /path
--welcome-page ウェルカム HTML ファイルへのパス pdf2zh --gui --welcome-page /path
--enabled-services 有効な翻訳サービス pdf2zh --gui --enabled-services "Bing,OpenAI"
--disable-gui-sensitive-input GUI のセンシティブ入力を無効にする pdf2zh --gui --disable-gui-sensitive-input
--disable-config-auto-save 自動設定保存を無効にする pdf2zh --gui --disable-config-auto-save
--server-port WebUI ポート pdf2zh --gui --server-port 7860

⬆️ トップに戻る


部分翻訳

--pages パラメータを使用してドキュメントの一部を翻訳します。

  • ページ番号が連続している場合、以下のように記述できます:
pdf2zh_next example.pdf --pages 1-3
pdf2zh_next example.pdf --pages 25-

Tip

25- は 25 ページ以降のすべてのページを含みます。ドキュメントが 100 ページある場合、これは25-100と同等です。

同様に、-25は 25 ページより前のすべてのページを含み、これは1-25と同等です。

  • ページが連続していない場合は、カンマ , で区切ることができます。

例えば、最初と 3 番目のページを翻訳したい場合は、次のコマンドを使用できます:

pdf2zh_next example.pdf --pages "1,3"
  • ページに連続した範囲と非連続した範囲の両方が含まれている場合、それらをコンマで接続することもできます。例:
pdf2zh_next example.pdf --pages "1,3,10-20,25-"

このコマンドは、最初のページ、3 ページ目、10~20 ページ、および 25 ページ以降のすべてのページを翻訳します。

⬆️ トップに戻る


ソース言語とターゲット言語を指定する

Google 言語コードDeepL 言語コードを参照してください

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ トップに戻る


例外付きで翻訳する

正規表現を使用して、保持する必要がある数式フォントと文字を指定します:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

デフォルトで LatexMonoCodeItalicSymbolMath フォントを保持する:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ トップに戻る


カスタムプロンプト

翻訳用のカスタムシステムプロンプト。主に Qwen 3 の'/no_think'命令をプロンプトに追加するために使用されます。

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ トップに戻る


カスタム設定

設定ファイルを変更およびインポートする方法は複数あります。

Note

設定ファイルの階層

同じパラメータを異なる方法で変更する場合、ソフトウェアは以下の優先順位に従って変更を適用します。

上位の変更は下位の変更を上書きします。

cli/gui > env > ユーザー設定ファイル > デフォルト設定ファイル

  • コマンドライン引数による設定の変更

ほとんどの場合、コマンドライン引数を通じて直接設定を渡すことができます。詳細についてはコマンドライン引数を参照してください。

例えば、GUI ウィンドウを有効にしたい場合は、次のコマンドを使用できます:

pdf2zh_next --gui
  • 環境変数による設定の変更

コマンドライン引数の --PDF2ZH_ に置き換え、パラメータを = で接続し、-_ に置き換えて環境変数として使用できます。

例えば、GUI ウィンドウを有効にするには、次のコマンドを使用できます:

PDF2ZH_GUI=TRUE pdf2zh_next

env

  • ユーザー指定の設定ファイル

以下のコマンドライン引数を使用して設定ファイルを指定できます:

pdf2zh_next --config-file '/path/config.toml'

設定ファイルの形式がわからない場合は、以下のデフォルト設定ファイルを参照してください。

  • デフォルト設定ファイル

デフォルトの設定ファイルは ~/.config/pdf2zh にあります。 default ディレクトリ内の設定ファイルは変更しないでください。 この設定ファイルの内容を参照し、ユーザー指定の設定ファイルを使用して独自の設定ファイルを実装することを強く推奨します。

Tip

  • デフォルトでは、pdf2zh 2.0 は GUI で翻訳ボタンをクリックするたびに現在の設定を~/.config/pdf2zh/config.v3.tomlに自動保存します。この設定ファイルは次回起動時にデフォルトで読み込まれます。
  • defaultディレクトリ内の設定ファイルはプログラムによって自動生成されます。修正用にコピーすることは可能ですが、直接編集しないでください。
  • 設定ファイルには"v2"、"v3"などのバージョン番号が含まれる場合があります。これらは設定ファイルのバージョン番号であり、pdf2zh 自体のバージョン番号ではありません

⬆️ トップに戻る


クリーンをスキップ

このパラメータを True に設定すると、PDF のクリーン処理ステップがスキップされます。これにより互換性が向上し、一部のフォント処理問題を回避できます。

使い方:

pdf2zh_next example.pdf --skip-clean

または環境変数を使用して:

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

--enhance-compatibilityが有効な場合、クリーンをスキップが自動的に有効になります。


翻訳キャッシュ

PDFMathTranslate は翻訳されたテキストをキャッシュし、同じ内容に対する不要な API 呼び出しを避けて速度を向上させます。--ignore-cacheオプションを使用すると、翻訳キャッシュを無視して強制的に再翻訳を行います。

pdf2zh_next example.pdf --ignore-cache

⬆️ トップに戻る


公開サービスとしてのデプロイ

pdf2zh GUI を公開サービスとしてデプロイする場合、以下のように設定ファイルを変更する必要があります。

Tip

  • 公開デプロイ時には、disable_gui_sensitive_inputdisable_config_auto_save の両方を有効にする必要があります。
  • 利用可能なサービスは英語のカンマ , で区切ってください。

使用可能な設定は以下の通りです:

config.toml
[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ トップに戻る


認証とウェルカムページ

認証とウェルカムページを使用して、どのユーザーが Web UI を使用し、ログインページをカスタマイズするかを指定する場合:

auth.txt の例 各行には、ユーザー名とパスワードの 2 つの要素が含まれ、カンマで区切られています。

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

example welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

認証ファイルが空白でない場合のみ、ウェルカムページが機能します。 認証ファイルが空白の場合、認証は行われません。 :)

使用可能な設定は以下の通りです:

config.toml
[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ トップに戻る


用語集サポート

PDFMathTranslate は用語集テーブルをサポートしています。用語集テーブルファイルはcsvファイルである必要があります。 ファイルには 3 つの列があります。以下はデモ用語集ファイルです:

source target tgt_lng
AutoML 自動 ML zh-CN
a,a a zh-CN
" " zh-CN

CLI ユーザー向け: 用語集には複数のファイルを使用できます。異なるファイルは , で区切る必要があります。

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

WebUI ユーザー向け:

独自の用語集ファイルをアップロードできるようになりました。ファイルをアップロード後、名前をクリックすると内容が下に表示されますので確認できます。

⬆️ トップに戻る

このページの一部のコンテンツは GPT によって翻訳されており、エラーが含まれている可能性があります。