高度な設定

高度な設定 > 高度な設定 (現在)

コマンドライン引数
レート制限設定ガイド
部分翻訳
ソース言語とターゲット言語を指定する
例外付き翻訳
カスタムプロンプト
カスタム設定
クリーンスキップ
翻訳キャッシュ
パブリックサービスとしてのデプロイ
認証とウェルカムページ
用語集サポート

コマンドライン引数

コマンドラインで翻訳コマンドを実行し、現在の作業ディレクトリに翻訳文書 example-mono.pdf とバイリンガル文書 example-dual.pdf を生成します。デフォルトの翻訳サービスとして Google を使用します。その他のサポート翻訳サービスはこちらで確認できます。

cmd

以下の表に、すべての高度なオプションを参考としてリストアップします：

Args

オプション	機能	例
`input-files`	処理する入力 PDF ファイル	`pdf2zh_next example.pdf`
`--output`	ファイルの出力ディレクトリ	`pdf2zh_next example.pdf --output /outputpath`
`--<Services>`	特定のサービスを使用して翻訳する	`pdf2zh_next example.pdf --openai` `pdf2zh_next example.pdf --deepseek`
`--help`, `-h`	ヘルプメッセージを表示して終了	`pdf2zh_next -h`
`--config-file`	設定ファイルへのパス	`pdf2zh_next --config-file /path/to/config/config.toml`
`--report-interval`	進捗レポートの間隔（秒単位）	`pdf2zh_next example.pdf --report-interval 5`
`--debug`	デバッグログレベルを使用する	`pdf2zh_next example.pdf --debug`
`--gui`	GUI と対話する	`pdf2zh_next --gui`
`--warmup`	必要なアセットをダウンロードして検証した後に終了するだけ	`pdf2zh_next example.pdf --warmup`
`--generate-offline-assets`	指定されたディレクトリにオフラインアセットパッケージを生成する	`pdf2zh_next example.pdf --generate-offline-assets /path`
`--restore-offline-assets`	指定されたディレクトリからオフラインアセットパッケージを復元する	`pdf2zh_next example.pdf --restore-offline-assets /path`
`--version`	バージョンを表示して終了	`pdf2zh_next --version`
`--pages`	部分文書翻訳	`pdf2zh_next example.pdf --pages 1,2,1-,-3,3-5`
`--lang-in`	ソース言語コード	`pdf2zh_next example.pdf --lang-in en`
`--lang-out`	ターゲット言語コード	`pdf2zh_next example.pdf --lang-out zh-CN`
`--min-text-length`	翻訳する最小テキスト長	`pdf2zh_next example.pdf --min-text-length 5`
`--rpc-doclayout`	文書レイアウト分析のための RPC サービスホストアドレス	`pdf2zh_next example.pdf --rpc-doclayout http://127.0.0.1:8000`
`--qps`	翻訳サービスの QPS 制限	`pdf2zh_next example.pdf --qps 200`
`--ignore-cache`	翻訳キャッシュを無視	`pdf2zh_next example.pdf --ignore-cache`
`--custom-system-prompt`	翻訳用のカスタムシステムプロンプト。Qwen 3 の `/no_think` に使用されます	`pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"`
`--glossaries`	用語集ファイルリスト。	`pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"`
`--save-auto-extracted-glossary`	自動抽出された用語集を保存	`pdf2zh_next example.pdf --save-auto-extracted-glossary`
`--pool-max-workers`	翻訳プールの最大ワーカー数。設定されていない場合、qps をワーカー数として使用します	`pdf2zh_next example.pdf --pool-max-workers 100`
`--term-qps`	用語抽出翻訳サービスの QPS 制限。設定されていない場合は qps に従います。	`pdf2zh_next example.pdf --term-qps 20`
`--term-pool-max-workers`	用語抽出翻訳プールの最大ワーカー数。設定されていないか 0 の場合、pool_max_workers に従います。	`pdf2zh_next example.pdf --term-pool-max-workers 40`
`--no-auto-extract-glossary`	自動用語集抽出を無効にする	`pdf2zh_next example.pdf --no-auto-extract-glossary`
`--primary-font-family`	翻訳されたテキストのプライマリフォントファミリーを上書きします。選択肢：'serif' はセリフフォント、'sans-serif' はサンセリフフォント、'script' はスクリプト/イタリックフォント。指定しない場合、元のテキストプロパティに基づいて自動フォント選択を使用します。	`pdf2zh_next example.pdf --primary-font-family serif`
`--no-dual`	バイリンガル PDF ファイルを出力しない	`pdf2zh_next example.pdf --no-dual`
`--no-mono`	単一言語の PDF ファイルを出力しない	`pdf2zh_next example.pdf --no-mono`
`--formular-font-pattern`	数式テキストを識別するためのフォントパターン	`pdf2zh_next example.pdf --formular-font-pattern "(MS.*)"`
`--formular-char-pattern`	数式テキストを識別するための文字パターン	`pdf2zh_next example.pdf --formular-char-pattern "(MS.*)"`
`--split-short-lines`	短い行を強制的に異なる段落に分割する	`pdf2zh_next example.pdf --split-short-lines`
`--short-line-split-factor`	短い行の分割しきい値係数	`pdf2zh_next example.pdf --short-line-split-factor 1.2`
`--skip-clean`	PDF クリーニングステップをスキップ	`pdf2zh_next example.pdf --skip-clean`
`--dual-translate-first`	デュアル PDF モードで翻訳済みページを先に配置	`pdf2zh_next example.pdf --dual-translate-first`
`--disable-rich-text-translate`	リッチテキスト翻訳を無効にする	`pdf2zh_next example.pdf --disable-rich-text-translate`
`--enhance-compatibility`	すべての互換性向上オプションを有効にする	`pdf2zh_next example.pdf --enhance-compatibility`
`--use-alternating-pages-dual`	デュアル PDF 用の交互ページモードを使用する	`pdf2zh_next example.pdf --use-alternating-pages-dual`
`--watermark-output-mode`	PDF ファイルの透かし出力モード	`pdf2zh_next example.pdf --watermark-output-mode no_watermark`
`--max-pages-per-part`	分割翻訳のパートあたりの最大ページ数	`pdf2zh_next example.pdf --max-pages-per-part 50`
`--translate-table-text`	テーブルテキストを翻訳（実験的）	`pdf2zh_next example.pdf --translate-table-text`
`--skip-scanned-detection`	スキャン検出をスキップ	`pdf2zh_next example.pdf --skip-scanned-detection`
`--ocr-workaround`	翻訳されたテキストを強制的に黒色にし、白い背景を追加する	`pdf2zh_next example.pdf --ocr-workaround`
`--auto-enable-ocr-workaround`	自動 OCR 回避策を有効にします。文書が重度にスキャンされていると検出された場合、OCR 処理を有効にし、さらなるスキャン検出をスキップしようとします。詳細はドキュメントを参照してください。(デフォルト：False)	`pdf2zh_next example.pdf --auto-enable-ocr-workaround`
`--only-include-translated-page`	出力 PDF に翻訳済みのページのみを含める。--pages が使用されている場合のみ有効。	`pdf2zh_next example.pdf --pages 1-5 --only-include-translated-page`
`--no-merge-alternating-line-numbers`	行番号が含まれる文書内の交互の行番号とテキスト段落のマージを無効にする	`pdf2zh_next example.pdf --no-merge-alternating-line-numbers`
`--no-remove-non-formula-lines`	段落エリア内の非数式行の削除を無効にする	`pdf2zh_next example.pdf --no-remove-non-formula-lines`
`--non-formula-line-iou-threshold`	非数式行を識別するための IoU 閾値を設定 (0.0-1.0)	`pdf2zh_next example.pdf --non-formula-line-iou-threshold 0.85`
`--figure-table-protection-threshold`	図表の保護閾値を設定します (0.0-1.0)。図表内の行は処理されません	`pdf2zh_next example.pdf --figure-table-protection-threshold 0.95`
`--skip-formula-offset-calculation`	処理中の数式オフセット計算をスキップ	`pdf2zh_next example.pdf --skip-formula-offset-calculation`

GUI 引数

オプション	機能	例
`--share`	共有モードを有効化	`pdf2zh_next --gui --share`
`--auth-file`	認証ファイルのパス	`pdf2zh_next --gui --auth-file /path`
`--welcome-page`	ウェルカム HTML ファイルへのパス	`pdf2zh_next --gui --welcome-page /path`
`--enabled-services`	有効な翻訳サービス	`pdf2zh_next --gui --enabled-services "Bing,OpenAI"`
`--disable-gui-sensitive-input`	GUI のセンシティブ入力を無効にする	`pdf2zh_next --gui --disable-gui-sensitive-input`
`--disable-config-auto-save`	自動設定保存を無効にする	`pdf2zh_next --gui --disable-config-auto-save`
`--server-port`	WebUI ポート	`pdf2zh_next --gui --server-port 7860`
`--ui-lang`	UI 言語	`pdf2zh_next --gui --ui-lang zh`

⬆️ トップに戻る

レート制限設定ガイド

翻訳サービスを使用する際、適切なレート制限設定は API エラーを回避し、パフォーマンスを最適化するために重要です。このガイドでは、様々な上流サービスの制限に基づいて --qps と --pool-max-worker パラメータを設定する方法について説明します。

Tip

pool_size は 1000 を超えないことを推奨します。以下の方法で計算された pool_size が 1000 を超える場合は、1000 を使用してください。

RPM (Requests Per Minute) レート制限

上流サービスに RPM 制限がある場合、以下の計算式を使用してください：

計算式： - qps = floor(rpm / 60) - pool_size = qps * 10

Note

10 という係数は、ほとんどのシナリオでうまく機能する経験的な係数です。

例：翻訳サービスの制限が 600 RPM の場合： - qps = floor(600 / 60) = 10 - pool_size = 10 * 10 = 100

pdf2zh example.pdf --qps 10 --pool-max-worker 100

同時接続制限

上流サービスに同時接続制限がある場合（GLM 公式サービスのように）、このアプローチを使用します：

計算式： - pool_size = max(floor(0.9 * official_concurrent_limit), official_concurrent_limit - 20) - qps = pool_size

例：翻訳サービスが 50 の同時接続を許可している場合： - pool_size = max(floor(0.9 * 50), 50 - 20) = max(45, 30) = 45 - qps = 45

pdf2zh example.pdf --qps 45 --pool-max-worker 45

ベストプラクティス

Tip

常に控えめな値から始め、必要に応じて徐々に増やしてください
サービスの応答時間とエラーレートを監視してください
サービスによって最適化戦略が異なる場合があります
これらのパラメータを設定する際は、特定のユースケースと文書サイズを考慮してください

⬆️ トップに戻る

部分翻訳

--pages パラメータを使用して、文書の一部を翻訳します。

ページ番号が連続している場合、次のように記述できます：

pdf2zh_next example.pdf --pages 1-3

pdf2zh_next example.pdf --pages 25-

Tip

25- は 25 ページ以降のすべてのページを含みます。文書が 100 ページある場合、これは 25-100 と同等です。

同様に、-25 は 25 ページより前のすべてのページを含み、これは 1-25 と同等です。

ページが連続していない場合は、カンマ , を使用して区切ることができます。

例えば、最初と 3 ページ目を翻訳したい場合は、以下のコマンドを使用できます：

pdf2zh_next example.pdf --pages "1,3"

ページに連続した範囲と非連続した範囲の両方が含まれている場合、以下のようにカンマで接続することもできます：

pdf2zh_next example.pdf --pages "1,3,10-20,25-"

このコマンドは、1 ページ目、3 ページ目、10〜20 ページ、および 25 ページから最後までのすべてのページを翻訳します。

⬆️ トップに戻る

ソース言語とターゲット言語を指定する

Google 言語コード、DeepL 言語コードを参照してください。

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ トップに戻る

例外付き翻訳

正規表現を使用して、保持する必要がある数式フォントと文字を指定します：

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

デフォルトで Latex、Mono、Code、Italic、Symbol、Math フォントを保持します：

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ トップに戻る

カスタムプロンプト

翻訳用のカスタムシステムプロンプト。主にプロンプト内に Qwen 3 の'/no_think'指示を追加するために使用されます。

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ トップに戻る

カスタム設定

設定ファイルを変更およびインポートする方法は複数あります。

Note

設定ファイルの階層構造

同じパラメータを異なる方法で変更する場合、ソフトウェアは以下の優先順位に従って変更を適用します。

上位の変更は下位のものを上書きします。

cli/gui > env > ユーザー設定ファイル > デフォルト設定ファイル

コマンドライン引数による設定の変更

ほとんどの場合、コマンドライン引数を通じて希望の設定を直接渡すことができます。詳細については、コマンドライン引数を参照してください。

たとえば、GUI ウィンドウを有効にしたい場合は、次のコマンドを使用できます：

pdf2zh_next --gui

環境変数による設定の変更

コマンドライン引数の -- を PDF2ZH_ に置き換え、パラメータを = で接続し、- を _ に置き換えて環境変数として使用できます。

例えば、GUI ウィンドウを有効にするには、以下のコマンドを使用できます：

PDF2ZH_GUI=TRUE pdf2zh_next

env

ユーザー指定の 設定ファイル

以下のコマンドライン引数を使用して設定ファイルを指定できます：

pdf2zh_next --config-file '/path/config.toml'

設定ファイルの形式がわからない場合は、以下のデフォルト設定ファイルを参照してください。

デフォルト設定ファイル

デフォルトの設定ファイルは ~/.config/pdf2zh にあります。 default ディレクトリ内の設定ファイルは変更しないでください。この設定ファイルの内容を参照し、ユーザー指定設定ファイルを使用して独自の設定ファイルを実装することを強くお勧めします。

Tip

デフォルトでは、pdf2zh 2.0 は GUI で翻訳ボタンをクリックするたびに、現在の設定を ~/.config/pdf2zh/config.v3.toml に自動的に保存します。この設定ファイルは次回起動時にデフォルトで読み込まれます。
default ディレクトリ内の設定ファイルはプログラムによって自動生成されます。修正のためにコピーすることはできますが、直接編集しないでください。
設定ファイルには「v2」、「v3」などのバージョン番号が含まれる場合があります。これらは 設定ファイルのバージョン番号 であり、pdf2zh 自体のバージョン番号 ではありません。

⬆️ トップに戻る

クリーンスキップ

このパラメータを True に設定すると、PDF のクリーンアップステップがスキップされ、互換性が向上し、一部のフォント処理の問題を回避できます。

使い方：

pdf2zh_next example.pdf --skip-clean

または環境変数を使用する：

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

--enhance-compatibility が有効になっている場合、クリーンスキップは自動的に有効になります。

翻訳キャッシュ

PDFMathTranslate は翻訳速度を向上させ、同じ内容に対して不必要な API 呼び出しを避けるために、翻訳されたテキストをキャッシュします。--ignore-cache オプションを使用して翻訳キャッシュを無視し、強制的に再翻訳を行うことができます。

pdf2zh_next example.pdf --ignore-cache

⬆️ トップに戻る

パブリックサービスとしてのデプロイ

パブリックサービス上で pdf2zh GUI をデプロイする場合、以下のように設定ファイルを変更する必要があります。

Warning

このプロジェクトはセキュリティに関する専門的な監査を受けておらず、セキュリティ上の脆弱性が含まれている可能性があります。パブリックネットワークにデプロイする前に、リスクを評価し、必要なセキュリティ対策を講じてください。

Tip

公開デプロイ時には、disable_gui_sensitive_input と disable_config_auto_save の両方を有効にする必要があります。
利用可能な異なるサービスは 英語のカンマ , で区切ってください。

使用可能な設定は以下の通りです：

config.toml

[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ トップに戻る

認証とウェルカムページ

Authentication と welcome page を使用して、どのユーザーが Web UI を使用するかを指定し、ログインページをカスタマイズする場合：

auth.txt の例各行には、ユーザー名とパスワードの 2 つの要素が含まれており、カンマで区切られています。

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

example welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

認証ファイルが空白でない場合のみ、ウェルカムページが機能します。認証ファイルが空白の場合、認証は行われません。 :)

使用可能な設定は以下の通りです：

config.toml

[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ トップに戻る

用語集サポート

PDFMathTranslate は用語集テーブルをサポートしています。用語集テーブルファイルは csv ファイルである必要があります。ファイルには 3 つの列があります。以下はデモ用語集ファイルです：

source	target	tgt_lng
AutoML	自動 ML	ja
a,a	a	ja
"	"	ja

CLI ユーザーの場合：用語集に複数のファイルを使用できます。異なるファイルは , で区切る必要があります。

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

WebUI ユーザー向け：

独自の用語集ファイルをアップロードできるようになりました。ファイルをアップロード後、ファイル名をクリックすることで内容を確認できます。

⬆️ トップに戻る

高度な設定

目次

コマンドライン引数

Args

GUI 引数

レート制限設定ガイド

RPM (Requests Per Minute) レート制限

同時接続制限

ベストプラクティス

部分翻訳

ソース言語とターゲット言語を指定する

例外付き翻訳

カスタムプロンプト

カスタム設定

クリーンスキップ

翻訳キャッシュ

パブリックサービスとしてのデプロイ

認証とウェルカムページ

用語集サポート

このページの一部のコンテンツは GPT によって翻訳されており、エラーが含まれている可能性があります。