跳轉到

Opções avançadas

Opções avançadas > Opções avançadas (atual)


Índice


Argumentos da Linha de Comando

Execute o comando de tradução na linha de comando para gerar o documento traduzido example-mono.pdf e o documento bilíngue example-dual.pdf no diretório de trabalho atual. Use o Google como o serviço de tradução padrão. Mais serviços de tradução suportados podem ser encontrados AQUI.

cmd

Na tabela a seguir, listamos todas as opções avançadas para referência:

Args
Opção Função Exemplo
input-files Arquivos PDF de entrada para processar pdf2zh_next example.pdf
--output Diretório de saída para arquivos pdf2zh_next example.pdf --output /outputpath
--<Serviços> Usar serviço específico para tradução pdf2zh_next example.pdf --openai
pdf2zh_next example.pdf --deepseek
--help, -h Mostrar mensagem de ajuda e sair pdf2zh_next -h
--config-file Caminho para o arquivo de configuração pdf2zh_next --config-file /path/to/config/config.toml
--report-interval Intervalo de relatório de progresso em segundos pdf2zh_next example.pdf --report-interval 5
--debug Usar nível de registro de depuração pdf2zh_next example.pdf --debug
--gui Interagir com a GUI pdf2zh_next --gui
--warmup Apenas baixar e verificar os recursos necessários e depois sair pdf2zh_next example.pdf --warmup
--generate-offline-assets Gerar pacote de recursos offline no diretório especificado pdf2zh_next example.pdf --generate-offline-assets /path
--restore-offline-assets Restaurar pacote de ativos offline do diretório especificado pdf2zh_next example.pdf --restore-offline-assets /path
--version Mostrar versão e sair pdf2zh_next --version
--pages Tradução parcial do documento pdf2zh_next example.pdf --pages 1,2,1-,-3,3-5
--lang-in Código do idioma de origem pdf2zh_next example.pdf --lang-in en
--lang-out Código do idioma de destino pdf2zh_next example.pdf --lang-out zh-CN
--min-text-length Comprimento mínimo do texto para traduzir pdf2zh_next example.pdf --min-text-length 5
--rpc-doclayout Endereço do host do serviço RPC para análise de layout de documento pdf2zh_next example.pdf --rpc-doclayout http://127.0.0.1:8000
--qps Limite de QPS para o serviço de tradução pdf2zh_next example.pdf --qps 200
--ignore-cache Ignorar cache de tradução pdf2zh_next example.pdf --ignore-cache
--custom-system-prompt Prompt personalizado do sistema para tradução. Usado para /no_think no Qwen 3 pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"
--glossaries Lista de arquivos de glossário. pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"
--save-auto-extracted-glossary salvar glossário extraído automaticamente pdf2zh_next example.pdf --save-auto-extracted-glossary
--pool-max-workers Número máximo de workers para o pool de tradução. Se não definido, será usado qps como o número de workers pdf2zh_next example.pdf --pool-max-workers 100
--term-qps Limite de QPS para o serviço de tradução de extração de termos. Se não definido, seguirá o qps. pdf2zh_next example.pdf --term-qps 20
--term-pool-max-workers Número máximo de workers para o pool de tradução de extração de termos. Se não definido ou 0, seguirá pool_max_workers. pdf2zh_next example.pdf --term-pool-max-workers 40
--no-auto-extract-glossary Desativar extração automática do glossário pdf2zh_next example.pdf --no-auto-extract-glossary
--primary-font-family Substitui a família de fontes primária para o texto traduzido. Opções: 'serif' para fontes serifadas, 'sans-serif' para fontes sem serifa, 'script' para fontes cursivas/itálicas. Se não especificado, usa a seleção automática de fonte baseada nas propriedades do texto original. pdf2zh_next example.pdf --primary-font-family serif
--no-dual Não gerar arquivos PDF bilíngues pdf2zh_next example.pdf --no-dual
--no-mono Não gerar arquivos PDF monolíngues pdf2zh_next example.pdf --no-mono
--formular-font-pattern Padrão de fonte para identificar texto de fórmula pdf2zh_next example.pdf --formular-font-pattern "(MS.*)"
--formular-char-pattern Padrão de caracteres para identificar texto de fórmula pdf2zh_next example.pdf --formular-char-pattern "(MS.*)"
--split-short-lines Força a divisão de linhas curtas em parágrafos diferentes pdf2zh_next example.pdf --split-short-lines
--short-line-split-factor Fator de limite de divisão para linhas curtas pdf2zh_next example.pdf --short-line-split-factor 1.2
--skip-clean Pular etapa de limpeza do PDF pdf2zh_next example.pdf --skip-clean
--dual-translate-first Colocar páginas traduzidas primeiro no modo PDF duplo pdf2zh_next example.pdf --dual-translate-first
--disable-rich-text-translate Desativar tradução de texto rico pdf2zh_next example.pdf --disable-rich-text-translate
--enhance-compatibility Ativar todas as opções de aprimoramento de compatibilidade pdf2zh_next example.pdf --enhance-compatibility
--use-alternating-pages-dual Usar modo de páginas alternadas para PDF duplo pdf2zh_next example.pdf --use-alternating-pages-dual
--watermark-output-mode Modo de saída de marca d'água para arquivos PDF pdf2zh_next example.pdf --watermark-output-mode no_watermark
--max-pages-per-part Número máximo de páginas por parte para tradução dividida pdf2zh_next example.pdf --max-pages-per-part 50
--translate-table-text Traduzir texto da tabela (experimental) pdf2zh_next example.pdf --translate-table-text
--skip-scanned-detection Pular detecção de digitalização pdf2zh_next example.pdf --skip-scanned-detection
--ocr-workaround Forçar o texto traduzido a ser preto e adicionar fundo branco pdf2zh_next example.pdf --ocr-workaround
--auto-enable-ocr-workaround Ativar solução alternativa automática de OCR. Se um documento for detectado como fortemente digitalizado, isso tentará ativar o processamento de OCR e pular a detecção adicional de digitalização. Consulte a documentação para obter detalhes. (padrão: Falso) pdf2zh_next example.pdf --auto-enable-ocr-workaround
--only-include-translated-page Incluir apenas páginas traduzidas no PDF de saída. Eficaz apenas quando --pages é usado. pdf2zh_next example.pdf --pages 1-5 --only-include-translated-page
--no-merge-alternating-line-numbers Desativa a fusão de números de linha alternados e parágrafos de texto em documentos com numeração de linhas pdf2zh_next example.pdf --no-merge-alternating-line-numbers
--no-remove-non-formula-lines Desativar a remoção de linhas não relacionadas a fórmulas dentro de áreas de parágrafo pdf2zh_next example.pdf --no-remove-non-formula-lines
--non-formula-line-iou-threshold Definir limite de IoU para identificar linhas não relacionadas a fórmulas (0.0-1.0) pdf2zh_next example.pdf --non-formula-line-iou-threshold 0.85
--figure-table-protection-threshold Definir limite de proteção para figuras e tabelas (0.0-1.0). Linhas dentro de figuras/tabelas não serão processadas pdf2zh_next example.pdf --figure-table-protection-threshold 0.95
--skip-formula-offset-calculation Pular o cálculo de deslocamento de fórmula durante o processamento pdf2zh_next example.pdf --skip-formula-offset-calculation
Argumentos da GUI
Opção Função Exemplo
--share Ativar modo de compartilhamento pdf2zh_next --gui --share
--auth-file Caminho para o arquivo de autenticação pdf2zh_next --gui --auth-file /caminho
--welcome-page Caminho para o arquivo html de boas-vindas pdf2zh_next --gui --welcome-page /path
--enabled-services Serviços de tradução habilitados pdf2zh_next --gui --enabled-services "Bing,OpenAI"
--disable-gui-sensitive-input Desativar entrada sensível da GUI pdf2zh_next --gui --disable-gui-sensitive-input
--disable-config-auto-save Desativar o salvamento automático da configuração pdf2zh_next --gui --disable-config-auto-save
--server-port Porta do WebUI pdf2zh_next --gui --server-port 7860
--ui-lang Idioma da interface do usuário pdf2zh_next --gui --ui-lang zh

⬆️ Voltar ao topo


Guia de configuração de limitação de taxa

Ao usar serviços de tradução, a configuração adequada da limitação de taxa é crucial para evitar erros de API e otimizar o desempenho. Este guia explica como configurar os parâmetros --qps e --pool-max-worker com base nas diferentes limitações dos serviços upstream.

Tip

É recomendado que o pool_size não exceda 1000. Se o pool_size calculado pelo método a seguir exceder 1000, use 1000.

Limitação de taxa de RPM (Solicitações por Minuto)

Quando o serviço upstream tem limitações de RPM, use o seguinte cálculo:

Fórmula de Cálculo: - qps = floor(rpm / 60) - pool_size = qps * 10

Note

O fator de 10 é um coeficiente empírico que geralmente funciona bem para a maioria dos cenários.

Exemplo: Se o seu serviço de tradução tiver um limite de 600 RPM: - qps = floor(600 / 60) = 10 - pool_size = 10 * 10 = 100

pdf2zh example.pdf --qps 10 --pool-max-worker 100
Limitação de conexões simultâneas

Quando o serviço upstream tem limitações de conexões simultâneas (como o serviço oficial GLM), use esta abordagem:

Fórmula de Cálculo: - pool_size = max(floor(0.9 * official_concurrent_limit), official_concurrent_limit - 20) - qps = pool_size

Exemplo: Se o seu serviço de tradução permite 50 conexões simultâneas: - pool_size = max(floor(0.9 * 50), 50 - 20) = max(45, 30) = 45 - qps = 45

pdf2zh example.pdf --qps 45 --pool-max-worker 45
Melhores práticas

Tip

  • Sempre comece com valores conservadores e aumente gradualmente, se necessário
  • Monitore os tempos de resposta e as taxas de erro do seu serviço
  • Diferentes serviços podem exigir diferentes estratégias de otimização
  • Considere seu caso de uso específico e o tamanho do documento ao definir esses parâmetros

⬆️ Voltar ao topo


Tradução parcial

Use o parâmetro --pages para traduzir uma parte de um documento.

  • Se os números das páginas forem consecutivos, você pode escrever assim:
pdf2zh_next example.pdf --pages 1-3
pdf2zh_next example.pdf --pages 25-

Tip

25- inclui todas as páginas após a página 25. Se o seu documento tiver 100 páginas, isso é equivalente a 25-100.

Da mesma forma, -25 inclui todas as páginas antes da página 25, o que é equivalente a 1-25.

  • Se as páginas não forem consecutivas, você pode usar uma vírgula , para separá-las.

Por exemplo, se você quiser traduzir a primeira e a terceira páginas, pode usar o seguinte comando:

pdf2zh_next example.pdf --pages "1,3"
  • Se as páginas incluírem intervalos consecutivos e não consecutivos, você também pode conectá-los com uma vírgula, assim:
pdf2zh_next example.pdf --pages "1,3,10-20,25-"

Este comando irá traduzir a primeira página, a terceira página, as páginas 10-20 e todas as páginas de 25 até o final.

⬆️ Voltar ao topo


Especificar idiomas de origem e destino

Veja Google Languages Codes, DeepL Languages Codes

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ Voltar ao topo


Traduzir com exceções

Use regex para especificar fontes de fórmulas e caracteres que precisam ser preservados:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

Preserva as fontes Latex, Mono, Code, Italic, Symbol e Math por padrão:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ Voltar ao topo


Prompt personalizado

Prompt personalizado do sistema para tradução. É usado principalmente para adicionar a instrução '/no_think' do Qwen 3 no prompt.

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ Voltar ao topo


Configuração personalizada

Existem várias maneiras de modificar e importar o arquivo de configuração.

Note

Hierarquia do Arquivo de Configuração

Ao modificar o mesmo parâmetro usando métodos diferentes, o software aplicará as alterações de acordo com a ordem de prioridade abaixo.

Modificações de classificação mais alta substituirão as de classificação mais baixa.

cli/gui > env > arquivo de configuração do usuário > arquivo de configuração padrão

  • Modificando a configuração via Argumentos da Linha de Comando

Para a maioria dos casos, você pode passar suas configurações desejadas diretamente por meio de argumentos da linha de comando. Consulte Argumentos da Linha de Comando para obter mais informações.

Por exemplo, se você quiser habilitar uma janela GUI, pode usar o seguinte comando:

pdf2zh_next --gui
  • Modificando a configuração via Variáveis de ambiente

Você pode substituir o -- nos argumentos da linha de comando por PDF2ZH_, conectar os parâmetros usando =, e substituir - por _ como variáveis de ambiente.

Por exemplo, se você quiser habilitar uma janela GUI, pode usar o seguinte comando:

PDF2ZH_GUI=TRUE pdf2zh_next

env

  • Arquivo de Configuração Especificado pelo Usuário

Você pode especificar um arquivo de configuração usando o argumento da linha de comando abaixo:

pdf2zh_next --config-file '/path/config.toml'

Se você não tiver certeza sobre o formato do arquivo de configuração, consulte o arquivo de configuração padrão descrito abaixo.

  • Arquivo de Configuração Padrão

O arquivo de configuração padrão está localizado em ~/.config/pdf2zh.
Por favor, não modifique os arquivos de configuração no diretório default.
É altamente recomendado consultar o conteúdo deste arquivo de configuração e usar Configuração personalizada para implementar seu próprio arquivo de configuração.

Tip

  • Por padrão, o pdf2zh 2.0 salva automaticamente a configuração atual em ~/.config/pdf2zh/config.v3.toml cada vez que você clica no botão de traduzir na GUI. Este arquivo de configuração será carregado por padrão na próxima inicialização.
  • Os arquivos de configuração no diretório default são gerados automaticamente pelo programa. Você pode copiá-los para modificação, mas por favor não os modifique diretamente.
  • Os arquivos de configuração podem incluir números de versão como "v2", "v3", etc. Estes são números de versão do arquivo de configuração, não o número de versão do pdf2zh em si.

⬆️ Voltar ao topo


Pular limpeza

Quando este parâmetro for definido como True, a etapa de limpeza do PDF será ignorada, o que pode melhorar a compatibilidade e evitar alguns problemas de processamento de fontes.

Uso:

pdf2zh_next example.pdf --skip-clean

Ou usando variáveis de ambiente:

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

Quando --enhance-compatibility está ativado, Pular limpeza é automaticamente ativado.


Cache de tradução

PDFMathTranslate armazena em cache os textos traduzidos para aumentar a velocidade e evitar chamadas de API desnecessárias para conteúdos idênticos. Você pode usar a opção --ignore-cache para ignorar o cache de tradução e forçar uma nova tradução.

pdf2zh_next example.pdf --ignore-cache

⬆️ Voltar ao topo


Implantação como serviços públicos

Ao implantar uma GUI pdf2zh em serviços públicos, você deve modificar o arquivo de configuração conforme descrito abaixo.

Warning

Este projeto não foi auditado profissionalmente quanto à segurança e pode conter vulnerabilidades de segurança. Avalie os riscos e tome as medidas de segurança necessárias antes de implantar em redes públicas.

Tip

  • Ao implantar publicamente, tanto disable_gui_sensitive_input quanto disable_config_auto_save devem ser habilitados.
  • Separe diferentes serviços disponíveis com vírgulas em inglês , .

Uma configuração utilizável é a seguinte:

config.toml
[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ Voltar ao topo


Autenticação e página de boas-vindas

Ao usar Autenticação e página de boas-vindas para especificar qual usuário deve usar a Web UI e personalizar a página de login:

exemplo auth.txt Cada linha contém dois elementos, nome de usuário e senha, separados por uma vírgula.

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

example welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

A página de boas-vindas funcionará apenas se o arquivo de autenticação não estiver em branco. Se o arquivo de autenticação estiver em branco, não haverá autenticação. :)

Uma configuração utilizável é a seguinte:

config.toml
[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ Voltar ao topo


Suporte ao glossário

PDFMathTranslate oferece suporte à tabela de glossário. O arquivo da tabela de glossário deve ser um arquivo csv. Existem três colunas no arquivo. Aqui está um arquivo de glossário de demonstração:

source target tgt_lng
AutoML AutoML pt
a,a a pt
" " pt

Para usuários da CLI: Você pode usar vários arquivos para o glossário. E arquivos diferentes devem ser separados por ,.

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

Para usuários do WebUI:

Agora você pode fazer upload do seu próprio arquivo de glossário. Após fazer o upload do arquivo, você pode verificá-lo clicando no nome dele e o conteúdo será exibido abaixo.

⬆️ Voltar ao topo

Parte do conteúdo desta página foi traduzida pelo GPT e pode conter erros.