跳轉到

Opciones avanzadas

Opciones avanzadas > Opciones avanzadas (actual)


Tabla de Contenidos


Argumentos de la línea de comandos

Ejecuta el comando de traducción en la línea de comandos para generar el documento traducido example-mono.pdf y el documento bilingüe example-dual.pdf en el directorio de trabajo actual. Utiliza Google como el servicio de traducción predeterminado. Puedes encontrar más servicios de traducción soportados AQUÍ.

cmd

En la siguiente tabla, enumeramos todas las opciones avanzadas como referencia:

Argumentos
Opción Función Ejemplo
files Ruta del archivo PDF local pdf2zh ~/local.pdf
enlaces Archivos en línea pdf2zh http://arxiv.org/paper.pdf
--output Directorio de salida para los archivos pdf2zh example.pdf --output /outputpath
--<Services> Usar servicio específico para la traducción pdf2zh example.pdf --openai
pdf2zh example.pdf --deepseek
--help, -h Mostrar mensaje de ayuda y salir pdf2zh -h
--config-file Ruta al archivo de configuración pdf2zh --config-file /ruta/al/config/config.toml
--report-interval Intervalo de informe de progreso en segundos pdf2zh example.pdf --report-interval 5
--debug Usar nivel de registro de depuración pdf2zh example.pdf --debug
--gui Interactuar con la interfaz gráfica de usuario (GUI) pdf2zh --gui
--warmup Solo descargar y verificar los recursos necesarios y luego salir pdf2zh example.pdf --warmup
--generate-offline-assets Generar paquete de recursos sin conexión en el directorio especificado pdf2zh example.pdf --generate-offline-assets /path
--restore-offline-assets Restaurar el paquete de recursos sin conexión desde el directorio especificado pdf2zh example.pdf --restore-offline-assets /ruta
--version Mostrar versión y salir pdf2zh --version
--pages Traducción parcial del documento pdf2zh example.pdf --pages 1,2,1-,-3,3-5
--lang-in El código del idioma de origen pdf2zh example.pdf --lang-in en
--lang-out El código del idioma de destino pdf2zh example.pdf --lang-out zh-CN
--min-text-length Longitud mínima del texto a traducir pdf2zh example.pdf --min-text-length 5
--rpc-doclayout Dirección del host del servicio RPC para el análisis de diseño de documentos
--qps Límite de QPS para el servicio de traducción pdf2zh example.pdf --qps 200
--ignore-cache Ignorar caché de traducción pdf2zh example.pdf --ignore-cache
--custom-system-prompt Indicación personalizada del sistema para traducción. Utilizada para /no_think en Qwen 3 pdf2zh example.pdf --custom-system-prompt "/no_think You are a professional, authentic machine translation engine"
--pool-max-worker Número máximo de trabajadores para el grupo de traducción. Si no se establece, se utilizará qps como el número de trabajadores pdf2zh example.pdf --pool-max-worker 100
--no-auto-extract-glossary Desactivar la extracción automática del glosario pdf2zh example.pdf --no-auto-extract-glossary
--primary-font-family Anula la familia de fuentes principal para el texto traducido. Opciones: 'serif' para fuentes serif, 'sans-serif' para fuentes sans-serif, 'script' para fuentes script/cursivas. Si no se especifica, utiliza la selección automática de fuentes basada en las propiedades del texto original. pdf2zh example.pdf --primary-font-family serif
--no-dual No generar archivos PDF bilingües pdf2zh example.pdf --no-dual
--no-mono No generar archivos PDF monolingües pdf2zh example.pdf --no-mono
--formular-font-pattern Patrón de fuente para identificar texto de fórmulas pdf2zh example.pdf --formular-font-pattern "(MS.*)"
--formular-char-pattern Patrón de caracteres para identificar texto de fórmulas pdf2zh example.pdf --formular-char-pattern "(MS.*)"
--split-short-line Forzar la división de líneas cortas en diferentes párrafos pdf2zh example.pdf --split-short-line
--short-line-split-factor Factor de umbral de división para líneas cortas
--skip-clean Omitir el paso de limpieza del PDF pdf2zh example.pdf --skip-clean
--dual-translate-first En el modo de PDF dual, priorizar la colocación de páginas traducidas pdf2zh example.pdf --dual-translate-first
--disable-rich-text-translate Deshabilitar la traducción de texto enriquecido pdf2zh example.pdf --disable-rich-text-translate
--enhance-compatibility Activar todas las opciones de mejora de compatibilidad pdf2zh example.pdf --enhance-compatibility
--use-alternating-pages-dual Usar el modo de páginas alternas para PDF dual pdf2zh example.pdf --use-alternating-pages-dual
--watermark-output-mode Modo de marca de agua para archivos PDF pdf2zh example.pdf --watermark-output-mode "NoWaterMark"
--max-pages-per-part Máximo de páginas por parte para traducción dividida pdf2zh example.pdf --max-pages-per-part 1
--translate-table-text Traducir texto de tablas (experimental) pdf2zh example.pdf --translate-table-text
--skip-scanned-detection Omitir detección de escaneado pdf2zh example.pdf --skip-scanned-detection
--ocr-workaround Forzar que el texto traducido sea negro y añadir un fondo blanco pdf2zh example.pdf --ocr-workaround
--auto-enable-ocr-workaround Habilitar solución alternativa automática de OCR. Si se detecta que un documento está muy escaneado, intentará habilitar el procesamiento de OCR y omitir la detección adicional de escaneo. Consulte la documentación para más detalles. (valor predeterminado: False) pdf2zh example.pdf --auto-enable-ocr-workaround True
--only-include-translated-page Solo incluir las páginas traducidas en el PDF de salida. Solo es efectivo cuando se usa --pages. pdf2zh example.pdf --pages 1-5 --only-include-translated-page
--glossaries Glosario personalizado para traducción. pdf2zh example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"
--save-auto-extracted-glossary guardar glosario extraído automáticamente. pdf2zh example.pdf --save-auto-extracted-glossary
--no-merge-alternating-line-numbers Desactiva la fusión de números de línea alternos y párrafos de texto en documentos con números de línea pdf2zh example.pdf --no-merge-alternating-line-numbers
--no-remove-non-formula-lines Deshabilitar la eliminación de líneas que no son fórmulas dentro de áreas de párrafo pdf2zh example.pdf --no-remove-non-formula-lines
--non-formula-line-iou-threshold Establece el umbral de IoU para identificar líneas que no son fórmulas (0.0-1.0) pdf2zh example.pdf --non-formula-line-iou-threshold 0.85
--figure-table-protection-threshold Establece el umbral de protección para figuras y tablas (0.0-1.0). Las líneas dentro de figuras/tablas no serán procesadas pdf2zh example.pdf --figure-table-protection-threshold 0.95
--skip-formula-offset-calculation Omitir el cálculo de desplazamiento de fórmulas durante el procesamiento pdf2zh example.pdf --skip-formula-offset-calculation
Argumentos de GUI
Opción Función Ejemplo
--share Habilitar modo de compartir pdf2zh --gui --share
--auth-file Ruta al archivo de autenticación pdf2zh --gui --auth-file /ruta
--welcome-page Ruta al archivo HTML de bienvenida pdf2zh --gui --welcome-page /ruta
--enabled-services Servicios de traducción habilitados pdf2zh --gui --enabled-services "Bing,OpenAI"
--disable-gui-sensitive-input Deshabilitar entrada sensible en la GUI pdf2zh --gui --disable-gui-sensitive-input
--disable-config-auto-save Deshabilitar el guardado automático de configuración pdf2zh --gui --disable-config-auto-save
--server-port Puerto de WebUI pdf2zh --gui --server-port 7860

⬆️ Volver arriba


Guía de Configuración de Límite de Tasa

Al utilizar servicios de traducción, una configuración adecuada del límite de tasa es crucial para evitar errores de API y optimizar el rendimiento. Esta guía explica cómo configurar los parámetros --qps y --pool-max-worker según las limitaciones de diferentes servicios ascendentes.

Tip

Se recomienda que el pool_size no exceda de 1000. Si el pool_size calculado por el siguiente método excede 1000, por favor utilice 1000.

Limitación de tasa RPM (Solicitudes Por Minuto)

Cuando el servicio ascendente tiene limitaciones de RPM, utiliza el siguiente cálculo:

Fórmula de cálculo: - qps = floor(rpm / 60) - pool_size = qps * 10

Note

El factor de 10 es un coeficiente empírico que generalmente funciona bien para la mayoría de los escenarios.

Ejemplo: Si tu servicio de traducción tiene un límite de 600 RPM: - qps = floor(600 / 60) = 10 - pool_size = 10 * 10 = 100

pdf2zh example.pdf --qps 10 --pool-max-worker 100
Limitación de conexiones concurrentes

Cuando el servicio ascendente tiene limitaciones de conexiones concurrentes (como el servicio oficial de GLM), utiliza este enfoque:

Fórmula de cálculo: - pool_size = max(floor(0.9 * official_concurrent_limit), official_concurrent_limit - 20) - qps = pool_size

Ejemplo: Si tu servicio de traducción permite 50 conexiones concurrentes: - pool_size = max(floor(0.9 * 50), 50 - 20) = max(45, 30) = 45 - qps = 45

pdf2zh example.pdf --qps 45 --pool-max-worker 45
Mejores prácticas

Tip

  • Siempre comienza con valores conservadores y aumenta gradualmente si es necesario
  • Monitorea los tiempos de respuesta y las tasas de error de tu servicio
  • Diferentes servicios pueden requerir diferentes estrategias de optimización
  • Considera tu caso de uso específico y el tamaño del documento al configurar estos parámetros

⬆️ Volver arriba


Traducción parcial

Utiliza el parámetro --pages para traducir una parte de un documento.

  • Si los números de página son consecutivos, puedes escribirlo así:
pdf2zh_next example.pdf --pages 1-3
pdf2zh_next example.pdf --pages 25-

Tip

25- incluye todas las páginas después de la página 25. Si tu documento tiene 100 páginas, esto es equivalente a 25-100.

Del mismo modo, -25 incluye todas las páginas antes de la página 25, lo que equivale a 1-25.

  • Si las páginas no son consecutivas, puedes usar una coma , para separarlas.

Por ejemplo, si deseas traducir la primera y tercera página, puedes usar el siguiente comando:

pdf2zh_next example.pdf --pages "1,3"
  • Si las páginas incluyen rangos tanto consecutivos como no consecutivos, también puedes conectarlos con una coma, así:
pdf2zh_next example.pdf --pages "1,3,10-20,25-"

Este comando traducirá la primera página, la tercera página, las páginas 10-20 y todas las páginas desde la 25 hasta el final.

⬆️ Volver arriba


Especificar idiomas de origen y destino

Consulta los Códigos de idioma de Google y los Códigos de idioma de DeepL

pdf2zh_next example.pdf --lang-in en -lang-out ja

⬆️ Volver arriba


Traducir con excepciones

Usar expresiones regulares para especificar fuentes de fórmulas y caracteres que deben preservarse:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^RT].*|MS.*|.*Ital)" --formular-char-pattern "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

Preservar las fuentes Latex, Mono, Code, Italic, Symbol y Math por defecto:

pdf2zh_next example.pdf --formular-font-pattern "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"

⬆️ Volver arriba


Indicaciones personalizadas

Indicaciones personalizadas del sistema para traducción. Se utiliza principalmente para agregar la instrucción '/no_think' de Qwen 3 en la indicación.

pdf2zh_next example.pdf --custom-system-prompt "/no_think You are a professional and reliable machine translation engine responsible for translating the input text into zh_CN.When translating, strictly follow the instructions below to ensure translation quality and preserve all formatting, tags, and placeholders:"

⬆️ Volver arriba


Configuración personalizada

Existen múltiples formas de modificar e importar el archivo de configuración.

Note

Jerarquía de archivos de configuración

Al modificar el mismo parámetro utilizando diferentes métodos, el software aplicará los cambios según el siguiente orden de prioridad.

Las modificaciones de mayor prioridad anularán las de menor prioridad.

cli/gui > env > archivo de configuración del usuario > archivo de configuración predeterminado

  • Modificación de la configuración mediante Argumentos de la línea de comandos

En la mayoría de los casos, puedes pasar directamente tus configuraciones deseadas a través de argumentos de la línea de comandos. Consulta Argumentos de la línea de comandos para obtener más información.

Por ejemplo, si deseas habilitar una ventana GUI, puedes usar el siguiente comando:

pdf2zh_next --gui
  • Modificación de la configuración mediante variables de entorno

Puedes reemplazar el -- en los argumentos de la línea de comandos con PDF2ZH_, conectar parámetros usando =, y reemplazar - con _ como variables de entorno.

Por ejemplo, si deseas habilitar una ventana GUI, puedes usar el siguiente comando:

PDF2ZH_GUI=TRUE pdf2zh_next

env

  • Archivo de configuración especificado por el usuario

Puedes especificar un archivo de configuración utilizando el siguiente argumento de la línea de comandos:

pdf2zh_next --config-file '/path/config.toml'

Si no está seguro del formato del archivo de configuración, consulte el archivo de configuración predeterminado que se describe a continuación.

  • Archivo de Configuración Predeterminado

El archivo de configuración predeterminado se encuentra en ~/.config/pdf2zh.
Por favor, no modifiques los archivos de configuración en el directorio default.
Se recomienda encarecidamente consultar el contenido de este archivo de configuración y utilizar Configuración personalizada para implementar tu propio archivo de configuración.

Tip

  • Por defecto, pdf2zh 2.0 guarda automáticamente la configuración actual en ~/.config/pdf2zh/config.v3.toml cada vez que haces clic en el botón de traducción en la GUI. Este archivo de configuración se cargará por defecto en el próximo inicio.
  • Los archivos de configuración en el directorio default son generados automáticamente por el programa. Puedes copiarlos para modificarlos, pero por favor no los modifiques directamente.
  • Los archivos de configuración pueden incluir números de versión como "v2", "v3", etc. Estos son números de versión del archivo de configuración, no el número de versión de pdf2zh en sí.

⬆️ Volver arriba


Omitir limpieza

Cuando este parámetro se establece en True, se omitirá el paso de limpieza del PDF, lo que puede mejorar la compatibilidad y evitar algunos problemas de procesamiento de fuentes.

Uso:

pdf2zh_next example.pdf --skip-clean

O utilizando variables de entorno:

PDF2ZH_SKIP_CLEAN=TRUE pdf2zh_next example.pdf

Tip

Cuando --enhance-compatibility está habilitado, Omitir limpieza se activa automáticamente.


Caché de traducción

PDFMathTranslate almacena en caché los textos traducidos para aumentar la velocidad y evitar llamadas API innecesarias para los mismos contenidos. Puedes usar la opción --ignore-cache para ignorar la caché de traducción y forzar la retraducción.

pdf2zh_next example.pdf --ignore-cache

⬆️ Volver arriba


Despliegue como servicios públicos

Al desplegar una GUI de pdf2zh en servicios públicos, debes modificar el archivo de configuración como se describe a continuación.

Warning

Este proyecto no ha sido auditado profesionalmente en cuanto a seguridad y puede contener vulnerabilidades. Por favor, evalúe los riesgos y tome las medidas de seguridad necesarias antes de implementarlo en redes públicas.

Tip

  • Al implementar públicamente, tanto disable_gui_sensitive_input como disable_config_auto_save deben estar habilitados.
  • Separe los diferentes servicios disponibles con comas en inglés , .

Una configuración utilizable es la siguiente:

config.toml
[basic]
gui = true

[gui_settings]
enabled_services = "Bing,OpenAI"
disable_gui_sensitive_input = true
disable_config_auto_save = true

⬆️ Volver arriba


Autenticación y página de bienvenida

Al usar Autenticación y página de bienvenida para especificar qué usuario debe usar Web UI y personalizar la página de inicio de sesión:

ejemplo auth.txt Cada línea contiene dos elementos, nombre de usuario y contraseña, separados por una coma.

admin,123456
user1,password1
user2,abc123
guest,guest123
test,test123

ejemplo welcome.html

<!DOCTYPE html>
<html>
<head>
    <title>Simple HTML</title>
</head>
<body>
    <h1>Hello, World!</h1>
    <p>Welcome to my simple HTML page.</p>
</body>
</html>

Note

La página de bienvenida funcionará solo si el archivo de autenticación no está en blanco. Si el archivo de autenticación está en blanco, no habrá autenticación. :)

Una configuración utilizable es la siguiente:

config.toml
[basic]
gui = true

[gui_settings]
auth_file = "/path/to/auth/file"
welcome_page = "/path/to/welcome/html/file"

⬆️ Volver arriba


Soporte de glosario

PDFMathTranslate soporta la tabla de glosario. El archivo de tablas de glosario debe ser un archivo csv. Hay tres columnas en el archivo. Aquí hay un archivo de glosario de demostración:

fuente objetivo idioma_destino
AutoML ML automático es
a,a a es
" " es

Para usuarios de CLI: Puedes usar múltiples archivos para el glosario. Y los diferentes archivos deben estar separados por ,.

pdf2zh_next example.pdf --glossaries "glossary1.csv,glossary2.csv,glossary3.csv"

Para usuarios de WebUI:

Ahora puedes subir tu propio archivo de glosario. Después de subir el archivo, puedes verificarlo haciendo clic en su nombre y el contenido se mostrará a continuación.

⬆️ Volver al inicio

Parte del contenido de esta página ha sido traducido por GPT y puede contener errores.