PDF 文档翻译及双语对照工具
2024-11-13 11:21:0 Author: www.upx8.com(查看原文) 阅读量:11 收藏

PDF 文档翻译及双语对照

  • 📊 保留公式和图表

  • 📄 保留可索引目录

  • 🌐 支持多种翻译服务

  • 项目地址

要求 Python 版本 >=3.8, <=3.12

命令行中执行翻译指令,在工作目录下生成翻译文档 example-zh.pdf 和双语对照文档 example-dual.pdf,默认使用 Google 作为翻译服务

pdf2zh example.pdf -p 1-3,5

参考 Google Languages CodesDeepL Languages Codes

pdf2zh example.pdf -li en -lo ja

参考 DeepLX

设置环境变量构建接入点:{DEEPL_SERVER_URL}/{DEEPL_AUTH_KEY}/translate

  • DEEPL_SERVER_URL(可选), e.g., export DEEPL_SERVER_URL=https://api.deepl.com
  • DEEPL_AUTH_KEY, e.g., export DEEPL_AUTH_KEY=xxx
pdf2zh example.pdf -s deepl

参考 Ollama

设置环境变量构建接入点:{OLLAMA_HOST}/api/chat

  • OLLAMA_HOST(可选), e.g., export OLLAMA_HOST=https://localhost:11434
pdf2zh example.pdf -s ollama:gemma2

使用 OpenAI/SiliconCloud 翻译

参考 SiliconCloudZhipu

设置环境变量构建接入点:{OPENAI_BASE_URL}/chat/completions

  • OPENAI_BASE_URL(可选), e.g., export OPENAI_BASE_URL=https://api.openai.com/v1
  • OPENAI_API_KEY, e.g., export OPENAI_API_KEY=xxx
pdf2zh example.pdf -s openai:gpt-4o
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

文章来源: https://www.upx8.com/4401
如有侵权请联系:admin#unsafe.sh