- Published on
【优秀开源推荐】一款基于AI的PDF文档翻译神器!
- Authors

- Name
- 骨哥
前段时间有朋友问我,有没有免费的PDF翻译平台或本地化部署工具,今天被骨哥找到了!这是一款超过10K+ Star的开源项目---PDFMathTranslate
工具介绍
概述
PDFMathTranslate 是一款基于 AI 完整保留排版的 PDF 文档全文双语翻译,,同时提供 CLI/GUI/Docker等多种部署方式,其功能丰富,不仅能保留公式、图表、目录和注释,还支持多种语言和诸多翻译服务。
不论是学术研究者、技术文档收藏者,还是跨语言科学交流的爱好者,相信该工具都能满足你的需求。
废话不多说,先看官方效果图!


下面是骨哥随手测试的效果图:

翻译及排版效果一级棒!
功能亮点
保留元素
PDFMathTranslate 能完整保留原文中的学术公式、图表、目录及注释,从而确保学术内容的完整性和准确传达。
多语言支持
无论是论文还是科研报告,该工具支持将文档翻译为多种语言,包括英语、中文、法语等。
多服务兼容
工具兼容多个翻译服务,如Google、DeepL、腾讯翻译等,用户可以根据自己的需求选择合适的服务,实现精准翻译。
多方式使用
PDFMathTranslate 提供了多种使用方式,包括命令行工具、便携安装、图形交互界面以及容器化部署,用户可以根据自己的技术水平和使用场景灵活选择。
安装和使用
1. 命令行工具
确保安装了版本大于3.8且小于3.12的Python,运行以下命令安装并使用:
pip install pdf2zh
pdf2zh document.pdf
2. 便携安装
无需预先安装Python环境,下载 setup.bat 并双击运行即可。
3. 图形交互界面
同样需要Python环境,安装并运行以下命令即可在浏览器中使用:
pip install pdf2zh
pdf2zh -i
4. 容器化部署
使用Docker拉取镜像并运行:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
然后在浏览器中访问:http://localhost:7860/ 即可。
高级选项
在命令行中执行翻译命令,在当前工作目录下生成译文文档 example-mono.pdf 和双语对照文档 example-dual.pdf,默认使用 Google 翻译服务。
工具提供了丰富的配置选项,例如指定源语言和目标语言、设定翻译服务、输出目录等,以便用户根据具体需求进行更细致的控制和调整。如下表所示:
Option
Function
Example
files
本地文件
pdf2zh ~/local.pdf
links
在线文件
pdf2zh http://arxiv.org/paper.pdf
-i
进入图形界面
pdf2zh -i
-p
仅翻译部分文档
pdf2zh example.pdf -p 1
-li
源语言
pdf2zh example.pdf -li en
-lo
目标语言
pdf2zh example.pdf -lo zh
-s
指定翻译服务
pdf2zh example.pdf -s deepl
-t
多线程
pdf2zh example.pdf -t 1
-o
输出目录
pdf2zh example.pdf -o output
-f, -c
例外规则
pdf2zh example.pdf -f "(MS.*)"
--share
获取gradio公开链接
pdf2zh -i --share
--authorized
添加网页认证和自定义认证页
pdf2zh -i --authorized users.txt [auth.html]
--prompt
使用自定义的大模型prompt
pdf2zh --prompt [prompt.txt]
通过详细的配置选项,用户可以灵活的调整PDFMathTranslate的翻译行为,满足不同场景下的需求。
全文或指定页数翻译
全文翻译:
pdf2zh example.pdf部分翻译:
pdf2zh example.pdf -p 1-3,5
结语
无论是无缝保留原文信息的翻译效果,还是丰富的功能兼容性,以及简便的多种安装和使用方式,PDFMathTranslate都展示了其在科学文档翻译中的强大优势。如果你需要处理跨语言的PDF学术文档,那么这款工具将是你的不二选择。