前段时间有朋友问我,有没有免费的PDF翻译平台或本地化部署工具,今天被骨哥找到了!这是一款超过10K+ Star的开源项目—PDFMathTranslate
工具介绍
概述
PDFMathTranslate 是一款基于 AI 完整保留排版的 PDF 文档全文双语翻译,,同时提供 CLI/GUI/Docker等多种部署方式,其功能丰富,不仅能保留公式、图表、目录和注释,还支持多种语言和诸多翻译服务。
不论是学术研究者、技术文档收藏者,还是跨语言科学交流的爱好者,相信该工具都能满足你的需求。
废话不多说,先看官方效果图!
下面是骨哥随手测试的效果图:
翻译及排版效果一级棒!
功能亮点
保留元素
PDFMathTranslate 能完整保留原文中的学术公式、图表、目录及注释,从而确保学术内容的完整性和准确传达。
多语言支持
无论是论文还是科研报告,该工具支持将文档翻译为多种语言,包括英语、中文、法语等。
多服务兼容
工具兼容多个翻译服务,如Google、DeepL、腾讯翻译等,用户可以根据自己的需求选择合适的服务,实现精准翻译。
多方式使用
PDFMathTranslate 提供了多种使用方式,包括命令行工具、便携安装、图形交互界面以及容器化部署,用户可以根据自己的技术水平和使用场景灵活选择。
安装和使用
1. 命令行工具
确保安装了版本大于3.8且小于3.12的Python,运行以下命令安装并使用:
pip install pdf2zh
pdf2zh document.pdf
2. 便携安装
无需预先安装Python环境,下载 setup.bat 并双击运行即可。
3. 图形交互界面
同样需要Python环境,安装并运行以下命令即可在浏览器中使用:
pip install pdf2zh
pdf2zh -i
4. 容器化部署
使用Docker拉取镜像并运行:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
然后在浏览器中访问:http://localhost:7860/ 即可。
高级选项
在命令行中执行翻译命令,在当前工作目录下生成译文文档 example-mono.pdf 和双语对照文档 example-dual.pdf,默认使用 Google 翻译服务。
工具提供了丰富的配置选项,例如指定源语言和目标语言、设定翻译服务、输出目录等,以便用户根据具体需求进行更细致的控制和调整。如下表所示:
Option | Function | Example |
---|---|---|
files | 本地文件 | pdf2zh ~/local.pdf |
links | 在线文件 | pdf2zh http://arxiv.org/paper.pdf |
-i | 进入图形界面 | pdf2zh -i |
-p | 仅翻译部分文档 | pdf2zh example.pdf -p 1 |
-li | 源语言 | pdf2zh example.pdf -li en |
-lo | 目标语言 | pdf2zh example.pdf -lo zh |
-s | 指定翻译服务 | pdf2zh example.pdf -s deepl |
-t | 多线程 | pdf2zh example.pdf -t 1 |
-o | 输出目录 | pdf2zh example.pdf -o output |
-f, -c | 例外规则 | pdf2zh example.pdf -f "(MS.*)" |
–share | 获取gradio公开链接 | pdf2zh -i --share |
–authorized | 添加网页认证和自定义认证页 | pdf2zh -i --authorized users.txt [auth.html] |
–prompt | 使用自定义的大模型prompt | pdf2zh --prompt [prompt.txt] |
通过详细的配置选项,用户可以灵活的调整PDFMathTranslate的翻译行为,满足不同场景下的需求。
全文或指定页数翻译
-
全文翻译:
pdf2zh example.pdf
-
部分翻译:
pdf2zh example.pdf -p 1-3,5
结语
无论是无缝保留原文信息的翻译效果,还是丰富的功能兼容性,以及简便的多种安装和使用方式,PDFMathTranslate都展示了其在科学文档翻译中的强大优势。如果你需要处理跨语言的PDF学术文档,那么这款工具将是你的不二选择。