随记体验 · 2024年12月23日 0

【优秀开源推荐】一款基于AI的PDF文档翻译神器!

前段时间有朋友问我,有没有免费的PDF翻译平台或本地化部署工具,今天被骨哥找到了!这是一款超过10K+ Star的开源项目—PDFMathTranslate

工具介绍

概述

PDFMathTranslate 是一款基于 AI 完整保留排版的 PDF 文档全文双语翻译,,同时提供 CLI/GUI/Docker等多种部署方式,其功能丰富,不仅能保留公式、图表、目录和注释,还支持多种语言和诸多翻译服务。

不论是学术研究者、技术文档收藏者,还是跨语言科学交流的爱好者,相信该工具都能满足你的需求。

废话不多说,先看官方效果图!

file

file

下面是骨哥随手测试的效果图:

file

翻译及排版效果一级棒!

功能亮点

保留元素

PDFMathTranslate 能完整保留原文中的学术公式、图表、目录及注释,从而确保学术内容的完整性和准确传达。

多语言支持

无论是论文还是科研报告,该工具支持将文档翻译为多种语言,包括英语、中文、法语等。

多服务兼容

工具兼容多个翻译服务,如Google、DeepL、腾讯翻译等,用户可以根据自己的需求选择合适的服务,实现精准翻译。

多方式使用

PDFMathTranslate 提供了多种使用方式,包括命令行工具、便携安装、图形交互界面以及容器化部署,用户可以根据自己的技术水平和使用场景灵活选择。

安装和使用

1. 命令行工具

确保安装了版本大于3.8且小于3.12的Python,运行以下命令安装并使用:

pip install pdf2zh
pdf2zh document.pdf
2. 便携安装

无需预先安装Python环境,下载 setup.bat 并双击运行即可。

3. 图形交互界面

同样需要Python环境,安装并运行以下命令即可在浏览器中使用:

pip install pdf2zh
pdf2zh -i
4. 容器化部署

使用Docker拉取镜像并运行:

docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh

然后在浏览器中访问:http://localhost:7860/ 即可。

高级选项

在命令行中执行翻译命令,在当前工作目录下生成译文文档 example-mono.pdf 和双语对照文档 example-dual.pdf,默认使用 Google 翻译服务。

工具提供了丰富的配置选项,例如指定源语言和目标语言、设定翻译服务、输出目录等,以便用户根据具体需求进行更细致的控制和调整。如下表所示:

Option Function Example
files 本地文件 pdf2zh ~/local.pdf
links 在线文件 pdf2zh http://arxiv.org/paper.pdf
-i 进入图形界面 pdf2zh -i
-p 仅翻译部分文档 pdf2zh example.pdf -p 1
-li 源语言 pdf2zh example.pdf -li en
-lo 目标语言 pdf2zh example.pdf -lo zh
-s 指定翻译服务 pdf2zh example.pdf -s deepl
-t 多线程 pdf2zh example.pdf -t 1
-o 输出目录 pdf2zh example.pdf -o output
-f, -c 例外规则 pdf2zh example.pdf -f "(MS.*)"
–share 获取gradio公开链接 pdf2zh -i --share
–authorized 添加网页认证和自定义认证页 pdf2zh -i --authorized users.txt [auth.html]
–prompt 使用自定义的大模型prompt pdf2zh --prompt [prompt.txt]

通过详细的配置选项,用户可以灵活的调整PDFMathTranslate的翻译行为,满足不同场景下的需求。

全文或指定页数翻译

  • 全文翻译:
    pdf2zh example.pdf

  • 部分翻译:
    pdf2zh example.pdf -p 1-3,5

结语

无论是无缝保留原文信息的翻译效果,还是丰富的功能兼容性,以及简便的多种安装和使用方式,PDFMathTranslate都展示了其在科学文档翻译中的强大优势。如果你需要处理跨语言的PDF学术文档,那么这款工具将是你的不二选择。

在线演示:(https://pdf2zh.com/),体验便捷高效的文档翻译服务吧

GitHub地址:https://github.com/Byaidu/PDFMathTranslate