Windows 平台本地翻译双语电子书方案

在「小众软件」论坛看到了新的开源翻译项目: GitHub - xxnuo/MTranServer: Low-resource, fast, and privately self-host free version of Google Translate - 低占用速度快可私有部署的自由版 Google 翻译

一个超低资源消耗超快的离线翻译服务器,仅需 CPU + 1G 内存即可运行,无需 GPU。单个请求平均响应时间 50ms。支持全世界主要语言的翻译。

翻译质量与 Google 翻译相当。

注意本模型专注于速度和多种设备私有部署,所以翻译质量肯定是不如大模型翻译的效果。需要高质量的翻译建议使用在线大模型 API。

那么在 AMD64 Windows 端直接使用 Calibre/Pandoc 转换 EPUB 文件至 HTML 格式(如此或将丢排版,自行取舍)再浏览器打开,使用「沉浸式翻译」/「简约翻译」接入这个本地 Docker 部署的模型(这部分在项目 README 已有提及),即可获得与 《 将外文电子书翻译成双语对照版本,并在任何设备上阅读 | #UNTAG 》类似的效果。

不过我自己是暂时懒得试的,期待一手大伙的使用反馈(

1 个赞

感谢推荐!看了简介,确实是完成度很高的一个项目,你提到的思路应该是完全可行的。

我之前用 LibreTranslate 实现了 RSS 标题的纯本地自动翻译——《FreshRSS 插件配合 LibreTranslate 实现纯本地的 RSS 标题翻译》。我感觉只要稍作调整(主要是插件的支持)就能用到 RSS 的翻译上。

测试了使用在线翻译的方法:

  1. 使用 Pandoc 可以保留引用图片的路径,直接 pandoc input.epub -o output.html ,再将得到的 HTML 剪切到 EPUB 解压的文件夹中即可,可以应对 EPUB 中的 HTML 不是 0001.html 0002.html 而是 coyright.html append.html 的情况
  2. 浏览器打开 output.html 然后启动 简约翻译,中键点击开个自动滚动,然后去冲杯咖啡:smiling_face:
  3. 翻译完的整个页面 translated.html 可以直接保存,也可以全选:arrow_right:查看源代码,然后把源代码复制到新文件,应该仅影响后面转换时是否需要把 translated.html 移动到 EPUB 解压出的文件夹。
  4. translated.html 转换为 EPUB 我更推荐使用 Calibre 的 ebook-convert.exe ,因其可自动检测页面大小并分页,而使用 Pandoc 时我使用 --split-level 参数没有成功分页(之前用来转换 Org-Mode、markdown 倒是 OK 的)。
  5. 如果转换完希望调整元数据、封面也可使用 Calibre 的 ebook-polish.exe

BTW,@yarinzhang 回帖的通知邮件发送了 5 封,不知道出了什么错

1 个赞

很有价值的分享!

邮件重复发送的问题我来看一下