Marker:一个能够快速且准确地将...
发布时间 :2023-12-05 08:00:00
Marker:一个能够快速且准确地将 PDF、EPUB 和 MOBI 文档转换成 Markdown 格式的工具。
该工具有如下特点:
- 能够处理各种类型的 PDF 文件,特别是针对书籍和学术论文进行了优化;
- 自动去除文档中的非主要元素,如页眉和页脚;
- 能够将大部分的数学方程公式转换成 LaTeX 格式;
- 对代码块和表格进行格式化处理;
- 支持多种语言,尽管大部分测试语言为英语;
- 可以在不同的计算环境下运行,包括 GPU、CPU 或 MPS。
GitHub:github.com/VikParuchuri/marker
作者声称:转换速度比 Nougat 快 10 倍,且在非专业领域文档上的准确性更高。
Nougat 是 Meta AI 推出的一个 OCR 神器,可以轻松将 PDF 文档转换为 MultiMarkdown,尤其擅长复杂数学公式。
更多 Nougat 介绍可看:facebookresearch.github.io/nougat/
南归线上
南归线上
回复 Canis凯尼斯:其实可以试试wsl
linux配置也挺方便的
Canis凯尼斯
回复 南归线上:我想转转openai的论文,都是英文的。我在hugging face上面找了下nougat,发现也不太会用![[泪]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_lei-4cdf6ee412.png)
偶尔围观
Marker:一个能够快速且准确地将 PDF、EPUB 和 MOBI 文档转换成 Markdown 格式的工具。
星球特曼
📝
歪思日记
这个必须get
帕斯捷尔纳克_
转发微博
拥抱自然Lee
转发微博