MinerU0.10.0

大小:363.06MB

版本:0.10.0

语言:简中

更新:2025-11-23

普通下载
360安全卫士下载
资源说明

MinerU是一款非常实用的智能数据提取软件,软件功能强大,操作简单易用,提供70多种语言,专注于PDF文档的高效解析,能够快速处理复杂的多模态 PDF 文档,如图片、表格、公式和脚注等,支持多种输出格式,包括 Markdown、content.json 和 listlayout.json 等,满足全球用户的需求,感兴趣的小伙伴赶快下载使用吧!

MinerU软件功能

1、删除页眉、页脚、脚注、页码等元素,保证语义连贯。

2、按照人类阅读顺序输出文本,适用于单栏、多栏和复杂排版。

3、保留原始文档的结构,包括标题、段落、列表等。

4、提取图像、图片说明、表格、表格标题和脚注。

MinerU0.10.0

5、自动识别文档中的公式并将其转换为LaTeX格式。

6、自动识别文档中的表格并将其转换为HTML格式。

7、自动检测扫描的PDF和失真的PDF,并启用OCR功能。

8、OCR支持109种语言的检测和识别。

MinerU0.10.0

9、支持多种输出格式,如多模态和NLP的Markdown、按阅读顺序排序的JSON、信息丰富的中间格式等。

10、支持多种可视化结果,包括布局可视化、跨度可视化等,便于高效确认输出效果和质量检查。

11、支持纯CPU环境,支持GPU(CUDA)/NPU(CANN)/MPS加速。

12、兼容Windows、Linux和Mac平台。

MinerU软件安装步骤

1、在本站下载软件安装包,点击我同意继续安装;

MinerU0.10.0

2、选择安装选项,点击下一步;

MinerU0.10.0

3、自定义选择安装位置,点击安装。

MinerU0.10.0

MinerU软件更新日志

2025/11/04 2.6.4 发布

为pdf渲染图片增加超时配置,默认为300秒,可通过环境变量MINERU_PDF_RENDER_TIMEOUT进行配置,防止部分异常pdf文件导致渲染过程长时间阻塞。

为onnx模型增加cpu线程数配置选项,默认为系统cpu核心数,可通过环境变量MINERU_INTRA_OP_NUM_THREADS和MINERU_INTER_OP_NUM_THREADS进行配置,以减少高并发场景下的对cpu资源的抢占冲突。

2025/10/31 2.6.3 发布

增加新后端vlm-mlx-engine支持,在Apple Silicon设备上支持使用MLX加速MinerU2.5模型推理,相比vlm-transformers后端,vlm-mlx-engine后端速度提升100%~200%。

bug修复: #3849 #3859

2025/10/24 2.6.2 发布

pipline后端优化

增加对中文公式的实验性支持,可通过配置环境变量export MINERU_FORMULA_CH_SUPPORT=1开启。该功能可能会导致MFR速率略微下降、部分长公式识别失败等问题,建议仅在需要解析中文公式的场景下开启。如需关闭该功能,可将环境变量设置为0。

OCR速度大幅提升200%~300%,感谢 @cjsdurj 提供的优化方案

OCR模型优化拉丁文识别的准度和广度,并更新西里尔文(cyrillic)、阿拉伯文(arabic)、天城文(devanagari)、泰卢固语(te)、泰米尔语(ta)语系至ppocr-v5版本,精度相比上代模型提升40%以上

vlm后端优化

table_caption、table_footnote匹配逻辑优化,提升页内多张连续表场景下的表格标题和脚注的匹配准确率和阅读顺序合理性

优化使用vllm后端时高并发时的cpu资源占用,降低服务端压力

适配vllm0.11.0版本

通用优化

跨页表格合并效果优化,新增跨页续表合并支持,提升在多列合并场景下的表格合并效果

为表格合并功能增加环境变量配置选项MINERU_TABLE_MERGE_ENABLE,表格合并功能默认开启,可通过设置该变量为0来关闭表格合并功能

2025/09/26 2.5.4 发布

MinerU2.5技术报告现已发布,欢迎阅读全面了解其模型架构、训练策略、数据工程和评测结果。

修复部分pdf文件被识别成ai文件导致无法解析的问题

2025/09/20 2.5.3 发布

依赖版本范围调整,使得Turing及更早架构显卡可以使用vLLM加速推理MinerU2.5模型。

pipeline后端对torch 2.8.0的一些兼容性修复。

降低vLLM异步后端默认的并发数,降低服务端压力以避免高压导致的链接关闭问题。

更多兼容性相关内容详见公告

软件合集更多

办公软件有哪些更多

办公软件在提高生产力、简化文件管理、促进团队合作和数据分析方面发挥着重要作用。办公软件大大提高了打工人们的工作效率。通过自动执行重复性任务和提供协作平台,办公软件减少了人为错误和时间浪费。下面就为大家推荐一些常用的办公软件。

相关软件
傲软数据恢复1.1.1.2

傲软数据恢复1.1.1.2

下载
傲软数据恢复是一款功能十分强大的硬盘数据恢复软件,软件提供三种模式来帮助用户巧妙的恢复丢失文件,具有一个简洁明了的界面并能让您的数据轻松无损恢复,即便是新手也能非常轻松的掌握如何恢复他们丢失的文件,有需求的朋友请下载使用。
大小:1.78MB 时间:2026-04-04
数据恢复精灵在线版

数据恢复精灵在线版

下载
数据恢复精灵软件是一款功能强大且简单易用的数据恢复软件,基于DiskGenius内核开发而成,它能让您迅速地恢复丢失的文件或分区,该软件界面简捷、容易上手,使用数据恢复精灵,您可以恢复丢失的分区,恢复误删除的文件,恢复误格式化的分区,以及恢复因各种原因造成的分区被破坏而无法打开的情况,对在线版有需求的用户快来下载吧!
大小:31.93MB 时间:2026-03-20
迷你兔数据恢复64位14.0.0

迷你兔数据恢复64位14.0.0

下载
迷你兔数据恢复是一款功能强大的数据恢复软件,软件恢复效率高,功能全面,界面美观,支持多种数据恢复,包括删除数据恢复、硬盘数据恢复、格式化恢复等,有兴趣的欢迎前来下载!
大小:80.69MB 时间:2026-02-23
福昕数据恢复1.0.10423.16

福昕数据恢复1.0.10423.16

下载
福昕数据恢复是一款数据文件恢复软件,软件支持恢复不同存储介质数据:硬盘、光盘、U盘/移动硬盘、数码相机、手机、Raid文件恢复等,能恢复包括文档、表格、图片、音视频等各种文件,感兴趣的朋友不妨一起来下载!
大小:45.23MB 时间:2026-02-14
最新软件
千牛官方正版

千牛官方正版

下载
千牛官方正版是一款非常实用的线上办公软件,软件操作简单易用,提供了实时店铺基础运营数据、网站地址栏、语音转文字、前沿商业媒体门户等实用功能,拥有整合各种店铺工具,批量上架,店铺装修,交易数据分析等等功能,能帮助您更快找到和联系客户,发布、管理商业信息和及时把握商机,满足用户的不同需求,大大提高开店效率,有需要的小伙伴快来下载使用吧!
大小:1.32MB 时间:2026-04-04
雷云3v1.0.83.111

雷云3v1.0.83.111

下载
雷云3是一款适配了雷蛇所有设备的配套软件工具,用户可以通过软件对雷蛇硬件设备的灯光效果、DPI等进行设置。非常方便快捷,软件界面简约,布局直观清晰。操作简单,容易上手,是一款十分实用的工具。
大小:4.07MB 时间:2026-04-04
Abyssmedia ID3 Tag Editor(音频标签编辑器)v4.0.0.0

Abyssmedia ID3 Tag Editor(音频标签编辑器)v4.0.0.0

下载
Abyssmedia ID3 Tag Editor(音频标签编辑器)v4.0.0.0是一款简易实用,功能全面的音频标签编辑器。软件能够帮助用户组织音乐收藏和编辑/复制/添加/删除音频文件中的元数据,软件还能自动识别未知歌曲的标题和艺术家。有喜欢的小伙伴快来下载吧!
大小:1.99MB 时间:2026-04-04
OKI MICROLINE 5150F针式打印机驱动1.0

OKI MICROLINE 5150F针式打印机驱动1.0

下载
《OKI MICROLINE 5150F针式打印机驱动》是一款非常好用的打印机驱动,该驱动能够帮助打印机的各项功能正常使用,软件界面简洁清爽,操作简单便捷,非常推荐下载,感兴趣的用户可以在本站下载体验。
大小:92KB 时间:2026-04-04

玩家点评 0人参与,0条评论)

收藏
违法和不良信息举报
分享:

热门评论

全部评论

热搜推荐
编辑推荐