MinerU0.14.1

大小:852.12MB

版本:0.14.1

语言:简中

更新:2026-06-11

资源说明

MinerU是一款十分优秀的智能数据提取软件,软件功能强大,操作简单易用,提供70多种语言,专注于PDF文档的高效解析,能够快速处理复杂的多模态 PDF 文档,如图片、表格、公式和脚注等,支持Markdown、content.json 和 listlayout.json 等多种输出格式,满足用户的使用需求,感兴趣的小伙伴赶快下载使用吧!

MinerU软件功能

1、删除页眉、页脚、脚注、页码等元素,保证语义连贯。

2、按照人类阅读顺序输出文本,适用于单栏、多栏和复杂排版。

3、保留原始文档的结构,包括标题、段落、列表等。

4、提取图像、图片说明、表格、表格标题和脚注。

MinerU0.14.1

5、自动识别文档中的公式并将其转换为LaTeX格式。

6、自动识别文档中的表格并将其转换为HTML格式。

7、自动检测扫描的PDF和失真的PDF,并启用OCR功能。

8、OCR支持109种语言的检测和识别。

MinerU0.14.1

9、支持多种输出格式,如多模态和NLP的Markdown、按阅读顺序排序的JSON、信息丰富的中间格式等。

10、支持多种可视化结果,包括布局可视化、跨度可视化等,便于高效确认输出效果和质量检查。

11、支持纯CPU环境,支持GPU(CUDA)/NPU(CANN)/MPS加速。

12、兼容Windows、Linux和Mac平台。

MinerU软件安装步骤

1、在本站下载软件安装包,点击我同意继续安装;

MinerU0.14.1

2、选择安装选项,点击下一步;

MinerU0.14.1

3、自定义选择安装位置,点击安装。

MinerU0.14.1

MinerU软件更新日志

2025/11/04 2.6.4 发布

为pdf渲染图片增加超时配置,默认为300秒,可通过环境变量MINERU_PDF_RENDER_TIMEOUT进行配置,防止部分异常pdf文件导致渲染过程长时间阻塞。

为onnx模型增加cpu线程数配置选项,默认为系统cpu核心数,可通过环境变量MINERU_INTRA_OP_NUM_THREADS和MINERU_INTER_OP_NUM_THREADS进行配置,以减少高并发场景下的对cpu资源的抢占冲突。

2025/10/31 2.6.3 发布

增加新后端vlm-mlx-engine支持,在Apple Silicon设备上支持使用MLX加速MinerU2.5模型推理,相比vlm-transformers后端,vlm-mlx-engine后端速度提升100%~200%。

bug修复: #3849 #3859

2025/10/24 2.6.2 发布

pipline后端优化

增加对中文公式的实验性支持,可通过配置环境变量export MINERU_FORMULA_CH_SUPPORT=1开启。该功能可能会导致MFR速率略微下降、部分长公式识别失败等问题,建议仅在需要解析中文公式的场景下开启。如需关闭该功能,可将环境变量设置为0。

OCR速度大幅提升200%~300%,感谢 @cjsdurj 提供的优化方案

OCR模型优化拉丁文识别的准度和广度,并更新西里尔文(cyrillic)、阿拉伯文(arabic)、天城文(devanagari)、泰卢固语(te)、泰米尔语(ta)语系至ppocr-v5版本,精度相比上代模型提升40%以上

vlm后端优化

table_caption、table_footnote匹配逻辑优化,提升页内多张连续表场景下的表格标题和脚注的匹配准确率和阅读顺序合理性

优化使用vllm后端时高并发时的cpu资源占用,降低服务端压力

适配vllm0.11.0版本

通用优化

跨页表格合并效果优化,新增跨页续表合并支持,提升在多列合并场景下的表格合并效果

为表格合并功能增加环境变量配置选项MINERU_TABLE_MERGE_ENABLE,表格合并功能默认开启,可通过设置该变量为0来关闭表格合并功能

2025/09/26 2.5.4 发布

MinerU2.5技术报告现已发布,欢迎阅读全面了解其模型架构、训练策略、数据工程和评测结果。

修复部分pdf文件被识别成ai文件导致无法解析的问题

2025/09/20 2.5.3 发布

依赖版本范围调整,使得Turing及更早架构显卡可以使用vLLM加速推理MinerU2.5模型。

pipeline后端对torch 2.8.0的一些兼容性修复。

降低vLLM异步后端默认的并发数,降低服务端压力以避免高压导致的链接关闭问题。

更多兼容性相关内容详见公告

其他版本
MinerU最新版

日期:2026-04-21

版本:0.10.0

点击查看
资源下载地址 安全无毒安全无毒
请选择任意下载地址进行下载
提示 温馨提示: 如果点击下载后没有反应或速度过慢等问题,请尝试更换下载地址或稍后再试。
相关软件
傲软数据恢复1.1.0.8

傲软数据恢复1.1.0.8

下载
傲软数据恢复———款功能十分强大的硬盘数据恢复软件,软件提供三种模式来帮助用户巧妙的恢复丢失文件。能够帮助用户轻松恢复各种丢失的文件数据,涵盖了各种常见的文件类型。
大小:1.78MB 时间:2026-06-08
数据恢复精灵4.6.0.473

数据恢复精灵4.6.0.473

下载
数据恢复精灵是一款非常实用的数据恢复软件,软件功能强大,操作简单易用,支持MBR与GPT分区类型,并支持FAT16、FAT32、NTFS、exFAT等文件系统,支持各种硬盘、RAID磁盘、各种U盘(优盘)、数码相机存储卡、手机内存卡上面的文件及分区恢复,满足用户的各种使用需求,有需要的小伙伴赶快下载使用吧!
大小:31.93MB 时间:2026-06-07
小白数据恢复1.1.0.14

小白数据恢复1.1.0.14

下载
小白数据恢复是一款专业的数据恢复软件,软件具有强大的文件恢复找回功能,支持上千种格式文件资料的恢复,可以完全恢复丢失的文件、图片、文档、视频、删除、格式化、分区丢失、操作系统崩溃、病毒攻击和其他数据丢失情况,需要的朋友快来下载吧!
大小:21.86MB 时间:2026-05-28
数据蛙1.0.6

数据蛙1.0.6

下载
数据蛙录屏软件,操作简单、功能实用、不限时长、声画同步,支持多模式、多格式、多音源、多种画质的屏幕录制软件。数据蛙录屏软件操作简单,功能强大,是录屏首选软件。数据蛙录屏软件,你值得选择。
大小:2.06MB 时间:2026-05-24
最新软件
小满壁纸v1.0.0.0

小满壁纸v1.0.0.0

下载
小满壁纸是一款简洁、流畅的电脑动态壁纸软件,汇集海量动静态壁纸持续更新,特色网页交互壁纸让你在桌面上流连忘返,细致分类和标签实现精准定位,2K4K高清壁纸赋予极致视觉体验,搭建属于自己独一无二的桌面,软件功能强大,对该软件感兴趣的朋友千万不要错过,快来一起下载使用吧!
大小:68.38MB 时间:2026-06-11
迅捷文字转语音软件64位1.7.6

迅捷文字转语音软件64位1.7.6

下载
迅捷文字转语音是一款集文字转语音,语音、录音转文字为一体的语音文字转换器软件,软件功能十分强大,支持多种格式文件导入和输出,还支持自定义设置普通女声、普通男声、情感女声、情感男声等多种语言类型以及音量、语速、语调等多种参数,快来下载吧!
大小:2.53MB 时间:2026-06-11
ToDeskLite4.7.1.4

ToDeskLite4.7.1.4

下载
ToDesk是一款由海南有趣科技有限公司开发的,安全、免费、不限速的远程控制软件。通过领先的网络技术搭建并运营自己的网络系统,拥有覆盖全球的多节点、多业务,毫秒级延时应用层路由系统,带给用户像使用本地电脑一样的体验感。
大小:10.63MB 时间:2026-06-11
华为云空间电脑版

华为云空间电脑版

下载
华为云空间是一款非常好用的文件云储存软件,软件操作简单易用,支持Win7 Sp1/Win10/Win11 系统,提供了一站式数据管理,点击首页管理快捷查看云空间占用详情,一键即可跳转进行管理,并可以对图库、备忘录、云盘等上传至云端的数据进行统一管理,还支持联系人、备忘录、图库、录音、云盘、查找我的手机、自动每7天自动备份一次设备内容等强大且实用功能,感兴趣的小伙伴赶快下载使用吧!
大小:294.22MB 时间:2026-06-11

玩家点评 0人参与,0条评论)

收藏
违法和不良信息举报
分享:

热门评论

全部评论

编辑推荐