MinerU 3:文档提取演示

开源文档提取工具,支持将 PDF、DOCX、PPTX、XLSX 和图片转换为 Markdown 与 JSON。
如果我们的项目对你有帮助,请点亮 ⭐️ 支持我们! GitHub 星标

Backend

High-precision hybrid parsing, supports multiple languages.

1 25
等待任务
准备请求
检查服务
提交任务
排队
解析中
下载结果
整理输出
完成
上传文件后开始转换。
{}
Examples

If disabled, tables will be shown as images.

If disabled, inline formulas will not be detected or parsed.

If disabled, image/chart blocks will keep layout positions but skip VLM image/chart analysis.

OCR Language

Select the OCR language for image-based PDFs and images.

Enable only if the result is extremely poor. Requires correct OCR language.