Mineru本地安装要点
-
1
git clone https://github.com/opendatalab/MinerU.git
-
1
cd MinerU
-
1
python -m venv .venv
-
1
.venv\scripts\activate.ps1
-
1
uv pip install -e .[core] # 安装核心组件,不含GPU加速
- 修改
magic_pdf.json
,将env的cuda
修改为cpu
- 终端运行:
bash mineru -p <源文件地址/文件名.pdf> -o <目标地址>
自动安装解析模型 - Docker部署运行:
-
1
cd .\projects\web-api
- 退出虚拟环境,修改
dockerfile
、app.py
、download_models.py
、entrypoint.sh
,在VS Code中将行尾符从CRLF修改为LF(Linux用) - 运行:
bash docker build -t mineru-api
如果Hugging Face中下载模型时间过长,将会终止报错,请执行如下程序:- 打开
download_models.py
,将模型下载路径修改:1 2
model_dir = snapshot_download(……, local_dir="./models/") layoutreader_model_dir = snapshot_download(……, local_dir="./models/layoutreader/")
- 打开
Dockerfile
,将下载改为拷贝本地文件:1 2 3
# Copy pre-downloaded models (删除原Run语句) COPY models/models /opt/models/ COPY models/layoutreader /opt/layoutreader/
- 进入虚拟环境中,运行:
bash python download_models.py
将模型下载到本地 -
1
deactivate
- 在第9步配置完Dify后,运行:
bash docker build -t mineru-api
- 打开
- 启动容器:
bash docker run -it -p 17777:8000 mineru-api
-
- 配置Dify环境
- 进入Dify的env,设置
FILES_URL=http://api:5001
,将docker-compose.yaml
内容相应调整,并打开dify-api
容器的ports: 5001:5001
外部映射端口 - 关闭重启Dify
- 进入Dify的env,设置
- 下载Mineru插件,授信地址为:
http://host.docker.internal:5001
,类型本地部署,密码不填。