手把手0基础Centos下安装与部署paddleOcr 教程
2025.09.26 19:55浏览量:0简介:本文为0基础用户提供CentOS系统下PaddleOCR的完整安装与部署指南,涵盖环境准备、依赖安装、源码下载、模型下载及测试全流程,帮助用户快速实现OCR功能部署。
手把手0基础Centos下安装与部署PaddleOCR教程
引言
PaddleOCR是百度开源的一款高性能OCR工具库,支持中英文、多语言及复杂场景的文本识别。对于开发者而言,在CentOS服务器上部署PaddleOCR能够满足生产环境的需求。本文将针对0基础用户,提供详细的安装与部署指南,确保读者能够顺利完成环境搭建与功能测试。
一、环境准备
1.1 系统要求
- 操作系统:CentOS 7或CentOS 8(推荐使用CentOS 7,稳定性更高)。
- 内存:至少4GB(推荐8GB以上,模型加载与推理需要较大内存)。
- 磁盘空间:至少20GB(包含依赖库、模型文件及源码)。
- Python版本:3.6/3.7/3.8(PaddleOCR对Python版本有明确要求)。
1.2 网络配置
确保服务器能够访问外网,以便下载依赖库与模型文件。若服务器位于内网环境,需提前配置代理或离线安装包。
1.3 用户权限
建议使用非root用户操作,避免直接使用root权限导致系统风险。可通过sudo命令提权执行需要root权限的操作。
二、安装依赖库
2.1 更新系统
sudo yum update -y
此命令会更新所有已安装的软件包至最新版本,确保系统环境稳定。
2.2 安装基础工具
sudo yum install -y wget git vim
wget:用于下载文件。git:用于克隆PaddleOCR源码。vim:文本编辑器,用于修改配置文件。
2.3 安装Python与pip
CentOS默认安装的Python版本可能较旧,需手动安装Python 3.6+。
# 安装依赖sudo yum install -y gcc openssl-devel bzip2-devel libffi-devel zlib-devel wget# 下载Python 3.6.8源码wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tar.xz# 解压并编译安装tar -xf Python-3.6.8.tar.xzcd Python-3.6.8./configure --enable-optimizationsmake -j$(nproc)sudo make altinstall# 验证安装python3.6 --version
安装完成后,使用python3.6命令启动Python解释器。
2.4 安装PaddlePaddle
PaddleOCR依赖PaddlePaddle深度学习框架,需根据CUDA版本选择对应的安装命令。
CPU版本安装
python3.6 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
GPU版本安装(需提前安装CUDA与cuDNN)
# 示例:CUDA 10.1对应的PaddlePaddle版本python3.6 -m pip install paddlepaddle-gpu==2.1.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
安装完成后,验证PaddlePaddle是否安装成功:
import paddlepaddle.utils.run_check()
若输出PaddlePaddle is installed successfully!,则表示安装成功。
三、安装PaddleOCR
3.1 克隆源码
git clone https://github.com/PaddlePaddle/PaddleOCR.gitcd PaddleOCR
克隆完成后,进入项目目录。
3.2 安装Python依赖
python3.6 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple
此命令会安装PaddleOCR运行所需的所有Python库,包括opencv-python、shapely等。
四、下载模型文件
PaddleOCR提供了预训练模型,可直接下载使用。
# 下载中文OCR模型(包含检测与识别)cd PaddleOCR/mkdir -p inferencecd inferencewget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tarwget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tarwget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar# 解压模型tar -xf ch_ppocr_server_v2.0_det_infer.tartar -xf ch_ppocr_server_v2.0_rec_infer.tartar -xf ch_ppocr_mobile_v2.0_cls_infer.tar
解压后,inference目录下会生成det、rec、cls三个子目录,分别对应文本检测、文本识别与方向分类模型。
五、运行PaddleOCR
5.1 单张图片测试
python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg
-c:指定配置文件路径。-o:覆盖配置文件中的参数,如预训练模型路径与测试图片路径。
5.2 批量图片测试
修改配置文件configs/rec/rec_chinese_common_v2.0.yml,将Global.infer_imgs参数改为图片目录路径:
Global:infer_imgs: ./doc/imgs_words/ch/
然后运行:
python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model
5.3 端到端识别
若需同时进行文本检测与识别,可使用tools/infer_det_rec.py脚本:
python3.6 tools/infer_det_rec.py -c configs/det/det_mv3_db.yml configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_det_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg Global.rec_pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model
六、常见问题与解决方案
6.1 依赖冲突
若安装过程中出现依赖冲突,可使用pip install --ignore-installed命令强制安装。
6.2 模型下载失败
若模型下载失败,可手动从百度网盘下载后上传至服务器。
6.3 内存不足
若服务器内存不足,可尝试:
- 减少
batch_size参数值。 - 使用CPU版本PaddlePaddle。
- 升级服务器内存。
七、总结
本文详细介绍了在CentOS系统下从零开始安装与部署PaddleOCR的全过程,包括环境准备、依赖安装、源码下载、模型下载及测试。通过本文的指导,0基础用户也能够顺利完成PaddleOCR的部署,并实现文本检测与识别功能。在实际应用中,可根据需求调整模型与配置参数,以获得更好的识别效果。

发表评论
登录后可评论,请前往 登录 或 注册