logo

手把手0基础Centos下安装与部署paddleOcr 教程

作者:4042025.09.26 19:55浏览量:0

简介:本文为0基础用户提供CentOS系统下PaddleOCR的完整安装与部署指南,涵盖环境准备、依赖安装、源码下载、模型下载及测试全流程,帮助用户快速实现OCR功能部署。

手把手0基础Centos下安装与部署PaddleOCR教程

引言

PaddleOCR是百度开源的一款高性能OCR工具库,支持中英文、多语言及复杂场景的文本识别。对于开发者而言,在CentOS服务器上部署PaddleOCR能够满足生产环境的需求。本文将针对0基础用户,提供详细的安装与部署指南,确保读者能够顺利完成环境搭建与功能测试。

一、环境准备

1.1 系统要求

  • 操作系统:CentOS 7或CentOS 8(推荐使用CentOS 7,稳定性更高)。
  • 内存:至少4GB(推荐8GB以上,模型加载与推理需要较大内存)。
  • 磁盘空间:至少20GB(包含依赖库、模型文件及源码)。
  • Python版本:3.6/3.7/3.8(PaddleOCR对Python版本有明确要求)。

1.2 网络配置

确保服务器能够访问外网,以便下载依赖库与模型文件。若服务器位于内网环境,需提前配置代理或离线安装包。

1.3 用户权限

建议使用非root用户操作,避免直接使用root权限导致系统风险。可通过sudo命令提权执行需要root权限的操作。

二、安装依赖库

2.1 更新系统

  1. sudo yum update -y

此命令会更新所有已安装的软件包至最新版本,确保系统环境稳定。

2.2 安装基础工具

  1. sudo yum install -y wget git vim
  • wget:用于下载文件。
  • git:用于克隆PaddleOCR源码。
  • vim:文本编辑器,用于修改配置文件。

2.3 安装Python与pip

CentOS默认安装的Python版本可能较旧,需手动安装Python 3.6+。

  1. # 安装依赖
  2. sudo yum install -y gcc openssl-devel bzip2-devel libffi-devel zlib-devel wget
  3. # 下载Python 3.6.8源码
  4. wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tar.xz
  5. # 解压并编译安装
  6. tar -xf Python-3.6.8.tar.xz
  7. cd Python-3.6.8
  8. ./configure --enable-optimizations
  9. make -j$(nproc)
  10. sudo make altinstall
  11. # 验证安装
  12. python3.6 --version

安装完成后,使用python3.6命令启动Python解释器。

2.4 安装PaddlePaddle

PaddleOCR依赖PaddlePaddle深度学习框架,需根据CUDA版本选择对应的安装命令。

CPU版本安装

  1. python3.6 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

GPU版本安装(需提前安装CUDA与cuDNN)

  1. # 示例:CUDA 10.1对应的PaddlePaddle版本
  2. python3.6 -m pip install paddlepaddle-gpu==2.1.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装完成后,验证PaddlePaddle是否安装成功:

  1. import paddle
  2. paddle.utils.run_check()

若输出PaddlePaddle is installed successfully!,则表示安装成功。

三、安装PaddleOCR

3.1 克隆源码

  1. git clone https://github.com/PaddlePaddle/PaddleOCR.git
  2. cd PaddleOCR

克隆完成后,进入项目目录。

3.2 安装Python依赖

  1. python3.6 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

此命令会安装PaddleOCR运行所需的所有Python库,包括opencv-pythonshapely等。

四、下载模型文件

PaddleOCR提供了预训练模型,可直接下载使用。

  1. # 下载中文OCR模型(包含检测与识别)
  2. cd PaddleOCR/
  3. mkdir -p inference
  4. cd inference
  5. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar
  6. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar
  7. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
  8. # 解压模型
  9. tar -xf ch_ppocr_server_v2.0_det_infer.tar
  10. tar -xf ch_ppocr_server_v2.0_rec_infer.tar
  11. tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar

解压后,inference目录下会生成detreccls三个子目录,分别对应文本检测、文本识别与方向分类模型。

五、运行PaddleOCR

5.1 单张图片测试

  1. python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg
  • -c:指定配置文件路径。
  • -o:覆盖配置文件中的参数,如预训练模型路径与测试图片路径。

5.2 批量图片测试

修改配置文件configs/rec/rec_chinese_common_v2.0.yml,将Global.infer_imgs参数改为图片目录路径:

  1. Global:
  2. infer_imgs: ./doc/imgs_words/ch/

然后运行:

  1. python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model

5.3 端到端识别

若需同时进行文本检测与识别,可使用tools/infer_det_rec.py脚本:

  1. python3.6 tools/infer_det_rec.py -c configs/det/det_mv3_db.yml configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_det_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg Global.rec_pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model

六、常见问题与解决方案

6.1 依赖冲突

若安装过程中出现依赖冲突,可使用pip install --ignore-installed命令强制安装。

6.2 模型下载失败

若模型下载失败,可手动从百度网盘下载后上传至服务器。

6.3 内存不足

若服务器内存不足,可尝试:

  • 减少batch_size参数值。
  • 使用CPU版本PaddlePaddle。
  • 升级服务器内存。

七、总结

本文详细介绍了在CentOS系统下从零开始安装与部署PaddleOCR的全过程,包括环境准备、依赖安装、源码下载、模型下载及测试。通过本文的指导,0基础用户也能够顺利完成PaddleOCR的部署,并实现文本检测与识别功能。在实际应用中,可根据需求调整模型与配置参数,以获得更好的识别效果。

相关文章推荐

发表评论

活动