logo

手把手0基础Centos下安装与部署paddleOcr教程

作者:Nicky2025.09.26 19:55浏览量:0

简介:本文为0基础开发者提供CentOS系统下PaddleOCR的完整安装部署指南,涵盖环境准备、依赖安装、源码编译、模型下载及测试验证全流程,附带常见问题解决方案。

手把手0基础Centos下安装与部署paddleOcr教程

引言

在人工智能技术快速发展的今天,OCR(光学字符识别)技术因其能够将图像中的文字信息转换为可编辑的文本格式而备受关注。PaddleOCR作为百度开源的一款高性能OCR工具库,凭借其优秀的识别准确率和丰富的功能特性,在业界得到了广泛应用。本文将针对0基础开发者,详细介绍如何在CentOS系统下安装与部署PaddleOCR,帮助读者快速上手这一强大工具。

一、环境准备

1.1 系统要求

  • 操作系统:CentOS 7或更高版本(推荐使用CentOS 7.6+)
  • Python版本:Python 3.6及以上
  • CUDA与cuDNN(如需GPU加速):CUDA 10.1/10.2/11.x 与对应版本的cuDNN

1.2 安装必要工具

  1. # 更新系统软件包
  2. sudo yum update -y
  3. # 安装基础开发工具
  4. sudo yum groupinstall "Development Tools" -y
  5. # 安装Python3及相关依赖
  6. sudo yum install python3 python3-devel -y
  7. # 安装pip3(如果未随Python3一起安装)
  8. curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
  9. python3 get-pip.py

二、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架,因此首先需要安装PaddlePaddle。

2.1 CPU版本安装

  1. # 使用pip安装CPU版本的PaddlePaddle
  2. python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

2.2 GPU版本安装(可选)

如果您的服务器配备了NVIDIA GPU,并且希望利用GPU加速OCR识别过程,可以安装GPU版本的PaddlePaddle。

  1. # 首先确认CUDA和cuDNN版本
  2. nvcc --version # 查看CUDA版本
  3. cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 # 查看cuDNN版本
  4. # 根据CUDA版本选择对应的PaddlePaddle GPU版本安装命令
  5. # 示例:CUDA 10.1下的安装命令
  6. python3 -m pip install paddlepaddle-gpu==2.2.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

三、安装PaddleOCR

3.1 克隆PaddleOCR仓库

  1. git clone https://github.com/PaddlePaddle/PaddleOCR.git
  2. cd PaddleOCR

3.2 安装依赖库

  1. # 进入PaddleOCR目录后,安装所需依赖
  2. python3 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

3.3 下载预训练模型

PaddleOCR提供了多种预训练模型,包括中文、英文等多种语言的识别模型和方向分类器等。您可以从PaddleOCR的官方模型库下载所需的模型。

  1. # 示例:下载中文OCR识别模型和方向分类器
  2. mkdir -p inference/ch_PP-OCRv3_det_infer
  3. mkdir -p inference/ch_PP-OCRv3_rec_infer
  4. mkdir -p inference/ch_ppocr_mobile_v2.0_cls_infer
  5. # 下载模型文件(这里以wget为例,实际下载链接需从PaddleOCR官方获取)
  6. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_PP-OCRv3_det_infer/ch_PP-OCRv3_det_infer.tar -P inference/ch_PP-OCRv3_det_infer/
  7. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_PP-OCRv3_rec_infer/ch_PP-OCRv3_rec_infer.tar -P inference/ch_PP-OCRv3_rec_infer/
  8. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer/ch_ppocr_mobile_v2.0_cls_infer.tar -P inference/ch_ppocr_mobile_v2.0_cls_infer/
  9. # 解压模型文件
  10. cd inference/ch_PP-OCRv3_det_infer
  11. tar xvf ch_PP-OCRv3_det_infer.tar && rm ch_PP-OCRv3_det_infer.tar
  12. cd ../ch_PP-OCRv3_rec_infer
  13. tar xvf ch_PP-OCRv3_rec_infer.tar && rm ch_PP-OCRv3_rec_infer.tar
  14. cd ../ch_ppocr_mobile_v2.0_cls_infer
  15. tar xvf ch_ppocr_mobile_v2.0_cls_infer.tar && rm ch_ppocr_mobile_v2.0_cls_infer.tar
  16. cd ../..

四、运行PaddleOCR

4.1 单张图片识别

  1. # 使用命令行工具进行单张图片识别
  2. python3 tools/infer_rec.py -c configs/rec/rec_ch_PP-OCRv3_model.yml \
  3. -o Global.pretrained_model=inference/ch_PP-OCRv3_rec_infer/ch_PP-OCRv3_rec_infer \
  4. Global.infer_img=doc/imgs_words/ch/word_1.jpg

4.2 批量图片识别

若需批量识别图片,可以修改infer_rec.py脚本或使用提供的批量识别脚本。

4.3 使用Web服务(可选)

PaddleOCR还提供了Web服务接口,方便通过HTTP请求进行OCR识别。

  1. # 启动Web服务
  2. python3 web_service.py

启动后,您可以通过浏览器访问http://127.0.0.1:8866/,上传图片进行OCR识别。

五、常见问题与解决方案

5.1 依赖冲突

在安装过程中,可能会遇到依赖冲突的问题。这时,可以尝试使用虚拟环境来隔离项目依赖。

  1. # 安装virtualenv
  2. python3 -m pip install virtualenv
  3. # 创建虚拟环境
  4. virtualenv paddle_env
  5. # 激活虚拟环境
  6. source paddle_env/bin/activate
  7. # 在虚拟环境中重新安装PaddlePaddle和PaddleOCR

5.2 CUDA版本不兼容

如果遇到CUDA版本不兼容的问题,请确保安装的PaddlePaddle版本与您的CUDA版本相匹配。可以参考PaddlePaddle官方文档中的版本对应表进行选择。

5.3 模型下载慢

由于模型文件较大,下载速度可能较慢。可以考虑使用国内镜像源或离线下载后上传至服务器。

六、总结与展望

通过本文的介绍,相信0基础的开发者也能够成功在CentOS系统下安装与部署PaddleOCR。PaddleOCR不仅提供了强大的OCR识别能力,还支持多种语言和场景的识别需求。未来,随着深度学习技术的不断发展,PaddleOCR将会在更多领域发挥重要作用。希望本文能成为您开启OCR技术之旅的一块敲门砖。

相关文章推荐

发表评论

活动