logo

手把手0基础Centos下安装与部署paddleOcr 教程

作者:谁偷走了我的奶酪2025.09.18 11:24浏览量:0

简介:本文为零基础用户提供CentOS系统下安装与部署PaddleOCR的详细教程,涵盖环境准备、依赖安装、代码下载、模型下载及测试验证全流程,助力快速上手OCR开发。

手把手0基础Centos下安装与部署paddleOcr教程

引言

PaddleOCR是百度开源的一款基于深度学习的OCR(Optical Character Recognition,光学字符识别)工具库,支持多种语言的文本检测与识别。对于需要在CentOS系统上部署OCR服务的开发者来说,掌握PaddleOCR的安装与部署是关键一步。本文将详细介绍如何在CentOS环境下,从零开始安装并部署PaddleOCR,适合没有相关经验的开发者参考。

环境准备

1. 系统要求

  • 操作系统:CentOS 7或更高版本。
  • Python版本:推荐Python 3.6及以上版本。
  • CUDA与cuDNN(如需GPU加速):根据GPU型号安装对应的CUDA和cuDNN版本。

2. 安装依赖

在CentOS上安装必要的依赖包,包括但不限于:

  1. sudo yum install -y epel-release
  2. sudo yum install -y python3 python3-devel python3-pip gcc git wget

如果计划使用GPU加速,还需安装NVIDIA驱动、CUDA和cuDNN。具体安装步骤可参考NVIDIA官方文档

安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架。根据是否使用GPU,选择相应的安装命令。

CPU版本安装

  1. python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

GPU版本安装

首先确认CUDA和cuDNN已正确安装,然后根据CUDA版本选择合适的PaddlePaddle GPU版本安装命令,例如:

  1. # 假设CUDA版本为10.2
  2. python3 -m pip install paddlepaddle-gpu==2.2.2.post102 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装完成后,可通过以下命令验证安装是否成功:

  1. python3 -c "import paddle; paddle.utils.run_check()"

安装PaddleOCR

1. 克隆PaddleOCR仓库

  1. git clone https://github.com/PaddlePaddle/PaddleOCR.git
  2. cd PaddleOCR

2. 安装PaddleOCR依赖

  1. python3 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

下载预训练模型

PaddleOCR提供了多种语言的预训练模型,可根据需求下载。例如,下载中文OCR模型:

  1. # 下载中文文本检测模型
  2. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_train.tar
  3. tar xvf ch_ppocr_mobile_v2.0_det_train.tar
  4. mv ch_ppocr_mobile_v2.0_det_train inference/det_db
  5. # 下载中文文本识别模型
  6. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_train.tar
  7. tar xvf ch_ppocr_mobile_v2.0_rec_train.tar
  8. mv ch_ppocr_mobile_v2.0_rec_train inference/rec_crnn
  9. # 下载中文方向分类器(可选)
  10. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
  11. tar xvf ch_ppocr_mobile_v2.0_cls_train.tar
  12. mv ch_ppocr_mobile_v2.0_cls_train inference/cls

配置与运行

1. 配置文件修改

根据实际需求修改configs/目录下的配置文件,例如ppocr/utils/ppocr_keys_v1.txt为识别字典文件,configs/det/det_mv3_db.yml为检测模型配置文件等。

2. 运行OCR

图像文本检测与识别

  1. python3 tools/infer_rec.py -c configs/rec/rec_icdar15_train.yml -o Global.pretrained_model=inference/rec_crnn/best_accuracy Global.infer_img=doc/imgs_words/ch/word_1.jpg

-o Global.infer_img=后的路径替换为待识别图片的路径。

批量处理图片

若需批量处理图片,可编写脚本遍历图片目录,调用PaddleOCR进行识别。示例脚本(batch_infer.py):

  1. import os
  2. from paddleocr import PaddleOCR
  3. # 初始化PaddleOCR
  4. ocr = PaddleOCR(use_angle_cls=True, lang="ch") # 使用中文模型
  5. # 图片目录
  6. img_dir = "path/to/your/images"
  7. # 遍历目录,处理每张图片
  8. for img_name in os.listdir(img_dir):
  9. if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
  10. img_path = os.path.join(img_dir, img_name)
  11. result = ocr.ocr(img_path, cls=True)
  12. for line in result:
  13. print(line)

运行脚本:

  1. python3 batch_infer.py

性能优化与调试

1. 性能优化

  • 使用GPU加速:确保已正确安装CUDA和cuDNN,并在PaddleOCR初始化时指定use_gpu=True
  • 模型裁剪与量化:PaddleOCR支持模型裁剪和量化,可减小模型体积,提高推理速度。
  • 批量处理:对于大量图片,采用批量处理方式可提高效率。

2. 调试技巧

  • 日志查看:PaddleOCR提供了详细的日志输出,可通过修改配置文件中的日志级别来调整日志详细程度。
  • 可视化工具:利用PaddleOCR的可视化工具,如tools/plot_bbox.py,可直观查看检测结果。
  • 错误排查:遇到错误时,首先检查依赖是否安装完整,配置文件是否正确,再根据错误信息逐步排查。

结论

通过本文的详细步骤,即使是没有相关经验的开发者也能在CentOS系统上成功安装并部署PaddleOCR。PaddleOCR的强大功能使其在多种OCR应用场景中表现出色,无论是文本检测、识别还是方向分类,都能提供高效准确的解决方案。希望本文能为你的OCR开发之路提供有力支持。

相关文章推荐

发表评论