手把手0基础Centos下安装与部署paddleOcr教程

作者：Nicky2025.09.26 19:55浏览量：0

简介：本文为0基础开发者提供CentOS系统下PaddleOCR的完整安装部署指南，涵盖环境准备、依赖安装、源码编译、模型下载及测试验证全流程，附带常见问题解决方案。

手把手0基础Centos下安装与部署paddleOcr教程

引言

在人工智能技术快速发展的今天，OCR（光学字符识别）技术因其能够将图像中的文字信息转换为可编辑的文本格式而备受关注。PaddleOCR作为百度开源的一款高性能OCR工具库，凭借其优秀的识别准确率和丰富的功能特性，在业界得到了广泛应用。本文将针对0基础开发者，详细介绍如何在CentOS系统下安装与部署PaddleOCR，帮助读者快速上手这一强大工具。

一、环境准备

1.1 系统要求

操作系统：CentOS 7或更高版本（推荐使用CentOS 7.6+）
Python版本：Python 3.6及以上
CUDA与cuDNN（如需GPU加速）：CUDA 10.1/10.2/11.x 与对应版本的cuDNN

1.2 安装必要工具

# 更新系统软件包
sudo yum update -y
# 安装基础开发工具
sudo yum groupinstall "Development Tools" -y
# 安装Python3及相关依赖
sudo yum install python3 python3-devel -y
# 安装pip3（如果未随Python3一起安装）
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python3 get-pip.py

二、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架，因此首先需要安装PaddlePaddle。

2.1 CPU版本安装

# 使用pip安装CPU版本的PaddlePaddle
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

2.2 GPU版本安装（可选）

如果您的服务器配备了NVIDIA GPU，并且希望利用GPU加速OCR识别过程，可以安装GPU版本的PaddlePaddle。

# 首先确认CUDA和cuDNN版本
nvcc --version  # 查看CUDA版本
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2  # 查看cuDNN版本
# 根据CUDA版本选择对应的PaddlePaddle GPU版本安装命令
# 示例：CUDA 10.1下的安装命令
python3 -m pip install paddlepaddle-gpu==2.2.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

三、安装PaddleOCR

3.1 克隆PaddleOCR仓库

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

3.2 安装依赖库

# 进入PaddleOCR目录后，安装所需依赖
python3 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

3.3 下载预训练模型

PaddleOCR提供了多种预训练模型，包括中文、英文等多种语言的识别模型和方向分类器等。您可以从PaddleOCR的官方模型库下载所需的模型。

# 示例：下载中文OCR识别模型和方向分类器
mkdir -p inference/ch_PP-OCRv3_det_infer
mkdir -p inference/ch_PP-OCRv3_rec_infer
mkdir -p inference/ch_ppocr_mobile_v2.0_cls_infer
# 下载模型文件（这里以wget为例，实际下载链接需从PaddleOCR官方获取）
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_PP-OCRv3_det_infer/ch_PP-OCRv3_det_infer.tar -P inference/ch_PP-OCRv3_det_infer/
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_PP-OCRv3_rec_infer/ch_PP-OCRv3_rec_infer.tar -P inference/ch_PP-OCRv3_rec_infer/
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer/ch_ppocr_mobile_v2.0_cls_infer.tar -P inference/ch_ppocr_mobile_v2.0_cls_infer/
# 解压模型文件
cd inference/ch_PP-OCRv3_det_infer
tar xvf ch_PP-OCRv3_det_infer.tar && rm ch_PP-OCRv3_det_infer.tar
cd ../ch_PP-OCRv3_rec_infer
tar xvf ch_PP-OCRv3_rec_infer.tar && rm ch_PP-OCRv3_rec_infer.tar
cd ../ch_ppocr_mobile_v2.0_cls_infer
tar xvf ch_ppocr_mobile_v2.0_cls_infer.tar && rm ch_ppocr_mobile_v2.0_cls_infer.tar
cd ../..

四、运行PaddleOCR

4.1 单张图片识别

# 使用命令行工具进行单张图片识别
python3 tools/infer_rec.py -c configs/rec/rec_ch_PP-OCRv3_model.yml \
                           -o Global.pretrained_model=inference/ch_PP-OCRv3_rec_infer/ch_PP-OCRv3_rec_infer \
                           Global.infer_img=doc/imgs_words/ch/word_1.jpg

4.2 批量图片识别

若需批量识别图片，可以修改infer_rec.py脚本或使用提供的批量识别脚本。

4.3 使用Web服务（可选）

PaddleOCR还提供了Web服务接口，方便通过HTTP请求进行OCR识别。

# 启动Web服务
python3 web_service.py

启动后，您可以通过浏览器访问http://127.0.0.1:8866/，上传图片进行OCR识别。

五、常见问题与解决方案

5.1 依赖冲突

在安装过程中，可能会遇到依赖冲突的问题。这时，可以尝试使用虚拟环境来隔离项目依赖。

# 安装virtualenv
python3 -m pip install virtualenv
# 创建虚拟环境
virtualenv paddle_env
# 激活虚拟环境
source paddle_env/bin/activate
# 在虚拟环境中重新安装PaddlePaddle和PaddleOCR

5.2 CUDA版本不兼容

如果遇到CUDA版本不兼容的问题，请确保安装的PaddlePaddle版本与您的CUDA版本相匹配。可以参考PaddlePaddle官方文档中的版本对应表进行选择。

5.3 模型下载慢

由于模型文件较大，下载速度可能较慢。可以考虑使用国内镜像源或离线下载后上传至服务器。

六、总结与展望

通过本文的介绍，相信0基础的开发者也能够成功在CentOS系统下安装与部署PaddleOCR。PaddleOCR不仅提供了强大的OCR识别能力，还支持多种语言和场景的识别需求。未来，随着深度学习技术的不断发展，PaddleOCR将会在更多领域发挥重要作用。希望本文能成为您开启OCR技术之旅的一块敲门砖。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

手把手0基础Centos下安装与部署paddleOcr教程

手把手0基础Centos下安装与部署paddleOcr教程

引言

一、环境准备

1.1 系统要求

1.2 安装必要工具

二、安装PaddlePaddle

2.1 CPU版本安装

2.2 GPU版本安装（可选）

三、安装PaddleOCR

3.1 克隆PaddleOCR仓库

3.2 安装依赖库

3.3 下载预训练模型

四、运行PaddleOCR

4.1 单张图片识别

4.2 批量图片识别

4.3 使用Web服务（可选）

五、常见问题与解决方案

5.1 依赖冲突

5.2 CUDA版本不兼容

5.3 模型下载慢

六、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者