手把手0基础Centos下安装与部署paddleOcr 教程

作者：4042025.09.26 19:55浏览量：0

简介：本文为0基础用户提供CentOS系统下PaddleOCR的完整安装与部署指南，涵盖环境准备、依赖安装、源码下载、模型下载及测试全流程，帮助用户快速实现OCR功能部署。

手把手0基础Centos下安装与部署PaddleOCR教程

引言

PaddleOCR是百度开源的一款高性能OCR工具库，支持中英文、多语言及复杂场景的文本识别。对于开发者而言，在CentOS服务器上部署PaddleOCR能够满足生产环境的需求。本文将针对0基础用户，提供详细的安装与部署指南，确保读者能够顺利完成环境搭建与功能测试。

一、环境准备

1.1 系统要求

操作系统：CentOS 7或CentOS 8（推荐使用CentOS 7，稳定性更高）。
内存：至少4GB（推荐8GB以上，模型加载与推理需要较大内存）。
磁盘空间：至少20GB（包含依赖库、模型文件及源码）。
Python版本：3.6/3.7/3.8（PaddleOCR对Python版本有明确要求）。

1.2 网络配置

确保服务器能够访问外网，以便下载依赖库与模型文件。若服务器位于内网环境，需提前配置代理或离线安装包。

1.3 用户权限

建议使用非root用户操作，避免直接使用root权限导致系统风险。可通过sudo命令提权执行需要root权限的操作。

二、安装依赖库

2.1 更新系统

sudo yum update -y

此命令会更新所有已安装的软件包至最新版本，确保系统环境稳定。

2.2 安装基础工具

sudo yum install -y wget git vim

wget：用于下载文件。
git：用于克隆PaddleOCR源码。
vim：文本编辑器，用于修改配置文件。

2.3 安装Python与pip

CentOS默认安装的Python版本可能较旧，需手动安装Python 3.6+。

# 安装依赖
sudo yum install -y gcc openssl-devel bzip2-devel libffi-devel zlib-devel wget
# 下载Python 3.6.8源码
wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tar.xz
# 解压并编译安装
tar -xf Python-3.6.8.tar.xz
cd Python-3.6.8
./configure --enable-optimizations
make -j$(nproc)
sudo make altinstall
# 验证安装
python3.6 --version

安装完成后，使用python3.6命令启动Python解释器。

2.4 安装PaddlePaddle

PaddleOCR依赖PaddlePaddle深度学习框架，需根据CUDA版本选择对应的安装命令。

CPU版本安装

python3.6 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

GPU版本安装（需提前安装CUDA与cuDNN）

# 示例：CUDA 10.1对应的PaddlePaddle版本
python3.6 -m pip install paddlepaddle-gpu==2.1.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装完成后，验证PaddlePaddle是否安装成功：

import paddle
paddle.utils.run_check()

若输出PaddlePaddle is installed successfully!，则表示安装成功。

三、安装PaddleOCR

3.1 克隆源码

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

克隆完成后，进入项目目录。

3.2 安装Python依赖

python3.6 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

此命令会安装PaddleOCR运行所需的所有Python库，包括opencv-python、shapely等。

四、下载模型文件

PaddleOCR提供了预训练模型，可直接下载使用。

# 下载中文OCR模型（包含检测与识别）
cd PaddleOCR/
mkdir -p inference
cd inference
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
# 解压模型
tar -xf ch_ppocr_server_v2.0_det_infer.tar
tar -xf ch_ppocr_server_v2.0_rec_infer.tar
tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar

解压后，inference目录下会生成det、rec、cls三个子目录，分别对应文本检测、文本识别与方向分类模型。

五、运行PaddleOCR

5.1 单张图片测试

python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg

-c：指定配置文件路径。
-o：覆盖配置文件中的参数，如预训练模型路径与测试图片路径。

5.2 批量图片测试

修改配置文件configs/rec/rec_chinese_common_v2.0.yml，将Global.infer_imgs参数改为图片目录路径：

Global:
  infer_imgs: ./doc/imgs_words/ch/

然后运行：

python3.6 tools/infer_rec.py -c configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model

5.3 端到端识别

若需同时进行文本检测与识别，可使用tools/infer_det_rec.py脚本：

python3.6 tools/infer_det_rec.py -c configs/det/det_mv3_db.yml configs/rec/rec_chinese_common_v2.0.yml -o Global.pretrained_model=./inference/ch_ppocr_server_v2.0_det_infer/model Global.infer_img=doc/imgs_words/ch/word_1.jpg Global.rec_pretrained_model=./inference/ch_ppocr_server_v2.0_rec_infer/model

六、常见问题与解决方案

6.1 依赖冲突

若安装过程中出现依赖冲突，可使用pip install --ignore-installed命令强制安装。

6.2 模型下载失败

若模型下载失败，可手动从百度网盘下载后上传至服务器。

6.3 内存不足

若服务器内存不足，可尝试：

减少batch_size参数值。
使用CPU版本PaddlePaddle。
升级服务器内存。

七、总结

本文详细介绍了在CentOS系统下从零开始安装与部署PaddleOCR的全过程，包括环境准备、依赖安装、源码下载、模型下载及测试。通过本文的指导，0基础用户也能够顺利完成PaddleOCR的部署，并实现文本检测与识别功能。在实际应用中，可根据需求调整模型与配置参数，以获得更好的识别效果。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询