手把手0基础Centos下安装与部署paddleOcr 教程

作者：半吊子全栈工匠2025.09.18 11:24浏览量：6

简介：零基础也能轻松上手！本文详细讲解CentOS系统下PaddleOCR的安装、配置及部署全流程，涵盖环境准备、依赖安装、代码下载、模型下载及简单使用示例。

手把手0基础Centos下安装与部署paddleOcr教程

摘要

本文是一篇针对零基础开发者的CentOS系统下PaddleOCR安装与部署教程。从环境准备、依赖安装到代码下载、模型下载，再到简单的使用示例，本文将详细阐述每一个步骤，确保读者能够轻松上手并成功部署PaddleOCR。

一、环境准备

1.1 确认CentOS版本

首先，我们需要确认自己的CentOS版本。可以通过以下命令查看：

cat /etc/redhat-release

PaddleOCR对CentOS 7及更高版本支持良好，因此建议使用CentOS 7或8。

1.2 更新系统

在开始安装之前，建议更新系统到最新状态：

sudo yum update -y

此命令将更新所有已安装的软件包到最新版本。

1.3 安装必要的工具

安装一些必要的工具，如wget、git和unzip，这些工具在后续的安装过程中会用到：

sudo yum install -y wget git unzip

二、安装Python环境

PaddleOCR需要Python环境支持，推荐使用Python 3.7或更高版本。我们可以通过以下步骤安装Python：

2.1 安装EPEL仓库

EPEL（Extra Packages for Enterprise Linux）是一个额外的软件包仓库，提供了许多不在默认仓库中的软件包。安装EPEL仓库：

sudo yum install -y epel-release

2.2 安装Python 3.7

通过EPEL仓库安装Python 3.7：

sudo yum install -y python37

安装完成后，可以通过以下命令验证：

python3.7 --version

2.3 安装pip

pip是Python的包管理工具，用于安装和管理Python包。安装pip：

curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python3.7 get-pip.py

安装完成后，可以通过以下命令验证：

pip3.7 --version

三、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架，因此需要先安装PaddlePaddle。

3.1 安装PaddlePaddle GPU版本（可选）

如果你的服务器有NVIDIA GPU，并且已经安装了CUDA和cuDNN，可以安装GPU版本的PaddlePaddle以获得更好的性能。首先，确认CUDA和cuDNN的版本，然后根据官方文档选择对应的PaddlePaddle版本进行安装。例如，安装CUDA 10.1和cuDNN 7.6对应的PaddlePaddle版本：

pip3.7 install paddlepaddle-gpu==2.0.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

3.2 安装PaddlePaddle CPU版本

如果没有GPU，或者只想在CPU上运行PaddleOCR，可以安装CPU版本的PaddlePaddle：

pip3.7 install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

安装完成后，可以通过以下命令验证：

python3.7 -c "import paddle; paddle.utils.run_check()"

如果输出“PaddlePaddle is installed successfully!”表示安装成功。

四、安装PaddleOCR

4.1 下载PaddleOCR代码

通过git克隆PaddleOCR的代码仓库：

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

4.2 安装依赖

PaddleOCR有一些额外的依赖，可以通过以下命令安装：

pip3.7 install -r requirements.txt

五、下载模型

PaddleOCR提供了预训练的模型，可以直接下载使用。在PaddleOCR目录下，有models目录，其中包含了各种预训练模型的下载链接。

5.1 下载中文OCR模型

例如，下载中文OCR模型（包括检测模型和识别模型）：

cd models
# 下载检测模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar
tar -xf ch_ppocr_mobile_v2.0_det_infer.tar
# 下载识别模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar
tar -xf ch_ppocr_mobile_v2.0_rec_infer.tar
cd ..

六、简单使用示例

6.1 图片文字检测与识别

使用PaddleOCR进行图片文字检测与识别非常简单。以下是一个简单的示例：

from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
# 读取图片并进行OCR
img_path = "your_image_path.jpg"  # 替换为你的图片路径
result = ocr.ocr(img_path, cls=True)
# 打印结果
for line in result:
    print(line)

将上述代码保存为ocr_example.py，然后运行：

python3.7 ocr_example.py

如果一切正常，你将看到图片中的文字被检测并识别出来。

6.2 批量处理图片

如果需要批量处理图片，可以编写一个简单的脚本：

import os
from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
# 图片目录
img_dir = "your_image_directory"  # 替换为你的图片目录
# 遍历图片目录并进行OCR
for img_name in os.listdir(img_dir):
    if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
        img_path = os.path.join(img_dir, img_name)
        result = ocr.ocr(img_path, cls=True)
        print(f"Image: {img_name}")
        for line in result:
            print(line)
        print("-" * 50)

将上述代码保存为batch_ocr.py，然后运行：

python3.7 batch_ocr.py

七、总结与展望

通过本文的详细步骤，我们成功地在CentOS系统下安装并部署了PaddleOCR。从环境准备、Python环境安装、PaddlePaddle安装到PaddleOCR代码下载、模型下载以及简单的使用示例，每一个步骤都进行了详细的阐述。

PaddleOCR作为一个强大的OCR工具，不仅支持多种语言，还提供了丰富的预训练模型，可以满足不同场景下的OCR需求。未来，随着深度学习技术的不断发展，PaddleOCR也将不断更新和优化，为用户提供更加高效、准确的OCR服务。

希望本文能够对零基础的开发者有所帮助，让大家能够轻松上手并成功部署PaddleOCR。如果在安装或使用过程中遇到任何问题，欢迎随时查阅官方文档或社区论坛，获取更多的帮助和支持。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

手把手0基础Centos下安装与部署paddleOcr 教程

手把手0基础Centos下安装与部署paddleOcr教程

摘要

一、环境准备

1.1 确认CentOS版本

1.2 更新系统

1.3 安装必要的工具

二、安装Python环境

2.1 安装EPEL仓库

2.2 安装Python 3.7

2.3 安装pip

三、安装PaddlePaddle

3.1 安装PaddlePaddle GPU版本（可选）

3.2 安装PaddlePaddle CPU版本

四、安装PaddleOCR

4.1 下载PaddleOCR代码

4.2 安装依赖

五、下载模型

5.1 下载中文OCR模型

六、简单使用示例

6.1 图片文字检测与识别

6.2 批量处理图片

七、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者