logo

手把手0基础Centos下安装与部署paddleOcr 教程

作者:半吊子全栈工匠2025.09.18 11:24浏览量:0

简介:零基础也能轻松上手!本文详细讲解CentOS系统下PaddleOCR的安装、配置及部署全流程,涵盖环境准备、依赖安装、代码下载、模型下载及简单使用示例。

手把手0基础Centos下安装与部署paddleOcr教程

摘要

本文是一篇针对零基础开发者的CentOS系统下PaddleOCR安装与部署教程。从环境准备、依赖安装到代码下载、模型下载,再到简单的使用示例,本文将详细阐述每一个步骤,确保读者能够轻松上手并成功部署PaddleOCR。

一、环境准备

1.1 确认CentOS版本

首先,我们需要确认自己的CentOS版本。可以通过以下命令查看:

  1. cat /etc/redhat-release

PaddleOCR对CentOS 7及更高版本支持良好,因此建议使用CentOS 7或8。

1.2 更新系统

在开始安装之前,建议更新系统到最新状态:

  1. sudo yum update -y

此命令将更新所有已安装的软件包到最新版本。

1.3 安装必要的工具

安装一些必要的工具,如wgetgitunzip,这些工具在后续的安装过程中会用到:

  1. sudo yum install -y wget git unzip

二、安装Python环境

PaddleOCR需要Python环境支持,推荐使用Python 3.7或更高版本。我们可以通过以下步骤安装Python:

2.1 安装EPEL仓库

EPEL(Extra Packages for Enterprise Linux)是一个额外的软件包仓库,提供了许多不在默认仓库中的软件包。安装EPEL仓库:

  1. sudo yum install -y epel-release

2.2 安装Python 3.7

通过EPEL仓库安装Python 3.7:

  1. sudo yum install -y python37

安装完成后,可以通过以下命令验证:

  1. python3.7 --version

2.3 安装pip

pip是Python的包管理工具,用于安装和管理Python包。安装pip:

  1. curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
  2. python3.7 get-pip.py

安装完成后,可以通过以下命令验证:

  1. pip3.7 --version

三、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架,因此需要先安装PaddlePaddle。

3.1 安装PaddlePaddle GPU版本(可选)

如果你的服务器有NVIDIA GPU,并且已经安装了CUDA和cuDNN,可以安装GPU版本的PaddlePaddle以获得更好的性能。首先,确认CUDA和cuDNN的版本,然后根据官方文档选择对应的PaddlePaddle版本进行安装。例如,安装CUDA 10.1和cuDNN 7.6对应的PaddlePaddle版本:

  1. pip3.7 install paddlepaddle-gpu==2.0.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

3.2 安装PaddlePaddle CPU版本

如果没有GPU,或者只想在CPU上运行PaddleOCR,可以安装CPU版本的PaddlePaddle:

  1. pip3.7 install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

安装完成后,可以通过以下命令验证:

  1. python3.7 -c "import paddle; paddle.utils.run_check()"

如果输出“PaddlePaddle is installed successfully!”表示安装成功。

四、安装PaddleOCR

4.1 下载PaddleOCR代码

通过git克隆PaddleOCR的代码仓库:

  1. git clone https://github.com/PaddlePaddle/PaddleOCR.git
  2. cd PaddleOCR

4.2 安装依赖

PaddleOCR有一些额外的依赖,可以通过以下命令安装:

  1. pip3.7 install -r requirements.txt

五、下载模型

PaddleOCR提供了预训练的模型,可以直接下载使用。在PaddleOCR目录下,有models目录,其中包含了各种预训练模型的下载链接。

5.1 下载中文OCR模型

例如,下载中文OCR模型(包括检测模型和识别模型):

  1. cd models
  2. # 下载检测模型
  3. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar
  4. tar -xf ch_ppocr_mobile_v2.0_det_infer.tar
  5. # 下载识别模型
  6. wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar
  7. tar -xf ch_ppocr_mobile_v2.0_rec_infer.tar
  8. cd ..

六、简单使用示例

6.1 图片文字检测与识别

使用PaddleOCR进行图片文字检测与识别非常简单。以下是一个简单的示例:

  1. from paddleocr import PaddleOCR
  2. # 初始化PaddleOCR
  3. ocr = PaddleOCR(use_angle_cls=True, lang="ch")
  4. # 读取图片并进行OCR
  5. img_path = "your_image_path.jpg" # 替换为你的图片路径
  6. result = ocr.ocr(img_path, cls=True)
  7. # 打印结果
  8. for line in result:
  9. print(line)

将上述代码保存为ocr_example.py,然后运行:

  1. python3.7 ocr_example.py

如果一切正常,你将看到图片中的文字被检测并识别出来。

6.2 批量处理图片

如果需要批量处理图片,可以编写一个简单的脚本:

  1. import os
  2. from paddleocr import PaddleOCR
  3. # 初始化PaddleOCR
  4. ocr = PaddleOCR(use_angle_cls=True, lang="ch")
  5. # 图片目录
  6. img_dir = "your_image_directory" # 替换为你的图片目录
  7. # 遍历图片目录并进行OCR
  8. for img_name in os.listdir(img_dir):
  9. if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
  10. img_path = os.path.join(img_dir, img_name)
  11. result = ocr.ocr(img_path, cls=True)
  12. print(f"Image: {img_name}")
  13. for line in result:
  14. print(line)
  15. print("-" * 50)

将上述代码保存为batch_ocr.py,然后运行:

  1. python3.7 batch_ocr.py

七、总结与展望

通过本文的详细步骤,我们成功地在CentOS系统下安装并部署了PaddleOCR。从环境准备、Python环境安装、PaddlePaddle安装到PaddleOCR代码下载、模型下载以及简单的使用示例,每一个步骤都进行了详细的阐述。

PaddleOCR作为一个强大的OCR工具,不仅支持多种语言,还提供了丰富的预训练模型,可以满足不同场景下的OCR需求。未来,随着深度学习技术的不断发展,PaddleOCR也将不断更新和优化,为用户提供更加高效、准确的OCR服务。

希望本文能够对零基础的开发者有所帮助,让大家能够轻松上手并成功部署PaddleOCR。如果在安装或使用过程中遇到任何问题,欢迎随时查阅官方文档或社区论坛,获取更多的帮助和支持。

相关文章推荐

发表评论