手把手0基础Centos下安装与部署paddleOcr 教程
2025.09.18 11:24浏览量:0简介:零基础也能轻松上手!本文详细讲解CentOS系统下PaddleOCR的安装、配置及部署全流程,涵盖环境准备、依赖安装、代码下载、模型下载及简单使用示例。
手把手0基础Centos下安装与部署paddleOcr教程
摘要
本文是一篇针对零基础开发者的CentOS系统下PaddleOCR安装与部署教程。从环境准备、依赖安装到代码下载、模型下载,再到简单的使用示例,本文将详细阐述每一个步骤,确保读者能够轻松上手并成功部署PaddleOCR。
一、环境准备
1.1 确认CentOS版本
首先,我们需要确认自己的CentOS版本。可以通过以下命令查看:
cat /etc/redhat-release
PaddleOCR对CentOS 7及更高版本支持良好,因此建议使用CentOS 7或8。
1.2 更新系统
在开始安装之前,建议更新系统到最新状态:
sudo yum update -y
此命令将更新所有已安装的软件包到最新版本。
1.3 安装必要的工具
安装一些必要的工具,如wget
、git
和unzip
,这些工具在后续的安装过程中会用到:
sudo yum install -y wget git unzip
二、安装Python环境
PaddleOCR需要Python环境支持,推荐使用Python 3.7或更高版本。我们可以通过以下步骤安装Python:
2.1 安装EPEL仓库
EPEL(Extra Packages for Enterprise Linux)是一个额外的软件包仓库,提供了许多不在默认仓库中的软件包。安装EPEL仓库:
sudo yum install -y epel-release
2.2 安装Python 3.7
通过EPEL仓库安装Python 3.7:
sudo yum install -y python37
安装完成后,可以通过以下命令验证:
python3.7 --version
2.3 安装pip
pip是Python的包管理工具,用于安装和管理Python包。安装pip:
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python3.7 get-pip.py
安装完成后,可以通过以下命令验证:
pip3.7 --version
三、安装PaddlePaddle
PaddleOCR依赖于PaddlePaddle深度学习框架,因此需要先安装PaddlePaddle。
3.1 安装PaddlePaddle GPU版本(可选)
如果你的服务器有NVIDIA GPU,并且已经安装了CUDA和cuDNN,可以安装GPU版本的PaddlePaddle以获得更好的性能。首先,确认CUDA和cuDNN的版本,然后根据官方文档选择对应的PaddlePaddle版本进行安装。例如,安装CUDA 10.1和cuDNN 7.6对应的PaddlePaddle版本:
pip3.7 install paddlepaddle-gpu==2.0.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
3.2 安装PaddlePaddle CPU版本
如果没有GPU,或者只想在CPU上运行PaddleOCR,可以安装CPU版本的PaddlePaddle:
pip3.7 install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple
安装完成后,可以通过以下命令验证:
python3.7 -c "import paddle; paddle.utils.run_check()"
如果输出“PaddlePaddle is installed successfully!”表示安装成功。
四、安装PaddleOCR
4.1 下载PaddleOCR代码
通过git克隆PaddleOCR的代码仓库:
git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
4.2 安装依赖
PaddleOCR有一些额外的依赖,可以通过以下命令安装:
pip3.7 install -r requirements.txt
五、下载模型
PaddleOCR提供了预训练的模型,可以直接下载使用。在PaddleOCR目录下,有models
目录,其中包含了各种预训练模型的下载链接。
5.1 下载中文OCR模型
例如,下载中文OCR模型(包括检测模型和识别模型):
cd models
# 下载检测模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar
tar -xf ch_ppocr_mobile_v2.0_det_infer.tar
# 下载识别模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar
tar -xf ch_ppocr_mobile_v2.0_rec_infer.tar
cd ..
六、简单使用示例
6.1 图片文字检测与识别
使用PaddleOCR进行图片文字检测与识别非常简单。以下是一个简单的示例:
from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
# 读取图片并进行OCR
img_path = "your_image_path.jpg" # 替换为你的图片路径
result = ocr.ocr(img_path, cls=True)
# 打印结果
for line in result:
print(line)
将上述代码保存为ocr_example.py
,然后运行:
python3.7 ocr_example.py
如果一切正常,你将看到图片中的文字被检测并识别出来。
6.2 批量处理图片
如果需要批量处理图片,可以编写一个简单的脚本:
import os
from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
# 图片目录
img_dir = "your_image_directory" # 替换为你的图片目录
# 遍历图片目录并进行OCR
for img_name in os.listdir(img_dir):
if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
img_path = os.path.join(img_dir, img_name)
result = ocr.ocr(img_path, cls=True)
print(f"Image: {img_name}")
for line in result:
print(line)
print("-" * 50)
将上述代码保存为batch_ocr.py
,然后运行:
python3.7 batch_ocr.py
七、总结与展望
通过本文的详细步骤,我们成功地在CentOS系统下安装并部署了PaddleOCR。从环境准备、Python环境安装、PaddlePaddle安装到PaddleOCR代码下载、模型下载以及简单的使用示例,每一个步骤都进行了详细的阐述。
PaddleOCR作为一个强大的OCR工具,不仅支持多种语言,还提供了丰富的预训练模型,可以满足不同场景下的OCR需求。未来,随着深度学习技术的不断发展,PaddleOCR也将不断更新和优化,为用户提供更加高效、准确的OCR服务。
希望本文能够对零基础的开发者有所帮助,让大家能够轻松上手并成功部署PaddleOCR。如果在安装或使用过程中遇到任何问题,欢迎随时查阅官方文档或社区论坛,获取更多的帮助和支持。
发表评论
登录后可评论,请前往 登录 或 注册