Python+OCR自动识别火车发票号码全流程解析

作者：暴富20212025.09.18 11:48浏览量：4

简介：本文详细介绍了如何利用Python结合OCR技术自动识别火车发票中的发票号码，包括环境准备、OCR引擎选择、图像预处理、发票号码定位与识别等关键步骤，并提供了完整的代码示例和优化建议，帮助开发者高效实现自动化发票信息提取。

Python+OCR自动识别火车发票号码全流程解析

一、背景与需求分析

在财务报销、税务审计等场景中，火车发票作为重要的交通费用凭证，其发票号码的准确提取至关重要。传统的人工录入方式效率低下且易出错，而通过Python结合OCR（光学字符识别）技术，可以实现火车发票号码的自动化识别，大幅提升工作效率。本文将详细介绍如何利用Python和OCR技术，从火车发票图像中准确提取发票号码。

二、环境准备与依赖安装

1. Python环境

建议使用Python 3.6及以上版本，确保兼容性和性能。可通过Anaconda或直接安装Python官方版本。

2. OCR引擎选择

目前主流的OCR引擎包括Tesseract、EasyOCR、PaddleOCR等。其中，Tesseract开源免费，支持多种语言；EasyOCR基于深度学习，识别准确率高；PaddleOCR是百度开源的OCR工具包，特别适合中文识别。本文以PaddleOCR为例进行介绍。

3. 依赖库安装

pip install paddlepaddle paddleocr opencv-python numpy

paddlepaddle：PaddlePaddle深度学习框架。
paddleocr：基于PaddlePaddle的OCR工具包。
opencv-python：用于图像处理。
numpy：数值计算库。

三、图像预处理

火车发票图像可能存在倾斜、光照不均等问题，影响OCR识别效果。因此，在识别前需要进行图像预处理。

1. 图像二值化

将彩色图像转换为灰度图，再通过阈值处理将图像二值化，增强文字与背景的对比度。

import cv2
import numpy as np
def preprocess_image(image_path):
    # 读取图像
    img = cv2.imread(image_path)
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 二值化处理
    _, binary = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)
    return binary

2. 图像倾斜校正

通过霍夫变换检测直线，计算倾斜角度并校正图像。

def correct_skew(image):
    # 边缘检测
    edges = cv2.Canny(image, 50, 150, apertureSize=3)
    # 霍夫变换检测直线
    lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold=100, minLineLength=100, maxLineGap=10)
    # 计算倾斜角度
    angles = []
    for line in lines:
        x1, y1, x2, y2 = line[0]
        angle = np.arctan2(y2 - y1, x2 - x1) * 180. / np.pi
        angles.append(angle)
    median_angle = np.median(angles)
    # 旋转校正
    (h, w) = image.shape[:2]
    center = (w // 2, h // 2)
    M = cv2.getRotationMatrix2D(center, median_angle, 1.0)
    rotated = cv2.warpAffine(image, M, (w, h), flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_REPLICATE)
    return rotated

四、发票号码定位与识别

1. 使用PaddleOCR进行识别

PaddleOCR提供了简洁的API，可直接调用进行文字识别。

from paddleocr import PaddleOCR
def recognize_invoice_number(image_path):
    # 初始化PaddleOCR
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")
    # 读取并预处理图像
    img = preprocess_image(image_path)
    img = correct_skew(img)
    # 识别文字
    result = ocr.ocr(img, cls=True)
    # 提取发票号码（假设发票号码位于特定区域或具有特定格式）
    invoice_number = None
    for line in result:
        for word_info in line:
            word = word_info[1][0]
            # 简单规则匹配发票号码（实际应用中需更复杂的规则）
            if len(word) == 10 and word.isdigit():  # 假设发票号码为10位数字
                invoice_number = word
                break
        if invoice_number:
            break
    return invoice_number

2. 发票号码定位优化

实际应用中，发票号码可能位于发票的特定区域（如右上角或底部）。可通过以下方式优化定位：

模板匹配：预先定义发票号码区域的模板，通过模板匹配定位。
关键点检测：利用深度学习模型检测发票上的关键点（如发票号码区域），再裁剪该区域进行识别。

五、完整代码示例与测试

1. 完整代码

import cv2
import numpy as np
from paddleocr import PaddleOCR
def preprocess_image(image_path):
    img = cv2.imread(image_path)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, binary = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)
    return binary
def correct_skew(image):
    edges = cv2.Canny(image, 50, 150, apertureSize=3)
    lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold=100, minLineLength=100, maxLineGap=10)
    angles = []
    for line in lines:
        x1, y1, x2, y2 = line[0]
        angle = np.arctan2(y2 - y1, x2 - x1) * 180. / np.pi
        angles.append(angle)
    median_angle = np.median(angles)
    (h, w) = image.shape[:2]
    center = (w // 2, h // 2)
    M = cv2.getRotationMatrix2D(center, median_angle, 1.0)
    rotated = cv2.warpAffine(image, M, (w, h), flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_REPLICATE)
    return rotated
def recognize_invoice_number(image_path):
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")
    img = preprocess_image(image_path)
    img = correct_skew(img)
    result = ocr.ocr(img, cls=True)
    invoice_number = None
    for line in result:
        for word_info in line:
            word = word_info[1][0]
            if len(word) == 10 and word.isdigit():
                invoice_number = word
                break
        if invoice_number:
            break
    return invoice_number
# 测试
image_path = "train_invoice.jpg"  # 替换为实际发票图像路径
invoice_number = recognize_invoice_number(image_path)
print(f"识别到的发票号码: {invoice_number}")

2. 测试与优化

测试数据集：收集多张不同光照、角度的火车发票图像进行测试。
性能优化：调整OCR参数（如语言模型、识别阈值）、优化图像预处理步骤。
错误处理：添加异常处理，如图像读取失败、OCR识别为空等情况。

六、总结与展望

本文介绍了如何利用Python和PaddleOCR技术自动识别火车发票中的发票号码，包括环境准备、图像预处理、OCR识别等关键步骤。通过实际代码示例和测试，验证了方法的可行性。未来，可进一步探索深度学习模型在发票号码定位中的应用，提升识别的准确率和鲁棒性。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Python+OCR自动识别火车发票号码全流程解析

Python+OCR自动识别火车发票号码全流程解析

一、背景与需求分析

二、环境准备与依赖安装

1. Python环境

2. OCR引擎选择

3. 依赖库安装

三、图像预处理

1. 图像二值化

2. 图像倾斜校正

四、发票号码定位与识别

1. 使用PaddleOCR进行识别

2. 发票号码定位优化

五、完整代码示例与测试

1. 完整代码

2. 测试与优化

六、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者