前言
最近和车检行业上的技术过不去了,那就继续分享使用OCR(光学字符识别)提取行驶证上的文字,OCR技术在行驶证识别中的应用已经非常广泛,基于深度学习算法,通过训练大量样本数据,使模型具备图像分类、目标检测和文字识别能力,在行驶证识别中,首先对行驶证图像进行预处理,包括灰度化、二值化、去噪等操作,以提高图像清晰度和识别率,然后对图像中的文字进行定位、分割和识别。
一、开发环境
语言:Pytnon
开发工具:PyCharm
二、本地离线版测试效果
离线版API测试地址:http://47.108.177.251:9000,源码待完善后上传至CSDN,敬请关注~
三、实现方法
一种是使用Tesseract的本地识别(本人用的则是本地离线识别,可部署于任一场景),经过预处理,识别准确度高;另一种是使用百度云API,准确性更高但需要网络调用,若在非互联网下就用不了。
以下是一个使用本地OCR引擎(需要安装Tesseract),这是OpenCV + pytesseract的示例:
import cv2
import pytesseractdef ocr_local(image_path):# 读取图像img = cv2.imread(image_path)# 预处理(按需调整)gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]# 设置中文识别(需要下载chi_sim训练数据)custom_config = r'--oem 3 --psm 6 -l chi_sim'text = pytesseract.image_to_string(thresh, config=custom_config)return text# 使用示例
print(ocr_local('行驶证照片.jpg'))
如果是想使用 Python 和百度云 OCR API 识别行驶证的示例代码,需要先注册百度AI开放平台获取API Key:
from aip import AipOcr# 配置百度OCR应用信息
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)def ocr_vehicle_license(image_path):# 读取图片with open(image_path, 'rb') as f:image = f.read()# 调用行驶证识别接口result = client.vehicleLicense(image)# 解析结果if 'words_result' in result:data = {}for key, value in result['words_result'].items():data[key] = value['words']return dataelse:return None# 使用示例
if __name__ == '__main__':image_path = '行驶证照片.jpg'result = ocr_vehicle_license(image_path)if result:print("识别结果:")print(f"车牌号码: {result.get('plate_num', '')}")print(f"车辆类型: {result.get('vehicle_type', '')}")print(f"所有人: {result.get('owner', '')}")print(f"住址: {result.get('address', '')}")print(f"使用性质: {result.get('use_character', '')}")else:print("识别失败")
注意:
-
百度API版本需要网络
-
本地版需要安装Tesseract并下载中文语言包(应用场景更广泛)
-
实际应用中需要根据行驶证版式添加图像预处理和结果解析逻辑