CORC  > 湖南大学
题名基于深度学习的快销品图像识别系统设计与开发
作者戴同武
答辩日期2018
授予单位湖南大学
导师李肯立 ; 郑京杰
关键词多模型融合 Faster RCNN 图像矫正 目标检测 WebService
学位名称硕士
公开日期[db:dc_date_available]
页码随着经济社会的发展,快销品行业飞速发展,啤酒行业竞争日趋激烈,如何抢占市场获取第一手的市场占有率信息,成为以百威啤酒为代表的啤酒厂商正在着手考虑的问题。与此同时,在互联网大数据的时代背景下,深度学习快速发展,并开始广泛应用于各行各业。如何利用深度学习技术快速统计不同场景不同类别自己销售啤酒和竞争对手销售啤酒在各大超市摆放的数量,以便采取精准施策提供依据,成为优先考虑的问题。本文与百威啤酒产商合作,利用Faster RCNN目标检测技术,针对不同场景共3种、不同类别自己销售啤酒和竞争对手销售啤酒共76类啤酒进行识别。针对图像倾斜较为严重的图片,提供图像预处理;对于重复框的问题,对模型增加后处理操作;对于即倾斜又模糊的图像采用多模型融合的技术方案,大大提高图像识别的准确率。为百威啤酒产商提供了一整套的解决方案,包括图像识别、页面展示、接口开发。大大缩短了人工处理图片的时间、提高了图像识别的精度,为后期的推广提供了有力的支撑。主要工作如下:分析对比了多种目标检测算法,最终采用速度更快的Faster RCNN作为目标检测算法。对原有的标图软件源码进行修改,提高了标图的效率。基于VOC2007数据集使用了多个网络进行训练,如VGG16、ResNet50、Inception-v2 等。针对图像倾斜较严重的图片,提供了 C++语言编写的图像处理工具。首先寻找两条上下货架线,根据啤酒瓶摆放的方向确定两条左右纵向竖线,将处于倾斜的梯形图像部分,通过坐标映射到二维坐标像素点。对于处于梯形外部的图像保留原有像素,实现了图像矫正。主要解决了识别不准的三个问题:a.重复框问题、b.错误较多的类别、c.相同名称不同高低尺寸。使用多组样本训练得到多个模型,比如正反两个面分别得到模型。对于相同类别正反两个识别结果统一为一个类别。对于不同位置的框之间IOU达到50%以上进行图像合并操作。对于相同名称不同高低尺寸,如330ml和500ml,采取对同一排啤酒瓶高度取均值,超过均值20%的啤酒瓶认为是500ml,反之亦然。客户端或网页端上传标准图片到Microsoft Azure,服务器端下载标准图片,定期上传审图结果,客户端或网页端获取审图结果。主要采用WebService框架,模型训练端使用Python发布成服务,客户端或者网页端通过Ajax请求服务,获取识别结果,上传到Azure云。<<收起
URL标识查看原文
内容类型学位论文
URI标识http://www.corc.org.cn/handle/1471x/5452944
专题湖南大学
推荐引用方式
GB/T 7714
戴同武. 基于深度学习的快销品图像识别系统设计与开发[D]. 湖南大学. 2018.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace