新零售智慧视觉解决方案

人工智能计算机视觉技术在2017-2018年取得巨大技术突破,计算机视觉识别准确率大幅提高,有些场景下已经超过了人眼识别的准确度。因此在2018年智慧视觉在金融、政府事务、医疗图像、交通、制造业、无人机等领域逐步推广开来,并且发展迅速。但目前在线下商业领域新零售方面的应用还处于初级摸索阶段。主要原因如下:第一,新零售属于商业零售竞争激烈,大多数公司都处于微利状态,公司使用新技术非常关注成本,目前人工智能视觉成本高居不下;第二,新零售公司往往都大型连锁公司,目前人工智能依靠云端计算能力,需要大量CPU和GPU来做运算,还需要高速稳定互联网带宽将终端采集的视频和图片传输到云端,因此人工智能使用还必须依赖很多硬件资源的投入,构建的系统非常复杂导致人工智能视觉在商业连锁中普及率很低。 

小工蚁提供的新零售智慧视觉解决方案就是针对如何将人工智能视觉成本大幅下降,降低使用人工智能视觉依赖的资源和环境,同时给出一个通用的人工智能视觉解决方案,适应于不同应用新零售场景给商业企业带来更大价值。 

新零售智慧视觉解决方案:包含硬件和软件系统解决方案。硬件系统方案小工蚁采用树莓派摄像头,摄像头分辨率500万-800万,成本80元(摄像头可以根据不同应用场景选择不同的摄像头例如红外、双目、定焦、鱼眼等);控制器采用树莓派3,Linux操作系统,树莓派是目前世界上应用最广泛性价比最高的一块控制板,它不但具备WI-FI和有线网络、蓝牙网络等支持,而且ARM CPU 4核频率1.2GHZ,内存1GB,成本只有350元性价比极高;再使用一块神经网络加速板卡使用MYRIAD X VPU对深度卷积运算加速具备1T浮点计算能力,成本750元。。 

相关设备下表所示:

  • 树莓派3b(ARM1.2GHZ 4核 1GB)
  • 树莓派摄像头
  • 神经加速计算卡Movidius NCS 2(MYRIAD X VPU芯片 1TFLOPS)
  • 树莓派POE-HAT板卡(可选,通过网口供电)

QQ20190112-165916@2x

树莓派3b

QQ20190112-165932@2x

树莓派3 + 神经网络计算加速卡

软件系统使用Linux开源操作系统、Tensorflow/Caffe2/Keras开源人工智能框架、OpenCV4开源视觉框架技术上开发小工蚁智慧视觉应用。该应用包含3部分组成: 

第一,运行在树莓派3控制器嵌入应用程序,树莓派3上电后应用自动启动,打开摄像头,读取视频中每帧图像,对图像根据嵌入系统预先加载人工智能模型数据进行预测计算,并将返回结果通过MQTT协议自动传回云端服务器。 

第二,运行在云端服务器不断监测树莓派3终端是否正常健康运行,并且不断接受来自树莓派3采集的数据,并且保持的云端,使用WEB图表进行数据展示和分析。 

第三,云端训练人工智能模型应用,计算模型预测准确率和误差率,通过大量数据训练人工智能模型,并且优化为树莓派3计算优化模型存放在模型仓库中,等待被树莓派终端加载。如下图所示。 

QQ20190112-165949@2x

该方案的优势在于:模型训练放在云端,利用云端收集的大量原始数据进行标记和训练学习,生成准确率更高、误差率更低的模型;嵌入式应用根据加载不同人工智能模型可以实现不同应用场景例如到线下门店用户的人脸识别、客流统计、用户性别和年龄预测、用户表情捕捉、用户行为动作捕捉等,一种方案可以实现多种应用场景。 

该方案成本低,不需要要求低,不需要把海量数据传回服务器端运算,把人工智能计算分散在每个低成本终端上实现。 

该方案采用开源软件解决方案构成,可以从底层源代码修改来实现新零售各种应用场景,不会受制于商业解决方案不提供接口,在上层接口多次封装导致运行效率低下等问题。 

根据新零售应用场景小工蚁根据开源社区提供的模型,当前解决方案可以加载如下模型: 

1)消费者年龄和性别识别 

QQ20190112-170004@2x

2)消费者人脸识别模型和根据零售环境增强模型 

QQ20190112-170015@2x

3)表情识别 

QQ20190112-170027@2x

4)各种场景人流统计 

QQ20190112-170040@2x

 

6)用户关键特征:长发、穿什么衣服 

QQ20190112-170052@2x

7)消费者动作预测,将用户姿势提取18个关键点,来判别用户动作 

QQ20190112-170101@2x

8)安防,低精度转化为高精度图片 

QQ20190112-170108@2x

开源社区仍在不断研究和开发新的更高效、精准度更高的人工智能模型,在这些基础模型上小工蚁也可以根据客户实际情况对模型进行微调优化,进一步贴近商业运营环境。 

目前小工蚁聚焦于使用大数据和人工智能打造新零售平台,为企业提供SAAS平台和可定制私有新零售云平台。新零售智慧视觉解决方案解决了下线数据采集难的问题,通过该解决方案可以将连锁公司每个店铺下线客户情况数据都可以采集回来,结合线上平台用户数据,通过小工蚁客户大数据平台进行分析,提供给连锁公司客户在新零售完整画像,让企业实时、准确了解潜在客户、忠实客户和粉丝客户等,根据历史数据趋势为决策提供参考依据。 

小工蚁智慧视觉解决方案,主要针对新零售应用场景,当然根据适当的修改也可以应用于其他行业和领域。 

小工蚁新零售平台目前已服务顾家家居、美特斯邦威、红星美凯龙、松下电器、今世缘、来依份等公司,3年多时间已服务了近250+客户。小工蚁服务今世缘销售终端网络超过10万个,如果每个终端门店都可以安装一个新零售智慧摄像头,可以帮助客户收集大量烟酒店客户数据,可以帮助今世缘理解客户需求和帮助评估竞争对手销售情况。顾家家居在全国拥有尽4000家门店,如果每个门店都部署新零售智慧摄像头可以准确掌握每个门店客流情况和趋势,分析店铺坪效,对全国4000多家门店进行综合打分排序,淘汰落后店铺加强核心优势渠道,有效帮助企业降低渠道成本。美特斯邦威全国3000多家门店,每年2亿件服装被消费者购买,但仍有大量的服装库存,因此需要终端门店及时采集门店服装消费者挑选和试用、门店停留时间分析帮助预测门店SKU单品销量,协调后端供应链是否需要减产、降价促销还是加单生产。该解决方案商业前景广阔,但需要人工智能、大数据、物联网等相关技术结合,具备一定技术门槛,未来通过大数据积累可以形成商业壁垒。目前人工智能视觉应用主要应用于安防等领域,新零售领域应用不多,一旦小工蚁研制产品成功市场前景广阔。摩尔定律每18个月计算能力翻倍,随着人工智能计算能力不断增长,边缘计算新智慧应用将更为广阔。

 

参考文档:

https://software.intel.com/articles/OpenVINO-Install-RaspberryPI 由于使用Intel神经加速卡,需要安装IntelOpen VINO软件包,我使用2代产品,和一代产品API发生巨大变化,因此参考Intel官网

https://software.intel.com/en-us/articles/OpenVINO-Using-Caffe 预测模型我使用Caffe2 MobileNet-SSD因此需要使用Intel工具对人工智能模型进行优化,否则神经加速卡无法对人工智能模型进行加速

在实现开发过程中由于受限于树莓派3CPU计算能力,开发应用尽可能使用神经加速卡进行计算降低CPU计算;但有些实时视频应用场景中神经加速卡计算能力还是不足的,2种解决方案第一使用更多的神经加速卡通过USB接口接入树莓派3,另一种方案通过软件方式不需要对视频中每帧视频进行计算,可以选择间隔多少帧计算方式从而达到应用。我自己实践下来发现最优参数3-5之间。

我们做一个统计客流的应用,使用树莓派3在使用和未使用神经加速卡差别还是非常巨大的,如下图所示:

树莓派3每帧计算一次人工智能识别人计算,并且跟踪识别出来的人(CPU计算),智能达到每秒2.46帧;使用神经加速开后软件没有任何变化每秒钟可以达到14.22(提升7倍性能);去除使用CPU计算跟踪识别出来的人算法,直接调用人工智能识别人性能再次翻倍;每3帧计算一次应用达到26.27帧,已经可以达到商业环境使用。

QQ20190112-165440@2x QQ20190112-165408@2x

推荐文章

沪公网安备 31010702002009号