发布时间:2021-09-28 15:12 作者:未知
撸串已经成为大家工作之余的放松方式之一,回想下每次撸完串,扫码结账前,总要等待服务员一个个数签结算,效率低下不说还很容易出错,为了解决数签难题百度AI数签神器上线了,服务员只需对着签子底部拍张照片,就能实现一秒“数签”,然后从这种繁琐的日常工作中解脱出来。
这款叫做《百度AI数签神器》的小程序由百度研发。据了解,上线这个数签小程序,前期只需要进行小批量的数据标注,通过把标注好的图片上传平台进行模型训练,最快半小时,专属的数签模型就轻松生成了。随后结合百度APP,就开发出「百度AI数签神器」小程序。
这次“AI数签神器”,就是在百度飞桨EasyDL一站式开发平台完成模型训练的。EasyDL是百度飞桨推出的零门槛AI开发平台,开发者不需要有算法基础,就能在平台上完成数据上传、标注和训练,可视化操作几步就可以完成一个AI模型。
“数签”模型之所以快且准,核心离不开百度飞桨EasyDL图像-物体检测模型的支持,它是零算法基础定制高精度图像应用AI模型,提供端云多种灵活部署方案。
模型训练过程有多简单呢?只需四步就可以得到你想要的识别效果:
1,创建模型。确定模型名称,记录希望模型实现的功能。
由于我们的目标是统计竹签数量,那就需要定位竹签,然后统计竹签出现的次数。对于这类要定位出物体区域,并识别为竹签的场景,在EasyDL可以使用物体检测模型来完成。
2,上传并标注数据。检测功能的模型:上传数据后,需要在数据中标注出需要检测的具体目标。
要知道,数据的获取是一个比较长的过程,这个过程中需要开发者去采集数据,标注数据,清洗数据,每个流程都可能会占用我们较多的人力。
别担心,百度推出的一站式数据处理和服务平台EasyData,主要围绕AI开发过程中所需要数据采集、数据清洗、数据标注等业务需求提供完整的数据服务,帮助你提升模型训练的效果。
在竹签数据集中,采集的图片竹签占比小,背景干扰多,可以通过数据清洗模块批量裁剪掉非目标的背景区域,保留核心竹签区域。
3,训练模型并校验效果。选择部署方式与算法,用上传的数据一键训练模型;模型训练完成后,可在线校验模型效果。
EasyDL平台的用户可根据模型部署环境以及对预测时延的要求来选择模型,一般情况下,时延越大,精度越高。
得到模型的初步效果后,用户还可以根据其特点进一步优化。
首先是数据增强,竹签图片量不大,为了扩产数据集并提高模型的泛化性,可以采用数据增强策略。
其次是优化超参数,如锚框大小、输入分辨率、学习率、优化器等。百度飞桨EasyDL平台提供自动超参搜索服务,能大幅提升模型的效果。同时,EasyDL支持早停、失败重试、表现差的试验复用优秀试验的预训练权重等功能,使训练更加高效。在EasyDL线上多场景模型精度可以平均提升10%以上。
然后是智能评估。通过查看指标、归因分析、有针对性地收集和修正数据并进行模型迭代,模型调优的效率普遍可以提升50%,在有些数据集上精度甚至可以提升20%以上。
4,发布模型。根据训练时选择的部署方式,将模型以云端API、设备端SDK等多种方式发布使用。
EasyDL提供灵活丰富的服务部署形态,包括公有云部署、本地服务器部署、设备端SDK、软硬一体产品等。它还支持4大操作系统,15+芯片类型。
在AI模型开发的部署阶段,除了硬件的适配性,性能一直是开发者最关心的核心问题,很多场景对时延都有非常高的要求。EasyDL引入计算图优化、模型压缩等功能,能够大幅降低模型的体积,以及内存/显存的占用,如模型内存占用可以降低60%。同时,在本地部署中,通过端到端的硬件加速和异构计算的合理编排等机制,可以最大化发挥AI芯片的潜力,提升本地模型推理的性能。
从创建模型到模型发布,到此,整个模型训练的整个过程就结束了。这里也有个详细的上手视频介绍。
由此可以看出,与大家所熟知的那样,百度AI不止能做高大上的工业检测、电力巡检等专业应用场景,更重要的是,百度AI给我们展示了技术可以非常贴近日常生活,AI可以有烟火味,他们也真正做到了将AI落地到各领域,改变人们的生活。
同时,可以看到,EasyDL平台让AI开发变得很容易就能上手,不是专业的算法工程师,也可以用它开发各种应用。