发布时间:2020-08-31 09:32 作者:未知
一般来说数据清洗功能需要和具体的业务场景来结合使用,因此EasyData近期升级,上线过滤无人体/无人脸图像高级清洗功能,下面和腾佑AI人工智能一起来看具体内容吧!
在园区智能管理等场景下,需要监测工厂园区、林区中是否有人闯入。为了满足此类场景下的图片清洗需求,EasyData上线了高级清洗功能,将无人脸、无人体出现的数据进行过滤。虽然EasyData平台本身并没有人脸识别、人体识别的能力,但用户仅需在百度云上开通相应的服务(人脸检测和人体检测都可以免费试用),就可以直接使用这些功能。
1、无人脸图片过滤
如果以前没有用过百度智能云的人脸检测服务,第一次使用高级清洗的功能会提示”申请免费试用”,点击链接会进入百度人脸检测的页面,按照提示,开通服务后,再回到EasyData的页面就可以正常使用了。
和基础的数据清洗服务一样,过滤无人脸图片也是以数据集为单位的。在数据清洗页面选择过滤无人脸图片,点击保存,提交任务就可以进行清洗。如果勾选了”保留标签”,那么不仅会把没有人脸的图片过滤,还会将人脸画框同步至清洗后的数据集。
提交任务时勾选保留人脸画框
例如下图,清洗前的数据集除了人脸图片,还有一些风景照、车辆等其他物体的照片,人脸过滤会把这些没有人脸的图片过滤,保留下来包含人脸的图片,包括戴口罩,被遮挡的人脸也可以识别出来。
清洗前的数据集中有人脸照片、风景照、静物照
清洗后的数据集只有人脸照片被保存下来
2、无人体图片过滤
过滤无人体图片同样会用到百度智能云的人体检测能力,在使用之前需要在百度智能云上开通相应的服务。过滤无人体图片会用到两个接口:
人体检测和属性分析:https://ai.baidu.com/tech/body/attr
人像分割:https://ai.baidu.com/tech/body/seg
数据集模板为图像分类和物体检测的数据集会调用人体检测和属性分析接口,数据集模板为图像分割的数据集会调用人像分割接口。百度智能云上的人像分割接口返回的是人像图片对应的二值图片(人像为1,背景为0),在后端会执行相应的标签转换,返回的二值图片转换成对应的标签。
清洗前的数据集中有风景图、静物图和人体图
人体过滤保留的5张人体图片
模板为图像检测的数据集清洗后的标签
模板为图像分割的数据集清洗后的标签
目前的数据清洗服务所能支持的最大数据集大小是5万张片,基于EasyData平台的大数据处理平台,对于基础清洗服务,2万张图片的数据集,大约1小时可以完成清洗。5万张图片的数据集,大约2小时可以清洗完成。对于高级清洗来说,清洗的速度取决于开通服务的QPS。
EasyData是百度大脑推出的业内首个提供软硬一体、端云协同的智能数据采集服务的平台,支持图片、文本、音频和视频四类数据的处理,其中图片数据支持了采集、清洗、标注一站式处理,覆盖模型开发中的各类数据管理需求。且四类数据都已经支持将EasyData处理的数据应用于EasyDL模型训练,便于开发者直接使用,高效开发AI模型。
立即体验EasyData:https://ai.baidu.com/easydata/
更多EasyData上新相关内容,腾佑AI人工智能持续分享中