发布时间:2021-04-01 09:55 作者:未知
今天给大家带来的是百度大脑EasyDL多人标注重磅上线,助力团队协作标注的相关信息,下面我们来看具体内容!
无论是企业的AI业务应用开发,还是高校师生团队的AI科研项目,想要获取高精度模型,除了需要选择一个功能完备的开发平台外,必须要考虑的是具备充足的训练数据,但这些动辄几百上千甚至上万条的数据,标注就成了令人头疼的大问题。别小看标注只是画框和点选操作,仅依赖一人进行标注的效率足以让整个AI项目陷入进展停滞的境地。
那么,秉承着效率第一和团队协作的信条,标注工作能否也团队齐上阵,让效率搭上火箭,项目进展一飞冲天?
观察到这一需求,EasyDL重磅上线多人标注,化整为零、分块并行,短时间完成数据标注,模型开发流程效率再提升不是梦!
在多人标注中,共有三种角色:管理员、标注员、审核员。管理员创建多人标注任务,分配给指定的标注团队,标注员完成标注后,引入审核团队对标注员的工作进行审核,进一步提高了标注的准确率,保证了后续模型训练的标注准确性。审核员审核全部完成后,管理员对整体的标注效果进行验收,验收完成后标注工作正式结束。目前支持数据类型有文本、图片、音频和视频。
简单四步,团队协作搞定标注
1,管理员创建团队与任务
首先,管理员创建好标注团队和审核团队,并在团队里添加相关的成员并完善信息。
团队创建好后,就可以对已有数据集的未标注图片发起多人标注任务了。如下图:
目前对数据集里面未标注的数据进行任务平均分配,在任务创建时,管理员可以灵活选择是否需要标注审核、任务截止时间、成员权限和数据保存方式。
完成任务创建并提交后,后台会自动进行任务的平均分配,并将标注任务的链接发放到标注团队成员的邮箱中。
2,标注员进行标注
标注员点击邮箱收到的任务链接开始标注,在管理员设置的结束时间之前完成即可,标注完成后进行任务提交,根据管理员设置决定是否进行任务审核。
上图为标注员的标注页面,管理员可以为每个标签设置对应的颜色,标注框的颜色也会随之变化,以方案标注员进行标注和检查。同时,EasyData也支持标签置顶和锁定功能,便于标注员快速选择常用标签,提升标注效率和准确率。
3,审核员进行审核
审核员点击邮箱里面的审核任务链接,在管理员设置的结束时间之前,对标注员的标注工作进行审核,审核完成后提交任务。所有审核任务都提交后,管理员进入验收环节。在整体流程中,审核员的加入分担了管理员的审核压力,也提高了对标注员的要求,通过多种方式提升数据的标注质量,提升了验收环节的效率。
4,管理员验收
管理员可以看到标注任务和审核任务的进展,以及所有的标注详情。在需要审核的情况下,如果某个标注员的标注结果审核通过率较低,可以进行打回与重新标注,审核员与管理员也需要重新审核与验收。在验收完成之后,标注数据会保存到目标数据集中,标志着多人标注工作完成。
随着多人标注功能的上线,原本繁重的数据标注工作可以通过团队协作的方式进行分配,并且,引入管理员、审核员角色,将标注工作进一步细分,在保证数据质量的前提下,最大化提升团队协作效率。
EasyDL零门槛AI开发平台基于飞桨开源深度学习平台构建,为用户提供一站式的模型定制开发和服务。
在数据管理中,用户可以享受到完善安全的数据服务,包括端云一体的数据采集方案、高级数据清洗、数据扩充、智能标注与近期上线的多人协同标注能力,在多个环节持续提升数据处理效率。
在模型构建环节中,EasyDL支持用户零代码、自动化进行模型训练。在开发者最关注的模型精度问题上,EasyDL预置了百度自研的视觉超大规模预训练模型与语义理解模型文心ERNIE2.0,并提供迁移学习、自动超参搜索、自动数据增强等工具组件,能够让开发者用更少的数据与开发量,获取更优质的效果。在满足精度的同时,为提升训练效率,EasyDL在训练流程中也做了优化,例如分布式训练加速,用户可以自主选择多机多卡的模式,更高效地完成训练流程。同时,为了帮助用户在模型训练后快速了解模型、有针对性地进行模型调优,EasyDL支持在线查看模型的多种指标,包括精确率、召回率、F1-score、mAP等,也有热力图、混淆矩阵等功能更好地对模型效果进行归因分析。
值得一提的是,EasyDL的物体检测模型,针对多种场景预置了自适应训练优化机制,并提供了适应广泛业务场景的算法选型,并且在不断根据市场需求进行优化。立足于各类企业应用场景,提供兼具高精度与高性能的模型训练机制。
企业在AI应用时,往往面临部署的“最后一公里”问题。为此,EasyDL提供了灵活的端、边、云多种部署方案,用户可根据业务应用场景要求选择公有云、设备端、私有化、软硬一体的部署方式,更快更好地让AI赋能于各类行业与场景。