最新资讯
热门资讯
最热资讯

文字识别相关咨询

图像识别相关咨询

语音识别相关咨询

人脸识别相关咨询

人工智能http://ai.tuidc.com/templets/default/img/advertising_space_right_3.jpg

当前位置:
资讯中心 > 图像识别 >

百度大脑EasyDL AI进阶系列课程问答汇总

发布时间：2021-01-07 11:02 作者：未知

分享到： QQ空间新浪微博腾讯微博人人网微信

简述：今天我们就百度大脑EasyDLAI进阶系列课程问答的干货进行了汇总，希望对参与课程的开发者小伙伴有所帮助，我们一起来了解下！

　　今天我们就百度大脑EasyDL AI进阶系列课程问答的干货进行了汇总，希望对参与课程的开发者小伙伴有所帮助，我们一起来了解下！

　　在EasyDL「三小时AI开发进阶」系列课程中，百度高工精选三大知识点，从技术能力解析到模型开发实战带来了干货满满的三节公开课，录播地址如下：

　　http://abcxueyuan.baidu.com/#/course_detail?id=15331&courseId=15331

　　课程内容

　　视觉模型核心难点攻破：目标检测技术详解

　　1，小目标检测场景分析与典型算法详解

　　2，基于EasyDL平台能力实战物体检测模型开发

　　NLP开发利器解析：超大规模预训练模型原理及应用精讲

　　1，语义理解与预训练技术简介

　　2，文心（ERNIE）原理解析和最新技术解读

　　3，文心语义理解技术应用实例分享

　　工程师进阶课：模型调参与算法优化技巧实战

　　1，平台能力：全功能AI开发平台BML技术解析

　　2，实战演练：模型开发与多种方式调参

　　3，部署应用：服务器端模型部署流程演示

　　【问题集锦】

　　视觉模型核心难点攻破：目标检测技术详解

　　预训练相关：

　　1，预模型没有理解，训练平台根据训练任务或上传的数据，自动选择合适的预训练模型？

　　预训练模型是在大数据集上经过充分训练的模型，这些模型通常耗费具大的时间和计算资源。通过加载预训练模型的权重参数，新任务能获得预训练模型上已学习的一些知识，如特征提取能力等。在实际训练中，收敛速度更快，效果更好，泛化性也有一定提升。

　　EasyDL经典版是零门槛的AI训练平台，用户无需关心具体模型，只需选择具体部署场景下和算法，平台会根据用户任务类型和数据特征自动帮助用户选择最适合的模型，并加载在大规模数据集上预训练过的权重参数，帮助用户更好更快的优化自有模型。

　　2，网络结构不一样怎么加预训练模型？

　　EasyDL内置非常丰富的预训练模型，不同网络结构均有对应的预训练模型。

　　算法相关：

　　3，小样本可训出效果，但是拟合不足，怎么数据平衡？

　　用户的问题是如何解决小样本的数据不均衡问题？

　　1，对小样本较多的图片进行过采样；

　　2，对小样本进行“复制-粘贴”，进行数据扩充；

　　3，将大样本较多的图片进行“拼接”，将大样本转换为中样本，中样本转换为小样本。

　　4，在EasyDL平台上大概多少图像就可以训练？

　　-分类任务每类至少50张图，图片数建议200张以上；检测任务每类建议20个框，图片数建议100张以上；分割任务每类建议20个标注，图片数建议50张以上；

　　5，小目标拍不清的时候怎么办呢？算法层面有办法解决吗？

　　“拍不清”存在多种情况，如果是抖动、雾化，可以通过特定算法缓解，但如果是分辨率较低，目前虽然有超分辨率、GAN等方向研究，但目前实测效果不太理想。还是建议提高拍摄设备稳定性和分辨率，提高成像质量。

　　6，小目标检测，与一般的目标检测任务对比来看，需要更多的数据么？

　　需要更多数据。小目标所占空间区域小，相比中大型目标，匹配的anchor更少，对损失函数的贡献小，容易导致训练不充分。

　　7，能否实现小目标、大目标同时检测？

　　可以。数据集同时存在大、小目标时，属于多尺度共存情况，建议1.选择带特征金字塔结构的模型；2.启用多尺度训练；3.补充小目标数据。

　　8，老师的内容参考了哪些论文，搜索Anchor两个方法的论文是什么？

　　k-means算法，参考yolov2，YOLO9000:Better,Faster,Stronger

　　guided_anchor，参考Region Proposal by Guided Anchoring

　　AABO:参考AABO:Adaptive Anchor Box Optimization for Object Detection via Bayesian Sub-sampling

　　9，训练模型手动配置项是否越多越好？

　　对于模型优化经验丰富的开发者，手动配置项越多越合适自定义模型优化；对于初学者或者其他行业用户，后台自动选择参数越多，手动配置参数越少，上手难度越低，更利于平台用户专注于自由业务的集成。

　　10，可以简单介绍一下算子是什么吗？

　　算子是图像变化的基础操作，如旋转、裁剪、平移等。

　　11，增强时剪掉了背景，影响模型的预测准确率吗？

　　不影响。数据增强的操作是概率性事件，是否裁剪、裁剪多少，具有一定随机性。保证数据多样性的同时，让模型学习到最核心的特征区域。

　　12，训练完成的数据怎样转换成坐标点？

　　EasyDL平台各种部署方式，均会返回相对于原图的检测框坐标值（top，left，width，height）和对应的类别，用户无需转换。

　　13，anchorfree有哪些优化方向？

　　建议参考coco高分模型榜单，了解sota模型的发展方向：

　　https://paperswithcode.com/sota/object-detection-on-coco

　　14，小目标各不形同无法复制粘贴怎么办？

　　推荐使用分割模型，进行像素级别的识别。

　　15，EasyDL里面已经有小目标的增强是指？

　　手动数据增强中暂未开放，后续会逐渐开放。

　　16，EasyDL中的物体检测和图像分割用哪一个？

　　如果物体形状差异大，且有像素级的识别需求，推荐使用图像分割；如果物体形状规整，整体呈矩形，仅有定位和识别需求，推荐使用检测模型。

　　17，物体检测和图像识别有什么区别？

　　图像分类任务仅需要识别是那个类别；物体检测任务除了识别外，还有定位需求，对象在图中哪个区域。

　　18，调整哪些超参可以提升那么多精度？（货架挡板检测案例）

　　综合EasyDL/BML平台的调优能力，如1.超参搜索，搜索最佳anchor参数以及训练参数；2.增加自动数据增强，提升数据多样性；3.使用百度自有的超大规模预训练模型，获取更多的先验知；4.根据评估报告页中的混淆矩阵的情况，优化数据集等。

　　19，小样本怎么提升模型精度？

　　保证小样本数据量充足，再结合EasyDL平台其他能力，1.超参搜索，搜索最佳anchor参数以及训练参数；2.增加自动数据增强，提升数据多样性；3.使用百度自有的超大规模预训练模型，获取更多的先验知；4.根据评估报告页中的混淆矩阵的情况，优化数据集等。

　　20，样本数量少怎么训练高精度模型？

　　建议1.开启数据增强，自动扩充数据

　　建议2.使用百度自有超大规模预训练模型，获得预训练模型中已学习好的特征抽取能力，保证在小数据集下也有较好的效果。

　　21，一张图最适合训练的区域，挑选GT框这里。这个是怎么挑选的？用人工标定画出区域么？

　　SINIPER引入了chips（碎片）的概念。这些chips主要分为2个类别，一个是postive chips，包含GT框，一个是neigative chips，从RPN网络输出的ROI抽样获得的。

　　每张图像有n个scale，这n个scale用s1,s2,…,sn表示；表示在尺度为i时获得的chip集合。表示postive chips，表示neigative chips。

　　其中postive chip的选择过程如下，

　　缩放原图至不同scale，如si,在该尺度下，定义，其中,i表示尺度；Ri表示对于尺度i来说，只有介于和之间的GT框才能被选进当前Chip。在Ri范围内的GT框用Gi表示，每个chip都尽量多的包含GT框，而且只有当GT框完全包含在chip时才说明该chip包含GT框。这样得到的尺度i的postive chip集合就是

　　其中negtive chip的选择过程如下：

　　1.缩放原图至不同scale，如si,在该尺度下，获得RPN网络输出的ROI，

　　2.移除包含在的区域候选框；

　　3.在Ri范围内，每个chip至少选择M个候选框；

　　4.在训练模型时，每张图每个epoch都处理固定数量的neigative chip，这些固定数量的neigative chip就是从所有尺度的neigative chip中抽样获取的。

　　22，如果把小目标切开了，不完整了，怎么办

　　SINIPER在切图时，只有当GT框完全包含在chip时才说明该chip包含GT框，保证至少存在完整的GT框。

　　23，训练完的模型可以看到用了什么网络吗？

　　取决于具体的训练任务。EasyDL经典版是零门槛的AI训练平台，用户不需要关心高精度效果背后的模型，所以也不会看到模型结构。BML全功能训练平台提供了不同程度的代码编辑方式与训练定制方式，可以对模型网络本身进行编辑修改，也能看到不同程度的网络结构。

　　应用案例：

　　24，货架检测的实用价值是什么？

　　用户的实际需要检测商品所在层数，但无法直接得到。因此转换为检测货架条的位置，通过一系列后处理获得商品层数信息。

　　25，货架分析是不是要对商品摆放间距有要求？

　　无，没有要求

　　EasyData问题：

　　26，EasyDL支持用其他的标注工具标好的数据集上传吗？

　　2021年2月左右支持labelme标注好的数据上传。

　　27，有标注的信息的数据是什么格式？可以导出吗？

　　目前检测任务支持平台自有的json格式以及VOC形式的标注格式，在2021年1月中会支持coco格式；2月初会支持分割的coco和VOC格式

　　28，智能标注能省掉多久时间？

　　能帮助用户省去70%的标注工作

　　29，标注框选错了标签，支持更改吗？

　　支持修改。

　　30，Easydata最大的亮点就是数据的管理，作为机器学习，功能性能非常漂亮，支持私有化购买吗？

　　支持私有化

　　31，Easydl支持导入TF的TFRecord格式数据吗？支持导入其他模型吗？

　　目前暂时不支持导入TF格式；也暂时不支持导入其他模型。

　　32，智能标注是不是就是做目标检测任务？

　　目前智能标注支持物体检测、图像分割。

　　数据标注问题：

　　33，目标检测标注，标注框要紧密贴合物体才行吗？

　　建议贴合。

　　34，标注的时候一个物体需要标注多个框体吗？

　　建议一个目标对象只框一个物体。

　　35，如果一个模型中有两个长得很像的物体，即会标注两个标签。那如何做到两个标签不会误检呢？

　　对于相似的干扰项，建议增加该干扰项的标注，让模型显示的学习到两者的区别；同时增加数据增强，增加数据多样性，提升模型的泛化能力。

　　36，对于目标检测，有没有用到强化学习的方式？

　　EasyDL平台暂时不支持强化学习任务，若有需求，建议和运营同学反馈。

　　部署相关问题：

　　37，使用SDK需要什么环境？

　　EasyDL训练出来的模型可以适配很多种硬件和操作系统，支持常见的CPU、GPU、FPGA、ASIC等硬件平台，每一种解决方案都需要不同的开发环境，大家可以根据自己的需要选择硬件平台，并根据开发文档准备相关开发环境或部署环境。

　　38，EasyDL在模型加速上有哪些策略？

　　EasyDL的模型可以部署在众多常见的同构或异构硬件平台上，并且针对硬件平台和模型做了深度的推理过程优化，在推理速度上具有优秀的表现。加速策略上有很多，常见的有针对模型的计算图优化、量化剪枝，针对硬件的自研加速库、硬件厂商加速库、端到端推理优化等。

　　39，EasyDL支持模型压缩吗？

　　支持。EasyDL的部分模型提供了模型压缩过程。通过开发套件可以选择使用单精度、半精度或int8进行推理。

　　40，服务器通用小型设备专项适配硬件之间有哪些区别？

　　服务器是适配本地高性能服务器级别的开发部署套件，比如高性能的CPU、GPU、百度昆仑、华为昇腾等服务器。通用小型设备是适配边缘、终端、开发板、工控机等智能硬件的开发部署套件。专项适配硬件是针对百度自研的EdgeBoard硬件和与英伟达合作的Jetson系列硬件提供深度定制优化的模型和开发套件。无论哪一种形式的开发套件，都为大家提供了深度优化、高性能、简单易部署的能力。

　　更多百度大脑EasyDL AI进阶课程问答相关内容，腾佑AI人工智能持续分享中！

　　推荐阅读：百度AI人像特效AI小程序之护照识别

点击展开全文

腾佑AI(ai.tuidc.com) 成立于2007年，一直致力于发展互联网IDC数据中心业务、云计算业务、 CDN业务、互联网安全及企业客户技术解决方案等产品服务， 2018年成为百度云河南服务中心。主营服务器租用，服务器托管，虚拟主机，域名注册，机柜租用，主机租用，主机托管，带宽租用，云主机，CDN加速， WAF防火墙，网络安全，人脸识别，文字识别，图像识别，语音识别等业务；

售前咨询热线：400-996-8756

备案提交：0371-89913068

售后客服：0371-89913000