发布时间:2020-07-17 10:37 作者:未知
腾佑AI人工智能给大家分享百度EasyDL经典版与专业版在NLP技术方向上的重大升级,下面我们来看具体内容
1、经典版和专业版上线文本分类多标签的定制化模型
文本分类多标签任务,可满足对一个文本同时标记多个标签。例如“北京明天气温骤降,请注意保暖”可对应标签为“beijing_local”、“weather”
场景方面:使用文本分类多标签任务的场景非常丰富,可以在媒体新闻内容场景中,通过对新闻进行多个标签的分类后,将海量的新闻内容自动归类到所属频道(标签)下;也可以在内容推荐场景下,通过内容标签通过标签来提升召回;在对知识文档内容进行多层级归类时,也可以使用此任务进行。
-经典版-
-专业版-
模型训练的功能特点:
经典版提供了定制高性能模型训练和定制高精度模型训练两种方式。使用高精度的模型训练时,可使用少量的数据即可获得高预测精确度的模型;而使用高性能的定制化模型训练时,虽然相较于高精度模型需要较多的训练数据,但可以在服务预测过程中,却有优异的性能,在正常的数据量下,可以接近高精度模型的预测效果,精确率平均低约1-2%左右;
专业版可以在任务配置过程中,选择基于预训练的语义理解技术ERNIE,提供了ERNIE Tiny、ERNIE Large、ERNIE Base三个版本。
2、经典版上线情感倾向分析的定制化分类模型
情感倾向分析定制化模型,可以对一条文本进行情感倾向的判断,即一条文本是正向情感还是负向情感。例如:“酒店位置很好,服务周到热情,下次一定会再来”,标签为positive。
应用场景:通常使用情感倾向分析对用户产出的商品和店铺的评论进行口碑指数的分析,在多个汽车、餐饮、酒店等多个垂类上,情感倾向性分析准确率达到95%以上,在实际电商产品销售分析中已有广泛的应用和落地;也可对事实性的新闻事件进行舆情分析,或对互联网的相关话题进行网民情感倾向的监控等相关应用;
模型训练的功能特点:
同时也提供了基于预训练技术的高精度模型训练方式和具有快速预测性能的高性能的模型训练方式。具备较高泛化能力,在相对长的句子上仍然能保持较高的效果;
后续逐步新增基于实体级和基于句子级的情感分类,覆盖更多的应用需求
3、文本的各任务数据管理升级
丰富了数据管理的能力,新支持Excel、TXT方式上传数据;
同时可上传未标注数据进行数据,可便捷的在平台中进行在线标注。
关注NLP技术方向的小伙伴们,不如现在体验新鲜热乎的单文本多标签、情感倾向分析、超强的数据管理能力哦!