发布时间:2023-01-09 16:22 作者:创始人
简述:通用场景文字识别覆盖多种通用场景、20+种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景。
通用场景文字识别多用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景,然而百度通用场景OCR文字识别技术有很多的小分类,不同分类实现的识别效果不同,下面我们一起来看一下吧!
1、通用文字识别(高精度版)
支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。
2、通用文字识别(高精度版含位置)
在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。
3、通用文字识别(标准版)
对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测。
4、通用文字识别(标准版含位置)
在通用文字识别(标准版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。
5、网络图片文字识别(基础版)
支持识别艺术字体或背景复杂的文字内容,仅返回文字信息。
6、网络图片文字识别(含位置版)
除文字信息外,还可返回文字的位置信息、行置信度、单字符内容和位置等。
7、手写文字识别
检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。
8、办公文档识别
可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言,手写、印刷体混排多种场景。
9、表格文字识别
支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持单图中多表格内容的识别。
10、印章识别
检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,支持圆形章、椭圆形章、方形章等常见印章。
11、二维码识别
对图片中的二维码、条形码进行检测和识别,自动返回存储的内容。
12、数字识别
识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景。
以上就是百度通用场景OCR文字识别所支持识别的产品,同时提供在线api调用接口、离线SDK、私有化部署等使用方式,欢迎有需求的您联系在线客服进行咨询!
热搜词
微信公众号
手机站
COPYRIGHT 2007-2020 TUIDC ALL RIGHTS RESERVED 腾佑科技-百度AI人工智能_百度人脸识别_图像识别_语音识别提供商
地址:河南省郑州市姚砦路133号金成时代广场6号楼13层 I CP备案号:豫B2-20110005-1 公安备案号: 41010502003271
声明:本站发布的内容版权归郑州腾佑科技有限公司所有,本站部分素材来源于网络及网友投稿,若无意中侵犯了您的版权,请致电在线客服我们将在核实后予以删除!