在线文本实体抽取能力,助力应用解析海量文本数据
随着信息化的发展,很多具有重要价值的知识隐藏分布在海量数据中,影响了人们获取知识的效率,如何处理繁杂的非结构化文本数据成为难题。
近日,HMS Core机器学习服务6.5.0版本新增在线文本实体抽取能力,该能力可以检测出文本中是否存在比如日期、姓名、专有名词等实体信息,并将此类实体抽取出来,即自动处理非结构化自然语言文本数据的能力。例如,影视行业的应用中常常会出现大量文字的影评、资讯等内容,使用在线文本实体抽取能力即可快速提取结构信息,帮助搭建知识图谱,便于用户清晰理解。
此外,文本实体抽取能力更多应用于问答系统、信息索引、知识图谱构建等领域。
问答系统
问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户提出的问题。在问答系统实现过程中,则需要用到文本实体抽取能力识别问题和知识库中的实体信息,再通过多种算法模型匹配出精准回答。
信息索引
使用在线文本实体抽取能力,可命名特定实体信息作为索引和超链接。比如用户在评论时提到的专有名词,可以生成超链接,便于其他用户检索了解相关内容。
知识图谱构建
知识图谱是由实体、关系和属性组成的一种数据结构,即具有有向图结构的一个知识库,文本实体抽取能力作为知识图谱构建过程中的底层能力,有着极其重要的作用。比如构建音乐知识图谱,首先需要大量的文本数据中提取出歌手、歌曲、作词、影视等相关信息,然后再进行知识图谱的搭建。
目前,华为机器学习服务在线文本实体抽取能力共支持人名、金钱、影视名、网页链接在内的16个实体类别,可根据实际语义场景应用于不同类别的App中。
集成步骤
- 开发准备
详细准备步骤可参考华为开发者联盟官网。
- 集成和配置apigateway鉴权
基于apigateway的鉴权机制:
"paths": { "/entityExtract": { "post": { "operationId": "entityExtract", "parameters": [{"in": "body", "name": "req", "required": true, "schema": { "$ref": "#/definitions/NerEnterReq" } }, { "name": "X-Request-ID", "in": "header", "required": true, "type": "string" }, {"name": "X-Package-Name", "in": "header", "required": true, "type": "string" }, ……], "responses": {"200": { "description": "response of 200", "schema": { "$ref": "#/definitions/ResponseEntityNerBodyVo"}}}}}
- 创建在线文本实体构造器
// 使用自定义的参数配置创建语种检测器。 MLRemoteNerSetting setting = new MLRemoteNerSetting.Factory() .setSourceLangCode("zh") .create(); MLRemoteNer ner = MLNerFactory.getInstance().getRemoteNer(setting); 进行文本实体抽取。
- 在线获取文本实体抽取
异步方法示例代码:
ner.asyncEntityExtract(input).addOnSuccessListener(new OnSuccessListener<RemoteNerResultItem[]>() { @Override public void onSuccess(RemoteNerResultItem[] remoteNerResults) { // 成功的处理逻辑。 if(remoteNerResults != null){ // 有识别结果 }else { // 识别结果为空 } } }).addOnFailureListener(new OnFailureListener() { @Override public void onFailure(Exception e) { // 识别失败,获取相关异常信息。 try { MLException mlException = (MLException) e; // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。 int errorCode = mlException.getErrCode(); // 获取报错信息,开发者可以结合错误码,快速定位问题。 String errorMessage = mlException.getMessage(); } catch (Exception error) { // 转换错误处理。 } } });
同步方法示例代码:
try { RemoteNerResultItem[] remoteNerResults = ner.syncEntityExtract(input); // 识别成功逻辑 if(remoteNerResults != null){ // 有识别结果 }else { // 识别结果为空 } } catch (MLException mlException) { // 失败的处理逻辑。 // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。 int errorCode = mlException.getErrCode(); // 获取报错信息,开发者可以结合错误码,快速定位问题。 String errorMessage = mlException.getMessage(); }
- 完成后,释放资源
if (ner != null) { ner.stop(); }
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
物联网?快来看 Arduino 上云啦
这里是 HelloGitHub 推出的讲解开源硬件开发平台 Arduino 的系列教程。 第一篇:Arduino 介绍和开发环境搭建 第二篇:制作温湿度显示器 上一篇文章,我们介绍了如何安装 Arduino 支持库、DHT 11 温湿度传感器以及 OLED 屏幕的使用,并用 Arduino 制作了一个小型温湿度显示器。 在这个讲究万物互联的时代,让咱们的 Arduino 温湿度也去“云上”玩玩,有个学名叫物联网。 物联网(IoT) 是由物理对象组成的网络,这些物理对象嵌入了传感器、软件和其他技术,以便可以通过互联网与其他设备和系统建立连接并交换数据。 是不是瞬间感觉高大上了一些,但是不用担心本期的知识超纲,因为高深的我也不会! 今天我们讲解:如何把上一期做的温湿度设备上云,通过物联网平台完成实时数据上传和远程控制设备。实现将 Arduino 设备测量的温湿度数据上传到物联网平台,然后接收平台发送指令控制设备上 LED 灯光开关。 你是否已经开始摩拳擦掌了呢?下面我们开始“上云”! 一、实现联网功能 1.1 模块介绍 首先,如果想要 Arduino 连接到物联网平台的服务器,必然需要先让...
- 下一篇
干货|如何让同事不再吐槽自己的git管理技术
代码作为程序员辛苦加班的结晶,同时也是平时交流最多的方式,"低眉信手续续弹,说尽心中无限事"。她低着头手在键盘上连续地敲个不停;像是用满屏的代码把心中无限的往事说尽,"轻拢慢捻抹复挑,初为《霓裳》后《六幺》",初为然而此刻他并没有像久别重逢的老友一般,叽叽喳喳的说个不停,而是轻轻地拢,慢慢地捻,一会儿抹,一会儿挑,一会儿写策略,一会儿又琢磨起了观察者。现在话锋一转,又谈起了git: 想了解git命令,来一个help看看都有哪些命令: git help <command> git <command> -h git <command> --help 了解之后,想进入git,怎么办?一般我们都不需要重新搭建一个内网git,因为不可能说每个人来到单位,都要把git平台重新搞一遍,而且大多数时候,我们作为开发,是不会有管理员权限的。管理员权限一般由运维把控。所以现在需要找运维童鞋给你开一个账号,开完后,他会把账号密码还有登录地址都发给你(沟通方式看各个公司规定)。 到这里你已经拿到自己的git信息,假设realname="王小风",username="...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8编译安装MySQL8.0.19
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,7,8上安装Nginx,支持https2.0的开启