HanLP-基于HMM-Viterbi的人名识别原理介绍
Hanlp自然语言处理包中的基于HMM-Viterbi处理人名识别的内容大概在年初的有分享过这类的文章,时间稍微久了一点,有点忘记了。看了 baiziyu 分享的这篇比我之前分享的要简单明了的多。下面就把文章分享给大家交流学习之用,部分内容有做修改。
本文主要介绍一下HanLP是如何利用HMM来做人名识别的。基本思想是把词语序列作为观测序列,将角色序列作为隐藏序列,当模型预测出最佳隐藏状态序列后,利用模式最大匹配法,匹配出人名实体。下边说一模型的三要素在这个应用中所对应的内容,因为训练阶段就是要求解这三个要素的值。
假设有下边的观测序列和其对应的隐藏序列
观察值序列:词1 词2 … 词n
隐变量序列:角色1 角色2 … 角色n
训练阶段:统计三个要素(三个矩阵的元素值)
初始概率分布:
各隐变量标记意义列于下表
状态转移概率分布:
观测概率分布:
有关这些概率值的计算都很简单,就是频率法,留在后边介绍隐马时候再写。
预测阶段:
根据训练得到的三个要素,利用Viterbi算法求解得到了最优隐藏变量序列 角色1 角色2 ... 角色n*
最大模式匹配阶段:
利用下边的模式串匹配出人名
{ BBCD, BBE, BBZ, BCD, BEE,BE,BG,BXD,BZ,CD,EE,FB, Y,XD}
基于HMM-Viterbi标注的人名识别原理就介绍到这里,我想我应该把原理说清楚了,如果你还没有看明白,就等着后续的有关隐马的文章吧。基于隐马的人名识别会很容把以一个姓氏作为开头的词语识别为人名,特别是地名中有人名字的,因此,人工整理出一些非常用姓氏的人名,以及一些地名是必要的,后续如果整理出来了,我应该会放到专栏文章里,毕竟都是公开语料上做的,也就不涉及什么别的不方便。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里云新版人脸识别Go语言调用示例
概述 本文主要演示基于阿里云现有通用Http Go SDK调用阿里云新版人脸识别服务,分别DetectFace方法使用图片URL、VerifyFace方法使用本地为示例演示。 环境准备 1、Go语言版本 go version go1.12.7 windows/amd64 2、IDE LiteIDE 3、SDK安装 go get -u github.com/aliyun/alibaba-cloud-sdk-go/sdk 测试代码 1、DetectFace Sample // demo1 project main.go package main import ( "fmt" "github.com/aliyun/alibaba-cloud-sdk-go/sdk" "github.com/aliyun/alibaba-cloud-
- 下一篇
阿里云推出人脸识别门禁一体机 可动态识别人脸 秒速通行
随着社会智能信息化建设的推进,传统的一卡通、指纹、虹膜等门禁系统给人们通行带来了不便,丢卡、盗卡、冒用他人证件通行的行为也给整体安全性埋下隐患,以人脸生物特征为唯一身份标识(One -ID)的刷脸门禁通行系统随即应运而生。 近日,阿里云推出了首款人脸识别门禁一体机。阿里云刷脸门禁通行系统前端接入人脸AI赋能的人脸识别门禁机,系统能够提供基于人脸One -ID的人员管理、识别比对、智慧通行、轨迹记录、人脸搜索等服务,满足用户对效率提升、安保服务先进可靠的诉求。 阿里云人脸识别门禁一体机官网:https://www.aliyun.com/product/face?source=5176.11533457&userCode=ffsbbyn0 阿里云人脸识别门禁一体机有以下特点: 云端整体联调 云端系统可对人脸识别门禁机进行实时控制与推送,人脸数据在设备端和平台端双重同步,保障人群刷脸通行的便捷性和可靠性。 无感知抓拍,秒速通行 在无感知无配合状态下进行抓拍识别工作,不需要通行人员刻意配合,可支持万级别人脸库1:N比对,≤1.5s秒速开门通行。 “门钥匙”唯一,人脸识别受限少 自带活体...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- CentOS8编译安装MySQL8.0.19
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Mario游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G