HanLP-基于HMM-Viterbi的人名识别原理介绍-低调大师

HanLP-基于HMM-Viterbi的人名识别原理介绍

2019-07-23 666

Hanlp自然语言处理包中的基于HMM-Viterbi处理人名识别的内容大概在年初的有分享过这类的文章，时间稍微久了一点，有点忘记了。看了 baiziyu 分享的这篇比我之前分享的要简单明了的多。下面就把文章分享给大家交流学习之用，部分内容有做修改。

本文主要介绍一下HanLP是如何利用HMM来做人名识别的。基本思想是把词语序列作为观测序列，将角色序列作为隐藏序列，当模型预测出最佳隐藏状态序列后，利用模式最大匹配法，匹配出人名实体。下边说一模型的三要素在这个应用中所对应的内容，因为训练阶段就是要求解这三个要素的值。
假设有下边的观测序列和其对应的隐藏序列

观察值序列：词1 词2 … 词n
隐变量序列：角色1 角色2 … 角色n
训练阶段：统计三个要素（三个矩阵的元素值）
初始概率分布：

各隐变量标记意义列于下表

状态转移概率分布：

观测概率分布：

有关这些概率值的计算都很简单，就是频率法，留在后边介绍隐马时候再写。
预测阶段：
根据训练得到的三个要素，利用Viterbi算法求解得到了最优隐藏变量序列角色1 角色2 ... 角色n*
最大模式匹配阶段：
利用下边的模式串匹配出人名
{ BBCD, BBE, BBZ, BCD, BEE,BE,BG,BXD,BZ,CD,EE,FB, Y,XD}
基于HMM-Viterbi标注的人名识别原理就介绍到这里，我想我应该把原理说清楚了，如果你还没有看明白，就等着后续的有关隐马的文章吧。基于隐马的人名识别会很容把以一个姓氏作为开头的词语识别为人名，特别是地名中有人名字的，因此，人工整理出一些非常用姓氏的人名，以及一些地名是必要的，后续如果整理出来了，我应该会放到专栏文章里，毕竟都是公开语料上做的，也就不涉及什么别的不方便。

微信关注我们

原文链接：https://yq.aliyun.com/articles/710502

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里云新版人脸识别Go语言调用示例

概述本文主要演示基于阿里云现有通用Http Go SDK调用阿里云新版人脸识别服务，分别DetectFace方法使用图片URL、VerifyFace方法使用本地为示例演示。环境准备 1、Go语言版本 go version go1.12.7 windows/amd64 2、IDE LiteIDE 3、SDK安装 go get -u github.com/aliyun/alibaba-cloud-sdk-go/sdk 测试代码 1、DetectFace Sample // demo1 project main.go package main import ( "fmt" "github.com/aliyun/alibaba-cloud-sdk-go/sdk" "github.com/aliyun/alibaba-cloud-

2019-07-21

710

随着社会智能信息化建设的推进，传统的一卡通、指纹、虹膜等门禁系统给人们通行带来了不便，丢卡、盗卡、冒用他人证件通行的行为也给整体安全性埋下隐患，以人脸生物特征为唯一身份标识（One -ID）的刷脸门禁通行系统随即应运而生。近日，阿里云推出了首款人脸识别门禁一体机。阿里云刷脸门禁通行系统前端接入人脸AI赋能的人脸识别门禁机，系统能够提供基于人脸One -ID的人员管理、识别比对、智慧通行、轨迹记录、人脸搜索等服务，满足用户对效率提升、安保服务先进可靠的诉求。阿里云人脸识别门禁一体机官网：https://www.aliyun.com/product/face?source=5176.11533457&userCode=ffsbbyn0 阿里云人脸识别门禁一体机有以下特点：云端整体联调云端系统可对人脸识别门禁机进行实时控制与推送，人脸数据在设备端和平台端双重同步，保障人群刷脸通行的便捷性和可靠性。无感知抓拍，秒速通行在无感知无配合状态下进行抓拍识别工作，不需要通行人员刻意配合，可支持万级别人脸库1：N比对，≤1.5s秒速开门通行。 “门钥匙”唯一，人脸识别受限少自带活体...

2019-07-23

788

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。