NLP度量指标BELU真的完美么?
刚接触自然语言处理的朋友通常会问我:当系统的输出是文本,而非对输入文本进行某种分类,如何对该系统进行评估。当模型的输入是文本信息,输出也是文本信息时,我们称之为序列到序列问题,也可称为字符串转换问题。
序列到序列建模是解决NLP中较难任务的核心,它包括:
1、 自动文摘(Text Summarization);
2、 文本简化(Text simplification);
3、 问答(Question answering);
4、 聊天机器人(Chatbots);
5、 机器翻译(Machine translation);
理解序列到序列建模问题相对容易,如何对其进行评价才是难点。
对于刚入门NLP的人来说,选取衡量标准较为困难。目前最流行的评价指标之一BLEU虽然常用,但也存在较大的缺陷。
本文将介绍BELU的工作原理

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
1月18日云栖精选夜读 | Euler 今日问世!国内首个工业级的图深度学习开源框架,阿里妈妈造
阿里妹导读:千呼万唤始出来!阿里妈妈正式公布重磅开源项目——图深度学习框架Euler。这是国内首个在核心业务大规模应用后开源的图深度学习框架。此次开源,Euler内置了大量的算法供用户直接使用,相关代码已经可在GitHub上进行下载。 热点热议 Euler 今日问世!国内首个工业级的图深度学习开源框架,阿里妈妈造 作者:技术小能手发表在:阿里技术 天啦噜!在家和爱豆玩"剪刀石头布",阿里工程师如何办到? 作者:技术小能手发表在:阿里技术 云栖专辑 | 阿里开发者们的20个感悟,一通百通 作者:云篆 知识整理 SAP创建物料MM01的三个画面(初始、主画面、附加画面) 作者:pandamonica Redis 缓存 雪崩 穿透 作者:心意乱 自然语言处理hanlp的入门基础 作者:大数据资讯 开发函数计算的正确姿势 —— 安装第三方依赖 作者:倚贤 ES6规范import和export用法总结 作者:刘琨1227 美文回顾 Linux基础命令---usermod 作者:一生有你llx 网站有漏洞被攻击篡改了数据该怎么修复解决 作者:网站安全 如何在基于Bytom开发过程中集成IPFS 作...
- 下一篇
使用智能媒体管理(IMM)快速搭建人脸搜索服务
概述 在服务构建中,我们经常需要对用户的图片做进一步分析。本文利用 智能媒体管理(IMM) 提供的图片索引功能,快速搭建一个人脸搜索的功能,示例使用 Python 2.7 实现。 我们以学生点名场景为例。首先构造学生照片集合,再对现场拍摄的照片进行检测。操作流程如下: 将所有学生图片传入 OSS 存储中。 创建一个媒体集 Set,用于存储这些图片的 元数据,本文将利用其中的 人脸特征 数据。 将所有学生图片预置至 Set 内。 传入一张待测图片,查找和该照片匹配的人物。 如下图: 下面我们分步操作一下。 创建 IMM 项目 开通 IMM 服务后,访问 控制台 ,在左侧点击加号创建一个新项目。 左上方地域我们选择 华东1(杭州),右侧的项目名称命名为 RollCallDemo ,所属地域选择 华东1(杭州) ,类型选择 图片标准型 ,QPS 填入 1 ,点击下一步。 截止本文发表时,图片标准型的 1 QPS 是免费的,可以放心测试。参考 计费说明 准备测试图片 我们准备了3张学生图片,用于构建学生集: oss://imm-user-wmt-cn-hangzhou/roll-call-de...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7设置SWAP分区,小内存服务器的救世主