大牛讲堂 | 语音专题第二讲,语言模型技术
雷锋网(公众号:雷锋网)注:曹立新,地平线机器人语音算法工程师。2011年7月毕业于哈尔滨工业大学计算机科学与技术专业,曾任百度语音资深研发工程师。负责百度超大语言模型训练,语音交互技术研发以及语音搜索、语音输入法、语音助手等产品的语音识别优化。现在地平线负责语音识别、自然语言处理等相关技术算法研究。 语言模型技术 语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。语言模型的建模需要利用复杂的模型公式进行模拟计算,是人工智能领域的关键技术之一。 语言模型的背景 语言模型是针对某种语言建立的概率模型,目的是建立一个能够描述给定词序列在语言中的出现的概率的分布。给定下边两句话: "定义机器人时代的大脑引擎,让生活更便捷、更有趣、更安全"。 "代时人机器定义
