在终端设备上实现语音识别:ARM开源了TensorFlow预训练模型
关键词识别(Keyword Spotting,KWS)是语音识别领域的一个子领域,在用户在智能设备上进行语音交互时起到重要作用。
△ 关键词识别pipeline
近日,ARM和斯坦福大学合作开源了预训练TensorFlow模型和它们的语音关键词识别代码,并将结果发表在论文Hello Edge: Keyword Spotting on Microcontrollers中。
这个开源库包含了TensorFlow模型和在论文中用到的训练脚本。
在论文中,研究人员还展示了不同的神经网络架构,包含DNN、CNN、Basic LSTM、LSTM、GRU、CRNN和DS-CNN,并将这些架构加入到预训练模型中。
预训练模型地址:
https://github.com/ARM-software/ML-KWS-for-M