Daniel Povey团队新一代 Kaldi 中的 Reworked Conformer 模型


                 # 【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

语音之家

语音之家

已认证帐号

已认证帐号

CCF语音对话与听觉专委会中国人工智能产业发展联盟(AIIA)评估组小米集团语音之家北京希尔贝壳科技有限公司 共同主办的 【语音之家】AI产业沙龙—如何应用k2开发语音识别系统,将于 2022年9月22日19:00-20:35 线上直播。

参会嘉宾

姚增伟

嘉宾简介: 姚增伟,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,硕士毕业于哈尔滨工业大学,主要研究方向为语音识别。

分享主题:新一代 Kaldi 中的 Reworked Conformer 模型以及基于多码本向量量化的蒸馏方案摘要: 本报告将介绍近期新一代 Kaldi 项目的两个核心贡献点。针对 Conformer 模型存在的问题进行改进,实现了训练稳定、性能更优的 Reworked Conformer 模型,其核心思想已拓展应用于 Emformer 和 LSTM 等模型中。基于多码本向量量化的蒸馏方案,通过将 teacher 模型的高维(如 1280 维)的 float 向量量化为极少数个(如 8 个)uint8 类型的码本索引,显著地降低了存储空间,并基于量化结果进行高效蒸馏。

匡方军

嘉宾简介: 匡方军,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,主要研究方向为语音识别。

GitHub: https://github.com/csukuangfj

分享主题:新一代 Kaldi 部署框架 sherpa 分享摘要: 本报告将介绍如何使用新一代Kaldi 部署框架sherpa 在不同平台 (Linux/macOS/Windows/Raspberry Pi 等) 进行语音识别。

沙龙议程

参加方式

直播将通过语音之家微信视频号进行直播手机端、PC端可同步观看

语音之家AI工匠学堂​

xjw.h5.xeknow.com/sl/2yOtKa

沙龙联系人闫亮 电话:18611344096邮箱:jack@speechhome.com

发布于 2022-09-16 18:39