|
|
|
|
职位描述 用小程序查看更多 |
|
【岗位职责】 1.推动ASR/TTS等语音算法在实际业务中的落地与性能优化; 2.负责语音信号前处理相关算法的研发与优化(包括噪声抑制、回声消除、语音增强、声源分离等),提升ASR前端语音质量与鲁棒性; 3.设计低延迟、高性能的流式语音处理方案,支持端侧/云端混合部署,优化系统资源占用; 4.开发并维护音频处理工具链(编解码、格式转换、流媒体处理等)与SDK,支持跨平台调用和部署; 5.跟踪语音信号处理/语音合成/识别/多模态等领域的前沿研究,结合实际场景探索创新解决方案。
【任职要求】 1.计算机、电子工程、信号处理、人工智能等相关专业本科及以上学历; 2.熟悉语音前处理技术,如回声消除、降噪、语音增强、VAD等; 3.熟悉传统与深度学习语音算法(CTC、Transformer、Whisper等),具备ASR开发经验; 4.熟悉Kaldi等传统语音工具包; 5.熟练掌握Python/C,熟悉PyTorch或TensorFlow,具备流式语音处理和端侧部署经验; 6.熟悉常见音频编解码格式(AAC/Opus/MP3)、流媒体传输协议,有实际音频处理/封装开发经验; 7.具备良好的团队 |
|
|
|
|
|
|