|
|
|
|
职位描述 用小程序查看更多 |
|
职责描述
负责大语言模型(LLM)或多模态大模型的研发、优化及落地应用,包括但不限于模型架构设计、预训练、微调、推理加速等。
探索大模型的前沿技术(如RLHF、MoE、长上下文处理、Agent框架等),提升模型在特定场景(搜索、对话、代码生成等)的性能。
针对业务需求,设计高效的Prompt工程、模型微调或蒸馏方案,解决实际场景中的效果与效率问题。
参与大模型相关基础设施的建设,如分布式训练框架、高性能推理引擎、数据 pipeline 等。
跟踪学术界与工业界最新进展,推动技术创新和专利/论文产出。
任职要求
任职要求:
1. 计算机、人工智能、信号处理等相关专业。
2. 精通Python/C++,熟悉PyTorch/TensorFlow框架训练。
3. 深入理解语音+NLP技术、Transformer架构及大模型预训练/微调流程。
4. 具备多模态算法经验(如语音-文本融合),有语音大模型(如LLM-based)或端到端语音交互系统开发经验者优先。
|
|
|
|
|
|
|