|
|
|
|
职位描述 用小程序查看更多 |
|
【工作职责】 1、负责LLM以及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents,RAG,functioncall、systemprompts等,探索大模型应用前沿 2、负责对公司内部微调和推理框架的性能优化,以及主流模型的适配工作,包括主流大模型Qwen、DeepSeek等;
【任职要求】 1、自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业本科以上学历; 2、熟悉Transformer、Bert等深度学习理论算法和优化; 3、在大语言模型方面有一定研究基础或经验,熟悉常用大模型,如GPT系列、LLaMA、BLOOM等,熟悉大语言模型各阶段训练过程,有实际训练经验者优先; 4、较强的工程实现能力,熟练掌握C,Go,Python等至少一种语言,熟悉DeepSpeed、Megatron等分布式训练框架,熟练使用至少一种深度学习框架(如Tensorflow,pytorch); 5、具备较强的团队协作能力和沟通能力,有较强的学习能力和业务分析及问题解决能力; |
|
|
|
|
|
|