|
|
|
|
职位描述 |
|
岗位职责:
1、NLP方向相关技术研发,包括大模型技术、分类,序列标注、信息抽取等任务;
2、NLP大模型前沿技术探索,解决大模型输出内容不可控、推理效率低等问题;
3、负责技术产品化转化,参与关键技术系统集成;
4、负责创新成果的专利化、论文化工作。
任职要求:
1、计算机相关专业获得博士学位,发表过NLP相关研究顶会论文优先,如ACL、AAAI、EMNLP等;
2、对NLP主流大模型如ChatGPT/LLaMA/ChatGLM等的原理和差异有深入的理解;
3、熟悉预训练模型的认知和知识学习(包括认知架构、知识增强、知识支持、知识监督等)、预训练模型的推理加速技术、预训练模型的压缩技术、预训练模型赋能的知识获取、预训练模型的领域适应与任务适应技术;
4、熟练掌握主流深度学习框架pytorch/tensorflow,有百亿/千亿大模型训练调优经验优先;
5、熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT。
专业要求:
计算机相关专业 |
|
|
|
|
|
|