星外工多多 [切换] 客服微信  收藏  消息  免费找工作 | 企业免费招人 | 雇主免费招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  多模态交互大模型研究员  点击:6次
工作编号:1671300
30000-60000/月
灵机交互(深圳)科技有限公司 查看企业资料及职位 2025-12-10 
深圳市-南山区  1-3年经验 | | 招3人 | 全职
  工作地址
(深圳市清华信息港科研楼) 用小程序查   用百度查

  职位描述  用小程序查看更多
职位描述
1、设计、构建、训练和优化面向机器人交互场景的端到端多模态大模型架构;
2、探索和实现模型对多模态输入(语音、文本、图像/视频、深度信息、传感器数据、环境上下文等)的深度融合与理解;
3、研发模型生成多模态输出(语言语音、情绪、表情、移动、行为动作等)的能力,确保输出的一致性与自然性;
4、重点攻克人机交互闭环中的关键问题:上下文记忆与理解、意图识别与澄清、个性化交互、情感感知与表达、长时程对话一致性、任务导向交互等;

职位要求
1、本科及以上学历,计算机、人工智能、电子、数学等相关专业;博士优先
2、出色的问题分析和解决能力,自主探索新解决方案的能力强;
3、关注生成式AI和多模态交互技术,对推动人形机器人智能化有热情;
4、熟悉VLM/VLA/VLP/MLM等多模态任务建模、具备跨模态模型设计与训练经验;
5、理解多模态对齐(如cross-attention、token-levelalignment)、条件生成、多模态融合机制;

加分项
1、有端到端多模态大模型研究经验,或实际落地应用项目经验者;
2、在CVPR、NeurIPS、ICLR、ACL等会议发表多模态相关工
 
 

  职位照片
尚未上传照片。

  联系办法
     联系电话: [请登陆后查看]  用小程序打开  
 

  马上投简历  收藏   复制网址  投诉下架

  灵机交互(深圳)科技有限公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》 《隐私政策》  投诉与举报  关于我们  更新历史  小程序/APP下载

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2