星外工多多 [切换] 客服微信  收藏  消息  免费找工作 | 企业免费招人 | 雇主免费招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  强化学习算法工程师(运控方向)  点击:7次
工作编号:1675238
30000-50000/月
自变量机器人科技(深圳)有限公司 查看企业资料及职位 2025-12-12 
深圳市-宝安区  无经验 | | 招5人 | 校招
  工作地址
(稻兴环球科创中心a座) 用小程序查   用百度查

  职位描述  用小程序查看更多
1.负责机器人领域的强化学习算法研究与开发,包括机械臂、灵巧手、机器人全身运动控制等核心技能训练;
2.熟悉机器人端到端操作模型,研究强化学习在ACT、DiffusionPolicy、OpenVLA等前沿VLA模型中的应用;
3.基于IsaacGym/Sim/Lab、MuJoCo等仿真平台,设计并实现机器人操作策略的强化学习训练框架,解决sim2real迁移问题;
4.研究操作模型基于人类或者模型反馈的真机强化学习,提升模型的泛化性和精准性,进一步提升模型的能力;
5.研究并开发模仿学习与强化学习相结合的算法,实现机器人复杂操作技能的快速学习和泛化;
6.负责强化学习模型的蒸馏、优化和真机部署,确保算法在实际机器人系统中的稳定运行;
7.跟踪机器人强化学习领域最新研究进展,推动算法创新和技术突破。
 
 

  职位照片
尚未上传照片。

  联系办法
     联系电话: [请登陆后查看]  用小程序打开  
 

  马上投简历  收藏   复制网址  投诉下架

  自变量机器人科技(深圳)有限公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》 《隐私政策》  投诉与举报  关于我们  更新历史  小程序/APP下载

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2