返回信息流lz是北邮本科,即将进入自动化所读研。现在组里面有一些论文打算扩刊,比较缺人手。带队的是亲师兄,实力很强,非常靠谱,能手把手调代码改bug。非常欢迎各位想攒paper的同学或低年级学弟学妹加入!
之前帖子在电脑端格式有点问题,现已修复。
-----------------------------------------------------------------------
项目1: 基于视觉语言动作模型的端到端自动驾驶
1. 项目目标:ICRA(ddl:9.15)或CVPR(ddl:11.16)和扩刊项目IEEE TPAMI
2. 研究思路:研究思路:主要研究VLA模型输出层面的设计,探索一套数据形式和学习机制保留模型的语言能力和动作空间决策能力,即让VLA模型具备动作输出能力+保留语言CoT输出能力
3. 研究方向:端到端自动驾驶,Vision-language-action model
5. 研究基础:
a. TOD3Cap:https://arxiv.org/abs/2403.19589
b. PlanAgent:https://arxiv.org/abs/2406.01587
项目2: 基于世界模型的端到端自动驾驶
1. 项目目标:投稿ICRA(ddl:9.15)或ICLR(ddl:9.29)
2. 研究思路:打造一套具备世界模型想象能力的E2E自动驾驶算法,研究world model的策略与E2E模型轨迹输出的对齐机制,在nuScene和Carla完成Sota实验
3. 研究方向:World model、端到端驾驶。
4. 研究基础:
a. MILE:https://arxiv.org/abs/2210.07729
b. Bench2Drive:https://arxiv.org/abs/2406.03877
c. TD-MPC2:https://arxiv.org/abs/2310.16828
项目3: 基于隐式重建的3D点云的时空一致的特征点检测方法(具身智能)
1. 项目目标:对现有会议论文扩刊,投稿IEEE TPAMI
2. 研究思路:
a. 改进原有会议版本的重建方法,加入法向场提升物体表面重建质量
b. 解决原有的网络框架不支持多个动态物体检测的问题
c. 验证该方法可应用在更多的下游任务中
3. 研究方向: 3D点云的网络框架及自监督训练范式,机器人仿真器,了解现有的重建方法与物体的集合属性。
4. 研究基础:
a. 3D Implicit Transporter:https://arxiv.org/abs/2309.05098
b. SparseDff:https://arxiv.org/abs/2310.16838
合作模式
1. 设备:基础算力如3090/A6000/A800
2. 指导:对于某个project,可以是定期的会议同步,也可以是有需求随时快速sync。尽量提供从idea到coding到paper writing的完整流程的帮助。在一些不够熟悉的topic上,我们会尽可能找到合适的合作者一起提供帮助。参考Anysyn3D(https://anysyn3d.github.io/)
4. 要求:希望具备一定的编程能力,踏实认真,年级不限。
5. 联系:
郑宇鹏(带队师兄)
a. Wechat:18811796002
b. Email:zhengyupeng2022@ia.ac.cn
c. Google:https://scholar.google.com/citations?user=anGhGdYAAAAJ&hl=en
发帖人
a. WeChat:18436370083
b. Email:xzebin@bupt.edu.cn
这是一条镜像帖。来源:北邮人论坛 / paper / #48733同步于 2024/6/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Paper机器人发帖
【长期科研合作】
x18436370083
2024/6/22镜像同步14 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复