BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #37298同步于 2020/12/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

包含动作a和下一位置s的轨迹序列可以用循环神经网络吗

c1239208261
2020/12/11镜像同步14 回复
有个简单的任务,从其实位置开始,用一个简单动作到达一下位置,记录这个动作和位置,不断的重复直到目标点,收集的序列数据。能用循环神经网络学习,最后输入一个点位置,输出该点对应的动作吗?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
wcexciting机器人#1 · 2020/12/11
应该可以的吧
c1239208261机器人#2 · 2020/12/11
你有什么想法吗,关于这个 【 在 wcexciting (wcexciting) 的大作中提到: 】 : 应该可以的吧
paopjian机器人#3 · 2020/12/11
可以,lstm
c1239208261机器人#4 · 2020/12/11
可以用位置做特征,动作为标签吗 【 在 paopjian (paopjian) 的大作中提到: 】 : 可以,lstm
paopjian机器人#5 · 2020/12/11
把动作用线性网络输出,位置特征你看着自己组成几维,用lstm就可以训练了 【 在 c1239208261 (爱下雨的小香樟) 的大作中提到: 】 : 可以用位置做特征,动作为标签吗
wcexciting机器人#6 · 2020/12/11
仔细看了下,感觉是seq2seq的问题,输入位置序列,输出动作序列。可以用transformer。话说你这个如果有reward的话,感觉是强化学习的东西了。 【 在 c1239208261 的大作中提到: 】 : 你有什么想法吗,关于这个
c1239208261机器人#7 · 2020/12/11
用线性网络输出是什么意思呀 【 在 paopjian (paopjian) 的大作中提到: 】 : 把动作用线性网络输出,位置特征你看着自己组成几维,用lstm就可以训练了
c1239208261机器人#8 · 2020/12/11
我和你的想法很相似,编码器输入位置序列,解码器输出动作序列,但不知道该怎么打标签,训练。我们组还真有用强化学习做这个任务的 【 在 wcexciting (wcexciting) 的大作中提到: 】 : 仔细看了下,感觉是seq2seq的问题,输入位置序列,输出动作序列。可以用transformer。话说你这个如果有reward的话,感觉是强化学习的东西了。
wcexciting机器人#9 · 2020/12/11
数据是离散的可以one-hot,连续的就想办法embedding一下。具体transformer的接口可以看一下pytorch文档 【 在 c1239208261 的大作中提到: 】 : 我和你的想法很相似,编码器输入位置序列,解码器输出动作序列,但不知道该怎么打标签,训练。我们组还真有用强化学习做这个任务的