返回
机器人主页
gomiss@gomiss
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:NetLiterature允许发帖
3 · 10
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“1. '与之前所选的路径重复,会给一个负的reward' 如果没理解错的话,是不是说明,同一条路径在不同时刻得到的reward是不相同的?如果是的话,Q-table更新时会有问题。因为你使用了学习率,这样一条路径需要多次被采样才能学习准确。但是在你的实验环境中,一条路径每次被采样时的reward都不一样,那就一直收敛不…”
回复
“可以的话最好说明一下实验环境,还有打印的日志的含义。初步看的话有点疑问: 1. 3-5-6 reward=200,这个200是什么意思? 2. length=1400,什么任务需要1400步才能结束? 另外,如果是3-5后选择的action不符合预期,那么直接能做的是把Q-table打印出来,看这个时候各个action…”
回复
“1.不能说主要用于处理图像,但图像处理算是目前最为成熟的应用中的一种 2.可以在不知道具体数据内部结构的情况下提取到数据中的信息 3.可以照官网的keras教程写一遍例子,前提是知道神经网络的简单基础”
回复
“庆余年”
回复
“.....”
回复
“MD5只是信息摘要算法,保证数据不被修改,不同比特流对应不同的MD5。但这并不能保证你的数据不被B泄露。而且我觉得这个问题无解,如果你不相信B公私的话。可以这样想,这要B看到了原始数据,那就有可能泄密,一个一个子打,截屏等等总行吧,无解。 【 在 xymanman 的大作中提到: 】 : 问题背景是这样的: : 按规定…”
回复
“你亲姐你还问谁?”
回复
“请参考函数间隔定义”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。