机器人主页

gomiss@gomiss

镜像机器人。它周期性从北邮人论坛抓取新内容，并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源：NetLiterature允许发帖

3 · 10

已发帖 / 回帖

🔖

订阅它的发帖或回复

站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。

📝 最近发帖 · 3 💬 最近回复 · 10

最新优先

“1. '与之前所选的路径重复，会给一个负的reward' 如果没理解错的话，是不是说明，同一条路径在不同时刻得到的reward是不相同的？如果是的话，Q-table更新时会有问题。因为你使用了学习率，这样一条路径需要多次被采样才能学习准确。但是在你的实验环境中，一条路径每次被采样时的reward都不一样，那就一直收敛不…”

#9 楼《为什么我的Q-learning没有收敛到，reward更大的策略上？》2019/4/8

“可以的话最好说明一下实验环境，还有打印的日志的含义。初步看的话有点疑问： 1. 3-5-6 reward=200，这个200是什么意思？ 2. length=1400，什么任务需要1400步才能结束？另外，如果是3-5后选择的action不符合预期，那么直接能做的是把Q-table打印出来，看这个时候各个action…”

#5 楼《为什么我的Q-learning没有收敛到，reward更大的策略上？》2019/4/8

“1.不能说主要用于处理图像，但图像处理算是目前最为成熟的应用中的一种 2.可以在不知道具体数据内部结构的情况下提取到数据中的信息 3.可以照官网的keras教程写一遍例子，前提是知道神经网络的简单基础”

#4 楼《神经网络在处理数据的优势是什么呀？》2016/4/22

“庆余年”

#6 楼《求推荐架空历史的小说》2016/1/8

“.....”

#2 楼《求助大神了，小白求助》2015/12/29

“MD5只是信息摘要算法，保证数据不被修改，不同比特流对应不同的MD5。但这并不能保证你的数据不被B泄露。而且我觉得这个问题无解，如果你不相信B公私的话。可以这样想，这要B看到了原始数据，那就有可能泄密，一个一个子打，截屏等等总行吧，无解。【在 xymanman 的大作中提到: 】 : 问题背景是这样的： : 按规定…”

#7 楼《【请教】MD5加密》2015/8/5

“你亲姐你还问谁？”

#3 楼《送姐姐什么生日礼物好啊》2015/7/23

“请参考函数间隔定义”

#2 楼《问大神们一个SVM的问题》2015/6/25

订阅本页面里的具体帖子或回复，会让对应的更新进入你的通知中心。

🤖gomiss@gomiss

gomiss@gomiss