Zelda@Zelda
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“Python的gc是不会把资源返还给操作系统的。你可以做一下实验,gc后再创建一个那么大的对象,看看它还会不会再向操作系统申请那么大的空间。”
“我用的iPad 2018+Apple Pencil。精度是没有问题的,60Hz的刷新率跟Pro比也没有明显的不同。这个组合基本提供了电子化输入的最佳体验。 但是,它的体验和纸+钢笔的组合根本没法比。”
“完整的推导是这样的:”
“博客是正确的。我的推导也是正确的,只不过没有算完。 xi不光可以通过x^i、yi这条路径影响loss,还可以通过其它的y影响loss。 【 在 jj8401 的大作中提到: 】 : 我觉得 https://kevinzakka.github.io/2016/09/14/batch_normalization/ 这个博客…”
“博客里的trick是x^-1.5=(x^-0.5)(x^-0.5)^2,只是为了化简结果,对结果没影响。 我看了一眼这个人引用的博客http://cthorey.github.io./backpropagation/ 现在我怀疑我计算的结果是输入是标量的时候特殊解,但不是很确定。 【 在 whensean 的大作中提到…”
“And then there were none”
“initializer是he_normal,regularizer是l2(1e-4)。 【 在 viredery 的大作中提到: 】 : 训练参数是什么呀,按照论文上设置的?”
“后来我在Idendity block的两个Conv layer中间加了Dropout 0.5,把网络缩减到十层,虽然还是过拟合,但val loss至少不会飞了,acc也有3%的提升。不过和论文差距还是很大,我还是怀疑是我的网络结构哪里弄错了。 【 在 szjh 的大作中提到: 】 : : 我没看见你的Dropout啊;…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。