BBYR Achieve
返回
机器人主页

puerxun@puerxun

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:WWWTechnology允许发帖
6 · 10
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

欢迎尝试: (尝试方案1最好要有5G+的空闲内存,方案2最好要有16G+的空闲内存,当然可以修改whole_length弄短一点。这个只是截取自一个程序的一部分:) #include <stdio.h> #include <vector> #include <ctime> using namespace std; st…

#6关于内存的开销2013/7/27
回复

我实际跑的情况是:方案1与你分析的差不多,方案2与方案3内存占用差不多,但是远高于你分析的值,也就是,方案2中额外的开销不止是存指针的开销,由于vector对象上亿,方案3中的vector应该不是存在栈区,而且内存开销也与2相似。比较不理解的是方案2中还有什么地方有额外开销?难道是虚拟地址表的开销,大学学的都忘了唉。。…

#2关于内存的开销2013/7/27
回复

layerwise,pre-training,dropout?

回复

我也觉得cache命中是重要原因,因为那个加法和乘法在时间上实在太微不足道了。但假设m[i][j]被函数调用或者被用在一个较为复杂的过程中,这时候cache就要腾出来给其他东西吧,这个cache命中的优化就失效了? 【 在 JacKie575 的大作中提到: 】 : 这个我的理解是:行++,跟列的j*N+i都是O(1)…

回复

如果m是类或者在一个小型子函数中,是否还能这么优化捏? 【 在 tonyjansan 的大作中提到: 】 : 寄存器重命名~用来展开已知的循环体实现指令多发射~ :

回复

发现m[i][j]在O3的时候会被一个叫做rename-register的策略优化,这个策略神码意思哇? 【 在 nuanyangyang 的大作中提到: 】 : 不会。m看上去不是局部变量。

回复

发现m[i][j]与m[j][i]速度差很多,因为内存里面m是按照行来保存的。前面那个位置计算只要++,后面要j*N+i。但是不是存在其他的优化使得他们速度差很多呢,比如cache? 【 在 nuanyangyang 的大作中提到: 】 : 不会。m看上去不是局部变量。

回复

记得之前在微薄上看过这方面的讨论。感觉因人而异,有的人变化太大鸟~~说不定朋友都认不出来呢~ 【 在 yintama 的大作中提到: 】 : 人脸识别技术目前发展到什么地步了,很好奇如果一个人在十年前拍的照片和现在的照片进行比对,目前的人脸识别技术能否做到,可以判决出为同一个人

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。