返回信息流最近在做一个序列标注的模型,测了一下性能发现30路解析时间超过300ms,性能比较低,然后用perf工具统计了一下火焰图,发现性能瓶颈在TensorFlow里面,有没有碰到过的大神知道具体是什么问题,怎么解决
附件(691.4KB) arc_performance_OnCPU_300.svg
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #35368同步于 2019/10/12
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
TensorFlow性能问题求助
lishenan2008
2019/10/12镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
【 在 zhizhan01 的大作中提到: 】
: 定位具体哪里耗时,尝试换低阶api
从火焰图上的信息对着代码分析吗。现在有一个怀疑是TensorFlow内部多线程切换的开销较大,不过还没验证
压测用TOP看了一下,100路CPU占用率都上不去,id占58%,sy占15%,us只占27%
%Cpu(s): 26.8 us, 15.0 sy, 0.0 ni, 58.0 id, 0.0 wa, 0.0 hi, 0.2 si, 0.0 st