返回信息流tensorflow新手求助,现在手上有10个ip资源,每个ip一个gpu和一个cpu,目前对着文档,将py文件和数据均拷贝到每一个ip,在每台ip上分别设置命令,指定job以及task_id,然后依次启动ps、worker,能跑通。但是觉得这种操作太麻烦,自己也是刚刚入坑tensorflow,请问有没有前辈了解,如何直接在一台ip上就可以分发整个集群的命令,而不用每次启动都要在每个ip上输入相应命令。最近查了一些资料也没有很好的参考,要是有资料推荐也不胜感激。先拜谢了!
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24928同步于 2017/7/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】tensorflow分布式新手请教
HenryBigD
2017/7/21镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复