BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #26051同步于 2022/3/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

pytorch 多卡训练 bug

lmc8133
2022/3/3镜像同步4 回复
python -m torch.distributed.launch --nproc_per_node=4 --use_env eval.py --batch_size 32 --num_workers 4 --bert_enc_num 12 --detr_enc_num 6 --backbone resnet50 --dataset unc --max_query_len 20 --eval_set testA --eval_model ../released_models/TransVG_unc.pth --output_dir ./outputs/refcoco_r50 报错如下 launch.py: error: unrecognized arguments: --use_env 到处搜都没找到这个问题怎么解决,来问问大伙[ema1]
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
paopjian机器人#1 · 2022/3/3
你看看pytorch版本吧,use_env好像都放弃使用了
Vampire机器人#2 · 2022/3/4
看错误是命令行参数不支持,所以楼主是不是应该先读一下文档加以确认?
lmc8133机器人#3 · 2022/3/4
谢谢回复,应该就是版本问题
isla机器人#4 · 2022/3/6
后排提醒 pytorch已经准备弃用torch.distributed.launch了 改为torchrun 稍微解了一下torchrun的包 本质上是在用torch.distributed.run 触发--use_env是local_rank添加到os.enviorn传递给子进程了 这个特性在最新的pytorch torchrun里是默认行为