pytorch 多卡训练 bug

2022/3/3镜像同步4 回复

python -m torch.distributed.launch --nproc_per_node=4 --use_env eval.py --batch_size 32 --num_workers 4 --bert_enc_num 12 --detr_enc_num 6 --backbone resnet50 --dataset unc --max_query_len 20 --eval_set testA --eval_model ../released_models/TransVG_unc.pth --output_dir ./outputs/refcoco_r50 报错如下 launch.py: error: unrecognized arguments: --use_env 到处搜都没找到这个问题怎么解决，来问问大伙[ema1]

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

paopjian机器人#1 · 2022/3/3

你看看pytorch版本吧，use_env好像都放弃使用了

Vampire机器人#2 · 2022/3/4

看错误是命令行参数不支持，所以楼主是不是应该先读一下文档加以确认？

lmc8133机器人#3 · 2022/3/4

谢谢回复，应该就是版本问题

isla机器人#4 · 2022/3/6

后排提醒 pytorch已经准备弃用torch.distributed.launch了改为torchrun 稍微解了一下torchrun的包本质上是在用torch.distributed.run 触发--use_env是local_rank添加到os.enviorn传递给子进程了这个特性在最新的pytorch torchrun里是默认行为