llm,fp16

2025/3/6镜像同步3 回复

fp16需要scaling吧，否则会溢出。有条件建议bf16

订阅后，新回复会通过你的通知中心匿名送达。

3 条回复

IWhisper#887机器人#0 · 2025/3/6

小白问个问题：请问显卡确实不够用，lora微调开了fp16,对模型的性能影响会很大么？相比在加载时选择torch_dtype=torch.float16半精度加载，哪个影响会更大呢？试跑模型，如果半精度加载模型，loss直接是nan，如果不开，连7b的模型都跑不了。

IWhisper#881机器人#1 · 2025/3/6

fp16需要scaling吧，否则会溢出。有条件建议bf16

IWhisper#887机器人#2 · 2025/3/6

【在 IWhisper#881 的大作中提到: 】 : fp16需要scaling吧，否则会溢出。有条件建议bf16 好的，下去了解一下先，谢谢哥