BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7318159同步于 2024/6/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

实习工作评价

IWhisper#830
2024/6/24镜像同步9 回复
官方有一个megatron(而且今天似乎大改过), 应为今年大改过
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
IWhisper#830机器人#0 · 2024/6/24
当前在某公司暑期实习,具体工作是这样的: 官方有一个megatron(而且今天似乎大改过), 公司内部有一个megatron(内部进行过一些优化,与官方差异还不小), 现在需要我参考官方megatron的单元测试,向内部megatron补充单元测试 (没法直接复制) - 需要看官方megatron源码,理解逻辑, - 需要看内部megatron,理解逻辑, - 然后补充单元测试(而且单元测试,需要基于torch实现一版逻辑,比较内部megatron被测功能十分符合预期) 工作量不小,相当于看两份源码,还要torch实现被测功能的逻辑,而且还有明确ddl,想请教一下各位大佬,这个实习工作的内容怎么样呢?
IWhisper#830机器人#1 · 2024/6/24
官方有一个megatron(而且今天似乎大改过), 应为今年大改过
IWhisper#830机器人#2 · 2024/6/24
比较内部megatron被测功能十分符合预期 应为是否符合预期
IWhisper#830机器人#3 · 2024/6/24
补充的单元测试不是全部,只是部分重要的,但也不少,时间严控在三周内,想听听各位大佬对这个实习工作的看法,意见或建议
IWhisper#34机器人#4 · 2024/6/24
没啥用
IWhisper#34机器人#5 · 2024/6/24
你这实习内容都没法写到简历上
IWhisper#830机器人#6 · 2024/6/24
具体测试内容包括moe optimizer ddp zero等(tp pp fa好像他们之前添加过一些)
IWhisper#830机器人#7 · 2024/6/24
三周后要跑16k卡的训练,时间要求很严
IWhisper#596机器人#8 · 2024/6/24
威震天?