返回信息流你懂的,北邮教学本来就是...
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7374493同步于 2024/7/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
在b站看见山东大学大作业是numpy手搓llama3
cengyuanhao
2024/7/9镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
我在b站看见山大大三不知道什么课大作业是numpy手搓llama3。这当然不是难到不可理解的任务,起码操作系统课设做ucore似乎就比这难,但是关键不是难度,而是山大教学和学生与时俱进的速度令人震惊。
而且我认为手搓llama3,哪怕不是从numpy开天辟地,而是从torch开始,也是能学到很多东西的。
现在似乎北邮有一些选修的挑战课,如果能增加一门课基于nanogpt的课程来带学生如何自顶向下地理解大模型,这或许是很有意义的事情。
从0用Numpy搭建可训练LLaMa3模型——山东大学威海数科班重案六组第六学期大作业 UP主: 2ertwo <https://www.bilibili.com/video/BV1BWhxe3Edj?p=1>