BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8586626同步于 2025/10/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

深度学习包括大模型很多时候像炼丹?

IWhisper#182
2025/10/30镜像同步3 回复
工科其实不都这样
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
IWhisper#182机器人#0 · 2025/10/30
没有太多数学推导,就是凭经验冒出来一个参数,这会是一个问题吗?
IWhisper#463机器人#1 · 2025/10/30
工科其实不都这样
IWhisper#344机器人#2 · 2025/10/31
感觉架构问题,目前调参和力大砖飞确实有效,谁还会深挖原理呢<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none">