返回信息流单模态,多模态,看ieee论文,读源码,但是,,,,简单的算法都需要极其强大的算力(比如clip这种需要四百块v100还要训练一个月),复杂的算法倒是不太需要,但太复杂了也很难读懂(大概只需要三块v100训练几天)
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7541081同步于 2024/9/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
怎么自学大模型啊
IWhisper#774
2024/9/3镜像同步18 回复
订阅后,新回复会通过你的通知中心匿名送达。
18 条回复
单模态,多模态,看ieee论文,读源码,但是,,,,简单的算法都需要极其强大的算力(比如clip这种需要四百块v100还要训练一个月),复杂的算法倒是不太需要,但太复杂了也很难读懂(大概只需要三块v100训练几天)
还有数据集也是大问题,虽然可以零监督学习,但是也需要一部分标注数据预训练模型,我研究方向就是搞这个的,感觉是个坑,太缺算力了,就算搞张4090,也很难。。。
那找大模型实习的人他们都是研究方向就是这个嘛,感觉好难学啊<br>【 在 IWhisper#339 的大作中提到: 】<br><font class="f006">: 单模态,多模态,看ieee论文,读源码,但是,,,,简单的算法都需要极其强大的算力(比如clip这种需要四百块v100还要训练一个月),复杂的算法倒是不太需要,但太复杂了也很难读懂(大概只需要三块v100训练几天) </font>
你这种搞预训练的bar太高了,自学肯定不行。那种应用层的rag agent可以自学搞搞吗?<br>【 在 IWhisper#339 的大作中提到: 】<br><font class="f006">: 目前主要能干的方向就俩,要是足够牛就搞算法创新,要是不够牛就自己补充数据针对新应用场景训练已有模型,都很扯 </font>
我的目标还是想先找个实习,然后通过实习来转。硬背八股可以找大模型实习吗<br>【 在 IWhisper#351 的大作中提到: 】<br><font class="f006">: 没听说过自学大模型的 </font>
这个还是看公司战略,比如我们公司(PS我已经毕业啦),还是以场景创新居多(就是补充更多类的数据满足公司业务需求),但随着需求越发复杂,所需的数据模态得需要从两个增加到更多个,就需要进行算法创新了,我们目前在搞这个<br><br>【 在 IWhisper#774 (null) 的大作中提到: 】<br><font class="f006">: 那找大模型实习的人他们都是研究方向就是这个嘛,感觉好难学啊 </font>
不过也没招实习生,我也不太清楚实习生做什么,要是我招人的话,可能就让他们做数据标注了<img src="/img/ubb/emb/1.gif" alt="emb1" style="display:inline;border-style:none"><br><br>【 在 IWhisper#339 (null) 的大作中提到: 】<br><font class="f006">: 这个还是看公司战略,比如我们公司(PS我已经毕业啦),还是以场景创新居多(就是补充更多类的数据满足公司业务需求),但随着需求越发复杂,所需的数据模态得需要从两个增加到更多个,就需要进行算法创新了,我们目前在搞这个 </font>
但是这个真的适合实习生搞嘛<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br><br>【 在 IWhisper#339 (null) 的大作中提到: 】<br><font class="f006">: 不过也没招实习生,我也不太清楚实习生做什么,要是我招人的话,可能就让他们做数据标注了<img src="/img/ubb/emb/1.gif" alt="emb1" style="display:inline;border-style:none"> </font>
没有训练经验进公司的话大概率是造数据<br>【 在 IWhisper#774 的大作中提到: 】<br><font class="f006">: 我的目标还是想先找个实习,然后通过实习来转。硬背八股可以找大模型实习吗 </font>
rag agent本质上就是Java,跟大模型没什么关系<br>【 在 IWhisper#752 的大作中提到: 】<br><font class="f006">: 你这种搞预训练的bar太高了,自学肯定不行。那种应用层的rag agent可以自学搞搞吗? </font>
但是我看公司招聘这两个也都是标的算法岗,我搞了半年Java了,明年秋招想转类似于rag agent应用还来得及吗?但是标的都是算法岗我怕到时候bar又不够<br>【 在 IWhisper#882 的大作中提到: 】<br><font class="f006">: rag agent本质上就是Java,跟大模型没什么关系 </font>
大模型,实验室没接项目别学<img src="/img/ubb/em/2.gif" alt="em2" style="display:inline;border-style:none">