返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #6830786同步于 2024/2/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
关于sora的一些分析
IWhisper#421
2024/2/16镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
吸取chatgpt大语言模型的成功经验,创造了对应 Token 的 “[bbsemoji160]Patch[bbsemoji160]” 概念用于训练 Sora 这个视频模型,继续采用了 Transformer 架构。
在训练端,利用自家 DALL·E 3 的 re-captioning 功能,给训练用的视频素材都加上了高质量文本描述。
在输入端,利用了GPT 的能力,在用户给 Sora 输入提示词的时候,先将用户输入的提示词进行精准的详尽扩写,让 Sora 遵循提示词来生成更精准的视频。
“OpenAI 自己先成为了一个巨人,然后再站在自己这个巨人的肩膀上,成为了一个新的巨人。而其他竞争对手,或许会因为文生文、文生图上的技术差,在未来被甩的更远。”
感觉张楠卸任抖音CEO,转向聚焦剪映这事,可能多少预知了一些消息~