返回信息流不错的
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7166391同步于 2024/5/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
gpt4o
IWhisper#42
2024/5/13镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
很快,感觉就是在和人聊天那种快
支持多模态端到端;以前是语音转文字,生成输出在转语言,现在语音直接转语音,能识别语气等信息了
网上有很多演示的视频了,去看几个就能感受够到了
还是语音转文字
: 支持多模态端到端;以前是语音转文字,生成输出在转语言,现在语音直接转语音,能识别语气等信息了
: ............
就是端到端的:<https://openai.com/index/hello-gpt-4o/>
支持语音直接转语音,估计也能有文字的输出:
“With GPT-4o, we trained a single new model end-to-end across text, vision, and audio, meaning that all inputs and outputs are processed by the same neural network. Because GPT-4o is our first model combining all of these modalities, we are still just scratching the surface of exploring what the model can do and its limitations.”