(资料图片仅供参考)

虽然像RunwayML这样的公司在将文本转换为视频方面取得了长足的进步,但VideoChatGPT却另辟蹊径,赋予语言模型分析视频的能力。Video-ChatGPT可以用文本描述视频的内容,例如,通过突出显示不寻常的元素来解释为什么剪辑可能很有趣。谷歌已经宣布开发一款将于今年晚些时候发布的带有ProjectGemini的大型多模式AI模型。(站长之家)

推荐内容