【资料图】

阿里达摩院在魔搭社区发布了一个新的人工智能模型,可以根据用户输入的英文文本提示,自动生成对应的视频。这个模型由三个子网络组成,整体参数约17亿,采用了扩散模型的结构,通过从噪声视频中迭代去噪的过程,实现视频生成的功能。或许我们只需要一些文字提示,就能制作出任何风格和主题的视频内容。(站长之家)

推荐内容