GoogleVeo针对电影制作人的新型生成式AI视频模型

导读 这家互联网搜索巨头已将目光瞄准电影制作人,推出了其最新的生成式AI视频模型Veo。据谷歌称,Veo能够使用文本、图像和视频提示作为输入,生...

这家互联网搜索巨头已将目光瞄准电影制作人,推出了其最新的生成式AI视频模型Veo。据谷歌称,Veo能够使用文本、图像和视频提示作为输入,生成时长超过一分钟的“高质量”1080p分辨率视频。

三个月前,OpenAI展示了其文本转视频AISora,引起了该领域的关注。谷歌在I/O开发者大会上发布了这款产品,旨在与Veo争夺该领域的关注,强调其能够制作各种视觉和电影风格的视频。

谷歌称Veo拥有“对自然语言的高级理解能力”,它可以解释电影术语,例如“延时摄影”或“风景的空中拍摄”。用户可以通过文本、图像或基于视频的提示来引导所需的输出,从而制作出被誉为“更一致、更连贯”的视频。这些视频通过镜头描绘了人物、动物和物体的真实运动。

在新闻发布会上,谷歌DeepMind首席执行官DemisHassabis提到,用户可以通过附加提示来优化视频结果。此外,谷歌正在探索使Veo能够创建故事板和更长场景的功能。

与许多AI模型的预览一样,那些渴望亲自尝试Veo的人可能会面临一段等待期。谷歌表示,它将向选定的电影制作人和创作者发出邀请,让他们尝试该模型,寻求有关如何最好地服务于创意社区的意见。这些合作将确保创作者在谷歌AI技术开发中拥有发言权。

某些Veo功能将通过VideoFX中的私人预览版“在未来几周内”向选定的创作者开放。感兴趣的人可以加入候补名单,以便尽早测试这些功能。此外,谷歌计划在未来将一些Veo功能整合到YouTubeShorts中。

近年来,谷歌开发了多种视频生成模型,包括Phenaki、ImagenVideo和今年早些时候展示的Lumiere模型。虽然Lumiere令人印象深刻,但Veo据称更擅长理解视频内容、模拟现实世界的物理现象和渲染高清输出。

与此同时,OpenAI正在积极向好莱坞推广Sora,并计划在今年晚些时候向公众发布。该公司的目标是将音频融入Sora,并将该模型直接集成到Adob​​ePremierePro等视频编辑应用程序中。凭借OpenAI的领先优势和Sora针对电影制作人的应用,谷歌的Veo可能会在市场上面临激烈的竞争。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。