GoogleVeo针对电影制作人的新型生成式AI视频模型

2024-05-28 13:58:16

导读这家互联网搜索巨头已将目光瞄准电影制作人，推出了其最新的生成式AI视频模型Veo。据谷歌称，Veo能够使用文本、图像和视频提示作为输入，生

这家互联网搜索巨头已将目光瞄准电影制作人，推出了其最新的生成式AI视频模型Veo。据谷歌称，Veo能够使用文本、图像和视频提示作为输入，生成时长超过一分钟的“高质量”1080p分辨率视频。

三个月前，OpenAI展示了其文本转视频AISora，引起了该领域的关注。谷歌在I/O开发者大会上发布了这款产品，旨在与Veo争夺该领域的关注，强调其能够制作各种视觉和电影风格的视频。

谷歌称Veo拥有“对自然语言的高级理解能力”，它可以解释电影术语，例如“延时摄影”或“风景的空中拍摄”。用户可以通过文本、图像或基于视频的提示来引导所需的输出，从而制作出被誉为“更一致、更连贯”的视频。这些视频通过镜头描绘了人物、动物和物体的真实运动。

在新闻发布会上，谷歌DeepMind首席执行官DemisHassabis提到，用户可以通过附加提示来优化视频结果。此外，谷歌正在探索使Veo能够创建故事板和更长场景的功能。

与许多AI模型的预览一样，那些渴望亲自尝试Veo的人可能会面临一段等待期。谷歌表示，它将向选定的电影制作人和创作者发出邀请，让他们尝试该模型，寻求有关如何最好地服务于创意社区的意见。这些合作将确保创作者在谷歌AI技术开发中拥有发言权。

某些Veo功能将通过VideoFX中的私人预览版“在未来几周内”向选定的创作者开放。感兴趣的人可以加入候补名单，以便尽早测试这些功能。此外，谷歌计划在未来将一些Veo功能整合到YouTubeShorts中。

近年来，谷歌开发了多种视频生成模型，包括Phenaki、ImagenVideo和今年早些时候展示的Lumiere模型。虽然Lumiere令人印象深刻，但Veo据称更擅长理解视频内容、模拟现实世界的物理现象和渲染高清输出。

与此同时，OpenAI正在积极向好莱坞推广Sora，并计划在今年晚些时候向公众发布。该公司的目标是将音频融入Sora，并将该模型直接集成到AdobePremierePro等视频编辑应用程序中。凭借OpenAI的领先优势和Sora针对电影制作人的应用，谷歌的Veo可能会在市场上面临激烈的竞争。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢。

标签：

上一篇:苹果的新软件更新将帮助你应对晕动症

下一篇:新颖的设计方法利用易于合成的罗丹明螺内酰胺衍生物实现非线性光致变色