Google Imagen 2:Google的Imagn 2图像生成模型可以利用文本生成4秒的视频。
Imagen提供先进的生成式媒体能力。Gemini模型非常适用于高级推理和通用用例,而任务特定的生成AI模型可以帮助企业提供专业能力。今天预览的文本到动态图片功能使Imagen在企业工作负载中更加强大。这允许营销和创意团队根据文本提示生成动态图片,如GIF等。初始时,动态图片将以每秒24帧(fps)的速度交付,分辨率为360x640像素,持续时间为4秒,计划进行持续增强。考虑到该模型专为企业应用设计,它擅长主题,如自然、食物图像和动物。它可以生成一系列的摄像机角度和动作,同时支持整个序列的一致性。Imagen的动态图片生成功能配备了安全过滤器和数字水印,以维护创作者和用户之间的信任承诺。此外,我们还通过高级照片编辑功能更新了Imagen 2.0的图像生成能力,包括修补和扩展。现在在Vertex AI上通用的这些功能,使用户可以轻松地删除图像中不需要的元素、添加新元素,并扩展图像边界,以创造更广阔的视野。此外,我们基于Google DeepMind的SynthID技术的数字水印功能现已通用,使客户能够生成隐形水印并验证Imagen系列模型生成的图像和动态图像。
(来源:站长之家)
免责声明:本站文章部分内容为本站原创,另有部分容来源于第三方或整理自互联网,其中转载部分仅供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对其内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。