

内容摘要
Veo是谷歌的视频生成大模型,最新Veo 3.1在原生音画同步,多模态输入能力方面进行了升级。其核心技术为潜在空间扩散架构,并结合了Transformer,在大量来自Youtube的真实音、视频数据的基础上,实现真实、连贯、音画同步的文生视频、图生视频、视频扩展等功能;
Nano Banana是谷歌的图片生成大模型,最新Nano Banana Pro具备高分辨率输出(最高至4K)、准确文字渲染(准确生成复杂带文本图表)、精细操控(微调、变换局部区域的角度、焦点景深等)、理解世界/实时接入(根据真实世界实时生成信息图)四大优势。

报告内容







更多报告内容菜单栏
回复暗号
计算机行业大模型及AI应用专题(2):Gemini+3.0/Nano密集发布,从谷歌AI体系看应用叙事-251229-国海证券-38页
联系助理获取



往期推荐













