用户3478用户34781. 原生多模态路线:基于通用的融合架构对文本、图像、视频等多模态数据进行统一范式的训练,提升对开放域下复杂交互场景的信息生成能力。 2. 底层全栈自研:拥有“底层算法原始创新”的自研能力,涵盖对多模态大模型的架构设计、训练策略、加速推理、可控生成等全栈技术领域。 3. 端到端应用产品:综合个性化交互体验、多模态信息融合、任务自动化执行、个人终端运行等不同能力维度,打造“AI native”时代下的全新应用。 |
| ViduQ1 | Vidu2.0 | |
区分 | Q系列主打高质量、数字系列主打速度,生成速度更快 | | |
| Vidu Q1视频生成专注于高质量的视频生成,模型支持: • 文生视频:写实风格崩坏率降低,变色的问题得到了解决,在美学、质感等方面也有较明显提升;动画风格在视角理解、复杂转场、2D动画风格方面综合稳定且效果较好 • 图生视频:崩坏率明显下降,同时清晰度有了明显的提升,生成时长从原来4s增长到5s • 参考生视频:Q1在主体、背景一致性、画质等方面优于2.0版本,画面的崩坏、胡抖减少 | Vidu 2.0更好平衡了速度与画面质量,模型支持: • 图生视频:4s时长的视频 支持360p、720p、1080p 三种分辨率;8s 时长的视频仅支持720p; • 首尾帧:4s时长的视频 支持360p、720p、1080p 三种分辨率;8s 时长的视频仅支持720 | |
优势 | 1. 清晰度:清晰度得到了大大加强,画质得到了明显提升; 2. 崩坏控制:手部的穿模、画面抖动问题得到了显著的优化; 3. 风格表现:本次写实的真实程度,和2D动画画风的保持得到了优化和加强; 4. 转场的丝滑程度:首尾帧转场的丝滑程度再次提升,仍然优于市面上所有的其他模型。 | 1. 速度:视频生成速度大幅加快; 2. 价格:720p、1080p 价格整体相对 1.5 有大幅度降低; 3. 图生视频:修复了变色等问题,画面更稳定可控,对电商场景更加适用,风格保持也很出色; 4. 首尾帧:在兼顾较好想象力和稳定性的基础上,效果各方面整体提升,特别是语义理解能力有大幅度增强,目前最好的首尾帧模型; 5. 参考生:一致性大大加强,针对于多个参考图的效果会更好。 | |
建议场景 | 影视、广告、动漫短剧、电商 | 泛互娱乐、动漫短剧、广告、电商 | |