自主研发大模型领先

用户3478

1月13日修改

1 模型介绍

将U-ViT架构运用于长视频生成模型，率先突破长视频生成瓶颈，推出中国首个长视频大模型Vidu。​

1.
原生多模态路线：基于通用的融合架构对文本、图像、视频等多模态数据进行统一范式的训练，提升对开放域下复杂交互场景的信息生成能力。​

2.
底层全栈自研：拥有“底层算法原始创新”的自研能力，涵盖对多模态大模型的架构设计、训练策略、加速推理、可控生成等全栈技术领域。​

3.
端到端应用产品：综合个性化交互体验、多模态信息融合、任务自动化执行、个人终端运行等不同能力维度，打造“AI native”时代下的全新应用。​

common.docs_name - LarkCCM_Docs_Menu_Image

2 模型区别及视频参考

	ViduQ1	Vidu2.0
区分	Q系列主打高质量、数字系列主打速度，生成速度更快
	Vidu Q1视频生成专注于高质量的视频生成，模型支持： • 文生视频：写实风格崩坏率降低，变色的问题得到了解决，在美学、质感等方面也有较明显提升；动画风格在视角理解、复杂转场、2D动画风格方面综合稳定且效果较好 • 图生视频：崩坏率明显下降，同时清晰度有了明显的提升，生成时长从原来4s增长到5s • 参考生视频：Q1在主体、背景一致性、画质等方面优于2.0版本，画面的崩坏、胡抖减少	Vidu 2.0更好平衡了速度与画面质量，模型支持： • 图生视频：4s时长的视频支持360p、720p、1080p 三种分辨率；8s 时长的视频仅支持720p； • 首尾帧：4s时长的视频支持360p、720p、1080p 三种分辨率；8s 时长的视频仅支持720
优势	1. 清晰度：清晰度得到了大大加强，画质得到了明显提升； 2. 崩坏控制：手部的穿模、画面抖动问题得到了显著的优化； 3. 风格表现：本次写实的真实程度，和2D动画画风的保持得到了优化和加强； 4. 转场的丝滑程度：首尾帧转场的丝滑程度再次提升，仍然优于市面上所有的其他模型。	1. 速度：视频生成速度大幅加快； 2. 价格：720p、1080p 价格整体相对 1.5 有大幅度降低； 3. 图生视频：修复了变色等问题，画面更稳定可控，对电商场景更加适用，风格保持也很出色； 4. 首尾帧：在兼顾较好想象力和稳定性的基础上，效果各方面整体提升，特别是语义理解能力有大幅度增强，目前最好的首尾帧模型； 5. 参考生：一致性大大加强，针对于多个参考图的效果会更好。
建议场景	影视、广告、动漫短剧、电商	泛互娱乐、动漫短剧、广告、电商

如果您希望我们的团队为您量身定制解决方案，请留下联系方式，以便我们深入沟通。​

点击咨询 (可领取1000体验积分)

自主研发大模型领先​

自主研发大模型领先