CogVideo是目前最大的通用领域文本到视频生成预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的,旨在通过理解和转换文本描述来生成相应的视频内容。CogVideo能够处理大量的文本-视频对数据,并通过学习这些数据的模式来生成与文本描述相匹配的视频。
数据统计
数据评估
关于CogVideo特别声明
本站智媒导航提供的CogVideo都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由智媒导航实际控制,在2024年11月10日 下午5:26收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,智媒导航不承担任何责任。
相关导航
暂无评论...