
Open-Sora是由北京大学与兔展智能联合发起的开源计划,旨在复现OpenAI的Sora视频生成模型,推动AI视频技术的普惠化发展。项目于2024年3月1日公开,核心技术架构包括Video VQ-VAE(支持视频压缩与可变时长处理)、Denoising Diffusion Transformer(去噪扩散模型)和Condition Encoder(多条件信息编码)。通过动态掩码策略和位置插值技术,Open-Sora已实现可变长宽比、可变分辨率及可变时长的生成能力,并公开了训练代码与演示案例。尽管受限于算力资源,其第一阶段成果已支持生成2秒的512×512视频,第二阶段计划扩展至20秒以上、720P清晰度的视频生成。项目开源后迅速获得全球开发者关注,GitHub访问量超14万次,吸引了美、英、德等多国技术人员参与协作。
数据统计
数据评估
关于Open-Sora特别声明
本站一芯AI资源导航提供的Open-Sora都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由一芯AI资源导航实际控制,在2025年3月23日 下午7:09收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,一芯AI资源导航不承担任何责任。
相关导航

在您的浏览器中组装、配置和部署自主 AI 代理
暂无评论...