您所在的位置: 成果库 通用视频大模型---实现小时级别视频中“大海捞针”

通用视频大模型---实现小时级别视频中“大海捞针”

发布时间: 2026-04-14

基本信息

合作方式: 技术转让
成果类型: 新技术
行业领域:
新一代信息技术产业,人工智能
成果介绍
2022年联合团队发布首个通用视频理解基础模型 InterVideo1.0,构建了可泛化的视频基础表征能力,全面覆盖视频识别、开放感知、时空解析三大核心领域。2024年联合团队发布多模态视频理解大模型IntemVideo2.0,新增了多模态视频理解与对话能力,在识别检索、开放问答高阶推理等复杂视频理解任务取得了国际领先性能。
成果亮点
2025年发布的全新升级版本 InternVideo2.5,在复杂视频理解的时间跨度与细粒度取得了双维提升,“记忆力”较前代模型扩容6倍,具备万帧长视频中精准“大海捞针能力。IntemmVideo 系列大模型已成功应用于中央广播电视总台巴黎奥运会直播,能精准定位运动员的得分瞬间及相关慢动作,提升了电视节目编创效率。该模型也跟通信行业龙头企业在终端视频内容分析、自动驾驶、AIGC内容生成等场景进行了合作应用。InternVideo2.5 凭借强大的长视频处理能力,将为互联网内容安全、监控安防、智慧体育,影视创作、虚拟现实等应用提供更高效的 AI技术支持,助力各行业实现智能化升级。
团队介绍
联系人: 庄老师 电话:15295039286 单位名称:常州市武进区科技成果转移中心
成果资料