基于龙芯LoongArch架构的异构AI计算平台关键技术研发
价格 双方协商
地区: 江苏省 苏州市 常熟市
需求方: 江苏***公司
行业领域
电子信息技术
需求背景
当前国产异构AI平台多采用下x86或Arm架构处理器,知识产权存在隐患。最新龙芯3A5000处理器采用完全自主的LoongArch指令集,但基于此处理器的异构AI平台研究偏少,和国产寒武纪、昇腾、天数等GPU/NPU的适配工作偏少。同时,在AI算法方面,由于工艺等因素的限制,国产AI板卡和芯片相对国外高端产品计算能力偏弱,而AI算法计算量大,难以快速运行在国产芯片上,无法满足大数据驱动的智能计算要求。
需解决的主要技术难题
项目旨在搭建基于自主LoongArch指令集的龙芯3A5000处理器的AI异构平台,在整机硬件研制、AI芯片适配、AI算法优化、典型应用构建等方面开展研究,解决CPU与GPU/ASIC总线互联设计技术、系统前端设计技术、基于高效管道和优化器的快速训练技术、基于自蒸馏的深度模型压缩技术等关键技术。
期望实现的主要技术目标
预期形成基于LoongArch指令集的异构AI计算机,实现对3款主流AI芯片板卡的适配与优化;深度快速训练技术可减少训练时间20%以上;基于自蒸馏的模型压缩技术可压缩模型尺寸30%以上,减少计算量30%以上。
需求解析
解析单位:江苏省苏州市 解析时间:2023-10-17
刘全
苏州大学
教授
综合评价