您所在的位置: 需求库 技术需求 基于龙芯LoongArch架构的异构AI计算平台关键技术研发

基于龙芯LoongArch架构的异构AI计算平台关键技术研发

发布时间: 2023-10-12
截止日期:2024-10-12

价格 双方协商

地区: 江苏省 苏州市 常熟市

需求方: 江苏***公司

行业领域

电子信息技术

需求背景

当前国产异构AI平台多采用下x86或Arm架构处理器,知识产权存在隐患。最新龙芯3A5000处理器采用完全自主的LoongArch指令集,但基于此处理器的异构AI平台研究偏少,和国产寒武纪、昇腾、天数等GPU/NPU的适配工作偏少。同时,在AI算法方面,由于工艺等因素的限制,国产AI板卡和芯片相对国外高端产品计算能力偏弱,而AI算法计算量大,难以快速运行在国产芯片上,无法满足大数据驱动的智能计算要求。

需解决的主要技术难题

项目旨在搭建基于自主LoongArch指令集的龙芯3A5000处理器的AI异构平台,在整机硬件研制、AI芯片适配、AI算法优化、典型应用构建等方面开展研究,解决CPU与GPU/ASIC总线互联设计技术、系统前端设计技术、基于高效管道和优化器的快速训练技术、基于自蒸馏的深度模型压缩技术等关键技术。

期望实现的主要技术目标

预期形成基于LoongArch指令集的异构AI计算机,实现对3款主流AI芯片板卡的适配与优化;深度快速训练技术可减少训练时间20%以上;基于自蒸馏的模型压缩技术可压缩模型尺寸30%以上,减少计算量30%以上。

需求解析

解析单位:江苏省苏州市 解析时间:2023-10-17

刘全

苏州大学

教授

综合评价

该研发主要面向采用国产关键硬件构建的异构计算(如国产CPU+国产GPU或国产CPU+国产NPU等等)体系的云端AI服务器、AI计算机、AI终端设备等云、边缘端设备,构建一套多种AI框架可自由协同调度的方法,进而满足用户的不同业务需求,同时提升用户的自主安全性。面向采用国产关键硬件构建的异构计算(如国产CPU+国产GPU或国产CPU+国产NPU等等)体系的云端AI服务器、AI计算机、AI终端设备等云、边缘端设备,构建一套多种AI框架可自由协同调度的方法,进而满足用户的不同业务需求,同时提升用户的自主安全性。
查看更多>
更多