您所在的位置: 需求库 技术需求 基于国产GPU的计算软件栈建设

基于国产GPU的计算软件栈建设

发布时间: 2023-11-28
来源: 科技服务团
截止日期:2024-12-31

价格 双方协商

地区: 湖南省 长沙市 岳麓区

需求方: 长沙***公司

行业领域

电子信息技术

需求背景

随着科技的不断发展,计算机图形处理器(GPU)已经成为了现代计算系统中不可或缺的重要组成部分。GPU具有强大的并行计算能力,能够高效地处理大量数据和复杂算法,因此在科学计算、人工智能、虚拟现实等领域得到了广泛应用。

然而,目前市场上主流的GPU产品主要由国外公司生产,如英伟达(NVIDIA)、AMD等。这些产品在性能和功能上都具有很高的水平,但同时也存在着一些问题。首先,由于技术和专利的限制,国内企业在GPU领域的自主创新能力相对较弱,很难形成自己的核心竞争力。其次,国外GPU产品的价格较高,对于一些中小企业和个人用户来说可能难以承受。此外,由于GPU的特殊性质,其软件栈的开发和维护也需要投入大量的人力和物力资源。

为了解决上述问题,越来越多的国内企业和研究机构开始关注国产GPU的发展。他们希望通过自主研发和创新,打破国外公司在GPU领域的垄断地位,提高国内企业的竞争力和市场份额。同时,他们也意识到了基于国产GPU的计算软件栈建设的重要性。只有建立起完善的软件栈体系,才能真正发挥出GPU的性能优势,满足不同领域的需求。

需解决的主要技术难题

目前在技术方面存在的困难以及需解决的问题

图形处理器(GPU)是计算机显卡的核心芯片,也是高性能计算与深度学习的关键部件,软件生态是决定GPU产品应用的核心因素,任何一个成功的计算平台都需拥有广泛而丰富的软件生态系统。如NVIDIA的成功依赖于CUDA生态系统可用的工具、库、应用程序和合作伙伴,通过软件生态的建设,构筑了强大的技术壁垒,使竞争对手难以逾越和替换。由于没有企业可提供与国产GPU配套的软件开发平台,国内所有高端军事应用系统,自动驾驶、人工智能等民用领域,基本都采用NVIDIA的CUDA平台开发应用产品,同时,由于国外GPU厂商软件开发平台完全不支持国产计算机平台,在国产计算机平台上,根本无法开发高端GPU国产应用软件。“安全与可靠”已成为国家信息产业发展的重要目标,目前计算软件的发展方向仍掌握在国外几个大公司手中,在国产GPU平台上构建自己的软件生态已经成为自主软件发展的重中之重。

期望实现的主要技术目标

相关技术指标或要求

针对景嘉微最新研制的GPU-JM9200开展计算软件栈建设,功能支持方面,需对开源计算框架进行功能适配,实现计算加速,将OpenCL接口融合到框架,达到应用兼容的目的。性能优化方面,针对JM9200架构特点对计算库进行优化。具体需求如下:

1)常用计算库的移植与优化利用OpenCL编程接口对主要计算库(优先使用具有自主知识产权的软件库,如果使用开源软件,必须具有与BSD相当的开源协议)进行移植与优化,包括clFFT、clBLAS、clDNN、clSPARSE、clLAPACK、clRNG。要求能完整支持计算库的所有接口及功能,应用能保持接口兼容,相关接口性能达到AMD RX550同等水平。

2)常用图像处理库的移植与优化利用OpenCL编程接口对主要图像处理库进行移植与优化,包括OpenCV、OpenVX。要求能完整支持图像处理库的所有接口及功能,应用能保持接口兼容,相关接口性能达到AMD RX550同等水平。

3)主要深度学习框架的移植,适配与优化利用OpenCL编程接口对主要深度学习框架进行二次开发(框架包括Tensorflow、Pytorch、Paddle),将JM9200作为后端加速设备融入计算框架,提供对CPU+ JM9200加速器高效的并行异构资源调度、自适应异构计算核心的任务映射以及多级存储的统一访问,实现JM9200对常用算子的加速。将深度学习框架移植到主要国产操作系统和实时操作系统运行。要求能在国产操作系统(包括Kylin,UOS等)平台上运行Tensorflow,Pytorch,Paddle框架,可以使用JM9200作为其加速设备。要求能完整支持Tensorflow,Pytorch,Paddle框架提供的所有功能,能支持训练和推理,应用能保持接口兼容,相关接口性能达到AMD RX550同等水平。

期望合作方式及拟投入资金(与企业、高校、科研院所等合作)

可以多种形式进行合作,产权归属归双方共有或另行协商。要求合作方在基于GPU的通用计算、图像处理或深度学习方面有较好的研究基础,有稳定的研究团队。计划总投资1000万元。

预期成果及经济社会生态效益预期成果为基于JM9200 GPU的计算软件工具集,包括:

(1)基于OpenCL1.2的常用计算库、图像处理库、深度学习框架。计算库包括:clFFT、clBLAS、clDNN、clSPARSE、clLAPACK、clRNG;图像处理库,包括:OpenCV、OpenVX;深度学习框架包括:Tensorflow、Pytorch、Paddle;

(2)为支持以上计算库、图像处理库、深度学习框架所必要的IDE开发环境、调试工具等;

(3)设计文档、测试报告、分析报告等。以上成果可用于真实感图形生成、自动驾驶、人脸识别、智能计算等相对开放的民用领域,也可以用于大型航天工程测控、电磁频谱态势感知、分布式协同电子对抗、无人装备、卫星图像处理、电磁信号分选识别、军用地理信息系统构建等军事领域。本项目的成果可以为用户提供与非国产GPU完全兼容的应用软件调用接口,缩短应用的开发周期,降低开发成本及应用迁移的难度,建立和培育国产GPU的软件生态;可以补齐国产计算环境的基础软件短板,解决行业痛点及“卡脖子”问题,建成和完善国产GPU计算软件应用创新研发体系,进一步增强自主创新能力。

处理进度

  1. 提交需求
    2023-11-28 10:21:32
  2. 确认需求
    2023-12-05 09:40:18
  3. 需求服务
    2023-12-05 09:40:18
  4. 需求签约
  5. 需求完成