成果介绍
近些年随着中美博弈深化,为了避免IT领域关键技术被“卡脖子”,对国家安全造成威胁,全面落实信息系统的国产化改造已大势所趋。其中,应用软件从非国产化平台向国产平台移植过程中面临技术难度大、成本高昂、移植周期长等难题,不仅延缓了各大行业国产化替代的进程,也影响了国产基础软硬件的生态建设。信创软件跨平台移植技术与工具面向信创体系的多处理器种类、多架构场景,将自动化和智能化充分结合到应用软件的信创改造过程中,切实实现应用软件与基础软硬件的解耦合,显著降低国产化替代的难度和成本,为确保我国信息技术体系的安全、自主、可控提供可靠技术支撑。
成果亮点
本成果的主要亮点体现在如下三点:
(1)基于大模型的智能化架构相关代码分析技术
本项目拟研究针对信创领域的大模型微调技术,形成信创领域的专用大模型。同时,创新性地利用大模型实现对Java、JavaScript、C/C++等常用高级开发语言开发的软件源码中架构相关代码段的智能化分析、定位和改写,显著提升软件跨平台移植的效率和准确率。
(2)混合语义粒度的架构无关中间表示技术
该技术针对架构相关语义进行分类表示:头文件引用、宏定义、函数接口、第三方库等,并在此基础上,创新性地针对不同类别的架构相关语义表示需求,对原始编译中间表示进行扩展并改进对应的编译流程,从而实现对高层次架构相关语义的表示支持。
(3)分隔架构相关、架构无关语义的二段编译处理流程技术
该技术创新性地将传统的编译流程划分为两个独立的阶段:在第一阶段,首先进行架构相关代码的标记与识别,之后,针对架构相关代码和架构无关代码进行独立处理:架构无关代码依然采用传统编译方法获得对应的编译中间表示;架构相关代码,则通过创新的编译流程编译为混合语义体架构,进行第二段编译,将编译中间表示通过传统编译流程中的第二阶段转换为硬件平台对应的指令
团队介绍
浙江金网信息产业股份有限公司、清华大学、宁波工程学院三方共同研发该成果。其中金网信息组成由郭辉领导的团队负责项目的组织实施、协调,组织技术方案论证、项目验收、鉴定,项目成果的具体实施与技术示范应用推广,技术上负责编译器中架构无关中间表示的关键技术研究与示范应用的研究等工作;清华大学研发团队包括渠鹏、张悠慧等人负责跨架构二段编译技术的研究和编译工具链的设计;宁波工程学院则由姚拓中、鲍淑娣组成研发团队信创领域负责人工智能大模型的研发。
成果资料