芯东西6月15日报道,又一家国产GPU公司的新品出鞘!今日下午,中科恒星(简称ATS)宣布推出国产自主GPU架构“天狼星”。
▲邓仰东博士介绍“天狼星”GPU架构
中科恒星成立于2019年8月,致力于自研核心图形架构GPU芯片,提供芯片产品和相关系统解决方案。其研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA合作教授邓仰东博士带队。
(资料图片)
邓仰东是GPU通用计算最早研究人员之一,被誉为“GPU通用计算先行者”,长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作,曾设计出全球第一个基于FPGA的GPU仿真平台,研究成果在ISCA、MICRO等顶级会议和期刊发表;撰写过多部教材和专著,其中《异构处理器OpenCL编程导论》是国内GPU异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。
谈及给GPU架构取名为“天狼星”的原因,中天恒星创始人黄永博士说:“我们的架构全部是以恒星来命名的。Stellar是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的110倍。”
一、三个技术优势:性价比、自主IP、完备交付能力
由中天恒星联合创始人、总架构师邓仰东带队研发的“天狼星”GPU架构,主要有三个技术优势:
第一、面向亿级订单市场,以独立显卡GPU芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势。
第二、拥有完全自主知识产权,以清华大学超过10年研究基础为依托的自研核心架构,确保产品迭代自主可控;以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计;核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于ISCA、Micro、IEEE TPDS、IEEE TCAD等顶级会议和期刊。
第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API认证:OpenGL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHY layer和LIINK layer;质量体系认证:显卡3C认证(中国)、 日本VCCI 、欧盟CE、 美国FCC。
▲邓仰东博士分享图形GPU市场及规模
国际信息显示学会中国总裁fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士现场分享说,今天看到的显示内容,显示的所有都在显示的平面上,没有跳跃出平面的状态,最大的问题就是它的互动性没法体现。我们现在逐步进入到下一代显示,显示的内容不仅在平面上,而且可以跳到空间上,跟人进行实时影像交互,预计五年到十年可能就会到来。他谈道,做空间三维影像对数据量的要求非常大、计算需求非常大,这个生态是非常需要有高算力的图形化处理硬件。
二、七大架构亮点:灵活优化的指令集,支持物理真实渲染,片上互联架构
“天狼星”GPU架构亮相,该架构有七大亮点:
一是具有3D图形引擎+2D图形加速+视频引擎。
二是自主可控/灵活优化的指令集和VLIW/SIMD机器指令集(ICCD’13);其中,自主可控/灵活优化的指令集,保证GPU芯片迭代的软件兼容。
三是SIMT计算框架,充分利用图形应用的数据并行性( DATE’12.ICCD’13,TVLSI15)。
四是支持物理真实渲染(ACMComputingSurvey’14,SIGGRAPHASIA’14.15)。
五是Shader Core(Graphics ProcessingCluster),包括SIMT独立指令执行单元、以32位浮点ALU为基础的统一图形架构(ICCD13)以及集成寄存器堆、纹理/数据缓存。
六是延迟聚集式全局线程调度技术(ISCA20、TPDS21、TCAD’21)。
七是具有良好性能伸缩性的片上互联架构(MICRO’20、TPDS’21)。
“把自己的钱掏出来做这件事,把整个产品、公司的命运和自己的命运联系起来,这是我看到比较少的,”上海市集成电路行业协会秘书长郭奕武也来到现场表示祝贺,“他们非常踏实地在做事情,我觉得在这个方面值得大家学习,也是值得大家肯定的。”
他总结说,中天恒星自研架构有几个特点:一是3D图形渲染,二是指令集的自主可控,三是框架结构,包括在整个储存器当中的DDR4,中天恒星都用上了,决定了其未来的产品、用途非常广泛,而且可以用在各个方面。
三、核心图形引擎完全自主设计,不涉及第三方IP
当前,Imagination和Vivante两家公司是主要的GPU IP来源,这些IP主要是针对移动应用的GPU内核,不适合桌面应用。此外,购买第三方的IP,难以形成成熟的图形显卡级GPU,核心电路专利无法自控和自主迭代。
邓仰东谈道:“很多国产的GPU的IP授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以3D图形引擎这块不涉及到别人的知识产权,也没有IP的问题,全部是我们自己拥有,从0到完整架构的实现,都是我们自主的技术。”
自研GPU架构存在极高的技术挑战。据邓仰东分享,GPU设计有几个地方非常复杂:
一个是架构级的设计,这其实是个统筹的艺术。GPU本身的资源,在所谓的uni版的shader,所有的计算资源是一样的,大家都用32比特或者64比特的浮点运算单元,这是一个配合的问题。
有很多个核共享L2的cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。
换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少30帧,这是一个极具挑战的地方。
二是架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这是一个很大的挑战,需要有多年的积累才能去做这件事。
结语:四年潜心研发,2025年量产第二代GPU架构
“天狼星”GPU架构并非一蹴而就,而经历了长期耕耘:2019年,第一代“天狼星”架构芯片设计验证完成。2021年,第一代“天狼星”架构GPU诞生;2022年,定义第二代GPU架构“大角星”;2023年,第一代“天狼星”架构GPU实现量产。
据悉,2024年,中天恒星会继续优化基于“天狼星”架构的GPU。2025年,将量产第二代GPU架构“大角星”。
中天恒星将提供GPU芯片、板卡和系统解决方案,以PC标准市场(包括台式机、一体机、笔记本电脑和部分服务器)为核心目标,逐渐拓展至大屏电视、数据中心、云渲染和车载智能系统等市场。
关键词: