到中流击水——2023龙芯产品发布会侧记

前言

11月末,我有幸应龙芯中科邀请,参与了龙芯2023年度产品发布会。由于工作繁忙,一直没顾得上把一些所思所想记录下来。终于接近年底,先前的生产支持工作稍告一段落,故用业余时间撰写此文,记录一下国产CPU的里程碑时刻。

先前的《国产架构计算机可堪大任乎》一文中,已经讲述过我与龙芯故事的起源。在2014年那个互联网渗透远不如今日的时代,龙芯通过QQ群、论坛等方式,将一批廉价的国产CPU设备带到了最早的一批用户手中。在那之前,国产芯片或是某个科研院所实验室里的曲高和寡,或是某个试点小学机房内落灰的小众奇葩。因此,尽管那台龙芯2F的小笔记本性能拉胯,做工粗糙,更像是一个大玩具的样子,我仍然愿意给它更多的溢美之词,敢于吃螃蟹的人永远应当被赞美。

那次依托于龙芯俱乐部的团购是龙芯走向开放市场的一次浅尝辄止的尝试,再之后的龙芯实际上在信创大潮中有些失速。按照龙芯官方的表述,在2009年推出3B1500后,他们猛然发现多核路线走不通。胡伟武老师在多个场合也有过类似表述:“一群小学生堆在一起也是打不过一个大学生的(多个低性能核心的堆砌比不过一颗高性能单核心)”。因此龙芯在那之后便开启了长达数年之久的单核心性能补课时期。而这段时期随着自主可控的概念被更广泛的接受,众多国产桌面CPU的后起之秀——如海光、兆芯等,依托着来自国外成熟指令架构和技术支持,在性能上快速超越了龙芯产品。因此,在国产化替代的浪潮中,仍在补课的龙芯实际上并没有分到多少份额。特别是自3A5000开始脱离MIPS指令集,独立研发LonngArch架构起,由于应用生态的原因其在信创市场的份额便一降再降,自科创板上市后也出现了连续多个季度的亏损。

在这样的外部环境下,龙芯3A6000的发布可以说从一开始就收到了业界的广泛关注。对龙芯自身而言,这是其多年单核性能补课的收官之作。对投资者而言,龙芯也急需要通过新产品证明自己的投资价值。

一、将自主进行到底

龙芯将发布会选择在了国家会议中心,对这里我有着一份额外的熟稔。早年间我曾作为开发者,在这里分别参加过Microsoft Ignite China和Google Developer,而作为嘉宾参加国产IT产品的发布,想来还是第一次。

发布会开始是来自工信部和北京市领导的致辞,某种程度上也算回应了外界对“龙芯失去官方支持”的质疑。而发布会的重点,自然还是来自于龙芯中科董事长胡伟武老师的主题演讲《将自主进行到底》。演讲PPT仍然是胡老师一贯的白底红字风格,没有丝毫多余的装饰。多年前在同样的地点,我参加C#之父Anders Hejlsberg的演讲时,PPT也是相似的风格。不知道有些把PPT搞的花里胡哨的企业看到后会作何感想(笑

演讲仍然由龙芯的愿景开始,即构建独立于Wintel(Windows+x68)和AA(Android+ARM)外的第三套体系。这个目标不可谓不宏大,而道路也不可谓不艰辛。不过龙芯确实给出了这个目标的具体实现路径,在此我们暂且按下不表。紧接着胡老师介绍了龙芯CPU三大产品系列的定位,即面向桌面和服务器应用的龙芯3号CPU,面向工控和终端应用的龙芯2号SOC,面向嵌入式专门应用的龙芯1号MCU。而本次发布会的绝对主角,自然是面向桌面的全新CPU龙芯3A6000。

3A6000基于龙芯第四代微结构LA664,主频2.5GHz。在与上一代产品3A5000相同的工艺下,单线程通用处理性能提高60%,多进程通用处理性能提高100%,并实现了同时多线程(SMT)技术。在这样的性能加持下,按照龙芯官方的说法,3A6000的性能达到了酷睿10代四核的水平,完成了通用处理性能的补课。其实不同指令集间的性能比较意义总归有限,但龙芯官宣的通用处理性能完成补课,仍然算是国产CPU的重要里程碑。这意味着第一次有国产产品在单核性能上,真正逼近了国际主流水平。长期以来,国内芯片业界其实有种非常不好的做法,把通过堆核心在某些并行计算场景下得到的高跑分用作宣传的素材,进而得出性能超越国外XX芯片的结论,也正是这种投机取巧的做法造成了国产芯片“参数没输过,体验没赢过”的窘境。如此来看,龙芯在单核性能上的努力,意义无需多言。

基于3A6000优越的性能,龙芯也考虑通过高速片间互联技术(即所谓龙链,类似NV-LINK即本轮制裁中被美方重点关注的领域),实现龙芯平台的多核化系列化发展。16核的3C6000,32核的3D6000,64核的3E6000均已经蓄势待发。

接下来的演讲中,胡老师重点介绍了龙架构的软件生态建设。这也是对前文中提到的第三套体系构建路径的回应。简单而言,龙芯并没有指望通过一家努力构建全部的生态,而是选择了自主与开放结合的道路。在指令集自主的前提下,龙芯选择了广泛依赖和参与国际开源软件社区的生态建设方案。从目前的成果看,这样的方案是卓有成效的。Linux自6.8版本开始,已经将LonngArch架构的支持代码合并进了主干分支,国际主流编译器gcc和llvm均有基于LonngArch的原生版本,.net Core自版本6起,将LonngArch作为了第三大主干支持架构。从某种意义上,LonngArch算得上极少数发源自国内后被国际主流社区接纳的技术之一。在此基础上,龙芯通过二进制翻译,在短期内有效缓解了LonngArch原生应用缺乏的状态,给了开发者和用户相对充裕的过渡时间。虽然龙芯自我表述的,在Linux桌面已经领先x86不免有自我抬举之意,但毫无疑问在生态建设上,龙芯的确有着构建第三套体系所匹配的考量。

最后的总结上,胡伟武老师也再一次解释了“将自主进行到底”的含义。如果说多年前客户不选择龙芯,是因为龙芯最自主所以性能最差的话,那么通过多年来的通用处理性能补课和生态构建,龙芯希望的是从观念上改变人们自主=性能差的印象。未来的用户在选择龙芯时,同样是因为龙芯最自主,所以性能最好。应该说,3A6000的发布为这份愿景交上了一份还不错的答卷。

二、爱来自华硕

上午的发布会议程很紧凑,而龙芯几乎是将唯二的主旨演讲机会给了华硕。能拉到华硕这种世界第一板卡厂商的站台,其实本身也能说明一些问题。

华硕的主旨演讲来自华硕中国产品经理余元麟,如果是老硬件玩家的话对他的另一个名字可能更为熟悉——普普通通Tony大叔。华硕本次带来了和龙芯合作的主板XC-LS3A6M,应该是老牌板卡厂商中的第一家。而在这块主板的加持下,在不改变电压和散热的情况下,龙芯的主频已经可以超到2.63GHz。而在液氮散热的加持下,龙芯3A6000也成功的超到了3.0GHz,并且在一小时的拷机测试中表现稳定。

而在稍后的展区交流中,我也专门去到了华硕的展区,见到了这块主板的真身。从主板的设计上,华硕的确展现了老牌厂商应用的水准,做工极为出色。CPU和桥片散热用料扎实,同样应用了华硕一贯的全固态电容。同时主板集成了诊断码LED,可以在故障时快速帮助用户诊断问题。在I/O接口上,该块主板提供了一条PCI-E x16,一条PCI-E x1,一条PCI-E x8,一个2242 m.2插口,4个SATA口。而通过与华硕展区工作人员的交流,该块主板大概会在12月在京东上架销售,售价预计1500+。应当说这样的价格在国产生态中是很有竞争力的。

三、走向开放市场

发布会现场很热闹,龙芯在自己的发布会上一口气发布了几十家合作伙伴公司的产品,从开发版到服务器,几乎涵盖了能想到的所有IT门类。场外各家合作伙伴的展台也占据了国家会议中心C2一层的半壁江山。恍惚间,真的有国产生态似乎可以与Wintel和AA体系比肩的感觉。

把时间推回到2001年,彼时尚在上小学的我便在电视中看到了关于龙芯1号的报道。作为国产通用CPU的肇始之作,从那时起我就在幻想着有一天国产CPU如果能普及开来,或许电脑价格就可以不那么贵了。当时的我刚刚接触计算机不久,自然不懂什么指令集兼容、生态体系之类,只是本着最朴素的想法:国产的应该会便宜些。事与愿违,后来十几年的国产体系都未能飞入寻常百姓家。即便是2014年龙芯的那次团购,或许也只是国产爱好者们的狂欢,与普罗大众仍然相距甚远。

究其原因,与x86架构不兼容,跑不了Windows固然是原因之一。而另一个大家心知肚明却谁也不愿意提起的原因便是,在政企采购市场中凭借着国产化率要求的行政指令,很多厂家便已经能赚的盆满钵满,自然缺乏走向开放市场的动力。

而对于龙芯而言,本次发布会令我触动最大的地方,或许不在于3A6000究竟进步了多少性能,也不在于发布了多少政企产品,而是龙芯迈向开放市场的决心。或许是因为信创采购的不如人意让龙芯必须寻找新的增长点,或许是因为龙芯自身有着更高层次的追求,但无论如何,在这次发布会上,我看到的不再是国产CPU阳春白雪式的顾影自怜,更多的是对普通用户需求的回应。在会场外的站台里,除了华硕这样的板卡大厂,我居然找到了攀升这样以DIY攒机起家厂商的摊位——甚至于由攀升赞助的整机产品打造出的游戏区几乎占据了1/4的展位空间。每一位走到游戏区的用户或许都会发出一声虽熟悉却在国产CPU发布会现场绝难听到的“我超,原!”甚至如果你愿意多待一会,还会有cos原的小姐姐很配合的摆pose让你拍照。在一众的国产CPU厂商中,愿意走出信创采购的舒适区,去投身于竞争激烈的开放市场竞争的,龙芯是第一家。单凭这一点,我就愿意给龙芯百倍千倍的赞美。

值得一提的是,在发布会现场我同样看到了来自龙芯俱乐部的展台。展台上摆放着14年团购时的龙梦盒子和001号逸珑8089笔记本电脑,一时间将我的思绪拉回了2014年的那个午后,在本科宿舍拆开的那个大盒子和通体白色的小笔记本。而如今,展台上由3A6000驱动的极客台式机和8盘位NAS恰是一个绝妙的符号,诉说着多年来开放市场中龙芯的脚印。应当说,开放市场的竞争龙芯走的并不轻松,但欣慰的是,它活了下来,仍在成长。

后记

这不是我第一次谈论国产IT技术和自主可控的话题了,但我相信这也远不是最后一次。当初考研时我几乎毫不犹豫的选择了国防科大的计算机体系结构专业,内心深处召唤我的便是对自主可控的IT架构的向往。这些年来,我也亲眼见证了国产技术从望尘莫及到望其项背的过程。但是,愈是行进到关键时刻,我们就愈应该实事求是的看待技术发展的客观规律。既要警惕那些因为一时落后而鼓吹投降的唱衰者,更要警惕那些妄自尊大目空一切的捧杀者。

近些年来,舆论场对于IT领域“超英赶美”的鼓噪声就没有断过。今日是“鸿蒙让谷歌微软吓尿了”,明日有“国家彻底出手,Intel慌了”,在抖音或者快手的短视频里,似乎某些公司真的“以一己之力抗衡了整个西方”。然而事实真正如何?恐怕从业者们都有着五味杂陈的体会。以日前大火的AIGC为例,在美西方禁售了高端计算卡后,媒体上几乎同一时间变出现了XX公司XX处理器可以脚踢nVIDIA的新闻,与之配套的往往还有某某国企大规模采购该处理器的新闻。诚然,从纸面参数上看,XX处理器或许与A800相差确实不大,但对于从业者而言,不兼容CUDA或许才是根本性的问题,这意味着花费大量时间构建的算力程序中的每个算子几乎都要被重写。试问,被这样的鸡血新闻裹挟起来的极端民粹,对于产业的发展真的有益吗?这样的例子在近些年来简直数不胜数,不一而足。

落后并不可怕,正确的认知是赶超的基础。舆论场充斥的“遥遥领先”,对于技术的发展没有任何正面意义。这样以专业领域信息差故意模糊公众认知,做了一步却吹成十步的的鼓噪,带来的只能是对于真正踏实追赶创新者的失焦。当公众通过亲身的体验发现现实并不如理想般那么美好时,所换来的也只能是舆论百倍千倍的反噬而已。

因此,当龙芯团队说出自己明年推出的GPGPU产品大概只能相当于RX580水平,自家的新品CPU同频IPC性能只能等于10代酷睿i3的时候,我所看到的是在如今互联网极化舆论中难得的清醒声音。龙芯用毛主席的一句诗词为本次的发布会命名——到中流击水。而我更愿意以同词中的两句话形容今日的龙芯——“恰同学少年,风华正茂。书生意气,挥斥方遒”。如同龙芯送的杯子上所印的那句话“我们中国人是有骨气的”,假以时日,我坚信在CPU天梯图中,我能看得到属于我们自己的一席之地。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注