默认冷灰
24号文字
方正启体

第594章 性能碾压CUDA?

作者:没钱又任性本书字数:K更新时间:
    而此时,远在美国圣克拉拉的英伟达总部。


    Jensen Huang,那个被中国IT圈亲切地称为“老黄”的男人,正坐在他的办公室里。


    老黄不是那种坐在办公室里看报表的传统CEO。


    他是一个狂热的技术迷,一个拥有枭雄气质的战略家。


    英伟达此时虽然已经是GPU的领头羊,但老黄始终保持着一种近乎病态的危机感。


    在这个行业,领先一步是神,落后一步就是死。


    他每天都在思考如何颠覆自己,如何让英伟达从一家显卡公司转型为计算巨头。


    CUDA就是他的命根子,是他压上英伟达未来的赌注。


    他点开了于文远转来的邮件。


    老黄的第一反应,并不是于文远预想中的轻蔑或者不屑。


    他那有些不修边幅的脸,在看到“盛夏科技”、“万卡集群”、“兼容AMD”这几个词时,瞬间变得冷峻起来。


    于文远的评语他只是扫了一眼。


    那个亚太区总裁还是太安逸了,在新加坡那个温柔乡里呆久了,丧失了对技术变革的恐惧感。


    老黄太了解什么是真正的技术突破了。


    中国互联网公司的营销手段他略知一二,夸大确实是常态。


    但有些东西是夸大不出来的。


    比如一万张卡带来的电力需求,比如个性化推荐算法对并行计算的恐怖消耗。


    盛夏科技既然能搞出Summer OS,说明他们手里有一支真正懂底层的团队。


    这样的团队,如果真的下定决心绕过CUDA……


    老黄的冷静在这一刻发挥了巨大的作用。


    他没有慌乱,更没有轻信于文远的“不需要紧张”。


    一个小时。


    老黄推迟了接下来的两个重要会议,把自己关在办公室里。


    他在谷歌上翻找一切关于“Jiuzhang”、“Summer Technology”、“AMD GPU”的蛛丝马迹。


    半个小时后,他的电脑屏幕上铺满了各种不同语言的网页。


    不仅仅是中国媒体,甚至连一些敏感的英文技术媒体也开始转载相关报道,并加上了诸如“神秘的中国力量”、“CUDA迎来挑战者”之类的标题。


    信息的真实性,已经被初步确立。


    这绝对不是一则单纯的营销笑话。


    哪怕有夸大,盛夏科技手里也一定掌握了某种能在AMD硬件上搞大规模并行计算的技术。


    老黄合上手提电脑,站在窗前。


    “有意思。”


    老黄的枭雄气质在这一刻展现得淋漓尽致。


    遇到威胁,英伟达的风格从来不是防守。


    而是进攻。


    要么收买你,要么毁灭你,要么,学得比你更好,然后用更强的性能碾压你。


    老黄大步走到办公桌前,按下了内线电话。


    电话那头,是英伟达首席技术官(CTO)和几个顶尖的硬件工程师。


    “我不管你们用什么办法,我要在二十四小时内看到一份关于盛夏科技‘九章’计算平台的详细评估报告。不仅仅是看新闻,我要实测性能。”


    电话那头的技术大佬们有些懵圈,他们甚至没听说过这个平台。


    老黄没有给他们解释的时间:“他们的文档刚刚上线,去下载,去研究。我要知道九章平台在性能上,到底比我们的CUDA快多少,或者慢多少。”


    ……


    之后的二十多个小时,英伟达总部测试中心忙成了一片。


    德里克盯着面前的显示器,双手离开键盘,重重地搓了搓脸颊。


    他是CUDA生态核心开发团队的资深工程师,平时自诩为硅谷的“肝帝”。


    但此时此刻,他觉得自己引以为傲的肝,大概是需要报废了。


    “亚瑟,你确定硬件没插错吗?”德里克转头,看着旁边顶着两个黑眼圈的助理工程师。


    亚瑟打了个大大的哈欠,抓起桌上的功能饮料灌了一口。


    “老大,这已经是你今晚第八次问我这个问题了。”


    亚瑟指了指玻璃机房里那台全速运转的测试机。


    “里面插着四张AMD的顶级显卡,主板是全新的,连供电线都是我亲手接的。”


    德里克咬着牙,指着屏幕上正在跑的代码终端。


    “那你能给我解释一下,为什么这套叫‘九章’的玩意儿,跑我们的矩阵乘法测试用例,速度比咱们自家的卡配合CUDA还要快百分之十二?”


    亚瑟摊了摊手,脸上写满了“我也很绝望”。


    “不仅是矩阵乘法,刚才跑的快速傅里叶变换,它领先了百分之十五。”


    德里克猛地站起身,绕着工位走了两圈,伸手抓了抓本就稀疏的头发。


    “这完全不讲基本法啊!AMD的硬件架构什么德行我们最清楚。”


    “他们那套驱动烂得连他们自己人都头疼,怎么可能榨出这种级别的算力?”


    亚瑟滑动鼠标,将一份底层调度日志拖到主屏幕上。


    “老大,问题就出在这儿。九章根本没用AMD的官方驱动逻辑。”


    “他们估计重写了底层,直接绕过了那些臃肿的冗余代码,直接对显存和流处理器进行微操。”


    德里克凑近屏幕,盯着那些跳动的十六进制地址和调度线程。


    一行行看下去,他的呼吸越来越重。


    这代码写得太妖孽了。


    没有任何多余的指令,每一级缓存的命中率被计算到了极致。


    这种感觉,就像是有人开着一辆破旧的二手皮卡,在赛道上套了他们F1赛车的圈。


    关键是,对方的车技毫无破绽。


    “这帮中国人是怪物吗?”德里克跌坐回椅子上,感觉血压直线飙升。


    “盛夏科技……我连听都没听过这家公司,他们哪来这么多懂底层硬件的神仙?”


    亚瑟摇摇头,敲击键盘调出另一份数据。


    “也并非全方位碾压,我们加班加点测了三十四个核心模块,还是赢了两项的。”


    德里克眼睛一亮,仿佛抓住了救命稻草。


    “哪两项?快说!”


    “一个是针对早期单精度浮点运算的某个特定物理引擎的兼容性测试。”


    亚瑟看着屏幕,语气毫无波澜。


    “还有一个是极少数非标格式的视频解码渲染。”


    德里克刚刚燃起的希望瞬间熄灭。


    “这有个屁用!这都是边缘得不能再边缘的功能,下个版本我们自己都要弃用的东西!”


    亚瑟叹了口气,点击鼠标,将一份文档拖了出来。


    “老大,还有一个更让人破防的消息,你要不要听?”


    德里克按住胸口,深吸了一口气。


    “说吧,我的心脏承受得住。”


    亚瑟将文档全屏,指着上面一段英文翻译。


    “这是九章计算平台官网的开发者文档说明。”


    “上面写着:当前版本仅为单节点预览版。”
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一章>> (快捷键→)