“马总,您好,叫我过来是有什么吩咐吗?”汤智晓礼貌地点了点头。
“智晓,你来看看这个。”马明把那份文档递了过去。
汤智晓接过来,扶了扶眼镜,目光落在标题上时,眉毛几不可查地挑了一下。
显然,“深度学习”这个新名词引起了他的注意。
他看得很快,但又很仔细。
一开始,他还站着,身体微微前倾。
看着看着,他不知不觉地拉开一张椅子坐了下来。
再然后,他的腰背挺得笔直,几乎是趴在桌子上,手指顺着纸上的数学公式一行一行地移动,嘴里还念念有词,全是些外人听不懂的术语。
办公室里的空气仿佛凝固了。
马宇腾倒是不急。他端起茶杯喝了一口,靠在沙发上等着。
对方这种反应,说明将里面的内容看了进去。
马明一直盯着汤智晓的表情变化,从疑惑到专注,从专注到凝重。
终于,汤智晓翻到了最后一页。
他长长地呼出了一口气,把文档放下来。
然后又拿起来。
从第一页重新开始看。
这一遍他看得更慢,手指在几个关键公式上来回摩挲,脑袋轻微地点着,不知道在跟谁确认什么。
马明忍不住了:“怎么样?”
汤智晓没理他。
马明嘴角抽了抽,转头看马宇腾。
马宇腾笑了一下,做了个稍安勿躁的手势。
又过了将近十分钟,汤智晓终于第二遍看完了。
他抬头的时候,眼镜片后面那双眼睛的神色跟十分钟前判若两人。
“马总……”
汤智晓看着马宇腾和马明,喉结动了动。
“这份东西,谁写的?”
““我提了些方向性的想法,”马宇腾语气随意。
“里面的数学论证和推导,主要是我爱人完成的。”
汤智晓的嘴巴微微张开。
他一开始以为这又是哪个领导拍脑袋想出来的“宏伟蓝图”。
却没想到里面竟然是如此严谨、完整、且具有开创性的理论框架。
从概念定义,到网络结构,再到训练方法,最后是坚实无比的数学基础,这简直就是一篇可以直接发表在顶刊上的开山之作!
“不可思议……简直是天才般的构想!”汤智晓激动地站了起来。
“‘无监督逐层预训练’,这个方法,完美地解决了深层网络训练时梯度弥散的难题!这……这将开启一个全新的时代!”
他看着马宇腾,眼神里全是敬佩。
马明坐直了身体,他明白汤智晓的水平,既然对方都对这份文件的内容赞不绝口,证明他之前的看法没有错。
汤智晓看着马宇腾的眼神变了,他没想到这位国内知名的雷霆工业集团总裁,居然对人工智能这个前沿领域,也有着如此恐怖的技术积累和洞察力。
马宇腾坦然地接受了这份赞美。
虽然核心思想来自未来,但在这个时空,这份文档的作者确实是他和钟虹。
“汤博士,你觉得这套理论有实际应用的可能性吗?”
马宇腾把话题拉了回来。
“有!太有了!”汤智晓毫不犹豫地回答。
“这不仅仅是可能性的问题,它就是我们一直在寻找的答案!有了这个框架,我们之前那些像没头苍蝇一样的研究,立刻就有了明确的方向!”
“很好。”马宇腾点了点头,这正是他想要的结果。
他身体前倾,看着汤智晓和马明,说出了自己今天真正的目的。
“我希望你们的团队,能在这套深度学习的理论基础上,尽快研发出一套新的模型架构。”
“这套架构,要能很好地处理时序数据。它不能只看孤立的、静态的一帧图像,而是要能理解一个连续的序列中,不同元素之间的关联和上下文。比如,一段视频里,前一秒的车辆位置和速度,与后一秒的行为预测之间的关系。”
马宇腾没有提“Transformer”这个名字,但他描述的,正是其核心思想——自注意力机制。
“我需要这套技术,为我们雷霆工业准备研发的自动驾驶系统,提供算法支持。”
“自动驾驶?”马明和汤智晓几乎同时出声。
汤智晓把手里的文档放回桌上,直起腰板。
“自动驾驶?”
他重复了一遍这个词,声音里带着明显的迟疑。
“马总,这个方向,说句不好听的,目前学术界自己都还停留在前期探索的阶段,工业界更没人敢碰。原因很简单,计算机视觉的识别能力远远不够。别说动态的交通场景了。”
马宇腾没有立刻反驳,而是仔细分析道。
“现在的计算机视觉不行,是因为算法模型太浅,特征提取的能力不够。”
他指着桌上那份文档。
“特征提取做不到位,当然什么都认不准。但你刚才自己也说了,这套卷积神经网络加上深度训练之后,提取能力会有质的飞跃。”
“再叠加我刚才说的那种对序列数据的理解能力后,它就不再是逐帧比对像素了。它开始理解上下文,理解空间关系,理解因果。”
“网络可以做得极深,深度意味着理解力。汤博士,这个道理你比我清楚。”
汤智晓没有马上接话。
他低下头,翻开文档里关于序列数据处理的那几页,手指在纸面上划了几道。
办公室里安静了好一阵。
“理论上……有可能。”
他推了推眼镜,语速放慢了不少。
“但问题在两个地方。第一,训练这种规模的模型,需要的数据量是天文数字。光靠实验室采集,十年也凑不够。第二,目前的芯片算力不够,即使利用最先进的GPU也无法实现处理行驶过程中视觉数据的能力。”
马宇腾看向马明。
“数据的问题,明讯网络每天有上亿用户产生的行为数据,这些暂且不说。雷霆汽车未来的产品,每一台车上都会装车载摄像头和传感器。车跑在路上,就是在帮我们采数据。等大量用户在使用过程中,积累下来的真实道路数据,足够我们使用了。”
他顿了一下。
“至于算力,按照摩尔定律,芯片每十八个月的性能翻一番。我们不需要等到算力完全够用的那天才开始动手。模型架构和算法先做出来,数据先存起来。等硬件追上来了,我们就能进入到实际的测试当中。”