默认冷灰
24号文字
方正启体

第241章 专业能力是一点没落下

作者:骚话王安澜本书字数:K更新时间:
    “你小子。”


    林远桥一眼就看到了安澜,挑了挑眉,用口形说了一句,显然认出了这位“不速之客”。


    安澜冲他笑了笑,还做了个开枪的手势,两人心照不宣。


    在前年一起备战ICPC竞赛的时候,林远桥就总是调侃安澜“纨绔脸,学霸心”,如今看来是一点没变。


    林远桥走上讲台,伸手敲了敲白板,用一口流利的华夏腔英语说道:“各位,今天我们讲卷积神经网络的基础架构,相应的知识很关键,别走神啊。”


    他故意瞥了一眼安澜的方向,嘴角带着一丝笑意。


    安澜靠在椅背上,掏出手机,随手翻了翻消息,看似漫不经心,实则讲台上的内容一个字都没放过。


    林远桥对着PPT讲解一阵,又拿起马克笔,转身在白板上画出一个残缺的卷积核矩阵:“刚才讲到残差连接时,有同学注意到GoogLe的Iion模块里——”


    他突然用笔帽敲了敲黑板边缘,随后看向安澜:“Oi,玩手机那个,知道为什么他们要用1×1卷积核做瓶颈层降维吗?”


    “帅哥,林助教问你呢……”不少人回过头来,安澜旁边的白人姑娘也轻轻戳了戳安澜的胳膊肘。


    她也和其他同学一样,有些好奇为什么助教今天突然问起问题来了。


    “啧啧。”安澜慢悠悠抬起头,指尖还停留在手机屏幕的Tiktok界面,嘴上却毫不犹豫地开口回答:“因为要压缩通道数的同时保留空间特征。”


    他晃了晃手机:“比如原始输入是256通道的3×3特征图,先用1×1卷积核降到64通道,计算量从256×3×3×256骤降到256×1×1×64,再通过64通道的3×3卷积处理,整体FLOPs能减少大概80%。”


    他顿了顿,目光扫过林远桥故意写在黑板角落的公式:“不过你这个例子里的分组卷积参数设置有点问题,最后一层的ReLU激活函数放在了拼接操作之后,会导致梯度消失的风险。”


    “啥?”教室里响起几声倒吸冷气的声音,前排几个学生慌忙掏出笔记本。


    林远桥挑眉,粉笔在黑板上敲出哒哒轻响:“哟,那你说说怎么改?”


    安澜把手机倒扣在桌上,伸手指了指白板:“应该把ReLU放在每个分支的卷积层之后、拼接之前。”


    他站起身,走到白板前拿起马克笔:“就像这样——”


    笔尖流畅地画出三个并行的卷积支路,每个支路都在卷积核后标注了ReLU激活函数:“这样每个分支的特征图在融合前都经过非线性变换,能提升模型的表达能力。”


    他退后两步,指尖点着黑板:“而且你这个Iion模块的通道分配比例不对,3×3和5×5卷积的通道数应该遵循1:1.5:2的黄金分割比,否则会出现特征图维度失衡。”


    林远桥盯着黑板看了几秒,接着笑出声来:“行啊,那我问你,如果要在边缘设备上部署这个改进版Iion模块,怎么平衡计算效率和精度损失?”


    安澜扫了眼教室中目不转睛的学生,嘴角微扬:“用深度可分离卷积替换标准卷积,把3×3卷积分解成3×1和1×3的逐通道卷积,再通过通道混洗操作恢复特征关联。”


    他拿起马克笔在白板右侧画出新架构图:“同时采用量化感知训练,把权重从FP32压缩到INT8,配合动态剪枝策略,能在保持92%以上Top-1准确率的前提下,把单次推理的延迟控制在5毫秒以内。”


    画完这一切,安澜放下笔,指尖轻轻敲了敲白板上的架构图:“当然了,这是用英伟达H200的情况。如果你们用的是昇腾NPU,还可以开启张量分解加速指令集,进一步降低能耗比。”


    教室里瞬间安静了一秒,紧接着爆发出一阵惊叹声。


    几个学生忍不住交头接耳,有人小声嘀咕:“这也太厉害了吧!”


    “他怎么什么都知道。”


    “行了行了,”林远桥翻了个白眼,“别抢我风头。”


    然后伸手把安澜往回推了推,示意他坐下。


    回到座位之后,一旁的白人姑娘又凑近安澜,小声问道:“说起来,我以前怎么没见过你?”


    安澜故作神秘地眨眨眼:“我是David教授派来检验助教授课水平的,现在看来这家伙马马虎虎,勉强及格。”


    姑娘轻笑一声,目光扫了扫林远桥:“教授还管这个?”


    林远桥咳嗽了一下,瞪了白人姑娘一眼,然后继续讲课。


    他清了清嗓子,试图重新掌控课堂节奏:“我们接着讲卷积神经网络的应用……”


    可不少学生的目光还是忍不住往安澜这边瞟。


    安澜也不再说话,安静地坐回座位,继续刷Tiktok,嘴角还带着一丝若有若无的笑意。


    中午下课之后,大部分学生们纷纷离开教室。还有几个学生围了上来,七嘴八舌地问着林远桥问题。


    “林助教,关于卷积神经网络的那个优化方案......”


    “我昨晚跑实验时遇到了梯度爆炸的问题......”


    林远桥一一解答,时不时在白板上画着示意图。


    安澜靠在教室后排的桌子上,指尖轻轻敲击着桌面,目光注视着林远桥的一举一动。


    十几分钟后,教室终于安静下来。


    林远桥揉了揉太阳穴,开始收拾讲台上的教案和笔记本。


    “你小子现在不玩计算机,改当投资人了,”林远桥一边整理文件,一边笑着对安澜说,“但专业能力倒是一点没落下。”


    “偶尔练练手。”安澜站起身收起手机,慢悠悠地走到讲台前。


    安澜拍了拍林远桥的肩膀:“何况专业这东西,放下了也丢不了。我虽然现在不干这行了,但平时也一直关注产业动向。”


    “那你说说,”林远桥挑了挑眉,饶有兴趣地问:“最近有啥新发现?”


    安澜靠在讲台边:“上个月我看了篇AI方向的论文,叫《基于多模态融合的通用智能决策模型研究》,就是你老板发的,好像叫大卫·汤姆逊。”


    “这个我熟啊,”林远桥眼睛一亮:“这篇论文很有前瞻性,很多实验都是我辅助的。”


    安澜点点头:“没错,我看完之后,发现这篇论文的研究方向和我投资的一家AI公司的研究课题相似。”


    林远桥好奇地问:“那你想怎么做?”


    安澜笑着说:“我想代表公司,跟你们老板展开合作,这对双方都大有益处。报酬方面我做主,只要你老板愿意,条件都好商量。”


    林远桥沉思片刻:“这倒是个不错的机会,我回头帮你问问大卫的意思。”
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一章>> (快捷键→)