默认冷灰
24号文字
方正启体

第635章 李飞飞的断言

作者:没钱又任性本书字数:K更新时间:
    “这40%的正确率,确实能打,但这是通用模型没做微调跑出来的数据。”


    “这绝对不是咱们实力的天花板。”


    郭长征敲了敲桌子,给几个年轻人降降温。


    “你想想,为了去榜单上当个显眼包,白白浪费一次提交机会。”


    “等后面咱们训练出准确度更高的专用模型,结果发现手里只剩四次机会了,亏不亏?”


    楚一航非常赞同郭长征的观点,也跟着劝钟柏。


    “郭老师说得对,稳住咱们能赢。”


    “五次提交机会太宝贵了,不能一开局为了装杯就随便浪费掉。”


    楚一航搓了搓下巴。


    “咱们得沉得住气。”


    钟柏听完,彻底收起了那股想出风头的浮躁劲,乖乖离开了电脑桌。


    “懂了,苟住发育。那咱们接下来这三个月从哪下手?”


    郭长征转身走到白板前,拿起黑色马克笔。


    “干咱们该干的具体工作。”


    “先把这通用模型的输出层改了,剔除多余的四千个类别,专门针对比赛的一千个分类做训练。”


    几个人立刻进入了工作状态。


    钟柏负责修改网络输出层的代码结构。


    叶言开始编写过滤多余分类的数据清洗脚本。


    楚一航则坐在电脑前,监控着九章平台的显存调度,为接下来的微调训练预留算力通道。


    教研室里刚才的激动情绪一扫而空,只剩下连串的键盘敲击声。


    ……


    斯坦福大学的人工智能实验室里,大卫用力敲打着回车键。


    屏幕上弹出一行红色的错误提示,伴随着一声警告音。


    大卫抓了抓头发,把键盘推到一边。


    约翰坐在旁边的工位上,转动椅子滑了过来。


    “又报错了?”约翰看着大卫的屏幕。


    “内存溢出。”大卫指着屏幕上的代码行,“这数据量完全超出了现有设备的承受极限。”


    约翰凑近看了一眼后台的运行日志。


    “这套图片分类的数据集太大了,一百万张图片,我们的算法根本跑不动。”约翰连连摇头。


    两人都是李飞飞团队的博士。


    虽然作为主办方团队的成员,但是两人也报名参加了比赛。


    两人正愁眉苦脸,李飞飞拿着一个装满黑咖啡的马克杯走了进来。


    大卫赶紧转头看向李飞飞。


    “飞飞教授,你觉得这次数据集的比赛,第一名大概能达到怎样的程度?”大卫开口询问。


    李飞飞拉过一把办公椅,在大卫身边坐下。


    她把马克杯放在桌上,看着屏幕上的错误日志。


    “大家不要灰心,我们内部其实已经用各种传统数值方法做过测试了。”李飞飞语气平缓。


    大卫立刻来了精神,坐直了身子。


    “教授,测试结果怎么样?”大卫追问。


    李飞飞喝了一口咖啡,放下杯子。


    “根据我们跑出的结果,这套数据集的极限应该可以超过30%。”李飞飞说出了数字。


    约翰在旁边计算了一下。


    “您是指 tOp 1 的正确率?”约翰确认道。


    李飞飞点了点头。


    “是的。至于 tOp 5 的正确率,可以超过70%。”李飞飞补充。


    大卫皱起眉头,手指在桌面上敲击。


    “超过30%?我们在特征提取上花了这么多时间,结果还差这么多?”大卫显得有些沮丧。


    李飞飞看着大卫的眼睛。


    “大卫,科学研究不能只看眼前的得失。目前我们尝试了所有不同的算法,确实只能达到这个程度。”


    李飞飞站起身,走到实验室中央的白板前。


    “但是,我对其他参赛团队很有信心。”李飞飞说。


    “为什么?”约翰不解地问。


    “因为现在这个数据集完全开放了。它会激发全球所有顶尖研究人员的热情。”李飞飞解释道。


    大卫叹了口气。


    “光有热情没用啊,算力跟不上,大家都在用传统的支持向量机做分类,上限就在那里。”大卫反驳。


    李飞飞笑了笑,“这就要感谢英伟达了。他们这次提供了非常大的帮助。”。


    约翰撇了撇嘴。


    “老黄这次确实花了不少钱,几万美元的奖金呢。”约翰调侃道。


    大卫跟着附和。


    “就是,重赏之下必有勇夫。很多人估计连夜都在改代码,就为了抢这笔奖金。”


    李飞飞走回座位。


    “不仅仅是奖金。英伟达设置的赛制非常吸引人,这种实时排名会带来很大的竞争压力。”


    李飞飞继续分析。


    “这些条件加在一起,能帮助比赛吸引更多顶尖团队来提交数据。有竞争,才能取得更高的成绩。”


    大卫还是觉得不乐观。


    “可是教授,您觉得第一名到底能考多少分?”大卫又回到了最初的问题。


    李飞飞在心里盘算了一下。


    “按照目前的学术发展速度,我预测,tOp 1 正确率能到32%。”李飞飞给出了具体的数值。


    “tOp 5 正确率能到75%。”李飞飞继续说道。


    约翰把这两个数字记录在笔记本上。


    “这就到顶了吗?”约翰问。


    李飞飞点头。


    “对,这就是目前的极限了。”李飞飞语气肯定。


    “为什么不能更高?”大卫追问。


    “毕竟以目前的技术水平,据我所知,应该还没有达到那种脱胎换骨的程度。”李飞飞解释。


    李飞飞端起咖啡杯。


    “没有新技术的加入,单靠优化现有算法,32%就是很难突破的瓶颈。”


    大卫靠在椅背上。


    “那这个比赛还有什么意义?大家只是在小数点后两位互相竞争。”大卫抱怨道。


    李飞飞拍了拍大卫的肩膀。


    “不要着急。我觉得,如果这个比赛未来几年一直办下去,一定会产生质的改变。”李飞飞语气中充满期待。


    大卫无奈地重新拉过键盘。


    “好吧,那我继续去改参数。看看能不能把正确率从25%提高到30%。”大卫重新投入工作。


    ……


    同一时间,加拿大多伦多大学。


    教研室的角落里,亚历克斯正盯着电脑屏幕上缓慢跳动的进度条,烦躁地抓了抓头发。


    伊利亚坐在旁边,机械地敲击着键盘。


    “这组数据的预训练还要跑多久?”伊利亚头也不回地问。


    亚历克斯叹了口气,敲了一下回车键。


    “按照现在的运算速度,大概还需要一个星期。这还是不出任何内存报错的情况。”亚历克斯语气里满是绝望。


    长时间的等待让人抓狂,亚历克斯切出编译器,打算看点科技新闻换换脑子。


    一条关于ImageNet视觉识别挑战赛的通告弹了出来。
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一章>> (快捷键→)