默认冷灰
24号文字
方正启体

第633章 ImageNet挑战赛开启,赛制堪比天梯排位

作者:没钱又任性本书字数:K更新时间:
    时间进入2009年12月中旬。


    墙上的电子挂钟跳到上午十点整。


    对于写字楼里的上班族来说,年底只意味着写不完的年终总结。


    但对于京城邮电大学计算机系教研室里的人来说,今天是个大日子。


    郭长征站在电脑屏幕前。


    楚一航坐在椅子上,右手握着鼠标,左手习惯性地搓着下巴上的络腮胡。


    旁边站着研究生钟柏、江深和叶言。


    电脑浏览器上,ImageNet视觉识别挑战赛的官方网站正式开放访问。


    楚一航点击刷新按钮。


    原本只有倒计时的页面瞬间变了模样,深蓝色的导航栏加载出来。


    赛题和规则文档链接出现在页面正中央。


    钟柏赶紧凑近屏幕,指着其中一行英文。


    “上面说,开放了一百二十万张图像,作为训练集?这数据量有点离谱吧。”


    楚一航摸了摸下巴。


    “以前的视觉识别比赛,搞个几万张图片就算顶格配置了。”


    “这次一上来就直接放出百万级别的数据集,跨度太惊人了。”


    “主办方这明摆着是鼓励大家别走寻常路,逼着所有参赛队伍去点新的科技树啊。”


    “而且这是明示大家,要用GPU去处理图片,传统的CPU干冒烟了,也处理不过来这么多图片。”


    叶言在旁边点头赞同,补充说明。


    “确实,要是继续用传统的老算法去跑这百万张图像的特征,算到比赛结束都跑不完第一轮。”


    “除了训练集,还有五万张验证集图片,这部分是带标签答案的,是让方便我们对自己的模型,先内部评估一下。”


    “算是模拟试卷。”


    楚一航继续往下念规则。


    “十五万张测试集图片,答案不公开。”


    “这就是这个比赛真正的考题了。”


    “我们需要用自己的算法,预测这十五万张测试集的标签,然后上传到官网。”


    郭长征看着比赛周期说明。


    “比赛为期三个月,到明年3月15日截止。”


    钟柏指着“UplOad”按钮旁边的一行小字。


    “这上面写着,比赛期间可以随时提交预测结果。”


    “官网会根据提交的结果,动态更新每个团队的当前排名。”


    叶言愣了一下。


    “实时排名?还能这样玩?”


    楚一航乐了,拍了拍大腿。


    “这哪是搞学术,这纯纯是网游里的天梯排位赛啊。”


    钟柏也跟着分析。


    “以前的学术比赛,都是大家蒙头搞几个月。”


    “最后一天统一提交,组委会再花几天时间评阅,最后放榜。”


    郭长征思索着这种新赛制带来的变化。


    “实时更新排名,意味着所有参赛队伍都能看到别人的进度。”


    “这就倒逼着大家一刻不能停,只要被人超了,就得继续优化模型重新跑。”


    叶言接着念规则。


    “整个比赛期间,每个账号最多只能上传五次预测结果。”


    “最终成绩,取五次中得分最高的那一次。”


    楚一航啧了一声。


    “五次机会,这不就是排位赛里的保级赛机制吗?用完就只能干瞪眼看别人上分了。”


    钟柏继续看排名机制的具体算法。


    “榜单分为TOp-1正确率和TOp-5正确率两个实时排名。”


    楚一航看着那两条榜单规则,直接乐了。


    “这赛事主办方也太懂年轻人了,硬生生把沉闷的学术比赛做出了电子竞技的刺激感。”


    叶言在一旁兴奋地搓了搓手。


    “确实有意思,以前搞研究只能自己一个队伍闷头死磕代码,毫无互动可言。”


    “现在搞出实时排行榜和提交次数限制,直接变成了全网极客在线大乱斗。”


    钟柏的胜负欲完全被勾起来了,声音都不自觉地拔高。


    “这么一来,咱们上传成绩的时间节点就非常讲究了,还得跟全世界的其他队伍玩心理战。”


    郭长征看着几个干劲十足的年轻人,笑着点头。


    “这种赛制把竞争完全摆在明面上,确实能最大程度逼出大家的好胜心。”


    楚一航双手在键盘上快速敲击了两下,眼神里全是跃跃欲试。


    “那还等什么?我已经迫不及待想下场,好好蹂躏他们了。”


    ……


    至于为什么这次比赛的赛制,会如此有意思,还要说回两周前。


    远在魔都的高档写字楼里。


    英伟达中国大区总经理张建忠的桌面上,放着ImageNet赛事的最终赞助确认书。


    秘书小刘站在办公桌对面,正在汇报赛事的媒体宣发情况。


    “张总,ImageNet官网已经按照我们的要求,把实时排行榜功能上线了。”


    张建忠翻看着文件。


    “李飞飞教授那边没再提出什么异议吧?”


    小刘摇头。


    “没有。他们团队的资金缺口很大,亚马逊的众包标注平台收费很高。”


    “我们这笔赞助解了他们的燃眉之急,对于赛制修改的要求,他们全盘接受了。”


    张建忠拿笔在文件上签下名字。


    实时排行榜这个点子,就是他本人向总部提议,并要求加进ImageNet比赛里的。


    传统的学术比赛太过沉闷,圈外人根本不关心。


    既然英伟达赞助这次比赛的核心诉求就是热度,那就需要一种能让媒体持续报道、能让参赛者产生焦虑感和竞争欲的机制。


    排行榜就是最好的焦虑制造机。


    为了放大这种竞争欲,英伟达不仅赞助了赛事运营,还单独设立了三万美元的冠军奖金。


    小刘提出一个疑问。


    “张总,官网还开通了论文和代码同步公开的功能。”


    “这也是我们提的诉求。”


    “您就这么确信,排在前面的队伍,会用我们英伟达的CUDA架构吗。”


    张建忠靠在椅背上。


    “这不需要确信,这是概率学。”


    “目前市面上能提供大规模并行计算能力,且被学术界广泛接受的,就只有我们的显卡。”


    “高校那些传统的图像特征提取算法,处理几千张图片还行。”


    “面对一百二十万张的庞大数据集,传统的CPU计算模式根本跑不动。”


    小刘接着问。


    “万一有人用AMD的显卡呢?”


    张建忠笑了笑。


    “硬件只是躯壳,生态才是灵魂。”


    “AMD没有CUDA这样成熟的底层调用架构。”


    “研究员拿了AMD的卡,连最基础的矩阵运算库都要自己从头写。”


    “三个月的比赛时间,光写底层代码都不够,还比什么赛?”


    小刘翻开手里的另一份简报。


    “那盛夏科技前两个月推出的那个九章计算平台呢?”


    张建忠听到这个名字,手指在桌面上敲了两下。


    “九章确实是个变数,它能兼容AMD的硬件。”


    “但一个推出才两个月的新平台,很多高校的老师,甚至都没听过它的名字。”


    “研究员们习惯了我们英伟达的工具链,谁会冒着比赛失利的风险,去踩一个新平台的坑?”


    张建忠对目前的局势判断非常清晰。


    英伟达通过几年的高校赞助,已经完成了用户习惯的初步绑定。


    这三万美元的奖金,就是用来收割这批高校用户的成果的。


    只要前几名使用了CUDA并在官网上公开技术论文或者源码,那就是对英伟达最好的免费广告。
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一章>> (快捷键→)