默认冷灰
24号文字
方正启体

第1801章 技术深水区

作者:极地苍狼本书字数:K更新时间:
    周一的技术战略会上,贾瀞雯在白板上写下四个字:图像搜索。


    会议室里安静了几秒。


    然后响起一阵低低的议论声。


    “图像搜索?”李明重复了一遍,“用户上传图片,然后我们找相似的图片?”


    “对。”贾瀞雯点头,“技术上叫基于内容的图像检索。


    国外有实验室在研究,但还没有成熟的产品。”


    张涛推了推眼镜:“贾总,这个……太超前了吧?我们现在连文字搜索都还没做到完美。


    图像搜索的复杂度要高几个数量级。”


    “我知道难。”贾瀞雯说,“但搜索的未来不只是文字。


    图片、声音、视频,这些都是信息。


    如果我们现在不开始研究,等别人做出来了,我们就落后了。”


    王磊举手:“技术上具体要做什么?”


    “分几个部分。”贾瀞雯在白板上画图,“第一,特征提取。


    从图片里提取颜色、纹理、形状等特征。


    第二,特征索引。


    把这些特征建成可搜索的数据库。


    第三,相似度匹配。


    用户上传图片后,计算和库中图片的相似度,返回最接近的结果。”


    她画完,看向团队。


    大多数人都皱着眉头。


    “这需要计算机视觉的专业知识。”新来的一个算法工程师说,“我们团队没人懂这个领域。”


    “需要大量的计算资源。”另一个工程师补充,“图片特征提取很耗CPU,匹配算法也很复杂。


    现在的服务器可能扛不住。”


    “还有数据问题。”李明说,“我们需要海量的图片数据来训练和测试。


    去哪找这么多图片?”


    质疑声一个接一个。


    贾瀞雯安静地听着,等大家都说完了,她才开口。


    “所有的困难我都知道。”她说,“但陈总说了,有些事现在不做,以后就晚了。


    图像搜索是未来,我们必须现在开始布局。”


    她顿了顿:“当然,不是要马上做出产品。


    我们先做预研,探索技术可行性。


    周期定六个月,投入资源控制在可接受范围内。


    这样可以吗?”


    团队互相看了看,最终都点了头。


    但贾瀞雯能看出来,大部分人心里还是没底。


    会后,她给陈浩打电话汇报情况。


    “团队反应怎么样?”陈浩问。


    “有疑虑。”贾瀞雯实话实说,“觉得太超前,技术难度太大。”


    “正常。”陈浩说,“新技术的探索总是这样。


    我等会儿发你一些资料,是国外论文和研究报告。


    你让团队先学习,有个概念。”


    半小时后,邮箱里多了十几封邮件。


    附件全是PDF,英文的,有些还有复杂的数学公式。


    贾瀞雯打印出来,厚厚一摞。


    她抱着这摞资料回到会议室,团队还在讨论。


    “这是陈总发的资料。”她把资料放在桌上,“大家先看看,了解下这个领域的前沿进展。”


    李明拿起一份,翻了翻,眼睛渐渐亮起来。


    “这篇论文……讲的是基于颜色直方图的图像匹配。


    思路挺巧妙的。”


    张涛也拿起一份:“这个是纹理特征提取的方法,用到了小波变换。”


    新来的算法工程师看着一篇论文,喃喃自语:“这个相似度度量公式……有点意思。”


    资料起了作用。


    团队开始认真研究,会议室里响起了讨论声。


    但一周后,问题又来了。


    “贾总,我们试了几个经典算法。”李明汇报,“效果……不太好。


    简单的图片能匹配,稍微复杂点就乱了。”


    “具体什么问题?”


    “特征不够鲁棒。”张涛解释,“同一辆汽车,不同角度拍,提取的特征差异很大。


    算法认不出来是同一个东西。”


    贾瀞雯思考着。


    这时,陈浩的电话来了。


    “进展如何?”他问。


    贾瀞雯把问题说了。


    陈浩听完,没直接给答案,而是问:“你们现在怎么做的?”


    “按论文里的方法,先做整体特征提取,再做全局匹配。”


    “换个思路。”陈浩说,“分阶段实现。


    第一阶段,不做通用图像搜索,先做特定类别的识别。


    比如先做汽车识别,因为汽车有比较固定的特征。


    第二阶段,扩展到建筑、动物等常见类别。


    第三阶段,再做通用搜索。”


    贾瀞雯记下来:“这是技术路径上的建议?”


    “对。”陈浩说,“另外,方法上也可以调整。


    不要追求完美算法,先用简单方法验证可行性。


    小步快跑,快速试错。”


    挂了电话,贾瀞雯立刻召集团队。


    “调整策略。”她说,“我们不分阶段:第一阶段,选定十个常见物品类别——汽车、建筑、动物、植物、家具、电器、服装、食品、书籍、艺术品。


    第二阶段,每个类别做专门的识别模型。


    第三阶段,整合成原型系统。”


    她看向李明:“方法上,先用最简单的特征——颜色和纹理。


    效果不好再升级。


    目标不是完美,是验证可行性。”


    团队重新分工。


    十个人,每人负责一个类别。


    贾瀞雯要求每周汇报进展,遇到问题随时讨论。


    第一周,进展缓慢。


    负责汽车识别的工程师发现,不同颜色的汽车在颜色特征上差异太大。


    负责动物识别的发现,猫和狗在某些角度下很难区分。


    第二周,有人想出了新办法。


    负责建筑的工程师提议,用边缘检测提取轮廓特征,因为建筑有清晰的几何形状。


    这个思路在其他类别也适用。


    第三周,团队开始分享经验。


    汽车组借鉴了建筑组的轮廓方法,动物组结合了颜色和纹理特征。


    小步快跑的策略见效了。


    虽然每个类别只能做到百分之六七十的准确率,但至少能跑了。


    第四周,贾瀞雯组织了一次内部演示。


    每个小组展示自己的成果。


    汽车组:能识别轿车、SUV、卡车等大类,但细分车型还有困难。


    建筑组:能区分现代建筑和古典建筑,但具体风格识别不准。


    动物组:能区分猫、狗、鸟等大类,但具体品种分不清。


    演示完,贾瀞雯总结:“虽然不完美,但证明了这条路能走通。


    下个月的目标:提高每个类别的准确率,同时开始做系统整合。”


    【跪求礼物,免费的为爱发电也行!】
(←快捷键) <<上一章 投推荐票 回目录 标记书签 下一章>> (快捷键→)