另一边,对这边内幕一无所知的孟繁岐,正准备前往白度的燕京总部。
作为重生人士的他,终究还是高估了现有的检测技术。
第一个真正意义上将深度学习技术应用到目标检测上的,应当是这个月刚刚提出来的R-CNN,也就是区域检测神经网络。
在传统算法mAP值止步于30-40,不再继续提升的情况下,R-CNN基于神经网络,一举突破了60的mAP值。
它的R指得便是区域,检测任务说白了,就是指出物体在图片中的位置区域。
而即便在14-15年,R-CNN系列作为领先的高性能算法,他的推理时间也是奇慢无比的。
采用14年牛津大学的VGG网络作为结构的骨干,需要整整几十秒才能处理一张图像。
也就没有了任何实时的可能,只做学术研究之用,难以投入业界。
即便是一两年后,屡次更新,升级迭代的快速版本FastR-CNN系列,也只有0.5和个位数的FPS。
而孟繁岐给出的算法:YOLO。
即便在448x448大小的图像上,速度也超过了80FPS。
如果采用最小的模型版本进行推理,速度甚至可以达到惊人的200帧。
多少人直到十年后,玩游戏的时候显示器都显示不了100帧?
();() 原本的初版YOLO技术其实在精确程度上还有所不足,毕竟,作为专注于速度的检测技术,在性能上有所牺牲也是在所难免。
但孟繁岐开始接触YOLO技术的时候,都已经出到V4了,等到2023年的时候,甚至都已经到了V7,V8。
很多细节上的问题,孟繁岐就是想犯错都不知道该怎么犯。
最开始记得的就是优化之后的技术。
此时此刻,比较常用的检测技术是DPM,30FPS性能26.1mAP,100FPS性能仅为16.0mAP。
而这个月刚刚出来的R-CNN技术,性能虽然有一个质的突破,来到了50-60,但FPS已经到小数点后几位去了,根本用不了。
孟繁岐交出的结果则是,69.5mAP,82FPS,58.3mAP,200FPS。
这已经不能说是普通的超越了,简直是完爆中的完爆。
不过除了在这方面有所疏忽之外,孟繁岐实际上还是在有意识地想要做高这个性能。
纵观自己掌握的所有AI技术,唯有检测是现在阶段变现最快的。
这个功能直接粗暴好理解,易于展示。
只需要接上摄像头,给观众们实时地演示,这项AI技术可以流畅丝滑地检测出屏幕中的桌椅,人物,动植物等常见物体,就能够给观众最为直接的震撼。
像图像生成,语言对话等技术,还需要一定的时间,海量的数据和计算资源来支撑,自己才能够实现这些技术。
而在实际的应用前景上,检测技术不仅是现阶段最容易落地的技术,它的未来前景也非常辽阔。
两三年后搞自动驾驶的企业那是不计其数,如过江之鲫,数不胜数。
在检测上尽力做出夸张的突破,很有助于此后自己在这个方向上的历史地位,说白了其实就是更容易忽悠到钱。
只是他第一次把握刀法,经验不足,没有切好。
不慎导致比较专业的人士对此有所误会。
林克穿越了,没有金手指,奋斗十多年,终于过上有车有房的宅男生活。然后末日降临了。他的金手指末日游戏one,随之激活。林克认为,自己拯救不了这个世界。但他还不知道问题的严重性,因为需要拯救的世...
林蔓穿越了,别人穿越为农家女是采药卖方子赚第一桶金,而她就不一样了,她靠的是写艳书。尖酸刻薄的奶奶小肚鸡肠的大伯一家子的极品亲戚不怕不怕,来一个灭一个,来两个灭一双。...
穿越封神大劫之前上古神话世界,重生帝俊亿万载,一朝真灵苏醒已是接近巫妖大劫。就在帝俊为巫妖量劫而迷茫的时候,系统突然觉醒了。帝俊我都大罗了你告诉我系统才觉醒?还得完成各个任务才有奖励?察觉到彼此之间差距,帝俊直接开局就是炼化系统将系统祭天,由此获得运朝大道。推演运朝大道,为改变命运,帝俊建立神话运朝,打造至高天庭。妖族天庭?人者,天地人三道之一,凡是生灵或是信息结合存在,若有灵智皆以为人。以人道镇压天庭气运,以天庭统御诸天众生,建立人道天庭!当帝俊收服洪荒强者时以前世一些至高道路噱头忽悠洪荒大能,万万没想到忽悠的话竟然变成真的了。三清立三道,演化诸因之果存世之基终结之焉。女娲立人道,构建人道诸天,自身投影照映诸天,道统汇聚万界。伏羲汇聚琴演之道,以时空为琴声,以琴声追溯万古。冥河鲲鹏看着这一个个洪荒大能,帝俊陷入了沉思。我就说说而已你们还真行?...