影响图像质量的因素除了光照、模糊还有很多比如噪声、分辨率等等问题,这些问题大多也是从算法和硬件上去优化,值得注意的是我之前提过的,需要考虑到时间和成本的权衡。 三、早期视觉(early vision) early vision这部分其实我之前没有总的概念,看了徐立的分享,回头来才发现“哦!原来大家当时做的是这个部分的内容”。 early vision主要是做哪些工作呢?主要是图像分割、边缘求取、运动和深度的估计。这些内容其实没有直接的结果应用,是一个“中间状态”。
图像分割是指将特定的影像分割成【区域内部属性一致】而【区域间不一致】的技术,是图像处理中最基础和最重要的领域之一。 图像分割方法有很多种,比如灰度阈值分割的方法、边缘检测法和区域跟踪等方法。很多种类的图像或景物都有相对应的分割方式对其分割,但同时有些分割方法也仅限于某些特殊类型的图像分割。 拿边缘检测来说,其目的是找到图像中亮度变化剧烈的像素点构成的集合,表现出来就是轮廓。
徐立提出了early vision现目前的两个问题: 结果不精确 需要长时间的知识沉淀才能做到 第一个问题的解决办法是用端到端的方式,第二个问题的解决办法可以依靠数据驱动。 这部分产品介入的比较少吧,平时跟算法同事沟通听见比较偏多的反馈是在图像分割上有一些缺陷。像徐立说的“怎么样用这种中间的结果去得到更好的应用,至今来说觉得这都是一个比较难回答的问题”,因此产品或许可以去考虑早期视觉直接应用的场景。 四、识别理解(Recognition) 识别理解是需要把一张(输入)图对应到一张(输出)图,或者说一张(输入)图对应到一个中间结果。简单来说就是把一张图对应到一个文字或标签。这其中有两个重要的因素:标签、数据。这两个因素广度和精度越高,针对模型最后的识别效果就越好。 标签 标签的定义其实也就是规则的定义,我在上一篇文章《AI产品经理需要了解的数据标注工作》里有提过,越精确的标签肯定对模型的结果有利,但同时越精确的标签意味着这类标签下的数据量就会越少,产品也需要考虑到这个因素。 还有一些会被主观因素影响的标签定义,比如颜值,每个人对颜值的评价都是不一样的。徐立说在他们的颜值模型里会分为“漂亮”“不漂亮”两个标签,主要是靠社交网站上的评分和明星与大众的区别来标注。其实我以前也跟过颜值的模型,在我的模型里对颜值更加细化了:有好看、普通、丑。除了根据社交网站打分、明星打分这种方式,我的经验是关注数据的场景类型,很多数据被归为一类都是场景相似的。比如如花,我们觉得丑吧?大多数男扮女的装扮也都会被定义为丑。 另外更细的标签细分会有更多的落地可能性,我印象最深的就是以前颜值模型有一个节日运营活动,主题是扮丑,办得越丑的人还会有小礼品,这个活动上线后在友商的用户圈内引起了很高的关注度。当时我接到这个活动的时候思想其实是被颠覆的,因为我最开始认为颜值模型可能存在的场景主要是去识别美的人,比如在直播等平台中去区分主播的颜值,推荐更优质的主播上首页等等后端的应用,没有想过还能反着用。经过这个活动的启发,后来我们也发现颜值模型在娱乐性上可以有更多挖掘的可能性。 这样看来由于我们的模型多了一个标签定义,就多了一种落地的可能性,标签的重要性也就不言而喻了。 数据优化 数据的数量和质量对模型来说举足重轻。最近刚接收到的重磅消息:阿法狗的弟弟阿法元没有任何先验知识的前提下,通过完全的自学,打败了由数据训练出来的阿法狗。我相信以后这个技术肯定会越来越多的应用,说不定以后确实在某些领域不利用海量数据也能完成模型训练。但是就目前而言,在计算机视觉领域,数据的大量性是重中之重的。 我们大家肯定都知道,数据优化可以使模型越来越好。什么类型的功能表现得不好,就要填补那些对应的数据。而除了这个常识外,其实数据优化还可以用来解决我们经常在训练过程中出现的问题:过拟合。 什么是过拟合? (责任编辑:admin) |