Facebook为AI首次应用自我监察学习，可减少大量人

来源：中国应用生理学杂志 【在线投稿】栏目：综合新闻时间：2021-03-07

一直以来，AI虽然说潜力非常大，透过训练建立起庞大的数据库之后可以完成各种任务，但最终AI还是需要人类在旁监察指导以及提供数据来学习。不过，人类操作现在或许可以减少一点了，因为Facebook首次把自我监察学习（Self-Supervised Learning，简称SSL）应用到计算机视觉训练上。

图片来源：Facebook

Facebook AI部门的研究员在一篇博客上表示：

“我们建立走了一套名为SEER（Self-supERvised）的计算机视觉自我监察模型。它拥有数以亿计的参数，可以自动从网络上不同类型的图片中学习。与现在现在大多数计算机视觉训练不一样，SEER不需要任何人为干预或者为标记图片。”

Facebook AI部门主管Yann LeCunn向Engadget表示，在一般人为监察的训练中，就好比要语音识别一句话首先要先为发音的字词进行标记一样，要识别图像也需要先为不同图像作标记。

而无监察训练的目的，就是为了可以在图片没有作标记的情况下也可以训练AI。其中一个方法就是联合嵌入（Joint embedding），意思是把两张非常接近，只有些许不同的图片呈现给AI，然后训练AI直至系统产生的任何关于这两张图片的矢量都是相近的。之后要确保当AI看到两张不同的图片时，会产出不同的矢量。一般来说最普遍的训练方法就是随机从几百万中图片上找几张已知是不同的图片，然后把它们交给AI判断。不过这样的方法非常消耗人力物力，同时也需要大量时间才可以完成。

另外，相对于语言而言，图像的概念会复杂很多，因为算法需要决定一个像素是属于哪个概念的，并且同一个概念在不同图片中也会有不同的呈现方式，例如说不同姿色下的猫，以及不同角度下的猫，牠们都一样属于猫。

而为了让这样的训练可以更加高效，Facebook的研究人员在SwAV上找到了一种非常具有弹性的算法，训练速度是此前使用的方法快6倍。此外，他们也找到了一个复杂神经网络RegNets，它可以向训练模型注入数以10亿计的参数，同时也可以为不同的计算资源作优代。

SEER就是这两套工具下的产物，并且表现也很不错。在经过参数预训练之后，SEER在ImageNet上的Top 1正确率达到了84.2%。即便是只用10%的原始数据来训练，SEER的Top 1正确率也有77.9%。更加另人惊讶的是，如果只有1%原始数据来训练的话，SEER的Top 1正确率也高达60.5%。

SEER的例子也说明了，无人监察学习训练在计算机视觉应用中是可以很高效的，而像Facebook以及其他社交媒体，有了像SEER的系列之后就可以更好地应对那些违规的内容。如果大家是有兴趣想了解更多SEER的训练库的话，可以到VISSL这个网站详细看看，并且从GitHhb上下载相关的代码。