Facebook是怎么训练AI模型的?答案是你的Instagram照片!

2018-05-07 17:53 未知
  如果你的Instagram个人页面充斥着许多公开照片以及你习惯在贴文中加上几个hashtag的话,你有可能正在帮Facebook训练机器学习模型!Facebook在近日的年度大会F8上谈到有关图像辨识技术时,说明他们使用了在Instagram平台上的35亿张公开照片和标签来训练AI的图像辨识模块。
Facebook是怎么训练AI模型的?答案是你的Instagram照片!
Facebook是如何处理这庞大的35亿张Instagram照片?Facebook表示,他们会藉由标签和照片本身,让AI学会辨识哪些主题标签为同义词,最终,将这些标签变成一套大规模的标签预测模块,用来训练图像辨识模块,Facebook还指出,他们每天会依靠数百台全天候运行的GPU来解析这些数据,而目前在ImageNet(图像数据库)上已经可以达到85.4%的准确度。

不过,谈到他们最被众人所关注的隐私问题,Facebook表示,这些资料只会用来辨识与标签之间的关联性,且使用的资料都是公开的,并不会从照片内容去推断用户的行为,如果用户不想要自己上传的照片成为训练素材,只要不在公开的照片上附加hashtag即可。

Facebook首席技术长迈克·施罗普佛(Mike Schroepfer)表示,这项功能虽会带来很多方便,但在训练的过程中其实遇到很多困难,象是有些使用者会标错标签,都会为训练过程带来影响,但他说道,「Facebook目前还需要更多新的突破及技术来解决所有人想解决的问题。」

迈克表示,目前平台上的辨识工作皆是由AI处理,包括扫荡恐怖主义、色情及危险内容等等,因此,用户在Instagram上传的照片及标签的同时,也正在为Facebook的深度学习技术做出贡献。 责任编辑:Fanny
::before