您的位置 首页 电源

五大可辨认图片的人工智能技术

很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(TurningTest),证明了机器能够像人类一样智能地回答书面问题

很长一段时间以来,人工智能的研讨都停留在文字层面,比方闻名的图灵测验(Turning Test),证明了机器可以像人类相同智能地答复书面问题。而假如让机器变得更聪明,只是处理文字显然是不行的。事实上,人类心智十分长于视觉处理。从所见傍边辨认图画、物体以及文本情形的才能让咱们很智能,这种才能也是人的本质特征。

  不过直到最近,计算机都对图片束手无策。比方,除非人为增加一些标签和注释,不然机器就无法了解图片,图片也便是成了无用的文件。可是,这种为难的情况正在发生变化。一大批能看懂图片的人工智能技能现已来到人世,下面无妨来看看机器之心的盘点:

  谷歌 TensorFlow

  5月份谷歌推出 Google Photos时,媒体重视的焦点是:人工智能和图片查找结合后所发生的强壮功用。谷歌宣称(并且用户也很快承认),查找特定或人,你会找到对方从现在到婴儿时期的相片。查找种类名,你就能找到相应种类狗的相片。把姓名和食物类别结合起来,比方输入「最大披萨」,就能确定特定图片。

  这款运用发布之初,媒体无从得知谷歌终究研发了多长时间。不过,一些查找功用在Google+上呈现一年多了。

  两周前,谷歌以TensorFlow渠道方法开源了它的人工智能主体部分。

  虽然TensorFlow并不是第一个开源人工智能渠道,可是,它是与谷歌强壮图片查找联系最为亲近一个。

  开源TensorFlow意味着,包括草创公司在内的其他公司,可以运用谷歌的这个开源渠道,快速将人工智能和图片结合起来。虽然谷歌并未敞开人工智能关键技能,包括在很多服务器上运转的才能。谷歌也没有敞开让其如此强壮的用户数据库。可是,谷歌的此举毫无疑问将**整个机器学习和人工智能创业生态的开展。

  咱们也期待着根据TensorFlow的各种震慑新运用能于下一年进入市场。

  Facebook Photo Magic

  Facebook近期开端在Messenger运用上测验一项新功用——Facebook Photo Magic。这是一个可选运用,它会扫描手机相册相片并对它们进行面部辨认处理。Photo Magic会辨认相片中的人物(他们也是你的Facebook老友),主张你和他们一同共享这些相片。  

  毫无疑问,这项功用给Facebook带来了两层优势。首要,它鼓舞用户更多在Messenger上共享。其次,它改进了辨认。可是,只是这项便当功用是不行的,用户实际上可以拥护或回绝在恣意灯火条件、视点和其他参数条件下,Facebook运用人工智能对面部和姓名进行匹配。Facebook人工智能把握的相片越多,辨认作用也越好。

  令人吃惊的是,即便遮住了脸部,Facebook的「面部辨认」相同能能辨认出你的脸部。这个体系也重视发型、姿态、穿着和身段。(请注意,咱们并不清楚Facebook是否现已完成了这种先进体系,但很明显的是,它从用户相片中搜集数据。)

  Facebook 的Photo Magic拓宽了图片库来历,它不只搜集Facebook(交际网站),还搜集Messenger(谈天运用)的数据,扩大了数据量。Photo Magic还鼓舞拥护或否定匹配成果,进步数据质量。

  很明显,Facebook最终目标是辨认恣意场景中的任何人,即便在看不清脸部的恶劣灯火条件下。毫无疑问,未来Facebook的人工智能会扫描和剖析环境,发现可市场化的头绪——比方,假如或人在相片里经常打棒球,广告商就可以运用这个信息确定棒球迷,虽然他在上传相片的文字里并没有表露出这种爱好。

  毫无疑问,他们也计划经过调查图片中一同呈现的人,进一步树立交际图谱。

  微软牛津项目(Project Oxford)

  微软日前也更新它的牛津项目,这是一个东西包,让开发者经过旗下的Azure云渠道,运用微软的人工智能体系。

  这个东西包支撑人工智能各个方面的运用,包括白话,视频和其他媒体。可是,最震慑和最强壮的功用莫过于牛津项目现在支撑开发者经过牛津人脸运用渠道接口项目( Project Oxford Face API)检测图片中的人物表情。 

  比方,用牛津项目处理一张包括5个人的相片,辨认相片中的脸以及每个人的表情——高兴,愤恨或厌恶。

  这项功用在新的高度,像人类相同「了解」图片质量。观看别人相片时,人们重视的最重要特征便是个人或集体的情感情况。

  Pinterest Visual Search

  Pinterest日前发布了全新的图片查找功用,它能协助用户发现更多的信息乃至协助购买他们在固定相片里看到的产品。

  首要,在 Pinterest的图片中选中任一物体(来回拖动一个盒状标识)。然后,查找东西会找到具有类似图画和色彩的类似物,体系会将最匹配的成果链接到购买按钮上,点击这儿就能购买该产品。

  这个功用是以伯克利视觉和学习中心(Berkeley Vision and Learning Center)的深度学习人工智能为根底的。

  这种相片人工智能运用可以说是万维网相片的雏形,在这个万维网中,每张图片中的每个物体都与同等物或许类似物、相关物互相相关。

  CloudSight

  一家名为CamFind的图片辨认和视觉查找公司,本年推出了一个「云视觉」(CloudSight)的公共运用渠道接口。

  这个API支撑开发者运用CamFind的人工智能剖析图片内容。这样的扫描大多数情况下具有高度特定性,比方,能辨认轿车的制作和模型,或许狗的种类以及食物的详细类型。一旦剖分出图片中的物品,开发者就可以运用这些信息来获取网络上的文字信息。

  Deepomatic

  Deepomatic开发了一种服务型软件智能查找引擎,它能辨认图片中各式各样的数据。Deepomatic热心时髦。它不只匹配色彩,图画和其他数据,还能辨认图片中的物品,并将它与一个全面的时髦产品数据库进行匹配。

  Deepomatic网站宣称,其技能模仿了人类大脑接纳视觉信息的方法并用这种方法来了解各种概念。

  远大远景

  每逢想到这样一个令人惊喜的新国际:可以了解相片内容的人工智能将无处不在,具有强壮扩展潜力且垂手而得时,这些无限可能性就会令人拍案叫绝。

  并且,这只是是一个开端。在绝大多数情况下,这项技能简直都能经过API,开源程序或服务化处理得以运用完成,因而,咱们现已站在了未来国际的进口:图画AI将和网络查找相同遍及,成为这个国际的一个基本特征。为了真实模仿人工智能,计算机必须有视觉,现在它们有了。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/dianyuan/225373.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部