奇群科技执行长宋牧奇一直想为旗下团队熟悉的先进GPU技术研发实力,找到一个杀手级的应用,经过多次碰壁后,没想到最后却是在家中得到答案,爱猫的意外激发他为多猫家庭打造智慧喂食器的点子。

2008年宋牧奇从美国IBM离职,便与另一位创办人共同创立奇群科技,他们一开始专注于GPU技术,并将之应用于开发多人在线游戏服务器平台,尽管当时各大在线游戏厂商也认为,能让服务器效能提升百倍是一项很厉害的技术,不过,因为服务器的花费对于一款在线游戏整体营运成本来说,比例低的不足一提,厂商不愿花费额外的开发资源转换平台,使的原本宋牧奇引以为傲的技术,因为疏于对于市场的了解,而导致这项产品最终以失败收尾。

在2014年,奇群科技却又因这项GPU技术的应用,获得了许多市场的关注,其智慧猫咪喂食器CATFi在群众募资网站Indiegogo受到超出预期的欢迎,3天内就达到原先募款目标的10万美元,最终吸引来自80个国家1,400名赞助者,共募得25万美元。CATFi这个看似有趣的商品,其后端所使用的技术并不简单,是运用现在当红的深度学习技术。

CATFi出发点只为解决自己的问题

而CATFi这个点子,来自宋牧奇饲养宠物的亲身惨痛经验,他家中总共养了5只猫,其中有一只猫一个星期都没吃东西喝水,但是他却不知道,因为5只猫都共享食物以及水的容器,当他下班回家,看到食物跟水都有减少,直觉认为每只猫都有正常吃喝,直到有天回家发现其中一只猫趴在地上不能动,送去医院才知道这只猫因为胰脏炎,导致身体不舒服没有食欲,没有进食引发血栓两只脚瘫痪,最后只好截肢。

宋牧奇的妹妹是兽医,常常碰到饲主将家中宠物带来就医的时候,健康状况已经非常糟糕,但如果能纪录宠物的饮食习惯,对于诸如糖尿病会导致猫咪进食喝水频率改变的疾病,就能提早发现,而不至于严重到无法挽回的地步。

宋牧奇表示,设计猫咪喂食器CATFi一开始的目的,只是想解决自己遇到的问题而已。CATFi的应用特别适合多猫家庭,有养猫的家庭,通常都不只养一只猫而已,宋牧奇提到,美国有多达一半以上的养猫家庭都是多猫家庭。

CATFi的功能不只能够纪录家中每只猫日常的喝水以及进食的状况,主人也能用手机看到家中爱猫吃东西的实时影像,或是过去的统计资料,而根据每只猫长期的饮食纪录,便能粗略掌握爱猫日常的健康变化。

在刚开始使用的时候,主人需要先在App中,标记几张家中猫咪的照片以及相对应的名字,以训练CATFi学习分辨猫咪间的差异,之后当猫靠进装置要吃东西时,踏板下不只有感测器能测得猫咪的重量,还能启动摄影机,实时将猫咪影像串流回后端服务器,经过辨识知道是哪一只猫咪要吃饭,再根据预先设定的喂食策略,给予猫个别化喂食。

至于猫咪会不会乖巧的使用喂食器,让摄影机拍摄脸部影像,或是同时有两只猫挤进喂食器的情况又该怎么办,宋牧奇说:「CATFi在装置硬件上做了很多猫体工学的努力」,以尽量避免意料之外的事情发生。

把喂食器设计的让猫方便使用固然是重要的,不过,CATFi之所以被称为智慧喂食器,是因为它能对每只猫给予不同的喂食策略,而要分辨出家中每一只猫并非易事,需要应用如同人脸辨识的机器学习技术,才能够不只让计算机知道什么是猫,甚至进一步知道每一只猫的不同之处。

深度学习让机器精准辨识猫

CATFi不只使用了GPU技术,还使用了机器学习中当红的算法深度学习(Deep Learning),

深度学习算法会从学习样本中最小的单位(Primitive)开始,例如样本是图片,为了优化学习效果,须将资料处理单位拆解到像素等级,算法会从每个画素出发,计算画素与画素之间的线段关系,线段与线段的连接形成边的关系,而边与边相连则会形成轮廓关系等,每一阶段的处理都是一种特征萃取,计算机进而找出具有哪些特征的图片是代表猫。

适当的将深度学习算法运用在辨识工作上,能取得良好的结果,但由于深度学习是复杂数学模型,且要使用足够多的训练样本,才能得到够好的结果。计算上又需从样本的最小单位(Primitive)开始计算,并且经过多层特征萃取,因此非常耗费运算资源,当用来训练模型(Model)的运算能力有限的时候,训练一个可用的模型所需时间可能高达数周,这样的时间成本,在很多情况的应用上可用性便大打折扣,更何况并非任何人都能拥有千台服务器等级的运算资源。

CATFi是一款智慧猫咪喂食器,后端使用深度学习技术,能够辨识家中每一只猫,并根据不同的喂食策略喂食,主人还能透过App实时看到猫吃东西的画面。

产品大约有以下几个重点:

1、具猫脸辨识,能够辨别不同的长相。可以得知是哪只猫在吃东西

2、所站的地方具体重测量功能,可以测知猫的体重

3、喂食器的部分,一边是放水,一边是饲料,藉由重量的变化,可以得知每天所吃的份量

4、猫吃的地方有摄影机,除了刚谈到的辨识技术外,另一方面也可以让你在远端看到他。所以能够在你不在家的时候,帮你顾好家中的猫小孩。当家中猫咪食欲有异常状况时,会透过app通知宠物主。

不止精准,GPU加持让辨识更快

为了克服深度学习训练模型动辄以天计算的问题,工程师开始把脑筋动到GPU上,利用其平行运算的特性加速整个过程。但在GPU以及分散式系统执行机器学习都会遭遇相同的问题,由于机器学习在取得最终结果之前,中间过程需要经过多次迭代,而这两种平行运算的系统在设计上,便需要建立互相沟通的机制,让机器互相交流信息,宋牧奇说,由于在GPU上每个执行绪是共享存储器,所以耗费在沟通的成本非常低几乎可忽略。

GPU与深度学习的结合,使得技术可用程度得以大幅提高。因为即便深度学习的辨识率很高,但是当计算时间需要过长的时间,那终究是无用,毕竟使用者利用象是Google Now的语音搜寻服务,便会想要立即得到结果,对于回应延迟的容忍度随着科技发展而降低。