码隆科技黄鼎隆:探索商品识别“无人区” | 我有嘉宾
校友名录 · 2018-11-07
导读:
零售业作为与消费者息息相关的领域,人流、资金流、数据流庞大且繁杂,为人工智能的应用提出了挑战,同时也提供了无限想象的空间。通过数据和与商业逻辑的深度结合,以及先进感知技术的成熟应用,人工智能为新零售创造更多效益和购物体验。
创立于2014年的码隆科技,是通过人工智能对图像中的商品进行提取,并整合其背后的所有属性。其目前涉猎的领域主要有时尚、新零售、安防、医疗等垂直行业。
码隆的创始人团队是一对中美组合,在创业的四年中,他们的产品从C端迭代到B端,期间也做过不太成功的商业案例和风光无两的产品,总结出很多的行业经验。在黄鼎隆看来,“AI企业失败和成功的教训都指向一个,产品挺炫酷,但似乎没有什么用。真正的人工智能,是让别人的产品更加智能。”
另外,黄鼎隆坦言,如果有一天码隆科技或者同行业的某家企业倒下了,最大的原因应该是商业落地。“行业经过三年的时间迭代,已经进入验收期了。”而就目前的码隆科技现状来说,虽然有实际的产品商业化,但是如何大范围的铺开,这是一个全方位的系统挑战。
作为一家纯技术公司,码隆科技的办公室的设计风格却更像一家文化公司。
满满的现代感装修线条倒映在玻璃上,与疏阔的海天景色融为一体。除此之外,办公室还有许多巧思的小细节:网红电话亭、温馨的母婴室,还有分中式、清新开放、黑白灰极简主义、水粉色小清新、一人间的 coding room等千姿百态风格的会议室。
据「我有嘉宾」了解,今年6月,码隆科技搬进了现在办公室的时候,员工最容易发生的事情就是“迷路”。
“某某某会议室/人在哪里?”
“不知道,你就走走看吧,反正是环形办公室,走一圈总能找到的……就像地球是圆的。”
这是一家专注于引领深度学习与计算机视觉技术突破的人工智能公司,所以在做整体室内设计时,也是按照一只眼睛的概念去设计的——所有员工都在同一个开放办公环境里工作,即便是CEO黄鼎隆和CTO码特也没有独立的办公室。按黄鼎隆的话说,“在这里沟通门槛很低,甚至喊一嗓子就行。有任何想和老板们交流的内容,或者想请教技术大咖的问题,随时都可以问。”
在这偌大的海景房里,有一张照片极为显眼:三个不修边幅的年轻人在杂物间埋头苦干。黄鼎隆告诉「我有嘉宾」,2014年创业初期,几个人在中关村创业大街车库咖啡工作,但时常被打扰,然后借用了朋友的杂物间办公,室内充满烟味环境恶劣。
尽管如此,黄鼎隆还是认为与其他创业者相比,自己算是幸运的,2-3个月后就搬到了微软创投加速器,“之后的路也算顺风顺水。”
码隆科技创始团队在充满烟味的杂物间办公
在“达芬奇”会议室,黄鼎隆接受了「我有嘉宾」的专访,颇有蕴意的会议室名字,也彰显着码隆科技对科技和探索精神的追求。
从C端到B端
黄鼎隆在清华大学念完人机交互博士之后,先后在谷歌、微软、腾讯和TripAdvisor就职。在微软工作期间,与有十年研发经验,曾任微软亚洲研究院高级研发主管的码特成为黄金搭档,一起推出了“必应词典”,促进了微软在中国本土化上的创新。
在这个过程中,黄鼎隆和码特已经开始大量使用机器学习的方法,也处理了许多文本相关的信息,他们意识到,互联网信息有很大价值,图像就是一座未被开采的巨大金矿。“只可惜那时候,技术还达不到现在的水平。”黄鼎隆说道。
两人一拍即合决定创业,是码特在北京结婚那天。婚礼后,黄鼎隆等几个人聚在小酒馆聊天,当他们聊到这波深度学习技术的竞争时非常兴奋,并产生共识:人类80%的信息获取都是通过视觉,且图片不分国界和语言,所以挖掘图片数据比文本数据更有价值。人与计算机的交互方式,可能也会从文本转为以视觉为主,而且基于视觉的数据可以被结构化,这在商业层面也有很多的应用。
看到了未来曙光,黄鼎隆回去之后,好几天都没睡着觉。
在创业的前两年,码隆科技的产品定位在C端。为了解决年轻人穿衣搭配的需求,推出了一款以图搜图的移动应用——StyleAI,它不仅能够根据用户所拍图片搜索同款、提供穿搭建议,还能为用户的服装照片进行自动分类并提供智能推荐。
资本的橄榄枝是对当时的码隆科技最大的肯定。2015年3月,凭借StyleAI,获得由远镜创投和达晨创投的1200万元天使投资。
虽然解决了资金难题,码隆科技可以快速提升技术、打磨产品,但公司还是遇到了初始企业高速发展中的问题:StyleAI应用毕竟不是电商入口,无法积累用户消费行为,也无法构建闭环。因此从商业角度讲,算不上成功。
他们逐渐意识到,与其做一款面向C端市场的APP,倒不如用技术直接服务于B端企业,这是码隆科技的“最优选择”。一是他们希望技术服务积攒下的大量数据用户,可以最大程度地实现技术的价值;二是逆势而为,继续开发APP,无法创造更多的商业价值。
「我有嘉宾」团队在体验StyleAI
真正的转变是在2016年10月,码隆科技正式发布ProductAI人工智能视觉应用平台。具体来说,这是一个用数十亿商品数据训练出的人工智能系统,该系统具备看懂图片、视频中的商品及其各种属性的能力。
在商业运用上,ProductAI是一项PaaS服务,开发者可通过调用其接口来获得人工智能服务,以精确识别服装面料等易变形、遮挡、扭曲物体。
转型后的码隆科技,商业切入点主要在时尚、新零售、安防、医疗等垂直行业。
比如ProductAI可以准确识别出照片中衣服的元素,并针对颜色、款式、风格进行一一标注。以往服装企业需要聘请专业的时尚人士才能完成的事情,ProductAI可以瞬间解决。
黄鼎隆告诉「我有嘉宾」,过去行业了解潮流趋势的方法是组织专家去巴黎、米兰、纽约时装周,回来再总结什么东西会变得更流行。现在利用技术的力量,只要将时装周的100多万张照片输入到商品识别系统,马上就得到一个量化的结果。比如说某种颜色、装饰元素从百分之几提升到了百分之几,迅速识别出一个流行趋势,使效率有上百倍的提升。
另一方面,很多商业信息没有绝对干净的数据,ProductAI可以快速、有效处理含噪音的数据。例如一张图片里明明是只阿拉斯加犬,但却标注成了其它的犬,ProductAI便可以迅速识别错误并更正。
在错误的数据中如何快速训练出正确的模式?这对传统深度学习技术来说,要花很大的成本去标注、清理这些数据。
在互联网逻辑中,门口的野蛮人永远存在,跨界打劫永远是守恒定律。比如在无人货架虚火散尽后,行业内外又一齐将目光投向了智能货柜。但想要达到无人货架一样的扩张速度和体验效果,智能货柜的瓶颈尤为明显。
首先,用来控制货损的RFID、重力感应、视觉识别等都是目前市面上主要运用的技术和功能,成本相对较高;而无人货架的成本则能够控制在几百元。其次,由于技术尚未成熟,在智能货柜使用过程中,也会产生一定的错误识别率,影响用户体验。
戳中行业痛点,又与自己的技术挂钩,黄鼎隆决定用 ProductAI 驱动下的摄像头代替重力感应模块的成本和 RFID 消耗。
商家无需购买专门的货柜,只需将技术接入现有设备上,即可进行有效的商品数据库训练与识别,节省运营成本;在更新货架时,商家不论是随意摆放还是有序放置,库存情况都将基于视觉识别完成精确数量清点,为其提高运营效率。对消费者而言,在挑选商品的过程中可随意更换商品,关门即可完成结算,即便最后决定不进行购买,将商品摆放回去也可精准识别,大幅度优化了消费者的购物体验。
涉猎全球市场
AI企业失败和成功的教训都指向一个,“产品挺炫酷,但似乎没有什么用。”
在黄鼎隆的眼里,并不喜欢媒体片面地问他能够赚多少钱,因为“真正的人工智能并不是让自己变得多智能,而是让别人的产品更加智能”,他更关心的是客户能不能赚到钱。这里面分两种情况,一种是帮企业省钱,一种是帮企业创造新的商业场景,赚更多的钱。
提到帮别人赚钱,增加利润这一点,黄鼎隆坦言,他们采用的是接入API的商业模式,客户接入码隆后,依照调用次数收取一定费用。“这虽然不是码隆科技商业最大化的方式,但它是目前最合理的方式之一。”可以让很多还在犹豫是否需要人工智能场景的客户决定试一试,如果调用不多,并不需要付很多钱;如果调用多,那说明对该企业的用户是有价值的,可以产生更多的利润。
另一种是码隆提供整体解决方案,对方给予相应授权费。这种方式正在成为码隆科技接下来的主要模式。
中国人工智能产业起步相对较晚,但近几年产业布局、技术研究、资本支持等基础设施正处于高速发展时期,创业公司在国内有极优的发展环境。但在黄鼎隆的眼里,区别于人脸识别、语音识别,商品识别与实体结合方面,更多的机会是在全球市场。
最直接的原因在于,“发达国家的人力成本过高,对能够降低人力成本的人工智能商品需求是迫切的。甚至如果用技术实现无人零售以后,在法定的休息日也能够进行商业活动,相当于增加了1/6的营业时间,价值非常明确。”
2018年6月13日,在德国举行的国际消费电子、信息及通信技术博览会(CeBIT 2018)期间,码隆科技与华为签署合作协议,基于华为全球领先的新ICT基础设施解决方案协同码隆科技的ProductAI视觉应用平台,共同打造商品识别AI新零售解决方案。
“目的是推到雇人成本过高的欧洲市场。”黄鼎隆坦言,“另一方面,中国的数据多。比如纺织服装行业需要大量的服装数据才能训练系统,而全世界一半的服装都在中国生产,也就意味着全世界一半与服装相关的数据都在中国。这是其他任何一个国家无法比拟的。”
几千几万和动辄百万千万数据之间的量级是有差别的,码隆的B+轮投资方、全球最大的咨询公司埃森哲和LV母公司LVMH显然看到了这一点。今年,受LVMH邀请,码隆科技在法国Viva Tech展会上,展示了其打造的时尚色彩流行趋势解决方案。
不难发现,善于用与各行业巨头结合的方式开辟新市场,是码隆科技商业化的一大特点。按黄鼎隆的话说,是构建了“一横N纵”的商业模式:一横是以ProductAI平台为核心,通过PaaS模式和基于云端API调用的模式,为开发者提供强大的计算机视觉核心技术能力;N纵则是针对海外各行业客户和合作伙伴的实际场景,提供纵向行业解决方案。
远与近的规划
在码隆科技的办公区,有一个展位放满了公司近些年获得的国际奖状和奖杯。其中,码隆有几次重要的亮相。
2017 年 7 月 26 日,在苏黎世联邦理工(ETH)、Google Research、卡耐基梅隆大学(CMU)共同组织的计算机视觉识别领域的顶级赛事 WebVision ,码隆科技战胜了 SnapChat、清华大学、上海科技大学、UCF 等来自世界各国的顶尖学术和研发机构,获得了冠军。
脱颖而出的理由是,大部分人工智能公司采用的是 " 监督式学习 " 算法,对数据要求极其严格,需要大量的人力对数据进行标注才能准确识别。但码隆科技采用的是自主研发的 " 弱监督学习 " 算法,解决了人工标注的问题,在更符合真实使用场景、没有经过人工清理和标注的数据中,达到了比肩人类性能的 94.78% 的准确率。
巧的是,就在这之前的一个月,德国举办的G20全球创新企业竞赛中,码隆同时获得一等奖。两件事叠加在一起引发了不少媒体的关注和报道。一时间,码隆科技风光无两。
码隆科技在WebVision挑战赛中获得第一名
但硬币的另一面,黄鼎隆明白,仅是技术的领先无法让码隆科技长治久安。同时他不否认,在技术方面的发展以后会越来越艰难。“以往中国的创业者大多都在模仿美国,后来真正与其并驾齐驱、甚至在某些领域超越时,就要以身试险,其实是一件蛮痛苦的事。”
「我有嘉宾」问道,假如有一天,码隆科技面临一个巨大的挫折,甚至倒下了,您觉得可能是什么样原因造成的?
黄鼎隆回答道,“最大的挑战在于商业落地。如果说过去3年,行业的焦点在于技术突破,比如在乎零点零几的提升,那现在行业已经到一个验收期了。如果这一拨技术落不了地,说明还没有达到相应的要求和找到行业中真实的需求。”
“未来怎么与产业结合,怎么去打造一个更有效的商业模式,怎么与合作伙伴实现共赢,分享中间的利益是最为重要的。”虽然码隆已经有实际的产品商业化落地,但是如何大范围地铺开,这是一个全方位的系统挑战。
按黄鼎隆的长远规划,他们希望未来无论在服装、家具、零售行业,都可以将技术融入到从设计、原材料、生产、制造、批发、零售,最后到用户手里的整个供应链中。一旦将整个供应链打通,将有一种强有力的生产,来赋能实体经济。
采访结束后,黄鼎隆要立即赶往下一场会议。已经起身离去的他又停下脚步,补充了一句,“技术的博弈最终还要回归市场的争夺,而这一切才刚刚开始。”
文 | 鱼多多