张晨:AI 赋能汽车定制化营销

2019-07-16 17:31:25 资讯 0 FavoriteLoading收藏

在7月11日,以“D造客户生态”为主题的“2019(首届)中国汽车客户生态高峰论坛”上,浙江创邻科技创始人、CEO张晨为大家带来 “AI 赋能汽车定制化营销”的主题演讲。

他演讲中讲到,汽车行业已经逐渐步入智能营销新时代,如何依靠智能技术精准把握用户需求、精准进行广告投放、整合数据优化生产、为用户提供定制化服务平台,是当前车企需要关注的核心内容。

如下是他的演讲实录:

各位上午好!非常荣幸能够在这里介绍创邻科技以及创临科技的产品。我今天演讲的题目是“AI赋能汽车定制化营销”。

首先快速介绍一下,我本人是搞技术的,待会儿大家会发现他和技术非常相关,也和刚刚的讲者非常的相关,他们是做图数据库的,我们其实是可以做数据支持。

首先介绍一下我自己,后面也就明白为什么我来做这件事情。我是2000年保送进了浙大,2007年出国,在国外待了12年,2016年回国。一直做的是分布式与运行计算机系统,博士、博士后。

有几个重要的时间节点:一个是在做博后的时候,美国运通联系我,百夫长那个卡,要实现从单机到多机的转化,要建大数据平台,我想了一下,我到底是做教授呢,还是去业界,想了半天,觉得我的博士论文好像偏应用多一些,我就决定去了美国运通,开发它的第一批大数据算法。

第二个节点,是在运通的时候,Splice(音)这个公司做的是分布式数据库,大家搞技术知道(名字)是做了类似的事情。我博士论文中一部分被硅谷公司产业化,当时那部分是和谷歌同步独立发表的,做分布式事务处理的,就是分布式具体怎么做实现数据库的事情,谷歌就只有我这一套,我就想有多少博士生它的论文一部分被产业化,然后就去那儿了。

接下来跟我在美国银行、SAP和数字营销公司服务的过程中发现,他们做多表关联,20-30个表的关联,分布式数据库也会挂掉,就是车的数据大的时候做多表关联查询也会很慢,怎么办呢?有了一个新的技术叫做图数据库,我就去加拿大创业做了世界第一款基于Hadoop图数据库,分布式的数据库。当时苹果的头儿,也是深度学习创立者的学生是我们的首席科学家。

2015年底参加浙大一个活动,说图数据库、知识图谱国内大数据非常蓬勃,随便来一个就是大数据,不如回国吧,有各种各样的奖项,国家给一堆的奖项,然后我就被成功“勾引”回来了。

这就是我们创邻科技。我们现在的核心产品就是一个分布式的图数据库。如果大家加我的微信会发现,我们现在在大量的宣传,去年百度风投投了我们,现在我们是世界最快、性能最好的图数据库。我们最近在很多重要的会议做了分享,估计大家以后可以去下载它的公开版,有一个选型工具和数据库所有的东西自己下来跑一下,会发现非常快。

和我有什么关系呢?这个痛点大家都知道,我说半天是做技术的,如何和车相关呢?因为我这项技术、知识图谱的技术、图数据库图的技术在很多领域都会用到,我希望做成一个在产业链中相当于是一个数据库经销商,给各个行业,比如说第三方解决服务商、车企需要的数据服务,做底层的技术支撑、科技的赋能,成为一个产业。

车的痛点刚刚大家都讲到,现在车特别难卖,越来越难卖,怎么样能够更好触达客户,卖什么东西给他、卖什么配件给他、卖什么定制化的东西给他?怎么做定制化?怎么卖得更好?怎么样发掘新客户?怎么样解决客户的痛点?怎么样帮助这个行业呢?我有一些想法和大家交流一下。

首先说知识图谱,知识图谱、图数据库是什么?我相信在座的可能搞技术的比较少,给大家介绍一下。这个图、知识图谱的关联,其实每个人在大脑里面都在用这个,只是大家没有很好的意识到。简单说,图和一般的关系型的结构不同,我们每个人如果是同一个结点,就是一个圆球,假如把会议作为一个节点,也画成虚拟的圆球,我参加了这个会,把我这个圆球和会议的圆球连成一个虚拟的线,这就是图的基本构成单元,节点和边。这个为什么有用呢?我想在座的各位,如果每个人都抽象成一个圆圆的虚拟球,都和会议的节点连起来,就形成一个简单的知识图谱。

有什么用吗?我举简单一个例子,现在我们在茫茫人海当中想要找哪些对汽车客户生态感兴趣的人、去联系他,到底怎么找?一种办法是打开我们的通讯录,对每个人看他的标签是不是跟车有关,如果是就打电话一一找。第二种方法是一拍脑袋,我好像参加过一个论坛,参加论坛的应该还有别人,我就相当于从论坛这个节点进来,看这个节点连接了什么人,我直接去找这些人。这是我的思维逻辑,其实人的脑子里是一张非常复杂的,各种知识点结合起来的复杂的图。更进一步,我还找别人,我说这些参加这个会议的人有没有参加别的会议,如果有相当一部分人又参加了别的会议,参加那个会议的其他人又是谁?我是不是可以多条链路找过去,这个特点是非常自然的,我们大脑就这么想的,非常精准,这些人显然不对这个感兴趣不会来。为什么说知识图谱技术在我们现在的场景下,对于精准找到的那些感兴趣的人、事、物把他们串联起来非常有作用。

它可以做一些什么?我们基于知识图谱可以做一些整体的解决方案,包括各种数据源关联起来,待会儿我会再展示一个基于图谱产生的图,他们看看像在座的某些人各位的画像。融合各种各样的技术,包括人脸识别、各种关键词、行为轨迹都可以,还可以带实时性、带着时间标签,毫米粒度对图的快照,产生实时的营销决策,甚至是生产,就是柔性制造的决策。再结合多层的推荐技术,包括我可以推荐相关的品牌、车型、配件、渠道,然后达到更好地销售效果。

同时,图还有一个很大的特点,就是它的更新非常实时。比如我刚刚提到,老的信息放到里面构建一个画像很不对,有什么办法能够快速的捕捉舆情,那么多社交媒体里面那么多的信息,快速的把这些信息放到这个图里,告诉大家热点是什么、感兴趣是什么、它对我的营销有什么样的影响,用什么底层技术可以做到的?用图可以做到。

下面是一个例子的图,这个图其实很有趣,是用来讲故事,其实我们的图谱很多,这个是一位男士、一位女士,我们分别看到他们身上有很多的标签,这上面还有车,上海大众某一个车型,这边是车做的颜色,这边是各种配件。比如说这位男士是七口之家,经典奶爸,周末会近郊游,可能喜欢一些颜色、喜欢一些车和配件。女士可能是单身贵族,简单的代步,喜欢一些颜色、匹配。这个图其实可以有很多种用法,实时更新它可以有很多种不同的方式。比如说刚刚说的智能门店,我这边男士走进来明显在看七座的车,我就想:凡是这种男士,看起来是一样的,而且喜欢七座车,其他类似的男士喜欢一些什么东西我可以推给他。再反过来,只有这一类型的人,我可以做一些什么事情。就是这个图可以正用着反着用,无论是从个人出发、从经销商出发、从店面实时出发,手机APP,还是浸入式的4S店的场景,给实时的销售,让他推荐给他建议,都是非常有效的。它能够高速的查询、快速的反应,用的就是知识图谱。我后面纯讲技术的时候,会给大家介绍,为什么图数据库非常重要。这是一个场景。

基于这个我们还可以做很多,比如说用户画像给出了,做个性化推荐、内容输出。我们现在除了数据库,有一套产品。刚刚有提到KLO,如果你是车企,你说:我想要卖辆车,这种类型的车,有那么多KLO,我到底选哪个去联系转化率更高?这件事情我们会基于我们海量的数据给你推荐。为了做到这个实时的图,现在没有任何商务的通用的图数据库可以做到。

这是基于图产生的用户画像的关键词,其实有很多,其中有一个特别像我们那些同事,大家可以看这个磁云图,猜一下它到底是什么类似背景的人是符合这个图的?鼠标、按纽、背包,还有和宝宝相关的,好像还有车,这是什么样的人,具有这样通用特点?可能每个人心理有一个想法。

其实我们有好多这样的图。其中有一个图是这样的:我们有一个同事一开始不知道往这个方向想,给他看了,一张一张,直到有一张他突然看到,这不就是我嘛。他是一个宅男,那张图写的是:股票、电脑,只有很少的关键词,一看就是像我们做技术的,他一看“这就是我”,反过来他想原来是这类人。

这个是结婚以后,有房有车有小孩,收入比较高的高级白领妈妈。

这张图可以做很多事情,以及背后的图谱可以做很多事情。做一个广告,要开发一类车针对这类人卖这个车,你要创造一个广告的环境,里面放点什么,让他感觉到这就是我的人生、真的就是我。还有类似外延的产品,和什么东西去合作。诸如此类,可以做很多很多的事情。

这是我们做的另外一个,对KOL精确的计算。我们有一个网络,营销网络是什么,有自是大众的、有的是SUV的,它们之间的网络路径是怎么样的,它们影响了决策因子是怎么样的。上面中心节点,是给谁试驾,是不是可以给一波完全不买我车的人突然间买我的车?这些其实用海量的数据是可以分析出来的,也有非常好的结果。

这里是和后续生产各个流程之间打通的一个优化,可以说进行优化生产排期、库存补充设计和前端需求的整合,都可以通过图非常实时非常好的完成,自然就可以进行个性化的定制。

我们是干嘛的呢?我刚才说了是做技术的,做的是一个底层的数据库,以前是美国运通,很自己我现在落地的场景,清一色都是银行、金融、保险,主要是银行。这个其实在各个场景都是一样的,我们要做的事情就是用我们的数据库为核心来打通各个数据,把它们关联起来形成一张图,就像我们的脑子一样,所以我们管它加认知计算功能。打通以后,形成这样一个拓扑图,然后我们做实时的场景的营销、定制,新客科的挖掘、老客的挖掘。

为什么现在要用图?因为现在这个时代我们每个人的ID被数字化了,我们的支付被数字化、我们的行为轨迹被数字化,我们的社交网络也被数字化了,实际上每个人都是在流动行走的数字源,在不停的动、写,我开这车过一个地方可能商圈子网变化了。这种实时的东西,如果看过《骇客帝国》的同学们,当然那是一个电影,每个人身上都是流动的数字,这种复杂的图,而且是实时变化的东西,怎么把它映射到传统关系到一张张白纸,就像Excel表那样,一点都不自然。非常自然的方式,就是直接把它写成图的形式,支持快速的实时的变化,进行实时的决策和挖掘,下面用的技术就是整个图。

我们要做的可以通过LP方式,或者是插入的方式形成一个图以后,给你形成一个图的全局观,给你一个系统、可视化的条件,让你可以看到它、让你可以查询它,甚至可以进行各种各样深度的挖掘和计算。就是这个人的中心性、一些图的算法,我会算法算出来,在茫茫人海当中这个人就是比较像,这个关系度就是非常强,就应该找这样的人。诸有此类,你也可以自己设定变量,去研究现在客户到底长什么样,应该是什么变量,算出什么,对你的学习有帮助。

这是我们的技术产品架构,我们是搞技术的,我当时回国的时候带的分布式数据库,是一个命令行的页面。同学应该知道,正常人是不会用的。为了广大正常人能用,我们外星人就包了一圈,包括一个数据基础数据层、数据库层,企业内部的数据通过这个数据层,经过一些整理、经过一些构建,就是怎么把一张张数据库的表变成图的形式,进入我们的数据库。为什么是分布式?现在数据量爆炸是一个事实,已经不是一个趋势了。单机放不下的时候,算不动的时候你要用多台机器,5台、10台,你怎么办?你现在面前放10台机器你该怎么办,所以我们有一个分布式运算平台,在上面打造很多算法,接口也是非常通的接口,上面能实现各种业务。我们现在支持的是银行业务,其实我们和公安、保险现在都在合作,车也是一样的。

这些东西我们现在微服务化了,无论是平台、底层,实现的是什么呢?公司内部的服务器可以说想要一个东西,起什么样的东西,比如说起一个hadoop群,多少个节点,立刻就配置出来了。同样,我们的数据,我需要起一个图,上面漏了什么数据,数据资源管理也是全部微服务化,可以直接插来调用,非常方便,且是弹性的。

这上面我们的内部技术,我们并没有单独的输出,有必要也可以单独输出。但是看我是一个纯粹搞技术的,可以跟大家进行紧密合作的。

第三张图帮大家做知识图谱和知识数据库相关应用和挖掘。

这是我们的核心技术,这是恒生测的,性能非常好。两个关键词:一个是大图、一个是实时。数量大,我们可以线性的加、一台一台的加,跑不动了,你可以加节点。

举一个例子:我们现在例子是一个大型车贷公司,他用的是(名字)用了170秒,我们用1.4秒就搞定了,也是我们现在的客户之一。右边是Titan。

我们也提供了很多可视化的界面,这个意义说毕竟编程序的人少,业务人员可以目前通过拖拽可视化的方式完成构建图,我怎么变成节点和边形式,你不用编程序,自己就可以通过可视化的图表搞定。搞定以后你可以分析它、可以看它、可以查看它,可以生成变量,进行计算、导出结果、业务封装,嵌入你们的系统,全部都可以。

简单说,现在我们能够给各位摆10台机器,让大家在1分钟之内建一个图变量,完成一个在10亿的大图、舞台10个机子每个是人的节点,算出它的中心性节点是把那个技术贴在它身上,各位觉得怎么办?不用说各位,世界上人不能在1秒钟可以搞定,但是通过这个点选就可以搞定。

我快速过一下我们一些系统的截图:这是通用的图构建和图展示,我们现在凡是用了图的同事,就会随着数据量大会发现速度太慢,大家都是用(名字),为什么这么提倡?因为它是世界上占有率最高的图数据库,写我们和它所有的接口兼容,编程语言是一样的、查询语言是一样的,所以只要用它哪一天跑不动,换到我们就行了。现在是一个通用了,大家知道是什么就好了。

我在这里想,主要是给大家说说我的技术,说说这个技术多么好,我相信图计算和图数据库在汽车领域可以发挥非常大的作用。而我们同时自己做了一营销线,积累了大概现在有几百亿的数据,可以做各种推荐。我们已经有了一些客户,效果非常好。

车也应该是类似的,大概是这样。

这是我们的图构建,你可以通过一个界面点来建一个模型,先建一个节点和边的模型,建好以后把你的数据源映射上去,然后加载,就可以把一堆CSV变成图。

这里有一个直接的说明,这就是我们真实的界面,我今天应该带一个视频给大家来播。你可以新建一个点,可以配各种点的样子、属性,可以看出比如上面有一个人,ID、性能,接下来你可以加一个边,可以选边的样子、样式,可以帮助边,可以加各种东西,除了关注以外,购买或者是联系。

接下来是一个最简单的图,我们会添加数据源、添加一个或者是多个文件,这个文件可能是CSV或者是一个Excel表格,可以看到它的预览,选择它里面哪些东西映射到你这个图身上,比如说这个数据库表的第一列映射一个点,就点一下其映射过去了。同理,边也是这样映射的,你可以从这边拉一下、拖一下,就映射过去了,然后加载图,这个图就建好了。

这是一个初始的界面,你没有任何配置的时候是灰色的,我刚才说图建好以后要有一个可视化给你看、给你玩,让你明白是怎么回事。这就是那个界面,你可以配置它的点外观、边外观,各种各样的样子,可以进行各种过滤条件,点的过滤、边的过滤、深度过滤,各种各样的条件、掩藏,进行高级筛选、各种各样的布局。这些全部是给定的值,是我们自己写的材料库,这个材料库也非常重要,因为数据量大的时候,开源分一个布局和一个渲染的过程会非常慢,你的体验会非常非常差。各种各样的布局,可以直接导出、嵌入,可以导出CSV、导成图片、PDF,甚至一个link之类的,嵌入你的系统都是可以的。

这是在上面进行分群,找到最短路径,打通几个不同链路之间的关系就能现实出来。

感谢聆听,我说完了。谢谢大家!

您可能感兴趣的文章

网友评论

    发表评论

    *

    *