钟振华:
各位下午好,那我是今天这个分会场,最后一个部分也是很感谢各位有这么好的耐心来听到最后这个部分,那我们这个分会场主要谈的是应用,所以我想跟各位分享一下,偶尔口这两年一直在大数据领域,结合现在很火的机器学习和人工智能都做了哪些相关性的一些智能应用,同时大家也可以在我所讲的两个案例里面去了解到这些智能应用在中国的一些客户里面,它落地的一个效果是怎么样。
首先再讲我所讲的机器学习的应用。我们回顾一下今天一天在台上所有的演讲嘉宾并谈到的大数据的应用,其中主要就是四类,第一类我相信这几天应该不太会有人来讲,就是最早大数据切入的时候是说海量数据有一个非常低成本的环境去存储的一个应用场景,第二类我们会看到,其实今天也有很多的,一些演讲嘉宾谈到就是对于海量数据的一些处理,这些处理其中有一些应用场景我们之前一直听说的,类似于客户的360度视图客户标签其实都是利用一些大数据,在事先把海量数据进行一些预初第三类应用,我们相信各位也刚才在很多的演讲过程当中听到包括数据可视化数据的查询数据的分析,其实都是结合一些大数据的技术对数据进行一些人工的使用和分析,而我今天想谈的就是二扣,现在我们看到的在。
在大数据领域里面,现在比较火的一个应用场景,就是我们看到的叫机器学习,在机器学习里面,我们相信各位已经很多听说过,比如说AlphaGo在围棋上面的一些应用,那么在电信行业oracle有哪些应用可以真正在现实的业务上黄金里面进行落地呢,首先我们看还是谈一个怎么为企业赚钱的一个问题,其实刚才很多的演讲嘉宾也谈到了精准营销,当把精准营销在历史上面的三个阶段做一个分类,第一个时代可能没有大数据。我们很多的企业基于人的判断去做营销的规划,然后事后通过一些技术的手段,无论是大数据还是不是大数据,来把这些营销的结果进行一个分析,我们看到这种场景里面它的营销的转换率一般都在1%到5%之间,有些企业可能营销的转化率会更低一点。
第二类是现在很多的一些大数据的解决方案,所谈到的事件营销型的或者说是精准营销型的,基于客户事先的一些标签,或者说客户所在的地理位置或者说是客户的一些网上的行为,对这些客户进行一些所谓的精准营销,那这是事件驱动性,它确实能够提高一些营销的效果,我们会看到在实际的应用场景里面,我们的客户他的营销的转化率可以提高五倍左右,确实也和我们之前很多的演讲嘉宾谈到的实际的落地的效果是一致的,那么但是我们会看到结合机器学习之后我们能不能把这件事情做得更好,所以我们会看到今天或者说未来的一段时间,里面越来越多的客户会把大数据的应用更多的倾向在一种叫即时营销,跟客户互动的过程当中,自己进行一些学习自动化的产生模型,而不需要任何的IT以及业务人员的参与,所有的流程都是自动化的,我们的人就好像在和一个看不见、摸不着的一个智能的环境进行交互,这个是我们希望在大数据应用落地的时候,能够真正可以告用户提供业务价值的地方。
那么这个业务价值落地的框架是什么?很简单,就是三层,左边这一层是客户你们现在已有的大数据环境,无论是不是oracle,或者说是第三方的,或者是开源的都没有关系。只要你有数据,或者说你可以通过刚才我们所听到得很多演讲嘉宾谈到的各种方式是采集到的依据都没有问题,这些数据如果拿我们今天谈到的营销的业务场景来说的话,比如说你可以里面涉及到营销活动的数据,涉及到你所要营销的产品目录的数据,涉及到你要营销的一些内容管理的数据,或者说是一些营销广告的、策划的一些内容都可以。
另外一端我们看到右边这一段也是您现有的,我们叫接触端,因为以前客户和计算机的接触,最早都是在电脑上面,但是现在的接触端越来越多样化,除了PC有移动,将来我们还会看到有各种各样物理呈现的智能设备,这些智能设备可能可以通过语音或者是通过一些其他的人为交互的方式来把用户带入到你这个摸不到看不到的系统里,而oracle做的这个系统,是在当中我们叫一个智能的大脑,在这个当中它能够自动的,而不需要IT人员去写程序去编代码,去调用任何的机器。学习的算法,你可能需要人为去判断我到底用聚类还是分类还是预测还是决策,你不需要做这件事情,你只需要把这个环节引入到您的接入端和您的数据端之间,把数据和用户的接口连接在一起,从而实现一个什么自动化的业务流程的优化,那么这件事情怎么做我们看一下。
和我们熟知的,或者说经常谈到的机器学习的方法不一样的,在什么地方?在于上下两部分的区别。在图上的上半部分,我们看到的是我们现在基本上长谈的机器学习的方法,类似于你有数据,你把这部分的数据导入到一个你所了解或者说是采购的一个机器学习的框假也好,平台也好里面,你可能需要雇佣一个叫数据科学家的技术人员,或者说是请一些业务人员参与到这个项目里面去对这个算法进行学习,然后把这个算法学习产生一个模型,然后在这个模型使用过程之前,先通过一些手段,对这个模型进行什么进行一个打分,然后再把这个模型应用到你的运营应用系统里面去,这是以前或者说现在常规的机器学习做的这种方式都是这样。
但这个过程首先它需要一个过程,无论你有没有数学科学家,你有没有一个很好的团队或者是一个技术平台?你从拿数据到去训练这个模型,然后把这个模型应用到你的应用系统里面,都需要一个时间,可能短则一周、一个月,长则可能更长的时间。有些客户会是以项目的方式去做,但我们觉得今天其实技术远远不是只在这个层面,今天oracle做的是一个能够完全脱离人自己进化的一个机器学习的引擎,是完全一个黑盒子,他在背后是中间,你只要数据进去,然后连上我们刚才讲到的用户接口,这个接口可以是您已有的网站,也可以是call center、也可以手机端的APP或者说是你的一些智能的物理系统,比如说智能网关等等,这些系统上面都会产生数据,同时这些数据都会实时的和这个进化的这个机器的大脑进行实时的通讯。无论用户对呼叫中心的一个电话有没有响应,或者说有没有点网站上的某个广告,或者说他对智能系统上的一个报错有任何的响应。这一个响应的信息都可以使实时的传到自学习的大脑里面,去实时的进行他的模型的优化,从而为下一个客户、下一秒进行跟我交互的客户进行进一步的优化。
所以它所产生的业务价值会不断的反复迭代的进行优化提升,各位可能不相信,那我们就拿一个中国的运营商的例子来跟各位做一个分享,那这个客户是一个运营商,在中国境内也是三大运营商当中的其中的一个省份的客户,他拿这个平台做了一件事情,就是各位经常会遇到的,就是外呼是一个很经典的营销手段,其实今天有很多的人都收到一些骚扰电话,同时call center的人员也很苦恼,他每天要打非常大量的电话,但是收效甚微,那么oracle怎么帮他做到进一步的优化和实时的进行自主学习,你会看到左上角是这个系统的一个逻辑架构图,左边是这个客户已有的大数据平台,上边是客户和他的客服人员,这些都是我们系统之外的一些现有的客户的IT架构,没有什么特别的。在中间就是这个叫决策平台,这个决策平台是在他这个项目当中,引入的唯一的一个新的技术点,那么这个新的技术点它最后的产出,我们先看它的结果,它的结果是能够和它传统原来在采用第二代大数据应用,这种千人千面精准营销的这种应用场景之后进步的,能够提升外呼的准确度达到4到5倍,换句话说就是400%到百分之500的提升。
那么同时我们把精准营销的准确度,原来这个客户他打一百个电话,其中只有1.3个电话是接起来说,我愿意继续听下去的。可能更少的客户听完之后说,我愿意去对你这个电话的推销的产品进行采购或者是购买,但是通过这个平台之后,它的精确度提高到了15~20%,他100个客户里面有20个客户愿意接受达到这个电话的内容的推销信息,同时给他的年销售增长过千万,投资其实并不是特别大,那它是怎么做,我们看到在它一期项目实施的过程当中有这样一张图,这张图我们给各位做个解释,在这个图的左边的红色这根线是在他使用这个平台之前,其实很简单,这个客户说如果我把我的数据库,我这个大数据平台里面所有的客户全部打完,当然是能够达到这个最终的目标。
因为会买的就是那些客户,不会买的还是那些客户,是一个直线,但是采用了自学习的平台之后,你会看到当我打到所自学习平台里面提供的10%的客户的时候,他已经能够实现95%的客户精准响应,换句话说,我只需要打开整个运营商里面10%的客户的名单,他已经能够拿到百分之60不到的。原来需要打完全部客户名单的这样一个结果,当达到20%的客户的时候,他的响应完成都已经能够接近到80%,换句话说,对于呼叫中心的人员来说,他的工作量可以降低原来在百分之二十,而受到骚扰的客户,也可以减少原来的80%。
同一时间你会看到整个平台,我们说是自学习,所以它有各自学习曲线,这跟就是自学习曲线,但是在呼叫名单里面的一个响应情况你会看到一开始它的响应的实现或者达到率其实并不高,因为一开始运营商给到里面的模型并不是特别科学的,虽然它用了很多的数据可视化分析的工具,结合了很多的业务的理解,把它自然认为非常精准的客户画像或者说是标签输入到这个平台里面。但这个平台当它打到第二批的客户的时候,你会看到它的精准度已经提高到接近50%。当它打到第三批客户的时候,它的精准度基本上已经达到70%以上,所以他在不断的跟客户交互的过程当中收到了客户经过呼叫之后的一个响应。哪些客户收到电话之后,愿意继续听下去,这是继续学习的一个输入,而不是以前。我们分批事后做完这个活动之后,再把这些信息输入到系统里面做,他是实实在在里面进行学习。
那么这个是在呼叫过程当中,所有的这些呼叫线路的内容你会看到,从第一第二批呼叫的响应度并不高的同时,到之后的第三批开始就呼叫的响应速度就非常高了,那么有很多的客户就很关心,说既然是一个黑盒子,oracle把这种机器学习已经全部自动化结合在里面,那对于我们业务人员,他是不是完全不知道机器在背后做了什么,其实也不是。以前我们说很多机器学习的应用还是需要人去在里面进行一些设定,但是现在oracle给到的这个方案是说你不需要做设定,而你需要看结果,这个结果不是传统意义上的可视化或者是统计分析的结果,而是告诉你每一个精准的个体你所输入的任何一笔数据,它对你所希望产出的事件的重要程度是什么?你会看到左边栏目里面就是在这个客户所输入的,它所以有的一些事件或者说是营销活动。这个是他营销的市场部门之前制定的一些营销的内容,这没有什么特别的,但是特别的是。
我们会看到在平台里面用户可以直接看到经过机器学习之后,他告诉营销人员系统里面大数据所记录的人的各种类型的属性,比如说各种的消费的属性,这些属性针对每一个营销活动哪个属性,它所起到的重要程度最大?并且不是一个属性,而是把所有的属性的重要程度打分全部罗列在一个屏幕上面,而且这个打分会随着机器的学习和应用的不断深入,它的打分会越来越疲于精准,我们的用户可以每秒去看这个平台,里面给到用户说我背后用户的背景信息的哪些属性是最重要的?对于我此次进行的这样一个市场营销活动。
同一时间,除了重要度之外,有些业务人员还很关心的是这些属性的数据分值是怎么分布的?有些业务人员他想知道,既然这个属性很重要,那么当数值落在什么范围之内的时候,对我进行这一次当期的这样一个营销活动是最重要的,所以我会看到在这个平台里面他也会给出机器在所有的这些课护不断的跟它交互过程当中,所学到的这样一个知识,他会告诉你最接近于对营销活动响应的数值是多少,同时当这个数值在某一个范围之内的时候,用户的响应程度会比较偏高,其实这也是后可以对于我们一些营销人员,去进行一些创新的营销活动的设计,带来一些更好的想法。而不是让用户自己去想这些数据怎么分析怎么去用?
可以直接让机器跟用户去交互,把最终的结果呈现给业务人员,就这么简单。那么当然除了外呼的场景之外,其实在运营商的场景里面还有很多,比如说我们手机端应用场景也可以结合这样一个黑盒子的智慧大脑去应用,比如说基于地理位置,营销行为的优化或者是基于一些在线的网站,进行这些数字活动的营销优化。那么再举一个例子,这个例子是oracle在几年前就已经和我们的一个国外的运营商,做的一个也是结合智能平台的这样一个智慧的这样一个网站。智慧的网站是说每个用户它登陆到这个网站的时候,它第一时刻这个网站就会知道你是谁?你用过我就运营商什么产品?你目前这个服务所处的一个状态是什么?有没有欠费?有没有数据流量不够,有没有一些其他的一些问题,同时它也在背后会了解到你这个用户有没有一些投诉的反馈信息,基于所有这些信息,这个网站会自动的给到每个用户,每一个人都不一样的这样一个展现的。
在页面里面,同一时间还可以叫实时的进行机器学习,它怎么做的就是每一个框,上面用户只需要有点击,无论它点哪里,这个点击的信息,就会返回到这个机器学习的平台里面,去进行实时的进行模型的优化,而不需要IT去参与,只需要用户在这个平台上面有任何的点击,这个模型就会进行优化,所以当它这个网站上线不到一个月的时间,它发现这个网站上面的广告的点几率,比原来提高了接近五到六倍,因为原来他不知道在什么地方放什么广告?用户会点或者给什么用户看什么广告,用汇点。
同一时间,它连接这个平台之后,它也不需要业务人员去做分析,也不需要IT在背后天天去调用复杂的模型了,机器会自动的去优化,这样一个平台,将这个广告的推送率做到进一步的优化。当用户点击完之后,他还做了一件事情很有趣,虽然email现在大家都是手机端进行处理,但是EMAIL还是营销的渠道之一,所以运营商在用户点击这个平台之后。那他还会给用户发一封电子邮件,同时它会根据用户访问这个网站的时间以及他在网站上面浏览的时间长度去自己优化。我什么时候发这个email,因为大家有时候工作很忙,在一庙里面会收到非常多的垃圾邮件。当如果你所发送的精准广告淹没在一堆的垃圾邮件的时候,你可能这个广告的效率也不是特别好,所以它背后它还收集说用户点击我网站的时候,可能是它有时间去上网的时候,这是第一。
第二它去了解用户收到EMAIL之后打开的时间,它进一步的了解这个用户在emali平台里面它怎么去处理这样一些数据,把两者结合之后进一步的优化发送邮件的这样一个时间,让用户在他最后最希望了解信息的时候,收到这样一封电子邮件,这是另外一个客户的实际的例子,当然我们会看到这个平台其实在精准营销场景之外,其实还有很多的场景可以进行使用,只需要两个前提条件。第一,把这个平台接到现在的数据平台上面,无论是不是oracle都可以,你可以使自己搭建的大数据平台都可以。
第二连接到和客户交互布的渠道之上,这可以是call center可以是排队机,可以是网站,可以是你的手机端APP也可以是其他你任何的,只要跟客户有交互这个交互式,可以给他进行自我学习的数据的动力,那么在这个过程当中举了一些例子供各位参考。其实这些例子我们在不同的行业,不仅仅是电信行业,也有很多客户拿这个平台进行一些应用的创新。
那么在这个平台后面,其实oracle还结合了海量的这种机器学习的算法,只是罗列一下,因为本身这个平台是全自动的,只是给各位做一个参考,当中会涉及到区域内回归、关系规则、属性重要性、异常检测,还有文本编辑特征分析时间序列等一系列现在非常主流的机器学习的算法在这个平台里面进行,已经打包在里面进行使用。当然如果我们的用户说我如果用到这个平台之后,我还希望结合第三方的一些工具,对这个结果进行可视化的时候,当然你也可以结合今天会上谈到得很多第三方的非oracle的厂商把这些最终的结果进行数据可视化。
当然oracle也提供了结合机器学习算法在内的这种可视化的展现工具,包括帮你把这些数据的分类、异常预测、回归等相应这些数据把用可视化的这种方式展现给业务人员,让他再利用到机器学习创新的能力之后,还可以了解到机器在做些什么,自己在做些什么,那么最后我们看一下,除了其实oracle做的事情很多,因为今天时间的关系,我们就举其中的一个例子,也是变在比较火的机器学习的这样一个例子,来引申出大数据的一种应用。当然除了这种机器学习之外,在数据管理、数据实验室、还有快数据就是我们现在讲到的物联网场景,上面包括还有企业级应用,包括前报人工机器,智能机器机器人聊天等等,这些应用场景上面oracle都有相应的一些解决方案,如果各位有兴趣的话,也可以会后我们进行一个交流。好,那我今天所分享的内容就是这些,也再次感谢各位的时间。