龙空技术网

我们携程网公司的AI.从推荐到系统云化.从算法到公式.是怎么运行

深秋的影子 132

前言:

今天看官们对“一种个性化旅游线路推荐算法”大体比较关怀,同学们都需要学习一些“一种个性化旅游线路推荐算法”的相关资讯。那么小编在网摘上汇集了一些关于“一种个性化旅游线路推荐算法””的相关文章,希望同学们能喜欢,你们一起来了解一下吧!

原创:李盛

携程集团

从大数据平台.到通用个性化平台

从智能客服机器人到智能导购到小诗机

从公司级数据仓库到营销投放算法

广告算法等……是怎么运行的?我来告诉你.

首先

我说一下

什么样的技术服务.难以云化

什么样的技术服务.难以云化

这是什么意思?

是与业务耦合度高的服务

难以实现跨行业的云化

比如

像PaaS或Docker之类的

基本上和业务是完全脱耦的

相对来说

云生态和云技术架构更容易建立

但类似个性化推荐

部分业务AI技术和业务就高度耦合了

云化的难点是怎样

在技术上抽取业务共性

划清平台和各类用户之间的职责

技术上的边界

同时提升模块.数据.业务知识的复用和融合

从而为用户

构建产业群的“大”数据和“大”知识库

业务基础优势

促进相似产业的群簇聚集形成新的大业务闭环生态

在面向产业群簇

一方面

业务急需依赖于群簇

全量的“大”数据和“大”的AI知识图谱的上层服务

来直接驱动

各自业务的优化与升级

乃至构建新的大业务生态体系

另一方面

这些服务需要兼容

适用于数十个商业模式完全不同

架构各异的细分行业

因此云化工作又势在必行

业务高

耦合度的服务产品的云化工作

虽然一直是云化技术的深海区

其实对架构、算法、数据的云架构工程

设计能力提出了几乎极限的挑战

但是我们携程网

在这一块还是做了很多创新性的工作

比如集团个性化平台

曾经面向100多个落地场景

年化收益2亿多元

但只用了7.2个人力

其中包括服务、算法、数据和产品

并且支持

每天近3亿次的调用

用1.3个人日可以完成1个场景的迭代

或新场景上线

携程的客服机器人平台也是如此

与业务高度耦合

但同时支持60多个事业部

20多个行业的相关线上业务

依靠的是对这些业务

高度耦合的系统的深度架构优化

大量新技术的创新

引入和架构的重构,实现了对服务平台的模块化

复用化、配置化和对不同业务的兼容

我说一下

OTA跟传统的电商还是有非常大的差异性

比如说亚马逊

京东,有矿泉水,有服装,有电器

手机之类的产品

类目数有上万个

但是它们的客服流程、整个交易的流程

基本上

都是通着这种标准化的方式来解决的

而OTA

Online Travel Agent,在线旅行代理商

不一样

比如说

订酒店和机票完全不一样

用户诉求也不一样

机票、酒店和火车票的搜索、订单流程

库存体系和架构几乎完全不一样

所以一般来说

不同BU的系统是不同团队相对独立开发的

但传统电商

一般上万个类目会共用一套系统

在携程内部来说

我们公司

公共大部分的一些技术服务产品

特别是对于一些人工智能

还有一些个性化推荐

虽然是

针对公司或集团内部的

但是实际是需要在技术层面

支持对二三十个行业的兼容性和业务的自助化

但这些技术

又是和业务高度耦合的

现在我来以探讨方式说一下

怎么来做高业务耦合系统的云化工作

首先关于

Topic的主题会分为四个部分

携程AI实践

AI云化

集团个性化云

旅游技术的未来工作

等……

一、

携程的AI实践

首先、小诗机项目

我先从一个“简单”的AI系统说起

我们有一个携程写诗机器人.为了诗和远方

这个项目

主要是解决诗的问题

你上传旅游风景的照片

会帮你识别出来照片内容

再给用户AI写一首词文达意的唐诗

例如:下面

以下是人物的照片

虽然不擅长写人物的系统

但携程

很多用户也会用它来做文字版的美图秀秀

拍摄一些照片.文字上帮你做“美颜”

[呲牙]

然后

拍一张西湖的照片它可以识别出来

因为照片

本身没有太多的信息量

它只是一个太阳和水.AI会解析出来

帮你现场写一首西湖的诗

如下:[呲牙]

现在这照片是在富士山拍的

因为天很晚了

所以也看不出来任何信息

系统通过后台

景点知识库挂出来一些季节的数据和时间的数据

当然包括当天的天气情况

这张照的拍摄当天是下雪了

但是图片上看不出来

因为图片本身没有这个信息量

是要基于知识库来写诗

你在看如下:[呲牙]

要不这个输入

”郭德纲“三个字AI帮你写诗

这个就完全是基于人物的知识图谱来写诗了

你在看如下:[呲牙]

我们在用

上海地区做的一个盲测

就是跟上海的专业诗人做的一个盲测

事先评委并不知道

每一首诗是人写的还是AI写的

人机盲测

第3名,与上海地区诗人比略胜

你看如下:[呲牙][捂脸]

话又说回来

现在也可以写绝句.律诗.宝塔诗.藏头诗

也可检索

用户拍一张照片

AI检索出与照片最贴合的古代的唐诗

以及它的年代和作者

你看如下:[可爱]

二、

携程AI实践

客服机器人

当另外一个人工智能的应用

比较大的一块

主要是客服机器人这一块了

目前按会话级别来说

将近有80%的会话可以通过机器人来解决

在剩下的20%里面

大部分是客服需要帮客人跟酒店或者航空公司

人工

争取一些权益或者处理一些紧急事务

比如说

因为用户的问题.生病了或者临时行程有变

我们携程

要帮客人去跟酒店、航司商量

帮客人争取最大化的权益

已经支付的间夜

今天是否可以不算费用,或者退掉

如果这个地方解决掉,总体可以达到94%

如下:[我想静静]

这是

主要算法这一块

也是通过深度学习的方法来解决的

当然包括

一些命名实体的识别

包括用户意图的识别,CNN类似的方法

这些方法我就不说了

这是LSTM+CNN的, 是标准Q匹配的问题

这是QA会检索的

我说一下

当biLSTM可以从forward和backward

这两个方向获取上下文信息

lCNN模型对平移、缩放等具有不变形

可以较好

检测出特征区域,鲁棒性好

最终

通过多组实验比较

发现biLSTM+CNN离线效果最佳

我做有曲波逐流图

如下:

携程的AI云化的实践

AI在携程的落地

业务效果非常好

但是实际的最大的技术挑战是云化

携程的每个事业部几乎是完全不同的行业

和业务相关的IT技术架构也不同

其它的客服体系

更是完全不一样的

对口的技术、业务

产品本身就是拆分在各个事业部的各个团队

是非常独立的团队

这种情况下

怎么保证它能够支持集团内的60余条业务线

其实

就相当于20多个行业的60多个公司了

因此

做了一整套的类似的云化方案

业内虽然有一些.但也没有特别的成熟

包括各个事业部如何冷启动

因为它的客服场景非常多的

即使针对一个事业部

比如说酒店

有售后的,有售前咨询的

还有待会我们会看到的

到底选择哪个酒店?

或者选择哪个城市的酒店?

这一块我们做了

一个系统的云化的运作

做了一些抽象,形成了包括语料标注

对这个客服机器人熟悉的同学也知道

我们会把人工训练师和后台平台进行协调

所以

对应的东西.我们会给人工训练师

把每天应该做的事情

每周需要review的一些KPI的报告

云化平台的数据和算法会给他们列出来

包括标准Q(语料)

库的挖掘怎么挖掘,对应的平台也会列出来

如下:

我们目前做的事情

当然

包括业务管理的一些逻辑的云化

业务管理流程

它的机票和酒店可能是完全不一样的

在这种情况下怎么通过云化的平台

让每条业务线的人工智能训练师

在这个上面自助化地完成业务的编辑

如下:

人工智能

主要是两块东西.一个是小诗机

还有一个是客服机器人

对于携程来说

人工智能是比较多的

我们公司

也重新梳理和定位了一下携程的人工智能

应该怎么做

其实人工智能

是非常耗人力和物力财力的工作

即使非常小的功能

比如说反黄色的图片.或者反政治敏感的图片

也需要大量的人力跟物力

比如说

需要标上百万张的黄色图片

或者是敏感图片才能把功能实现

但这对业务线来说其实是非常小的功能点

做一个大的系统会涉及到非常多的功能点

在这种情况下

怎么把整个集团的人工智能做起来

把这个业务线的人工智能怎么升级?

我们公司

也是采取类似谷歌李飞飞提出来的理念

做民主化的人工智能

关于AI领域我们枝术人员

更加关注的是

我们如何帮各个事业部

利用AI怎样快速高效地提升OTA的用户体验?

比如

机票和火车票这样的事业部的话

怎样提升用户体验?

我们也做了相应的领域内的集成

包括小诗机里面

大量引入了

其中

包括BAT,Face++等公司和开源的AI力量

民主式、开放式推进携程的AI进展

如下:

我们公司

在公共这一块会统一的做一个接入平台

我们有一套系统地方法

建立了相对科学的方法的方法来做模型的评估

包括

评测、标准化、及综合的选型

比如

图片识别:就综合了携程自研

和BAT的API,

我们会综合评估哪家都好

怎样互补

从而为各个事业部提供业内最好的图片识别

这是我们携程网集团

AI云(Ctrip Brain)平台

你可以看一下

包括各个模块的功能

有广告的一些算法

也有传统图片的一些东西

文字的一些AI.语音的等等

如下:

以上

常见的功能

比如说景点的分类

传递一个照片.知道这个照片里面有哪些东西

然后再来写诗

实际上

在OTA网站上这个东西非常有用

比如说我要做一个春季的营销活动

需要把类似所有春天的照片聚合起来

整个小诗机的人工智能的话

会拆解开来,提供给各个业务线使用

如下:

这是人工智能的

客服这一块我总结一下

客服这块

是跟业务高度耦合的

这种情况下我们技术人员

会把整个客服系统

还有算法层面进行抽象

抽象出来以后

变成各个功能模块支持各条业务线的人工智能

训练师的工作

保证我上新的业务线的时候

对于我们整个技术栈的团队

它的成本尽可能为零

上新的业务线的工作

是通过自助化的平台来支持人工智能训练师

这部分人非常懂业务的

对于技术的团队

特别是对公共技术的同学

反而对业务的东西不是很了解

对一些机票能不能退

对能不能改签不了解

我们做的就是怎么支持这些业务

在平台上把这个事干掉

以下

集团个性化云平台

跟业务耦合度

比较高的就是个性化这一块

因为我们同时要推二三十种业务线的产品

它的推荐逻辑

也是完全不一样的

它的原始数据用户行为数据都是完全不一样的

在这种情况下

我们也构建了相应的集团统一的推荐系统

现在落地了100个场景

年化营收2.1亿元

目前也接入和很多深度学习的方法

如下:

在智能目的地决策

用户决定去哪儿玩的话

决策周期会比电商或者传统互联网公司好很多

比如说

我们统计的结果

用户如果要去国内游的话

平均会做21天的决策,如果去东南亚的话

会做40天的综合决策

460次的访问

比如说用户选择了东南亚

可以决策

儿子喜欢玩沙滩;老公喜欢玩户外运动

老婆喜欢shopping

合起来我们会做景点推荐

这样兴趣会合起来,我们会做一些推荐

我们会告诉他价格去哪儿便宜

因为

旅游市场跟电商不太一样

旅游市场随着季节的变化

每天的价格指数变化比较大

这种情况我们会给它做一个大数据

还有人工智能个性化的决策

如下:

这样的一个决策

决策好以后看价格曲线的变化情况

包括机票酒店的综合价格指数

这边会推荐你哪一天去

用户选择一个大概的时间范围

比如说

下个月想出去玩沙滩

我的老公想出去玩户外运动

综合把这些景点推出来

建议下个月哪一天去最便宜

对应的价格趋势图

主要是做这样的一个工作

线上也取得比较好的效果

如下:

这是行中场景的推荐

用户一旦到哪个地方

会推荐包括吃住游的东西.这是对应做的聚合页

如下:

整个推荐系统

刚才看的是产品落地的形式

看一下它的架构怎么做的

我们会把事业部的数据进行一个聚合

我们会采用一个虚拟的“标品”

把用户行为和订单数据标准化,然后再来做推荐

如下:

在架构上

我们采取了这个模式,我们底层这一块

白颜色的这些东西

大部分的引擎

包括整个回流的闭环,以及离线

在线计算的引擎

我们在集团统一做一套,会集中化进行迭代

上面黄颜色的框

主要是针对某个场景,我们做一些配置化的东西

如下:

实际上

我们还在进一步做一些事情

我们会把它变成一个完全的云化的

让产品经理来配它

我们会把整个

在线离线组织好变成模块化以后

我们业务的使用方

在这个界面上可以做自己的配置

从而可以进行一些组合

比如说用浏览历史做一些推荐

这些都可以进行一些配置

如下:

另外

关于旅游科技的未来

对于未来的探索

我们可以看一下

从数据来看移动网民占比已经达到95.1%

远远超过

一些国家的宽带用户

标签: #一种个性化旅游线路推荐算法