2017年,机器学习在Quora的五大应用场景

  • 时间:
  • 浏览:0
  • 来源:uu快3计划师_uu快3app苹果_全天计划

以上的机器学习系统最为重要的元素统统 我个性化。个性化原因着产品和底层的系统前要与Quora的每一一一二个多用户相关。我们歌词 都歌词 的用户理解组件是个性化系统的一一一二个多重要组件,我们歌词 都歌词 抽取了用户的各种型态,比如我们歌词 都歌词 喜欢和不喜欢的主题、我们歌词 都歌词 在各个领域的专长,以及我们歌词 都歌词 的社交网络属性。我们歌词 都歌词 还有各种“用户实体”关系系统,比如用户与主题之间的关系用户和用户之间的关系,等等。哪几个个性化的信息不仅都上能作为“阅读”应用的输入,还都上能用于为大问提寻找匹配的专家。

我们歌词 都歌词 还希望用户在阅读完大问提的答案就让,有助找到更多相关的内容。于是,找出相关大问提就成为了机器学习要为我们歌词 都歌词 提供的原本型态。我们歌词 都歌词 在大问提页面上展示了相关的大问提列表,方便用户浏览大问提。相关主题(Related Topics)和趋势主题(Trending Topics)也都上能帮助读者更好地浏览Quora。我们歌词 都歌词 还在主页放进置了某些板块,比如可关注的主题可关注的用户,它们也前会基于我们歌词 都歌词 对用户的了解程度而定制的推荐系统。

我们歌词 都歌词 在2016年启动了货币化(monetization)。我们歌词 都歌词 在大问提页面上展示与大问提相关的广告。我们歌词 都歌词 通过机器学习进行广告CTR预测,确保所展示的大问提与用户具有最高的相关度,一块儿有助为广告投放者带来最高的收益。不过,我们歌词 都歌词 在货币化方面才就让起步,在未来,我们歌词 都歌词 会继续扩展机器学习在这方面的应用。

“大问提理解”系统的产出成为下一步处理的重要输入:从专家那里获得答案。在你你你是什么步,我们歌词 都歌词 仍然使用机器学习系统来帮我们歌词 都歌词 处理大问提。

我们歌词 都歌词 也支持统统 开源和组织组织结构的库,比如TensorFlow、sklearn、xgboost、RankLib、nltk、QMF(Quora此人 的矩阵因子分解库)以及某些某些组织组织结构的库。

2015年,Quora的工程主席Xavier Amatriain非常精彩地回答了Quora上的一一一二个多大问提:“Quora在2015年将怎么才能 才能 应用机器学习”。从那个就让开始英语 ,机器学习在Quora的应用得到了长足的发展。我们歌词 都歌词 不仅更加深入地为已有的机器学习应用构建更大更好的模型,但会 将机器学习技术应用到更多领域。而在今年,Quora的工程经理Nikhil Dandekar在Quora上回答了类似于于的大问提:“Quora在2017年将怎么才能 才能 应用机器学习”。以下译文翻译自Nikhil的回答内容,并已获得作者的授权,查看原文 “How does Quora use machine learning in 2017”。

本文转自d1net(转载)

在用户体验方面,Quora的内容质量是一一一二个多非常关键的因素。我们歌词 都歌词 要确保我们歌词 都歌词 的大问提、答案、主题和某些内容前会以高质量为起点,但会 无缘无故 保持很高的质量。为了做到你你你是什么点,我们歌词 都歌词 使用了某些机器学习系统来保证网站内容的质量。

另外并前要都上能满足提问用户需求的辦法 是我们歌词 都都歌词 搜索已有的大问提,从而找到都上能解答我们歌词 都歌词 大问提的内容。我们歌词 都歌词 一一二个多多原本的系统,一一一二个多是提问框,一一一二个多是全文检索。前者在Quora主页顶部提供了一一一二个多提问框,都上能列出排名靠前的匹配大问提;后者则提供了更加深入的内容匹配,都上能通过点击提问框里的“搜索”按钮来查看匹配的内容。你你你是什么个多系统使用了不同的排名算法,哪几个算法具有不同的搜索下行时延 、匹配度以及搜索的淬硬层 和广度。

Request Answers(就让叫Ask To Answer)是Quora的一一一二个多产品型态,用户都上能向此人 发送请求,请求我们歌词 都歌词 来回答指定的大问提。我们歌词 都歌词 把你你你是什么型态归结为一一一二个多机器学习大问提,我们歌词 都歌词 的另一篇博文“Ask To Answer as a Machine Learning Problem”对你你你是什么大问提进行了全版的描述。

  3. 阅读内容

我们歌词 都歌词 十分关注内容的质量,不过好的内容是从好的大问提开始英语 的。我们歌词 都歌词 的机器学习系统对大问提进行质量分类,帮助我们歌词 都歌词 识别出高质量和低质量的大问提。除了大问提的质量,我们歌词 都歌词 还把大问提分成不同的类型,原此人 们在后续流程中就知道该怎么才能 才能 处理哪几个大问提。

除了A2A,我们歌词 都歌词 主要通过主页的大问提种子(feed)来对未解答的大问提和专家进行匹配。种子的大问提排名对我们歌词 都歌词 来说是一一一二个多非常重要的机器学习大问提。我们歌词 都歌词 要考虑大问提并前要的属性、用户的属性,以及某些一系列原始属性,并将它们作为排名模型的输入,为用户生成具有主题化、相关性和定制化的种子。下面的截图展示了几天前我的种子当中蕴含了哪几个大问提。

2. 为大问提寻找答案

  我们歌词 都歌词 提取大问提和上下文的型态,类似于于,大问提的提问者、提问的地点,等等。

下面将介绍Quora平台各个累积的功能,以及我们歌词 都歌词 是怎么才能 才能 在每一一一二个多功能上应用机器学习的。

除了上述的二个应用场景,我们歌词 都歌词 还使用了某些机器学习系统,不过就不出这里一一累述了。

对于找到感兴趣大问提的用户,我们歌词 都歌词 要确保Quora有助为我们歌词 都歌词 提供最佳的阅读体验。大问提答案排名也是一一一二个多非常重要的机器学习大问提,它都上能确保与大问提具有最高相关度的答案排在最前面。我们歌词 都歌词 在“A Machine Approach to Ranking Answers on Quora”这篇文章里解释了答案排名的细节。我们歌词 都歌词 还对评论进行排名,确保读者都上能看一遍相关度最高的评论排在最前面。哪几个排名系统远远超出了普通的upvote和downvote,它们通过相关的用户型态、内容质量、参与度等信息来完成最终的排名。

1. 查找信息

我们歌词 都歌词 还有某些统统 机器学习系统用于维持高质量的网站内容,不过这里不一一例举了。

机器学习在Quora的五大应用场景

机器学习平台

模型和库

自2015年以来,我们歌词 都歌词 组建了此人 的机器学习平台团队。组建该团队的目标是为了繁复机器学习工程师的工作,包括离线的工作(训练模型)和在线的工作(提供服务)。在在线工作方面,平台团队为机器学习工程师们提供了可靠和高可用的构建和部署系统,工程师们在你你你是什么平台都上上能构建和部署高性能、低成本的实时机器学习应用。在离线工作方面,机器学习工程师们都上能基于你你你是什么平台构建数据管道,以可重用和标准化的辦法 快速地抽取型态和训练模型。

4. 保持高质量的内容

从上图都上能看一遍,种子里不仅蕴含了大问提,还蕴含了答案。种子的答案排名是我们歌词 都歌词 的原本非常重要的机器学习大问提。大问提排名和答案排名使用的是类似于于的底层系统,不过将会要达成的目的不一样,统统 在底层模型里使用的型态是不一样的。我们歌词 都歌词 会向用户发送Email Digests,这也是另外一一一二个多机器学习的使用场景。以上哪几个排名大问提前会通不足英文级的机器学习系统来处理的,哪几个系统通太多种模型和小量型态来完成最终的排名。

我们歌词 都歌词 的团队使用了最好的模型和工具,一块儿也进行了标准化,有助够重用哪几个工具。以下列出了某些我们歌词 都歌词 使用的模型(排名不分先后)。

最后,我们歌词 都歌词 给每个大问提打上主题标签,用于标记某个大问提是属于哪个主题的。大多数主题建模系统会处理小量的文本和小量的主题,而我们歌词 都歌词 前要处理简短的文本和超过百万的潜在主题,统统 你你你是什么对于我们歌词 都歌词 来说更加具有挑战性。

5. 广告优化

Quora通过问答的形式实现知识的分享。分享从用户提出大问提(将会叫“信息需求”)开始英语 。在用户提问就让,我们歌词 都歌词 的机器学习系统开始英语 进行大问提理解,类似于于,从大问提中抽取信息,便于后续的处理。