## 一 推荐系统简介

​        个性化推荐(推荐系统)经历了多年的发展，已经成为互联网产品的标配，也是AI成功落地的分支之一，在电商(淘宝/京东)、资讯(今日头条/微博)、音乐(网易云音乐/QQ音乐)、短视频(抖音/快手)等热门应用中,推荐系统都是核心组件之一。

- 推荐系统产生背景

  - 信息过载 & 用户需求不明确
    - 分类⽬录（1990s）：覆盖少量热门⽹站。Hao123 Yahoo
    - 搜索引擎（2000s）：通过搜索词明确需求。Google Baidu
    - 推荐系统（2010s）：不需要⽤户提供明确的需求，通过分析⽤
      户的历史⾏为给⽤户的兴趣进⾏建模，从⽽主动给⽤户推荐能
      够满⾜他们兴趣和需求的信息。

- 什么是推荐系统

  - 没有明确需求的用户访问了我们的服务, 且服务的物品对用户构成了信息过载, 系统通过一定的规则对物品进行排序,并将排在前面的物品展示给用户,这样的系统就是推荐系统

- 推荐系统 V.S. 搜索引擎

  <table>
    <tr>
      <th></th>
      <th>搜索</th>
      <th>推荐</th>
    </tr>
    <tr>
      <td> 行为方式 </td>
      <td> 主动 </td>
      <td> 被动 </td>
    </tr>
    <tr>
      <td> 意图 </td>
      <td> 明确 </td>
      <td> 模糊 </td>
    </tr>
    <tr>
      <td> 个性化 </td>
      <td> 弱 </td>
      <td> 强 </td>
    </tr>
    <tr>
      <td> 流量分布 </td>
      <td> 马太效应 </td>
      <td> 长尾效应 </td>
    </tr>
    <tr>
      <td> 目标 </td>
      <td> 快速满足  </td>
      <td> 持续服务 </td>
    </tr>
    <tr>
      <td> 评估指标 </td>
      <td> 简明 </td>
      <td> 复杂 </td>
    </tr>
  </table>

  马太效应：指好的愈好，坏的愈坏，多的愈多，少的愈少的一种现象。即两极分化现象。越靠前的搜索结果被点击的概率越高。

  长尾效应：

  - 正态曲线中间的突起部分叫“头”；两边相对平缓的部分叫“尾”。
  - 从人们需求的角度来看，大多数的需求会集中在头部，而这部分我们可以称之为流行，而分布在尾部的需求是个性化的，零散的小量的需求。
  - 这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”，而所谓长尾效应就在于它的数量上，将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。

  Amazon有超过一半的销售量都来自于在它排行榜上位于13万名开外的图书(此处利用了长尾效应)。

- 推荐系统的作用

  - 高效连接用户和物品, 发现长尾商品
  - 留住用户和内容生产者, 实现商业目标

- 推荐系统的工作原理

  - **社会化推荐** 向朋友咨询, 社会化推荐, 让好友给自己推荐物品
  - **基于内容的推荐** 打开搜索引擎, 输入自己喜欢的演员的名字, 然后看看返回结果中还有什么电影是自己没看过的
  - **基于流行度的推荐** 查看票房排行榜, 
  - **基于协同过滤的推荐** 找到和自己历史兴趣相似的用户, 看看他们最近在看什么电影

- 推荐系统的应用场景 feed 流 

  ![](/img/recommend1.png)

- 推荐系统和Web项目的区别

  - 稳定的信息流通系统 V.S. 通过信息过滤实现目标提升 
    - web项目: 复杂逻辑 高并发 高可用
    - 推荐系统: 追求指标增长, 留存率/阅读时间/GMV (Gross Merchandise Volume电商网站成交金额)/视频网站VV (Video View)
  - 确定 V.S. 不确定思维
    - web项目: 对结果有确定预期
    - 推荐系统: 结果是概率问题