推荐算法的核心是预测用户可能喜欢的内容，并据此进行推荐。这里用一个非常简单的电影推荐案例，解释最常见的协同过滤原理。

数据介绍

假设有3个用户（小明、小红、小刚）对4部电影的评分（1~5分），未评分的用“-”表示：

已经采集到的数据如下：

目标：
为小明推荐他可能感兴趣的电影（比如《雷神》评分低，可不推荐；《爱情故事》未评分，是否需要推荐？）

数据映射

数组：
[[ 5, 4, 0, 2]
[ 4, 5, 3, 0]
[ 1, 2, 5, 4]]

推荐的原理就是计算目标用户和其他用户的相识度，推荐相识度高喜欢的作品给他。

找到相似用户的步骤：（常用方法：余弦相似度）

小明 vs 小红：共同评分的电影是《复仇者》《钢铁侠》。
- 小明的评分向量：[5, 4]
- 小红的评分向量：[4, 5]
- 余弦相似度 = (5×4 + 4×5) / (√(5²+4²) × √(4²+5²)) ≈ 0.98（非常相似）
小明 vs 小刚：共同评分的电影是《雷神》，但小明和小刚对《雷神》评分差异大（小明2分，小刚4分），相似度低。
结论：小红和小明兴趣最接近。
余弦相似度越接近1，说明两个向量的方向越一致，即“偏好模式”越相似。