互联网产生的海量信息带来了 “信息超载” 的问题。文章基于协同过滤算法对用户喜好进行了研究。阐述了协同过滤的基本思想, 对用户喜好数据的采集及预处理过程进行了研究; 在数据分析过程中提出几种常用的计算相似度的方法并进行了比较; 研究了协同过滤算法的两个分支的不同适用场景, 并与基于内容的算法进行比较, 对现有算法存在的不足提出了改进。