首页下载资源大数据第六届“泰迪杯”数据挖掘挑战赛- B 题:电视产品的营销推荐

ZIP第六届“泰迪杯”数据挖掘挑战赛- B 题:电视产品的营销推荐

GintokiShogun28.65MB需要积分:1

资源文件列表:

综合实验.zip 大约有20个文件
  1. 综合实验/1基于KNN算法和RFM模型的电视产品营销策略研究.docx 2.38MB
  2. 综合实验/代码文件/
  3. 综合实验/代码文件/代码文件.ipynb 1.22MB
  4. 综合实验/实验数据/
  5. 综合实验/实验数据/表1:1用户回看信息预处理.csv 1.67MB
  6. 综合实验/实验数据/表2:1用户收视信息预处理.csv 24.55MB
  7. 综合实验/实验数据/表3:1用户点播信息预处理.csv 43.75KB
  8. 综合实验/实验数据/表4:1稀疏矩阵指标.csv 4.5MB
  9. 综合实验/实验数据/表5:2RFM模型.csv 1.22KB
  10. 综合实验/实验数据/表6:2用户相似度商品推荐指标预处理.csv 4.85KB
  11. 综合实验/实验数据/表7:2用户相似度商品推荐指标.csv 10.53KB
  12. 综合实验/实验数据/表8:2用户分类.csv 4.5KB
  13. 综合实验/实验数据/表9:2商品推荐(同时存在于附件三及点播付费表中的用户).csv 17.59KB
  14. 综合实验/原始数据与题目要求/
  15. 综合实验/原始数据与题目要求/参考答案2.pdf 1001.56KB
  16. 综合实验/原始数据与题目要求/参考解答.pdf 1.29MB
  17. 综合实验/原始数据与题目要求/附件1:用户收视信息.xlsx 18.17MB
  18. 综合实验/原始数据与题目要求/附件2:电视产品信息数据.csv 8.41MB
  19. 综合实验/原始数据与题目要求/附件3:用户基本信息.csv 201.45KB
  20. 综合实验/原始数据与题目要求/基于协同过滤的电视产品个性化推荐.pdf 221.15KB

资源介绍:

第六届“泰迪杯”数据挖掘挑战赛—— B 题:电视产品的营销推荐 资源内包含题目要求及原始数据、本人自己做的解题代码、使用的数据、实验论文 适合备战“泰迪杯”类型的数据挖掘类比赛的本科生进行学习 能学到数据处理的基本方法以及物联网数据分析的相关知识
泰迪杯
作品名称:基于收视记录的电视产品营销及用户画像
荣获奖项:等并获信诺创新奖
作品单位:河海大学
作品成员:方思越 钟雨纯 杨洋
指导老师:施国良
“泰迪杯”挑战赛优秀作品
基于收视记录的电视产品营销及用户画
摘要三网融合的背景下,一方面越来越多的家庭对机顶盒电视实际上有了
更高的需求,希望快速获得目标资源;另一方面,电视服务供应商也希望有效挖
掘出用户需要和感兴趣的资源、信息,实现大数据分析,形成个性化的产品营销
及有偿服务。
该论文基于用户收视信息、产品信息及用户套餐数据,利用协同过滤及分类
的思想,先为用户做产品推荐,再进行分类推荐,并对套餐设置提出建议。
首先对数据进行预处理,对数据进行清洗、转换,利用爬虫捕捉网络数据进
行数据补充。
对于第一题,主要使用“用户点播信息”用户单片点播信息”表,基于
用户的协同过滤与基于电视产品的协同过滤相结合,为用户推荐电视产品。
对于第二题,在第一题的基础上结合三个附件,构建用户标签体系与产品标
签体系,按照标签体系对用户和产品进行分类,利用分类后的用户-产品类别矩
阵再次进行协同过滤,实现分类推荐。
分析现有套餐设置结构,并对套餐的销售品字段进行拆分。利用套餐拆分后
的结果和用户画像的结果进行关联规则,发现不同用户画像与套餐内容之间的规
律,为套餐推荐提出建议。
文章最后对此次实验做出总结,浅谈收获并对未来做出展望。
关键词:Excel;协同过滤;爬虫;Python
“泰迪杯”挑战赛优秀作品
Television Product Recommendations and User
Portraits Based on Viewing History
Abstract: In the integration of three networks age, on the one hand, more and
more families actually have higher demand for set-top TVs and hope to quickly obtain
target resources; on the other hand, TV service providers also hope to effectively tap
user needs and senses. Resources and information of interest, realizing big data
analysis, and forming personalized product marketing and paid services.
This paper is based on user viewing history information, product information and
user package data. It uses the idea of collaborative filtering and classification to make
product recommendations for users first, and then makes recommendations for
categorized users. Also, we make suggestions for package settings.
First, the data is preprocessed. The data is cleaned and converted, and we use the
crawler captures network data to supplement the data.
For the first question, the last two sheets in the first annex are mainly used, and
user-based collaborative filtering is combined with collaborative filtering based on
television products to recommend television products for users.
For the second question, our method is based on the results of the first question
and the three attachments were combined to build a user tag system and a product
labeling system. The users and products were classified according to the tag system,
and the classified user-product category matrix was used again. We again use
collaborative filtering to achieve classification recommendations.
Analyze the existing package setup structure and split the sales item field of the
package. Using the result of the splitting of the package and the result of the user's
portrait, the association rule is found, and the rules between the portraits of different
users and the contents of the package are found, and suggestions are given for the
package recommendation.
At the end of the article, a summary of this experiment is given, which is about
harvesting and looking forward to the future.
Key words: Excel; Collaborative filtering; Web crawler; Python
“泰迪杯”挑战赛优秀作品
目录
一、 引言 ..................................................... 1
1.1 背景 .................................................... 1
1.2 研究内容 ................................................ 1
1.3 研究思路 ................................................ 1
二、数据预处理.................................................. 2
2.1 附件 1:用户收视信息..................................... 2
2.1.1 用户收视信息 ...................................... 2
2.1.2 用户回看信息 ...................................... 2
2.1.3 用户点播信息 ...................................... 2
2.1.4 用户单片点播信息 .................................. 3
2.2 附件 2:电视产品信息数据................................. 3
2.3 附件 3:用户基本信息..................................... 3
三、研究方案及实施.............................................. 3
3.1 问题一 .................................................. 3
3.1.1 基于用户的协同过滤 ................................ 4
3.1.2 基于电视产品的协同过滤 ............................ 5
3.1.3 方案实施及测试 .................................... 6
3.2 问题二 .................................................. 7
3.2.1 构建用户标签体系(用户画像) ...................... 7
3.3.2 构建产品标签体系 .................................. 9
3.2.3 电视产品分类推荐 .................................. 9
四、电视套餐建议............................................... 11
4.1 分析套餐结构 ........................................... 11
4.2 对内容相同的套餐进行合并归类 ........................... 12
4.3 形成用户数据表 ......................................... 13
4.4 实施关联规则 ........................................... 13
五、 总结 .................................................... 15
5.1 结论 ................................................... 15
“泰迪杯”挑战赛优秀作品
5.2 回顾与展望 ............................................. 16
致谢........................................................... 18
Acknowledgement ............................................... 18
参考文献....................................................... 19
“泰迪杯”挑战赛优秀作品
100+评论
captcha