更新时间:11-02 上传会员:溪老师
分类:科技学院 论文字数:16226 需要金币:2000个
摘要:数据分析是一个很重要的过程,它对于企业来说有着重要的作用,进行充分的分析自身产品在市场的容量,能使企业找准自身的市场定位,对后期发布新产品有着很大的用途。
本文基于近几年运动器材市场的调研分析设计并开发了运动器材使用情况数据分析系统。该系统的功能模块包含数据获取模块、数据预处理模块、数据存储模块、数据分析模块和网页展示模块。数据获取模块使用基于Python的爬虫框架从京东网站爬取大量的运动器材销售信息等方面的数据;数据预处理模块对各种脏数据进行对应方式的处理,得到连续的、标准的数据,提供给数据统计、数据挖掘等使用;数据存储模块将经过预处理的数据存储至MySQL数据库,建立合适的索引,提高数据读取速度;数据分析模块采用K-means聚类算法将数据进行聚类,基于Django框架对数据进行统计分析;网页展示模块将分析所得的结果通过Bootstrap前端框架设置网页进行展示,并利用开源可视化库ECharts创建可视化图表,使网页展示内容生动形象。
本文从京东网站爬取大量的运动器材销售信息等方面的数据,通过本系统分析得到了各种类运动器材的购买人数和平均售价、用户购买量最多的运动器材排名、按售价进行运动器材排名,并对销售价格和购买人数数据进行聚类,根据其结果分析运动器材销售价格对消费者购买行为的影响。系统各模块的运行状态良好,界面展示友好。可视化的数据展示可以为运动器材企业管理者提供直观的运动器材销售状况的参考,具有一定的实际应用意义。
关键词:数据分析;运动器材;Python;k-means;可视化
目录
摘要
Abstract
1 绪论-1
1.1 系统研究背景-1
1.2 国内外的发展现状-1
1.2.1 国外的发展现状-1
1.2.2 国内的发展现状-2
1.3 课题研究的目标和内容-2
1.3.1 课题研究的目标-2
1.3.2 课题研究的内容-3
2 相关理论和技术的介绍-3
2.1 Python-3
2.2 Web相关技术-4
2.3 MySQL-5
2.4 k-means算法-5
3 系统分析-6
3.1可行性分析-6
3.2 需求分析-6
3.2.1 功能需求-6
3.2.2 非功能需求-7
4 系统设计-7
4.1 系统架构设计-7
4.2 系统模块设计-8
4.2.1 数据获取模块-9
4.2.2 数据预处理模块-10
4.2.3 数据存储模块-10
4.2.4 数据分析模块-11
4.2.5 网页展示模块-12
5 系统实现与展示-13
5.1 数据获取模块-13
5.2 数据预处理模块-13
5.3 数据存储模块-14
5.4 数据分析模块-16
5.5 网页展示模块-19
6 系统测试-23
7 总结-24
参 考 文 献-25
致 谢-26