基于校园卡数据的助学金预测问题研究.docx
更新时间:07-24 上传会员:小山神

分类:工业设计论文字数:17105 需要金币:1000个

下载此论文

摘要:目前,我国大学基本都已经建立了较为全面的贫困学生资助体系。但是由于学生的贫困生申请信息偏于主观、贫困指标难以量化等因素, 导致助学金的评判标准和申请助学金的条件还不太完善，这使得贫困生认定工作变成了高校资助决策中的难点问题。

本课题基于校园卡数据对助学金问题进行研究，主要通过机器学习方法，在高校奖学金评定不合理这种现状以及大数据的时代背景下，系统的挖掘了学生在大学学习生活中产生的校园卡数据特征，采用缺失值填充对特征进行处理、采用包裹型方法对特征进行选择。使用Random Forest分类器和GBDT算法对数据进行处理并且通过交叉验证中的K-折交叉验证方法进行参数调优，最后对助学金的发放进行了合理的预测，并且取得了较好的预测效果。

关键词：大数据；数据挖掘；机器学习；助学金

摘要

Abstract

1绪论-1

1.1 课题研究背景-1

1.2 国内助学金现状分析-1

1.2.1国家助学金评定现状-1

1.2.2国家助学金评定乱象原因分析-3

1.2.3国内助学金研究方法分析-4

1.3 大数据研究背景-4

1.4 论文主要研究内容-5

2 相关技术介绍-6

2.1 大数据介绍-6

2.1.1 大数据的定义-6

2.1.2 大数据的特征-6

2.1.3 大数据的结构-7

2.1.4 大数据的意义-7

2.1.5 大数据的趋势-8

2.2 Python语言介绍-8

2.2.1 Python简介-8

2.2.2 Python风格-9

2.3.1 Python执行-9

3 特征工程-10

3.1 数据描述-10

3.1.1 图书馆借阅数据-10

3.1.2 校园卡消费数据-10

3.1.3 寝室门禁数据-10

3.1.4 图书馆门禁数据-11

3.1.5 学生成绩数据-11

3.1.6 助学金数据-11

3.2 特征构造-11

3.2.1 图书借阅-12

3.2.2 图书馆门禁-12

3.2.3 宿舍门禁-13

3.2.4 成绩排名-13

3.2.5校园卡消费数据-14

3.3 特征处理-15

3.3.1 处理方法-15

3.3.2 缺失值填充-15

3.4 特征选择-15

3.4.1 过滤型-15

3.4.2 嵌入型-15

3.4.3 包裹型-16

3.5 本章小结-16

4 预测模型-17

4.1 Random Forest-17

4.2 GBDT-17

4.3 Xgboost-18

4.4 本章小结-18

5 实验结果-20

5.1 实验数据说明-20

5.2 实验数据处理-20

5.2.1 样本处理-20

5.2.2 模型融合-21

5.2.3 参数调优-21

5.3 实验评估指标-21

5.4 实验结果分析-22

5.5 本章小结-23

结论-24

参考文献-25

附录A 主要程序代码-26

致谢-45

上一篇：基于小波变换的语音去噪方法研究.docx
下一篇：激光设备应用环境检测系统设计.doc

最新原创论文，论文题目，论文提纲，论文范文

电脑版|

论文助手网提供可以用Word、WPS编辑的论文范文模板

基于校园卡数据的助学金预测问题研究.docx更新时间:07-24 上传会员:小山神

分类:工业设计 论文字数:17105 需要金币:1000个

基于校园卡数据的助学金预测问题研究.docx
更新时间:07-24 上传会员:小山神

分类:工业设计论文字数:17105 需要金币:1000个