更新时间:11-05 上传会员:溪老师
分类:科技学院 论文字数:20622 需要金币:2000个
摘要:在当今时代互联网金融在科技和政策的推动下快速发展,国内外对于资金流动的分析很多,但主要集中在股票市场预测、政府税务收支、企业内部资金分析等方面,很少有涉及到互联网金融方向的分析,加上相关企业对于有关数据的严格保密,也使得这方面的研究手段非常单一,没有普适性较强的模型框架可供使用,预测效果也不尽如人意。本论文就是在这样的时代背景下,对相关的互联网金融企业进行了调研,最终确定了以余额宝为例的对资金流入流出预测的研究方向。
本文对于余额宝的用户进行了详细的分析,结合了同类互联网基金产品的特点,首先对数据进行了分析处理,使得数据更加纯净贴合预测主题,然后通过多方面分析提出了一套特征提取方法:在通常不提供特征的情况下,明确主题后分别对用户、时间、收益等方面进行考量最终选出最优的特征子集。在实际预测中,采取了前人在用户申购赎回分析中较少使用的线性组合算法回归分析法。首先确定合适的训练集数据和测试集数据,其中合适的测试集对于模型评估起到了非常关键的作用。回归模型分别选择了线性回归、岭回归和Lasso回归,基于选定的特征向量子集分别进行训练建立各自的回归模型,然后以2014年4月为训练集确定最优的加权系数将三种回归算法生成最终的组合线性回归预测模型。在文章最后,对预测结果进行了预测结果进行了分析评估,取得了理想的成绩。
关键词:资金流预测;数据预处理;特征提取;线性回归;岭回归;Lasso回归
目录
摘要
ABSTRACT
1.绪论-1
1.1 问题的背景-1
1.2 研究目的和意义-1
1.3 研究现状-2
1.3.1 投资分析法-2
1.3.2 基于时间序列的模型分析法-3
1.3.3 人工神经网络算法-3
1.4 关键问题和研究内容-4
2.相关技术知识-5
2.1 原始数据预处理-5
2.1.1 数据清洗-5
2.1.2 数据编辑-5
2.1.3 数据缩减-6
2.1.4 数据整理-6
2.2 特征提取-6
2.3 特征优化-7
2.4 损失函数与优化目标-7
2.5 预测模型-7
2.5.1 线性回归-8
2.5.2 岭回归-8
2.5.3 Lasso回归-9
2.6 哑变量-9
3.资金流入流出分析-11
3.1 问题描述-11
3.2 问题分析-11
3.3 数据处理-11
3.3.1 原始数据介绍-11
3.3.2 数据基本信息分析-13
3.3.3 数据具体处理-14
3.4 特征构建-16
3.4.1特征提取-16
3.4.2 特征筛选-18
3.5 模型构建-19
3.5.1 确定模型-21
3.5.2 模型初步建立-23
3.6 模型疏漏分析-24
3.7 模型优化-25
3.8 结果与分析-26
4.总结-27
4.1 论文总结-27
4.2 存在问题-27
参 考 文 献-28
致 谢-29
附 录 A-30
附 录 B-35