学习天地
 
 
【新闻稿】互联网消费金融
发布人:胡茜  发布时间:2017-06-03   浏览次数:225

【新闻稿】” SPSS大数据分析算法及应用”讲座

201763日上午,由复旦CS创新创业中心、清平道场、MSE Club联合举办了一场创新创业讲座,本次讲座邀请了IBM SPSS算法研发高级软件工程师安欢先生,于邯郸校区第三教学楼给学生们做了一场SPSS大数据分析算法及应用”讲座。

主讲人一开始给大家介绍了数据分析基础流程,什么是数据科学,如何运用数据进行分析;接着解释了训练模型与预测模型过程,历史数据分成训练集与测试集等;已有测试集,利用测试集用模型进行预测,最终产生观测值与预测值;以及模型的训练分支和预测分支:模型训练分支——生成和创建模型,模型预测分支——预测模型和对模型进行评分IBM SPSS和 算法类型——按类别分类等;又给大家介绍了数据探索、智能报表、数据审计和数据关系的概念,数据探索即汇总数据特征,探索数据的关系 ,进而发现数据中所隐藏的模式并揭示洞察;数据分布即不同项中应相互平衡;数据审计,数据规模较大时,计算基本统计量;数据关系,数据整体或同一变量的关系,也可以是两个变量之间的相互关系。最后想大家介绍了回归和分类:在数据上依据一个变量(被解释变量)和另一个(些)变量(解释变量)的具体依赖关系建模,并将模型用于对新观测值的预测。主讲人表示,现代统计学已经提供了相当丰富的数据处理手段,但统计学的局限性在于,它只是在统计的层面上解释数据所包含的信息,并不能从数据上得到原理上的结果。也就是说统计学并不能解释为什么数据是个样子,只能告诉我们数据展示给了我们什么。因此,统计学无法揭示系统性风险,这也是我们在利用统计学作为数据处理工具的时候需要注意的一点。数据挖掘也是这个道理。因为数据挖掘的原理大多也是基于统计学的理论,因此所挖掘出的信息并不一定具有普适性。所以,在决策制定上,利用统计结果+专业知识解释才是最保险的办法。然而,在很多时候,统计结果并不能用已有的知识解释其原理,而统计结果又确实展示出某种或某些稳定的趋势。为了抓住宝贵的机会,信任统计结果,仅仅依据统计分析结果来进行决策也是很普遍的事情,只不过要付出的代价便是承受系统环境的变化所带来的风险。

整场讲座在同学们热烈的掌声中结束了,同学们均表示在此次讲座中收获颇丰,受益匪浅,安欢先生的精彩分享赢得了同学们的广泛好评。