519.5-SPSS.md

SPSS | SPSS统计应用

CLC: C819

随堂笔记

第一周 0302

  • 师は之前没怎么讲过通识,主要负责是另一个老师

  • 大数据专业选这个有点刷学分嫌疑

  • 这门课更重要的「统计分析」;SPSS流行度不高,虽然也好用;重在统计分析最基本的;偏基础的统计数据分析,什么机器学习不存在的

  • 参考资料

    • 概率论数理统计,浙大版是考研标准参考书,这门课2/3的原理内容都找得到(最白话的介绍)

    • 多元统计分析,这本书相对不那么数学,可能看起来容易,别的也可,已经有第五版

    • 这个推荐(uci?的)的 machine learning 的库整理得很好,

    • cdc 的数据也很运用统计

    • kaggle,

    • csdn,想了解信息更多依赖搜索,这里东西不少,老师认为这上面相对系统、出错率低

  • 目录

    • 参数统计的估计,学了,学了干什么

    • 假设检验(检验对数据分析很重要,但因为考研的要求,概统没怎么讲)

    • 均值、t检验……:对参数的检验……独立样本,比如肺炎的啥啥啥的,配对样本t检验是,个体配对

    • 卡方的检验,不是参数を的而是分布を,非参数的判别工具

    • 统计图,老师用的多的是直方图,商业角度别的图都可以让PPT好看

    • 方差分析,单因素双因素,

    • 回归分析,应用很重要,什么作用,怎么写你的报告

    • 各种分析、检验

  • 通识课,可以没有考试,需要课程汇报,每人一个数据分析的实验报告(个人作业),数据哪里来都可以,别的课程要求数据分析也都可以,只有网上抄袭是不可以,会查重的。上机考试,给一些数据、题目,请用SPSS画直方图、方差分析等。列联表的独立性检验可以证明,听不听课和会不会做相互独立。做作业SPSS用过一遍,上机考试问题不大;小论文用不用spess都可以,兴趣点可能不是直方图而是chargeboost什么的,用python也可以的,不过最基础的就做点数据分析

    • 每人一个小论文,人数比较多,如果退完课剩的人不太多,每个人都要汇报,人多的话随机抽签

    • 用Python、SAS什么的的话要吧代码给了;每个人也都要有PPT,只不过抽签者要表演;

  • 有数据分析相关问题可以发邮件

  • 粗暴一点,学会怎么用,什么问题用什么方法,读懂结果,也是可以的

  • SPSS就点点点,很傻瓜,点点试试

    • 很高级的数据分析不用,社会科学常用SPSS

  • SPSS

    • 数据导入进来

    • 数据视图、变量视图。

    • 菜单中「分析」,尤其其中的「描述统计」「比较均值」最常用,还有「相关」「回归」「分类」「降维(spss里面主成分是从因子分析来实现的,即在此)」,至此基本结课

      • 描述同济:用「选项」「确定」,bootstrap老师也没用过;怎么来的,作用

  • 描述性统计分析

    • 均值;方差$s^2$(「偏差平方和」除以,分母注意减一,“为了让变年轻”)、标准差$s$;标准误,反应平均数(x-bar)的标准差(分散性),SE=SD/✔n;他们都是代数运算

    • 中位数:主要是定位定出来;不受极端值影响

    • 众数

    • 均值、中位数、众数若接近,说明数据比较对称;左偏(skewed left)、右偏。为啥右边翘起来(纵坐标代表数量)叫左偏?因为,从median(中位数)来看,大多数的值域(故事)在左边,右边一下子就掉下去了;为什么需要知道对称或偏,

    • 集中趋势、离散趋势

    • 大概用位子刻画数据更客观、理性;但由于太冷酷,还是说均值吧,连标准差都不。比如标准差1,均值96,考93分的人就是在三个标准差之外,您要批评一番了

Last updated