统计 | 几种特殊随机变量的分布 一、随机变量及分布函数 二、离散型随机变量 1、单点分布 2、离散均匀分布 2、两点分布X∼b(1,p)X\sim b(1,p)X∼b(1,p) 3、二项分布X∼b(n,p)X\sim b( n,p)X∼b(n,p) 3、超几何分布X∼h(n,N,M)X\sim h(n,N,M)X∼h(n,N,M) 4、几何分布X&...

假设检验原理 反证法 小概率事件在一次试验中是几乎不可能发生的(但在多次重复试验中是必然发生的) 假设检验的步骤 设置原假设与备择假设; 设置显著性水平α\alphaα(通常选择α=0.05\alpha=0.05α=0.05); 根据问题选择假设检验方式; 计算统计量,并通过统计量获取P值 根据P值和显著性水平α\alphaα...

独立均值t检验

统计

  

2020-08-14 09:01:51

独立均值t检验 使用场景: 总体方差,均值未知 采样两次样本不同 **非独立均值t检验的两组样本是同样的样本测两次 内容来源–bilibili 标准误计算方法 例题: H0: 表达性写作没有治疗功效 H1: 有治疗功效 实验组和控制组是两组不同的人。...

最近项目中需要统计APP的最近几次的在线离线情况,因为有些商家的网络信号很差,需要根据最近的心跳在线离线情况做一些事情,例如统计商户APP最近10次的在线离线记录,如果最近10次有8次离线那就认识商家是网络比较差的商家,那么就去对这部分商家去做一些其他事情,那么怎么统计好呢?因为统计与计算是要同时记录的。 传统的方式是新建一个在线离线状态记录表,然后从表里面就可以获取最近几次在线离线记录,这个方法...

Wilcoxon signed-rank是一种非参数检验的统计量,用于检验对称分布的均值是否为0。给出iid数据Y1,⋯ ,YnY_1,\cdots,Y_nY1​,⋯,Yn​,Zj=sign(Yj)Z_j = sign(Y_j)Zj​=sign(Yj​),RjR_jRj​为ZjZ_jZj​的秩(rank). Wilcoxon signed-rank statistics定义为: W=...

UA MATH571A 一元线性回归III 一元线性回归的ANOVA ANOVA Table F检验 回归系数的F检验 F检验与t检验等价 广义线性检验方法 R2R^2R2 数值例子:女性肌肉量与年龄的关系 ANOVA Table ANOVA(Analysis of Variance)是分析方差构成的常用方法。在前两篇中,我们定义过 SST=∑i=1N(Yi−Yˉ)2 SST ...

使用statsvn统计svn中的代码量 StatSVN介绍 StatSVN是一个Java写的开源代码统计程序,从statCVS移植而来,能够从Subversion版本库中取得信息,然后生成描述项目开发的各种表格和图表。比如:代码行数的时间线;针对每个开发者的代码行数;开发者的活跃程度;开发者最近所提交的;文件数量;平均文件大小;最大文件;哪个文件是修改最多次数的;目录大小;带有文件数量和代码行数的...

UA MATH571A 一元线性回归II 系数的统计推断 β1\beta_1β1​的假设检验与置信区间 Gauss-Markov定理 检验的势 双边检验,单边检验与置信区间 置信区间 双边检验 单边检验 β0\beta_0β0​的分布 数值例子:女性肌肉量与年龄的关系 在上一篇的例子中,我们讨论到仅使用系数的估计值无法进行稳健的推断。因为系数的估计量服从某个...

统计学学习笔记-第一周

统计  pyhthon

  

2020-04-26 00:07:37

主要通过阅读贾俊平编写的《统计学》和网上统计学视频,及查看相关网络资料整理,为统计学学习第一周的学习笔记。 一、主要学习内容 1. 统计学基本概念 1.1.统计方法类别 统计学是收集、处理、分析、解释数据并从数据中得出结论多数据科学。统计不是万能多,它不能解决你所面临的问题,但可帮你分析数据,并从中得出某种结论,但对统计结论的进一步解释,则需要专业知识。 数据分析所用多方法可分为描述性统计方法和推...

Gibbs采样

概率统计

  

2020-05-08 04:09:21

在MCMC(三)MCMC采样和M-H采样中,我们讲到了M-H采样已经可以很好的解决蒙特卡罗方法需要的任意概率分布的样本集的问题。但是M-H采样有两个缺点:一是需要计算接受率,在高维时计算量大。并且由于接受率的原因导致算法收敛时间变长。二是有些高维数据,特征的条件概率分布好求,但是特征的联合分布不好求。因此需要一个好的方法来改进M-H采样,这就是我们下面讲到的Gibbs采样。 1. 重新寻找合适的细...

1. SPSS 当存在分类变量时,需要首先处理成多个哑变量,例如将年龄分成三个:age<18, age18_60, age>60。 然后在SPSS里纳入除了ref的所有哑变量,例如我们要将18-60作为参考组,就纳入age<18和age>60,不要纳入age18-60。 首先可以选择stepwise进行特征筛选建模。但是勾选逐步后,不能enable Bootstrap。所以...

MCMC采样和M-H采样

概率统计

  

2020-05-08 06:26:47

在MCMC(二)马尔科夫链中我们讲到给定一个概率平稳分布π\piπ, 很难直接找到对应的马尔科夫链状态转移矩阵PPP。而只要解决这个问题,我们就可以找到一种通用的概率分布采样方法,进而用于蒙特卡罗模拟。本篇我们就讨论解决这个问题的办法:MCMC采样和它的易用版M-H采样。 1. 马尔科夫链的细致平稳条件 在解决从平稳分布π\piπ, 找到对应的马尔科夫链状态转移矩阵PPP之...