记录一些基础概念
1.总体:是指根据研究目的所确定的观察单位某项特征的集合。
2.样本:就是从总体中抽出的部分观察单位某项特征的集合。
3.参数:是用于描述总体特征的指标,如总体均数(μ),总体标准差(σ)、总体率(π)、总体相关系数(ρ)。
4.统计量:是用于描述样本特征的指标,如样本均数([插图]),样本标准差(s)、样本率(p)、样本相关系数(r)。
5.概率(P):是用于反映某一事物发生可能性大小的一种量度。一般用大写的斜体P表示。
6.频率(f):是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。
频率是针对过去的,概率是针对未来的。频率是针对已经发生的样本的,概率是针对尚不知晓的总体的,频率就像样本统计量,概率更像总体参数,而我们是用频率去估计概率的。
7.误差:是观察值与真值之差,即我们通过一次试验得到的结果与事件真实结果之间的差值。
- 系统误差是因为试剂未校正或者仪器没有调零等因素造成的研究结果倾向性的增大或减小。
- 随机误差是由各种偶然因素造成的观察值与真值之差。
- 抽样误差是因为抽样造成的样本统计量与总体参数之间的差异。
- 过失误差是由于观察过程中的不仔细造成的错误判断或记录。
8.同质:是指观察单位所受的影响因素相同。同质是相对的。我们科研所确定的总体或者样本,在某些因素上必须是同质的,只有这样我们才能将其作为一个群体进行研究。
9.变异:是指观察单位在同质基础上的个体差异。变异是绝对的。
10.随机化原则:是指我们在选择受试对象、对受试对象分组以及对受试对象施加不同的干预措施时,受试对象被抽到的概率、被随机分到各组的概率以及接受不同干预措施的概率是相等的。包括随机化抽样、随机化分组和随机化顺序。 - 随机化抽样是指我们从研究总体中抽取研究样本时,总体中的任何一个个体被抽到作为样本进行研究的概率相等。
- 随机化分组是指我们获取研究样本后,样本中的每个受试对象具有同等的机会被分配到各个研究组中去。
- 随机化顺序是指当我们进行交叉试验时,随机化分组后的研究组接受不同干预措施的顺序是随机的。
11.因素:是可能对应变量有影响的变量,而分析的目的就是比较不同水平对应变量的影响是否相同。
12.水平:因素的不同取值等级称作水平。
13.变量:为观察单位的某项特征,如人的身高、体重、性别、年龄、血型、营养程度等,通俗讲就是我们研究的指标。
14.计量变量时通过定量的方法检测出来的指标,通常以阿拉伯数字呈现,具有单位,并可以定量地比较,如身高(cm)。又称为数值变量,连续性变量,定量变量。
15.计数变量:反映的是互不相容的属性和类别,反映的是一种我中无你、你中无我的关系。又称为分类变量,无序分类变量。
16.等级变量:具备计数变量的性质,同时又具有半定量比较的性质。如职称(初级、中级、高级)。这类变量各水平之间互不相容,但又有级别上的轻重关系。
三种变量反映受试对象信息的能力顺序依次为计量变量、等级变量和计数变量。