前沿科技创业的驱动者

R语言中的t检验丨数析学院

2016-09-27 10:47 阅读(211)    评论(0)   

问题

在R中,我们如何检验从总体中抽样得到的两组样本是否有不同的均值,或是通过总体中的某一组样本检验总体均值与某一理论均值间的差异。

指南

示例数据 我们选择内置的sleep数据集作为示例数据。

接下来,我们将sleep数据集处理为宽数据;在之前发布的教程中,我们曾谈到过数据集长宽转换的方法(R语言行动指南-36:长数据与宽数据的转换)。

两组数据的对比:独立双样本t检验

首先假设我们的两组数据完全由独立抽样得来;为了达成这个目的,我们暂且忽略掉ID这个变量的存在。

t.test函数可以直接用于检验像sleep这样的长数据,在下面的例子中,列extra中记录着用于检验的数值,而列group则为样本的分组依据;如果数据没有以数据框形式存储,我们同样可以通过指定两个独立的向量来完成这一操作。

默认地,t.test不会假设样本具有相同的方差,因此该函数默认地调用Welch t检验方法而不是student t检验。可以看到在上文的Welch t检验中,自由度df=17.776,这是由于方法内对于可能存在的非均等方差的调整。如果我们要调用student t检验方法,那么我们需要设置参数var.equal=TRUE。

配对样本t检验

有时需要我们检验的数据可能是同一个实验对象在实验前后的某一关键指标数值,或是相互匹配的两组对象在进行不同实验之后的数值反应,也就是说,我们得到的两组样本数据间具有某种配对关系。此时,我们可以通过配对样本t检验的方式对其进行检验。

同样的,在上文中我们提及了t-test函数可以兼用于一个带有分组变量的数据框或是两个独立的向量。在配对样本中,样本的配对关系取决于其对应的位置。如果我们的数据集为包含分组变量的数据框,那么程序将默认group=1的数据行中的第一行与group=2的数据行中的第一行相互匹配。所以我们需要特别注意数据的排列顺序并确保其中没有缺失值,否则样本间的配对就不得不被打破。在下面的例子中,我们运用group和ID两个变量来确保数据排序的正确。

配对t检验的实质等同于检验每组相互配对的样本数据的差值的总体均值是否为0。(详情可见下文中单样本t检验的内容)

样本与外生总体均值的对比:单样本t检验

假设现在我们的目的为检验列extra数据对应的总体均值是否为0,在下面的例子中,我们暂时忽略了变量group与变量ID。


复制链接,通过电脑学习效果最佳: http://datacademy.io/lesson/64

分享到:

相关推荐

  • QQ截图20160918112903

    两院院士严东生在沪逝世 享年98岁

    中国共产党优秀党员,九三学社社员,我国著名材料科学家、战略科学家、教育家,中国共产党第十一届中央纪律检查委员会委员,第十二届中央委员会委员,第六、七届全国政协常委,第六、七届上海市政协副主席,中国科学院原党组书记、副院长,中国科学院、中国工程院资深院士,中国科学院特邀顾问,中国...

  • nuclear battery

    俄罗斯即将造出寿命达100年的核能电池

    俄罗斯萨马拉科罗廖夫大学新闻办日前宣布,该校科研人员正在研制一种核能电池,使用期可达100年。其中的新技术利用多孔碳化硅结构保护放射性元素,能在保证安全的同时,让核能电池工作很长时间。 据称,新型电池中的放射源利用特殊元素碳14,其半衰期为5700年,且无毒、廉价。这种电池的使用范围相...

  • QQ截图20160920105054

    首个月球村 将由3D打印来完成

    在月球上建造自己的空间站是人们探索月球的新目标。但是月球环境恶劣,在上面长期作业肯定不行,于是科学家们有一个更加快捷有效的方法,3D打印一个月球村。 据英国媒体报道,欧洲空间局计划在最短15年时间内,在月球上打造出一个3D打印的“月球村”。 不久前,来自世界各地的太空探索专家对建立...

  • QQ截图20160905115633

    3Doodler PRO:现实版“神笔马良”

      内容摘要 2013年,WobbleWorks公司推出一款3D打印笔3Doodler,日前,这家公司又在2016年的柏林国际电子消费品展览会(IFA)带来了一款新品,一款据称是准专业级的3D打印笔--3Doodler PRO。   大家还是否记得此前的3Doodler,它是WobbleWorks公司推出的一款3D打印笔,堪...

  • 2989496f585502771d71aacdc654492f

    全球首根百米量级铁基超导长线“出世”

      内容摘要 中国科学院电工所日前成功研制出全球首根100米量级铁基超导长线,接下来将突破大功率电力电子器件、高温超导材料等关键元器件和材料的制造及应用技术,形成产业化能力。   铁基超导材料是继铜基超导材料之后发现的一类新的高温超导材料,这是高温超导研究领...

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SME 前沿科技创业的驱动者