对随机序列进行运行测试

给定一系列数据,我们可能想知道的一个问题是序列是否偶然发生现象,或者数据是否不是随机的。随机性很难识别,因为很难简单地查看数据并确定它是否是偶然产生的。一种可用于帮助确定序列是否真正偶然发生的方法称为运行测试。

运行测试是显着性检验或假设检验。此测试的过程基于具有特定特征的数据的运行或序列。要了解运行测试的工作原理,我们必须首先检查运行的概念。

数据序列11 12

我们将首先看一个运行示例。考虑以下随机数字序列:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5

对这些数字进行分类的一种方法是将它们分成两类,偶数(包括数字0,2,4,6和8)或奇数(包括数字1,3,5,7和9)。我们将查看随机数字的序列,并将偶数表示为E,将奇数表示为O:

E E O E O E O E E E E E O E O O

如果我们重写它以便所有操作系统都在一起并且所有Es都在一起,运行更容易看到:

E E O EE OO E O EEEEE O EE OO

我们计算偶数或奇数的块数,并查看数据总共有十次运行。四次跑有一个长度,五次跑有两个长度,一次跑有五个长度

Conditions

对于任何重要的测试,重要的是要知道进行测试需要什么条件。对于运行测试,我们将能够将样本中的每个数据值分为两类之一。我们将计算相对于属于每个类别的数据值数量的运行总数。

T他的测试将是双面测试。其原因是运行次数太少意味着可能没有足够的变化以及随机过程中发生的运行次数。当一个过程在类别之间交替出现的频率太高而无法偶然描述时,会导致太多运行。

假设和P值55,56

每个显着性检验都有一个零假设和另一个假设。对于运行测试,零假设是序列是随机序列。另一种假设是样本数据的序列不是随机的。

统计软件可以计算与特定测试统计信息相对应的p值。还有一些表格给出了运行总数的一定重要程度的临界值。

运行测试示例

我们将通过以下示例来了解运行测试的工作原理。假设对于任务,要求学生翻转硬币16次并注意出现的头部和尾部的顺序。如果我们最终得到这个数据集:

H T H H T H T H T H T H T H T H H

我们可能会问学生是否真的做了作业,或者他**并写下了一系列看起来随机的H和T?运行测试可以帮助我们。运行测试符合假设,因为数据可以分为两组,无论是头部还是尾部。我们继续计算运行次数。重新组合,我们看到以下内容:

H T HHH TT H TT H T H T HH

我们的数据有十次运行,七个尾部是九个头。

零假设是数据是随机的。另一种方法是它不是随机的。对于alpha等于0.05的显着性水平,我们通过查阅适当的表可以看到,当运行次数小于4或大于16时,我们拒绝零假设。由于我们的数据有十次运行,我们不能拒绝零假设H。

Normal Approximation

运行测试是确定序列是否可能是随机的有用工具。对于大型数据集,有时可以使用正态近似。这种正态近似要求我们使用每个类别中的元素数量,然后计算适当正态分布的均值和标准差。

科普_1

健康知识演讲稿