• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 英语学习 > 正文

    独立性检验的处理方法:独立性检验的方法

    时间:2019-04-24 03:14:19 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘 要:新的高中数学课程标准的建立,把原来在高中教材没有涉及到的问题都融入了高中的教学当中,如:算法与框图、茎叶图、还有回归分析和独立性检验,对于这些问题的处理上也是老师和学生关注的问题,作者就独立性检验一节的处理方式作以阐述,以起到抛砖引玉的作用.
      关键词:独立性检验;假设检验;临界值
      中图分类号:G632 文献标识码:A 文章编号:1002-7661(2012)12-178-02
      
      本文将就以下几个问题展开阐述:
      一、独立性检验的形成
      独立性检验的基本过程是根据客观实践情况和经验,提出原假设,选好统计量,进行抽样、试验、计算、检验,进行判断.也就是说,整个过程贯穿着通过实践提出假设理论,再通过实践进行检验.假设的过程其实就是类似与数学证明中的反证法,其基本步骤如下:
      假设: :两分类变量没有关系,用A、B表示两个分类变量,若 成立 事件A与事件B独立 .这单纯是从概率的角度衡量两个分类变量的是否有关.我们需要更进一步对相关程度进行检验,就是在假设 下,如果出现一个与 相矛盾的小概率事件,就可以推断 不成立,且该推断犯错误的概率不超过这个小概率.
      二、独立性检验的基本思想
      在新课程标准数学2-3第三章第二节对独立性检验进行了明确的阐述,课本首先通过对分类变量进行定义,分类变量也称属性变量或定性变量,它们的不同取值仅表示个体所属的类别,其取值是离散的.如性别变量,只能取男、女两个值,商品的等级变量只取一级、二级……,是否吸烟,宗教信仰,国籍等等都是分类变量.分类变量的均值和方差没有实际意义,所以不做研究.接着定义列联表:一般为两个或两个以上分类变量的汇总统计表.在我们的教材中仅限于两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为2×2列联表,如下:
      
      
      总计
      
      
      
      
      
      c
      
      总计
      
      
      在假设 成立的条件下,A表示 ,B表示 ,可以通过求分类变量 占总数与分类变量 占的总数的概率(用频率估计概率), 恰好为事件AB发生的频数; 和 恰好分别为事件A和B发生的频数.由于我们可以利用频率估计概率,所以在 成立的条件下应该有:
      
      , ,可得:
      .
      即: .
      因此, 越小,说明常上网与不及格之间的关系越弱,否则,关系越强.从这个角度这能说明两个变量间关系的强弱,而不能判断它们具体有多大程度上有关,在此基础上为了使不同样本的数据有一个统一而又合理的评判标准,统计学家们经过研究后构造了一个随机变量(卡方) = ,并且统计学家们通过实践还得到了如下的卡方临界值表:
      P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
      k0 0.455 0.708 1.323 2.072 2.706
      P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
      k0 3.841 5.024 6.635 7.879 10.828
      在表格中的数字与上述式子能够说明一个什么问题呢?上面的表格中的第一行是作为检验的犯错的上界(上界也是我们要找的
      那个小概率),下面的 是取值的临界值,接下来我们就从一个具体实例中做以分析:
      例 1为了考察高中生的性别与是否喜欢数学课程之间的关系,在我校学生中随机抽取300名学生,得到如下列联表:
      喜欢数学课程 不喜欢数学课程 总计
      男 37 85 122
      女 35 143 178
      总计 72 228 300
      由表中数据计算 的观测值.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?
      解:可以有95%以上的把握认为“性别与喜欢数学课程之间有关系”.
      = 4.514
      因此应该断定“性别与喜欢数学课程之间有关系”成立,并且这种判断结果出错的可能性约为5%,所以,约有95%的把握认为“性别与喜欢数学课程之间有关系”。
      这种利用随机变量 来确定是否能以一定的把握认为“两个分类变量之间有关系”的方法,称为两个分类变量的独立性检验。
      在上述题目做判断两分类变量是否有关时出现了“断定”一词,“断定”一词在独立性检验中的含义是指检验判断,“断定为A,B有关系”就是检验判断为A,B有关系,也就是拒绝A,B无关系,即拒绝原假设 (接受假设 的对立面)。“约有95%的把握”中“把握”一词在独立性检验中的含义是指不犯错误的可信度,“有95%的把握”就是有95%可信度(可能性)。换而言之,应该是在原假设 成立的条件下,检验判断接受原假设 犯错误的概率不超过5%,而不犯错误的概率超过95%。换句话说,就是在原假设 成立的条件下,不犯错误接受对立假设 错误的概率超过95%。对与求出的 的观测值 越大说明可信度越高,犯错误的概率就越小
      三、独立性检验的做题步骤
      通过以上的分析我们可以知道对于独立性检验问题如何去分析,接下来我们就要从实际操作中研究怎么去处理这部分问题。首先我们知道从2×2列联表的角度来说,我们对列联表的中概率的分析可以在直观上看出它们的概率关系,而这种直观判断不足之处在于不能给出推断“两个分类变量有关系”犯错概率,但是独立性检验就可以弥补这个不足.即首先直观上判断两分类变量是否有关系,然后独立性检验主要从是否有关和有多大的把握认为它们有关这两个方面来考查,这样以来就可以比较清晰的看出变量关系以及相关程度。那么这时候就需要借助随机变量 来求值,进而判断,即要推断“X与Y有关系”,可以通过频率估计概率进行直观判断,再按下面的步骤进行:
      1.根据实际需要确定容许推断“两个分类变量有关系”犯错概率的上界 ,然后查表确定临界值 ;
      2.根据2×2列联表与公式计算 的观测值K;
      3.如果 ,就可以推断“两个分类变量有关系”,这种推断犯错误的概率不超过 ;否则就犯错误的概率不超过 的前提下不能推断“两个分类变量有关系”,最后做出判断。
      例2在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?
      未感冒 感冒 总计
      使用血清 258 242 500
      未使用血清 216 284 500
      总计 474 526 1000
      分析:在使用该种血清的人中,有 的人患过感冒;在没有使用该种血清的人中,有 的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大。从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异。
      解:提出假设 :感冒与是否使用该种血清没有关系。由列联表中的数据,求得:
      
      ∵当 成立时, 的概率约为0.01,
      ∴我们有99%的把握认为:该种血清能起到预防感冒的作用。
      评注:首先提出假设检验的思想,根据公式计算出 的观测值,然后对比与临界值的大小关系,最后选择接受假设还是拒绝假设。
      利用独立性检验,能够帮助我们对日常生活中的实际问题做出合理的推断和预测。因此,在学习中通过统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题中的应用,以提高我们处理生活和工作中的某些问题的能力.另外,随着新课程标准在全国各地全面推行,对概率与统计知识的考查越来越偏重于对统计知识的考查力度,因此在这一方面我们要更加重视.

    推荐访问:独立性 检验 方法

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章