- · 《教育科学论坛》栏目设[05/28]
- · 《教育科学论坛》数据库[05/28]
- · 《教育科学论坛》收稿方[05/28]
- · 《教育科学论坛》投稿方[05/28]
- · 《教育科学论坛》征稿要[05/28]
- · 《教育科学论坛》刊物宗[05/28]
作为数学教育研究数据处理的方差
作者:网站采编关键词:
摘要:一、引言对于实证取向的数学教育研究来说,追求的是现象结果背后的原因,即以寻找因果关系为己任.而这种因果关系是能够用数据来说明,能从经验层面得到证明的.这种实证研究方
一、引言 对于实证取向的数学教育研究来说,追求的是现象结果背后的原因,即以寻找因果关系为己任.而这种因果关系是能够用数据来说明,能从经验层面得到证明的.这种实证研究方法还得到了心理学、社会学、管理学和经济学等众多学科的推崇.其中,统计方法在其中扮演了重要角色.对于教育科学及其他学科中的数据为什么能用统计方法处理,进而得到规律,是一个非常复杂的问题,需要做系列研究.本文是该系列研究中的一部分,主要阐明方差在处理数学教育研究数据时的原理及应用. 二、从误差的角度认识方差 实证取向的数学研究的第一步就是要对抽象的教育学概念,比如,数学素养等,进行操作化处理,得到经验层面的可测量的概念.然后,再根据所列的各项指标进行测量.在测量过程中,总会产生误差.误差是测量值与真实值之间的差异.真实值只是一个理论值,实际上得不到,只好用各种值来逼近它.例如,“多次测量取平均值”就是把测量值作为真实值的代表.我们把误差的平方,叫做平方误.对平方误取均值得到方差,是非常精彩的一笔,使得方差能够正交分解,具有鲜明且丰富的几何意义. 例如,把学生分组,分别按传统方法、翻转课堂的方法、探究式方法进行教学,现在要研究的问题是教学方法对教学质量的影响.实证取向的数学教育研究,首先要回答两个量之间是否相关,然后再看这两个量之间有无因果关系(即函数关系).因此,对这个问题而言,就要回答教学方法(这是分类控制变量)与教学质量(一般用学生成绩来衡量,这是定距观测变量)这两个变量是否相关,也就是如何求相关系数的问题. 设总体自变量共分为m类,每类共有nm个个体,n1+ n2+n3=n.如本例中,共有m=3类教学法,每类分别有n1= 50,n2=53,n3=64.对观测变量教学质量y进行了n次检测,也就是共有n个学生参加实验,教学质量由每个学生的成绩来衡量.当不知道教学质量y与分类控制变量教学方法x有关系时,对真实值的估计最好用平均值,就是“多次测量取平均值”,因为这时所产生的误差最小,这时,自然地形成了一个n维向量α=(y11-y,…,y1n1-y,y21-y,…,y2n2-y,…,ym1-y,…,ymnm-y);当知道教学质量y与自变量教学方法x有关系时,就会采用各组的平均值来估计真实值,而不会用总平均值来估计真实值,这时,自然地形成一个n维向量前后两次对真实值的估计是有区别的,这时,自然地形成一个n维向量注意到α=β+γ,可以证明β,γ的数量积为零,且两者相互独立.这时,由勾股定理就有,从而得到,D(α)=D(β)+ D(γ) (*). 测量值与真实值的误差总是一定的,即(*)式的左端是一个定值D(α);教学方法与教学质量越相关,表明单纯地用测量值的平均值来估计真实值,不如根据由与分类控制变量相关联的观测变量的平均值来估计真实值更好,这就说明越有必要引入分类控制量,D(γ)就应越大,D(γ)越大就表明作为真实值的代表,yi比y更好;此时D(β)就应越小,这说明即使假定y与x有关联之后,用yi来估计y还是有误差,这个误差是其他因素引起,称之为未被解释的误差或不明原因引起的误差,这个误差当然是越小越好,极端情况是零,这时说明把握了自变量就能把握因变量,就成了一种确定性的关系了.衡量教学质量与教学方法有无关联的标准是假定它们有关联之后,误差的改进程度,改进程度越高,拟合效果越好,根据这一朴素想法,就可以用来衡量回归直线拟合的好坏程度,这恰好等于cos2〈α,γ〉=r2. 记即TSS=RSS+BSS.从误差的来源来看,误差的源头可分为两类:一类是由不同的处理方法造成的,这是这种误差的来源,故称之为分类控制变量解释掉的误差,是组间误差,用BSS来衡量;一类是由各种随机因素造成,是未被解释掉的误差,是组内误差,用RSS来衡量.因,由TSS=RSS+BSS,变形有,此式的左边是一个满足F(m-1,n-m)分布的统计,F的值越大,r2也越大,说明两个量之间越有关联. 这事实上说明了方差分析的实质是分类变量与定距变量之间的相关性分析.这就是方差分析的基本思想:通过分析研究不同来源的误差对总误差的贡献大小,从而确定可控因素对研究结果影响力的大小.在观测变量总误差平方和中,如果组间误差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间误差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的. 在实际操作上,就用均方(误差平方和除以自由度)代替误差平方和以消除各组样本数不同的影响,方差分析就是用组间均方去除组内均方的商与1相比较,若F值接近1,则说明各组均值间的差异没有统计学意义,若F值远大于1,则说明各组均值间的差异有统计学意义,分类控制是有必要的(采用不同的教学法对教学质量是有影响的). 三、进一步的推广 上述误差正交分解的原理,还可进一步推广到多元方差分析和协方差分析问题. 1.多元方差分析问题 教学质量不但受教学方法(分类控制变量A),还受教师性格(分类控制变量B)的影响,如何研究不同教学方法和教师性格对教学质量的影响,就是一个多元方差分析问题.这时不但要分别考虑A、B对观测变量的影响,有时还要考虑A与B的交互作用对观测变量的影响.如某种性格的教师特别擅长于某种教学方法.如分类变量A的取值类型共有a类,分类变量B的取值类型共有b类,在不考虑存在实际干扰或交互作用的情况下,无须进行重复实验,只要得到a×b个观测值,便可以用方差分析方法判断分类控制变量分别对观测变量是否有影响.如果考虑实际干扰或交互作用,那么就要进行重复实验,要至少得到a×b×r(r≥2)个观测值,便可以用方差分析方法判断分类控制变量分别对观测变量是否有影响. 其步骤如下:(1)把误差进行正交分解,TSS=BSSA+ BSSB+IA×B+RSS;(2)确定误差衡量标准. 如果交互作用不显著,则IA×B+RSS可以合并为TRSS,以TRSS的均值作为标准衡量分类控制变量A和B对观测变量的影响程度. 如果交互作用显著的话,就要根据变量的类型确定衡量标准了.根据变量A和B的性质,选用不同的衡量标准.固定模型研究固定变量(不具有随机性的分类变量,如三种教学方法)对观测变量的影响,衡量标准是RSS的均值随机模型研究随机性分类变量对观测变量的影响,由于不能排除随机抽样误差,衡量标准是IA×B的均值混合模型研究随机变量和固定变量对观测变量的影响,检验固定变量的作用时,要考虎随机变量对其的影响,不能排除随机误差的影响,衡量标准是检验随机变量的作用时,衡量标准是 这里看起来有点复杂,其实不然,可以归结为一个模式根据不同的情形选用不同的分母. 2.协方差分析 教学质量不但受教学方法(分类控制变量A),还受教师性格(分类控制变量B)的影响,也受学生原来的学习基础、智力和兴趣(分类控制变量C)的影响,如何在排除C对教学质量影响的前提下,研究不同教学方法和教师性格对教学质量的影响,就是一个协方差分析问题.协方差分析将那些人为很难控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的作用,从而更加准确地对控制因素进行评价.观测变量的变动控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用等四个因素的影响.协方差分析沿承方差分析的基本思想,在分析观测变量的方差时,考虑了协变量的影响.以单因素协方差为例,TSS=RSS+BSS+Q控制变量.在扣除协变量的影响后,再分析控制变量的影响,检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方之比.如 四、教材寻根 统计是数据处理的学问,在实证取向数学教育研究中,应用数据处理的方法体现了研究方法的进步.然而,我们发现,很多研究者对其背后的原理是不大关注,以致影响了研究的信度和效度.关注概率统计的教学,提高数学教育研究者自身的素养是我们每个人必修的功夫之一. 对中学概率统计课程而言,我们可以在局部深度挖掘教材内涵,寻找贯通教材的核心概念.从以上可以看出,方差及其正交分解起到了关键作用.概率论中方差用来度量随机变量和其数学期望之间的偏离程度.统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数.这是方差的理论意义,然而只有探求其实际意义,把方差当作平方误时,方差与前后概念间的关联才会沟通起来.方差何时取最小值,是“多次测量取平均数”,确定线性回归方程的理据;[2]从误差的角度出发,线性相关系数的概念自然地产生了.然而,在现行的教材中,方差的地位并不突出,以致学生不能明白平均数的典型性、代表性,对线性回归方程的原理似懂非懂;相关系数一笔带过,学生看到繁冗的表达式就发悚.以方差为中心,凝聚了平均数、线性相关系数、线性回归方程!然而概率中的方差与统计中的方差其着眼点并不一样,这就要求教师站在寻求课程主线的角度,把前后知识融为一个整体. 对中学概率统计课程而言,我们可以在更大一点的范围内深度挖掘教材内涵,寻找前后教材的有机关联.方差的正交分解,涉及一系列知识和概念,有助于我们沟通数学知识不同分支间的关联.方差的正交分解,涉及向量的合成与正交分解,向量的几何意义;从表现形式上看,是勾股定理这一优美形式的推广,还可走得更远,可以看作是n维空间的正交分解;可以用方差的非负性,很好地证明基本不等式等.[3]随机性数学与确定性数学之间的桥梁如何架构,还需要我们提供更多的素材.方差,也就是平方误,还架起了数学与物理知识之间的桥梁.真是“曲径通幽处,禅房花木生”.这就要求教师具有大的课程观,不能囿于一隅. 关联,教材的重要特征之一,学习者不能不察.
文章来源:《教育科学论坛》 网址: http://www.jykxgw.cn/qikandaodu/2020/1214/1284.html