时间:2023-08-29 09:18:01
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇统计学的标准差,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
【关键词】 孕妇; 步行; 步态; 胸部; 骨盆; 生物力学
ABSTRACT: Objective To investigate the effects of pregnancy on the coordination of transverse pelvic and thoracic rotations during gait. Methods Gait of healthy pregnant women and nulligravidae was studied during treadmill walking at predetermined velocities. Comfortable walking velocity, amplitudes of pelvic and thoracic rotations, and their coordination were compared between the two groups. Results Comfortable walking velocity was significantly reduced. The rotational amplitudes of pelvis and thorax were somewhat reduced, with significantly smaller intrainpidual standard deviations. Also pelvisthorax Relative Fourier Phase was a little smaller; its intrainpidual standard deviation was significantly reduced at velocities ≥ 1.06 m/s. Conclusion The general pattern of gait kinematics in pregnant women is very similar to that of nulligravidae. Pregnant women experienced difficulties in realizing the harder antiphase pelvisthorax coordination that was required at higher walking velocities.
KEY WORDS: pregnant women; walking; gait; pelvis; thorax; biomechanics
长期以来,人们一直认为妊娠影响孕妇的步态运动。Foti等研究发现,孕妇步行时跖屈的动量减少,髋关节外展的动量及骨盆的倾斜度均增加,骨盆的倾斜度的改变存在较大的个体差异[1]。Nagy等报道孕妇最舒适的步行速度显著性降低,亦存在较大的个体差异[2]。但Foti等认为这种变化并无统计学意义,并发现怀孕对步长或步周期长无显著性影响[1]。上述研究显示,孕妇的步态发生改变,但研究结果并不一致。大约25%患有妊娠相关骨盆痛的孕妇和5%产后患者需要就诊治疗,重症患者常常出现步行障碍[3]。对正常孕妇运动协调的研究可作为今后研究妊娠相关骨盆痛的步态运动的基础。笔者研究怀孕对步行时水平面上骨盆和胸廓运动协调的影响,以期有助于从生物力学的角度进一步了解妊娠相关骨盆痛患者的步态运动。
1 对象与方法
1.1 对象 选取年龄20~45周岁的健康未孕妇女(对照组)和健康孕妇(孕妇组)作为观察对象。对照组13例,年龄中位数27岁(22~36岁),体质量中位数75 kg (45~95 kg),身高中位数172 cm(157~190 cm);孕妇组12例,年龄中位数32岁(30~38岁),体质量中位数76.5 kg(67.5~89 kg),身高中位数172 cm(162~180 cm)。
1.2 方法
1.2.1 仪器 步行仪(Biostar Giant,荷兰Almere Biometrico公司);三维运动捕捉系统(Optotrak,加拿大NDI公司)。
1.2.2 方法 受试者以不同速度在步行仪上行走。骨盆、胸廓和足部的运动由三维运动捕捉系统光学镜头拍摄记录。2组光学镜头位于受试者的身后。在受试者的胸背部第6胸椎棘突的位置和骶骨两髂后上棘之间各有一轻金属架,用尼龙束带将金属架固定其上,金属架上有3个可发红外光装置,构成一个刚体。为了捕获步行时足跟着地和足趾离地时的瞬间,在每侧足跟和第五跖趾关节处各安装一可发出红外线的装置。实验装置见图1[4]。实验开始时先让受试者在步行仪上行走3~5 min,接着步行速度从0.17 m/s每间隔1~2 min增加0.11 m/s,至1.72 m/s。步行过程中,测试受试者最舒适步行速度和最大步行速度。每个速度下的数据采集共30 s,抽样频率为100 Hz。
图1 测量步行时胸廓和骨盆运动的实验装置(略)
Fig 1 Experimental setup for measuring the thoracic and pelvic movements during walking
1.2.3 指标 胸廓和骨盆的刚体在空间的运动代表各自的三维运动。设定刚体x、y、z轴的正方向为人体解剖位的前、上、左方位。通过计算xy象限上的反正切角度得出骨盆和胸廓在水平面上旋转角度的时序。骨盆和胸廓的旋转运动幅度(rotational amplitude,RA)是从各自的运动时序上确定每一个步周期内最大与最小的角度差的绝对值。躯干的旋转运动时序是将骨盆运动时序与胸廓的运动时序相减而生成。在每一速度下对骨盆、胸廓和躯干的所有步周期的RA进行计算,取均值,分别确定为骨盆、胸廓和躯干的RA,并计算各自标准差。
应用快速离散傅立叶变换计算公式计算出每个运动时序的连续傅立叶相的时序。骨盆和胸廓的傅立叶相差时序是由胸廓的傅立叶相时序与骨盆的傅立叶相时序相减而产生。运用圆周统计学计算出骨盆和胸廓运动的傅立叶相差(relative fourier phase,RFP)及其个体内标准差。若RFP为0,表示同相协调运动;若RFP为180°,则表示反相协调运动。
1.3 统计学处理 应用SPSS 10.0软件,采用方差检验,P
2 结果
2.1 步行速度 正常孕妇的最舒适步行速度中位数1.06 m/s(0.72~1.28 )m/s,对照组为1.17 m/s(0.83~1.50)m/s,2组比较差别有统计学意义(P
2.2 骨盆和胸廓RA及其个体内标准差 骨盆RA先是随着步行速度的增加(0.94~1.06 m/s)而逐渐减小,然后随着步行速度的增加而逐渐增加(图2A)。孕妇组和对照组骨盆RA分别为(9.1±福建医科大学学报 2008年5月 第42卷第3期吴文华等:正常孕妇步行时骨盆与胸廓水平面的旋转运动3.5)°和(7.7±3.2)°,其速度效应差别有统计学意义(P
图2 对照组和孕妇组在不同步行速度下各部位的旋转运动幅度(略)
Fig 2 Rotational amplitudes of the pelvis, the thorax and the trunk during gait at different walking velocities of the control subjects and the healthy pregnant women
表1 各变量的速度效应和组别效应(略)
Tab 1 The effects of velocity and group on the variables(repeated measures ANOVAs)
胸廓RA基本维持稳定而变化不大直至步行速度增至0.8 m/s时,然后随着步行速度的递增而渐减少(图2B)。经方差检验,速度的效应差别有统计学意义(P
躯干RA是随着行步速度的增加而递增的(图2C),孕妇的躯干RA较对照组约小1°,其速度效应有统计学意义(P
2.3 RFP及其个体内标准差
图3 对照组和孕妇组在不同步行速度下的傅立叶相差及其个体内的标准差(略)
Fig 3 Relative fourier phase and its intrainpidual standard deviation between transverse pelvic and thoracic rotations at different walking velocities of the control subjects and the healthy pregnant women
2组RFP均随着速度的增加而增加(图3A),呈一条S形曲线,在速度为0.83,1.17 m/s的区域内最为陡峭。孕妇的RFP较对照组小7°。其步行速度效应有统计学的意义(P
孕妇的孕周数与RFP的个体内标准差相关系数为-0.68,差别有统计学意义(P
3 讨论
3.1 总体上孕妇的步态运动正常 在2组中,速度对RA、骨盆胸廓RFP及其个体内的标准差的影响相似(图2~3),由此得出结论,孕妇的步态运动从总体上讲是正常的。怀孕和行走本身就具有高度的相容性,从进化学的角度而言,这并不难理解[5]。尽管如此,孕妇的最舒适的步行速度明显的下降,RA变小,尤其是在最舒适的速度下骨盆和躯干RA的减少具有显著性差异。他们的个体内标准差减少,具有统计学意义。骨盆和胸廓RFP变小,在最舒适的速度下具有显著性差异,其个体内标准差变小,在快速行走的速度下(≥1.06 m/s),这种差别有统计学意义。孕周数与此个体内的标准差呈显著性负相关。孕妇必须适应怀孕的改变,比如体质量的增加。本研究揭示在孕妇身上发生了轻微但是连贯一致的运动学变化,这点与以往文献报道的有所不同[12]。
3.2 孕妇骨盆胸廓旋转运动的RFP 孕妇选择在低速下步行不能用节约能量的观点来解释,因为当步行速度低于(或高于)最舒适的速度时,须消耗更多的能量[5]。尽管如此,低速行走获得了更多时间来对微扰进行反应[6],这也许是孕妇由于额外的载荷或本体觉受干扰而选择低速行走的原因,目的是为了避免出现快速步行时的运动协调模式。
本研究表明,未怀孕妇女的最舒适步行速度出现在RFP的曲线上的平台起始段,而孕妇最舒适步行速度则是出现在曲线陡坡的半山腰处,此时2组间的RFP的差值为44°。当孕妇快速步行时,RFP值较高,但其变异性很小,这提示了对孕妇而言,完成大的RFP的步态是有困难的,这种现象同样发生在背着负荷的受试者、慢性下腰痛患者、妊娠相关骨盆痛产后的患者 [4,78]。出现较小RFP的步态运动可以由许多种不同的限制性因素造成,妊娠便是其中之一。
比较骨盆、胸廓和躯干旋转运动的个体内标准差,他们的平均值分别为1.25°,1.29°和0.66°。如果骨盆和胸廓的旋转运动的控制是相互独立的话;而实际上,它的值小得多。因此,骨盆和胸廓的旋转运动似乎是同时受到控制的,虽然躯干的旋转运动在快速行走的协调方面不是一个“必须的变量”[9],因为躯干的旋转缺乏时间维。显然,RFP是和时间变量有关,它也许是快速步行时的必须变量,以确保快速行走时骨盆的旋转运动必须被胸廓的反向旋转运动所平衡[10]。就孕妇的步态而言,快速行走时骨盆和胸廓的惯性冲量将会增加,这也许是孕妇无法实现大的RFP步态运动的原因。
3.3 孕妇步态运动的变异性 自从Bernstein引入了“探索变异性”以来,对运动的变异性研究渐渐兴起。运动的变异性常常被认为是具有功能性,才有可能有灵活性、适应性;然而变异性会消耗能量及增加损伤的可能性,因此变异性的功能性必须看是针对何种情形而言[1114]。
一个较为奇怪的现象是骨盆与胸廓间的RFP的个体内的变异的最大值在非常靠近最舒适步行速度的地方出现。Masani等人发现地面作用力的变异在最舒适步行速度时最小[15],也许在最舒适的速度下,身体重心的垂直运动是必须的变量,而在水平面上的骨盆和胸廓间的RFP在快速步行时则变成是必须的变量。撇开RFP的变异性是如何发挥作用的,在怀孕期间,尤其在怀孕晚期,RFP的变异性是如何在最舒适步行速度下增加并且在快速行走时减少有待于进一步研究。
笔者认为,正常孕妇的步态运动学特征与未怀孕的妇女相似。尽管如此,2组间存在着许多细微的差别。孕妇的最舒适步行速度较对照组显著性下降。骨盆、胸廓和躯干的RA较对照组小。他们的个体内的标准差则较对照组低。在最舒适步行速度下,骨盆和躯干的RA较对照组小。孕妇组的RFP较对照组小,在速度≥1.06 m/s,个体内的标准差呈显著性减少,尤其是在怀孕晚期表现更为明显。
【参考文献】
[1] Foti T,Davids J R,Bagley A. A biomechanical analysis of gait during pregnancy[J]. J Bone Joint Surg Am, 2000,82(5):625632.
[2] Nagy L E,King J C. Energy expenditure of pregnant women at rest or walking selfpaced[J]. Am J Clin Nutr, 1983,38(3):369376.
[3] Wu W H,Meijer O G,Uegaki K,et al. Pregnancyrelated pelvic girdle pain(PPP), I: Terminology, clinical presentation, and prevalence[J]. Eur Spine J, 2004,13(7):575589.
[4] Wu W,Meijer O G,Jutte P C,et al. Gait in patients with pregnancyrelated pain in the pelvis: An emphasis on the coordination of transverse pelvic and thoracic rotations[J]. Clin Biomech, 2002,17(910):678686.
[5] McNeill Alexander R. Energetics and optimization of human walking and running: the 2000 Raymond Pearl memorial lecture[J]. Am J Human Biol, 2002,14(5):641648.
[6] Maki B E,McIlroy W E. The role of limb movements in maintaining upright stance: the "changeinsupport" strategy[J]. Phys Ther, 1997,77(5):488507.
[7] LaFiandra M,Wagenaar R C,Holt K G,et al. How do load carriage and walking speed influence trunk coordination and stride parameters[J]. J Biomech, 2003,36(1):8795.
[8] Lamoth C J,Meijer O G,Wuisman P I,et al. Pelvisthorax coordination in the transverse plane during walking in persons with nonspecific low back pain[J]. Spine, 2002,27(4):E9299.
[9] Gel'fand I M,Tsetlin M L. The principle of nonlocal search in automatic optimization systems[J]. Soviet Physics Doklady, 1961,6(3):192194.
[10] Lamoth C J,Beek P J,Meijer O G. Pelvisthorax coordination in the transverse plane during gait[J]. Gait Posture, 2002,16(2):101114.
[11] Bongaardt R,Meijer O G. Bernstein's theory of movement behavior: historical development and contemporary relevance[J]. J Mot Behav, 2000,32(1):5771.
[12] Heiderscheit B C. Movement variability as a clinical measure for locomotion[J]. J Appl Biomech, 2000,16:419427.
[13] Van Die n J H,Dekkers J J,Groen V,et al. Withinsubject variability in low back load in a repetitively performed, mildly constrained lifting task[J]. Spine, 2001,26(16):17991804.
关键词:差异指标 差异指标的差异
在统计学及其相关课程中,有关差异指标(也称“差异量数”,下同)的教学要点有二:一是差异指标的意义,二是差异指标的种类。前者的要义可概括为:综合反映总体(或样本)各个单位标志值(或数据)的差异程度(或离中趋势、离散程度等);后者的意思是说:差异指标的种类很多,它们各有自己的计算方法和特点。如果我们把后者的这种不同种类、特点也统称做“差异”的话,那么,我们在统计学有关学科的教学过程中,就应把这两个方面的“差异”向学生交代清楚,使他们对差异指标之“差异”有个客观、全面而准确的理解,从而避免由于理解的片面性得出错误的判断。
一、正确理解不同差异指标之间的“差异”
人教版初中代数第三册教师教学用书第171页有这样一段话:“在表示各数据与其平均数的偏离程度时,……为什么对各数据与其平均数的差不取其绝对值,而要将它们平方,……这主要是因为在很多问题里含有绝对值的式子不便于计算,且在衡量一组数据波动大小的‘功能’上,方差更强些。例如有两组数据:
甲 9 ,1 ,0 ,-1 ,-9;
乙 6 ,4 ,0 ,-4 ,-6。
从直观上看,甲组数据的波动要比乙组数据大些,但它们的平均差都是4,区分不出其波动大小;而甲组数据的方差是32.8,乙组数据的方差是20.8,用方差可将它们的波动大小区别开来。”
其实,上述的一段描述是在告诉读者这样一个命题:在平均差与方差(或标准差)之间,方差(或标准差)表示数据波动大小的“功能”强于平均差。
这个命题是真的么?请看下一个例子:
在一次射击比赛中,甲乙两射手成绩记录如下:
甲 9 ,7 ,9 ,9 ,7 ,7 ,7 ,9;
乙 6 ,8 ,8 ,8 ,10 ,8 ,8 ,8 。
计算他们的平均值、标准差、平均差(如表)。
在这里,两组数据的标准差都是1,区分不出波动的大小,但甲组的平均差为1,乙组的平均差为0.5,我们通过平均差得出结论:甲组成绩的波动性大于乙组的波动性。于是又否定了上述命题,并得到一个于完全相反的命题(叙述从略)。
显然,若综合以上两种(假)命题,取其正确部分的话,那么,正确命题应为:
平均差和标准差(或方差),在所反映的总体(或样本)单位标志值的差异性上具有一致性,但区分这种差异大小的“功能”谁更强些不是绝对的。
那么,为什么人们在学习、应用统计学的多个差异指标时更多关注的是标准差呢?主要有以下理由:(1)反映灵敏,它随任何一个数据的变化而变化;(2)严密确定,一组数据的标准差有确定的值;(3)适合代数运算,可以将几个标准差合成一个总的标准差;(4)可以用样本数据推断总体差异量;(5)在计算其它统计量时,如差异系数、相关系数、标准分数等,都需要标准差。
二、正确理解同一个差异指标值在实际背景中释义的“差异”
某社出版的数学辅导教材有题如下:
甲乙两组学生各有8人,参加某门学科测试成绩如表2(100分制),请比较两组学生的成绩哪组较好一些。
因为 ,甲组成绩的波动比乙组小一些,所以甲组学生的成绩较好一些。
笔者认为:标准答案制订者是建立在“组内学生之间学习差异越小,成绩越好”的教育教学理念下做出这一判断及结论的。要知道,在新课程的教育教学理念下是允许学生与学生之间存在差异的,倡导学生在学习各门课程时敢于“冒尖”、创新,不搞“一刀切”,要让学生在全面发展的基础上培养个人特长。在评价学生时,以多元智能理论为依据,多方法、多手段、多尺度地考查学生的学习效果。基于此,我们又可以认为乙组的成绩好于甲组。甚至,倘若再对照例题中两组学生的其他指标情况,比如优秀率:若规定90分以上为优秀,则两组持平;若规定85分以上为优秀,则甲组为1/8,乙组为1/2,也会得出乙组的成绩好于甲组的结论。
总之,我们在用统计中差异指标的“差异”值解释现实现象并下结论时,不可以将教材中所说的变异指标值愈小,对相应平均指标的代表性愈好、稳定性也好,机械地认为“一切都好”,这是对差异指标本质的误解和歪曲。
选股不如选时,可见股市中买入股票时间的重要性。要选择买入股票的时间就必须准确的把握股票运行的趋势,尤其是中长期趋势。虽然目前常采用一些股票技术分析方法对股票的趋势进行预测,但是这些方法也常被庄家采用,通过人为的做市成为迷惑投资者的工具,从而导致有些技术分析方法的效果往往适得其反。因此,寻找一些新的分析方法往往会取得较好的效果。文章在高中数学知识的基础上引入加权标准差方法,通过对权值的修正达到预测股市趋势的目的。
股市技术分析方法概述
股市的分析通常包括基本面分析和技术分析方法。股市基本面分析是从国家的政策和公司的发展等角度对股市运行的趋势进行预测。投资者通过深入分析这些基本面信息能有效的把握股市的长期趋势并选择相应的股票买入和卖出。股市技术分析则是以股票价格作为主要研究对象,以预测股价波动趋势为主要目的,通过数学中的统计学理论计算和分析相应的股市评测指标并通过这些指标及其相应的图表对股市及其单个的股票价格趋势进行预测的方法。投资者通过对股市进行深入的技术分析能较有效的确定股市的趋势以及买入和卖出股票的时间。股市技术分析的重点是分析股票的价格、成交量、时间以及股票价格波动的幅度。 股市技术分析中最经典的方法是道氏理论、江恩理论和波浪理论。
道氏理论最初由美国人查尔斯・道提出,通过实践的检验它成为预测市场趋势的晴雨表,同时成为股市技术分析方法的开创者。道氏理论是一种技术理论,它是根据价格模式的研究,推测未来价格行为的一种方法。道氏理论认为股票会随市场的趋势同向变化以反映市场趋势和状况。股票的变化表现为三种趋势:主要趋势、中期趋势及短期趋势[1]。由于其对股市运用趋势良好的把握,因此,今天道氏理论仍然运用在股市分析中。道氏理论由于认为对数据的统计与前期数据存在较大的偏差才能对趋势的变化进行确定,因而其预测的结果存在滞后性。
江恩理论最初由投资大师威廉・江恩提出,它通过对数学、几何学、宗教、天文学的综合运用,建立起独特分析方法和测市理论并结合其在股票和期货市场上的骄人成绩和宝贵经验总结而来。江恩理论主要包括江恩时间法则,江恩价格法则和江恩线等。江恩理论认为股票、期货市场里也存在着宇宙中的自然规则,市场的价格运行趋势不是杂乱的,而是可通过数学方法预测的。它的实质就是在看似无序的市场中建立严格的交易秩序,并以此来发现何时价格会发生回调和将回调到什么价位[2]。
美国证券分析家拉尔夫・.纳尔逊・.艾略特通过对股市指标描述的技术图形的分析发现股市存在13种形态和波浪,并认为其在股市上会重复出现,以此为依据通过技术图形中波浪数量和结构的研究实现对股市运行趋势的预测。他认为股市运行的过程呈现一种周期性的变化,每一周期包含5个上升浪和3个下跌浪。艾略特波浪理论认为股市运行的周期有长短之分,长的达到上百年,短的仅仅以小时计,同时其将股市运行的周期按时间长短分为九大类,九大类结构中不论周期的长短每一周期均由8个波浪构成。
目前的股市技术分析方法被大多数投资者采用,成为买入和卖出股票的重要参考依据。但一旦大多数投资者都采用这些相同的方法时,结果往往适得其反。并且机构投资者往往通过这些技术分析方法逆向操作,迷惑和欺骗投资者。因此,如果避开这些传统的方法分析股市的趋势效果往往更好。
标准差
标准差是整个测量数据标准值与其平均数离差平方的算术平均数的平方根。它反映的是测量的数据中偏离平均值的个体多少的离散程度。标准差越大说明数据偏离平均值越多。标准差越大也可以认为数据越不稳定。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接均值。
基于标准差的股市趋势分析
标准差表示的是数据集中的个体偏离标准差的多少,标准差越大说明偏离平均值的数据越多。当股市发生趋势性变化时,将有越来越多的指标所代表的数据偏离原来数据集合的平均值,因此,采用标准差能对股市趋势进行预测。在采用标准差预测股市趋势前有两个问题要解决。首先,股市每一天的指标数据对预测股市的贡献是不一样的,越是近期的指标数据越能代表当时股市的趋势。其次,指标数据尤其是股票的价格包括每天的最高价,最低价,开盘价和收盘价庄家是可以操纵的,如果直接拿来分析结果往往会存在较大的误差。与股价相比成交量往往更接近真实的情况,因此要结合成交量来分析股价。第一个问题可以对指标数据施以权重来解决,根据指标数据不同的时间给予不同的权重,越是近期的数据权重越大,从而能对趋势的预测有指引作用。股市中的各种价格常常带有欺骗性,因此可以把成交量作为权重计算一个带有权重的价格,为更加真实的反映实际情况,每天成交量的计算时间不可太长,如可取10分钟,15分钟,30分钟等。
采用标准差的股市趋势分析方法具体步骤如下:
(1)设10分钟内的某股票成交的最高价为 ,成交的最低价为 ,则认为这10分钟内股票的价格为 。
设这1 0分钟内的该股票成交量 为,则这10分钟内该股票的价格为
(2)设该股票全天成交量为M,以10分钟为一个时间段全天的交易分为p个时间段,该股票全天的价格为 ,则
(3)对N天的股票价格进行分析,设每天股票价格的权重为 ,越是近期的价格权重的值越大,N天的股票平均价格为μ,则该股票的标准差为σ
。
(4)对股市中股票的标准差进行分析,确定标准差σ的阈值,当标准差σ超过阈值时可确定股票的趋势正发生变化。
实验分析
为确定本方法的有效性,本文采用了深万科股票作为研究对象,时间区间为2015年11月至2016年8月,下图1为深万科的股价走势,图2为万科股票日标准差。
从图2看出当股价日标准差数值发生突变时对应的股价这时刚好发生趋势性改变,两者的变化是同步的,没有滞后效应,因此,采用标准差的方法预测股价的走势具有可行性。
1.考试成绩总体情况本次参加考试的学生共87人,其中最高分96分,最低分48分,平均分75.93分,标准差为10.47,不及格7人,及格率仅为91.95%。
2.改革班与传统教学班考试成绩比较改革班参加考试的学生44人,其中最高分96分,最低分56分,平均分为76.86分,标准差为10.02,不及格2人,及格率为95.45%;传统教学班参加考试的学生43人,其中最高分93分,最低分48分,平均分为74.98分,标准差为10.95,不及格5人,不及格率为88.37%。改革班与传统教学班平均分和及格率差别无统计学意义(t=0.839,p=0.404;P=0.266)(见下表)。客观题改革班平均分为49.8分,传统教学班为49.4分(t=0.274,p=0.785);主观题改革班平均分为27.1分,传统教学班为25.6分(t=1.35,p=0.181)。以客观题为自变量x、主观题为应变量y,进行相关分析,得r=0.635,P=0.000。
3.改革班与传统教学班分数段及优良率比较教学改革班44人,优良(≧80分)人数为18人,优良率为40.9%;传统教学班43人,优良(≧80分)人数为15人,优良率为34.9%。
二、讨论
为了让课堂教学模式改革班的学生积极参与课堂活动,我们在教学中运用了研讨法教学、合作学习、以问题为基础的教学方法及指导自学等方式为学生提供探究型学习环境,引导学生主动学习,让学生在教师教学之前,学习教学内容,完成教师布置的任务。医学统计学一直是学生难学、教师难教的课程。计算机技术的快速发展为统计学的教学和应用提供了良好的平台,在教学课时不变的情况下,增加了SPSS软件实习的内容。
改革班班级平均分76.86分,传统班74.98分;改革班标准差10.02分,传统班10.95分;改革班及格率95.45%,传统班88.37%;改革班优良率40.9%,传统班34.9%。在班级平均分、及格率及优良率上改革班均高于传统教学班。主观题得分改革班(27.1分)高于传统班(25.6分);对客观题和主观题进行相关分析,得r=0.635(P=0.000),说明扎实的基础知识有利于促进学生的综合应用、分析和评价能力。
学生考试成绩说明学生是可以接受教学改革的方法,同时说明学生的潜力是巨大的,学生有能力完成教师布置的各项任务。但改革中也存在一些问题,如在案例教学中,课堂上直接进入案例讨论,导致教学内容的系统性较差。
1考试成绩的分布形态(规律)
保证考试质量是数学活动中不容忽视的重要组成部分。如何提高考试质量,不仅应在试前对试卷质量进行预测分析,更应结合试后考试成绩分析作出最终评价。用学生的考试成绩可以定量对命题质量进行评价与分析。观察统计学生考试成绩的直方图,其分布大致可分为5种情形:(1)单峰且对称、单峰大体对称;(2)单峰但峰值向左移;(3)单峰但峰值向右移;(4)双峰或多峰;(5)大体上可以一个平台型为代表等等。如果把这5种情形的直方图外廓线描出,则大致为如图所示几种情形的曲线。
2学生成绩正态分布曲线分析
根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩应接近正态分布。也就是说,当学生的成绩接近于正态分布时,则说明此次考试基本达到了教学要求。判断成绩是否接近正态分布,最直观,最有效的方法是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。当然,学生成绩呈现正态分布是理想化状态。考试成绩完全呈正态分布有一定的困难,也不现实。但我们要以正态分布为标准模式,加以对比,找出不足。
利用教育统计学研究发现,对于难度适中、客观有效的考试成绩一般都符合正态分布,且平均分在75分左右,标准差在9 ― 5之间。因此,我们有理由使用各种高级统计方法处理考试分数,以挖掘更多的教育信息。考试成绩是考生水平的反映,同时考试成绩分布是否正态分布反映了命题质量。根据正态分布曲线呈现的形态,可以进行考题相对难度分析。
平均成绩的差异引起曲线的水平位置变化,平均成绩偏低,如低于65分说明试卷难度较大;而偏高在90分以上说明试卷难度太小。若学生成绩分布属附图(1)所示的形态,这表明试卷命题的质量是比较好的.这里又有两种情形:在标准差不变的情况下随着平均分数的增加曲线向右移说明考生答题逐渐轻松;相反,随着平均分数的减小说明考题逐渐变难,学生成绩逐渐降低。在学生和教师工作正常情况下,题目越容易曲线越向右移。在平均分不变的情况下,标准差较小如低于6,成绩分布较集中,正态分布曲线呈陡峭型状态说明试卷区分度太小,表示中等难度试题所占比重太大;标准差较大如大于9,成绩分布较平坦,试卷区分度太大,则表示中等难度试题偏少。
若学生成绩分布属附图(2)所示形态, 即负偏态分布说明难度较大的试题比例偏高,表明试卷题目偏难;若学生成绩分布属附图(3)所示的形态, 即正偏态分布说明难度较小的试题比例偏重,则表明试卷题目偏易。若学生成绩分布属附图(4)或附图(5)等所示的形态,则表明试卷的命题质量不好,随意性较强,这样的试卷成绩不能很好地测量出学生对所学知识掌握情况。
3正态分布应用的结论
考题相对难度是指考题从整体上讲相对考生其难易程度的合理性,用学生成绩的平均分数衡量考题相对难度应是合理、可行的。对于高校结业类型的考试,经统计平均分数在77分附近时,考题相对难度是适中的。通过确定恰当的偏离度等级标准,对试卷做出试题难度相对学生①考题合理、②考题稍偏易或稍偏难、③考题较易或较难、④考题过易或过难、⑤考题难度不合理的5个等级判断。
综上所述,考试成绩符合正态分布是说明考题命题合理的条件,也是衡量考试质量的一个客观标准。考试的重要功能之一是信息反馈, 考试分数的分布形态里蕴含着丰富的教学信息。对考试分数的统计处理可以得出大量有价值的教学信息,据以评价教学、改进教学和进行教学研究。进一步分析发现,正态性较弱的课程有这样一些特点:考试分数出现了“极值”(特小值),或者是中间分数段分数的频数太小,或者是尾端频数略高。所以根据正态分布曲线呈现的状态,可以评价试卷的难易程度,为评价试卷命题质量提供数据资料。进而调整教学进度,改进教学方法。
【关键词】统计学原理;应用
一、《统计学原理》简介
《统计学原理》是一门集搜集、整理和分析统计数据于一身的方法论科学,它主要用来研究数据的内在数量的规律性。进行统计分析的基础是获得统计的数据,而数据的收集与分析之间有一个必不可少的环节就是对统计数据的整理,统计学的核心内容就是统计数据的分析。
《统计学原理》的基础是统计学科在各个领域中的普遍应用,它的出发点是要解决实际的问题,统计方法论的实际效用是它的侧重点,把定量分析与定性分析有机的结合起来。它把理论和实践相联系,这样对学生在实际工作中的实际操作能力有促进作用。
《统计学原理》主要包括:统计学的研究对象和方法、统计学的基本范畴、统计调查的意义、统计调查的方法、统计整理的内容、统计分组、统计分布、统计表、总量指标、相对指标、变异指标、综合指标的应用、样本和总体、抽样估计的方法、假设检验方法、相关图表和相关系数、回归分析、综合指数和平均指数、指数数列等等。
二、《统计学原理》与计算机科学相结合的必然趋势
在科技高速发展的现今社会,信息化是主要的趋势,自然而然信息化的需求也就越来越突出,对于人们来说,通常都要对大量的数据进行收集,并且还要对所收集的数据进行仔细的分析,分析过后还要对一些有价值的数据进行提取,提取过后再做出正确的决策。《统计学原理》就是一门对怎样合理的进行数据收集、整理以及分析并进行研究的学科,在人们制定一些决策时,都要把它作为主要的依据。那么,对于现代统计方法来说,它和现代信息处理技术是分不开的,随着计算机运行能力的不断提高,对于大规模统计调查的数据的处理来说,就会显得更加的精确以及方便快捷。所以,《统计学原理》越来越不可能脱离计算机技术,当然,计算机技术的应用的深入,也同样不能离开《统计学原理》的发展以及完善。对计算机技术进行充分利用,并通过计算机软件将统计方法中比较复杂的计算构成进行简便化,统计输出的结果就一目了然了,这样,统计方法的普及就会显得非常容易了。所以,在对这门学科进行学习时,不但要把统计方法学好,还要会对商品化统计软件进行充分的利用,对计算机信息系统开发的一些基本思想以及计算机基本程序的设计要进行掌握,除此之外,还要学会通过编程来把具体单位的统计模型进行实现,从而把统计决策支持系统建立起来。
总的来说,把《统计学原理》和计算机以及信息相结合起来这是一个时展的产物,是一个必然的趋势。只有正确的把《统计学原理》与计算机有机结合起来,才能使统计摆脱传统的复杂计算,从而变得越来越简便,越来越科学化。
三、《统计学原理》在教学过程中的应用--以相关系数的计算为例
(一)利用基本公式计算相关系数促进理解推导过程
对于相关系数的基本公式来说,就是要把方差标准化消除具体单位,从而转化为统一量纲的相对数,这样,对不同单位的资料进行对比就方便了许多。在利用基本公式计算相关系数时,需要对两个变量的标准分进行计算,手工计算繁琐费事,在excel中可以轻松实现。
那么,在Excel中能够实现数据标准化的就是STANDARDIZE函数,它是返回平均值是mean,标准差是standard-dev的分布的正态化数值,计算标准分是以平均数和标准差为基础的。对于STANDARDIZE函数来说,它需要对平均数和标准差进行输入,可以利用AVERAGE函数来对平均数进行求解,求标准差是用STDEVP来实现的。下面以某省近几年的城镇居民家庭可支配收入和消费性支出为例,来对操作过程进行演示。在Excel表格中点B10单元格,输入AVERAGE(B3:B9),这样就求出了可支配收入的平均数为9966。点B11,输入STDEVP(B3:B9),这样就求出了标准差为2404。选择与原始数据同样数目的单元格(D3:D9),用STANDARDIZE函数,根据具体要求对参数进行输入,x输入(B3:B9),mean参数就是要求输入平均数,直接点击B10引用即可,standar_dev参数是要求输入标准差,则点击B11进行引用。按F2进行数组操作,然后按shift+ctrl+enter,就对可支配收入进行了标准化,数据显示在(D3:D9)。对消费性支出做同样的操作,在(E3:E9)输出标准化数据。对两个变量进行标准化后,需要计算两个变量标准分的乘积。选择F3单元格,输入“=D3*E3”,点击回车键就得到了第一个乘积,然后下拉单元格并进行复制,就在(F3:F9)得到了所有的乘积。最后对这些乘积的平均数进行计算,选择F10,利用AVERAGE函数求出平均数为0.999615,这个就是遵循基本公式,按照步骤求出的积差相关系数r。
按照上面的这些步骤对相关系数进行求解后,为保险起见,最好利用excel中的其他方法再次计算相关系数,是各种方法进行相互的验证,这样也方便对各种计算公式的推导过程进行理解。可以直接在工具菜单下的数据分析功能中选择相关系数项进行计算,这种方法也就是大多数统计实验课程采用的方法。excel中的correl函数是直接利用计算相关系数,而与correl函数不同的是,pearson函数直接用简捷公式求相关系数。这三种计算方法与上面利用基本公式的计算出的结果是相同的。
在利用实际数据计算相关系数之前,要先让学生对经济学中消费和收入的相关理论进行回顾;计算后再加以总结,宏观经济学认为消费支出与可支配收入存在函数关系,上面的计算的相关系数近似等于1,这就说明了两者存在线形相关的密切程度是十分大的,也就是对这一理论的成立进行了证明。这一步骤有助于引导学生利用统计学验证经济理论,也对统计学的实用性进行了充分的证明。
(二)验证回归直线斜率与相关系数的关系促进理解几何意义
对可支配收入和消费性支出两个变量的原始数据进行标准化,这样就得到两组消除了量纲的数据,那么根据这两组数据来画出最优拟合直线,那么,表示相关系数的就是直线的斜率,这也就是相关系数的几何意义。回归直线可以按照最小二乘法,通过原始数据来得出,直线斜率b就表示了消费性支出随支配性支出的变化程度。相关系数r作为标准化数据的斜率,只要乘以一个数字就可以还原为原始数据的斜率b。我们同样可以用excel函数SLOPE来对两个斜率进行求解,然后加以验证。对于上面的计算,我们还可以继续,就是点击G3,输入函数SLOPE(E3:E9,D3:D9),得到标准化数据的斜率0.999615,这得到的就是相关系数。点击G4,输入函数SLOPE(C3:C9,B3:B9),得到原始数据的斜率0.617952,此斜率表示可支配性收入每增加一元则消费性支出就增加0.62元。在G5输入“=C11/B11”,得到的数值0.61819。可以在G7单元格输入“=G3*G5”验证b和r之间的推算关系是成立的。
四、结语
总之,学习《统计学原理》不单单能使人们的思维方式从主观向客观进行改变,而且对于提高人的综合分析能力也有十分重要的帮助,并且具体行为也能变得客观正确。所以,对于人们来说,学好这门课程是十分重要的,只有学好了这门课程,才能在众多领域进行更好更正确的应用。
参考文献
[1]高敏雪.经济社会统计[J].中国人民大学出版社,2005
【中图分类号】 R 179 G 478.2
【文章编号】 1000-9817(2008)09-0853-03
【关键词】 体质;身高;体重;肺活量;学生
自20世纪90年代中期以来,随着农村劳动力向城市的流动,流动儿童即第二代移民的教育问题日益成为人们关注的焦点。2003年由国务院妇女儿童工作委员会办公室主持完成的《让我们共享阳光――中国九城市流动儿童状况调查研究报告》[1]指出,在2000年我国的1亿多流动人口中,18周岁以下的儿童少年占19.37%,即应该在2 000万人左右。2003年西安市义务教育阶段中流动人口子女中的青少年至少有2万人[2]。本文针对西安市7~12岁流动儿童和常住人口小学生的体质状况进行了分析,旨在发现2个群体间体质的差异。
1 对象与方法
1.1 对象 城市流动人口小学生界定为随父母或其他监护人(均为普通外来农民工)在流入地居住满1 a以上,且正常入学的适龄小学生。样本来源于西安市雁塔区燎原小学、大雁塔小学、西安电子科技大学附小、莲湖区土门小学、灞桥区水泥厂小学5所学校。采用整群抽样的方法,在5所学校不同的年级按奇数班随机抽取城市常住人口和流动人口小学生各300名,其中各群体男生和女生分别为150名。学生年龄为7~12岁。
1.2 方法 参照2002年教育部和国家体育总局颁发的《学生体质健康标准(试行方案)实施办法》测试。身体形态指标为身高、体重、维尔维克指数、BMI、机能指标为肺活量;运动素质测试指标为立位体前屈、50 m跑、立定跳远、50 m×8折返跑(五六年级)、斜身引体(男)、仰卧起坐(女)。测试时间为2006年6月。
2 结果
2.1 2组小学生身体形态和生理功能对比分析 见表1,2。
由表1,2可见,在各个年龄段城市常住人口的身高均高于流动人口。对于2个群体来讲,随着年龄的增长,身高的标准差总的趋势在增大,说明研究对象年龄越大,个体间的身高越发显得参差不齐。体重指标显现出的规律基本同身高指标。但值得一提的是,除7岁男孩这一年龄组以外,7~12岁各个年龄组常住人口男女小学生体重指标值的标准差都高于城市流动人口小学生,而且随年龄的增大,标准差的值也在加大,其中男孩在12岁、女孩在11岁的值最高。胸围指标在7~12岁各个年龄组、城市常住人口小学生的指标值及标准差均高于流动人口小学生,其中男、女生均在10,11岁2个年龄组和女孩在12岁时胸围的差异具有统计学意义(P值均<0.01)。常住人口和流动人口男女小学生的肺活量在各个年龄组前者高于后者。男孩在11,12岁,女孩在10,11岁年龄组2个群体间肺活量的差异具有统计学意义(P值均<0.05)。维尔维克指数各个年龄组常住人口均优于流动人口小学生,其中11,12岁男孩,11,12岁女孩两者间的差异有统计学意义(P值均<0.01)。BMI在各个年龄组,常住人口值均优于流动人口,其中10岁男、女生两者间的差异均有统计学意义(P值均<0.05),11,12岁两者间的差异均有统计学意义(P值均<0.01)。
2.2 2组小学生运动素质对比分析 男孩在10,12岁,女孩在11,12岁年龄组立位体前屈2群体间的差异有统计学意义(P值均<0.05)。女生除12岁年龄组外,2个群体间50 m跑和立定跳远成绩差异均无统计学意义(P值均>0.05)。男生的50 m跑成绩在10~12岁间的差异有统计学意义(P值均<0.01)。立定跳远成绩男生在11,12岁间的差异有统计学意义(P值均<0.05)。50 m×8折返跑指标男女小学生在11,12岁2个年龄组,流动人口小学生的指标值优于常住人口,且标准差值显示其成绩比常住人口整齐。常住人口男孩在11岁时、女孩在12岁时的耐力素质分化最为严重,且与流动人口成绩间的差异有统计学意义(P值均<0.05)。从整体来看,常住人口小学生的斜身引体和仰卧起坐指标值在各个年龄组都优于流动人口,男生在8,11,12年龄组的差异有统计学意义(P值均<0.05)。女生的仰卧起坐指标总体状况仍然是常住人口小学生的指标值在各个年龄组均优于流动人口,但差异无统计学意义,而且在12岁年龄组这一指标值出现了高标准差值,提示在这一年龄组小学女生的腰腹力量出现了较大的两极分化。见表3,4。
3 讨论
3.1 身体形态和生理功能 身高:城市常住人口和流动人口小学男女生在各个年龄组都显示出前者的身高高于后者的趋势,在9,10,11,12岁4个年龄组上身高的差异有统计学意义,女生在10,11,12岁3个年龄组上身高的差异有统计学意义,年龄越大,个体间身高的差异越大。体重:男孩在11,12岁2个年龄组2个群体间体重的差异有统计学意义,而女孩在10,11,12岁3个年龄组2个群体间体重的差异有统计学意义。胸围:从7~12岁各个年龄组,城市常住人口小学生的指标值均高于流动人口,且流动人口胸围指标的标准差值在各个年龄组均小于常住人口。肺活量:在各个年龄组常住人口小学男女生的值高于流动人口。维尔维克指数:各个年龄组常住人口均优于流动人口小学生,其中男孩在11岁时两者间的差异具有统计学意义;男孩在12岁,女孩在11,12岁时两者间的差异有统计学意义。BMI指数各个年龄组常住人口均优于流动人口小学生,其中男女孩均在10岁时两者间的差异有统计学意义,在11,12岁时两者间的差异有统计学意义。
3.2 运动素质 立位体前屈:男孩在10,12岁,女孩在11,12岁年龄组上2个群体间的差异有统计学意义。50 m跑和立定跳远:整体上常住人口成绩优于流动人口,女生除了12岁年龄组外,在其他年龄组两群体间的50 m跑和立定跳远成绩的差异无统计学意义,男生50 m跑在10岁间的成绩差异有统计学意义,在11,12岁间的差异有统计学意义,立定跳远成绩男生在11,12岁间的差异有统计学意义。50 m×8折返跑:男女小学生在11,12岁2个年龄组测试的结果均显示流动人口小学生的指标值优于对方,女孩在12岁时的耐力素质分化最为严重,且两者成绩间的差异有统计学意义。斜身引体和仰卧起坐:整体上常住人口男女小学生的各自指标值在各个年龄组都优于流动人口,女孩在12岁年龄组腰腹力量出现了较大的两极分化。
本次调查结果表明,西安市流动人口小学生在多数体质指标上较常住人口差,但耐力素质整体优于对方。有关部门应针对不同群体的特点,采取有针对性的措施,进一步改善饮食结构,加强体育锻炼,使流动人口和常住人口小学生的体质均能得以改善,健康成长。
4 参考文献
[1] 张黎明,赵顺义.中国九城市流动儿童状况调查研究报告. 北京:国务院妇女儿童工作委员会办公室,2003:6,134.
关键词: 原始分 标准分 意义 作用 考试成绩评价
一、引言
考试是学校教育的一个极为重要的组成部分,是检查教学质量、评价教师教学水平、检验学生知识掌握及能力结构的主要环节。过去评价学生成绩时,常常使用原始分数,如认为语文得90分的学生语文学得好,而外语得70分的学生则外语能力较低;再有,同一名学生期末数学得80分,语文得65分,于是认为该生是学理科的材料,文科不好。这些认识是不够科学的,因为试题的难易程度是决定学生分数的主要因素,题目难,原始分数就偏低;题目容易,原始分数就偏高,从而导致了原始分数之间的不可比性。试题还受区分度大小的影响,因而造成考试的内容不同质、不等效、不可加。由于考试分数或原始分数没有绝对的零点,也没有统一的单位,因而不能将一个学生前后多次考试的成绩进行比较,不能对不同科目的成绩进行比较,难以判断学生成绩的变化趋势。因此,原始分数得到的信息不够准确,不科学,用原始分来评价学生的成绩缺失公正性和合理性。采用标准分数对考试成绩进行分析,就可以克服以上缺点,因此,用标准分比用原始分数评价学生成绩更科学、更合理和公正。
二、标准分的定义及计算方法
标准分是由均数和标准差规定的相对地位量。它是统计学中最重要、用途最广的统计量,标准分的定义为:以标准差为单位标定某一分数离开团体均数的距离。公式为:
z==
式中X为某一原始分数,为N个原始分数的平均数,x-是离均差,即某一分数离开均数的差数,S为标准差,Z即为标准分数,因此标准分数常称为Z分数。Z分数有正值和负值。当Z为正数时,则X>;当Z为负数时,则X<;当Z=0时,则X=。Z分数的绝对值|Z|,表示某分数与在此分布上的平均数的距离,|Z|越大,表示某分数离开均数的位置越远。计算机(利用Excel表)可以方便地将原始分转换成标准分。
三、标准分的意义
标准分是一种具有相等单位的量数。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。其意义在于:
1.标准分的分布与原始数据的分布相同。
2.各科标准分的单位是绝对等价的。无论各科的平均分、标准差怎样不同,一经转换成标准分,就形成以平均数为0、标准差为1的统一的、固定不变的标准形式。
3.标准分数值的大小、正负,反映某一考分在全体中所处的位置,它是相对分数。
4.当总体均服从同一分布时,总体的标准分之间具有可比性。
5.用标准分表示的样本间可以进行算术运算。
因此,标准分在考试成绩评价中具有重要作用。
四、标准分的作用
标准分在考试成绩评估中的用途很多,一是能够明确各个分数在总体中的位置;二是能客观地比较不同学生不同学科的总成绩及其优劣;三是可以比较某学生不同学科、与阶段的考试成绩,正确评价其学习的发展。
(一)能明确各个分数在总体中的位置。
标准分是按正态分布原理而建立的分数制度,其主要特点是:分数不但可以反映考生的水平高低,而且可以直接反映出该分数在全体考生中的位置。
依据Z标准分数的意义,Z分数为0的原始成绩是全班的平均分。Z分数大于0的原始成绩高于全班的平均分;Z分数小于0的原始成绩则低于全班的平均分。也就是说,标准分数值的大小、正负,反映某一考分在全体中所处的位置。以表1为例。
表1是某高校10级商英2班第一学期外语三科期末考试的成绩统计。表1中学生01的泛读得分为34,其泛读标准分为-1.690,这表明学生01所得的泛读分数低于全体考生平均数1.690个标准差,在总体的位置靠后;学生02的泛读得分为65,泛读标准分为0.158,这表明学生02的泛读分数高于全体考生平均数0.158个标准差,在总体的位置则靠前。
再如,学生32的精读和泛读的原始分数都是73分,这个分数是高还是低?该学生在全体考生中的位置靠前还是靠后?单从原始分数看不出来,因为没有一个稳定的参照点。若把原始分数转换成标准分后,该学生在全体考生中的位置则一目了然:该生精读原始分数为73分,标准分为1.211,高于全体考生平均数,原始分数73分应算较高的成绩了;而泛读的标准分为0.635,接近全体考生平均数,原始分数73分则只算中等成绩,由此可见,原始分数很难准确说明分数所反映的考生实际水平,也不能确定分数在群体中的位置。而标准分则可以直接反映出该分数在全体考生中的位置。|Z|越大,表示某分数离开均数的位置越远。
(二)能客观地比较不同学生不同学科的总成绩及其优劣。
从表1可以看到,若按原始分累计总分,学生09、学生10和学生22的总分都是140,三者学习成绩处于并列的位置,没有优劣或高低之分;但将原始分数转换成标准分数后,以Z值的总和相比较,学生09的Z总为-1.013,学生10的为-1.189,学生22的为-0.777,则可以看出学生22的成绩要比学生09的高,而学生09的成绩又比学生10的要高。从“Z总”这一栏,我们可以明确地看到学生22、学生09和学生10在班级成绩中的排名分别为第26、第29和第31。三者原始总分相等,没法比较,但按标准分来分析,他们这几科的总成绩却有高低之分。
从表1还可以看到,学生07的总分为189,学生28的总分为195,以三科的总分来判定成绩的优劣,学生28排第8名,学生07则排第12名。表面上学生28的成绩似乎要比学生07的成绩好。但是,按原始总分计算只考虑了分值,并没有考虑各分值在各自总体(即各自科目的分数总体)中的价值,这种考虑是欠妥的。分数的价值应用最佳地位量标准分数来表示。那么将学生07和学生28的三科考分都换成Z值(见表1),以Z值的总和相比较,Z为1.748,而Z为1.433,则可看出学生07的分数价值要比学生28的高。学生07的成绩优于学生28,两者的排名恰与原始分数的排名截然相反。若要推荐优秀生,推荐学生07更为合理。其道理从学生08的泛读为84分,其Z值为1.291,与学生30的听力为84分,其Z值为1.775的比较分析可以显示出来。从原始分数看,同是84分,但由于分别位于不同科目的不同分布中,其价值是不同的。受试题难度和区分度大小的影响,导致了泛读的“1分”与听力的“1分”不等值,便造成了这样的现象:同样是84分的两科成绩却反映出两种高低不同的水平。
上述例子表明,使用原始分数难以对学生的水平进行科学的比较。将原始分数相加得到总分的方法,就好比将100元人民币加上100元港币再加上100元美元得到300元一样,是不能反映三种货币在总额中的真实价值的。由此可见,原始分数不具有简单的可加性,几门原始成绩的总分并不能说明个体在团体中的实际排名,不能确切评价学生成绩的优劣,甚至会产生与学生实际水平截然不同的结果。而标准分是以群体的平均分为参照、以标准差为度量单位的一种分数,是在消除考试难度、考生不确定因素产生的抽样误差影响,将考试成绩(分数制)通过某种变换而得到的具有明确区分、比较特性的考试成绩。所以标准分能够直接比较不同学生不同学科的总成绩,能够客观、公正地反映各个学生的成绩在群体成绩中的实际地位或实际排名。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
(三)可比较某学生不同学科与阶段的成绩,正确评价其学习的发展。
我以某高校某学生第一学年(两个学期)大学语文与大学英语成绩为例来说明这个问题,见表2。
按表2中的原始分数评价,有人认为该生的语文成绩有进步,而英语学习有退步。而若将该生的成绩标准化后,不难发现,该生的语文成绩在班上的相对位置没有变化,而英语成绩第二学期虽比第一学期低7分,但标准分数提高了,说明该生在班上的相对成绩有所提高。同样,若仅看该生的第二学期成绩:语文86分,英语80分,不少人会认为该生的语文比英语学得好。但我们从表2中可知,该生的语文成绩高于平均成绩0.96个标准差,英语成绩高出平均成绩1.16个标准差,英语成绩比语文成绩在班上的相对位置高,因而相对来说该生的英语学得较好。所以只凭借原始分数盲目评价学生是不恰当的。如果教师采用标准分数,就可以掌握每个学生学习某科成绩发展趋势,了解学生知识的掌握程度。
五、结语
无论用原始分数比较单科成绩还是比较总成绩都是不科学的,因为各原始分数分别位于不同科目的不同分布中,价值不同,没有同一的测量尺度,因而不可加与不可比。标准分是采取统计学的计算方法计算出的一种数据,利用这种计算方法可以避免多次考试因试题量不同及试题难度不同而造成的前面提到的对学生的学习情况评价不确切的情况发生,使课程之间、学生之间、班级之间、年级之间和学校之间具有可比性,可对同一考试各科进行横向比较,也可对同一学科不同时期的考试纵向比较,找到个体在总体内的位置,从而对全校教学情况一目了然,教学管理也可以做到心中有数。
当前,仍有相当一部分教师用原始分数作为考试成绩评价的依据,尚未认识到原始分数的局限性。因而,我认为对标准分数的认同需要宣传,让教师更了解标准分的意义和作用,尽快地接受标准分,并运用标准分更好、更科学和更合理地评价学生的考试成绩,客观地了解学生的学习动态,做到有的放矢、因材施教。
参考文献:
[1]罗玉莲等.标准分及其应用[J].吉安师专学报,1998,VOL19,(5).
[2]刘晓莉.标准分与考试成绩评估[J].佛山科学技术学院学报(自然科学版),1999,VOL17,(4).
[3]廖平胜等.考试学[M].武汉:华中师范大学出版社,1988.
[4]张玉田等.学校教育评价[M].北京:中央民族大学出版社,1998.
[5]将庆伟等.教育科研中的量化方法[M].北京:中国科学技术出版社,1997.
[6]唐小杰等.课堂教学与学习成绩评价[M].南宁:广西教育出版社,2000.