教育评估与监测8篇

时间：2023-05-16 10:17:03

绪论：在寻找写作灵感吗？爱发表网为您精选了8篇教育评估与监测，愿这些内容能够启迪您的思维，激发您的创作热情，欢迎您的阅读与分享！

教育评估与监测

篇1

关键词：MEQS系统；教育质量；监测；评估

自素质教育理念的提出，我国的教育体制便在不断改革，经过多年的实施，取得了一定的可喜成绩。然而面对信息化时代的大环境，教育事业遇到了全新的挑战和危机，如何向教育信息化管理方向转型成为了教育界需要改革的首要任务。尤其在教育体系结构和教学质量之间的矛盾问题，可谓教育发展的重点解决对象，那么作为减轻教学负担、提升教学效率、改善教学质量的重要保障，教育质量监测与评估工作的开展显得十分必要，以MEQS系统为代表的一类教学软件系统在教育质量监测和评估中的应用发展具有一定现实意义。

一、MEQS系统在教育质量监测与评估中的应用价值分析

时代在发展，科技在进步，我国的教育事业也走向了新的发展阶段，信息时代的来临，无疑推动了教育改革计划的执行落实速度，在某些方面，也确实获得了长足的进步，比如：教育理念的转变、教材内容和教学方法的完善等，但是在教育测评工作领域却进步较慢，从目前的情况来看，具有很大的发展空间，在教育信息化管理的逐步影响下，一大批教学软件和教育系统开始兴起且运用到实际的教学当中，比如：OMR阅机、MEQS教育质量监测与评估系统。其中，MEQS系统更是以良好的功能优势被广泛运用到教育领域当中。其应用价值主要表现在两方面：教学质量的跟踪监测和教学效果的准确评估。MEQS系统以较为先进的技术功能让教学质量实现了全程跟踪监测，这在以往的教育时期是很难达到的，尤其在当前教育师资力量、教学内容等方面的不断变化影响下，MEQS系统利用准确的数据、统计分析平台，可以将学生的相关信息、历次考试成绩等实施精准测评，以系统无缝式的资源信息搜集和整合，对整个教育过程进行了有效的动态监控，十分有助于及时发现和解决问题；MEQS系统的评估功能则有效解决了从前因缺乏较为完善、标准的教育体系而受到影响的教学效果评估问题，借助资源及功能优势，对获取的信息依据相关规定步骤，以科学的方法加以处理分析，保证真实有效。

二、MEQS系统在教育质量监测与评估中的相关应用机制过程研究

（一）MEQS系统的设计目标依据

事实上，MEQS系统的设计形成，缘于当前教育制度全面改革、教材课程不断更新的背景影响下，随着信息化程度的提高，教育事业的管理面临信息化转型变得势在必行。作为一种先进的教育测评信息化产品，MEQS系统的设计正是以提高教学质量为目的，依据《教育测量学》而形成的。表现在对统计指标体系和统计分析报表的丰富与细化两个方面，通过较为全面的内容、项目的填充，使得教育质量的监测与评估取得更好的成效。例如：对于前者来说，以各项等级分数的划分、名次的排布、难易程度的标识等作为设置要求，形成诸如总分、科目分、排名、难度等项目的监测与评估。对于统计分析报表的设计来说，也系统地划分为四大类项目，包括了日常评估、历次考试监测、特定考试统计以及终结评估等四类报表，其中涉及到的内容依然做出了系统的划分，诸如教师的成绩和名次分布、学生在实验、课堂等各阶段的学习能力均是其中的具体类别。

（二）MEQS系统的设计目标

从前面的论述中不难看出，MEQS系统的设计目标是根据《教育测量学》而形成的，那么围绕教学质量为核心的宗旨，其设计目标主要以更具层次、阶段性的特点而设置，通过对教学阶段性成果的全方位把握，提升对整个教学过程的动态监控，最终实现素质教育的推进发展。

（三）MEQS系统的独特优势体现

教育质量的监测与评估可谓教育改革过程中的一个重要组成部分，MEQS系统的出现加快了教育领域测评工作的进展，同时得以被应用到实际的教学实践当中，经历了经验积累与技术改进的过程之后，MEQS系统自身的独特优势十分明显。首先得益于MEQS系统的设计理念，不仅较为系统、覆盖全面，而且应用环境宽松灵活。例如：在MEQS系统的应用环境方面的设置上，较为灵活且覆盖范围十分广泛，包括互联网、局域网、广域网以及便捷安全的操作方式，密码、账号或者数字证书均可以。其次，MEQS系统紧密围绕教育质量的监测和评价两方面，兼具了科学性与时效性的特点，从对学生的知识、技能、品质以及成绩、排名的分布情况等方面进行了科学、动态式的监测，并作出相应评估，达到及时有效的结果。最后，MEQS系统还具有出色的技术优势作为运行保障，用户登录界面美观、便捷，模块化的设计和用户权限管理更加体现出技术的先进性和安全性，在信息资源的校验检测方面，诸如逻辑校验、数据校验等不同形式有助于减少误差和错误。在细节方面，MEQS系统也做到了人性化的处理，比如：MEQS系统为用户提供了数据恢复、备份等功能，方便用户及时找回丢失的信息和资源、做好安全的防范。

（四）MEQS系统的功能应用分析

MEQS系统的功能繁多且实用，涵盖了诸如基础数据管理、采集统计、质量监测、教学评估、考务管理等功能模块，从其功能应用方面来看，首先对学校学生以班级、年级为单位，系统的将每一次教学考试的所涉及的知识点、科目、题目等进行信息的统计与分析，形成全面、准确地统计分析报表，以便教务管理人员研究，其次，以动态跟踪式的监测方式对学生的学习成绩和能力实施较为全面、科学地监测，完全掌控其学习动态，最后，对监测结果进行综合评估，全方位衡量和评价学生的品德、技能及知识掌握情况，最终形成评估报告，供学生和老师参考借鉴。

三、总结

总之，信息技术对于社会的进步具有至关重要的作用，在教育制度不断改革的影响下，教学质量的监测和评估工作变得越来越重要。通过本文对MEQS系统的功能作用、技术优势等方面的论述，以便其得到相关教育机构的重视，进而达到推广应用的目的。

参考文献：

[1]文燕清.高等教育地方化背景下省级高等教育质量监控研究[D].广西师范大学，2013.

篇2

[关键词]幼儿园；教育质量；监测与评估

[中图分类号]G617[文献标识码]A[文章编号]1004-4604（2013）10-0026-05

幼儿园教育质量是指幼儿园教育（包括保育）满足相关主体（主要是幼儿，同时包括家长、教师、社区等）合理需要的程度。幼儿园教育质量一般包括结构性要素（如空间和设施、材料、教师素质、班级规模、师幼比例等）的质量和过程性要素（如课程与教学、游戏、户外/体育活动、作息安排、师幼互动等）的质量。为确保幼儿园教育质量监测与评估的科学性和真实性，应以班级为基本的监测与评估单位，以一日活动的全过程观察为主要监测与评估方式，在监测与评估结构性要素质量的基础上，重点考察班级一日活动每个环节、全方位的过程性要素质量。

《国务院关于当前发展学前教育的若干意见》（国发[2010]41号）明确提出，要“坚持学前教育的公益性和普惠性”“坚持政府主导”“保障适龄儿童接受基本的有质量的学前教育”。近年来，浙江省加大了对学前教育的财政投入力度，教育部门针对区域特点，积极探索学前教育的规范管理和内涵提升之路，取得了明显成效。但同时我们也看到，学前教育的发展还存在不少问题和挑战。这些问题既可能影响到儿童的身心健康发展，也可能关涉整个地区未来的经济发展与社会稳定。为探索学前教育质量的提升之路，力求找到突破瓶颈的策略，我们以浙江省c市为取样区域，对其幼儿园教育质量进行了全面深入的监测与评估研究。

一、研究对象与方法

（一）研究对象

本研究在浙江省C市依据幼儿园所在地、办园性质、等级抽取了13所幼儿园，每所幼儿园根据年龄段随机抽取2个班级，剔除其中非常态教学的班级1个，共抽取25个班级。其中小班8个，中班9个，大班8个，这些班级基本能够反映该市幼儿园的结构特征。样本幼儿园具体情况见表1。

（二）研究工具

美国北卡罗来纳大学FPG儿童发展研究中心哈姆斯等人编制的《幼儿学习环境评价量表》（ECERS）及其修订版（ECERS-R）是美国乃至目前世界范围内应用最广泛的学前教育质量评价工具之一。本研究采用的是李克建、胡碧颖在借鉴ECERS-R以及实证研究的基础上合作编制的《中国托幼机构教育质量评价量表（试用版）》（以下简称“量表”）。该量表对幼儿园教育质量的界定与考察包括以下九个方面：自由选择性、独立性、创造性、多样化、计划性、积极氛围、监督和管理、成人角色以及均衡性。从量表的内容来看，该量表由空间与设施、保育、课程计划与实施、集体教学、游戏与活动、语言与推理、指导与互动、家长和教师共八个子量表构成。每个子量表下包含若干个维度，共有51个维度；每个维度包含若干个项目，共有180个项目；每个项目一般包括4个等级指标。量表采用利克特7点量表评分，其中：1分代表“不适宜”，3分代表“最低要求”，5分代表“良好”，7分代表“优秀”，得分越高表明幼儿园教育质量越高。经过前期测量以及实践专家评定，该量表具有较高的评分者一致性、结构效度和内容效度。

（三）研究过程

共24名评分员参与了本次班级观察的数据采集工作。所有评分员事前均接受了严格的培训。在正式观察和评估过程中，2名评分员为一组。同时进入同一个班级独立进行观察和记录。由于有些项目现场无法观察到，评分员还需要在恰当的时机对该班教师和部分家长进行访谈。之后开小组会议，对评分不一致的项目进行讨论。直至达成一致意见，给出小组评分。每个班级的观察和访谈时间一般约8个小时（从幼儿早晨入园到下午离园）。评分结束后，对数据进行编码、录入、整理和分析。

二、研究结果及分析

（一）幼儿园教育质量整体偏低

调查显示，抽样幼儿园班级在两个子量表上的均分未达到最低要求（3分），分别为游戏与活动（2.22分）和课程计划与实施（2.95分）；在五个子量表上的均分在3-4分，仅达到最低要求。得分从高到低分别为保育（3.70分）、集体教学（3.67分）、指导与互动（3.58分）、空间与设施（3.06分）和语言与推理（3.03分）；均分最高的为家长和教师（4.01分）。通过观察与访谈，评分员发现，抽样幼儿园班级硬件设施大部分达到了基本要求，较为注重对幼儿的生活照料，高度重视集体教学，师幼关系比较融洽，有形式多样的家园联系，基本能够满足幼儿的身心发展需要。但存在两大明显问题：一是大多数班级内区角较少，游戏材料不够丰富，特别是角色/戏剧游戏、音乐/律动和美术、沙/水这几类活动区角，空间不足，材料匮乏。二是幼儿园五大领域课程之间、不同集体教育活动之间的联系比较肤浅、生硬，有些幼儿园的集体教育活动次数太多、时间过长，集体教学与自由游戏时间比例严重失衡。总体而言，抽样幼儿园班级教育质量整体偏低。

（二）不同所在地、等级的幼儿园教育质量差异较大

1.不同所在地幼儿园教育质量的差异比较

调查发现，整体而言，城市幼儿园班级与农村幼儿园班级在八个子量表上的得分趋同。游戏与活动均没有达到最低要求。农村幼儿园班级除集体教学、家长和教师外，在其他子量表上的均分都未达到最低要求；城市幼儿园班级除游戏与活动外，在其余子量表上的均分均达到了最低要求。

对比来看，城市幼儿园班级在六个子量表（空间与设施、保育、游戏与活动、语言与推理、指导与互动及家长和教师）上的得分在2.57分到4.48分之间，农村幼儿园班级的得分则在1.60分到3.18分之间，差距最大的是保育及家长与教师上的得分。那么，城市与农村幼儿园之间的教育质量差异是否达到了显著水平呢？所在地是否是影响幼儿园教育环境质量的一个关键变量？独立样本T检验的结果显示，城市幼儿园班级的教育质量均显著高于农村幼儿园，详见表2。

长期以来，我国社会处于城乡二元结构。城乡差异不仅表现在经济上，也表现在文化上。随着农村经济的发展，农村基础教育条件逐渐得到改善、父母对子女的早期教育也越来越重视，农村学前教育比以前有了长足的发展，但仍然存在很多问题，比如物质条件差，师资紧缺、经费不足等。如果农村的学前教育得不到相应的扶持与帮助，城乡之间的差距将会进一步拉大，最终势必影响到农村地区儿童的发展。

2.不同办园性质幼儿园教育质量的差异比较

调查结果显示，公办幼儿园班级在八个子量表上的得分均高于民办幼儿园班级，公办园班级的得分在2.73分到4.65分之间，民办园班级的得分在1.98分到3.71分之间，差异最大的是保育及家长和教师。公办园班级除游戏与活动得分外，均达到了最低要求。家长和教师的得分在4.5分以上，接近良好水平（5分）；民办园班级的空间与设施、课程计划与实施、游戏与活动、语言与推理得分均未达到最低要求。

进一步进行的独立样本T检验发现，不同办园性质的幼儿园班级教育质量不存在显著差异。由此推知，幼儿园的办园性质不是影响幼儿园教育环境质量的关键变量。

3.不同等级幼儿园教育质量的差异比较

调查结果显示，不同等级幼儿园班级在八个子量表上的得分分别为：省一级园班级3.69-5.63分，省二级园班级3.41-4.95分，省三级园班级1.97-3.73分，准办园班级1.26-3.12分，省一、二级园班级在八个子量表上的得分均高于省三级园与准办园班级，且差异较大。省三级园班级在八个子量表上的得分又均高于准办园班级，差异也较大。由此可知，准办园班级得分与省一、二级园班级之间的差距就更大了。准办园班级除家长和教师得分达到最低要求外，其余子量表上的得分均未达到最低要求，特别是游戏与活动得分在1-1.5分（不适宜）。对不同等级幼儿园的教育质量进行单因素方差分析发现，省一、二、三级园及准办园的教育质量存在极其显著的差异，详见表3。

对差异显著项进行多重比较。结果发现：在空间与设施的质量上，省一级园班级得分显著高于省二、三级园和准办园班级得分，省二级园班级得分显著高于省三级园和准办园班级得分，省三级园班级得分显著高于准办园班级得分。在保育、集体教学、指导与互动的质量上，省一级园班级得分显著高于省三级园班级得分，省等级园班级得分显著高于准办园班级得分。在课程计划与实施、游戏与活动、家长与教师的质量上，省一、二级园班级得分显著高于省三级园和准办园班级得分，省三级园班级得分显著高于准办园班级得分。

综上可知，不同所在地、不同等级对于幼儿园教育质量的影响非常大，这意味着不同家庭背景和社会阶层、不同地方（户籍）的学龄前儿童受教育的机会和质量水平存在很大差异，这种差异最终会体现到儿童发展的结果上。

三、建议与措施

（一）制定并实施有效的课程指南，提升学前教育质量

当前，英国、美国、新西兰、澳大利亚等国和我国港台地区都把课程作为评估学前教育质量的重要内容（康建琴、刘焱，2011），幼儿园课程改革发展呈现出多元、开放、自主化等特点，总体趋势是生活化、经验化、游戏化、综合化。针对本研究中各级各类幼儿园在游戏与活动、课程计划与实施方面存在的问题，幼教行政和教研部门应通力协作，结合本地区幼儿园实际，制定切实可行的课程指南和实施意见，对幼儿园的课程目标、课程内容、课程组织实施、课程评价等给予具体有效的指导，尤其要考虑：如何保证幼儿园课程真正以幼儿的游戏活动为主，如何保证五大领域课程和幼儿各方面发展的平衡，如何保障幼儿户外/体育活动的时间和效果。如何限定集体活动的次数、保障幼儿自由游戏活动的时间，如何优化一日活动的过程、提高保育和教育的有效性等问题，从而从制度上保证幼儿的游戏权利，加强师幼间、同伴间积极的、富有教育性的人际互动，改善幼儿学习环境，提升学前教育质量。

具体而言，可以从以下方面进行努力：第一，改进课程结构，设立并灵活利用班级内的游戏区角。总体而言，整个地区的幼儿园的课程结构应从目前集体活动过多的模式，走向集体活动与自由游戏均衡协调的课程模式，动态地推进并逐步实现领域课程活动之间的均衡。不同集体活动之间、集体活动和区角活动之间，都存在着紧密的内在联系。应改变过去整个幼儿园设立几个专用活动室的做法，注重班级游戏活动区角的创设，扩大区角活动的空间，增加区角材料。第二，增加自由游戏的时间，提高一日活动的质量。我国《幼儿园工作规程》和《幼儿园教育指导纲要（试行）》均规定，幼儿园教育要以幼儿的游戏活动为基本途径。但调查结果表明，自由游戏是整个地区幼儿园教育中最为薄弱的环节。因此，各级各类幼儿园应调整课程结构和一日作息时间结构，大幅度增加幼儿自由游戏的时间。同时，通过教师配班和工作方式的调整，提高师幼互动的频率和质量（比如，集体教学时间采取分组教学，自由游戏时间采取分区域监护和指导）。最重要的是教师要有全过程质量管理的意识，切实提高一日活动各个环节的质量。

（二）保障处境不利儿童接受基本而有质量的学前教育，促进学前教育公平

篇3

关键词：监测评估；高等教育评估；新理念

2015年10月国务院印发的《关于统筹推进世界一流大学和一流学科建设总体方案》中明确提出：到本世纪中叶，基本建成高等教育强国。在建设高等教育强国的进程中，持续创新教育理念是其首要任务。在高等教育评估活动中创新教育理念就是要以监测评估理念为引领，推动我国高等教育的跨越式发展。《国家中长期教育改革与发展规划纲要（2010-2020年）》（以下简称《教育规划纲要》）明确提出：整合国家教育质量监测评估机构及资源，完善监测评估体系，定期监测评估报告。十八届三中全会《中央关于全面深化改革若干重大问题的决定》再次明确提出“委托社会组织开展教育评估监测”。积极开展监测评估活动，对于提高我国高等教育质量，实现高等教育现代化，建设高等教育强国具有重要的现实意义。

一、高等教育监测评估的内涵

教育评估作为教育研究的三大领域之一，在我国教育体系中具有十分重要的地位和作用。在高等教育领域积极开展教育评估，既是满足社会政治经济发展对我国教育发展的需求，也是深化教育领域综合改革，统筹推进我国高等教育“双一流”建设的客观需要。我国高等教育评估始于20世纪80年代中期，历经三十年的发展，高等教育评估制度不断完善，评估理论不断丰富，评估队伍不断扩大，评估水平不断提高，已基本形成了合格评估和水平评估两大评估体系，评估工作初步实现了制度化、科学化、常态化和专业化。但是我们也看到，传统的合格评估和水平评估均存在着评估过程缺乏有效监督、评估过分注重结果、高等学校缺乏参与评估的积极性与主动性等缺陷。随着我国高等教育由外延式扩张向内涵式发展方式转变，全面提高高等教育质量，加快推动高等教育领域的变革，也要求一种全新的教育评估理念与之相适应。高等教育监测评估就是在这样的时代背景下应运而生。

监测一词，原是项目工程上的用语，是指系统地收集和分析项目的数据信息，其目的在于提高工作效率和项目组织的有效性。[1]杭德格姆等把管理分成4个阶段：计划―做事―检查―作用，其中监测属于“做事”阶段，主要是监测过程是否符合目标，如果与目标不符则要根据实际情况进行调整。[2]OECD认为，监测具有常规的、持续性的功能。它运用特定的指标系统性地收集数据，为管理者和主要利益相关者提供活动执行中的有关信息，包括活动的进展状况和目标实现程度，以及所分配的资金使用情况。[3]世界银行认为监测包括：持续收集并分析活动实施信息，评价活动过程，通过比较实际实施情况和预定目标，随之进行调整，以实现既定目标；它是活动实施管理者的责任，属于活动内部管理实践。[4]

将“监测”这一概念应用于高等教育评估领域，属于教育评价的范畴，承载着教育评价与教育监督的功能。所谓高等教育监测评估是指，利用现代信息技术持续收集和深入分析有关数据，直观呈现高等教育状态，为多元主体价值判断和科学决策提供客观依据的过程。[5]相对于传统的评估体系而言，高等教育监测评估是通过对高等教育系统中的各个要素、组成部分的状态信息进行持续地、不间断地收集、整理、分析与挖掘、预判等过程，直观呈现高等教育状态，从而为多元主体进行价值判断和科学决策提供客观依据。监测评估坚持用数据说话，更加突出评估的持续性、系统性、直观性、客观性，更加强调监测的常态性与过程性，并通过对高等教育教学信息的持续监控，更好地发挥对高等教育的连续监测、预测预警与及时改进等功效，推动我国高等教育持续快速健康发展。监测评估是在反思传统评估理论所存在的问题与不足并吸收其经验优势的基础上，在评估理念、目标、方式、手段等方面充分反映了当今时代对教育评估的新要求，预示着一个新的评估时代的到来。

二、高等教育监测评估的基本理念

1.监测目的重在持续改进

美国著名教育评估专家斯塔弗尔比姆指出：评估最重要的目的不是为了证明，而是为了改进。[6]高等教育监测评估是一项科学性和技术性相结合的专业活动，其目的是通过对高等教育相关教学数据的监控，寻求高等教育教学活动持续改进和质量提高的途径，推动高等学校深化教育教学改革，加快推进高等学校内涵建设，以实现高等教育由外延式扩张向内涵式方向发展的转变。正如吉特等人指出的，监测评估依据持续收集到的数据，评价项目的进展情况的目的是通过获得项目的所有有关数据，以识别可能会引起不同于原定目标的特别程序，决策者可以根据结果对实际的执行方法或者具体目标进行持续性的调整，从而实现最终目标。[7]相对于过分强调评估结果和实施成效的传统评估活动，监测评估突出强调监测目的的持续改进，即通过持续监测高等学校教育教学的相关信息，准确发现教育教学活动中存在的问题，深入剖析原因，及时修正活动偏差，并对潜在的风险进行预警与提示，促进监测对象连续地、不间断地改进正在实施的教育教学活动，以提高教育资源的利用率，真正实现以评促改、以评促建的评估目标。

2.监测主体的多元化

治理理论倡导通过多元主体之间的合作、协商、伙伴关系，确立共同目标等方式实施对公共事务的管理。其权力向度是多元的、相互的，而不是单一的和自下而上的。[8]监测评估打破了政府单一主体的传统评估模式，突出强调评估主体的多元化，使得监测评估的组织模式、评估的手段与方法、以及评估结果等更加多样化。所谓监测评估主体的多元化，是指通过充分调动利益相关方参与评估的积极性和主动性，建立由外部评估专家、教育管理者、专业机构和第三方社会组织、用人单位、高等学校等共同构成的多元评估主体。在评估过程中，监测评估积极倡导和明确树立评估主体地位平等性的理念，尊重利益相关方的多元价值诉求，保障各方以平等的身份积极参与评估活动，维护相关各方的利益。同时，监测评估实行评估方案由各方协商构建，评估过程由各方共同参与，评估结果公开合理使用，有效地保障了利益相关方的独立性、自主性。

3.监测方式的常态化

按照评估周期的不同，可以把评估分为常态性评估和周期性评估两大类。依此划分标准来看，合格评估和水平评估都属于周期性评估。这两类评估对于完善我国高等教育评估制度，推动我国教育评估的发展发挥了重要作用。但周期性的评估有其不可克服的缺欠，一是外部性，二是周期长。[9]再加上评估过程静态化、评估结果滞后性等缺陷，难以真正实现对高等教育的有关信息进行及时性、常态化评估，无法及时监测高等教育发展状况。因此，路易斯等在探讨评估未来发展趋势时，提出随着技术的发展、人们关注度的提高，评估结果的有效周期会越来越短，所以需要采用高效率低成本的监测技术进行实时评估。[10]监测评估通过信息技术手段极大地缩短评估时间尺度，数据采集和更新的时间间隔至少缩短至一年及以下，部分数据达到每季、每月、每周、每天甚至实时采集，这样就能够完整记录和及时反馈评估对象的状态，发现异常、预测趋势、促进改进。[11]监测评估提出的常态监测理念，一方面打破了传统评估中只关注已发生的事实和评估的偶发性和周期性特点，监测周期更短，可以做到对教育教学状态的常态监测。另一方面，通过建立高等学校教育教学基本状态信息库等数据资源，对有关信息进行常规性、连续性与制度化的信息采集，并利用现代技术和科学的方法对数据库信息进行实时性、常态性监测，以实现评估方式的常态化。

4.监测手段的多样化

为了克服传统评估活动中过分依赖专家进校考察为主的评估手段，保障监测活动的科学性和客观性，监测评估充分利用多样化的手段对高等教育教学状态进行多维度、多角度的监测。一方面是高等教育主体通过对高等学校师资队伍、办学条件、德育工作、教学管理、教学质量的监控与改进等方面实施数据常规性、持续性、系统性与制度化的采集、整理和分析，直观呈现高等学校状态，以实现对高等教育教学状态监测的常态化。另一方面，监测评估还强调充分利用实地考察、收集高等学校各项事业发展报告与信息公开清单内容等手段对高等学校教育教学信息进行监测。随着网络时代的到来，利用网络组建评估团队、创新开发工具、开展网络评价是今后教育评估发展的重要方向。[12]监测评估紧跟时展的需要，利用现代信息技术和手段，通过组建全国联网的由国家、省级和高等学校三级构成的网络化高等教育质量监测数据平台，加强对高等教育的常态监控，以推动高等教育评估手段的现代化。

5.监测程序的透明化

监测程序是否公开、透明，是决定评估结果能否被社会广泛接受的关键。《教育规划纲要》中明确提出要完善信息公开制度，保障公众对教育的知情权、参与权和监督权。监测评估充分利用各种公开、透明的数据，通过构建科学、合理的指标体系，对高等教育教学状态进行常态性、持续性监测。在监测评估过程中，虽然多元评价主体的出发点不同，评估的依据和标准不同、评价的结果不同，但是各个监测评估的整个程序都是清晰的、透明的、可见的。之所以说整个程序具有透明化是源于监测评估所需数据均来源于高等学校公开数据，各评估主体都可以自由获取；各评估主体指标体系的设计均遵循导向性、整体性、可测性与客观性原则；评估的技术与方法科学规范、评估的组织与管理规范有序、评估的结果及时向社会公开。监测程序的透明化，能够有效保证整个监测评估过程的客观性与公正性，保证评估结果的可靠性和有效性，从而保障评估的公信力。

6.监测结果的多元价值判断

传统评估活动中政府作为评估的唯一主体主导着整个评估过程。评估计划由政府制定，评估指标由政府设计，评估活动的开展与实施由政府组织，评估过程由政府监督与管理，结果评判由进校考察专家组和教育部本科教学评估委员会的意见和结论构成，导致了评估结果的单一性和片面性。随着我国高等教育的快速发展，高等教育的主体更加多元化，他们比以往任何时候都更加关注高等教育质量，积极参与高等教育治理。多元主体在参与高等教育监测评估活动过程中依据一定的标准和自身需要，对高等教育教学的结果进行价值判断或事实判断，实现了评价结果的多元化。这是由于政府、高等学校、教师、学生、用人单位、第三方组织等多元主体的立场和出发点不同，因此他们对高等教育质量结果评判也不尽相同。而就监测评估本身而言，它只是对高等教育基本状态进行客观的事实呈现，并不做出任何价值判断，其目的是通过直观呈现高等教育教学“状态”，促进高等教育的办学主体、实施主体、监督主体等不断推动教育教学质量的提高。

三、监测评估需要明确的几对关系

1.主体与客体

实践的本质是主体与客体的统一。实践活动的开展既离不开作为实践载体的主体，也离不开作为实践对象的客体，二者相互联系、共同构成了一个有机整体。二者也只有在相互关联中才会有自己的本质与规定。[13]在评估实践活动中，只有首先明晰他们二者之间的关系，才能更好地开展评估活动。监测评估打破了传统评估实践活动中政府是唯一主体的地位，明确评估的主体由专业机构、第三方社会组织和用人单位等共同构成。在监测评估活动中，政府从传统评估活动的“裁判员兼运动员”变成了监测评估活动中的“裁判员”，能够更好地转变政府管理部门职能，增强对高等教育的宏观管理，真正实现高等教育管办评分离。同时，以第三方作为评估的主体，能充分发挥第三方的“外部性”特点，有利于形成独立客观的结论，保证评估结果的客观性和公平性。高等学校作为评估活动中重要的利益相关者之一，它既是评估的客体，被评估的对象，更应是评估活动的主动参与者。监测评估充分强调高等学校作为质量保障的主体地位，积极调动高等学校参与评估的主动性，让高等学校主动参评、乐于参评，以提高高等学校在评估活动中的话语权，增强高等学校作为质量保障主体的意识和责任。

2.一元与多元

一元和多元是一对既对立又统一的矛盾体。开展监测评估，必须正确理解和处理一元和多元之间的关系。在此，我们所说的一元是指管理主体的一元性。各级政府作为我国高等教育的主管部门，对高等教育具有管理权、监督权、问责权。特别是在当前我国正处于全面深化社会领域综合改革，推进教育治理能力和治理体系现代化的新时期，政府作为高等教育管理的主体，要发挥好宏观管理的作用，积极转变职能，简政放权，即从传统评估活动的领导者、具体组织者、实施者等角色，转变为监测评估活动中的外部监督者、宏观管理者。所谓多元，是指评估主体的多元化和评估结果的多元价值判断。在评估主体上，监测评估积极引入第三方独立评价机构、用人单位、学生等利益相关者积极参与到评估活动中来，实现评估主体的多元化。在评估结果的价值判断上，监测评估活动本身只对高等教育教学状态进行直观呈现，在价值判断上保持中立。而对于高等教育教学状态的价值判断由政府、高等学校、用人单位、第三方独立评价机构等相关利益者，根据自身的需要独立进行。因此，在监测评估中，处理好一元和多元之间的关系，就是要界定清楚谁是评估活动真正的组织者、实施者、管理者、监督者，明确政府与其他利益相关者之间的权限，处理好事实判断和价值判断之间的关系，才能更好地开展监测评估。

3.定量与定性

定量分析与定性判断是评估活动中采用的两种基本研究方法。二者在不同类别评估活动中的作用有较大差异。上一轮本科教学工作水平评估中存在的问题之一就是，评估方式单一，过多依赖专家进校考察方式。[14]监测评估以定量分析为主，定性判断为辅，同时二者有机结合，实现评估方法的多样化。监测评估充分运用现代信息技术，采集、分析、整理有关数据，深入挖掘各数据之间的内在关联性，通过运用定量分析的研究方法，把高等教育教学的状态以数据形式客观呈现出来。同时，监测评估并不完全否定专家的作用，而是利用现代技术手段将专家从整个评估活动中解脱出来，有效发挥专家在评估理念、指标的设计等环节中的智慧与作用。这样，既可以发挥专家的特长与优势，也可以避免评估过程中过多依靠专家经验进行评断，减少专家在评估活动中的道德风险和对评估结果的主观性判断。监测评估充分认识到以数据为主的定量分析与以专家经验判断为主的定性判断中各自的优点与不足，把专家评价和数据评估进行优势互补、有机结合，促进评估活动更加科学、合理、客观、公正。

4.过程与结果

过程与结果是哲学当中的一对基本范畴，它们既相互依存，又相互制约，构成了一个有机的统一体，统一于社会实践活动当中。其中，过程是结果的基础与前提，它指向结果，为结果服务。结果是过程发展变化的必然趋势，结果影响过程。监测评估作为一种社会实践活动，它既重视监测过程又强调监测结果，并将两者进行有机地结合，以实现对高等教育教学状态进行常态监测、及时发现、预测预警、及时改进的监测目标。在监测评估实践活动中，通过对高等教育教学的有关数据进行反复性、持续性、常态化的监测，以实现对高等教育教学状态的实时掌握。同时，监测评估也十分重视评估结果对评估过程和整个监测评估活动的影响与制约作用。特别是在评估结果的功能上，监测评估突出诊断功能与预警功能。通过对高等教育教学过程的常态监测，诊断出评估对象的现状，预测评估对象的发展趋势，特别是对处于临界阈值的有关指标及时做出预警，促进评估对象对教育教学活动中存在的偏差进行及时修正和持续改进，从而确保教育目标的有效达成，推动评估对象自我完善、自我发展、自我提高。因此，在监测评估活动中，评估结果需要监测过程的持续性与常态性，从而保证评估结果对评估对象实现强大的诊断功能和预警功能。

参考文献：

[1]沈南山.基础教育质量监测：学业评价制度分析视角[J].教育科学研究，2010（7）：37-40.

[2]Annie Hondeghem，Karolien Van Dorpe.Performance management systems for senior civil servants： how strong is the managerial public service bargain？[J].International Review of Administrative Sciences，2013， 79： 9.

[3]Evaluation guidelines Between past and future[EB/OL]http： // / derec/finland/47384551.pdf.

[4]Monitoring and Evaluation ： A Closer Look[EB/OL]http：///evaluations/evaluation-capacity-development-ecd.

[5]王战军，乔刚，李芬.高等教育质量保障新类型：监测评估[J].高等教育研究，2015（4）：39-42；60.

[6]Stufflebeam D.L.The CIPP model for program evaluation[J].In Madaus G.F， Scriven M.S， Stfflebeam D.L（els.）.Evaluation Models.Boston， MA：Kluwer-Nijhoff，1983：117.

[7]Guijt I， Gaventa J.Participatory Monitoring & Evaluation： Learning from Change[R].Institute of Development Studies， 1998：2-4.

[8]俞可平.治理与善治[M].北京：社会科学文献出版社，2000：6.

[9]刘振天.我国新一轮高等学校本科教学评估总体设计与制度创新[J].高等教育研究，2012（3）：23-28.

[10]Louise Yarnall ， and Nick L.Smith.The Evaluation Theory-Practice Interface in 2036[J].American Journal of Evaluation， 2011， 32： 565.

[11]王战军，乔伟峰，李江波.数据密集型评估：高等教育监测评估的内涵、方法和展望[J].教育研究，2015（6）：29-37.

[12]Nick L.Smith， Paul R.Brandon， Melanie Hwalek， Susan J.Kistler， Susan N.Labin， Jim Rugh Veronica Thomas and Louise Yarnall Looking Ahead： The Future of Evaluation[J].American Journal of Evaluation 2011 32： 565.

篇4

【关键词】高职口语；口语评估；交际能力；检测方法

0 导言

2000年版《高职高专教育英语课程基本要求》提出构建以社会需求为目标，以就业为导向，以实用为特点的教学体系。这一教育性质决定了口语教学在高职英语教学中的重要性。在信息化和经济全球化的大背景下，无论是针对面试还是就业，加强口语交际能力培养更符合高职教育的培养目标。而恰当的的检测和评估机制能够更好地促进口语教学的实施。

1 高职院校学生英语口语检测和评估的作用和意义

教学与评估是教学过程中相互作用不可分割的整体。科学合理的评估机制对高职英语口语教学有积极的引导作用。高职院校的学生英语口语水平参差不齐，大多数学习动力不足，热衷考试过关。因此更需要切合的评估方式来激发学生的学习热情和潜能。另一方面，英语口语的检测和评估有利于老师了解学生英语口语方面的水平与需求，更清楚地知道学生在口语学习中的问题和薄弱点。做到因材施教，让学生更好地适应并学习相关知识。由此可见，高职院校的英语口语的检测和评估对学生和老师来说都有着重要的作用和意义。

2 高职院校英语口语教学与评估现状

目前高职学生的英语听说能力差异较大。有些可以较为清晰完整地表达自己的观点，也有很多同学不能完成简单的日常对话。不论那类学生，口语的听与说的能力往往是听说读写中最弱的一项。究其原因，主要因为：（1）学生缺乏学习方向，对自身英语学习没有规划，对口语缺乏重视；（2）高职教育强调实用与就业相结合，而学院在课堂设置中最实用的口语课却安排极少；（3）教师教学思路陈旧，仍然重视读写，放松听说。由于高职学生听说能力较弱，甚至有部分教师过于“体贴学生”放弃了全英文授课。

而在口语评估体系方面，国家也已开始建立了系统的英语口语检测体系。像现在我们全国英语口语等级考试中的口语测试、大学英语四级和六级的口语测试、剑桥商务英语考试中的口语测试和面试、雅思和托福等考试中的口语测试等等。然而对于高职院校来说，我国目前还没有一套完整的、系统地、全面地的口语测试体系。即便是这些测试，由于某些检测因素没有一个统一的标准和要求，结果并不准确。例如：监考的严格程度、考场的设施和环境、考官的口语水平及主观感受、考生的心理素质以及考试答题的时间和要求等等因素都能影响到了学生口语检测的准确性和实用性。

3 高职英语口语教学及检测与评估体机制的建议

首先，高职院校应当在英语教学中真正树立为专业服务为就业服务的观念，加大口语课程的设置。并且加强教师培训，使有限的英语课堂能够真正能够用于实用对话的练习。确保课堂英文使用率特别是听说使用比率。

再者，要由小及大，由近及远。设立符合高职英语教学的一套评估机制，真正激发学生对英语口语的热情与重视。如口语测试中，学院自身可以将形成性评价与终结性评价结合起来，将平时课堂的口语问答，发言，小组会话等成绩纳入到综合评定中，积极开展师评，自评与学生互评。平时的口语学习与表现直接体现在期末成绩中，必能激励学生认真对待日常的口语的学与练，从而提高学生的英语会话能力。更重要的是，高职院校在学生的口语测试和评估方面要与社会接轨，积极和社会取证机构合作，如商务类学生口语考试与全国剑桥商务英语取证挂钩，其他专业也可与全国英语口语等级考试以及三一伦敦英语口语考试等合作。最终做到测试与社会取证相结合，取证与就业相呼应。这才能做到教学与就业相结合，真正激发学生口语学习的积极性。让学生自发地重视口语学习，尽早确立学习目标，做好学习规划。

4 高职英语口语检测与评估的内容和方法

在高职学院自身口语检测中，要注重学生对于英语口语的交际能力、学生口语的准确性、合适性以及有效性等几个方面进行考察。在评估的内容和标准的设计上也是不容忽视的。

（1）首先从口语测试方式来说，可以在口语测试中设计一些交际功能强的口语测试任务，比如可以就日常生活、教学过程、性格特征以及个人兴趣爱好等提出询问，然后学生通过回答这些问题并提出相应的个人看法和观点；也可以进行情境对话，组织学生选择一个情境，并进行扮演，完成交际任务；或者就某一话题，分小组进行讨论，然后各自讨论并陈诉其观点。这样有助于学生集中精神，开动自己的大脑，想法设法的表达自己的想法和内容，并在测试过程中充分的表现自己的口语交际能力和水平，也使得口语测试更真实、更具细节性、也更合理。

（2）其次从口语测试的内容来说，口语测试的内容应该具备相互交流的特性和真实性，这样才使得学生对口语测试的内容更直观，也能够让学生主动参与其中，获得信息并表达自己的观点和意见。此外口语情境内容也应该要符合当下的社会环境，最好贴近学生的生活，让学生更具身临其境之感，使得学生更能畅所欲言，体现其交际能力。

（3）然后从口语测试内容的文化方面来说，在设计测试试题时应该尽量选择不同的、真实的语音环境和背景。英语口语测试的最终目的就是让学生能够在以后的日常交际和商务活动中熟练的运用英语。因此，在试题内容方向的选择时可以倾向于日常生活和商务活动等方面的情景，用来考察学生在不同的文化方向环境中英语口语的表达能力以及学生对于这些文化的相关背景知识的掌握程度。

（4）最后从口语测试评分的细节考察点来看，对于学生英语口语交际能力的评价方面，要根据口语测试的侧重点从各个细节来对其进行评价并打分。例如，从宏观层面上来看，考察学生是否掌握英语的思维习惯和表达方式；措辞的使用是否合乎情境；学生理解会话和表达语言的能力以及表达社会文化的语言能力等几个方面。从微观的角度上来看，可以根据考察学生在规定的实践内表达内容的多少；口语表达是否流利；口语发音和语调是否准确；口语选词和语法的使用是否合理等等几个细节。综合这些，可以根据口语考试的侧重点来制定考察点的分数和规则，并根据学生口语测试的表现来对学生的口语交际能力进行系统地评价和评估。

5 结束语

英语口语交际能力的检测和评估是考察学生学习过程中语言实际运用能力的有力手段，它暴露学生学习中的问题，同时也反馈了高校老师的教学能力和教学水平，进而让学生和老师共同进步，提高高职院校整体英语口语的教学水平和学生英语口语的交际能力。现今，各大高职院校迫切要做的事就是如何建设一套科学合理的英语口语交际能力的评估体系，同时健全其测试内容与方法，进一步推动高职院校英语口语教学与测试的发展和进步。

【参考文献】

[1]Bachman LE Fundamental Considerations in Language Testing[M].Oxford University Press，1996.

[2]章雪玲.在职护理人员专英语口语学习现状的调查分析[J].护理研究，2008（22）.

[3]赵凤君，王心涤.本科护生专业英语交际能力培养的探讨[J].护理研究，2009（23）.

[4]苏英.试探高职高专的教学改革[J].文学教育，2010（12）.

篇5

关键词：商业企业顾客满意顾客满意度测评

中国加入WTO后零售市场进一步开放，随着许多国外大型零售企业，如沃尔玛、家乐福等的陆续进入，我国零售商业效益低下已是不争的事实。目前，越来越多的企业认识到市场竞争的核心是顾客满意，只有赢得顾客，才能赢得市场，获得利润。在2000版ISO9000族标准中，“以顾客为关注焦点”被列为质量管理八项原则之首，强调了对顾客满意度的测评与监控，并将其作为质量管理体系业绩的一项测量指标。可见，如何提高顾客满意度进而提高顾客的忠诚度，是我国各个商业企业应极其关注的问题。

在这种背景下，本文试图提出一个适合于我国商业企业顾客满意度评价的方法，为提升我国商业企业的核心竞争能力提供帮助。

顾客满意度指数测评模型的介绍

顾客满意度是一个经济心理学的概念，要衡量它就必须建立模型，将顾客满意度与一些相关变量（例如价值、质量、投诉行为、忠诚度等）联系起来。顾客满意度指数（Customer Satisfaction Index，CSI）是目前许多国家使用的一种新经济指标，主要用于对经济产出质量进行评价。它也是目前国内质量领域和经济领域一个非常热门而又非常前沿的课题。20世纪90年代以来，许多国家都开展了全国性的顾客满意度指数测评工作，以此来提高本国企业的竞争力。瑞典率先于1989年建立了全国性的顾客满意度指数，即瑞典顾客满意度晴雨表指数（SCSB），此后，美国和欧盟相继建立了各自的顾客满意度指数――美国顾客满意度指数（ACSI，1994）和欧洲顾客满意度指数（ECSI，1999）。另外，新西兰、加拿大等国家和台湾地区也在几个重要的行业建立了顾客满意度指数。

瑞典顾客满意度晴雨表指数（SCSB）模型

从世界范围来看，瑞典SCSB（Sweden Customer Satisfaction Barometer模型是最早建立的全国性顾客满意度指数模型（如图1）。该模型的前导变量有两个：顾客对产品/服务的期望；顾客对产品/服务的价值感知。满意度的结果变量是顾客抱怨和顾客忠诚度，忠诚度是模型中最终的因变量，因为它可以作为顾客保留和企业利润的指示器。

SCSB模型可用如下2个函数关系式表示：

顾客满意度=f（购前期望，感知表现）（1）

顾客忠诚度=f（满意度，转移障碍，顾客意见）（2）

SCSB模型推出后，在实践中也受到了质疑：价值感知对满意度的影响是必然的，但是价值因素和质量因素相比，哪方面更重要呢？由于顾客对不同产品和服务的质量感知是有差别的，如果在模型中加入质量感知变量，如何来衡量呢？等等。

美国顾客满意度指数（ACSI）模型

ACSI（theAmerican Customer Satisfaction Index）模型（如图2）是由美国密歇根大学商学院国家质量研究中心费耐尔（Fornell）博士等人在SCSB模型的基础上创建的，自1994年首次在美国应用，至今还不到10年时间。

目前ACSI已成为影响最为广泛的模型，为新西兰、中国台湾、奥地利等所采用，也是挪威和欧盟模型的基础。该模型认为，顾客的满意程度是由顾客对服务质量的期望、对质量的感知以及价值感知共同决定的；如果顾客对服务质量不满意，则会产生抱怨；顾客的忠诚取决于顾客的满意程度和事后抱怨的处理。

与其他模型相比，该模型科学地利用了顾客的消费认知过程，能客观反映出消费者对服务质量的评价，综合地反映出顾客的满意程度；同时，该模型所得出的结果可以在不同行业里进行比较，有利于企业服务质量的不断改进工作，但是对于服务质量中的具体因素的分析不够深入。

ACSI模型主要创新之处在于增加了一个潜在变量――感知质量（如果去掉感知质量及与其相关的路径，ACSI模型几乎可以完全还原为SCSB模型），将质量感知从价值感知中分离出来。

增加感知质量这一概念和相关的路径有两大优势：一是通过质量的三个标示变量，可以清楚地知道定制化和可靠性在决定顾客的感知质量中所起的不同作用。二是感知质量侧重于单纯的质量评判，而感知价值偏重于价格因素方面的评判，通过比较它们对顾客满意的影响，可以比较明确地分辨出顾客满意的源头出自何处，是质量制胜还是成本领先，使管理者采取相应的管理措施。

1996年ACSI模型又针对耐用消费品，将质量感知进一步分为产品质量感知和服务质量感知。

欧洲顾客满意度指数（ECSI）模型

ECSI模型（如图3）继承了ACSI模型的基本架构和一些核心概念，如顾客期望、感知质量、感知价值、顾客满意以及顾客忠诚，但又对ACSI进行了修正，主要表现为：

去掉了ACSI模型中顾客抱怨这个潜在变量。因为许多国家的顾客投诉系统已经比较完备。

ECSI模型增加了另一个潜在变量――企业形象。它是指顾客记忆中和组织有关的联想，这些联想会影响人们的期望值以及满意度的判别。

在模型的度量上，ACSI模型从1996年以后才只针对耐用品类商品分别测度其产品质量和服务质量。但是ECSI模型在针对所有行业的测评中，都将感知质量统一地拆分为针对产品的质量评判和针对服务的质量评判。

以上模型虽然具有很强的可操作性，但随着实践的深入，顾客满意度模型尚需不断的发展和完善，也必然会出现许多问题和分歧。因为模型变量的加入及变量间关系，在不同国家和不同行业是具有不同强度的，因此也不断涌现新模型。对于我国来说，也有一些需继续研究。

在我国,顾客满意度测评则刚刚步入借鉴与试验阶段，并于20世纪90年代后期启动了顾客满意度指数的测评工作。1995年由清华大学赵平教授将这一概念引入中国，并开始进行系统性研究分析。1998年，由当时国家质量技术监督局委托清华大学经济管理学院组织开展在中国建立用户满意度指数的研究工作。2000年，由国家质量监督检验检疫总局和清华大学中国企业研究中心共同承担了国家“软课题”研究项目“中国用户满意度指数构建方法研究”，为在我国建立国家级用户满意度指数奠定了基础，此项目已在2002年7月通过了由国家科技部组织的专家成果鉴定会。

中国顾客满意度指数（CCSI）是在学习借鉴美国顾客满意度指数（ACSI）基础上，根据中国国情对模型结构和测评指标体系进行必要的改造后而建立起来的具有中国特色的质量测评方法，并且我国一些地区和某些行业也在积极实施顾客满意指数测评工作。

但到目前为止，我国尚未正式实施国家级的CSI评价制度，也缺少相应的规章、规范，且国内的研究大多偏向于综述及描述性研究，只有少数实行定量分析，在定性描述研究中，一般以介绍国外的研究成果为主，然后说明在中国开展顾客满意度指数研究的意义、作用以及应注意的问题等。但是，仅仅从定性描述方面去研究只能使企业加强对顾客满意度指数调查的重视，确定以顾客为中心的经营理念，对于企业如何实行顾客满意度指数的调查没有实际的指导意义，而且操作性不强。因此，本文将定性描述和定量分析相结合，结合我国消费者的消费心理以及商业企业的实际情况，建立可以精确度量的，操作性较强的模型，指导企业实行顾客调查，得到企业所需要的一些数据，从而指导企业的经营行为。

构建我国商业企业顾客满意度指数测评模型

影响我国商业企业顾客满意度的因素分析

影响我国商业企业顾客满意的因素有很多，这里我们借用有名的“特征空间”理论来分析其影响因素。

研究产品差异化比较有名的学者有霍特林（Hoteling）和兰凯斯特（Lancaster）。其中兰凯斯特提出了著名的“产品特征空间理论”。他认为，一种产品可以看作一个多维向量，是在诸如质量、性能、颜色、规格、服务等变量中取一定的“值”构成，一个行业的多种类似产品组成一个多维的特征空间。

借用兰凯斯特的思想，我们可以分析影响我国商业企业顾客购买的一些主要因素，据此我们也就可以构造出影响我国大型商场顾客满意度的因素，这里的关键是抽象出合适的影响因素。与物质产品相比，影响我国大型商场顾客满意的变量还是比较固定的。在本文的模型里，变量抽象为7个，其中6个选自哈佛商学院教材，作者在此基础上增加了一个“商品质量”变量。

品种多样性

这一因素是由顾客的需求具有多样性的特征所决定的。商场经营的商品品种越多，顾客选择的余地越大，在其它因素一定的情况下，顾客的满意度就会越高。一个商场经营品种的多少一般由这几个因素决定：本企业所属业态；竞争者的品种数；供应商所能提供的品种数；店铺的大小；本企业的经营能力；各个品种由于利润率和周转率不同而对利润的影响。

价格

由于顾客的购买力总是有限的，故大部分顾客购物时价格因素仍然是其考虑的主要因素之一。顾客对价格的比较主要是对本商场中主力商品群各种商品与服务于同一目标市场的其它商场相同或相似产品的比较。如果相同的商品，企业能保证其价格位于较低的水平，一定会大大增加顾客的满意度。

商品服务

商业企业本身就属于服务行业，并处于供应链的末端，直接与顾客打交道，周密、细致的人性化服务对满足顾客的心理需求起着非常重要的作用，故商品服务质量的高低也是影响顾客对商场满意度的主要因素之一。商场可为顾客提供的商品服务包括关于商品位置、特色、价格的信息提供、快速结算、消费信贷、存车服务、送货服务和特殊定制等，企业在这方面可动的脑筋很多。

购买便利性

随着人们生活节奏不断加快，顾客购物追求方便的心理也越来越突出。购买的便利性越强，顾客购买的时间成本和精力成本就会大减少，从而提高其满意度。便利程度一般是用目标顾客来店铺完成购物所花时间的多少来衡量的。购物时间包括购物前计划时间、赶到店铺时间、店内选购时间和结算时间。企业应缩短顾客的店内选购时间和结算时间，特别是店内选购时间，这就求工作人员真诚地为顾客服务，当好参谋和助手。

产品保证

确保商品品质，这是外资商业企业科学管理的手段之一。我国商业企业必须努力学习西方的这一重要管理经验，强化商品采购管理，加大商品质量检测力度，防止假冒伪劣商品进入，真正做到“高质高价”。另外，企业应倡导“购物零风险”的经营理念，切实加强售后服务工作，提高顾客满意度，培养忠诚顾客。

在实际的顾客满意度指数测评中，“产品保证”可用“企业形象”或“商誉”代替。

购物环境消费者去商场购物除看重其商品质量外，就一看服务二看环境。色彩明亮、干净整洁、放有适宜背景音乐的店铺一般都会给顾客留下好的印象。

商品质量商品质量是影响我国商业企业顾客满意的主要因素之一。笔者认为，从现实情况看，在构建我国大型商场的顾客满意度测评模型时，应该单独测量商品本身质量的满意度。主要是因为在目前我国经济的发展阶段，我国市场上的假冒伪劣商品屡禁不止，因此质量感知的单独测量是非常必要的，这样可以进行各商场/商品间的质量比较。顾客认同商品企业提供的商品质量，自然对商场企业本身也就会潜意识的满意。

以上介绍了影响我国商业企业顾客购买的七个变量，这7个变量是构建我国商业企业顾客满意度测评模型的基础，但是这7个变量在不同的消费者心目中，其“相对地位”是不一样的，在进行顾客满意度指数测评时我们应分别赋予其不同的权重。

构建我国商业企业顾客满意度的测评模型

笔者基于对SCSI、ACSI、ECSI等顾客满意度指数模型的分析，结合我国商业企业的经营特点、影响我国商业企业顾客购买（满意度）的因素以及我国消费者的消费心理，在现有模型的基础上，拟提出一个适合我国商业企业顾客满意度指数测评的模型，如图4。

模型的描述

测评模型的结构如图4所示。本模型体现了一种因果关系，并结合了消费心理学因素。共选择了6个结构变量作为隐变量，其中企业形象、顾客期望、感知质量、感知价格等4个作为顾客总体满意度的原因变量，以顾客抱怨、顾客忠诚作为总体满意度的结果变量。

该模型认为：

顾客的满意程度受消费之前对产品或服务质量的预期同消费之后的实际感知之间的对比差距的影响。如果实际的感知超过消费前预期，顾客就会感觉到满足；反之，则不满意。

从市场营销的角度来看，企业提供给顾客的产品或服务应是一个包含多层次内容的整体概念，具体包括三方面的内容，即核心产品、有形产品和附加产品。顾客对产品质量的满意水平取决于产品这三个方面的质量。其中，核心产品的质量、有形产品的质量、附加产品的质量对顾客满意的影响是和Kano关于3种不同等级的质量如何影响顾客满意的理论分析是一致的。顾客一般会将核心产品的质量视作是理所当然的质量，它的充分实现也不会带来顾客满意水平的提升，但是，如果产品或服务缺少核心产品质量却会招致顾客的强烈不满；有形产品质量指顾客对产品或服务质量的具体要求，它的实现程度与顾客满意水平同步增长；能激发顾客进一步满意的是附加质量，是属于顾客预期质量之外的部分，产品或服务缺乏附加产品质量并不会导致顾客产生不满意，然而具有的话则会带来顾客满意程度的大幅上升。模型中顾客对超过预期的那一部分质量特性的感知，即等同于产品整体概念中的附加产品质量，能极大地提高顾客的满意程度。模型中，感知质量同总体满意度表现为正相关关系。

顾客对质量的感知由顾客对服务质量的感知和顾客对商品质量的感知两部分构成。这是由商业企业经营的特点所引起的。其中，顾客对服务质量的感知又主要由购物环境、购买的方便性、品种的多样性、售前及售中、售后服务等构成；顾客对商品质量的感知主要有品牌、材料等。

顾客记忆中和企业有关的联想即企业形象的好坏会影响顾客的期望值以及满意度的判别，并且对属于行为意图的顾客忠诚也有一定的影响。企业在实际的测评中可用诸如企业信誉、促销宣传和店容店貌等指标来代替。

模型中单独设立了一个感知价格变量，取代原来的感知价值来分析顾客满意中由价格驱动的部分，能使相关的路径更为清晰。目前我国总体消费水平仍然很低，且大多数商业企业经营的商品种类雷同，相同的商品，企业能保证以最低的价格出售，当然会大大增加顾客的满意度。在实际测评中，其标示变量可以采用商品的性价比、价格弹性以及购买过程中的各种费用如安装、使用、维护等费用来测试。

感知质量侧重于单纯的质量评判，而感知价格则偏重于价格因素的评判，通过比较它们对顾客满意的影响，可以比较明确地分辨出顾客满意的源头出自何处，是质量制胜还是成本领先，使管理者采取相应的管理措施。

Hirschman 和Fornell、Wernerfelt的研究表明，当顾客的满意水平较低时，他将表达出他的抱怨以试图得到补偿，不采取行动者极少。顾客采取的行动通常表现的形式主要有公开的形式和不公开的形式。不公开的形式指私人行动，即顾客以非正式的形式将其抱怨告诉其亲朋好友，劝其不买且自己也会停止购买该品牌或产品；某些公开的正式的形式所表现出来的抱怨，如通过法律手段等。但任何提高顾客满意水平的措施都能降低顾客的抱怨。

企业对于顾客抱怨的处理对顾客的忠诚有着影响，这可从实证研究中得到证明。笔者在2004年5月对长沙市的三家商业企业进行了一次顾客满意度调查，在回收的632份有效问卷中，对于问题“如果您对本店处理问题是满意的，您是否愿意再次来本店购物？”的回答中，回答“愿意”的人数占总人数的65.2%,回答“不愿意”的人数仅占7.28%,回答“不一定”的人数占总人数的27.52%。可见，如果企业能够妥善处理顾客所反映的抱怨，将提高顾客的忠诚度，相反，无视顾客抱怨与意见的行为将导致顾客忠诚度的进一步下降。但顾客抱怨同顾客忠诚之间并不存在着必然的正负相关关系，而是取决于企业在处理顾客抱怨时的态度和努力。

虽然Anderson 、Boulding、Fornell等多次分别从理论和实证上验证了总体顾客满意度和顾客忠诚之间的正相关关系，顾客忠诚作为总体满意度的结果变量也反映了顾客满意在消费心理学上的一个合理结论：高度满意带来忠诚的顾客。但随着消费者购买心理变得日趋的复杂，顾客对商店的选择性愈来愈强的情况下，顾客的满意也不一定就会转变为顾客的忠诚，笔者认为这中间需要加入一个潜在变量，即顾客情感。实证数据显示，顾客情感对于顾客忠诚的直接影响在绝大部分行业中甚至超过了顾客满意对顾客忠诚的直接影响，且顾客满意对顾客情感存在着显著的正向影响。我国学者汪孝纯等人的研究也证实了顾客满意、顾客情感之间的相互作用。

市场经济的基本思想就是各种交易的存在和竞争是为了创造满意的顾客，在这种市场经济体制下，卖方为了买方竞争，但是买方从不为产品或服务竞争。

企业之间的竞争其实就是顾客的竞争，是优质顾客的竞争。因此，科学地进行顾客满意度的评价对我国商业企业参与竞争，获得竞争优势显得尤为重要和紧迫。

参考资料：

1.张德栋等，我国零售银行业顾客满意度指数测评方法研究，管理评论，2004

2.刘新燕等，构建新型顾客满意度指数模型-基于SCSB、ACSI 、ECSI的分析，南开管理评论，2003

篇6

关键词：教学质量监测与评估系统高效复习

中图分类号：G633.91 文献标识码：A 文章编号：1673-9795（2013）04（c）-0036-02

1 研究背景、意义和国内外研究现状

《基础教育课程改革纲要》提出：“大力推行信息技术在教学过程中的普遍应用”。一方面是师生应对高考的需要；另一方面是学生个人成长和发展的需要，只有这样，教师和学生才能更好地适应这个时代。

经济发达国家已经建立了较完善的考试专业机构，很多机构根据自己的职能建立了数字化试卷分析系统，但这对目前中国学校来说并不符合国情。试卷分析在国内属于起步阶段，以往对学生考卷的分析，大多是用人工方式来完成的，操作过程周期长且容易出错。引进计算机辅助工具（如Excel）后，情况有所改善，在数据量少的情况下，这些软件基本可以胜任。但是当数据量大到一定程度时，就需要专门的系统来分析和处理这些数据信息。教学质量监测与评估系统辅助分析是其必由之路，在一定意义上，它能促进成绩考核和教学管理的定量化、科学化。

2 教学质量监测与评估系统的选择、学习和分析

目前，国内比较成熟的教学质量监测与评估系统有：全通数码科技有限公司自主研发的产品MEQS，深圳海云天公司研发的海云天教育测评及教育质量评估体系以及南昌丽升信息技术有限公司的LeaScent教学质量检测与评估系统等。

教学质量监测与评估系统一般具有如下功能：（1）答题卡制作；（2）试卷扫描；（3）识别裁切；（4）试卷分发；（5）阅卷客户端；（6）数据统计报表。因其有针对性和可移植性，基本符合“教育测量学”要求的统计分析与评价功能。下面以LeaScent教学质量检测与评估系统为例，介绍学生、家长和教师使用较多的“数据统计报表”功能。

数据统计报表功能主要包括：（1）成绩报表中分析了各班各科各题的正答率、难度系数、区分度、均分、标准差，还根据试题作答情况统计出试题的闪光灯、薄弱点；（2）综合指标分析统计各班的有效人数、最高分、最低分、均分、优秀率、及格率、低分率、标准差、众数等信息；（3）分数段统计表灵活变动，可根据学校具体要求来进行设置，细分到1分一个分数段，统计年级各班均分、优秀数、及格数的排名和各分数段每个班所占的人数比；（4）分数段频数分析显示各班分数段之间的人数和年级累加总人数，附带频数分析图能直观的看出各班之间的差距；（5）考试情况统计表中详细记录了考号填涂有问题的学生姓名、考号；（6）总分排名显示每个学生各科目成绩的具体分数，总分、单科的年级排名、班级排名；（7）总分报表导出能提供给每个学生一张自己的成绩单；（8）可生成学生脱机查询库，便于学生查询自己的试卷成绩信息。

3 高三生物考试分析及对策

借助教学质量监测与评估系统对考试进行分析和教学调整，拟以“问题、反思、策略”为主线，根据系统分析结果，分析教学中存在的问题、进行反思，提出解决问题的策略，推进有效教学，提高教学质量。下面以2012年至2013学年某次生物全市模拟考试为例进行分析。

3.1 考试试题信度分析

本套试题没有超纲、试题不偏，考查内容都是高考所要求的考点。重点考查了本学科的核心知识（光合作用、呼吸作用、细胞分裂遗传的基本规律、基因表达、可遗传变异的类型、基因工程、现代生物进化理论内环境稳态的调节机制、二次免疫、生态系统的功能，DNA的粗提取和蛋白质的分离，生态工程的原理，探究实验）；试题分布广泛（细胞结构和功能、减数分裂、种群和群落没有出题）且较合理，难度适中，基本没有学生做过的原题，多为改编试题，无特别新颖试题（高考中的新材料题）。着重考查学生对知识的理解能力、分析能力、应用能力和实验探究能力，在核心知识和能力考查方面、题型、题量、试卷编制等都符合高考的要求或与高考一致，因此，总体来说本套试题具有较好的可信度。

3.2 考试情况及分析

从考试均分看：本次考试总体情况良好，考试成绩与兄弟学校考试成绩比较可以看出，均分高出约11分，如果排除阅卷不统一造成的误差，至少均分也要高出5分以上；仅从客观题（选择题）来看，我校的均分比其他学校的均分高约20%。

从临界生（是指上一本边缘的学生）的转化情况看：临界生工作取得了明显的效果，各个班级上次的临界生这次都有不同程度的转化，如2班，上次班主任确定的9个临界生中，已经有6人被转化，补差工作也有明显的效果，参加补差的学生都有不同程度的提高。

由此可知，本次考试有明显的进步，可以说取得了良较好的成绩。但是通过学生各试题的得分情况分析、学生答题卷的分析以及对答卷的面批、和学生面谈的综合分析，还存在许多问题，下面就学生本次考试及学习过程中的问题进行分析。

3.3 问题诊断分析

3.3.1 易错题的分析

试卷第3题：占人类基因组中近一半的“垃圾”DNA之前一直被认为是没有意义的，科学家新发现一种酶，该酶能在基因组的任何位置中“剪切”和“黏贴、垃圾”DNA，

而“垃圾”DNA的移动对细胞会产生影响。下列关于说法错误的是（）。

A 该酶的成分可以是蛋白质或脂质

B 该酶作用于磷酸二酯键

C 该酶是由活细胞产生的有机物

D 该酶有高效性和专一性

分析：本题均分为2.9分（满分4分），难度系数0.72，区分度0.28。

考点分析：本题考查酶的化学本质（种类），酶的作用特点（高效性、专一性）。题干给予最新的科研成果，选项中设置干扰项，着重考查学生信息获取能力以及运用相关生物学知识规律推理判断能力。

错因分析：错误选项B（7人）、C（23人）、D（144人）。

学生错误集中在D选项的主要原因：（1）知识方面：知识点（酶的本质-蛋白质/RNA）遗忘，也有不少思维敏捷的同学认为此酶可能是新发现的全新的酶类，不同于已知的任何一种酶类，误认为A正确；（2）能力以及应考策略方面：本题给予新信息，题目中设置对应的干扰项，对学生新信息获取以及排除干扰能力有一定要求。题干“该酶在基因组任何位置”，选项D“专一性”，不少同学将该酶与限制酶比较，认为材料中的信息已经了此酶的专一性。酶的专一性有绝对专一与相对专一之分（簇专一，键专一等），不少同学对酶专一认识不足，在信息与干扰下选择D。

3.3.2 易错题的诊断与矫正试题

（对应试卷第3题）当某种RNA存在时，生物体内的某种化学反应能正常进行，当这种RNA被有关的酶水解后，此种化学反应的速率便慢了下来。由此可以说明：

A RNA是核酸的一种

B RNA也可起生物催化剂的作用

C RNA主要存在于细胞质中

D RNA是该种生物的遗传物质

正确答案B：此题考察酶的化学本质，题目中给予新的信息，要求学生根据信息做相关判断。考察的知识点，能力要求与试卷试题高度吻合。

3.4 反思和体会

（1）进一步落实学生知识结构的形成。以教材为蓝本，先按每节知识为单位，引导学生构建知识体系，然后，再以章为单位构建。最好的方式是引导学生自己构建，充分发挥学生的主体作用，老师不要包办。

（2）狠抓核心概念的教学。对核心概念不仅要从概念的内涵、外延，讲清楚、将透彻；而且，尽量将相关概念联系起来，通过比较、分析，加深学生对核心概念的理解，避免学生对核心概念的混淆。

（3）始终坚持“以培养学生的能力为主”的教学思想。在今后的复习过程中，根据教学的具体内容，围绕考纲要求的十一种能力，有计划、有步骤的一一加以落实。尤其要把学生对知识的迁移能力、从文字、图表中获取知识的能力，实验探究能力、审题和答题能力放在首位。

（4）重视对临界生的面批、面谈工作。通过面批临界生的答卷和相互交谈，将“掌握学情、落实教学方法”真正落到实处；准确把握学生存在的具体问题：能力、方法、思路、技巧等。确定知识的难点、重点和易错点，落实矫正的具体措施；使我们的教学更加具有针对性。

参考文献

[1] 郑均辉.试卷分析系统的研究与实现[Z].2010.

[2] 刘颖梅，罗键，高红英，等.高三生物第一轮复习教学反思[J].生命世界，2010（1）：95-96.

[3] 徐殊均.信息技术与高三生物自主学习整合的实证研究[Z].2011.

[4] 陈熙.试卷分析与评价的指标体系及其应用[J].西北医学教育，2006，14（5）：589.

篇7

关键词：美术；教学检测；鼓励性评价

根据美术学科的特点及教学要求，美术学科的检测和评价采取以形成性检测和评价为主的方式进行。形成性检测和评价即是教学过程之中实施的教学检测和评价。它是相对终结性评价而言的。形成性评价的主要功能不在于鉴定分等，而是取得教学目标达成与否的反馈信息，诊断教学疑难，以便调整、改进教学过程。同时，提供反馈信息，促进学生学习。终结性检测和评价是指在期末的课程结业检测和评价。所涉及的内容为整个学期内的全部学习内容。其目的是帮助教师对本学期美术教学和学生美术学习的基本情况做出客观的评价。从中获得改进教学、提高质量的信息，增强学生学习的信心。

美术学科的检测和评价包括美术基础知识认知、美术能力、学习情感三个方面。这三个方面既是相对独立的，又是不可分割的整体。只有将三方面检测和评价的结果综合为一体，才能形成对个体学生美术学习水平全面有效的评价。

一、美术学习情感检测和评价的内容与要求

1.学生的学习过程是智力因素与非智力因素共同参与、相互作用的过程。学生的学习效果同样与非智力因素的参与状况密切相关。学习中的非智力因素同本评价方案中所指的学习情感是基本一致的。学习情感主要包括学生在学习方面的兴趣、动机、意志、毅力和习惯等品质。对学生美术学习情感的评价，主要通过对学生完成课堂练习符合要求的程度、课上参与学习的表现以及课前为能实现课上顺利学习所做的学具准备情况等可观测的外显行为进行考察。

2.美术学习情感评价的标准。

探究型∶自觉主动地准备齐每节课所需要的美术学具，上课摆放学具有条理；课上学习注意力集中，积极思维，主动参与，兴趣浓厚；按要求认真完成练习。探究型为优。

愿意型∶在教师或家长的提醒和督促下，能带齐美术学具；学习态度较认真，有一定自控能力，愿意回答教师的课堂提问；能完成课堂练习作业。愿意型为良。

接受型∶学具准备有时不齐全，但接受教师的提醒能够改正；学习注意力有时不够集中，但无厌学表现，能坚持正常学习；对完成课上练习有时不够认真，但在教师的指导督促下基本能完成作业。接受型为合格。

二、美术学习情感评价主要以鼓励为主

所谓鼓励性评价，就是教育者着眼于发现学生的优点和长处，观察学生的细微变化，寻找闪光点，创造一个支持性的环境，不断增强学生成功的愿望，从而最大限度地调动学生的积极性。

前苏联的一位心理学家研究指出，95%以上的人有自我贬低的倾向。那么，如何运用鼓励性评价，激发学生的学习兴趣，增强信心，改变“学习困难学生”的失败心态呢？

1.教师对学生要有积极的期望和要求。教师的期望来源于正确的教育思想，教师要相信“学习困难学生”是有潜能的，他们的潜能是可以发展的。如果教师总是认为学生笨，教不会，带着这种消极的态度去从事教育，就会有意无意地把“这类学生好不了”的想法强加于学生，使整个教育一开始就失败了。

2.教师多方面为学生创造成功的机会，诱导学生参与教育教学活动。

积极的期望和要求，能对学生起到导向和激励作用，教师要善于为学生创造种种成功的机会，诱导学生参与到教育教学活动中去，发现和发展自己，把期望和要求变成有形的事实。教师既可以在课内运用“低起点、小台阶、多活动、快反应”的方法，，也可以在课外开展多种形式的有层次的适合“学习困难学生”特点的活动，为他们发展兴趣爱好、发挥特长、取得成功提供机会。

3.营造氛围、诱发好奇心。好奇心是兴趣的先导，是人们积极探索新奇事物的倾向，是人类认识世界的动力之一，对于形成动机有着重要的作用。富有创新精神的人往往有着强烈的好奇心。根据这一心理特征，在美术教学中运用合理的手段、恰当的措施，营造良好的创新氛围，诱发学生的好奇心，激发他们对新知识的渴望，从而培养学生的创新能力。

4.突破定势、鼓励发散。没有发散就无所谓创新，定势心理制约着人的发散思维。学生从刚刚入学我就发现，大部分的孩子接受的美术教育基本上以临摹或学习简单绘画技法为主。存在思维上的定势。如果不打破这些定势，思维就不会活跃，久而久之就丧失了创新意识。所以我在教学中，特别鼓励学生的发散性思维。一个事物，力求学生从全方面、多角度地去表现它。

5.启发想象、培养创造。学生想象能力的培养是学习创新方法的一种重要手段。在美术教学中，我尽可能地利用各种方法启发学生的联想和想象，培养创新能力。

进行鼓励性评价，必须制订不同层次的不同标准。各个层次的学生都能大面积地受到表扬和鼓励，有利于调动学生积极性性，而且要求各层次的学生都应向高一层次前进，这有利于学生不断进步，因此，我们要实行适应学生起点的鼓励进步的评价。

三、实施鼓励性评价的主要做法是

1.根据不同学生的水平确定其要达到的最近区域目标。在美术教学中同一项练习，教师可根据不同学生的不同水平制订几个评价标准。例如：上素描静物课，我把全班学生分成A、B、C几个等级小组，在不同等级内提出不同要求。C级要求造型准确，能表现型准确，物体立体感、空间感、质感比较强。如符合要求就给高分，当学生达到这一标准后，即可升入高一级。

2.对学生在原有基础上的每一点进步，或对某些长处有所发展的学生都给予鼓励。如：作品有创新，色彩效果好，造型准确，制作精巧等等都给予表扬和鼓励。使学生在学习上逐步上台阶，不断地由小成功积为大成功，有利于消除学生的自卑感，增强信心，激发内在的学习主动性。

3.在教学评价中，除了采用教师评价之外，还可以采用学生群体评价、学生自我评价等多种评价方式。学生们进行互评除了受评者得益之外，评价他人美术作品的学生也可以从中吸收别人的长处，还能培养审美能力和评价能力。

在教学中采取了对不同水平的学生制定不同的学习目标和评价标准。如：素描石膏像练习，有的学生造型基础较差，虽每次都能认真完整地按时完成作业，但造型总是不准。我发现这一问题后，对造型能力差的学生制定了与其他学生不同的练习目标和评价标准。我要求他目前石膏像练习主要训练造型能力，每6课时完成一幅形体结构造型准确、不涂明暗调子的石膏像作业，反复练习一阶段。虽然这位学生只完成了几幅半成品，但只要造型准确就给高分，以资鼓励。这样集中突破薄弱环节效果很好。经过师生的共同努力，学生的素质得到全面提高，

实践证明：学生的成功源于学生的信心，学生信心的形成往往源于教师的鼓励。所以，教师在教学中运用鼓励性评价有益于学生树立自信心，积极进取，在学习上取得新的成功。

参考文献：

[1]《赏识你的学生》孟繁华主编教育科学出版社 2010年12月第1版.

[2]《美术概论》王宏建袁宝林主编大象出版社 2014年10月第1版.

[3]《青年心理测试与辅导》完美人格编写组中国时代经济出版社，2002年9月第1版.

[4]《探索者的歌-北京特级教师素质教育报告》北京市教育委员会编同心出版社，2002年9月第1版.

篇8

金融部门评估规划和压力测试简介

金融部门评估规划简介

由于1997年亚洲金融危机的影响，国际货币基金组织和世界银行于1999年联合推出并通过金融部门评估规划(FinaglCialSector Assessment Programme，缩写为FSAP)，该规划是通过对金融部门的稳健性、金融监管结构的效力和能力以及金融部门基础设施的健康性进行全面的评估，旨在找出金融体系的优势和薄弱环节，进而使金融体系在短期和长期的运营过程中能够更有弹性地应对冲击，并确定发展的优先顺序和设计合适的应对策略。

一个稳健的金融体系包括充分的宏观审慎监测、有效的监管和完善的金融基础设施三大要素，FSAP就是从这三大要素来评估一个经济体的金融体系是否稳健。具体如下：

宏观审慎监测评估。FSAP对宏观审慎监测的评估包括三个方面：一是对宏观经济因素的评估，即识别影响金融体系稳定的潜在宏观经济风险，如经济增长下滑、国际收支不平衡和外部经济脆弱、通货膨胀、利率和汇率的急剧波动、信贷和资产价格上涨、金融市场的传染效应及其他因素(如指令贷款和投资，政府对银行体系的隐性补贴)等等。二是通过对金融稳健性和市场指标的分析，来衡量金融体系的脆弱性以及消化损失的能力。其中金融稳健性指标(FSIs)包括资本充足性指标、资产质量指标、稳健管理性指标、盈利性指标、流动性指标、市场风险指标等；市场指标(MBIs)包括股票价格(或收益率)、利率、汇率、住房价格(或收益率)等指标，同时也包括居民和企业部门的健康指标(如负债股本比率)等。虽然FSIs是宏观审慎监管分析的基础，但由于其是以资产负债表和损益表为基础的，因此具有时间追溯性、低频率和仅能反映表内信息等局限性，而MBIs涵盖了市场参与者对于特定资产或衍生品价格的判断和理解，其前瞻性、高频率和对金融动态的市场判断和预测是对FSIs很好的补充。三是压力测试，即分析极端但可能发生的市场冲击给金融体系资产负债表造成的影响(详见表1)。

有效监管评估。FSAP对有效监管的评估是对银行、保险、证券市场的关键性监管标准进行评估，具体的评估标准主要有：巴塞尔有效银行监管核心原则、国际保险监管协会(IAIS)保险核心原则和国际证监会组织(IOSCO)证券监管目标核心原则等。

金融市场基础设施评估。FSAP对金融市场基础设施的评估包括对货币和金融政策透明度、支付体系、反洗钱、会计准则、公司治理和安全网等方面的评估。具体的评估标准主要有：货币和金融政策透明度的良好实践准则(MFP)、支付体系核心原则和证券结算体系建议(CPSS)、反洗钱与反恐融资(AML-CFT)法律准则、会计和审计标准等。

压力测试简介

根据IMF(2004)的定义，压力测试(Stress Testing)是指一系列用来评估一些异常但有可能发生的宏观经济冲击对金融体系脆弱性影响的技术总称。压力测试是在FSAP框架下对FSAP的评估进行的补充，可以进一步证实FSAP的一些结论。在微观领域，一方面压力测试具有能评估某些小概率事件对银行经营或其所拥有的投资组合可能造成的影响的优势，可作为金融稳健性指标(如CAMELS)中风险度量工具VAR的重要补充；另一方面压力测试能帮助金融监管者更好地监管个别金融机构的市场风险和信用风险。因此，发达国家监管当局都要求所属银行遵循巴塞尔银行监管委员会的规范建议进行压力测试的工作，并在银行业年报中加入压力测试分析，使投资者对银行业的未来发展、前景及风险，有更深层次的认识，以达到资讯透明化和公开化的原则。

2009年1月，巴塞尔银行监管委员会公布了《稳健的压力测试实践和监管原则》征求意见稿。该文件是巴塞尔委员会首次的专门的压力测试监管文件，系统、全面地阐述了对银行和监管机构的压力测试要求。文件要求银行开展覆盖全行范围内各类风险和各个业务领域的压力测试，提供一个全行全面风险的整体情况，以便促进风险识别和控制，弥补其他风险管理工具的不足。

压力测试的风险类型和运用领域。20世纪90年代初期以来，压力测试在国际银行业得到广泛应用，已成为银行等金融机构重要的风险管理工具，其测试的风险类型、可能的冲击和运用的领域如表1所示。

压力测试的步骤和方法。实施压力测试主要包括以下五个步骤：一是根据金融体系面临的外部环境确定风险暴露情况及内外数据的可得性，定义纳入压力测试的机构和资产范围；二是以可能发生的经济冲击为基础，假定相应的冲击类型，并进行压力情景设计与校准；三是选择恰当的研究方法，定期进行压力测试；四是对压力测试的结果进行分析并进行解释，主要分析每一种相关的经济冲击为什么会对金融体系产生不利影响以及如何改进；五是采取监管行动，即根据分析结果决定采取的预防补救措施，以处理测试中发现的潜在风险。

压力测试的分析方法主要包括敏感性分析方法和情景分析方法，在具体的分析过程中还可能运用宏观经济计量模型分析，如向量自回归模型(VAR)等。敏感度分析即单一因素分析，主要考虑的因素是利率的变动以及汇率的变动，各国对于上述因素变动幅度的设定是不同的。情景分析即多因素分析，主要考虑资产(股票、房地产)价格下跌以及GDP下降造成的冲击，表现为多种因素同时发生的情况下，银行等金融机构的盈利情况、资产质量和资本充足情况等。情景分析又分为历史情景和假定情景两种类型：历史情景运用在特定历史事件中所发生的冲击结构进行压力测试，假定情景使用某种可预知的发生概率极小的压力事件进行测试。实际上，大多数金融机构都同时使用历史情境和假定情景测试。

金融稳定评估与压力测试的国际比较

FSAP的评估标准和结果

截至2007年，FSAP已对115个国家或地区的金融体系稳定性进行了评估，还有25个国家或地区完成了更新评估。参与FSAP首次评估和更新评估的国家数目及区域分布见表2。IMF中规定的FSAP的评估标准和准则包括BCP、CPSS、IAIS、IOSCO、CPSS-IOSCO、MFPT、AML-CFT等，虽然各国在参与FSAP评估过程中采用的标准和准则有所不同(见表3、表4、表5)，但从评估的结果来看，发达国家和地区在各项评估标准和准则的

遵守和合规方面的情况均好于发展中国家和地区。

压力测试的国际比较

国际典型的压力测试系统和实践。在FSAP项目的协助下，压力测试方法成为其成员国政策当局金融稳定性分析中广泛使用的工具。2007年7月“压力测试和金融危机模拟”(Conferenceon Stress－testing and Financial Crisis SimulationExercises)会议在法兰克福召开，IMF和欧洲各国央行官员就各国(或地区)压力测试的经验和面临的挑战进行了交流。

比较典型的宏观压力测试实践系统有IMF和世界银行的FSAP压力测试系统、英格兰银行的TD压力测试系统、奥地利央行的SRM测试系统。其中后两者都是在FSAP压力测试系统基础上发展起来的。FSAP框架下的压力测试主要由信贷、利率、汇率、流动性、操作风险及风险传染模块组成。风险情景、影响指标的设计依赖于各国的宏观经济环境和数据可得性。根据IMF对各国金融稳定报告的统计，截至2005年底，各国金融稳定报告中包括压力测试的占总体稳定报告的百分比为55％(见表6)。各国开展FSAP压力测试覆盖的机构也有所不同，有的国家是针对所有银行，有的国家只针对大银行或具有系统性重要性的银行进行压力测试，还有的国家压力测试的机构包括保险公司和养老基金(见表7)。

英格兰银行的TD系统比较成熟，该测试系统强调由上到下法，强调对多重金融风险传染渠道的分析，研究市场微观主体(居民、企业、政府、银行金融机构和非银行金融机构)的相互作用，但实践中对数据要求很高。本次金融危机中对北岩银行的倒闭具有一定的预警作用。奥地利央行的SRM测试系统采用银行间双边头寸网络模型来描述传染效应，在实践应用中对数据的要求不是很高，可操作性较强，但是该模型只考虑了银行间简单的相互关系，对传染机制考虑不多，也没有考虑反馈效应。

目前，各国在运用各种系统进行压力测试的过程中主要存在如下趋势：一是国家当局和单个金融机构在设计和运用压力测试中发挥着更大的作用；二是对金融机构的覆盖范围已经增加到包括非银行的金融机构；三是数据的可得性经常会决定使用的方法和测试的复杂程度；四是各国和地区越来越多的使用宏观模型来校准相适应的宏观经济情景。

中国的实践

随着FSAP已逐步成为被广泛接受的金融稳定评估框架和国际货币基金组织加强对其成员国监督的重要手段，中国也在积极推进相关工作。2003年9月，中国银监会响应FSAP项目要求在国内各商业银行开展利率变动、汇率变动、准备金调整、不良贷款变动对商业银行资本金和盈利的影响四个子课题的压力测试。其模型设计分别由四大国有商业银行负责，银监会汇总修订后，发各银行自主开展压力测试，并撰写压力测试报告上报银监会。内容包括测试的目的、方法、数据口径和来源、结果、原因、对策和对抗风险能力的评估等。并在2004年实施的《商业银行市场风险管理指引》中明确了有关压力测试的设计、实施等方面的技术指标。其后实施的相关部门法规中压力测试都是重要的组成部分。2007年次贷危机发生后，银监会再次要求各个银行对房地产贷款进行了地产贷款综合风险和个人贷款专项风险两方面的压力测试。2008年又选择部分中小银行对流动性进行压力测试的跟踪监测。同时，对于2009年底实施新资本协议的9家试点银行来说，压力测试更是有严格的要求。

但受限于国内银行风险管理技术和人才的不足，对压力测试的推广工作收效不大。2007年银监会再次组织各大商业银行到普华永道接受压力测试技术培训。同年由中国人民银行和IMF在大连又联合举办了“FSAP和金融稳定分析国际研讨班”，组织各省市分行系统学习FSAP和压力测试的原则和操作方法。2008年初，总理接见IMF总裁卡恩时，表达了中国加入FSAP的意愿。虽然我们在压力测试方面已经有了一个新的开端，但中国人民银行公布的《金融系统稳定性报告(2008)》的内容仍缺少压力测试内容，这不利于我们对我国金融体系的稳定性做出正确评价，并据此制定出符合实际经济金融情况的政策。

我国商业银行在开展压力测试的过程中，主要面临着以下问题：一是数据的可得性和数据质量很大程度上制约了压力测试的开展；二是我国目前尚缺乏一套符合中国国情的、严谨的、能够通过各种统计检验的宏观经济模型，因此在进行压力测试的情景设定时通常套用他国模型，很少加入我国特殊的因素变量，情景设定的偏差会影响后续压力测试的质量；三是人才储备方面有待加强，鉴于FSAP和压力测试的复杂性和系统性，无论是中央银行还是金融机构，都需要有雄厚的人力资本才能完成，而我国当前金融行业中从事风险管理的队伍仍然比较薄弱。在金融全球化的浪潮下，中国要顺利加入FSAP和有效开展压力测试，必须尽快解决好以上问题。

经验借鉴和政策建议

中国作为最大的发展中国家，经济、金融体系都处于不断变化和成熟的阶段。尽管到目前为止亚洲金融危机和本次经济危机对我国的金融系统都没有造成太大的冲击，但是必须正确的认识这种幸免的根本原因不是银行等金融机构风险管理能力超出国际先进银行，而是相对独立和保守使然。但是世界经济一体化和金融创新是未来发展的主流，中国银行业必须面对这一挑战，没有先进的风险管理系统和方法是绝对不行的。FSAP项目和FSAP框架下的压力测试为金融部门的稳定和发展问题提供了一个综合而客观的分析方法，有助于识别金融体系的发展优势、弱点和潜在的风险，明确发展需求和需要改善的金融基础设施，帮助制订并实施行之有效的政策措施以增强金融体系应对冲击的能力，提升金融部门对经济增长的贡献度。所以，已经在规模上处于世界领先地位的中国银行业要实现可持续发展，在风险管理方面应该积极地参与国际金融稳定和风险管理的交流与合作。一方面结合目前推行的新资本协议(Basei II)的试点工作，按照国际标准建设银行全面风险管理系统，包括压力测试系统，从技术层面上加强交流，借鉴国际先进经验。另～方面在时机成熟时积极加入FSAP，这将会给金融部门一个客观的评价和综合的审视，有利于识别金融部门风险并制定相应的政策措施，对于银行自身的风险管理和银行业的监管都有很大的促进作用。同时在国际相关规则的制订中反映中国的声音。但是也要注意到FSAP的评估建议不能完全考虑到国家的特殊性，因此，在具体实施中，应该尤为注意以下几点：

关于新型风险管理技术应用的规范化。尽管压力测试技术的推广和应用要立足于我国的微观金融机构，但监管当局应协助金融机构树立风险管理理念，积极学习先进的风险管理技术，逐步使压力测试等新型风险管理技术的应用规范化。这需要政策当局结合金融实务界现行的需求与做法，制订符合本国金融业发展要求的规范标准，要求各金融机构根据自身的风险特点制订各自的压力测试方案，并建立定期检查和汇报制度。由监管当局出面组织压力测试的相关培训，帮助各金融机构建立压力情景所需的风险因子模型。

关于数据可得性。商业银行要尽快着手建立压力测试数据库，积极推广压力测试技术。数据库的建设属于基础性工作，它是展开量化分析的前提条件，对于开展压力测试而言更是不可或缺。要尽可能长的收集经济金融时间序列数据，对口径发生变化的，须采用科学的方法加以调整。

关于宏观经济模型。加大宏观经济模型的开发力度，构建和完善中国金融稳健性指标体系(FSI)和早期风险预警指标系统。在积极借鉴国外压力测试技术的同时，要努力消化吸收，进行技术创新，开发出符合我国国情的宏观压力测试系统。建议由中央银行和银监会牵头，组织金融机构、高校、研究机构等部门的专家学者，成立课题攻关小组，在借鉴国际经验的基础上，结合中国国情，尽早开发出我国的宏观压力测试情景和结构模型。构建和完善中国金融稳健性指标体系(FSI)和早期风险预警指标系统，加快中国金融稳定与金融监管数据库建设，为我国宏观压力测试提供技术保障和数据支持。

关于压力测试分析报告及其保密性。在条件成熟的情况下，可借鉴发达国家先进风险管理经验，将压力测试部分分析结果作为金融机构财务报告的项目之一。对于保密性要求，可参照英国及加拿大的现行做法，动态清偿能力及动态资本充足性测试的结果被列为机密文件，测试结果报告仅交送监管机构及董事会，并不对外公布。动态财务分析及其他方面的专项压力测试报告，可列入公开财务报告，使股东及其他社会各界对金融机构的未来发展前景及风险，有更深的认识。

免责声明：以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。

推荐范文