时间:2023-07-30 08:52:05
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇数据统计分析学习,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
一、激发学生兴趣
美国教育学家布卢姆曾提出:“学习的最大动力,是对学习材料的兴趣。”由于小学生年龄特征和性格爱好的特点,他们会对自己感兴趣的内容拥有极大的研究和学习动力,并且能够在这种动力的驱使下促进自己的能力提升。因此,教师必须抓住小学生的这种特点,充分结合小学生喜闻乐见的生活内容进行课程的导入、设计和教学,使得他们能够在兴趣的激励下实现深入的学习,实现知识的有效掌握。
举例而言,在引入“统计”的课程时,教师可以询问学生:“假期就要到了,电视台打算在这个阶段播一部大家都喜欢看的电视剧,但是因为时间限制,只能从《西游记》《还珠格格》和《武林外传》中选一部播出。大家认为电视台怎样就知道大家喜欢哪部电视剧了呢?”这样的话题可以立即激发小学生的兴趣,并帮助电视台出谋划策。在这个过程中,教师可以适时引入统计的概念,让学生了解统计对于生活的重要性,拥有学习和研究的热情,从而提高学生的学习效率。
二、借助生活经验
由于统计与数据分析的知识在小学数学教学中占据的内容相较于代数、几何而言较少,并且可以利用的素材也不像其他知识那样广泛。因此教师应当积极挖掘相关知识在现实生活中的资源,让学生能够根据自己的生活经验解决问题,实现学习,并发现统计与数据分析在生活中的应用价值。
例如,教师可以引导学生调查平时最喜欢吃的零食和水果,从而确定在新年联欢会之前采购怎样的食物。学生可以根据自己的经验进行调查表的制作,并在调查后进行数据的整理和总结,最终确定采购的食物,这样不仅可以让学生利用统计的结果进行决策的制定,还可以解决身边的现实问题,发现知识的价值,提高学习的热情和效率。
三、创设教学情境
统计与数据分析的知识源于生活,在学习和使用的过程中也要回归生活。然而在学习的过程中,师生不可能将所有的教学活动都放在实际的生活中,这就要求教师创设相应的教学情境。对此,教师可以在应用题和例题的讲解以及知识的传授中充分创设教学情境,让学生在真实的情境中让抽象的知识变得具体、生动,从而降低知识的学习难度,实现学习效率的提升。
比如,在讲解关于“概率”的知识时,教师可以创设这样的情境:购物中心进行有奖活动,买够500元的顾客可以抽奖一次,每天设置一等奖1名、二等奖3名、三等奖6名、纪念奖30名。已知每天满足抽奖条件的顾客为200人,那么每个顾客抽中一等奖的概率是多少,能够中奖的概率是多少。这样的情境让知识变得更加形象、具体,学生在学习的过程中也更容易接受,教师的教学效率能够有效提升。
四、开展多样活动
关键词:数据分析;统计;数学;教学策略
中图分类号:G623.5 文献标志码:A 文章编号:1008-3561(2017)12-0027-01
能够根据具体问题背景选择合适的统计图是学生统计素养的一个重要内容,也是学生对数据分析能力的一个表征。扇形统计图是在学生认识了条形统计图、折线统计图后的小学阶段的最后一个统计内容,该内容增加了选择合适统计方法的难度,使“数据分析”变得尤为重要。因此,教师在教学中要以数据为载体,以学生原有知识经验为基础,引导学生展开渐进式思考,探寻统计的有效方法,培养数据分析观念。
一、引发认知冲突,点燃统计内需
学习是一种由外而内的过程,学习最大的动力来自学生心灵深处,源自于自身的认知冲突。教师在教学中创设教学情境的目的正是为了借助外部环境的刺激,引发学生的内部认知冲突,促使学生在矛盾中生成新的需要,将学习不断引向纵深。苏教版六年级下册的“扇形统计图”一课意在使学生通过联系百分数的意义,体会扇形统计图描述数据的特点。为了让学生深刻领会扇形统计图的特点,教师在教学中改变了教材的编排顺序,没有直接出示例题中的扇形统计图,而是引导学生感知数据,造成他们认知上的矛盾冲突,点燃他们新的统计内需,逐步引出扇形统计图。教师这样给学生出示例题:我国陆地总面积大约是960万平方千米,其中丘陵占9.9%、山地占33.3%、高原占26.0%、盆地占18.8%、平原占12.0%。“同学们能否根据数据设计出一个统计图反映出我国陆地各地形分布情况?”教师边出示条件边提问。学生一听说设计统计图,马上联想到以前学习的内容,有的说:“我们可以画出条形统计图。”有的说:“我们可以设计成折线统计图。”教师表扬了学生善于联系旧知的意识后说:“请同学们想一想条形图与折线图分别用来反映什么?例题中的数据表示什么含义,可以用它们来表示吗?”教师的提示唤醒了学生的数据意识,经过对数据的观察与思考,学生们一致认为:“条形统计图用来直观反映数量多少,折线统计图反映了数量的增减变化,这道题中的数据都是百分数,表达的是部分量与总量的关系,看来以前学的那两种统计图不合适。”“那该怎么办呢?”一个女生迫不及待地问道。“是啊,我们该用怎样的图形来表示部分量与总量之间的关系呢?”教师故意装作不知,“看来我们必须另找出路了。”
二、引导自主思考,点化绘制图形
面对学生的急切心理,教师没有直接将“扇形统计图”推出,而是借助生活情境的观察感悟,引导他们自主思考,摸索出扇形统计图的特点和画法,逐步点化学生绘制出扇形统计图。“先请同学们来看一个有趣的拼盘。”教师边说边给学生展示了一张课前制作的地地形分布模型:用一个圆形塑料盘代表我国陆地总面积,在圆盘内用各种颜色的橡皮泥分别表示不同地形。教师用这个拼盘图对学生进行暗示启发,学生甲一点就通:“原来百分数关系可以用圆与扇形来表达,用一个整圆表示总量,用扇形表示各部分量。”学生乙补充道:“平原占12.0%,表示平原面积占我国陆地总面积的12.0%,我们可以用一个圆来表示我国陆地总面积,在圆内画出一个扇形表示平原面积。” 教师接着说:“同学们的悟性真高,像拼盘那样表示各部分量与总量之间关系的统计图我们称为扇形统计图。下面,就请同学们自己尝试着画出我国陆地各种地形分布情况统计图。”然后教师又引导学生根据各百分数的含义,讨论如何绘制出各个扇形。学生丙联系圆心角的知识道出了平原部分的画法:“一个圆是360°,360°的12.0%是43.2°,在圆内画出一个圆心角是43.2°的扇形就表示平原的面积了。”在学生丙的引领下,同学们迅速算出其他扇形的圆心角度数,并画出了完整的扇形统计图。
三、引领梳理反思,点醒对应思想
为了实现“教是为了不教”,教师在教学中经常引领学生梳理思路,反思学习得失,总结学习经验,使他们获得了质的提升。在学习“扇形统计图”一课的过程中,由于有了先前基于数据分析的精心引导,学生亲历了统计方法的选择与统计图的绘制,对扇形统计图的特点和作用了然于心,读懂扇形统计图自然不成问题。因此,在组织学生对统计图中的信息进行简单分析之后,教师增设了一个“回顾反思”环节,让学生回顾整个统计活动经历,使学生懂得了不同的问题背景需要用不同的数据分析方法,各种统计图的选用必须与数据意义相适应。如反映数量增减可选择折线图,要表达数量多少可选用直条图,要反映各部分量与总量之间的百分比关系可选择扇形统计图。高年级学生的类比分析能力比较强,教师让他们通过简要梳理与反思,能使他们明晰数据分析方法的选择的重要性,对数据分析方法的选择有清晰的认识,进而点醒他们的数学思想。
四、结束语
总之,统计教学是一个系统而完整的活动过程,从对问题背景的理解、对数据的解读、对统计方法的选择,再到图形的绘制等,这一切都离不开科学严谨的分析。数据分析是统计的核心,教师在统计教学中应以数据为核心,引领学生在科学分析中选择出合适的统计方法,从而圆满地完成统计任务。
参考文献:
大数据一词是由英文单词“Big Data”翻译而来。大数据时代的到来既是信息技术领域的一场持久而深刻的变革,更在全世界范围内开启了思想的剧变,从而成为引领社会实现新兴技术不断向前发展与变革的利器,深刻地影响着人们的生产与生活。“当今社会已经迈入了大数据时代,大数据已经渗透到当今所有的行业和业务领域,成为重要的生产因素。”[1]在这个宏观背景下,大数据的社会价值和科学价值的不断得到彰显与利用,给高校的教育与管理也带来了新的机遇。教育领域的大数据运用有其自身的特点,在高校的实现应当侧重从学生的学习过程、日常生活的微观表现进行测量,开展精准的“学生画像”,有效分析與预测研究对象的学业完成进度与趋势,从而为学校教育教学质量提升和学生教育管理服务提供保障。
目前,国内不少高校通过利用大数据技术,深度挖掘在校大学生的行为数据,但每个学校都因有自身不同的办学特色和现实情况,如何结合学校信息化校园建设,开展针对在校学生的行为数据分析与研究,帮助教学、学工等相关部门提供可视化图表的方式呈现数据分析结果和学业预警等相关意见,从而为学校教育与管理服务,提供决策建议与意见,具有强烈的现实意义和广阔的应用前景。
2 一卡通数据系统分析云平台
本文以围绕学院校园一卡通系统建设,开展智慧校园和智慧管理研究,通过对学生教室考勤、宿舍门禁,校园消费、上网记录、奖励资助及购水购电等信息,关联学生教务、图书及其他物联网等应用系统后台数据库,结合系统基础数据库的表结构特征和关键字段,设置相应的逻辑关系和判断条件,通过校园一卡通大数据分析云平台,从学生学业警示预警、个性化学习、上网行为、消费行为、奖惩资助和就业帮扶等六个维度,使用聚类、关系规则和序列模式挖掘等技术指标与手段,开展深度数据分析与数据挖掘,形成可视化图表的方式呈现出数据分析的描述结果,给出相关的建议结论或预警意见,供班导师、辅导员、相关职能部门查看与使用,从而为学校教育、管理与服务提供决策支持和智慧服务。[2]
3 学生行为大数据分析
3.1 学业警示预警分析
基于一卡通数据系统分析云平台关联学生教务系统,系统管理员根据权限可以实现实时查看学生个人学业完成及积欠课程的情况,各班导师或辅导员可以统计与分析相关专业学生的学业完成度统计数据,结合学生的课堂考勤、心理测评、图书借阅、重修课程、上网数据等对学生的失联、留级及预判延长学制、不能毕业等情况予以预警。根据动态分析数据,班导师和辅导员可以及时与学生本人、任课教师和学生家长取得联系,帮助学生分析和查找问题,指明努力方向。
3.2 个性化学习分析
基于一卡通数据系统分析云平台结合学生选修课程、个人兴趣与综合评估,分析学生个人现状及特点,通过大数据分析,给予相关培养建议,从而围绕校园数据资源,指导学校相关职能部门定期向学生推送个性化的网络教学资源、网络书籍与纸质图书资源、兼职与就业招聘信息等,提高课外阅读量和专业学习水平,从而实现个性化教学指导与帮助。
3.3 上网行为分析
基于一卡通数据系统分析云平台对学生的上网行为统计分析,通过对学生上网时间、上网地点、上网时长、上网内容、流量下载等数据建模,挖掘与分析学生上网行为习惯。通过统计分析日均上网或游戏时长较长的学生情况,结合学生学业完成度等,定期开展预警警示工作,班导师和各学院学团也可以有针对性的开展学风检查、建设与整顿工作,从而更好地培育优良的校风、班风与学风。
3.4 消费行为分析
基于一卡通数据系统分析云平台对校园的消费数据进行分析,发现和诊断群体消费的偏好以及潜在的问题,有效分析与预测未来消费新趋势,加强后勤服务场所的管理与引导。学校可以针对贫困生等不同身份特征人群开展分类型的数据分析,通过消费数据的挖掘,在贫困生认定和精准帮扶等方面提供可靠的数据支持,从而有效地为学工、教务后勤等部门的管理与服务提供信息数据支持。
3.5 奖惩资助行为分析
基于一卡通数据系统分析云平台对学生在校期间的奖惩资助行为分析,完善学生奖惩助困的动态分析与监控。通过及时完善相关信息,便于后期的数据统计及筛查工作,同时有利于完善贫困生的资助体系,开展贫困生精准帮扶工作,引导与管理好校园义工和勤工俭学岗位。通过全面梳理学生奖励及资助数据,能有效加强对受处分学生的动态的监控,及时受理学生处分的撤销与评议,提高受处分学生主动承担社区及义工服务的意识。
3.6 就业行为分析
基于一卡通数据系统分析云平台对全校或者部分专业提供市场就业细分,结合学生生源地区、专业特长、性格特征、个人爱好、学业完成度、能力模型及求职意向,设计就业工作模型,匹配相关用人单位及招聘信息,通过大数据实施双向精准推荐,从而更好地服务学生和用人单位。针对就业市场的大数据分析和结论,还可以为学校现有专业建设及人才培养方案的重构,提供数据支撑,从而进一步服务教学与管理工作。
4 数据分析结果评价
基于一卡通数据系统分析云平台的运用,针对应用系统后台数据库开展数据分析,通过大数据挖掘方法,开展系统总体构建设计,利用从原数据层到数据处理层,再到数据库仓层,最终到终端用户层的框架模型,维度分析因果和映射关系,辅助以灵活可视化的查询界面、图形与图表等形式,呈现出研究对象的学习、上网、消费、奖惩、资助、阅读、就业等日常行为特征,分析其行为特征与学校智慧化校园管理与监督之间的关系,为学校的教育、教学与管理工作提供决策建议和意见。
4.1 有助于学校精细化管理
通过平台,理清管理职责与权限,加强工作的细化与内化,逐步实现学生的精准化管理,既提高了工作的效率,又提升了工作的水平。通过信息系统,改变原有相对粗放的管理模式,量化分析学生的学习行为和日常表现,洞察学习规律,促进管理工作横向到底、纵向到边。[3]
4.2 有助于学校精准化服务
通过平台,运用数据监测,分析与定位重点帮扶的班级及学生,积极关注情况特别学生群体,帮助学业预警、心理异常、经济特困、就业困难、违纪处分等类型的学生分析困难与问题,找到走出困境的途径与方法,从而将帮扶工作做到精准到位,帮助每个学生充分发展。
4.3 有助于学校精心化育人
通过平台,透视教育数据,优化管理与评价机制,建立全方位育人体系,为学校及學生个性化教育和教学干预行为进行准确预测与服务,加强部门间的联动与沟通,从而推进学校决策的系统化与科学化,打造全员、全过程的育人格局,打造精心育人工程。
关键词:大数据;统计学;数据分析;抽样理论;理论
重构随着信息科学技术的高速度发展,当代获取和储存数据信息的能力不断增强而成本不断下降,这为大数据的应用提供了必要的技术环境和可能.应用大数据技术的优势愈来愈明显,它的应用能够帮助人类获取真正有价值的数据信息.近年来,专家学者有关大数据技术问题进行了大量的研究工作[1],很多领域也都受到了大数据分析的影响.这个时代将大数据称为未来的石油,它必将对这个时代和未来的社会经济以及科学技术的发展产生深远的意义和影响.目前对于大数据概念,主要是从数据来源和数据的处理工具与处理难度方面考虑,但国内外专家学者各有各的观点,并没有给出一致的精确定义.麦肯锡全球数据分析研究所指出大数据是数据集的大小超越了典型数据库工具集合、存储、管理和分析能力的数据集,大数据被Gartner定义为极端信息管理和处理一个或多个维度的传统信息技术问题[23].目前得到专家们认可的一种观点,即:“超大规模”是GB级数据,“海量”是TB级数据,而“大数据”是PB及其以上级别数据[2].
一些研究学者把大数据特征进行概括,称其具有数据规模巨大、类型多样、可利用价值密度低和处理速度快等特征,同时特别强调大数据区别于其他概念的最重要特征是快速动态变化的数据和形成流式数据.大数据技术发展所面临的问题是数据存储、数据处理和数据分析、数据显示和数据安全等.大数据的数据量大、多样性、复杂性及实时性等特点,使得数据存储环境有了很大变化[45],而大部分传统的统计方法只适合分析单个计算机存储的数据,这些问题无疑增加了数据处理和整合的困难.数据分析是大数据处理的核心过程,同时它也给传统统计学带来了巨大的挑战[6].产生大数据的数据源通常情况下具有高速度性和实时性,所以要求数据处理和分析系统也要有快速度和实时性特点,而传统统计分析方法通常不具备快速和实时等特点.基于大数据的特点,传统的数据统计理论已经不能适应大数据分析与研究的范畴,传统统计学面临着巨大的机遇与挑战,然而为了适应大数据这一新的研究对象,传统统计学必须进行改进,以继续和更好的服务于人类.目前国内外将大数据和统计学相结合的研究文献并不多.本文对大数据时代这一特定环境背景,统计学的抽样理论和总体理论的存在价值、统计方法的重构及统计结果的评价标准的重建等问题进行分析与研究.
1传统意义下的统计学
广泛的统计学包括三个类型的统计方法:①处理大量随机现象的统计方法,比如概率论与数理统计方法.②处理非随机非概率的描述统计方法,如指数编制、社会调查等方法.③处理和特定学科相关联的特殊方法,如经济统计方法、环境科学统计方法等[7].受收集、处理数据的工具和能力的限制,人们几乎不可能收集到全部的数据信息,因此传统的统计学理论和方法基本上都是在样本上进行的.或者即使能够得到所有数据,但从实际角度出发,因所需成本过大,也会放弃搜集全部数据.然而,选择最佳的抽样方法和统计分析方法,也只能最大程度还原总体一个特定方面或某些方面的特征.事实上我们所察觉到的数据特征也只是总体大量特征中的一小部分,更多的其他特征尚待发掘.总之,传统统计学是建立在抽样理论基础上,以点带面的统计分析方法,强调因果关系的统计分析结果,推断所测对象的总体本质的一门科学,是通过搜集、整理和分析研究数据从而探索数据内部存在规律的一门科学.
2统计学是大数据分析的核心
数的产生基于三个要素,分别是数、量和计量单位.在用数来表示事物的特征并采用了科学的计量单位后,就产生了真正意义上的数据,即有根据的数.科学数据是基于科学设计,通过使用观察和测量获得的数据,认知自然现象和社会现象的变化规律,或者用来检验已经存在的理论假设,由此得到了具有实际意义和理论意义的数据.从数据中获得科学数据的理论,即统计学理论.科学数据是通过统计学理论获得的,而统计学理论是为获得科学数据而产生的一门科学.若说数据是传达事物特征的精确语言,进行科学研究的必备条件,认知世界的重要工具,那么大数据分析就是让数据最大限度地发挥功能,充分表达并有效满足不同需求的基本要求.基于统计学的发展史及在数据分析中的作用,完成将数据转化为知识、挖掘数据内在规律、通过数据发现并解决实际问题、预测可能发生的结果等是研究大数据的任务,而这必然离不开统计学.以大数据为研究对象,通过数据挖掘、提取、分析等手段探索现象内在本质的数据科学必须在继承或改进统计学理论的基础上产生.
统计数据的发展变化经历了一系列过程,从只能收集到少量的数据到尽量多地收集数据,到科学利用样本数据,再到综合利用各类数据,以至于发展到今天的选择使用大数据的过程.而统计分析为了适应数据可观察集的不断增大,也经历了相应的各个不同阶段,产生了统计分组法、大量观察法、归纳推断法、综合指标法、模型方程法和数据挖掘法等分析方法,并且借助计算机以及其他软件的程度也越来越深.300多年来,随着数据量以指数速度的不断增长,统计学围绕如何搜集、整理和分析数据而展开,合理构建了应用方法体系,帮助各个学科解决了许多复杂问题.现在进入了大数据时代,统计学依旧是数据分析的灵魂,大数据分析是数据科学赋予统计学的新任务.对于统计学而言,来自新时代的数据科学挑战有可能促使新思想、新方法和新技术产生,这一挑战也意味着对于统计学理论将面临巨大的机遇.
3统计学在大数据时代下必须改革
传统统计学是通过对总体进行抽样来搜索数据,对样本数据进行整理、分析、描述等,从而推断所测对象的总体本质,甚至预测总体未来的一门综合性学科.从研究对象到统计结果的评判标准都是离不开样本的抽取,完全不能适应大数据的4V特点,所以统计学为适应大数据技术的发展,必须进行改革.从学科发展角度出发,大数据对海量数据进行存储、整合、处理和分析,可以看成是一种新的数据分析方法.数据关系的内在本质决定了大数据和统计学之间必然存在联系,大数据对统计学的发展提出了挑战,体现在大样本标准的调整、样本选取标准和形式的重新确定、统计软件有待升级和开发及实质性统计方法的大数据化.但是也提供了一个机遇,体现在统计质量的提高、统计成本的下降、统计学作用领域的扩大、统计学科体系的延伸以及统计学家地位的提升[7].
3.1大数据时代抽样和总体理论存在价值
传统统计学中的样本数据来自总体,而总体是客观存在的全体,可以通过观测到的或经过抽样而得到的数据来认知总体.但是在大数据时代,不再是随机样本,而是全部的数据,还需要假定一个看不见摸不着的总体吗?如果将大数据看成一个高维度的大样本集合,针对样本大的问题,按照传统统计学的方法,可以采用抽样的方法来减少样本容量,并且可以达到需要的精度;对于维度高的问题,可以采取对变量进行选择、降维、压缩、分解等方法来降低数据的复杂程度.但实际上很难做得到,大数据涵盖多学科领域、多源、混合的数据,各学科之间的数据融合,学科边界模糊,各范畴的数据集互相重叠,合成一体,而且大数据涉及到各种数据类型.因此想要通过抽样而使数据量达到传统统计学的统计分析能力范围是一件相当困难或是一件不可能的事.大量的结构数据和非结构数据交织在一起,系统首先要认清哪个是有价值的信息,哪个是噪声,以及哪些不同类型的数据信息来自于同一个地址的数据源,等等,传统的统计学是无法做到的.在大数据时代下,是否需要打破传统意义的抽样理论、总体及样本等概念和关系,是假设“样本=总体”,还是“样本趋近于总体”,还是不再使用总体和样本这两个概念,而重新定义一个更合适的概念,等等.人们该怎样“安排”抽样、总体及样本等理论,或人们该怎样修正抽样、总体、样本的“公理化”定义,这个问题是大数据时代下,传统统计学面临改进的首要问题.
3.2统计方法在大数据时代下的重构问题
在大数据时代下,传统的高维度表达、结构描述和群体行为分析方法已经不能精确表达大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而且从“数据”到“数据”的统计模式还没有真正建立,急切需要一个新的理论体系来指引,从而建立新的分析模型.去除数据噪声、筛选有价值的数据、整合不同类型的数据、快速对数据做出分析并得出分析结果等一系列问题都有待于研究.大数据分析涉及到三个维度,即时间维度、空间维度和数据本身的维度,怎样才能全面、深入地分析大数据的复杂性与特性,掌握大数据的不确定性,构建高效的大数据计算模型,变成了大数据分析的突破口.科学数据的演变是一个从简单到复杂的各种形式不断丰富、相互包容的过程,是一个循序渐进的过程,而不是简单的由一种形式取代另一种形式.研究科学数据的统计学理论也是一样,也是由简单到复杂的各种形式相互包容、不断丰富的发展过程,而绝不是完全否定一种理论、由另一种理论形式所代替.大数据时代的到来统计学理论必须要进行不断的完善和发展,以适应呈指数增长的数据量的大数据分析的需要.
3.3如何构建大数据时代下统计结果的评价标准框架
大数据时代下,统计分析评价的标准又该如何变化?传统统计分析的评价标准有两个方面,一是可靠性评价,二是有效性评价,然而这两种评价标准都因抽样而生.可靠性评价是指用样本去推断总体有多大的把握程度,一般用概率来衡量.可靠性评价有时表现为置信水平,有时表现为显著性水平[8].怎么确定显著性水平一直是个存在争议的问题,特别是在模型拟合度评价和假设检验中,因为各自参照的分布类型不一样,其统计量就不一样,显著性评价的临界值也就不一样,可是临界值又与显著性水平的高低直接相关.而大数据在一定程度上是全体数据,因此不存在以样本推断总体的问题,那么在这种情况下,置信水平、可靠性问题怎么确定?依据是什么?有效性评价指的是真实性,即为误差的大小,它与准确性、精确性有关.通常准确性是指观察值与真实值的吻合程度,一般是无法衡量的,而精确性用抽样分布的标准差来衡量.显然,精确性是针对样本数据而言的,也就是说样本数据有精确性问题,同时也有准确性问题.抽样误差和非抽样误差都可能存在于样本数据中,抽样误差可以计算和控制,但是非抽样误差只能通过各种方式加以识别或判断[910].大多数情况下,对于样本量不是太大的样本,非抽样误差可以得到较好的防范,然而对于大数据的全体数据而言,没有抽样误差问题,只有非抽样误差问题,也就是说大数据的真实性只表现为准确性.但是由于大数据特有的种种特性,使得大数据的非抽样误差很难进行防范、控制,也很难对其进行准确性评价.总之,对于大数据分析来说,有些统计分析理论是否还有意义,确切说有哪些统计学中的理论可以适用于大数据分析,而哪些统计学中的理论需要改进,哪些统计学中的理论已不再适用于大数据统计研究,等等,都有待于研究.所以大数据时代的统计学必是在继承中求改进,改进中求发展,重构适应大数据时代的新统计学理论.
4结论
来自于社会各种数据源的数据量呈指数增长,大数据对社会发展的推动力呈指数效应,大数据已是生命活动的主要承载者.一个新事物的出现,必然导致传统观念和传统技术的变革.对传统统计学来说,大数据时代的到来无疑是一个挑战,虽然传统统计学必须做出改变,但是占据主导地位的依然会是统计学,它会引领人类合理分析利用大数据资源.大数据给统计学带来了机遇和挑战,统计学家们应该积极学习新事物,适应新环境,努力为大数据时代创造出新的统计方法,扩大统计学的应用范围.
参考文献:
[1]陈冬玲,曾文.频繁模式挖掘中基于CFP的应用模型[J]沈阳大学学报(自然科学版),2015,27(4):296300.
[3]卞友江.“大数据”概念考辨[J].新闻研究导刊,2013,35(5):2528.
[5]靳小龙,王元卓,程学旗.大数据的研究体系与现状[J].信息通信技术,2013(6):3543.
[6]覃雄派,王会举,杜小勇,等.大数据分析:Rdbms与Mapreduce的竞争与共生[J].软件学报,2012,23(1):32-45.
[7]游士兵,张佩,姚雪梅.大数据对统计学的挑战和机遇[J].珞珈管理评论,2013(2):165171.
[8]李金昌.大数据与统计新思维[J].统计研究,2014,31(1):1017.
[关键词]数据结构;算法;数据元素;系统应用
中图分类号:TP311.52 文献标识码:A 文章编号:1009-914X(2017)22-0102-01
1 引言
随着计算机技术日新月异的发展,程序可视化教学在教育和教学中已经显示了明显的优越性。所谓可视化教学,是指在计算机软件与多媒体技术的帮助下,将一些抽象、深奥、复杂的事物以及发展过程,用仿真化、虚拟化、实体化的方式,在教学方法中显现出来。可视化教学应用方便,可以使计算机学习者直观地观察、体验并利用这些可视化的知识模型,从而使计算机学习者较为轻松地进行课程的学习,对计算机学习者的认知能力与创新能力都会有较大的提升。
可视化教学应用于数据结构算法教学当中,可以改变传统教学方法中的枯燥乏味局面,吸引计算机学习者的注意力。可以将文字、数据、图片、源代码等其它多媒体动态地融合在一起,丰富算法的执行过程。可以让计算机学习者体会在大量不同的数据结构下,算法执行效率的差异。计算机学习者也可以充分的利用自己的课余时间进行自我学习,通过可视化教学软件研究算法的执行过程,培养计算机学习者自主学习的能力。
2 数据结构与算法系统的需求分析
传统的数据结构与算法教学方法中,有些算法的执行过程比较抽象,教师为了讲解一个算法往往需要辅助大量的图形示例。常规的板书和一般的幻灯投影授课均难以有效地展示这种抽象性和动态性,容易造成教学的低效和学时膨胀。有一些学校看到了弊端,苑⒊隽耸据结构教学网站供计算机学习者学习和交流;也有一些学校则开发出了可视化数据结构教学演示系统,将数据结构中算法的执行过程直观展示在用户面前。整体上看,这些系统在一定程度上促进了用户的学习,但还存在着一些不足,如系统以“教”为中心而设计,缺乏以用户为中心的人机交互理论的指导,学习者与软件的交互机会少且单一。因此,一个供用户自主设计算法,在实践环节上进行创新,提出自己的见解和设计,并得以验证,从根本上和底层次上深化对数据结构与算法的理解的学习平台的苑⒂任重要,互联网支撑的数据结构与算法学习系统将解决这个问题。系统能够让用户熟悉数据结构课程的核心理念,掌握相关算法内部的运行机制。本文在研究数据结构模块的基础上,将开发一个数据结构与算法学习系统,联动演绎各数据结构模块是如何有机结合的,并为用户提供自主设计算法的接口,这也是本系统区别于其他系统的一个创新点。
本文提出的数据结构与算法学习系统的设计目标为:系统良好的交互界面,包含数据结构各功能模块的算法演示,各模块详细信息查看,利用计算机图形界面技术,提供良好的用户界面。系统实现一系列数据结构的算法,用户能实时查看算法图形动态演示过程,并提供各算法和数据结构的详细中间结果信息,帮助用户进一步理解算法的执行过程和效率。系统不仅可以为用户展示数据结构算法的执行过程和中间结果,还提供编程接口让用户实现自定义算法,并对该算法进行测评,以图形界面的方式展示在用户面前。系统具备良好的稳定性,采用了多种安全机制确保服务器的稳定运行,保证了系统的安全可靠。充分运用面向对象的设计思想来设计系统模块,使其具有良好的扩展性,方便系统的后期维护和扩展。
3 数据结构的系统总体架构
系统采用典型的三层架构作为开发模型,本系统的三层架构主要划分为客户端、服务器端和服务资源层。系统客户端是一个浏览器,显示用户的使用界面,不同的用户通过浏览器向服务器端发送请求,然后接收服务器的返回信息展示在用户界面上。服务器层位于系统的服务器端,包含了数据库服务器和应用程序服务器,它提供了数据支持,实现了算法引擎和代码测评,算法引擎提供了经典算法的演示和用户自定义算法演示,代码测评负责对用户提交的源代码进行测试,并生成y试数据。服务资源层位于系统的服务器,它提供用户经典算法库和可视化类库,经典算法库包含了相关的代码以及算法演示的全过程,可视化类库提供用户的一些画图操作,让图形界面的演示更为美观。
优秀的系统必须能够满足系统的扩展和维护需求,数据结构与算法学习系统三层架构侧重于设计的简单化,简化客户端的功能,将复杂操作置于服务器端。系统的客户端,也就是浏览器层,仅仅用来显示用户工作界面和执行一些画图操作。系统的客户端是前台用户浏览器,显然,浏览器不会对测评系统产生任何影响,只要客户端浏览器支持环境就可以运行该系统,而目前的浏览器都对其进行了支持。不管客户端有多少不同种类和数目,都不会影响系统的完善和后期维护,这样就减轻了系统开发和扩展维护的难度。另一方面,系统服务器端承载了绝大多数的负载,基于此情况,服务器端的配置就必须要合理,后台服务器的一个小小的错误都有可能对系统测试服务造成不可预计的影响,因此,保证系统服务器端的安全稳定运行是十分关键的。
在本系统的三层架构中,利用基于面向对象的方法进行系统的苑,按照系统需求对服务器做了不同模块的划分,主要分为三个部分。分别是数据库、算法引擎和代码测评程序。数据库为用户提供数据支持,能够满足用户对数据的增加、修改、删除、更新等操作。算法引擎负责对算法进行解释,给用户提供算法的演示功能,并能够将用户按照系统要求编写的代码转变成图形方式展示在用户面前。代码测评程序主要对用户提交的源代码进行完整的测评,其中包括源代码编译,源代码测试和程序监控等。对于服务资源层,包括两大部分,分别是经典算法库和可视化类库。经典算法库包含了数据结构九大章节的数据结构模型和相关的算法,供算法引擎调用,在客户端上展示出来。可视化类库提供了一系列的数据结构画图操作,使算法的演示过程显得生动形象。
服务器层用分离可缩放结构,算法引擎部分与代码测评程序两者没有直接交互。本文设计的系统将算法引擎与代码测评分离开来,测评模块用多线程处理机制,极大的提高了系统的响应速度,双方通过数据库进行~合。这种结构的设计也使得测评模块的复杂性有所降低,首先,测评模块易于维护,不同模块的修改不会对其他的模块造成影响,其次,利于系统的负载均衡。如果算法引擎和代码测评在同一台服务器运行,当同时测试的用户比较多的时候,非常消耗服务器资源,容易照成服务器负载过重。用了分离可缩放结构,代码测评系统就可以单独的放在另外一台服务器上,专门负责源代码的测评工作,甚至可以放在一个集群上,有效地提升系统的运行效率。通过对系统进行分层,能够使得系统的各大模块之间没有强的Q合,彼此之间相互联系却不会相关干扰,使得开发过程方便快捷,对以后的维护和扩展也有着极大的好处。
参考文献
[1] 在线学习系统的设计与开发[J].李萍.电子世界.2013(13).
【关键词】学习分析系统 教育 大数据
一、引言
“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”(麦肯锡咨询公司)大数据时代已经到来了,决策将日益基于数据和分析而做出,而并非基于经验和直觉。大数据应用已经在商业、经济等领域取得了显著的成功。而在目前,教育领域中,各种数字学习环境的普及和推广,越来越多的人员在网络环境下发生学习行为。学习者与学习系统之间,学习者与学习者之间,学习者与设备之间,每天都在发生大量的交互数据,这些数据有着海量的数据规模(Volume)、多样的数据类型(Variety)、快速的数据流动和动态的数据体系(Velocity)、巨大的数据价值(Value),这些都符合大数据的4V特性。海量的数据给传统教育数据的存储和分析都带来了巨大的挑战。如何通过技术手段对教育大数据进行分析处理,使教育领域的方方面面都受益,最终有效促进教与学,已经越来越受到研究者的重视。而学习分析理念的提出,为教育大数据的应用找到了很好的途径。
二、学习分析概述
早在2010年美国新媒体联盟的《地平线报告》中就预测学习分析技术将在未来的四到五年内成为主流。第一届学习分析和知识国际会议认为:学习分析技术是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术。
学习分析所服务的对象涉及教育系统的各个相关人员,学习者、教育者、教育研究者、教育管理者、学习服务提供者等等。使用数据挖掘、社会网络分析、统计分析等多种技术对教育大数据进行解释和分析,根据解释与分析的结果,评估学习者的学习进展,预测未来的表现,并发现潜在问题,以便学习者能更准确地把握自己的学习情况,优化学习过程,教育者能及时调整教学活动和教学内容,优化教学方法和教学策略,为学生提供个性化的教学资源与建议,同时也能为教育管理者的决策提供科学依据。国外对学习分析技术的研究已经取得了一定的效果,而国内还处在理论研究和综述阶段。基于教育大数据的学习分析系统的构建可以为学习分析的应用和实践提供重要指导,更好地提高学习效率,有效促进教与学。
三、学习分析系统的总体架构
国内外许多学者都从不同角度对学习分析进行了整体框架的设计,但每个框架都有其局限性,经过实践验证的框架依然很少。学习分析的基础和核心是海量的教育数据。围绕数据开展数据的采集、存储、分析、表示以及应用五个环节的活动。本文以数据为核心,依据数据流动的过程来构建一个更加灵活和可扩展的学习分析系统的架构模型(见图1所示)。
图1 学习分析系统架构图
学习者的学习行为发生在各种数字环境中,如传统的学习管理系统、网络课程以及开放学习环境(MOOCs)等,社会性学习系统,如博客,微博,各种社交网络等。交互当中所产生的数据都会被记录到原始数据库中,而原始数据来源众多,形式不一,存储和处理都有困难。通过聚集、抽样、维归约、离散化和二元化等预处理,让原始数据更加适合挖掘,将预处理得到的学习数据存储到学习数据库中,与学习者相关的一些基本数据存储在学生信息库中。在特定的时间中学习分析引擎会从学习数据库和学生信息库中获取数据进行分析,依据需求不同,在分析过程中使用不同的数据挖掘和分析工具及模型。分析结果作用于学习者、教育者、研究者、教育管理者等不同层次,提供相应的教育干预,学习内容和过程、教学设计和策略优化。当然,分析结果也要以报告或可视化图表等形式在展示平台输出。
四、结束语
学习分析是大数据技术在教育领域中的应用。在大数据技术的支持下,深度挖掘学习行为模式,交互数据之间所隐藏的潜在价值,学习质量分析,个性化教学内容推送等都将成为可能。在对学习分析进行不断深入研究的同时,也存在许多挑战。如何快速有效地收集和预处理来源多样的原始数据,使用哪种工具、算法能更准确地得到有效预测,如何做到保护学生隐私等,都是我们要考虑的问题。相信这些挑战都将在不久的将来得到解决。
【参考文献】
[1]Barwick H.The “four Vs” of Big Data.Implementing Information Infrastructure Symposium[EB/OL].2012-10-02.
[2]Johnson,L.,Adams,S.,andCummins,M.(2012).The NMC Horizon Report: 20l2 Higher Education Edition.Austin, Texas: TheNewMediaConsortium.
【关键词】数据分析;实践;统计
中图分类号:G635.5 文献标识码:A 文章编号:1671-0568(2015)36-0122-01
我国相关教学制度规定,在数学教学中,必须重视对学生空间观念、数据分析观念及推理观念等的培养。数据能够帮助学生正确判断学习及生活中的相关问题,从而做出正确抉择,数据现已充斥着整个社会,因此,现代公民必须重视对数据分析、数据收集及数据整理等能力及观念的培养,从而提升自身决策的合理性与准确性,实现数据的有效传输与表达。
一、数据分析观念内涵
数据分析观念主要是指现实生活中人们在解决相应的问题时,需要对与问题相关的数据等进行调查研究,同时,通过对相关数据的分析理解其中的内涵,找到解决问题的方法。在数据分析过程中,同样的数据有多种数据分析方法,这就需要相关人员根据相关问题的具体要求选择合理的分析方法。数据分析是统计的核心要素,因此,数据分析内的相关要素及相关内涵主要包含以下几个方面:
1. 具有数据相关意识
数据的应用充斥着人们的现实生活与学习,要合理、准确地解决现实问题需要有数据意识。在解决问题之前,需要对信息及数据进行收集,同时,学生根据数据提炼内部的相关信息及有效数据,帮助学生高效解决相关问题。
2. 选择合理的数据搜集与分析方法
分析与整理相同数据具有多种分析方法,这就需要学生对相关问题进行分析从而选择最合理的方法。例如,在对数据统计中的统计图表进行绘制时,往往具有多种图表表现形式,但是学生在进行相关统计图表选择时会选用最佳的统计图表,如在对相关数据中的数量关系进行统计时,则可选用条形统计图,若表现各数据在整体数据中所占比例时,则可选用扇形统计图。
3. 通过数据分析体验随机特征
数据的随机性主要是指在解决同一问题时,其收集到的数据可能存在差异性,另一方面是指足够的数据中具有相关规律。例如,探究数学学习中关于学习知识点需要用多长时间时,就可以对数据进行统计。在统计过程中,会发现每天的知识点、学习时间具有差异性,但在多次试验之后便可发现其中的相关规律。数据虽然具有随机性,但在多次试验验证后其数据又具有相对稳定性。
二、在统计教学中培养学生数据分析观念的途径分析
1. 引导学生基于现实参与数据收集及分析活动
在统计学教学中,教师可以积极引导学生参与数据收集及分析活动,促进学生数据分析意识及分析观念的形成。学生数据分析观念的养成首先需要数据分析意识的养成,学生在遇到困难时,可产生利用数据解决问题的意识,因此,教师在具体教学中可依照实际生活设计具有现实意义的数学实际情境,这样可以最大限度地激发学生完全投入到统计活动中,使学生通过实际情景对数据进行收集、整理、分析并做出解决问题的最终决策,通过在活动中的实际体会逐步促进自身数据分析观念与分析思维模式的养成与提升。
2. 重视情感作用,激发学生的求知欲望
在统计教学中,学生良好的学习情绪以及强烈的求知欲对其学习进步以及智力开发具有非常重要的影响,在数据分析观念的培养过程中,重视对学生情感的教育与引导可使学生尽快进入学习状态,营造轻松、和谐的教学氛围,将学生带入教学情境中,不仅有利于教学工作的开展与教学任务的实现,同时还有利于良好师生关系的形成。
在“统计”课程教学之前,教师在课堂中可以进行情境创设。例如,周末组织班级学生外出郊游,要求学生思考郊游的地点及郊游活动应怎样选择。此时,学生因听到有关游玩的话题比较兴奋,便积极地展开讨论,教师再对学生进行统计课程带入教学,这样,不仅使得课堂变得生动、活跃,使学生的积极性增强,为课程的展开创造了良好的环境,使教学内容更易开展。
3. 引导学生掌握数据收集、整理及分析等方法
在数学统计学教学中,常用的数据收集方法一般为直接获取数据的方法,包括实验、调查,等等,同时也包括资料翻阅等间接获取方法。收集数据工作结束之后,需要对看似杂乱的数据进行整理、分类,在对数据进行描述时,常用的方式主要有计数、统计图等,因此,需要学生认识条形统计图、扇形统计图及折线统计图等统计方法,并运用以上方法对数据进行有效分类,同时还可运用自身语言知识解释其含义,分析数据主要是指对数据进行简繁分析并达到交流作用。数据分析过程是复杂的思维分析过程,在问题解决的过程中,教师应引导学生根据问题的具体情况选择合理的分析方式,从而使学生在学习中不断完善自身的想法并实现对数据分析方法的有效掌握。
例如,对班级学生身高进行分析与相关问题探讨:某小学某班级中学生的身高在134~160cm之间,学生根据班级身高记录单对班级中学生的身高进行分析统计,从而得出学生中最低身高为134cm,最高身高为160cm,若要选择参与跳高的运动员时,学生可以通过数据进行探讨,并对学生的身高按照从高到低的顺序进行排列后选出多名身高最高的学生,之后再对整理数据的作用进行相应分析。
4. 引导学生重视数据随机性,使学生全面认识数据
教师在对学生进行数据分析观念的培养中,需要选择适当的问题对学生进行数据随机性体验。例如,在对学校校门口一天之内各个时段的人流量统计活动中,教师可引导学生选用合适的方式进行人流量的统计与记录,同时在开展该活动中,学生还应考虑数据的有效性及数据所需时间,等等,引导学生在所监测的不同数据中找寻相应规律,最终顺利解决问题。
在数学统计教学中,学生数据分析观念的培养,是统计学与概率学教学的开展基础,同时也是数学问题解决的有效观念之一。在对学生进行数据分析观念的培养中,教师应重视对学生具体实践教学的开展及数据统计方法的教授,使学生选用最合理的数据整理、分析等方法,从而促使学生数据分析统计思维的养成,实现数学教学的最终目标。
参考文献:
[1] 范明明.中小学生数据分析能力的培养研究[D].武汉:华中师范大学,2014.
关键词:听障大学生; 教学评价; 统计分析
【中图分类号】G762
学生教学评价,即学生作为评价主体对教师的教学质量进行评价。其主要目的是为教师的教学提供有用的反馈,以促进教师提高教学质量,从而为提高学生的学习效果服务 [1、2]。听障大学生,作为特殊的学生群体,日常教学应赋予更多的关心和爱心。对听障大学生教学评价数据的研究,可以促进从事特殊教育的老师改善教学方法,调整教学态度,进一步提高特殊高等教育的课堂教学质量显得格外重要。
数据数理统计分析是数学的一个分支,是指研究如何有效地收集和使用带有随机性影响的数据。通过数据的数理统计分析,可以进行数据的整理和问题的推断[3]。现代数理统计分析的一个显著特点就是运用计算机实现有关的统计计算与分析,目前也有许多应用计算机软件对于教学质量进行分析讨论的报道。本文利用SPSS软件(Statistical Product and Service Solutions)对听障大学生教学评价数据进行统计分析,以更好的发挥评价的诊断、激励和导向的作用。
一、数据分析来源
本文数据来源于某大学某学期听障大学生教学评价数据,共涉及25门课程。教学评价分为十项指标,分别为“tm1”:仪表端庄,教态自然,精神饱满;“tm2”:上课准时、足时,认真负责,严格要求学生;“tm3”:关怀和尊重学生,有固定的辅导和答疑时间师生关系融洽;“tm4”:教学目标、要求、考核形式明确,推荐有助我们学习的参考文献;“tm5”:授课内容充实,信息量大,重难点突出,进度安排适当;“tm6”:作业有利于我们掌握知识和自主学习,批改和分析认真;“tm7”:思路清晰,阐述准确,语言规范生动;“tm8”:因材施教,注重学生创新意识和能力培养;“tm9”:教学方法灵活,教学手段恰当,注重互动,课堂气氛活跃;“tm10”:掌握了本课程的核心内容,激发了学生学习兴趣,提高了分析问题、解决问题的能力。
二、分析方法
本文主要使用了SPSS软件中的描述性统计分析(Descriptive Statistics,得到原始数据转化成标准化的取值,可以直观了解数据的情况,同时便于进一步分析);K-S单样本检验分析(Kolomogorov- Simirnov One-sample Test,主要考察数据是否符合正态分布);主成分分析(Principal Component Analysis,将多个变量通过线性变换以选出较少个数重要变量);K中心聚类分析(K-means cluster analysis,将数据进行分类,辨别样本之间的亲疏关系);单因素方差分析(one-way ANOVA,调查按某个研究因素的不同水平分组后该因素的效应)。
三、结果与分析
(一)学生教学评价整体情况及正态分布分析
分析教学评价整体情况可以了解听障大学生课堂教学质量的总体情况。从表1可以看出,该学期听障大学生教学评价总分范围在81.48-99.82之间,平均成绩为89.69±3.62。利用SPSS软件进行正态分布分析,得到表2及图1。从表2得到单样本K-S检验Z统计值为0.500,渐近显著性水平为0.964,远大于0.05,因此教学评价结果符合正态分布。
(二)学生教学评价指标主成份分析
利用SPSS进行学生教学评价指标主成份分析后,得到表3。主成份分析法只提取到1个成分,且变量系数均接近1,因此可以认定本体系10项指标相互独立,影响较小。
(三)不同课程学生教学评价聚类分析
通过SPSS软件K中心聚类分析方法,将25门课程进行聚类分析,得到表4、表5。从表4可以看出,通过聚类分析,通过学生教学评价成绩将25门课程分为了2类,1类优秀成绩为15门课程,2类良好成绩为10门课程。表5则表示每门课程所属聚类。
(四)学生教学评价指标的聚类分析
通过SPSS软件K中心聚类分析方法,将学生教学评价十项指表每门课程的得分进行聚类分析,得到表6、表7。通过聚类分析,将评价指标分为了2类,指标1、2、3被归为类别1,可以看出主要是指教师的教学态度;指标4-10被归为类别2,主要考查教师的教学业务水平。
(五)不同学科类别科目学生教学评价差异性分析
根据课程不同性质,将参与评价的25门课程分为了学生思政(两课)类、文科(外语、语言等)类、理科(数学、物理等)类。
利用SPSS进行单因素方差分析。文科类课程与理科类课程学生教学评价成绩有显著性差异,且文科类课程得分要高于理科类课程。原因可能由于理科类课程需要大量逻辑思维能力,听障大学生可能在这方面有所欠缺,因此课堂教学效果不如文科类课程。此外,学生思政类课程与文科、理科类课程均没有显著性差异,其得分介于两者之间。
(六) 不同职称教师授课学生教学评价差异性分析
根据授课教师职称不同,将参与评价的25门课程分为了教授授课、副教授授课及讲师授课三类。
利用SPSS进行单因素方差分析。教授授课类学生教学评价得分与副教授、讲师授课类直接均存在着显著性差异,且总分均值要高于其他两类。可见,教授因为在知识、授课经验上的累积,其教学效果要好于副教授及讲师。副教授及讲师教学评价得分则无显著性差异。
四、结语
本文通过计算机软件等辅助手段,将原本多而无规律的教学评价数据进行了分析处理,获得了许多有价值的信息,这些都有利于教育管理进行优化管理,更好的做出决策,为强化教学管理、提高教学质量打下基础。本文只是在听障大学生教学评价过程中,利用计算机辅助手段进行分析的初步探索。教学评价是一项非常复杂的质量监控的过程,如何进一步利用计算机软件等为教学质量提供支持,有待我们继续研究。
参考文献
[1] 鲁进勇,夏建刚. 本科教学质量评价的文献综述[J].学问・科教探索,2008,18:24-25.