摘要:前对大数据的定义有三种,分别从数据体量、复杂性程度、价值这三个角度来界定,反映了大数据三个最主要的特性。大数据在教育领域的主要应用是教育数据挖掘和学习分析。今后要加强多个来源的数据库整合,充分利用在线数据开展教育舆情分析等研究,在确保数据安全的前提下与专业数据公司开展合作。
关键词:大数据 数据挖掘 学习分析
文中从四个不同的角度介绍了大数据的定义。一、从数据集的“大体量”人手,。麦肯锡对大数据的定义是:大数据是指那些规模大到传统的数据库软件工具已经无法采集、存储、管理和分析的数据集。二、从“复杂性程度大”入手,罗伯特·福莱对大数据的定义是:有用的数据源排列数量巨大,使有用的查询非常困难,并且,复杂的相关关系使得排除很困难。大数据的第一个詹陛是复杂性,大不是数量大,而是复杂性更大。三、从“价值大”的角度入手,维克托·迈尔一舍恩伯格的定义是:大数据是当今社会所独有的一种新型的能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。四、《上海推进大数据研究与发展行动计划》对大数据的概念做了较全面的概括:大数据有三层内涵:一是数据量巨大、来源多样和类型多样的数据集;二是新型的数据处理和分析技术;三是运用数据分析形成价值。
同时,文章根据大数据的不同来源把大数据分为科研数据、互联网数据和感知数据三种类型。并且重点指出在教育中有两个特定的领域会用到大数据:教育数据挖掘和学习分析。教育数据挖掘应用统计学、机器学习和数据挖掘的技术和开发方法,对教学和学习过程中收集的数据进行分析,教育数据挖掘检验学习理论并引导教育实践。学习分析应用从信息科学、社会学、心理学、统计学、机器学习和数据挖掘的技术,来分析从教育管理和服务过程中收集的数据,学习分析创建的应用程序直接影响教育实践。
(文章来源:《上海教育科研》2013(9) 作者:陆璟 华东师范大学课程与教学系,上海市教育科学研究院普教所)