大数据研究
严霄凤 张德馨
摘要: 大数据是继云计算、物联网之后IT 产业又一次颠覆性的技术革命。大数据挖掘和应用可创造出超万亿美元的价值,将是未来IT 领域最大的市场机遇之一。大数据利用对数据处理的实时性、有效性提出了更高要求,需要根据大数据特点对传统的常规数据处理技术进行技术变革,形成适用于大数据收集、存储、管理、处理、分析、共享和可视化的技术。文中介绍了大数据的概念及其关键技术,描述了大数据带来的机遇和挑战,概述了美国政府的“大数据研究和发展倡议”。
关键词: 大数据; 云计算; 信息安全
总结:1、大数据的定义与特征。麦肯锡将大数据定义为: 无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。其主要特征有:(1)数据体量巨大(2)数据种类繁多(3)价值密度低(4)处理速度快
2、大数据的关键技术。大数据技术是一系列收集、存储、管理、处理、分析、共享和可视化技术的集合。适用于大数据的关键技术包括:遗传算法、神经网络、数据挖掘、回归分析、分类分析、聚类分析、关联规则学习、数据融合与集成、机器学习、自然语言处理、情感分析、网络分析、空间分析、时间序列分析、分布式文件系统、分布式缓存、分布式数据库、非关系型数据化系统、可视化技术。
3、大数据带来的机遇和挑战。大数据带来的机遇:( 1) 大数据的挖掘和应用成为核心,将从多个方面创造价值。( 2) 大数据利用中安全更加重要,为信息安全带来发展契机。( 3) 大数据时代来临,使商业智能、信息安全和云计算具有更大潜力。大数据带来的挑战:( 1) 大数据需要专业化的技术和管理人才。( 2) 大数据的有效应用需要解决大容量、多类别和高时效数据处理的问题。( 3) 大数据利用对信息安全提出了更高要求。
(出处:《计算机技术与发展》2013年4月23卷第4期)