大数据研究与应用综述(上)
胡雄伟 张宝林 李抵飞
摘 要:在系统分析国内外大数据研究与应用现状的基础上,梳理了涉及大数据的10个重要概念,总结分析了企业大数据的策略和商业应用案例、美英等国政府数据开放政策及做法,以及大数据应用的技术和业务特点。在分析大数据时代面临挑战基础上,整理了大数据研究与发展的重要问题和发展趋势,提出正确应对大数据挑战的观点。
关键词:大数据 数据开放 数据价值
总结:1、提出基本概念。主要涉及以下概念:一、数据、信息与知识。数据是数字化的信息记录,数据本身不具有具体的意义;信息是把数据置于特定的背景下,对数据的解释和注释,赋予数据具体的意义;所谓知识是指人类识别万物实体与性质,以及是与不是的信息集合。二、最小数据集与大数据。最小数据是指管理层面针对具体业务领域强制收集的数据指标的集合,是针对被观察对象建立的简单使用的数据指标,是基本数据项的集合;最小数据集是业务管理过程中最重要的数据指标,是开发设计不同信息管理系统的基础。三、运营式信息系统与决策分析系统。所谓运营式系统是指为提高日常工作效率、满足业务运行管理而设计开发的信息系统;决策分析系统是建立在数据仓库基础上,提供数据挖掘、数据分析、联机分析等技术方法的信息系统,属于业务智能系统,提供基于数据的决策或称为数据驱动的决策。四、业务(商务)智能流程。即商务信息系统的一个发展方向。五、数据质量原则。即数据质量标准、质量管理流程、数据质量救助机制三个原则。六、数字化与数据化。数字化是把摸拟信息转换成为用0、1表示的二进制代码,用计算机可以保存处理的过程;数据化是一种把现象转变为可以制表分析的量化形式的过程。七、数据的价值。即数据是有价值的。八、数据废气。数据废气是一个描述人们在网上留下的数字轨迹的通俗词汇。九、数据折旧。即数据作为资产同样有折旧的过程。十、对信息技术(IT)的再认识,指出大数据技术的出现使得我们由关注代表技术的T字开始关注这个代表信息的I字,开始关注数据,关注数据的分析加工和挖掘,以及由数据信息知识的演变过程。
2、企业的大数据策略和应用。首先提出了数据特点:(1)容易共享,并且使用的人越多,价值越大;(2)重复使用,可以增值;(3)数据整合和重组可以大幅度增值的特点。进而指出企业可以通过利用数据分析来提高竞争力,并列举了部分应用案例。
Overview of Big Data Research and Application (Part A)
HU Xiong-wei ZHANG Bao-lin LI Di-fei
Abstract:On the basis of the systematic analysis of domestic and foreign big data research and application, the paper introduces ten key concepts related to big data, analyzes the strategies of enterprise big data, commercial application cases, open policies of data in the United States,the U.K. etc., as well as the application technologies and business characteristics of big data. The paper also summarizes the important issues and development trends of big data research and development and proposes the methods of facing the future challenges.
Keywords:big data, open data, data value
出处:《标准科学》2013年第10期