大数据探讨
刘宇芳
摘要:大数据的重大意义正逐步被人们认识到。简要介绍大数据,从技术和工具、解决方案和应用案例等方面对大数据进行研究,并对大数据给计算机科学带来的若干问题进行探讨。
关键词:大数据;云计算;数据分析
总结:文章对大数据做了全面的介绍:
1、认识大数据。(1)大数据的来源:各类软件的数据库、互联网、传感器网络和物联网。(2)大数据的规模:PB级别、 ZB级别,甚至更高级别数据。(3)大数据的类型特征:异构和多样性、很多不同的形式、无模式或者模式不明显、不连贯的语法或句义。(4)大数据的生态系统:拥有数据的企业、拥有技术的企业、拥有思维的企业。
2、研究大数据。主要有四方面、大数据技术、大数据工具、大数据解决方案、大数据应用案例。
3、思考大数据。大数据带来了一些值得认真思考解决的问题:(1)目前存储能力的增长已经远远赶不上数据的增长,必须考虑为IT系统设计、选用更为合理的、高可扩展性的分层存储架构。(2)传统数据库的管理能力无法应付大数据体量的数据,新型数据库应该逐步走到数据管理的主角位置。(3)数据的移动已成为 IT系统的最大开销。(4)逻辑推理研究、因果关系证明,是科学研究的传统方法。
(出处:《现代计算机》2013年第10期)