网上数字档案大数据分析中的知识挖掘技术研究
王兰成 刘晓亮
摘要:促进情报和档案信息交流、共享已成为当前开展深度信息服务的发展趋势,网上各类档案大数据信息正成为开发和利用的新型资源。大数据时代的到来,给传统的数据分析技术带来了极大的挑战,归纳、比较在大数据背景下知识挖掘技术的发展趋势和特点,探讨大数据知识挖掘处理中的数据集成、数据存储、数据分析、语义处理与可视化数据挖掘问题,研究深层次知识挖掘的方法和技术,结合档案网站知识服务功能研究,为开展网上数字档案大数据的分析挖掘提供了启示与参考。
关键词:大数据 档案信息服务 知识挖掘 信息技术
总结:1、档案大数据知识挖掘的需求与挑战。大数据背景下,档案数据分析处理环境条件的变化导致了其知识挖掘面临着新的需要与挑战,体现在以下几个方面:(1)数据量问题(2)特征维度问题(3)数据关系问题(4)算法性能问题(5)语义理解问题(6)数据解释问题(7)数据隐私问题
2、档案大数据知识挖掘中的关键技术。档案大数据知识挖掘处理流程需要集合多种信息技术,其中的关键技术主要有:(1)数据集成(2)数据存储(3)数据分析(4)语义处理(5)可视知识挖掘
(出处:《浙江档案》2013年第10期)