当前位置:首考文秘网>范文大全 > 公文范文 > 大数据环境下图书馆数据资源质量评估与整体优化研究

大数据环境下图书馆数据资源质量评估与整体优化研究

时间:2023-06-16 17:55:02 公文范文 来源:网友投稿

制度的科学性、制度执行的有效性、数据的评估与优化等部分组成,涉及图书馆大数据采集、管理和决策人员素质,以及与大数据质量管理机制相关的制度、流程和措施的评估等内容,是大数据生命周期管理流程科学性、管理措施缺陷发现和效率评估质量保证的关键环节。大数据质量维度划分与数据质量评估标准的制定,应随着大数据4“v”特征和数据决策需求的变化而动态调整变化,并依据大数据决策科学性和可用性评估结果而反馈优化,才能确保评估过程科学、高效、动态和可用。

3图书馆大数据质量管理与优化的流程

图书馆大数据质量管理涉及大數据的产生、采集、传输、处理、存储、分析、决策和销毁生命周期全程的多个环节,主要包括数据需求质量控制、数据的定义与规范、集成节点检查数据质量、大数据的清洗、数据质量的评估、数据质量管理流程的反馈优化控制、大数据决策和数据过期销毁等流程,不仅涉及对图书馆大数据质量的管理和改善环节,而且还包括与大数据质量保证相关性较大的系统组织、管理流程、质量评估、质量监督等过程的优化。本文设计的基于数据生命周期理论的图书馆大数据质量管理与优化流程如图2所示。

数据需求管理是图书馆大数据生命周期的起始阶段,数据管理员通过对大数据的需求进行预测、描述和分析,明确图书馆大数据定义与规范的标准、方法与步骤。大数据的定义与规范是图书馆依据大数据决策对数据质量的要求,通过数据模型构建、数据标准的定义与更新、数据语义的识别等操作,使图书馆对内外部采集、传输、交换和使用的大数据能够统一标准,确保所有大数据在数据业务属性、技术属性和质量管理属性上具有较高的一致性。集成节点检查大数据质量是指基于对大数据的准确定义与规范,图书馆通过在数据采集节点、数据传输节点、数据存储节点、大数据存储库等,这些与大数据采集、传输和交换紧密相关的数据集成点上进行基于抽样方式的数据质量检查,来确定途经这些关键节点的大数据是否满足大数据决策对数据质量的区间要求。大数据的清洗是图书馆在相关大数据传输、交换和存储的数据节点上,依据数据节点上大数据质量检测的结果,通过数据清洗操作来提升大数据的一致性、唯一性、完整性和准确性的过程。数据质量的评估是图书馆对已清洗过的大数据进行质量与可用性评估的过程,评估的标准包括大数据的正确性、实时性、规范性、业务逻辑性、完整性、相关性、重复性和可用性等8个方面的内容,大数据质量的评估应坚持智能、实时、动态和自动化的原则,为大数据的质量管理与控制提供科学的决策依据。大数据质量评估后,评估结果如果满足图书馆大数据决策对数据质量的要求,则将合格大数据传输至大数据分析与决策系统,为图书馆的系统管理、用户服务和宏观发展提供科学的数据决策支持,并在数据决策后对过期数据进行销毁。大数据质量评估结果如果不满足图书馆大数据决策对数据质量的要求,则依据评估结果明确大数据在数据的正确性、实时性、规范性与可用性等数据质量维度上存在的问题,并通过数据质量评估结果对数据需求质量控制、数据的定义与规范、集成节点上大数据质量的检查、大数据的清洗等,大数据生命周期相关重要环节的反馈控制、规范和优化,最终提升大数据的价值量和可用性,为图书馆大数据决策提供科学、可靠的大数据质量保证。

4结束语

大数据的质量管理与数据价值保证,是一个关系图书馆大数据可用性和大数据决策科学性的重要问题,与图书馆IT服务系统构建、用户服务模式变革、读者个性化服务定制与推送、个性化服务的质量保证等息息相关。因此,在图书馆大数据质量的管理中,我们应将图书馆员、大数据决策需求、数据质量管理的流程和大数据质量保障的相关技术完美结合,依据图书馆大数据决策对数据质量的要求,科学构建大数据的质量监控、管理、评估和优化体系,并将大数据的质量管理融人大数据的需求分析、定义、采集、清洗、处理、决策和销毁生命周期全程中去,才能确保图书馆大数据安全、高价值、实时和可用,才能为图书馆服务系统构建和读者个性化服务推送提供科学、可靠的大数据决策支持。

推荐访问:数据 下图 书馆 评估 优化

版权所有:首考文秘网 2015-2024 未经授权禁止复制或建立镜像[首考文秘网]所有资源完全免费共享

Powered by 首考文秘网 © All Rights Reserved.。备案号:冀ICP备15026071号-91