上一篇:没有了 下一篇:数据仓库术语

数据仓库概念

什么是数据仓库?

数据仓库是构建和使用数据仓库的过程。通过整合来自支持分析报告,结构化和/或临时查询以及判断的多个异构源的数据构建数据仓库。数据仓库涉及数据清理,数据整合和数据整合。

使用数据仓库信息

有一些判断支持技术有助于利用数据仓库中的数据。这些技术帮助管理人员快速有效地使用仓库。他们可以收集数据,分析数据,并根据仓库中存在的信息进行判断。收集在仓库中的信息可以在以下任何一个域中使用:

  • 调整生产策略 - 产品策略可以通过重新定位产品和通过比较每季度或每年的销售来管理产品组合来进行调整。

  • 客户分析 - 客户分析是通过分析客户的购买偏好,购买时间,预算周期等进行的。

  • 运营分析 - 数据仓库还有助于客户关系管理,并进行环境修正。这些信息还使我们能够分析业务运营。

集成异构数据库

为了整合异构数据库,我们有两种方法:

  • 查询驱动方法
  • 更新驱动的方法

查询驱动方法

这是集成异构数据库的传统方法。这种方法用于在多个异构数据库之上构建包装器和集成器。这些集成商也被称为调解员。

查询驱动方法的过程

  • 当向客户端发出查询时,元数据字典将查询转换为涉及的各个异构站点的适当形式。

  • 现在这些查询被映射并发送到本地查询处理器。

  • 异构站点的结果被集成到全局答案集中。

缺点

  • 查询驱动方法需要复杂的集成和过滤过程。

  • 这种方法效率很低。

  • 经常查询是非常昂贵的。

  • 对于需要聚合的查询,此方法也非常昂贵。

更新驱动的方法

这是传统方法的替代方法。今天的数据仓库系统遵循更新驱动的方法,而不是前面探讨的传统方法。在更新驱动的方法中,来自多个异构源的信息被预先集成并存储在仓库中。此信息可用于直接查询和分析。

优点

这种方法具有以下优点:

  • 这种方法提供了高性能。

  • 提前在语义数据存储中复制,处理,集成,注释,汇总和重组数据。

  • 查询处理不需要在本地源处理数据的接口。

数据仓库工具和实用程序的功能

以下是数据仓库工具和实用程序的功能:

  • 数据提取 - 涉及从多个异构源收集数据。

  • 数据清理 - 涉及查找和纠正数据中的错误。

  • 数据转换 - 涉及从旧格式转换为仓库格式的数据。

  • 数据加载 - 涉及排序,总结,整合,检查完整性,构建索引和分区。

  • 刷新 - 涉及从数据源到仓库的更新。

注意:数据清理和数据转换是提高数据质量和数据挖掘结果的重要步骤。

Copyright © 2002-2017 vue5.com 版权所有

Top