数据仓库(香港、台湾译资料仓储)是一门新兴的信息技术相关理论,以下用二种方式对其作解释。
目录 |
数据仓库是一种信息系统的数据存储理论,此理论强调利用某些特殊数据存储方式,让所包含的数据,特别有利于分析处理,以产生有价值的信息并依此作决策。
利用数据仓库方式所存放的数据,具有一但存入,便不随时间而更动的特性,同时存入的数据必定包含时间属性,通常一个数据仓库皆会含有大量的历史性数据,并利用特定分析方式,自其中发掘出特定信息。
数据仓库 ,由数据仓库之父W.H.Inmon于1990年提出,主要功能乃是将组织通过信息系统之在线交易处理(OLTP)经年累月所累积的大量数据,通过数据仓库理论所特有的数据存储架构,作一有系统的分析整理,以利各种分析方法如在线分析处理(OLAP)、数据采矿(Data Mining)之进行,并进而支持如决策支持系统(DSS)、主管信息系统(EIS)之建立,帮助决策者能快速有效的自大量数据中,分析出有价值的信息,以利决策拟定及快速回应外在环境变动,帮助建构商业智能(BI)。
一般来说,数据仓库可由关系数据库,或专为数据仓库开发的多维度数据库建立,若由多维度数据库建立而成,其架构可分为星状及雪花状架构,包含数个维度数据表,及一个事实数据表。
数据仓库的建制不仅只是信息工具技术面的运用,在规画和运行面更需对产业知识、营销管理、市场定位、策略规画等相关条件有深入的了解,才能真正发挥数据仓库以及后续分析工具的价值,提升组织竞争力。
Operational data store(ODS)、数据仓库和数据超市三者相同之处在于均不属于任一OLTP系统,并且都是以数据导向的设计而非流程(process)导向。
相异之处在于,ODS的特性较著重于战术性查询,变动性大。数据仓库通常为企业层级,用来解答即兴式、临时性的问题。而数据超市则较偏向解决特定单位或部门的问题,部分采用维度模型(dimensional model)。
数据仓库可以作为数据采矿和OLAP等分析工具的数据来源,由于存放于数据仓库中的数据,必需经过筛选与转换,因此可以避免分析工具使用错误的数据,而得到不正确的分析结果。
数据采矿和OLAP同为分析工具,其差别在于OLAP提供用户一便利的多维度观点和方法,以有效率的对数据进行复杂的查询动作,其默认查询条件由用户预先设置,而数据采矿,则能由信息系统主动发掘数据来源中,未曾被查觉的隐藏信息,和通过用户的认知以产生知识。
数据采矿(Data Mining)技术是经由自动或半自动的方法探勘及分析大量的数据,以建立有效的模型及规则,而企业通过数据采矿更了解他们的客户,进而改进他们的营销、业务及客服的运作。 数据采矿是数据仓库的一种重要运用。基本上,它是用来将你的数据中隐藏的信息挖掘出来,所以 Data Mining 其实是所谓的 Knowledge Discovery 的一部份,Data Mining 使用了许多统计分析与 Modeling 的方法,到数据中查找有用的特征(Patterns)以及关连性(Relationships)。 Knowledge Discovery 的过程对 Data Mining 的应用成功与否有重要的影响,只有它才能确保 Data Mining 能获得有意义的结果。
stock | retire | vm
Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History