BI系统应用架构数据仓库是一种用于企业数据分析和决策支持的架构。该架构建立在数据仓库的基础之上,通过ETL(Extract-Transform-Load)过程将各种数据源中的数据统一到数据仓库中,然后通过报表、分析、挖掘等工具来完成数据分析和决策支持。
一、数据仓库
数据仓库是企业中所有运营系统、数据源以及历史数据的集成汇总,是一个专门用于分析的数据库和一个全面的历史数据存储处。它不同于操作型数据库,它不是为了交易处理而设计,而是为了提供一个数据存储和处理环境,以支持企业决策制定和业务分析等应用。数据仓库的特点是支持复杂的分析操作和大批量的数据插入,而不是面向交易的在线处理 (OLTP);具有模式化的数据存储结构和面向主题的数据组织方式;细粒度的数据存储方式;包含历史数据,而不是最新数据。
二、ETL(Extract-Transform-Load)
ETL过程将从各种数据源中收集到的数据提取,经过清洗、转换、整合成业务相关的数据后,再将其加载至数据仓库中,以被后续的报表、统计、分析等应用程序访问。数据源可以包括优劵、ERP、数据采集系统、安全监控系统或其他任何数据源。 数据的“提取”是指从各种数据源中收集到数据;“转换”是指将收集到的数据进行格式化、清洗、标准化等操作;“加载”是指将已经转换好的数据存储到数据仓库中。在ETL过程中,还需要考虑数据来源的质量问题,必须确保数据的准确性和完整性。
三、报表
报表是展示数据分析结果的一个重要方式。BI系统应用中的报表应包括依据企业需求设计的一些企业信息度量、数据展示方式、分析方式。