从听到关于
沃尔玛超市的“
啤酒”与“尿布”的故事,我们知道了
商业智能(Business Intelligence,BI)应用可以如此神奇地分析出两种看似毫不相干的东西之间原来还有着千丝万缕的联系,如今以数据仓库为核心的BI应用正在成为国内很多用户们实施的
热点。据IDC最新的研究报告称,2006年亚太地区BI
解决方案市场将达33亿美元,这是目前市场价值12亿美元的近3倍。本文则对商业智能应用这个热点从宏观到微观、从技术到应用进行了冷静全面的分析。
BI热点冷思考
——商业智能技术与应用发展现状之分析
郑晓军
技术篇
IDC将商业智能解决方案定义为帮助企业跟踪、分析、模拟和预测他们自己的业务过程以及他们的客户、供应商和合作伙伴关系的解决方案。从技术架构来讲,商业智能系统主要由数据仓库系统、数据源、商业智能应用和元数据几个部分组成。
在当今的商业环境中,市场竞争日益激烈,它促使企业和机构在信息系统的建设上不仅仅需要对业务流程的支持,同时需要从信息系统中获得从客户、营销、企业的运营状况到供应渠道的通畅与否等高层次的分析决策信息,并且将决策结果运用于日常业务以提高企业整体效益。然而,传统的业务系统则是针对分离的事务处理而设计,并不擅长于多层次的分析和统计。由此,商业智能应用应运而生,它通常是一个独立的系统,能够从传统业务系统中获取各类客户数据和业务数据,由此建立多层次的分析体系,并将其转化成有商业意义的信息。
1. 数据仓库系统 数据仓库系统是商业智能应用的核心,它是整个系统存储和管理数据和信息的地方。数据仓库系统可分为以下几个部分。
数据抽取、转换和装载(Extract, Transform, Load) 负责将数据从业务系统或外部系统中获得,转换和处理成数据仓库需要的格式和形态,并在规定的时间装入到数据仓库中去。通常我们把这三个具体的步骤统称为ETL,在系统实现时一般采用数据抽取工具和应用编程实现,并拥有调度管理和控制功能。
数据仓库(Data Warehouse) 数据仓库是数据存储核心,目前,大多数数据仓库采用关系型数据库管理。由于数据量的庞大和查询复杂的特点,在系统配置上强调大规模并行处理和针对决策支持访问的专项优化。
操作数据(Operational Data Store) 近年来,随着商业智能应用的需求,如数据挖掘和实时业务分析,在数据仓库中需要有部分数据拥有当前数据的特征,根据业务系统的变化而变化,不必关心历史信息,同时又拥有数据仓库数据面向主题的特点。这部分数据叫作操作数据,一般采用关系数据库存储,规模适中,强调快速查询响应能力。
数据集市(Data Mart) 数据集市存储了由数据仓库来的,经过裁剪和归整的数据,这些数据针对某个业务部门或某种业务分析应用而建立。数据集市一般都对数据进行了各种层次的汇总,并建立多维分析的模型,同时也包括了数据采样。数据集市的存储主要有关系数据库和多维数据库。其中,多维数据库存放多维分析数据,而关系数据库则存储星型模式。
数据归整(Refinement) 数据归整指数据从数据仓库到数据集市的过程,它是数据仓库系统内部的数据处理和转换的过程,主要的任务是多维模型的转换、数据的汇总和采样等。有时,它由ETL系统统一调度完成。
2. 数据源 数据源包括了现有企业中所有的信息系统,以及根据决策分析需求可能涉及的其他外部数据资源。它主要包括业务数据和外部数据。
&nbs......