6.商业智能解决方案
InterSystems白皮书
InterSystems
技术如何帮助企业实现商
业智能的解决方案
执行摘要
商业智能的发展趋势是(使其)更为及时—减少数据时滞和查询响应时间,并最终将会产生全新的应用。“商业智能”能够实时分析和处理操作型数据,在集成系统里则为业务活动监控。
InterSystems的Caché数据库利用多维数据构架使得SQL的处理速度比传统的关系型数据库快5倍。Caché的高性能使其更适合于构建传统型数据仓库,并能建立“事务型位图索引”和进行实时数据分析。
作为InterSystems通用集成平台的Ensemble具有实时的数据分析能力。从而使得可以更加便捷的构建业务活动监控解决方案
导言—商业智能状况
对于大多数企业,各个IT系统每天都会处理大量的数据,如果这些数据可以被及时地存储、分析和转化为有用的信息,将极具战术和战略价值。这个就是大多数企业都努力建立、维护和提升的商业智能系统的作用。
大多数商业智能的架构包括了作为数据仓库或数据集市的关系型数据库,并从一个或多个“事务型”系统周期性地进行批处理更新。积累的数据能被各种报表工具访问和分析,并支持“数据挖掘”和特殊查询。
然而许多企业都发现关系型数据仓库有很多缺点。其中一个缺点就是在操纵复杂数据时性能不佳;另外是信息延迟,根据更新频率,数据可能延迟数小时,甚至数天
因而,商业智能技术的发展趋势是构建速度和更新频率更为快速的数据仓库或数据集市,理想情况下,最终将会成为全新的、可以实时的分析和处理各个孤立事务型系统数据的应用。
实时数据分析已经在集成系统中得已应用,而业务活动监控(BAM)解决方案以“执行仪表盘”的形式展现跨企业各个检测数据的当前值。
本文档描述了InterSystems的多维数据库Caché如何建立高性能的数据仓库和“商业智能”,以及提供实时报告和对于业务环境变更作出立即反应的独立系统。本文档还讨论了InterSystems的统一集成平台Ensemble是理想的业务行为监控的选择。
Caché不是关系型数据库,虽然它具有关系型数据库所有的关键特性。Caché的基础数据构架是稀疏型多维数组,相对于表结构的关系型数据库,具有更有效的存储数据能力,特别对于复杂型数据。Caché没有关系型数据库的“表联接”和“跳表”操作,因而具有更小的处理开支和更快的查询响应。
虽然Caché不是关系型数据库,但仍可以用ODBC和JDBC进行SQL查询。因为Caché多维数据可以自动以关系表的形式展现,所以Caché也能被原为关系型数据库使用的分析和报告工具所访问。在实时应用软件中已证实Caché比传统关系型数据库SQL运行性能快5倍,而且在数据仓库的更新过程中数据的插入也要快一些。
而直接访问Caché数据库的多维数据结构则能达到更佳的性能。已有几个商业数据分析和报告工具已经可以直接多维访问Caché数据库。
相对于关系型数据仓库,在相同数据情况下,基于Caché的数据仓库不仅速度快,而且消耗的资源少;这主要归功于稀疏的多维数组结构,并且比关系型系统少占用1/3到1/2的磁盘空间,而且不需要调整,因而管理负担更少。
减少数据时滞
有些商业智能应用能够容忍数据时滞(例如:每月销售趋势的分析允许数据非频繁更新,也可以容忍几秒钟的查询时滞),而其它应用(如:比较当前和过去的购买模式、从而欺诈预警或交叉销售)则必须采用最新的数据。
一种减少数据时滞的方法就是使用从服务器技术。如果主数据库的数据发生改变,则这些事务都要写入日志文件里。从服务器读日志文件,然后把变更的数据写入到副本数据库。查询在从数据库中进行,因而不会影响主数据库的事务处理性能。数据时滞被限制在读取和应用日志事务的时间内。另外再考虑到从服务器处理查询的多少,数据时滞可能数秒。
Caché支持从服务器技术,Caché能最小化更新从数据库和查询响应时间。
有时,从系统中经常出现的数秒的时滞也太大了;有时需要对快速变化的操作型数据进行直接查询。在这些情况下,能进行极快速查询以避免降低整个系统的性能变得尤为关键。
在任何数据分析系统,一种提高查询响应速度的方法就是对于经常作为查询条件的属性建立索引。Caché为开发人员提供两种索引机制:传统索引方式和位图索引方式
在传统的索引机制中,属性以一列记录ID号表示,每个属性值都有一个相应的与该值匹配的记录的ID号列表。
位图索引机制多被用于数据仓库,因为其能显著的提高分析大数据量的速度。位图索引机制将属性描述为一串二进制数。每个属性值都有一个代表每条记录的位字符串。“1”表示该记录属性等于属性值,“0”表示不等。
位图索引机制的优点,通过对索引进行布尔操作(与,或),查询可以在不搜索整个数据库的情况下,就可以精确确定该纪录是否符合查询要求。而对于复杂查询,位图索引可以数百倍地大幅度的降低查询时间。
如果数据经常改变或删除,位图索引就难以更新。这也就是位图索引机制经常用于静态的,只读的情形(例如数据仓库)。位图索引也需要大量的磁盘空间,每个可能值要为每条记录都存储一个比特位(1或0)。
Caché是唯一能够运行“事务型位图索引机制”的数据库。由于其具有高效的多维数据结构和精巧的数据压缩技术,使得Caché的位图索引比起其他数据库需要更小的磁盘空间和更快的更新速度。由于Caché的位图索引机制更新速度快,因而更适合数据经常变更的状况。
事务型位图索引机制使得开发人员能够构建分析快速改变的业务数据并根据结果实时响应的“商业智能”。
在集成系统中需要为业务活动监控(BAM)提供实时分析数据。业务活动监控能够对分散的各个资源进行实时的收集和分析。
InterSystems的通用集成平台Ensemble内置了可以存储整个集成系统消息的数据仓。“消息仓库”同Caché一样也使用了多维数据结构,并具有同样的快速处理性能。Ensemble能够实时的分析消息仓库中数据,并具有强大的调试和管理能力,以及业务活动监控功能。
Ensemble的特点非常适合快速开发业务活动监控。Ensemble先进的对象技术和向导驱动,使得其能轻松地将信息按照开发者自定义“业务度量”进行收集或计算,然后以可定制的、基于网页的“执行仪表盘”形式展现。在集成系统中业务度量同时以循环反馈的逻辑实施。例如:当测量参数超出其限度,业务度量则自动更正,并发出通知。
总结
InterSystems的产品Caché(高性能数据库)和Ensemble(通用集成平台)所采用的多维数据架构使得其非常适合商业智能。Caché的快速处理性能不仅使得采用传统方式的数据仓库受益匪浅,而且适合对经常变更的操作型数据进行实时分析,从而开创了一种新的商业智能解决方案。“商业智能”是能实时分析和信息响应的、并能够充分利用每天收集到数据的卓越的系统。
Ensemble能够实时分析集成系统中的消息和其他数据,采用Ensemble能够建立业务活动监控方案所需的执行仪表盘和反馈机制。