数据仓库介绍(四) - 逻辑数据模型

一、定义

       逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图(blue print),定义需要追踪和管理的各种重要实体、属性、关系。
 
       LDM是Hight Level并且是粗线条的,是对仓库模型在战略上和总体架构上的指导和原则。它利用图形方式,通过数据和关系反映业务的一个过程,明确业务需要,解决业务问题,是进行各种数据管理、分析和交流的重要手段。

二、意义与作用

       LDM是构建DW的第一步,是建立BI的基础框架,是提供价值数据分析的重要基础,为复杂的DW系统实施提供了规范和基础结构的蓝图。

       LDM促进业务部门和IT分析人员之间的有效沟通,形成对重要业务定义和术语的统一认识。具备跨部门、中性的特征,能够表达所有的业务。

三、分类

1.层次模型

        层次模型(Hierarchical Model)是最早出现的数据模型,它是采用层次数据结构来组织数据的数据模型。层次模型可以简单、直观地表示信息世界中实体、实体的属性以及实体之间的一对多联系。它使用记录类型来描述实体;使用字段来描述属性;使用结点之间的连线表示实体之间的联系。

(1)层次模型的概念

        层次数据结构也称树型结构,树中的每个结点代表一种记录类型。满足以下两个条件的数据模型称为层次模型:

   1)只有一个结点没有双亲结点(双亲结点也称父结点),该结点称为根结点。
   2)根结点以外的其他结点有且只有一个双亲结点。层次模型可以很自然地表示家族结构、行政组织结构等。

(2)层次模型的三要素

   1)数据结构:使用记录类型表示实体,使用结点之间的连线表示一对多的联系。
   2)数据操作:包括结点的查询和结点的更新(如插入、删除和修改)操作。
   3)完整性约束:一个模型只有一个根结点;其他结点只能有一个双亲结点;结点之间是一对多的联系。

(3)层次模型的优缺点

层次模型的优点是结构简单、清晰,容易理解,结点之间联系简单,查询效率高。

缺点主要有以下几点:

   1)不能表示一个结点有多个双亲的情况。
   2)不能直接表示多对多的联系,需要将多对多联系分解成多个一对多的联系。常用的分解方法是冗余结点法和虚拟结点法。
   3)插入、删除限制多。比如,删除父结点则相应的子结点也被同时删除等。具体内容可参考“数据结构”课程中树的相关操作。
   4)必须要经过父结点,才能查询子结点。因为在层次模型中,没有一个子结点的记录值能够脱离父结点的记录值而独立存在。

2.网状模型

网状模型(Network Model)采用网状结构,能够直接描述一个结点有多个父结点以及结点之间为多对多联系的情形。

(1)网状模型的概念网状模型是满足以下两个条件的基本层次联系的集合:

   1)允许有一个以上的结点无双亲结点。
   2)一个结点可以有多于一个的双亲结点。 实际上,层次模型是网状模型的一个特例。

        网状模型去掉了层次模型中的限制,允许多个结点没有双亲结点,允许结点有多个双亲结点,还允许结点之间存在多对多的联系。使用网状模型可以表示多对多联系。网状模型中子结点与双亲结点的联系可以不唯一,但需要为每个联系进行命名,图1-8中成绩结点有两个双亲结点:课程和学生。将课程与成绩的联系命名为“课程-成绩”,将学生与成绩的联系命名为“学生-成绩”。

(2)网状模型的三要素

   1)数据结构:使用记录类型表示实体,使用字段来描述实体的属性,每个记录类型可包含若干个字段,使用结点之间的连线表示一对多的联系。
   2)数据操作:包括结点的查询和结点的更新操作。3)完整性约束:支持码的概念,用于唯一标识记录的数据项的集合;保证一个联系中双亲结点与子结点之间是一对多联系;支持双亲记录和子女记录之间的某些约束条件,如只删除双亲结点等。

(3)网状模型的优缺点

         网状模型具有良好的性能,存取效率较高。相比层次模型,网状模型中结点之间的联系具有灵活性,能表示事物之间的复杂联系,更适合描述客观世界。网状模型虽然有效克服了层次模型不方便表达多对多联系的缺点,但因为结构复杂,实现网状数据库管理系统比较困难。并且其所提供的DDL语言复杂,不容易学习和掌握。此外,由于实体间的联系本质上是通过存取路径来表现,因而,应用程序在访问数据时还需要指定存取路径。

3.关系模型
         层次模型和网状模型的共同缺点是通过存取路径实现记录之间的联系,应用程序在访问数据时必须选择适当的存取路径,用户必须了解系统结构的细节,这样加重了编写应用程序的负担。另外,不支持集合处理,即没有提供一次处理多个记录的功能。 关系模型(Relational Model)在1970年由IBM公司的E.F.Codd首次提出。关系模型可以描述一对一、一对多和多对多的联系,并向用户隐藏存取路径,大大提高了数据的独立性以及程序员的工作效率。此外,关系模型建立在严格的数学概念和数学理论基础之上,支持集合运算。关系模型由关系数据结构、关系操作和完整性约束三部分组成。在关系模型中,实体和实体之间的联系均由关系来表示。

(1)关系的定义: 关系模型是一种简单的二维表格结构,每个二维表称做一个关系,一个二维表的表头,即所有列的标题称为一个元组,每一列数据称为一个属性,列标题称属性名。同一个关系中不允许出现重复元组和相同属性名的属性。

(2)数据库体系结构:

   1) 外模式:或子模式、应用模式、局部模式等,它是对数据库在某个方面局部应用所涉及数据的逻辑结构和特征的描述,它是终端用户和应用程序员所见到的数据库。

   2)模式:或概念模式、逻辑模式、全局模式等。它是对整个数据库逻辑结构和特征的描述,用户以DBMS支持的逻辑数据模型为基础。

   3)内模式:或存储模式、物理模式等。它是对整个数据库的存储结构和特征的描述。

四、应用

金融业的11个主题

1团体 PARTY
是指银行作为一个金融机构所服务的任意对象和感兴趣进行分析的各种对象。如个人、公司客户、潜在客户、代理机构、合作伙伴、雇员、分行、部门等。一个团体可以同时是这当中许多种角色。借助团体主题的建立可以实现基于客户基本信息的分析,是实现以客户为中心的各种分析应用的重要基础。

2资产 ASSET
用于描述团体的资产,资产主题包含两大类的资产,客户资产和建行自有资产。一个资产可以被多个团体所拥有,一个团体可以与多个资产有关。资产可分为实物资产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。本主题可以存放从业务系统能够取得到的所有的客户资产或建行自有资产,可以房地产、存货、机动车辆、在其他金融机构的存款。

3地域 LOCATION
地域信息存储了希望观察和分析的任何区域,既包括传统类型的地址信息(如区县、街道),又包括如电话、电子邮箱等电子地址信息。

4产品 PRODUCT
产品(Product):指为拓展市场占有率,满足客户更广泛需求而制定的可营销的交易品种的集合,产品是金融机构向用户销售的或提供给客户所使用的服务。如果有必要,可以包括竞争对手所提供的产品

5协议 AGREEMENT
是金融机构与团体之间针对某种特定产品或服务而签立的契约关系,它可以是多样化的,如帐户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或服务的条款和条件达成协议时,一个协议(AGREEMENT)就会被开立,因此协议是客户和银行往来的重要载体。协议主题与很多应用有关,如:风险敞口的计算、不同种类协议的评级、资产负债的缺口分析、客户和银行的往来情况(客户贡献、客户买的什么产品、何时购买的产品)等。

6事件 EVENT
是一个范围很广义的概念,可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,可以记录各种与银行相关的活动的详细情况,包括交易数据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。

7营销活动 CAMPAIGN
营销活动是银行对客户开展的一系列的促销事件以及相应的策略和规划活动的组合,是为了获取、维护、增强金融机构与客户的关系而开展的,其目的可能是为推广某些产品,也可能是为了树立市场形象。

8渠道 CHANNEL
渠道是银行与客户进行交互和接触的手段和方法,通过它客户与银行进行接触、购买产品、使用服务并交流信息。渠道一般包括ATM、分行柜台、电话、POS、呼叫中心、电视、广播、报纸、网络、信件等。

 9财务 FINANCE
主要包括银行的总帐信息,是描述科目组织、控制、内部核算等银行核心科目帐务以及预算管理有关的内容。该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。

 10申请 APPLICATION
申请是一个团体表达与银行建立关系的意图。在团体(或申请者)满足银行的接收标准前,这种意图并不足以建立关系。本主题记录一个团体向银行提交的申请信息以及申请的状态、团体和申请关系历史、申请和资产关系历史、银行对申请的评分等信息。

11模型 MODEL
存储与模型细节相关的信息类,包括模型细节(模型名称、创建时间等等)、模型指标以及团体、渠道、产品的评分和细分。模型可以有多次运行;一个模型和另一个模型可以有多种关系;模型有多个结果值。



    原文作者:喝酸奶舔盖儿的土鳖
    原文地址: https://blog.csdn.net/leicool_518/article/details/44943173
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞