浅谈ODS与DW的区别-数据项目实战总结
副标题[/!--empirenews.page--]
浅谈ODS与DW的区别-数据项目实战总结 ? ODS 全称operation data store 或者 operational data store,中文意思是操作型数据存储(数据被操作产生的,例如电商交易数据 (客户买东西订单)? 行业订单 工单数据(客户投诉数据) ),或者有的地方也叫运营数据仓储 1、在业务系统和数据仓库之间形成一个隔离层 粒度 注: 对于一条操作型数据来说 有很多个属性 以电信行业投诉工单为例 ,有投诉时间 号码归属地省 号码归属地市 投诉号码? 用户唯一标示 投诉类型 投诉内容等等。 最细粒度 意思就是 到用户唯一id 的统计数据,即详单数据 粗一点的粒度 即是不到用户这么细的统计数据 比如 到地市的统计数据 如 xx市 投诉用户总数 3、完成数据仓库中不能完成的一些功能 多维分析举例:还是以电信行业投诉工单为例,时间 号码归属地省市 投诉类型 这些都是常见的维度 ,可以统计一个月 某个省有多少工单数 或者 一天某个市 投诉宽带慢(投诉类型)的工单有多少个,类似这些 就叫多维分析 在一个没有ODS层的数据仓库应用系统体系结构中,数据仓库中存储的数据粒度是根据需要而确定的,但一般来说,最为细节的业务数据也是需要保留的,实际上也就相当于ODS,但与ODS所不同的是,这时的细节数据不是“当前、不断变化的”数据,而是“历史的,不再变化的”数据。 ? 数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制 ? ? 1、数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。 移动某省经分系统 领导和市场部决策分析时关注的 几大重点方面 :4G 终端 政企 渠道 宽带等,各主题之间可能相互还有联系 ,且比如渠道这个主题 可能核和渠道管理系统 crm系统 计费系统 都想关,因为需要从这些系统取数据 2、数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出 ????? 跟业务生产系统严格要求的数据不能冗余的一致准确性不同? ,dw的数据经常是冗余的 不同的表可能都有某个属性信息,因为dw表的数据通常都是很大量的 或者高度聚合过的,如果想取某个属性 要通过表关联 这样的时间消耗是很大的 ,或者都是聚合过得表 无法通过关联取得想要的指标 包括数据源的描述信息 和 自己库、表的描述信息 。像源库的ip信息 自己库的ip信息 都属于元数据信息,通常这些还挺重要 当ods涉及到数据共享的时候,还有比较重要的就是像一些字段的编码 解释 比如 是否智能机 0 1两个值 性别等。或者客户每月消费等级 1 代表1-100元 2 代表 100-150元。此类信息看着很简单 但是实际做好元数据统一管理很重要。项目组曾经出现过 有人月初误把一个是否智能机的元数据维表 的字段 0 1值改成了 Y N 。导致所有的涉及到的定时执行的存储过程 用的 case when 来统计智能机和非智能机的数量 全部出问题 。最后结果是全体加班重新跑数据。 ? 数据仓库和ods的数据源通常都是多样化 有db? 文本 ws接口 消息队列等 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |