第288章 粽子!(2 / 3)
/p>
?
1?脚本脚本是数据集成的一种快速解决方案Y其优点是Y使用灵活且比
较经济Y很容易着手开发和进行修改Y几乎任何操作系统和绝大部分dbS都
可以使用脚本但是Y使用脚本也有很多问题Y比如Y耗费开发者的时间和
精力Y不好管理和操作Y以及不能满足服务水平协议?
等等。
有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL
EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x
?
2?EtLEtL是实现大规模数据初步加载的理想解决方案Y它提供了高级
的转换能力EtL任务通常都是在 维护时间窗口进行Y在EtL任务执行期间Y
数据源默认不会发生变化Y这就使得用户不必担忧EtL任务开销对数据源的影
响Y但同时也意味着Y对于商务用户而言Y数据和应用并非任何时候都是可
用的。
有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL
EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x
?
3?EAIEAI解决方案通常和EtL解决方案并存Y从而增强EtL的功能EAI
解决方案在源系统和目标系统之间进行连续的数据分发Y并且保证数据的成
功分发Y同时提供高级的工作流支持和基本的数据转换但是YEAI受到数据
量的限制Y因为EAI的初衷是为了实现应用的集成而不是数据的集成Y即它是
用来调用应用或者分发命令和消息的然而Y由于EAI具有在数据集成过程中
实时分发数据和维护数据一致性的特性Y所以也就能够提供实时数据获取的
能力Y而这种能力正是实时主动数据仓库所需要的。
有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL
EAI和cdc但是Y只有部分技术能提供实时(连续)的提供了连续变化数据的捕捉和分
发能力Y并且只需要很低的开销和时间延迟cdc在提交的数据事务上进行
操作Y从oLtp系统中捕获变化的数据Y再进行基本的转换Y最后把数据发送
到数据仓库中虽然在体系结构上Ycdc属于异步的Y但它表现出类似同步
的行为Y数据延迟只有不到1秒的时间Y同时能够维护数据事务的一致性。
EtL是将业务系统的数据经过抽取?
Extract?清洗转换?
transfor?
之后加载?
Load?到数据仓库的过程Y目的是将企业中的分散零乱
标准不统一的数据整合到一起Y为企业的决策提供分析依据
EtL是指从原系统中抽取数据Y并根据实际商务需求对数据进行转换Y然
后把转换结果加载到目标数据存储结构中源和目标通常都是数据库和文
件Y也可以是消息队列等。
数据抽取
可以采用周期性的pull机制或者事件驱动的ph机制
pull机制支持数据整合Y通常以批处理的方式工作
ph机制通常采用在线方式工作Y可以把数据变化传播到目标数据存储
结构。
数据转换 <
↑返回顶部↑