现代数据仓库构建指南:Azure 服务选型与实践
1. 计算组件与存储组件的独立扩展优势
计算组件最大的优势之一是其能够独立于存储组件进行扩展。当你需要时,可以随时添加计算能力。如今,许多服务都增加了自动扩展功能。
2. 添加展示层
现代数据仓库中的展示层有三个主要目的:
- 性能 :数据库在性能上仍优于文件存储。索引、分区、压缩和分布式处理(如大规模并行处理数据库)在数据用于可视化时能提供所需的性能。
- 安全 :提供行级和列级安全功能,以及易于实现的授权、撤销和数据掩码,与文件存储相比具有很大优势。该层可作为中央安全点,消除集成多个不同系统的需求。
- 可用性 :能够将数据库内容抽象为所谓的数据库视图,数据工程师可以向用户隐藏数据库的复杂性。数据库视图是一个可以存储和访问的 SQL 语句,类似于数据库表。可以将技术表和列名转换为用户易于理解和使用的名称。此外,该层还可以轻松关联存储组件的不同区域,不仅从安全角度,还从可用性角度充当整合点。
3. 仪表盘/报告规划
许多公司的目标是实现自助式商业智能(BI)。在仪表盘和报告领域,我们至少需要能够连接到中央展示层的工具。这取决于你希望用户拥有何种自由度的策略。可能会讨论允许用户将其他数据源与数据仓库数据关联的工具。尽管数据湖和即时架构功能可加速开发生命周期,但你可能仍无法立即响应用户向系统添加新数据的请求。一个能够访问多个不同数据源并将其与中央数据仓库关联的工具可以缓解业务和 IT 之间的紧张关系。
自助式 BI 工具通常
超级会员免费看
订阅专栏 解锁全文

2412

被折叠的 条评论
为什么被折叠?



