数据仓库的特点
数据仓库具有主题导向、集成式、相对稳定、反映历史变化等特点。相比传统的数据库,它不仅能帮助企业用户管理海量的历史信息,还能通过对数据的分析,挖掘数据的潜在价值。
主题导向
数据仓库是为决策分析提供数据的,它所涉及到的数据都是遵循一定的主题组织的。与传统数据库相比,主题导向是对数据进行更高层次的整合、归类和分析。数据仓库的每一个主题都对应着一个宏观的分析范围,同时它会排除于决策无用的数据。
集成式
数据仓库的数据都是来自于外部且分散于各个操作型数据库的数据。它会按照一定的主题,将分散的数据从原有的数据库中提取出来,进行整合和分析,消除原有数据的不一致性后,再综合存储到数据仓库中。
相对稳定
数据仓库内数据的质量是相对稳定的。数据仓库内的信息主要为决策和分析时使用,一般仅会进行数据查询的操作。所以海量数据在进入库中后,除了定期的提取、加载和查询外,很少进行修改和删除等操作,极大程度地保证了数据的稳定性。
反映历史变化
数据仓库中的数据一般会包含很多历史信息,这些历史信息记录着从单位时间点到某一具体时间的阶段内的所有既往信息。通过这些信息,我们可以总结出企业在发展过程中遇到的问题,并预测未来发展趋势和方向。
亚马逊云科技 Amazon Redshift 的优势
亚马逊云科技的 Amazon Redshift 是一种运行速度快、使用广泛、兼容性很强的全托管型云数据仓库。它采用了多种创新技术进行优化,以保证其对所有资源的更大利用和运行效率。它能够为用户提供花销不到传统方案十分之一的数据仓库解决方案,以此降低成本。用户不但可以通过简单而经济高效的方式,使用现有的智能商业工具对所有数据进行全托管式分析、自动备份、快速恢复,还可以自行设置防火墙规则,并审核各种操作,以保证数据仓库的安全性。
数据仓库的组成
数据仓库是集数据获得、数据提取、数据存储、数据访问为一体的数据的动态集成过程。将信息整合、重组再及时提供给用户,才是数据仓库的主要目的。它主要由元数据、提取工具、数据库、访问工具和数据集市五部分组成。
数据库
数据仓库中的数据库是数据仓库的核心组成部分,主要负责外部数据的存储以及管理。相较于传统的数据库,它不仅拥有更广泛的信息来源,还能够支持海量信息的快速检索(一般分为数据抽取、数据转换和数据装载三个步骤)。
提取工具
首先要将数据从分散的数据库中提取出来,才能整合、存储在数据仓库中,这里就需要数据提取工具。它需要有对不同数据库的访问能力,例如生成 COBOL 程序、MVS 作业控制语言、UNIX 脚本、和 SQL 语句等。
数据集市
数据集市是服务器为了某种特定的目的或需求,将数据从数据仓库中提取出来的小型数据集合,又叫部门数据。在使用数据仓库的过程中,可以先从一个数据集市着手,之后再将多个数据集市合并成一个完整的数据仓库。
元数据
数据仓库也保存形成和构建数据仓库所用方法的元数据。一般分为技术元数据和商业元数据两种。技术元数据是研发和管理人员使用的有关数据来源、转换、存储、更新时的基础数据。商业元数据是企业用户与业务相关的数据。
访问工具
访问工具是用户在访问数据仓库时,提供数据信息所使用的的手段。其中包括研发应用的工具、数据检索工具、报表填写工具、数据信息管理工具、在线数据分析 (OLAP) 工具和数据挖掘工具等前端工具。
数据库与数据仓库的区别
- 数据库是利用多个二维表格存放数据的电子文件柜。
- 数据仓库是数据库的升级,主要负责数据挖掘、分析、管理、决策。
区别:
- 数据库是面向业务设计的;数据仓库是面向主题设计的。
- 数据库一般存储的是在线类数据;数据仓库存储的是历史数据。
- 数据库为了避免冗余,所以一般采用符合范式的规则来建模;数据仓库允许合理的冗余,采用反范式的方式来设计。
- 数据库是为捕获和存储数据;数据仓库是为分析数据而设计。
亚马逊云科技热门云产品
Amazon Redshift
使用全托管、低成本、PB 级云数据仓库分析您的所有数据
Amazon S3
专为可从任何位置检索任意数量的数据而构建的对象存储
Amazon Elastic MapReduce
托管的 Hadoop 框架
Amazon DynamoDB
快速灵活的 NoSQL 数据库服务,适合在任何规模下使用
欢迎加入亚马逊云科技培训中心
欢迎加入亚马逊云科技培训中心
-
快速上手训练营
-
账单设置与查看
-
动手实操
-
快速上手训练营
-
第一课:亚马逊云科技简介
本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。
亚马逊云科技技术讲师:李锦鸿第二课:存储与数据库服务
您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。
亚马逊云科技资深技术讲师:周一川第三课:安全、身份和访问管理
在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。
亚马逊云科技技术讲师:马仲凯 -
账单设置与查看
-
-
动手实操
-
快速注册账号 畅享 40+ 免费云服务
快速注册账号 畅享 40+ 免费云服务
-
1 进入注册页面
-
2 设置用户名及密码
-
3 填写企业信息
-
4 企业信息验证
-
5 完成手机验证
-
6 选择支持计划
-
1 进入注册页面
-
01填写您注册账号的邮箱点击“继续”01填写您注册账号的邮箱点击“继续”03输入邮箱中收到的验证码点击“继续”03输入邮箱中收到的验证码点击“继续”注:该链接中的内容显示语言 是与您的网页浏览器设置相一致的,您可以根据需要自行调整语言栏。 *图片点击可放大
-
2 设置用户名及密码
-
3 填写企业信息
-
01填写公司联系人姓名全称01填写公司联系人姓名全称02填写公司联系人的联系电话02填写公司联系人的联系电话03填写公司名称*重要! ! !公司名称请务必与您所提供的营业执照公司名称保持一致03填写公司名称*重要! ! !公司名称请务必与您所提供的营业执照公司名称保持一致04填写公司办公地址省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码04填写公司办公地址省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码06您可以点击查看客户协议您可以点击查看客户协议勾选方框表示您已阅读,并同意客户协议的条款06您可以点击查看客户协议您可以点击查看客户协议勾选方框表示您已阅读,并同意客户协议的条款*图片可点击放大
-
4 企业信息验证
-
01在此上传企业注册执照01在此上传企业注册执照02请填写网络安全负责人的姓名
请注意: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致
02请填写网络安全负责人的姓名请注意: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致
03请填写网络安全负责人的联系方式有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)03请填写网络安全负责人的联系方式有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)04在此上传网络安全负责人的身份证件请注意:当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿
04在此上传网络安全负责人的身份证件请注意:当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿
*图片可点击放大 -
5 完成手机验证
-
6 选择支持计划