Hive 的优缺点

Hive 入门简单,更适合在对实时性要求不高的场景中处理大数据。

  • 优点:Hive 类似 SQL 语法,入门更简单,更容易上手;开发者无需开发查询分析数据功能,直接利用 MapReduce 实现数据分析,降低开发者的学习成本;Hive 具有高可靠、高容错的特点,处理大规模数据更有优势;Hive 能够自定义存储格式和函数,用户可以基于自身业务需求进行数据处理。
  • 缺点:Hive 延迟高,不适合实时性高的业务场景,也不适合处理小批量数据;Hive 仅支持普通视图,无法在视图上进行数据的增删改查等操作。

Hive 工作原理

简而言之,Hive 的工作原理就是一个查询引擎接收 SQL,然后对任务进行编译,再进行数据的管理和分析。

Hive 的执行入口是 Driver,用户提交 SQL 逻辑语句到 Driver 进行数据查询,编译器获取该数据查询任务后,到 MetaStore 中查找元数据信息进行任务编译,并把结果返回给 Driver。Driver 再把结果提交到执行器去执行,最后返回用户响应的执行结果。用户可以在可视化工具中,查看数据分析视图。

Hive 数据类型

Hive 数据类型_数值类型

数值类型

Hive 的数值类型数据包含7类:TINYINT、SMALLINT、INT、BIGINT、FLOAT、DOUBLE 和 DECIMAL。每一种类型数据的字节、精度、浮点数、有无符号整数都不同,是一个可变的字符串,用户可以根据需求进行类型转化。

Hive 数据类型_日期类型

日期类型

Hive 提供 DATE 类型和 TIMESTAMP 类型两种日期数据。DATE 类型数据格式为 yyyy-MM-dd;TIMESTAMP 类型数据格式为 yyyy-MM-dd HH:mm:ss.fffffffff,能精确到纳秒级别。

Hive 数据类型_复杂类型

复杂类型

Hive 复杂类型数据包括 ARRAY、MAP、STRUCT 三种。其中,ARRAY 是有序数组,字段的类型必须相同;MAP 是一组无序的键值对;STRUCT 是一组命名的字段。

亚马逊云科技热门云产品

Amazon Redshift

Amazon Redshift

运行速度快、使用广泛的全托管云数据仓库

Amazon Elastic Block Store

Amazon Elastic Block Store

易于使用的高性能数据块存储服务

Amazon Database Migration Service

Amazon DMS

快速并安全地进行数据库迁移

欢迎加入亚马逊云科技培训中心

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
  • 快速上手训练营
  • 第一课:亚马逊云科技简介

    本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。

    亚马逊云科技技术讲师:李锦鸿

    第二课:存储与数据库服务

    您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。

    亚马逊云科技资深技术讲师:周一川

    第三课:安全、身份和访问管理

    在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。

    亚马逊云科技技术讲师:马仲凯
  • 账单设置与查看
  • 视频:快速完成税务设置

    部署时间:5 分钟

    视频:账户账单信息

    部署时间:3 分钟

    视频:如何支付账单

    部署时间:3 分钟

  • 动手实操
  • 快速上手云上无服务器化的 MySQL 数据库

    本教程将引导您创建一个Aurora Serverless 数据库并且连接上它。

    部署时间:10 分钟

    启动一台基于 Graviton2 的 EC2 实例


    本教程将为您讲解如何在云控制台上启动一台基于 Graviton2 的 EC2 实例。

    部署时间:5 分钟

    使用 Amazon Systems Manager 进行云资源统一跟踪和管理

    在这个快速上手教程中,您将学会如何使用 Amazon Systems Manager 在 Amazon EC2 实例上远程运行命令。

    部署时间:10 分钟

准备好体验亚马逊云科技提供的云服务了吗?

新用户享受中国区域 12 个月免费套餐

立即注册,免费试用 Amazon EC2 T4g 实例

新老用户现可享受每月 750 小时的免费 t4g.small 实例使用时长,优惠期至 2025 年 12 月 31 日!

打开中国区账号注册页面

01 填写您 注册账号的邮箱,点击“继续”

02 查看您的 注册账号邮箱

注: 发件箱 no-reply@register.signin.amazonaws.com.cn

03 输入 邮箱中收到的验证码,点击“继续”

注: 该链接中的内容显示语言是与您的网页浏览器设置相一致的,您可以根据需要自行调整语言栏。

立即开始注册 »

image

填写用户名密码

01 请设置您的 账号用户名

02 为您的帐号 设置密码

03 重新 输入密码

立即开始注册 »

图片

填写账号联系人以及公司信息

01 填写公司联系人 姓名全称

02 填写公司联系人的 联系电话

03 填写 公司名称

注: 公司名称请务必与您所提供的营业执照公司名称保持一致

04 填写 公司办公地址

注: 省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码

05 请选择 是否需要发票

注: *附件-申请发票流程 供您参考

06 点击查看 客户协议 勾选方框表示您已阅读,并同意客户协议的条款

立即开始注册 »

图片

企业信息验证

01 在此上传 企业注册执照

02 请填写网络安全负责人的 姓名

注: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

03 请填写网络安全负责人的 联系方式

注: 有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)

04 在此上传网络安全负责人的 身份证件

注: 当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿

立即开始注册 »

图片

手机验证与支持计划

01 在此填写 手机号

02 请输入您收到的 4 位 验证码

03 请点击 继续

04 请根据需求 选择一个支持计划

立即开始注册 »

图片
限时钜惠

免费试用 Amazon EC2 T4g 实例

新老用户现可享受每月 750 小时的免费 t4g.small 实例使用时长,优惠期至 2025 年 12 月 31 日!