当前位置: 首页 > news >正文

Hive SQL常见操作

        Hive SQL 是基于 Hadoop 的数据仓库基础设施,用于提供数据查询和分析。下面介绍常用的 Hive SQL 语句,进行数据处理和分析。

        1. 数据库操作

           创建数据库 :CREATE DATABASE IF NOT EXISTS db_name;

           使用数据库:USE db_name;

           删除数据库:DROP DATABASE IF EXISTS db_name CASCADE;

        2.表操作

           创建表:

CREATE TABLE IF NOT EXISTS table_name (col1 datatype,col2 datatype,col3 datatype
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

        查看表结构:

DESCRIBE table_name;

        删除表:

        DROP TABLE IF EXISTS table_name; 

        3.数据导入

         从本地文件系统导入数据:

        LOAD DATA LOCAL INPATH '/path/to/file' INTO TABLE table_name;

        从 HDFS 导入数据:

        LOAD DATA INPATH '/path/in/hdfs' INTO TABLE table_name;

        4.数据查询

        基本查询:SELECT col1, col2 FROM table_name WHERE condition;

        分组查询:SELECT col1, COUNT(*) FROM table_name GROUP BY col1;

        排序查询:SELECT * FROM table_name ORDER BY col1 DESC;

        5.连接操作

        内连接:SELECT * FROM table1 JOIN table2 ON table1.id = table2.id;

        左连接:SELECT * FROM table1 LEFT JOIN table2 ON table1.id = table2.id;

        6.窗口函数

        计算累计和:

SELECT col1, SUM(col2) OVER (ORDER BY col1) AS running_total FROM table_name;

        分组排名:

SELECT col1, col2, RANK() OVER (PARTITION BY col1 ORDER BY col2 DESC) AS rank FROM table_name;

        7.分区表操作

        创建分区表:

CREATE TABLE IF NOT EXISTS table_name ( col1 datatype, col2 datatype ) PARTITIONED BY (dt string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

        添加分区:

ALTER TABLE table_name ADD PARTITION (dt='2023-01-01');

        8.插入数据

INSERT INTO TABLE table_name VALUES (val1, val2, val3);

        9、聚合函数

        计算平均值:

SELECT AVG(col1) FROM table_name;

        计算最大值:

SELECT MAX(col1) FROM table_name;

        10.其他常用操作

        创建视图:

CREATE VIEW view_name AS SELECT col1, col2 FROM table_name;

        设置Hive参数:

SET hive.execution.engine=tez;

        

http://www.lqws.cn/news/152443.html

相关文章:

  • 邮件分类项目
  • 【汇编逆向系列】六、函数调用包含多个参数之多个整型-参数压栈顺序,rcx,rdx,r8,r9寄存器
  • 【安全攻防与漏洞】​​量子计算对HTTPS的威胁:后量子密码学进展
  • 量子计算+AI:特征选择与神经网络优化创新应用
  • 新版NANO下载烧录过程
  • 007-nlohmann/json 项目应用-C++开源库108杰
  • LFWG2024.08
  • 互联网大厂Java面试:从Spring Cloud到Kafka的技术考察
  • 如何给windos11 扩大C盘容量
  • golang 如何定义一种能够与自身类型值进行比较的Interface
  • 【Go语言基础】基本语法
  • 命令行运行python程序报错 ImportError: /lib/x86_64-linux-gnu/libstdc++.so.6
  • Vite模块联邦(vite-plugin-federation)实现去中心化微前端后台管理系统架构
  • 《C++初阶之类和对象》【命名空间 + 输入输出 + 缺省参数 + 函数重载】
  • ubuntu系统文件误删(/lib/x86_64-linux-gnu/libc.so.6)修复方案 [成功解决]
  • .Net Framework 4/C# LINQ*
  • 机器学习的数学基础:决策树
  • 双空间知识蒸馏用于大语言模型
  • win32相关(远程线程和远程线程注入)
  • 初探Service服务发现机制
  • 基础线性代数
  • 文档处理组件Aspose.Words 25.5全新发布 :六大新功能与性能深度优化
  • Python实现markdown文件转word
  • 【react+antd+vite】优雅的引入svg和阿里巴巴图标
  • Java在word中指定位置插入图片。
  • npm run dev 报错:Error: error:0308010C:digital envelope routines::unsupported
  • Flash烧录速度和加载配置速度(纯FPGA ZYNQ)
  • 使用ReactNative加载Svga动画支持三端【Android/IOS/Harmony】
  • FPGA 的硬件结构
  • 70年使用权的IntelliJ IDEA Ultimate安装教程