大数据:
2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
 测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
 这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
 与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试
 
  
  文章目录
 
  - 大数据:
- @[TOC](文章目录)
 
- 大数据:hive数据操作
- hive数据表操作
- 内部表操作
- 外部表
- hive 数据加载和导出
- 总结
 
文章目录
- 大数据:
- @[TOC](文章目录)
 
- 大数据:hive数据操作
- hive数据表操作
- 内部表操作
- 外部表
- hive 数据加载和导出
- 总结
大数据:hive数据操作

 
 
 
create database if not exists myhive;
use myhive;
和sql类似的
show database;
desc database myhive;

 
create database myhive2 location '/myhive2';
自定义文件夹,放自己的地方
删除同样是drop
drop database myhive;
cascade;强制删除相关的表
create table test(id int);
建表之后就不能随便删除了

hive数据表操作

 
 与sql类似
 
 
 
 
create table test(id int, name string, gender string);
跟sql一样

 
drop table 表名;
easy
内部表操作

 
 
 
 元数据和本身的数据,内部表,直接干掉
 外部表值删除元数据,还没发删除数据本身

 
 没有external,就是内部表
 关键字修饰才外部

 
 
 terminated by以,,,分割
 delimited fields限定列字段
 
外部表

 
 
 表和数据是独立的
 链接

 \t分隔符最好是设计好的
 美滋滋

 外部表有了,但是没用数据
 我们可以上传数据进去

 现有表,再有数据
表和数据是独立的,没有关联。

 先创建数据
 再建表,它链接
 
 
 hive会主动链接和关联表和数据
反正就是说,外部表和数据是独立的
删除表,不影响数据本身哦,它只是去关联。

 
 
alter table 表名字 set tblproperties('EXTERNAL'='TRUE/FALSE');
true就是外部
false就是内部
不能小写哦
 只能大写哦

hive 数据加载和导出

 
 
 
 local是Linux本地
 
 

 
 
 
 
 覆盖数据
 
 从表2中查数据,插入表1

 普通插入
 可以覆盖
 好说
 
 从文件到表
 从表到表
 数据加载的两种方式

 
 只不过跟导入数据方向相反
 
 
 导出到不同的地方,用词不同哦

 
 
 
 
 
 
 
 
总结
提示:重要经验:
1)
 2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
 3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。















