目录
一、删除缺失值
1、文本文件输入
2、字段选择
3、过滤记录
4、输出excel文件
5、运行
二、填充缺失值
1、添加文件
2、过滤记录
3、替换NULL值
4、合并记录
5、替换NULL值2
6、字段选择
7、Excel输出
8、运行并查看执行结果
一、删除缺失值

1、文本文件输入
①导入并增加文件

② 分隔符为’tab’,取消头部复选框

③ 获取字段并修改字段名称

2、字段选择
①获取字段

②移除‘sex’字段

3、过滤记录
设置过滤条件

4、输出excel文件
①设置输出到revenue_test.xls文件

②获取字段

5、运行
查看执行结果

查看revenue_test.xls文件

二、填充缺失值

1、添加文件

②分隔符采用tab,取消头部复选框

③获取字段
预览结果如下

2、过滤记录

3、替换NULL值
勾选“选择字段”并设置要替换的字段及值

4、合并记录

5、替换NULL值2

6、字段选择
①获取字段

②移除flagfield字段

7、Excel输出
①选择输出到的people_test.xls文件

②获取字段

8、运行并查看执行结果

在文件中查看



















![[Hadoop]大数据导论与Linux基础](https://img-blog.csdnimg.cn/ac057ff43b7e4c4899445f28e7c15c1c.png)
