1.册除每列都为NAN的数据,以下操作正确的是单法题

选B:

2.?离散化就是将连续值进行分区间

选C

3.以下方法中可以修改索引名称的是多选

选ABCD。

df.index.map({0:‘A1’,1:‘B1’,2:‘C1’})
4.?求4个人的平均分数

选BCD .为啥选CD呢。



5.对于缺失值的处理方法有?

选ABCD。D有争议。

6. df.duplicated()方法默认检测的是每一行是否与之前出现过的行在某列上是重复的

B:不是某列,而是所有列相同才算重复的值。
7.Python内建的None估也被当作NaN判断题

选A。

8.(必做题1)读取lianjia.csv文件里的数据,完成以下需求

8.必做题1)读取lianjia.csv文件里的数据,完成以下需求
- 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
- 增加一个列关于目前状况(state),是否卖出状态随机设定
- 处理重复数据
- 查找楼层低的房子(这里提取低楼层)
- 电梯这列存在缺失值,想办法处理下缺失值
问答题 0.0分
1. 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)

2. 增加一个列关于目前状况(state),是否卖出状态随机设定

3. 处理重复数据
没重复值:

4. 查找楼层低的房子(这里提取低楼层)

5. 电梯这列存在缺失值,想办法处理下缺失值
subset是把该列有缺失值的“行”删掉。




















