数据分析中的dataframe详解
DataFrame 是什么一句话讲透DataFrame 就是 Pandas 里的「表格」和Excel 表格、数据库表完全一样有行有列、有表头、有数据是 Python 数据处理最核心的对象。你可以把它理解成带名字的表格版 NumPy 数组一、最简单直观的样子用你的数据你之前的正弦数据变成 DataFrame 长这样xsin(x)0.00.0000000.10.0998330.20.198669……二、怎么创建 DataFrame最常用importnumpyasnpimportpandasaspd# 你的数据xnp.linspace(0,10,100)ynp.sin(x)# 把数组变成表格DataFramedfpd.DataFrame({x坐标:x,# 列名1正弦值:y# 列名2})三、DataFrame 最常用操作必须会1看前5行df.head()2取一列像字典一样df[正弦值]# 拿到一整列3查看基本信息行、列、数据类型df.info()4统计平均值、最大值等df.describe()5筛选数据# 筛选正弦值大于 0 的行df[df[正弦值]0]四、为什么 Altair / Streamlit 必须用 DataFrame因为NumPy 数组只有数字没有列名Altair 画图需要知道横轴是什么、纵轴是什么DataFrame 自带列名所以最适合做可视化# Altair 必须用 DataFramealt.Chart(df).mark_line().encode(xx坐标,y正弦值)五、一句话总结核心DataFrame 表格由列名 数据组成基于 NumPy 构建是数据处理 可视化的标准格式
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2422494.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!