Python数据分析及可视化中常用的6个库及函数(二)

news2025/6/5 19:39:05

Python数据分析及可视化中常用的6个库及函数(二)

       摘要:以下是Python数据分析及可视化常用的6个库的详细介绍,包括它们的概述以及每个库中最常用的10个函数(如果某些库常用函数不足10个,则列出所有常用函数)。每个函数都附带功能描述、用法说明和使用示例。这些库在数据科学、机器学习和数据可视化领域被广泛使用。

1. NumPy

  • 概述:NumPy 是 Python 中用于科学计算的基础库,提供多维数组对象和各种数学函数,支持高效的数值运算。

1.1 常用函数

  1. numpy.array()功能:创建一个 NumPy 数组。
    用法numpy.array(object, dtype=None)object 是输入数据(如列表、元组),dtype 是数据类型。
    示例

    import numpy as np
    data = [1, 2, 3, 4]
    arr = np.array(data)
    print(arr)  # 输出: [1 2 3 4]
    
  2. numpy.mean()
    功能:计算数组的平均值。
    用法numpy.mean(a, axis=None)a 是输入数组,axis 指定计算平均值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    avg = np.mean(arr)
    print(avg)  # 输出: 2.5
    
  3. numpy.sum()
    功能:计算数组元素的总和。
    用法numpy.sum(a, axis=None)a 是输入数组,axis 指定求和的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    total = np.sum(arr)
    print(total)  # 输出: 10
    
  4. numpy.reshape()
    功能:改变数组的形状。
    用法numpy.reshape(a, newshape)a 是输入数组,newshape 是新的形状。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4, 5, 6])
    reshaped = np.reshape(arr, (2, 3))
    print(reshaped)  # 输出: [[1 2 3] [4 5 6]]
    
  5. numpy.zeros()
    功能:创建一个全零数组。
    用法numpy.zeros(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.zeros((2, 3))
    print(arr)  # 输出: [[0. 0. 0.] [0. 0. 0.]]
    
  6. numpy.ones()
    功能:创建一个全一数组。
    用法numpy.ones(shape, dtype=float)shape 是数组形状,dtype 是数据类型。
    示例

    import numpy as np
    arr = np.ones((2, 3))
    print(arr)  # 输出: [[1. 1. 1.] [1. 1. 1.]]
    
  7. numpy.random.rand()
    功能:生成均匀分布的随机数(0到1之间)。
    用法numpy.random.rand(d0, d1, ...)d0, d1, ... 是数组的维度。
    示例

    import numpy as np
    rand_arr = np.random.rand(2, 3)
    print(rand_arr)  # 输出: 2x3 的随机数数组
    
  8. numpy.std()
    功能:计算数组的标准差。
    用法numpy.std(a, axis=None)a 是输入数组,axis 指定计算标准差的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    std_dev = np.std(arr)
    print(std_dev)  # 输出: 1.118033988749895
    
  9. numpy.max()
    功能:返回数组中的最大值。
    用法numpy.max(a, axis=None)a 是输入数组,axis 指定查找最大值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    max_val = np.max(arr)
    print(max_val)  # 输出: 4
    
  10. numpy.min()
    功能:返回数组中的最小值。
    用法numpy.min(a, axis=None)a 是输入数组,axis 指定查找最小值的轴。
    示例

    import numpy as np
    arr = np.array([1, 2, 3, 4])
    min_val = np.min(arr)
    print(min_val)  # 输出: 1
    

2. Pandas

  • 概述:Pandas 是一个强大的数据分析和操作库,提供 DataFrame 和 Series 数据结构,适用于数据清洗、分析和处理。

2.1 常用函数

  1. pandas.read_csv()
    功能:从 CSV 文件读取数据并创建 DataFrame。
    用法pandas.read_csv(filepath, delimiter=',')filepath 是文件路径,delimiter 是分隔符。
    示例

    import pandas as pd
    df = pd.read_csv('data.csv')
    print(df.head())  # 输出数据的前5行
    
  2. pandas.DataFrame.groupby()
    功能:按指定列对数据进行分组,并可应用聚合函数。
    用法DataFrame.groupby(by)by 是分组依据的列名。
    示例

    import pandas as pd
    data = {'Name': ['Alice', 'Bob', 'Alice'], 'Score': [85, 90, 88]}
    df = pd.DataFrame(data)
    grouped = df.groupby('Name').mean()
    print(grouped)  # 输出: 按Name分组的平均分
    
  3. pandas.DataFrame.describe()
    功能:生成数据的描述性统计信息(如均值、标准差)。
    用法DataFrame.describe()
    示例

    import pandas as pd
    data = {'Score': [85, 90, 88, 92]}
    df = pd.DataFrame(data)
    stats = df.describe()
    print(stats)  # 输出: Score列的统计信息
    
  4. pandas.DataFrame.fillna()
    功能:用指定值填充数据中的缺失值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2397965.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

新德通科技:以创新驱动光通信一体化发展,赋能全球智能互联

在数字经济与AI技术高速发展的今天,光通信作为信息传输的核心基础设施,正迎来前所未有的升级浪潮。深圳新德通科技有限公司(以下简称“新德通科技”)凭借其深厚的技术积累与一体化产品布局,成为行业内的中坚力量。本文…

C++ 内存泄漏检测器设计

文章目录 1. C中的动态内存分配2. 什么是内存泄漏3. 内存泄漏的代码案例4. 内存泄漏检查器的设计模块1:位置信息捕获:模块2:内存分配跟踪:模块3:内存释放跟踪:模块4:泄漏记录存储:模…

破局与进阶:ueBIM 在国产 BIM 赛道的差距认知与创新实践

作为国产BIM领域的探索者,斯维尔ueBIM自诞生以来始终以追赶国际头部技术为目标,但不可否认的是,在核心功能覆盖、行业生态成熟度以及全球市场占有率等方面,我们与Autodesk Revit、Bentley Systems等国际巨头仍存在显著差距。这种差…

分布式流处理与消息传递——向量时钟 (Vector Clocks) 算法详解

Java 实现向量时钟 (Vector Clocks) 算法详解 一、向量时钟核心原理 #mermaid-svg-JcZ1GT0r1ZNSy6W7 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-JcZ1GT0r1ZNSy6W7 .error-icon{fill:#552222;}#mermaid-svg-JcZ…

20250603在荣品的PRO-RK3566开发板的Android13下的命令行查看RK3566的温度

20250603在荣品的PRO-RK3566开发板的Android13下的命令行查看RK3566的温度 2025/6/3 11:58 RK3566的cpu运行效率 top rk3566_t:/ # rk3566_t:/ # rk3566_t:/ # cd /sys/class/thermal/ rk3566_t:/sys/class/thermal # ls -l rk3566_t:/sys/class/thermal # cd thermal_zone0/ r…

帝可得 - 设备管理

一. 需求说明 设备管理主要涉及到三个功能模块,业务流程如下: 新增设备类型: 允许管理员定义新的售货机型号,包括其规格和容量。 新增设备: 在新的设备类型定义后,系统应允许添加新的售货机实例,并将它们分配到特定的…

【iOS安全】使用LLDB调试iOS App | LLDB基本架构 | LLDB安装和配置

LLDB基本架构 参考: https://crifan.github.io/ios_re_dynamic_debug/website/debug_code/lldb_debugserver.html https://book.crifan.org/books/ios_re_debug_debugserver_lldb/website/ LLDB安装和配置 1. 让iPhone中出现/Developer/usr/bin/debugserver 最初…

Idea 配置 Maven 环境

下载 Maven 官网:https://maven.apache.org/index.html 点击左侧 Downloads,然后选择 Files 中的 zip 包下载(下载慢可以使用迅雷) 配置 Maven 将压缩包解压,比如我解压后放到了 D:\developer\environment\apache-…

Kafka 如何保证不重复消费

在消息队列的使用场景中,避免消息重复消费是保障数据准确性和业务逻辑正确性的关键。对于 Kafka 而言,保证不重复消费并非单一机制就能实现,而是需要从生产者、消费者以及业务层等多个维度协同配合。接下来,我们将结合图文详细解析…

RNN结构扩展与改进:从简单循环网络到时间间隔网络的技术演进

本文系统介绍 RNN 结构的常见扩展与改进方案。涵盖 简单循环神经网络(SRN)、双向循环神经网络(BRNN)、深度循环神经网络(Deep RNN) 等多种变体,解析其核心架构、技术特点及应用场景,…

类 Excel 数据填报

类 Excel 填报模式,满足用户 Excel 使用习惯 数据填报,可作为独立的功能模块,用于管理业务流程、汇总采集数据,以及开发各类数据报送系统,因此,对于报表工具而言,其典型场景之一就是利用报表模…

Office文档图片批量导出工具

软件介绍 本文介绍一款专业的Office文档图片批量导出工具。 软件特点 这款软件能够批量导出Word、Excel和PPT中的图片,采用绿色单文件设计,体积小巧仅344KB。 基本操作流程 使用方法十分简单:直接将Word、Excel或PPT文件拖入软件&#xf…

【iOS】ARC 与 Autorelease

ARC 与 Autorelease 文章目录 ARC 与 Autorelease前言何为ARC内存管理考虑方式自己生成的对象,自己持有非自己生成的对象,自己也可以持有不再需要自己持有的对象时释放非自己持有的对象无法释放 ARC的具体实现编译期和运行期ARC做的事情ARC实现: __autoreleasing 与 Autoreleas…

铁电液晶破局 VR/AR:10000PPI 重构元宇宙显示体验

一、VR/AR 沉浸感困境:传统显示技术的天花板在哪? (一)纱窗效应与眩晕感:近眼显示的双重枷锁 当用户戴上 VR 头显,眼前像素网格形成的 “纱窗效应” 瞬间打破沉浸感。传统液晶 500-600PPI 的像素密度&…

竞争加剧,美团的战略升维:反内卷、科技与全球化

5月26日,美团发布2025年第一季度业绩报告,交出了一份兼具韧性与创新性的成绩单。 报告显示,公司一季度总营收866亿元,同比增长18%;核心本地商业收入643亿元,同比增长18%;季度研发投入58亿元&a…

(17)课36:窗口函数的例题:例三登录时间与连续三天登录,例四球员的进球时刻连续进球。

(89)例三登录时间 : 保留代码版本 : CREATE TABLE sql_8( user_id varchar(2), login_date date ); insert into sql_8(user_id,login_date) values(A,2024-09-02),(A,2024-09-03),(A,2024-09-04),(B,2023-11-25),(B,2023-12- 3…

高性能分布式消息队列系统(二)

上一篇博客将C进行实现消息队列的用到的核心技术以及环境配置进行了详细的说明,这一篇博客进行记录消息队列进行实现的核心模块的设计 五、项目的需求分析 5.1、项目框架的概念性理解 5.1.1、消息队列的设计和生产消费者模型的关系 在现代系统架构中,…

华为OD机试真题——天然蓄水库(2025A卷:200分)Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 200分 题型 本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析; 并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式! 2025华为OD真题目录+全流程解析/备考攻略/经验分享 华为OD机试真题《天然蓄水库》: 目录 题目…

【Harmony OS】数据存储

目录 数据存储概述 首选项数据存储 关系型数据库 数据存储概述 • 数据存储 是为了解决应用数据持久化问题,使得数据能够存储在外存中,达到保存或共享目的。 • 鸿蒙应用数据存储包括 本地数据存储 和 分布式数据存储 。 • 本地数据存储 为应用…

MybatisPlus--核心功能--service接口

Service接口 基本用法 MyBatisPlus同时也提供了service接口,继承后一些基础的增删改查的service代码,也不需要去书写。 接口名为Iservice,而Iservice也继承了IRepository,这里提供的方法跟BaseMapper相比只多不少,整…