Python数据分析基础

Python数据分析基础
NGX安装Anaconda
Anaconda是一个用于数据科学、机器学习的开源Python和R语言发行版,它集成了大量的科学计算包和工具(如 NumPy, Pandas, Jupyter),通过conda包管理器和环境管理工具,简化了软件安装、管理和多环境配置的复杂性,让你能“开箱即用”,专注于分析和开发。
- Anaconda下载地址:https://www.anaconda.com/download
- Anaconda Cloud JupyterLab:https://anaconda.com/app
Numpy
安装Numpy
如果是从Anaconda启动的Python,则Numpy库已经预装好了。如果是Miniconda或原生Python环境可能需要安装Numpy库,请在终端输入以下代码安装:
1 | pip install numpy |
Numpy介绍
Numpy是Python中科学计算的基础包。它是一个Python库,提供多维数组,象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、I/O、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。
Numpy的部分功能如下:
- ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。
- 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。
- 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
- 线性代数、随机数生成以及傅里叶变换功能。
- 用于集成由C、C++、Fortran等语言编写的代码的API。
ndarray
ndarray特性
- 多维性:支持0维(标量)、1维(向量)、二维(矩阵)及更高维数组。
- 同质姓:所有元素类型必须一致(通过dtype决定)。
- 高效性:基于连续内存块存储,支持向量化运算。
多维性
1 | # 导入numpy库 |
可以使用 arr.ndim 可以查看数组的维度。
同质性
1 | import numpy as np # 导入numpy库 |
不同的数据类型会自动转换成相同的数据类型,注意:不会报错。整数类型转浮点型时会省略小数点后的0。
ndarray属性
| 属性名称 | 解释 | 使用示例 |
|---|---|---|
| shape | 数组的形状:行数和列数(或更高维度尺寸) | arr.shape |
| ndim | 维度数量:1维、2维、3维等 | arr.ndim |
| size | 总元素个数:数组中所有元素的个数 | arr.size |
| dtype | 元素类型:整形、浮点型等 | arr.dtype |
| T | 转置:行变列,列变行 | arr.T |
| itemsize | 每个元素占用的内存字节数 | arr.itemsize |
| nbytes | 数组总内存占用量:size * itemsize | arr.nbytes |
| flags | 内存存储方式:是否连续存储(高级优化) | arr.flags |
shape
1 | import numpy as np # 导入numpy库 |
数组的形状 () 表示数组是0维数组;(3,)表示第 0 轴上有 3 个元素,可以理解成长度为 3 的一条线;(2,3) 表示
第 0 轴(行)有 2 个,第 1 轴(列)有 3 个。
dtype
1 | import numpy as np # 导入numpy库 |
输出的int是指arr元素的数据类型是int,64表明数据占用内存的大小。
T
1 | import numpy as np # 导入numpy库 |
转置操作的作用时行变列,列变行;所以转置操作对0维、1维数组无效。
ndarray的创建
| 用途 | 方法 |
|---|---|
| 基础构造 | np.array()、np.copy() |
| 预定义形状填充 | np.zeros()、np.ones()、np.empty()、np.full() |
| 基于数值范围生成 | np.arange()、np.linspace()、np.logspace() |
| 特殊矩阵生成 | np.eye()、np.diag() |
| 随机数组生成 | np.random.rand()、np.random.randn()、np.random.randint() |
| 高级构造方法 | np.array()、np.loadtxt()、np.fromfunction() |
基础构造
1 | import numpy as np # 导入numpy库 |
可以通过列表创建数组,可以使用dtype参数指定数据类型。
1 | import numpy as np # 导入numpy库 |
copy()用于复制数组,如果需要复制的是列表,用array()。如果需要复制的时数组,则用copy()。
预定义形状
1 | import numpy as np # 导入numpy库 |
需要接收数组的形状,默认数据类型时float64,可以在定义的时候添加dtype参数修改默认数据类型。
1 | import numpy as np # 导入numpy库 |
empty()可以创建一个未定义的数组,其内容随机生成。
1 | import numpy as np # 导入numpy库 |
full()用于填充任意数值。
1 | import numpy as np # 导入numpy库 |
zeros_like()、ones_like()、empty_like()和full_like()可以复制数组的形状并进行填充。












