Python数据分析工具pandas

算法吟游者
• 阅读 1778

一、关于pandas

pandas是基于NumPy构建,经BSD许可的开源库,为Python开发者提供高性能,易用的数据结构和数据分析工具。pandas官网

二、数据结构

1、Series:一维标记的数组,能够保存任何数据类型(整数,字符串,浮点数,Python对象等)。轴标签统称为索引。

import pandas as pd
import numpy as np

# 传入数据可以是 ndarray或列表,
# 此时传入index时,需要满足len(index)=len(data)
# data = np.random.randn(4)
# data = ["a",2,3.1,True]
# 传入数据可以是 标量值
# data = 6
# 传入数据可以是 字典
data = {"b":1,"a":6,"c":15}
# 如果没有传递index或index=None,将自动创建index=[0, ..., len(data) - 1]。
index = ['a', 'b', 'c', 'd', 'e']
# 创建 Series
s = pd.Series(data,index=index,name="my_series")
print(s)
# a    6.0
# b    1.0
# c    15.0
# d    NaN  --> pandas缺失数据标记
# e    NaN
# Name: my_series, dtype: float64
# Series切片操作
print(s[0]) # 6.0

print(s[:2])
# a    6.0
# b    1.0
# Name: my_series, dtype: float64

print(s[[1,4]])
# b    1.0
# e    NaN
# Name: my_series, dtype: float64

# Series类似字典操作
print(s["d"]) # nan
s["d"] = 2 # 设置指定index的值
print(s["d"]) # 2.0

print('e' in s) # True,判断是否含有指定index
# print(s["f"]) # KeyError: 'f'
print(s.get('f', np.nan)) # 类似字典get取值

print(s.name) # my_series 获取name
print(s.index) # Index(['a', 'b', 'c', 'd', 'e'], dtype='object')

2、Time- Series:以时间为索引的Series。
3、DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
4、Panel :三维的数组,可以理解为DataFrame的容器。

点赞
收藏
评论区
推荐文章
黎明之道 黎明之道
4年前
Pandas统计分析基础(基础篇,新手必看)
Pandas统计分析基础Pandas(PythonDataAnalysisLibrary)是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具,可以说Pandas是使得Pyth
Karen110 Karen110
4年前
总结了pandas提取数据的15种方法,统统只需1行代码,真香!
pandas是python数据分析必备工具,它有强大的数据清洗能力,往往能用非常少的代码实现较复杂的数据处理今天,鸟哥总结了pandas筛选数据的15个常用技巧,主要包括5个知识点:1.比较运算:、<、、、<、!2.范围运算:between(left,right)3.字符筛选:str.contains(pattern或字符串,naFalse)4.逻辑运算:&
Karen110 Karen110
4年前
14个pandas神操作,手把手教你写代码
「数仓宝贝库」,带你学数据!导读:Pandas是Python数据分析的利器,也是各种数据建模的标准工具。本文带大家入门Pandas,将介绍Python语言、Python数据生态和Pandas的一些基本功能。在Python语言应用生态中,数据科学领域近年来十分热门。作为数据科学中一个非常基础的库,Pandas受到了广泛关注。Pandas可以将现实中来
Aidan075 Aidan075
4年前
分享5个高效的pandas函数!
熟练掌握pandas函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次就为大家介绍5个pandas函数!本文来源towardsdatascience,作者SonerYıldırım,由Python大数据分析编译。1\.explodeexplode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同
Karen110 Karen110
4年前
14个pandas神操作,手把手教你写代码
「数仓宝贝库」,带你学数据!导读:Pandas是Python数据分析的利器,也是各种数据建模的标准工具。本文带大家入门Pandas,将介绍Python语言、Python数据生态和Pandas的一些基本功能。在Python语言应用生态中,数据科学领域近年来十分热门。作为数据科学中一个非常基础的库,Pandas受到了广泛关注。Pandas可以将现实中来源
Stella981 Stella981
4年前
Python实现数据分析(四)
Pandas关键词:数据分析库官网:https://pandas.pydata.org/(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fpandas.pydata.org%2F)介绍(选自百度百科):pandas是基于NumP
Stella981 Stella981
4年前
Python在网页上展示表格的简单方法
!(https://oscimg.oschina.net/oscnet/22596eed3e2a4708acc1bc8a22f8588d.jpg)Python是当今最热门的编程语言Pandas是Python下最热门的数据处理与数据分析的库Flask是Python下方便简洁的Web开发框架
Stella981 Stella981
4年前
Python 数据分析包:pandas 基础
pandas是基于Numpy构建的含有更高级数据结构和工具的数据分析包类似于Numpy的核心是ndarray,pandas也是围绕着Series和DataFrame两个核心数据结构展开的。Series和DataFrame分别对应于一维的序列和二维的表结构。pandas约定俗成的导入方法如下:lang:pytho
Stella981 Stella981
4年前
NumPy:数组批量计算
一、MumPy:数组计算1、NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。2、NumPy的主要功能:ndarray,一个多维数组结构,高效且节省空间无需循环对整组数据进行快速运算的数学函数\读写磁盘数据的工具以及用于操作内存映射文件的工具\
Pandas与Matplotlib:Python中的动态数据可视化
在数据科学领域,动态数据可视化是一种强大的工具,它可以帮助我们实时监控和分析数据变化。在本文中,我们将探讨如何使用Python中的Pandas和Matplotlib库来实现动态数据可视化,并以访问京东数据为案例进行详细说明。为什么选择Pandas和Matp