DataFrame
DataFrame是Pandas的一种数据类型可以理解为n乘n的表格结构;下面是它的部分常用用法
1.创建DataFrame
import pandas as pd
import numpy as np
# dict
pd.DataFrame(data={'id':['a','b','c'],'values':[1,3,5]})
# list
pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
# tuple
pd.DataFrame(data=((1,3,5),(2,4,6),(9,8,7)))
# ndarray
pd.DataFrame(data=np.array([[1,3,5],[2,4,6],[9,8,7]]))
# Series
pd.DataFrame(data=pd.Series([1,3,5,2,4,6,9,8,7]))
2.DataFrame属性
df = pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
df.shape        # 形状
df.ndim         # 维度、轴
df.iloc[0]      # 按索引位置
df.loc[1]       # 按索引值
df.dtypes       # 元素类型
df.T            # 转置
df.size         # 元素个数
df.index        # 索引值
df.values       # 元素值
df.columns      # 列名
3.DataFrame方法
df.keys()                        # 获取索引
df.head()                        # 获取前五行(默认)
df.sort_values()                 # 按元素值升序排序
df.sort_index(ascending=False)   # 按索引值降序排序
df.describe()                    # 查看详细描述
df.mean()                        # 求平均
df.drop()                        # 返回删除某列的DataFrame
df.drop_duplicates()             # 去重
df.value_counts()                # 统计某列不同值出现的次数
df.reset_index()                 # 重置索引
df.astype()                      # 转换类型  
df.dropna()                      # 去除NaN值
 
 
 
 
