Pandas的两种数据类型:Series和DataFrame
有关他们的创建、索引、切片等其他操作
Series对象操作
Series对象的创建
1 | a = np.array([1,2,3]) |
Series对象的索引
1 | h = pd.Series({'A':1,'B':2,'C':3,'D':4}) |
Series对象的切片
1 | ## Series对象切片 |
DataFrame对象的操作
DataFrame对象的创建
1 | # 创建DataFrame对象(二维表格) |
DataFrame对象的索引
1 | j = pd.DataFrame({'A':[10,20,30,40,50],'B':[60,70,80,90,100]}, |
DataFrame对象的切片
1 | j = pd.DataFrame({'A':[10,20,30,40,50],'B':[60,70,80,90,100]}, |
从文件中读取数据
我们可以利用pandas
将表格文件中的数据给提取出来,转换成DataFrame
对象来使用
下面我们以CSV
文件为例,来演示读取文件的基本操作
CSV
文件:是以纯文本形式存储的表格数据。其中,记录之间以换行符分隔,字段之间用逗号或制表符分隔。CSV
文件可以由EXCEL
文件转换而来。
我们在当前目录下创建一个CSV
文件:
test.csv
1 | Name,Chinese,Math,English |
再看一下pandas
是如何操作这个文件的:
1 | # 读取当前目录的csv文件 |
分组运算
1 | b = pd.DataFrame({'subject1':['A','B','C','A','B'], |