龙空技术网

干货整理:处理Pandas Data Frame中的行和列

是Cpp呀 107

前言:

而今看官们对“python添加列”都比较关切,朋友们都想要学习一些“python添加列”的相关资讯。那么小编也在网上汇集了一些有关“python添加列””的相关资讯,希望小伙伴们能喜欢,小伙伴们快快来学习一下吧!

数据帧是一种二维数据结构,即数据以表格方式排列成行和列。

我们可以对行或列执行基本操作,如选择、删除、添加和重命名。

今天将使用nba.csv档案。

处理列

为了处理列,我们对列执行基本操作,如选择、删除、添加和重命名。

列选择:

为了在PandasDataFrame中选择一个列,我们可以通过调用它们的列名来访问它们。

# Import pandas packageimport pandas as pd  # Define a dictionary containing employee datadata = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],        'Age':[27, 24, 22, 32],        'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],        'Qualification':['Msc', 'MA', 'MCA', 'Phd']}  # Convert the dictionary into DataFrame df = pd.DataFrame(data)  # select two columnsprint(df[['Name', 'Qualification']])

产出:

柱加法:

在PandasDataFrame中添加一个列,将一个新列表声明为一个列并添加到现有的Dataframe中。

# Import pandas package import pandas as pd  # Define a dictionary containing Students datadata = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],        'Height': [5.1, 6.2, 5.1, 5.2],        'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}  # Convert the dictionary into DataFramedf = pd.DataFrame(data)  # Declare a list that is to be converted into a columnaddress = ['Delhi', 'Bangalore', 'Chennai', 'Patna']  # Using 'Address' as the column name# and equating it to the listdf['Address'] = address  # Observe the resultprint(df)

产出:

列删除:

删除Pandas DataFrame中的列,可以使用drop()方法。通过删除具有列名的列来删除列。

# importing pandas moduleimport pandas as pd  # making data frame from csv filedata = pd.read_csv("nba.csv", index_col ="Name" )  # dropping passed columnsdata.drop(["Team", "Weight"], axis = 1, inplace = True)  # displayprint(data)

产出:

新输出没有传递的列。这些值被删除。

因为AXIS设置为1,并且由于Inplace是True,所以在原始数据帧中进行了更改。

删除列之前的数据帧-

删除列后的数据帧-

处理行:

对行执行基本操作包括:选择、删除、添加和重命名。

行选择:

熊猫为从数据框架中检索行提供了一种独特的方法。DataFrame.loc[]方法用于从Pandas DataFrame检索行。行还可以通过将整数位置传递给伊洛克[]功能。

# importing pandas packageimport pandas as pd  # making data frame from csv filedata = pd.read_csv("nba.csv", index_col ="Name")  # retrieving row by loc methodfirst = data.loc["Avery Bradley"]second = data.loc["R.J. Hunter"]    print(first, "\n\n\n", second)

产出:

如输出图像所示,返回了两个序列,因为两次都只有一个参数。

行加法:

在PandasDataFrame中添加一个Row,将旧的dataframe和新的数据连接起来。

# importing pandas module import pandas as pd     # making data frame df = pd.read_csv("nba.csv", index_col ="Name")   df.head(10)  new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,                        'Position':'PG', 'Age':33, 'Height':'6-2',                        'Weight':189, 'College':'MIT', 'Salary':99999},                                                            index =[0])# simply concatenate both dataframesdf = pd.concat([new_row, df]).reset_index(drop = True)df.head(5)

产出:

添加行之前的数据帧-

添加行后的数据帧-

行删除:

用Drop()方法删除PandasDataFrame中的一行,通过按索引标签删除行。

# importing pandas moduleimport pandas as pd  # making data frame from csv filedata = pd.read_csv("nba.csv", index_col ="Name" )  # dropping passed valuesdata.drop(["Avery Bradley", "John Holland", "R.J. Hunter",                            "R.J. Hunter"], inplace = True)  # displaydata

产出:

如输出图像所示,新输出没有传递的值。这些值被删除,并在原始数据框架中进行更改,因为Inplace是True。

在删除值之前的数据帧-

删除值后的数据帧-

标签: #python添加列