龙空技术网

用 python 做数据分析:pandas 与 excel 应用初探

LIFE与Python 530

前言:

现时你们对“没有nettcpipinf”大约比较注重,小伙伴们都想要剖析一些“没有nettcpipinf”的相关知识。那么小编也在网上收集了一些对于“没有nettcpipinf””的相关资讯,希望咱们能喜欢,兄弟们一起来学习一下吧!

pandas与excel

欢迎点击右上角关注小编,除了分享技术文章还有福利等你来拿,私信python可以领取python视频,PDF电子文档,爬虫等资料。

上一篇介绍了xlrd 和 xlwt两个库的安装以及使用,今天给大家介绍一下pandas库的安装,使用,以及read_excel( ) to_excel( ) 的正真面目,不要给它的真面目吓到哦。

安装

cmd下输入:

pip install pandas

如果你使用的是anaconda 就不需要安装,因为它本身就安装好了。

pycharm只要在project interpreter 下点击左下角加号,输入你要安装的库即可。

简介

先来看一个read_excel( )这个方法的API,这里只截选一部分经常使用的参数:

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None)

io:excel文件的路径

sheet_name:返回指定的sheet,如果将sheet_name指定为None,则返回全表,如果需要返回多个表,可以将sheet_name指定为一个列表,例如['sheet1', 'sheet2']

header:指定数据表的表头,默认值为0,即将第一行作为表头。

index_col: 指定列为索引列,默认None列。

usecols:读取指定的列。usecols = 'A'

使用

读取excel文件

import pandas as pddata = pd.read_excel('D:\\test.xlsx', sheetname='name')# sheetname 是excel的sheet的名字print(data.head()) #看看读取的数据,默认为前5行

读取sheet中的A:B列数据

import pandas as pddata = pd.read_excel('D:\\test.xlsx', sheetname='name', usecols='A:B')#读取A和B列的数据print(data.head())

使用loc方法,替换数据

import pandas as pddata= pd.read_excel('test.xlsx')data.loc[data['gender'] == 'female', 'gender'] = 1data.loc[data['gender'] == 'male', 'gender'] = 0print(data)

使用map()方法+lambda表达式,替换数据

import pandas as pddata= pd.read_excel('test.xlsx')data['gender'] = data['gender'].map(lambdax: 10ifx== 'female'else11)print(data)

使用map()方法+字典,替换数据

import pandas as pddata= pd.read_excel('test.xlsx')data['gender'] = data['gender'].map({'female': 20, 'male': 40})print(data)

使用replace替换数据

import pandas as pddata= pd.read_excel('test.xlsx')data.replace({'female': 15, 'male': 20}, inplace=True) # 要加inplace=True才能替换gender 列print(data)

保存excel文件

如果文件被修改,保存的时候一定要加inplace = True

data.to_excel('D:\\test1.xlsx',sheetname=data,inplace=True)

read_excel( )和 to_excel( )的真面容

pandas.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)to_excel(self, excel_writer, sheet_name='Sheet1', na_rep='', float_format=None,columns=None, header=True, index=True, index_label=None,startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None,inf_rep='inf', verbose=True, freeze_panes=None)​

看了之后是不是觉得生无可恋,不过不用怕一个函数的参数越多,说明它好用,只用记住几个常用参数,你就可以见证它的强大。

标签: #没有nettcpipinf