龙空技术网

在python3中爬取网站数据并存入excel表格

厚积薄发爱python 525

前言:

眼前同学们对“python提取网页表格数据”可能比较关切,看官们都需要学习一些“python提取网页表格数据”的相关知识。那么小编同时在网摘上网罗了一些对于“python提取网页表格数据””的相关资讯,希望兄弟们能喜欢,各位老铁们快快来了解一下吧!

代码如下:

import requestsfrom bs4 import BeautifulSoupimport pandas as pd #导入pandas模块,并设置为pdr=requests.get("")html=r.text.encode(r.encoding).decode() #对r的内容进行中文解码并赋值给htmlsoup=BeautifulSoup(html,'lxml')print(soup) #打印解码后的soup内容,即html内容print("*"*50) #打印50个星号分割符print(soup.body.div) #打印soup的html文件内的body标签内的div标签的内容list1=[x for x in soup.findAll('div')] #遍历soup里的所有div标签,并赋值给list1df=pd.DataFrame(list1,columns=[""]) #将列标题设置为,并将list列表的数据依次存入相应单元格df.to_excel("将HTML的div数据存入Excel表格.xlsx") #将数据存入excel中,文件名为将HTML的div数据存入Excel表格.xlsx

图片示例如下:

标签: #python提取网页表格数据