前言:
如今咱们对“python中parsel”大概比较关注,咱们都需要学习一些“python中parsel”的相关知识。那么小编在网络上搜集了一些有关“python中parsel””的相关文章,希望大家能喜欢,你们快快来学习一下吧!前言
国内大学最新排名,北大反超,浙大仅第四,中科大跌至第八
时隔五年,“双一流”大学即将迎来首次大考,这也是继改变高校评断标准之后,第一次即将以官方对外发布,自然是引来了许多人的关注。最近,有许多不同机构发布的国内高校排名,但彼此之间的差异很大,网友之间的争议也很大。
私信小编01即可获取大量Python学习资料
项目目标
爬取高三网大学排名,并保存
目标网址
基本环境配置python 3.6 pycharm爬虫代码
导入工具
import requestsimport parselimport csv
请求网页数据
url = ';headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)response.encoding = response.apparent_encoding
爬取数据
selector = parsel.Selector(response.text)trs = selector.css('#page tr')for tr in trs: dit = {} ranking = tr.css('td:nth-child(1)::text').get() dit['名次'] = ranking school = tr.css('td:nth-child(2)::text').get() dit['学校名称'] = school score = tr.css('td:nth-child(3)::text').get() dit['综合得分'] = score star = tr.css('td:nth-child(4)::text').get() dit['星级排名'] = star level = tr.css('td:nth-child(5)::text').get() dit['办学层次'] = level csv_writer.writerow(dit)
保存数据
f = open('排名.csv', mode='a', encoding='utf-8', newline='')csv_writer = csv.DictWriter(f, fieldnames=['名次', '学校名称', '综合得分', '星级排名', '办学层次'])f.close()运行代码,效果如下图
版权声明:
本站文章均来自互联网搜集,如有侵犯您的权益,请联系我们删除,谢谢。
标签: #python中parsel