前言:
现时咱们对“python爬妹子图”大概比较关切,各位老铁们都想要学习一些“python爬妹子图”的相关知识。那么小编同时在网络上网罗了一些关于“python爬妹子图””的相关文章,希望咱们能喜欢,朋友们一起来学习一下吧!前言
最近很忙,很久没有更新了,在这里和大家说声抱歉。今天继续讲一下爬虫实战,用Python爬取妹子图片。本文用到的知识点:
-requests
-xpath语法
-OS模块实现创建文件以及写入文件
爬取图片
先看效果图:
本文爬取的网站是豆瓣美女,网址:
代码
1.获取网站的网页数据
2.获取图片URL列表
3.依次写入本地文件
下面是整体的代码,爬取了前十页的图片:
import requestsimport osfrom lxml import etree#请求头headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}#URL列表urls=["{}".format(str(i)) for i in range(1,11) ]#路径,可以更改成你的路径path='C://Users/qzs/Desktop/美女图片/'#获取图片并写入本地文件def get_girlphoto(url): try: data = requests.get(url+"1", headers=headers) selector = etree.HTML(data.text) #获取图片的URL列表 girlphoto_urls = selector.xpath('//div/a/img/@src') #循环每个图片链接并写入本地文件,写入要用二进制 for item in girlphoto_urls: if not os.path.exists(path): os.makedirs(path) print("path创建成功") data = requests.get(item, headers=headers) with open(path + item[-7:], 'wb') as f: f.write(data.content) f.close() except : print("Exception")if __name__ == '__main__':#主函数 #循环URL for url in urls: get_girlphoto(url)
希望对刚入门的朋友有所帮助!
我的微信:lengquele5311
版权声明:
本站文章均来自互联网搜集,如有侵犯您的权益,请联系我们删除,谢谢。
标签: #python爬妹子图