前言:
眼前看官们对“python爬取网页表格”大体比较关怀,各位老铁们都需要剖析一些“python爬取网页表格”的相关文章。那么小编同时在网摘上网罗了一些有关“python爬取网页表格””的相关文章,希望我们能喜欢,咱们一起来了解一下吧!前面我有一篇教程爬虫何必用Python,用EXCEL爬取网页上的多页表格,里面说到了用EXCEL 加简单的VBA,爬取多页表格,今天我教大家如何用Excel Powerquery来爬取多页表格,这次的爬取目标还继续用上次的网站:;rec=31&search=1&tol=1111&val=C-
新建查询
2.输入网址然后点确定
3.网站加载完毕,点击编辑
4.点击视图-高级编辑器
5.修改程序
将上图程序开始和结束的位置分别添加"let GetResults=(URL) =>"和"in GetResults",并将要抓取的网址改为URL,修改后的程序如下
完成后点击已完成。
let GetResults=(URL) =>
let
源 = Web.Page(Web.Contents(URL)),
Data1 = 源{1}[Data],
更改的类型 = Table.TransformColumnTypes(Data1,{{"CLICK", Int64.Type}, {"FILTER TYPE", type text}, {"VIC No.", type text}, {"OEM No.", type text}})
in
更改的类型
in GetResults
6.将名称table1改为vicfilter
7.完成后点击关闭后上载
7.在表格中构造112页的网站链接(不懂可以参见上次的教程),并点击数据从表格
10.点击添加-自定义列
11.输入公式=vicfiter([URL]),点击确定
12.点击继续,并忽略隐私检查,点保存
13.点击扩展,然后点击确定
14.爬取成功,点击关闭并上载 ,速度杠杠的,比VBA的方法快上好几倍
好了教程就到这里了,有点长。。。如果有任何错误的地方还望指正,^_^