龙空技术网

无需编程,用Excel中的Powerquery爬取网页上的多页表格

月色微茫 748

前言:

眼前看官们对“python爬取网页表格”大体比较关怀,各位老铁们都需要剖析一些“python爬取网页表格”的相关文章。那么小编同时在网摘上网罗了一些有关“python爬取网页表格””的相关文章,希望我们能喜欢,咱们一起来了解一下吧!

前面我有一篇教程爬虫何必用Python,用EXCEL爬取网页上的多页表格,里面说到了用EXCEL 加简单的VBA,爬取多页表格,今天我教大家如何用Excel Powerquery来爬取多页表格,这次的爬取目标还继续用上次的网站:;rec=31&search=1&tol=1111&val=C-

新建查询

新建查询

2.输入网址然后点确定

输入网址

3.网站加载完毕,点击编辑

点击编辑

4.点击视图-高级编辑器

高级编辑器

5.修改程序

程序界面

将上图程序开始和结束的位置分别添加"let GetResults=(URL) =>"和"in GetResults",并将要抓取的网址改为URL,修改后的程序如下

完成后点击已完成。

let GetResults=(URL) =>

let

源 = Web.Page(Web.Contents(URL)),

Data1 = 源{1}[Data],

更改的类型 = Table.TransformColumnTypes(Data1,{{"CLICK", Int64.Type}, {"FILTER TYPE", type text}, {"VIC No.", type text}, {"OEM No.", type text}})

in

更改的类型

in GetResults

6.将名称table1改为vicfilter

7.完成后点击关闭后上载

点击已完成后

7.在表格中构造112页的网站链接(不懂可以参见上次的教程),并点击数据从表格

构造链接

10.点击添加-自定义列

添加自定义列

11.输入公式=vicfiter([URL]),点击确定

添加自定义列

12.点击继续,并忽略隐私检查,点保存

继续

隐私检查

13.点击扩展,然后点击确定

点击扩展

14.爬取成功,点击关闭并上载 ,速度杠杠的,比VBA的方法快上好几倍

爬取完成

好了教程就到这里了,有点长。。。如果有任何错误的地方还望指正,^_^

标签: #python爬取网页表格 #python爬取网页表格到excel