龙空技术网

js代码写一段web爬虫代码,读取当前页面的链接,json输出

快孵联盟 487

前言:

今天兄弟们对“js获取网页内容”大致比较关切,我们都想要剖析一些“js获取网页内容”的相关内容。那么小编同时在网摘上搜集了一些关于“js获取网页内容””的相关内容,希望同学们能喜欢,兄弟们一起来学习一下吧!

我手头有个项目,其中有个功能是爬取一个指定页面的所有链接地址,返回一个lists。我现在分享出来。

var tag = document.querySelectorAll("a");var myarray = []for (var i = 0; i < tag.length; i++) {    var nametext = tag[i].textContent;    var cleantext = nametext.replace(/\s+/g, ' ').trim();    var cleanlink = tag[i].href;    myarray.push([cleantext, cleanlink]);};function generateJson() {    var hrefArray = [];    for (var i = 0; i < myarray.length; i++) {        let t = {}        t.n = myarray[i][0]; t.m = myarray[i][1];        hrefArray.push(t);    };    var win = window.open("Json");    win.document.write(JSON.stringify(hrefArray));}generateJson()

测试步骤:

打开谷歌浏览器,地址栏输入网址的地址,打开要爬取的页面。打开控制台。复制粘贴上面的代码,json格式的数据将输出到当前页面。

屏幕截图

怎么运行输出结果

大家看完这篇文章有什么想法, 评论区多多交流!

标签: #js获取网页内容