龙空技术网

使用简单的JavaScript语法从网站获取数据

爱码农 255

前言:

当前朋友们对“js动态页面内容如何采集”大致比较重视,各位老铁们都需要了解一些“js动态页面内容如何采集”的相关内容。那么小编同时在网摘上搜集了一些有关“js动态页面内容如何采集””的相关文章,希望大家能喜欢,姐妹们一起来学习一下吧!

在本文中,我们将看一种从维基百科网页获取/复制表格的方法,使用简单的JavaScript语法进行数据抓取。

在本文中,我将使用一种简单的JavaScript语法向您展示一种用Wikipedia Web页面获取/复制表格的方法。如果您对JavaScript不熟悉,请不要担心,您仍然可以继续。

顺便说一下,这个过程通常被描述为使用浏览器抓取数据。

开始吧!

转到以下Wikipedia网页。向下滚动到经济部分。切换到开发者工具:

在Internet Explorer上:按F12。

在谷歌浏览器上:点击菜单,然后点击更多工具,然后选择开发工具(见下图)。

现在是选择表来复制数据的时候了。点击Developer Tools的箭头,然后点击第一个表格的第一个元素,然后点击<tbody>标签选择表格(见下文):

请注意,标签<tbody>后面有一个$ 0,这个标志允许我们处理元素表,换句话说,$ 0就是现在的表。

点击控制台标签。

然后写$ 0并点击输入。

前面选择的表现在控制台上。很酷,对!

要保存表格,请输入以下代码并按下回车键:

var wholeTable = $$(“tr”,$ 0)

警告:

一定要使用直撇子,而不是tr周围的撇号。

要访问表中的任何单元格(例如第一个单元格),请使用此代码并按下enter键:

wholeTable [0] .cells [0] .innerText

该表是一组行和列,这是如何访问的:wholeTable [Line] .cells [Column]。该inneText只是一个显示单元格中的数据的方式。

现在,让我们通过以下循环来获取数据:

var tempObj = [];

for (i = 0; i < wholeTable.length; i++) {

tempObj[i] = {

Country: "",

GDP: ""

};

//Copy the first column

tempObj[i].Country = wholeTable[i].cells[1].innerText;

//Copy the second column

tempObj[i].GDP = parseFloat(wholeTable[i].cells[2].innerText.replace(/[^\d\.\-]/g, ""));

}

我创建一个空对象tempObj(一个数组)来复制对象属性' 国家和GDP '中的单元格数据。

备注

如果您使用的是其他表格,请随意编写与您想要复制的表格相对应的标题。

您可以通过将以下代码行添加到右列号来复制任何列: wholeTable[i].cells[NumberOfTheColumn].innerText;

下面的行parseFloat(wholeTable [i] .cells [2] .innerText.replace(/ [^ \ d \。\ - ] / g,“”)只是将文本转换为值的一种技巧,否则我会获取一个字符串而不是一个值。

好吧,猜猜看,桌子准备好了。最后一步是复制并粘贴tempObj,并在任何你想要的环境中使用它。写入副本(tempObj)并按下回车键。在这里检查。

随意分享你的经验,使用这种方法或其他方法。也欢迎您提出有关此主题的任何问题。

祝你今天愉快!

标签: #js动态页面内容如何采集 #js获取单元格内容 #js获取网页内容 #js获取table数据