前言:
当前朋友们对“js动态页面内容如何采集”大致比较重视,各位老铁们都需要了解一些“js动态页面内容如何采集”的相关内容。那么小编同时在网摘上搜集了一些有关“js动态页面内容如何采集””的相关文章,希望大家能喜欢,姐妹们一起来学习一下吧!在本文中,我们将看一种从维基百科网页获取/复制表格的方法,使用简单的JavaScript语法进行数据抓取。
在本文中,我将使用一种简单的JavaScript语法向您展示一种用Wikipedia Web页面获取/复制表格的方法。如果您对JavaScript不熟悉,请不要担心,您仍然可以继续。
顺便说一下,这个过程通常被描述为使用浏览器抓取数据。
开始吧!
转到以下Wikipedia网页。向下滚动到经济部分。切换到开发者工具:
在Internet Explorer上:按F12。
在谷歌浏览器上:点击菜单,然后点击更多工具,然后选择开发工具(见下图)。
现在是选择表来复制数据的时候了。点击Developer Tools的箭头,然后点击第一个表格的第一个元素,然后点击<tbody>标签选择表格(见下文):
请注意,标签<tbody>后面有一个$ 0,这个标志允许我们处理元素表,换句话说,$ 0就是现在的表。
点击控制台标签。
然后写$ 0并点击输入。
前面选择的表现在控制台上。很酷,对!
要保存表格,请输入以下代码并按下回车键:
var wholeTable = $$(“tr”,$ 0)
警告:
一定要使用直撇子,而不是tr周围的撇号。
要访问表中的任何单元格(例如第一个单元格),请使用此代码并按下enter键:
wholeTable [0] .cells [0] .innerText
该表是一组行和列,这是如何访问的:wholeTable [Line] .cells [Column]。该inneText只是一个显示单元格中的数据的方式。
现在,让我们通过以下循环来获取数据:
var tempObj = [];
for (i = 0; i < wholeTable.length; i++) {
tempObj[i] = {
Country: "",
GDP: ""
};
//Copy the first column
tempObj[i].Country = wholeTable[i].cells[1].innerText;
//Copy the second column
tempObj[i].GDP = parseFloat(wholeTable[i].cells[2].innerText.replace(/[^\d\.\-]/g, ""));
}
我创建一个空对象tempObj(一个数组)来复制对象属性' 国家和GDP '中的单元格数据。
备注
如果您使用的是其他表格,请随意编写与您想要复制的表格相对应的标题。
您可以通过将以下代码行添加到右列号来复制任何列: wholeTable[i].cells[NumberOfTheColumn].innerText;
下面的行parseFloat(wholeTable [i] .cells [2] .innerText.replace(/ [^ \ d \。\ - ] / g,“”)只是将文本转换为值的一种技巧,否则我会获取一个字符串而不是一个值。
好吧,猜猜看,桌子准备好了。最后一步是复制并粘贴tempObj,并在任何你想要的环境中使用它。写入副本(tempObj)并按下回车键。在这里检查。
随意分享你的经验,使用这种方法或其他方法。也欢迎您提出有关此主题的任何问题。
祝你今天愉快!
标签: #js动态页面内容如何采集 #js获取单元格内容 #js获取网页内容 #js获取table数据