快好知 kuaihz订阅观点

 

抓取100页网页数据,你还在用复制粘贴?使用...

一、分析网页

我们以抓取车质网的汽车投诉为例跟大家演示下如何批量抓取数据,如下图,分别是第一页到第三页的网址,我们可能看到这三页的网址,仅仅只有标红的123也就是对应的页码是不一样的,其余的都是一样的

二、抓取数据

紧接着我们打开excel,然后点击数据功能组找到自网站,我们点击高级选项然后将代表页码的数字单独放置在一个输入框内,可以通过点击添加部件来添加输入框,当设置完毕后我们直接点击确定

这样的话我们就进入导航器的界面,在这个网页中power query一共抓取到了两个内容,我们可以点击看下具体哪个是我们需要的数据,在这里table0就是我们想要抓取的数据,直接选择table0这个选项然后点击转换数据即可,这样的话我们就进入了powerquery的编辑界面

紧接着我们点击高级编辑器在let前面输入(x as number) as table =>然后将网址中的“1”更改为(Number.ToText(x))直接点击完成即可

这样的话我们就将我们前面的操作封装成了一个函数,我们只需输入对应的数字,然后点击调用就会跳到对应页码的数据

紧接着我们点击左边的一个空白的区域,点击鼠标右键选择新建查询,在其中找到其他源然后选择空查询,接着我们在编辑栏中输入={1..100}点击回车,这样的话我们就得到一个1到100的 序列,然后点击到表,将查询转换为表,直接点击确定即可

紧接着选择添加列,然后找到自定义函数在功能查询中选择table0,直接点击确定即可,这样话power query就会开始抓取数据,在这里我们抓取的100页的网页数据,这个过程可能会比较漫长,在这里我大概耗时3分钟,抓取完成后每个序列的后面都会得到一个table我们点击左右反向的箭头来扩展数据,将使用原始列名前面的对勾去掉,然点击确定,将我们添加的序列删除,这样的话就完成了,我们只需在开始中选择关闭并上载至即可将数据加载进Excel中,因为数据比较多,这个过程也会耗费比较多的时间,在这里我耗时大概1分钟

三、统计分析

数据加载进Excel中我们就可以通过数据透视表来的快速的分析数据,如下图是根据在车质网的投诉记录中抓取到的3000条数据然后通过数据透视表得到了投诉品牌以及投诉车系的排名,在这里3000条数据将近1个月的投诉量

以上就是我们批量抓取100页网页数据的方法以及各厂家的投诉排名,整个过程做起来耗时大概在7分钟左右,大部分时间都花费在数据的抓取与加载中。

怎么样?你学会了吗?赶快动手试试把

我是Excel从零到一,关注我持续分享更多Excel技巧

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:抓取  抓取词条  粘贴  粘贴词条  在用  在用词条  复制  复制词条  网页  网页词条  
办公

 你会用 Ctrl+9 吗?

在Excel中隐藏行,你一定是这样操作的:选取行 - 右键 - 隐藏其实隐藏行是有快捷键的,它就是:Ctrl+9隐藏列是Ctrl+左边的Ctrl键离9和0键有点...(展开)

办公

 那些让人欲罢不能的word使用技...

很多人word已经用了十多年,觉得我还用学吗?需要时问度娘好了。然而问题的关键不在于用多久,而在于有没有用对。其实,使用word除了文字的编辑,段落的调整,我们...(展开)