jquery怎么爬取页面数据

本篇内容主要讲解“jquery怎么爬取页面数据”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“jquery怎么爬取页面数据”吧!

成都创新互联公司是一家集网站建设,崇左企业网站建设,崇左品牌网站建设,网站定制,崇左网站建设报价,网络营销,网络优化,崇左网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

搭建环境:

(1)、创建一个文件夹,进入并初始化一个package.json文件。

npm init -y

(2)、安装相关依赖:

npm install --save koa? ? npm install --save cheerio //后面会用到,用于抓取页面模块,为服务器特别定制的,快速、灵活、实施的jQuery核心实现

现在来一个简单的demo热热身。直接上代码(文件名:demo2.js):

var http=require('http') // Node.js提供了http模块,用于搭建HTTP服务端和客户端

var url='' //输入任何网址都可以

http.get(url,function(res){  //发送get请求

var html=''

res.on('data',function(data){

html +=data  //字符串的拼接

})

res.on('end',function(){

console.log(html)

})

})。on('error',function(){

console.log('获取资源出错!')

})

执行node demo2.js? ?得到结果如下:

很神奇有木有。然而这不是我们想要的,我们想要的是获取页面里面某一部份的数据。

这里以 没事影院 的电视剧页面为例。这时候cheerio就派上用场了,前面已经安装过,这里就不再赘述,它的用法其实跟jquery是很相似的。参考?cheerio(百度百科的解释)

在刚刚的js文件中引入cheerio模块,然后加载所需要的html内容。

var $=cheerio.load(html)? // 加载需要的html

为了方便使用,这里封装一个函数:

functionfilterChapters(html) {var $=cheerio.load(html)  //加载需要的html,然后就可以愉快地使用类似jQuery的语法了

var chapters=$('.movie-item')  //在html里寻找需要的资源的class

var courseData=[] //创建一个数组,用来保存资源

chapters.each(function(item, index) {  //遍历我们的html文档

到此,相信大家对“jquery怎么爬取页面数据”有了更深的了解,不妨来实际操作一番吧!这里是创新互联网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!


网站名称:jquery怎么爬取页面数据
标题来源:http://pwwzsj.com/article/jgpsii.html