nodejs puppeteer定位元素 await page.$ 和await page.waitForSelector - 查问我看 - 查问网

原 Win7安装nodejs，之后在sublime运行，之后再安装 puppeteer采集网页

|-原 nodejs puppeteer定位元素 await page.$ 和await page.waitForSelector

PHPer 2024-06-23 412 0 0

var pager_next = await page.$('.vui_button vui_pagenation--btn vui_pagenation--btn-side');//这种写法不支持 20240623
var no_content = await page.$('.vui_button--disabled');//这种写法支持 20240623
var pager_next = await page.waitForSelector('text/下一页');

版本 puppeteer@22.11.2

示例代码

url2 = decodeURIComponent(url);
        console.log(url2);//https://search.bilibili.com/all?keyword=php教程&from_source=webtop_search&spm_id_from=333.999&search_source=5
        url2.match(/keyword=([^&]+)/g);
        keyword = RegExp.$1;
        url2.match(/page=([0-9]+)/g);
        page_num = RegExp.$1;
        if(page_num==1){
            url =url.replaceAll('&page=1','');
        }
        console.log('keyword:'+keyword+',page_num:'+page_num)

        await opn("http://cn.bing.com",{app: ['chrome','--remote-debugging-port=1234']});

        await wait(5000);//等待5秒，等待浏览器打开 20240622 

        let wsKey = await axios.get('http://localhost:1234/json/version');
        let browser = await puppeteer.connect({
            browserWSEndpoint: wsKey.data.webSocketDebuggerUrl,
            defaultViewport:null
        });
        let page = await browser.newPage()
        await page.goto(url,{
            waitUntil:'networkidle2' //等待页面不动了，说明加载完毕了
        });
 
        
       
        let bodyHandle = await page.$('html');
        let html = await page.evaluate(body => body.outerHTML , bodyHandle);

        fs.writeFileSync(nodejsc_dirname+'html2/'+keyword+'_'+page_num+'.html',html);

        await wait(2000);//等待2秒 

        var pager_next = await page.waitForSelector('text/下一页');
        // console.log(pager_next)
        // return 
        var pager_next = await page.$('.vui_button vui_pagenation--btn vui_pagenation--btn-side');//这种写法不支持 20240623
        var no_content = await page.$('.vui_button--disabled');//这种写法支持 20240623

20240623...

浏览更多内容请先登录。 立即注册

采集, NodeJs

更新于：2024-06-23 14:23:04

您需要登录后才可以评论。立即注册

相关内容

这里专门开个帖子用来整理采集遇到的问题

Linux中使用curl命令访问https站点4种常见错误和解决方法

使用 curl 进行 ssl 认证 -文章是百度搜curl.cainfo找到的

网上之前找的封装php curl的类，小巧且实用，用了挺久

采集的时候把目标网页的内容输出到页面调试的问题

PHP实现抓取百度搜索结果并分析数据结构

CentOS 8 安装Puppeteer 记录

windows wamp SSL certificate problem: unable to get local issuer cert...

安装Puppeteer插件，PHP采集实现抓取百度搜索结果并分析数据结构

采集时遇到报错，去github.com查资料，遇到Github网站打不开的问题，网上找的...

PHP采集时报错Failed to launch the browser process puppeteer

Win7安装nodejs，之后在sublime运行，之后再安装 puppeteer采集网页

puppeteer爬取豆瓣电影信息

解决centos运行node项目puppeteer时chrome错误问题

How to Setup Puppeteer In CentOS 7 用spatie/browsershot成功采集百度...

cnpm 安装的扩展的路径不好找，觉得还是用npm安装，用国内的镜像源

nodejs 报错 Error: EPERM: operation not permitted, mkdir‘xxxxxxxxx...

新的chrome headless模式 headless=new

nodejs 报错 Error: Could not find Chrome (ver. 119.0.6045.105). This ...

Error: Could not find Chrome 运行js脚本直接执行ok，用php的exec执行脚...

PHP抓取JS渲染后的页面内容

ubuntu 安装 Puppeteer 配合laravel采集

Laravel + Puppeteer是在Windows11上成功了，在ubuntu22.04上没成功过

各种采集应用和采集插件的安装和采集代码整理

PHP Querylist采集插件Puppeteer的安装

PHP采集页面的四种方法

python获取完整网页内容（含js动态加载的）：selenium+phantomjs

php-webdriver 配合chromedriver 采集 (Windows系统)(2023年12月)

推荐项目：Node.js与PHP的完美融合——node-php

【环境配置】centos安装chrome浏览器

爬虫进阶路程2——centos安装各个版本chrome

php开源采集类Snoopy.class.php功能使用介绍与下载地址

PHP采集类Snoopy

php使用QueryList轻松采集JavaScript动态渲染页面

PHP使用Browsershot进行网页截图

使用node.js爬取网页数据（简单粗暴）

python关键词爬取bing【必应images】高清大图

php获取链接跳转的真实地址

curl超时的设置

nodejs puppeteer 自动化测试和采集的内容整理

[Bug]: TypeError: page.$x is not a function

推荐内容

真枪实弹，假戏真做，12部具有“实干精神”的电影！

怎样使用V2Ray代理和SSTap玩如魔兽世界/绝地求生/LOL台服/战地3/黑色沙漠/彩...

sstap游戏代理教程从此玩如魔兽世界/绝地求生/LOL台服/战地3/黑色沙漠/彩虹六...

BT磁力搜索网站汇总和找不到的资源

什么是磁力链接，您如何使用？

Z-Library：全球最大的数字图书馆/含打不开的解决方案/镜像

使用V2Ray的mKCP协议加速游戏

v2rayN已停止工作

PHPer

Follow Excellence. Success will chase you......But how is excellence defin...

标签云
服务器搭建

WEB

个人爱好

游戏

linux

互联网

操作系统

mysql

Python

Yii2

php

WEB后端

采集

网站建设

WEB前端

Centos

工具

经济

生活

内容整理

数据库

资源

OS

电影

JS

常用命令

保险

php项目

问题整理

IT

网站

魔兽世界

composer

NodeJs

观点

AI

欧美电影

Yii扩展

美女

学习

LAMP

全文索引

Apache

前端

发现

Windows

Android

影评

服务器维护

国产电影

uwow

PHP框架

邮件服务器

音乐

评测

随笔

服务器

历史

Win7安装nodejs，之后在sub...
|-nodejs puppeteer定位元...

推荐内容