puppeteer實(shí)現(xiàn)html截圖的示例代碼
puppeteer是谷歌官方出品的一個(gè)通過(guò) DevTools 協(xié)議控制 headless Chrome 的Node庫(kù)??梢酝ㄟ^(guò)Puppeteer的提供的api直接控制Chrome模擬大部分用戶操作來(lái)進(jìn)行UI Test或者作為爬蟲訪問頁(yè)面來(lái)收集數(shù)據(jù)。
安裝
直接運(yùn)行安裝命令:
npm install puppeteer
如果出現(xiàn)無(wú)法安裝的問題,可以使用淘寶鏡像。
puppeteer實(shí)現(xiàn)滑動(dòng)截圖
在我 puppeteer 使用截全屏的過(guò)程中發(fā)現(xiàn)有些圖片無(wú)法截取到,而實(shí)際上是因?yàn)橛行﹫D片是懶加載的,如果你沒有滑動(dòng)到圖片的位置,那么這個(gè)圖片是不會(huì)加載。
現(xiàn)在我的方式是采用模擬瀏覽器滾動(dòng)條滑動(dòng)的方式滑動(dòng)底部來(lái)使圖片加載出來(lái)。
代碼如下:
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch({
headless: false
});
const page = await browser.newPage();
await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
await page.setViewport({
width: 1200,
height: 800
});
await autoScroll(page);
await page.screenshot({
path: '1.png',
fullPage: true
});
await browser.close();
})();
function autoScroll(page) {
return page.evaluate(() => {
return new Promise((resolve, reject) => {
var totalHeight = 0;
var distance = 100;
var timer = setInterval(() => {
var scrollHeight = document.body.scrollHeight;
window.scrollBy(0, distance);
totalHeight += distance;
if (totalHeight >= scrollHeight) {
clearInterval(timer);
resolve();
}
}, 100);
})
});
}
動(dòng)圖如下:

puppeteer 實(shí)現(xiàn) html element 截圖
在某些情況下我們只想要針對(duì)html的某個(gè)位置進(jìn)行截圖而不是針對(duì)頁(yè)面截全屏。
puppeteer提供了ElementHandle.screenshot 方法,該方法參數(shù)和page.screenshot 一樣。而ElementHandle 對(duì)象是頁(yè)面內(nèi)的Dom對(duì)象??梢詭椭覍?duì) html element進(jìn)行截圖。這樣的話你想截取頁(yè)面的哪部分就截取頁(yè)面的哪部分。
代碼如下:
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch({
headless: false
});
const page = await browser.newPage();
await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
await page.setViewport({
width: 1200,
height: 800
});
//獲取頁(yè)面Dom對(duì)象
let body = await page.$('#cnblogs_post_body');
//調(diào)用頁(yè)面內(nèi)Dom對(duì)象的 screenshot 方法進(jìn)行截圖
await body.screenshot({
path: '2.png'
});
await browser.close();
})();
參考文檔:
https://github.com/GoogleChrome/puppeteer/blob/v1.11.0/docs/api.md#elementhandlescreenshotoptions
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
用node擼一個(gè)監(jiān)測(cè)復(fù)聯(lián)4開售短信提醒的實(shí)現(xiàn)代碼
這篇文章主要介紹了用node擼一個(gè)監(jiān)測(cè)復(fù)聯(lián)4開售短信提醒的實(shí)現(xiàn)代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-04-04
解決下載了nodejs但npm?-v沒有反應(yīng)問題的全過(guò)程
最近工作中遇到了個(gè)問題,node安裝成功,但npm無(wú)法使用,所以下面這篇文章主要給大家介紹了關(guān)于下載了nodejs但npm?-v沒有反應(yīng)問題解決的相關(guān)資料,需要的朋友可以參考下2022-08-08
NPM 安裝cordova時(shí)警告:npm WARN deprecated minimatch@2.0.10: Pleas
這篇文章主要介紹了NPM 安裝cordova時(shí)警告:npm WARN deprecated minimatch@2.0.10: Please update to minimatch 3.0.2 or higher to的相關(guān)資料,需要的朋友可以參考下2016-12-12
NodeJS實(shí)現(xiàn)跨域的方法(使用示例)
CORS是一種 W3C 標(biāo)準(zhǔn),它使用額外的 HTTP 頭來(lái)告訴瀏覽器讓運(yùn)行在一個(gè) origin (domain) 上的Web應(yīng)用被準(zhǔn)許訪問來(lái)自不同源服務(wù)器上的指定的資源,這篇文章主要介紹了NodeJS實(shí)現(xiàn)跨域的方法,需要的朋友可以參考下2024-05-05
nodejs的HTML分析利器node-jquery用法淺析
這篇文章主要介紹了nodejs的HTML分析利器node-jquery用法,簡(jiǎn)單分析了node-jquery的功能并結(jié)合實(shí)例說(shuō)明了node-jquery控制臺(tái)輸出信息的操作技巧,需要的朋友可以參考下2016-11-11
nodejs命令行參數(shù)處理模塊commander使用實(shí)例
這篇文章主要介紹了nodejs命令行參數(shù)處理模塊commander使用實(shí)例,commander是一個(gè)非常高大上的令行參數(shù)處理模塊,需要的朋友可以參考下2014-09-09
node.js如何操作MySQL數(shù)據(jù)庫(kù)
這篇文章主要介紹了node.js如何操作MySQL數(shù)據(jù)庫(kù),幫助大家更好的進(jìn)行web開發(fā),感興趣的朋友可以了解下2020-10-10

