强烈推荐这款神器,一行命令将网站转pdf!

封面

在日常工作生活中,我们常常会遇到一个需求:将网页保存为PDF。

比如,我比较喜欢某个公众号的文章,为了防止文章被删除,我想把这个公众号的历史文章保存为 PDF 文件,放到本地硬盘里,随时可以拿出来看。

我之前使用的方法是浏览器自带的功能,使用快捷键 Ctrl + P 或者在浏览器上右键点击页面,然后选择“打印”选项 ,调出浏览器打印功能。

封面

接着在“打印机”选项中选择“另存为PDF”,就可以输出 PDF 文件了。

这一套流程耗时有点长,偶尔操作个别页面是可以的,如果页面多了之后就会比较焦躁。

今天无意中发现一个好用的工具,它只需要一行命令就可以实现网页转 PDF 文件保存。

这款神器就是——wkhtmltopdf!

安装

要使用 wkhtmltopdf ,需要先安装这个软件。

wkhtmltopdf 的官网地址是:https://wkhtmltopdf.org/

在官网的 Downloads 导航下,我们可以看到这款软件支持多种操作系统,选择你正在使用的操作系统对应的安装文件即可。

封面

我这里下载的是 windows 版本,下载完成之后,直接安装。安装过程比较简单,总共才几步,直接默认配置即可。

使用

网页转 PDF

软件安装完成之后,就可以使用了。

这里以百度首页为例,展示如何将百度首页保存为 PDF 文件。

我们打开终端,找到安装路径下的 bin 目录,我的电脑路径是这样的:

封面

然后输入命令:

.\wkhtmltopdf.exe https://baidu.com C:\baidu.pdf

运行这个命令,等待运行完成后,你就可以在指定的目录下找到 baidu.pdf 文件了,我这里是 C 盘根目录下。

封面

这里不限于网站上的网页,本地的 html 文件也是可以的,你只需要把 https://baidu.com 替换成你本地的网页路径就行。

这里,需要进入到软件的安装目录下才可以运行命令,比较麻烦。你可以将软件的 bin 目录添加到环境变量中,添加完成后就可以在终端中即开即用了。

网页转图片

wkhtmltopdf 不仅可以将网页转 PDF 文件保存,还可以将网页转为图片保存,只需要使用另一个命令即可:

.\wkhtmltoimage.exe https://baidu.com C:\baidu.png

同样地,等待命令运行完毕,你就可以在对应目录下找到 baidu.png 的图片了。

封面

总结

wkhtmltopdf 的使用非常简单,甚至于官网对其使用方法也是几句话介绍。基于这个工具,我们也许可以做更多的事情,比如调用这个脚本命令,批量将爬虫爬取下来的网页转为 PDF 或者图片保存,这个有待各位去探索和使用!

Python Geek Tech wechat
欢迎订阅 Python 技术,这里分享关于 Python 的一切。