下载规范文件

因为学习时需要无网络环境,减少外部干扰。而一些规范文件需联网查看,于是想到把相关的规范下载下来。

为了防下载,现在主流的方法是使用pdf.js,实际遇到的情况分两种:

  • 抓包可获得直接下载地址

    通过抓包获得下载地址,直接下载

  • 无法获得下载地址

    1. 打开网页
    2. 点击全屏
    3. 顺时针旋转90度
    4. 截图
    5. 图片逆时针旋转90度
    6. 图片去黑边
    7. 图片合成pdf

使用selenium即可完成前面的工作,但是会导致截图存在3像素的黑边,强迫症患者自寻了python去黑边脚本。生成的pdf稍微有些大,但是清晰度不错。想进一步压缩,可使用Adobe Acrobat Pro DC对pdf进行压缩。