本软件下载地址未录入,如想要软件请评论,我们会补上!python 爬取网页内容并保存为pdf格式html2pdf.py是一款支持使用 Python 抓取网页中图片的内容, 并将其转换为 PDF 格式的文件。
sprite_image = image_re.findall(webPage) #通过规则找到符合的对象,并进行存储,列表类型
a = range(len(sprite_image)-1) #创建以长度为……的数列
pdf = PdfPages('cut_figure.pdf')#先创建一个pdf文件
#原理是先保存到图片,然后读取图片保存到pdf。
#这一部分可以直接在内存中操作,目前考虑代码的复杂度先用文件处理