站長資訊網
最全最豐富的資訊網站

python如何導出微信公眾號文章

python如何導出微信公眾號文章

相關學習推薦:python教程

1.安裝wkhtmltopdf

下載地址:https://wkhtmltopdf.org/downloads.html

我測試用的是windows的,下載安裝后結果如下

python如何導出微信公眾號文章

2 編寫python 代碼導出微信公眾號文章

不能直接使用wkhtmltopdf 導出微信公眾號文章,導出的文章會缺失圖片,所以需要使用 wechatsogou 將微信公眾號文章頁面抓取,之后將html文本轉化為pdf

pip install wechatsogou –upgrade

pip install pdfkit

踩坑!!!,看了很多人的代碼,都是一個模板,大家都是抄來抄去,結果還是運行不了,可能是因為依賴包更新的原因,也可能是因為我本地沒有配置wkhtmltopdf 的環境變量

import os import pdfkit import datetime import wechatsogou # 初始化API  ws_api = wechatsogou.WechatSogouAPI(captcha_break_time=3) def url2pdf(url, title, targetPath):     '''     使用pdfkit生成pdf文件     :param url: 文章url     :param title: 文章標題     :param targetPath: 存儲pdf文件的路徑     '''     try:         content_info = ws_api.get_article_content(url)     except:         return False     # 處理后的html     html = f'''     <!DOCTYPE html>     <html lang="en">     <head>         <meta charset="UTF-8">         <title>{title}</title>     </head>     <body>     <h2 style="text-align: center;font-weight: 400;">{title}</h2>     {content_info['content_html']}     </body>     </html>     '''     try:         path_wk="E:/softwareAPP/wkhtmltopdf/bin/wkhtmltopdf.exe";         config=pdfkit.configuration(wkhtmltopdf=path_wk)         pdfkit.from_string(input=html, output_path=targetPath,configuration=config)      except:         # 部分文章標題含特殊字符,不能作為文件名         filename = datetime.datetime.now().strftime('%Y%m%d%H%M%S') + '.pdf'         pdfkit.from_string(html, targetPath + os.path.sep + filename)    if __name__ == '__main__':     # 此處為要爬取公眾號的名稱      url2pdf("https://mp.weixin.qq.com/s/wwT5n2JwEEAkrrmOhedziw", "HBase的系統架構全視角解讀","G:/test/hbase文檔.pdf" )     # gzh_name = ''     # # 如果不存在目標文件夾就進行創建     # if not os.path.exists(targetPath):     #     os.makedirs(targetPath)     # # 將該公眾號最近10篇文章信息以字典形式返回     # data = ws_api.get_gzh_article_by_history(gzh_name)     # article_list = data['article']     # for article in article_list:     #     url = article['content_url']     #     title = article['title']     #     url2pdf(url, title, targetPath)

相關學習推薦:微信小程序教程

贊(0)
分享到: 更多 (0)
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
久久久免费精品re6| 国内精品久久久久久久涩爱| 精品国产乱码一二三四区五区| 蜜桃麻豆WWW久久囤产精品| 日韩精品久久久久久| 久久夜色精品国产| 国产精品成人国产乱一区| 精品一区二区三区中文| 99热在线日韩精品免费| 国产精品宾馆在线| 香蕉久久国产精品免| 午夜精品久久久久久久99蜜桃| 国产精品久久毛片完整版| 91精品国产91久久| 亚洲精品自在线拍| 97福利视频精品第一导航| 99久久精品全部| 日韩精品一区二区三区色欲AV| 久久国产乱子精品免费女| 99精品福利国产在线导航| AV天堂午夜精品一区| 久久精品免费网站网| 久久精品国产99久久香蕉| 精品国产黑色丝袜高跟鞋| 国产A√精品区二区三区四区| 亚洲精品一级无码鲁丝片| 亚洲人成电影网站国产精品| 亚洲第一区精品观看| 国产成人精品一区二三区在线观看| 国产精品99无码一区二区| 国产成人久久精品二区三区 | 日韩伦理一区二区| 亚洲日韩国产一区二区三区在线| 欧美日韩精品一区二区在线观看| 国产日韩综合一区二区性色AV| aaa级精品久久久国产片 | 亚洲精品中文字幕无码AV| 自怕偷自怕亚洲精品| 国产成人精品男人的天堂538 | 久久久无码精品亚洲日韩京东传媒| 日韩精品亚洲专区在线观看|