之前分享过我写的几个工具2023 更新版:苏生不惑开发过的那些原创工具和脚本 ,今天再更新下微博下载。
还是以这个号为例https://weibo.com/n/歌手李健,共抓取727条微博,导出的excel微博数据包含微博链接,微博正文,原始图片链接,被转发微博原始图片链接,是否为原创微博,微博视频链接,发布位置,发布时间,发布工具,点赞数,转发数,评论数,话题等。
第一条微博发布于2010年5月31 https://www.weibo.com/1744395855/OyJMj
再根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10微博了。
import
pandas
as
pd
df=pd.read_csv(
'weibo/歌手李健/1744395855.csv'
)
df[
'sort'
]=df[
'点赞数'
]+df[
'转发数'
]+df[
'评论数'
]
df.sort_values(by=[
'sort'
],ascending=False, inplace=True)
df.head(
10
).to_csv(
'歌手李健.csv'
,encoding=
'utf_8_sig'
,index=False)
https
:
//www.weibo.com/1744395855/LgnjmrmvF
https:
//www.weibo.com/1744395855/Cc3T09sqM
https:
//www.weibo.com/1744395855/C9UW2BmNd
https:
//www.weibo.com/1744395855/ChaNZmx6A
https:
//www.weibo.com/1744395855/Jfpw2xihv
https:
//www.weibo.com/1744395855/CfNZzoAMV
https:
//www.weibo.com/1744395855/Ckrkv2A0b
https:
//www.weibo.com/1744395855/Fn3bhwNWv
https:
//www.weibo.com/1744395855/Gt5of2OCo
https:
//www.weibo.com/1744395855/Gt5of2OCo再分析下微博发布工具比例图:
微博内容词云图:
原创微博与转发数据分布图:
转发评论点赞数据分布图:
导出pdf,大小 40MB。
所有微博图片:
然后是批量下载微博评论
苏生不惑
这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。
490篇原创内容
打开工具输入微博链接和网页版微博cookie就行,比如 https://weibo.com/1744395855/O0haQaIfE,https://m.weibo.cn/detail/5000660202553386
不过下载的评论比实际评论数少很多,可能被微博过滤了,点击加载更多没反应。
导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。
对excel文件分析评论IP地址分布图:
对excel文件分析评论内容生成的词云图:
还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,比如https://m.weibo.cn/status/5000660202553386这条微博有5000多条转发微博:
对excel文件分析微博转发ip地址分布图:
对excel文件分析微博转发内容词云图:
最后分享个查看微博无水印图片小技巧,有水印图https://lz.sinaimg.cn/mw690/001U3j31ly1gnynq1xvcqj634022oqv502.jpg替换为oslarge就是无水印图https://lz.sinaimg.cn/oslarge/001U3j31ly1gnynq1xvcqj634022oqv502.jpg,效果对比:
最新原创文章:
正式介绍下我的知识星球
2023 更新版:苏生不惑开发过的那些原创工具和脚本
再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数
一次性搞定微博,苏生不惑又写了个脚本,一键下载微博内容导出pdf,批量抓取微博评论转发数据导出excel
苏生不惑出品:2024 批量下载知乎回答,文章和想法,导出 excel 和 pdf ,文章数据包括标题,链接,赞同数
下载视频不求人,免费下载全网视频
全网电子书都在这了:ZLibrary 官方通道来了,不再担心找不到最新地址,配合这个脚本简直完美
2024 最新阿里云盘/百度网盘/夸克网盘资源搜索神器
研究了下莫言的公众号,发现。。。