Python爬虫爬取博客实现可视化过程解析_Python

Python爬虫爬取博客实现可视化过程解析

2020-06-29 12:10杨万里 Python

这篇文章主要介绍了Python爬虫爬取博客实现可视化,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

源码：

									from pyecharts import Bar

									import re

									import requests

									num=0

									b=[]

									for i in range(1,11):

									  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)

									  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}

									  r=requests.get(link,headers=headers)

									  html=r.text

									  post=re.findall('<span class="post-view-count">(.*?)</span>',html)

									for i in post:

									    i = i.replace("阅读(", "")

									    i = i.replace(")","")

									    b.append(i)

									    num=num+1

									columns=[]

									for i in range(1,num+1):

									#设置行名

									  columns.append('博客'+str(i))

									#设置数据

									#设置柱状图的主标题与副标题

									bar = Bar("柱状图", "每个博客阅读数量")

									#添加柱状图的数据及配置项，先行后列

									bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])

									#生成本地文件（默认为.html文件）

									bar.render()