1234笑话大全

当前位置: 1234笑话大全 > 糗事大全 >

python爬取糗事百科gui小程序

时间:2020-06-15 16:50来源:网络整理 作者:每日一笑 点击:
hao123新闻频道,聚合全网最新的新闻,最热点的新闻,实时新闻热搜词,热门新闻报刊;更有军事新闻,娱乐新闻,体育新闻,图片新闻,汽车新闻,女性新闻,财经新

 

前言:有时候无聊看一些搞笑的段子,糗事百科还是个不错的网站,所以就想用Python来玩一下。也比较简单,就写出来分享一下。嘿嘿

环境:Python 2.7 + win7

现在开始,打开糗事百科网站,先来分析。

 

python爬取糗事百科gui小程序

 

一般像这种都是文本的话,查看源代码就可以看到内容了。

 

python爬取糗事百科gui小程序

 

 

python爬取糗事百科gui小程序

 

已经可以看到都是在一个class 为content 的div里面,这样就很简单了,直接上正则表达式来匹配就好了。

(.*?)

这样等会再代码里面就可以提取出来段子内容了,再来看一下分页。

 

python爬取糗事百科gui小程序

 

分页也很简单,很有规律,直接接上页数就行了。

OK 既然 都分析完了 那就直接上代码。

#-*- coding: UTF-8 -*-

# author : Corleone

 


(责任编辑:每日一笑)

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
推荐内容