前言:有时候无聊看一些搞笑的段子,糗事百科还是个不错的网站,所以就想用Python来玩一下。也比较简单,就写出来分享一下。嘿嘿 环境:Python 2.7 + win7 现在开始,打开糗事百科网站,先来分析。
一般像这种都是文本的话,查看源代码就可以看到内容了。
已经可以看到都是在一个class 为content 的div里面,这样就很简单了,直接上正则表达式来匹配就好了。 (.*?) 这样等会再代码里面就可以提取出来段子内容了,再来看一下分页。
分页也很简单,很有规律,直接接上页数就行了。 OK 既然 都分析完了 那就直接上代码。 #-*- coding: UTF-8 -*- # author : Corleone
(责任编辑:每日一笑) |