西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 常用软件 软件下载 安卓软件 游戏下载 安卓游戏 MAC应用 驱动下载 安卓电视
系统工具网络工具媒体工具图形图像聊天工具应用软件编程开发手机软件安卓应用电脑安全字体素材

python爬取138看书网小说源码

  • python爬取138看书网小说源码
  • 软件大小:1KB
  • 更新时间:2020-09-21 07:48
  • 软件语言:中文
  • 软件厂商:
  • 软件类别:国产软件 / 免费软件 / 源码相关
  • 软件等级:3级
  • 应用平台:WinXP, Win7, win8
  • 官方网站:暂无
好评:50%
坏评:50%

本类精品

装机必备软件

软件介绍

python爬取138看书网小说源码,来自论坛大神原创制作的一个爬取源码,可以帮您爬取138小说网的小说资源,支持分类搜索查找功能,支持目录爬取,自带书签系统,让您看小说更加轻松。本次带来python爬取138看书网小说源码资源下载,需要看小说的朋友们不妨试试吧!

python爬取138看书网小说源码

python爬取138看书网小说源码作者说明

记录一下今天爬的第二个小说网,第二次弄起来比较熟练了,不像第一次弄一半就得找教程边看边搞。

但实际上爬小说应该是最简单的事情了吧,涉及的技术也没有那么深。

把代码发出来让想刚入门却不知道从何下手的同萌新们看看吧,看教程总是云里雾里的,还是还得上手多练练才能加深印象。

这个小说爬虫还是有点垃圾,多线程没有,而且有些函数也是用的跟*一样,这玩意该怎么改进也没有头绪。

python爬取138看书网小说源码演示一览

import requests

import lxml

import re

headers = {

    'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'

}

print ('本脚本仅适用于138看书网:https://www.13800100.com/')

#url_list = 'https://www.13800100.com/list/72262/'

url_list = (input('粘贴小说目录url,必须是小说目录,小说首页不支持\n'))

downurl = 'https://www.13800100.com/article/'

url_list = requests.get(url_list)

text_list = url_list.text

#爬小说书名

text_title = re.findall(r'<div class="cate-tit">(.*?)</h2>',text_list,re.S)[0]

text_title = text_title.replace('\r\n','')

text_title = text_title.replace('<h2>','')

text_title = text_title.replace(' ','')

#爬小说目录列表

text_list_info = re.findall(r'<div class="bd">.*?</div>',text_list,re.S)[0]

text_list_info = re.findall(r'<a href="/article/(.*?)" class="name">(.*?)</a>',text_list)

for i in text_list_info:

#每章小说的url和每章章名

    list = i[0]

    name = i[1]

    download = downurl + list

    download_info = requests.get(url = download,headers=headers)

    html=download_info.text

    html_info = re.findall(r'<div class=".*?">(.*?)</div>',html,re.S)[0]

    html_info = html_info.replace ('                          ','')

    html_info = html_info.replace ('<br/>',('\n'))

    html_info = html_info.replace ('  ','')

    print (name)

#输出为记事本

    with open ('%s.txt' % text_title,'a+',encoding = 'utf-8')as f:

        f.write('                                                '+ name + '\n')

        f.write('\n')

        f.write(html_info + '\n')

        f.write('\n')

print ('下载完成')

软件标签: python 小说 源码

脚本要求输入的url必须是小说的目录,而不是小说的首页

软件截图

python爬取138看书网小说源码
    Python经典案例
    (6)Python经典案例关键词
    Python经典案例是一套非常简单好用的Python计算机编程语言实战基础,它针对那些学弱们进行强化训练,让渣渣们可以通过手把手的代码敲打来进行快速入门巩固,欢迎有需要的同学下载使用。关于Python:1、主要是开发快,更多>>

    其他版本下载

    热门评论

    最新评论

    发表评论 查看所有评论(0)

    昵称:
    表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
    字数: 0/500 (您的评论需要经过审核才能显示)

    下载帮助下载帮助西西破解版软件均来自互联网, 如有侵犯您的版权, 请与我们联系。

    TOP
    软件下载