西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 安卓软件 安卓游戏 电脑软件 软件教程 专题合集

Beautiful Soup

v4.3.2 官方最新版
  • Beautiful Soupv4.3.2 官方最新版
  • 软件类型:国产软件 / 免费软件
  • 软件大小:151KB
  • 更新时间:2015-01-27 11:41
  • 应用平台:WinAll, Win7
  • 软件语言:中文
  • 软件等级:4级
  • 官方网站:http://www.crummy.com/software/Beautiful
5.0
0
好用
0
难用

本类精品

  • 软件简介
  • 软件截图
  • 软件评论
  • 软件推荐

Beautiful Soup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。

Beautiful Soup介绍:

1.Beautiful Soup提供了一些简单的方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。
2.Beautiful Soup自动将输入文档转换为Unicode编码,并将输出文档转化为UTF-8编码。你不需要考虑编码,除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到,这时你需要指出原来的编码方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上层,这允许你使用不同的解析策略或者牺牲速度来换取灵活性。

如何遍历树?

使用find_all 函数

find_all(name, attrs, recursive, text, limit, **kwargs)

举例说明:

print soup.find_all('title')
print soup.find_all('p','title')
print soup.find_all('a')
print soup.find_all(id="link2")
print soup.find_all(id=True)

返回值为:

[<title>The Dormouse's story</title>]
[<p class="title"><b>The Dormouse's story</b></p>]
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
[<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

使用方法:

1.下载完成之后需要解压缩,假设放到D:/python下。
2.运行cmd,切换到D:/python/beautifulsoup4-4.3.2/目录下(根据自己解压缩后的目录和下载的版本号修改),cd /d D:/python//beautifulsoup4-4.3.2
3.运行命令:
setup.py build
setup.py install
4.在IDE下from bs4 import BeautifulSoup,没有报错说明安装成功。

软件标签: 网页解析

软件截图

Beautiful Soup v4.3.2 官方最新版

其他版本下载

发表评论

昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲