问BeautifulSoup获得标签描述信息python源码怎么写
<dd
isStop = "1" class='isStop'
matchcode="201409066001"
matchnumcn ="周六001"
starttime = "1409994000000"
endtime ="1409993820000"
isattention = "0"
hostname="北九州" guestname="福冈黄蜂"
leagueid = "533"
hostteamid = "46148"
visitteamid = "12193"
matchid="1000817"
leagueName="J2联赛"
class="league_533"
style="display: none;"
ishot="0"
>
pass</dd>
比如我想获取的是:
style="display: none;"
这个字段的none~如何获取呢?
上代码:
#! /usr/bin/env python
# -*- coding: utf-8 -*-
tag_content = """
<dd
isStop = "1" class='isStop'
matchcode="201409066001"
matchnumcn ="周六001"
starttime = "1409994000000"
endtime ="1409993820000"
isattention = "0"
hostname="北九州" guestname="福冈黄蜂"
leagueid = "533"
hostteamid = "46148"
visitteamid = "12193"
matchid="1000817"
leagueName="J2联赛"
class="league_533"
style="display: none;"
ishot="0">
pass</dd>
"""
from bs4 import BeautifulSoup
tag_soup = BeautifulSoup(tag_content)
style_str = tag_soup.dd["style"]
print style_str.split(":")[1].lstrip()[:-1]
Beautiful Soup不能直接获得“none”,不过我们能容易地得到display: none;
,然后用python很容易处理了。
用tag attrs["style"] 然后正则
1.如果python的cgi中能有专门获取html中style或者属性的方法最好,这style 既没有id name 也不是value。不知道能不能get出来
2,我的超级笨办法我的思路:把这一大块用'''包裹,之后,另开一个py文件,用open打开刚才的要检索的大块,用readlins()去读取那大块中的每一行,用正则匹配出 style=“dispaly:”,之后再用str的切片 切出来。
s = """ <dd
isStop = "1" class='isStop'
matchcode="201409066001"
matchnumcn ="周六001"
starttime = "1409994000000"
endtime ="1409993820000"
isattention = "0"
hostname="北九州" guestname="福冈黄蜂"
leagueid = "533"
hostteamid = "46148"
visitteamid = "12193"
matchid="1000817"
leagueName="J2联赛"
class="league_533"
style="display: none;"
ishot="0"
>
pass</dd>"""
from pyquery import PyQuery
p = PyQuery(s)
a=p("dd")
print a.attr('style')
print a.attr('hostname')
display: none;
北九州
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19443.html
相关文章 Recommend
- • Python操作Redis数据库方面的问题
- • python re模块中的 match()和group()疑问
- • 豆瓣API 40次/分钟的访问限制怎么办
- • apache运行webpy项目遇到换行符无故增加的恼人问题
- • 大家一起来讨论抽用正则取优酷视频并生成播放
- • 又是python乱码问题,excel类型文件单元格内数据有
- • 想转业学python,请问应该如何规划自己的学习计划
- • 问浏览器地址栏如何执行虚拟主机脚本关于环境
- • python异常的问题有代码求指教,关于raise语句
- • 请教python返回值变量对象的问题,有源码
- • 环境部署问题,python web应用可以在代码中判断de
- • python rss框架内部做添加数据操作遇到的问题
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:
必知PYTHON教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
必知PYTHON模块 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • Python程序员解决棘手问题的常用库
- • 求助关于restfull api接口几个问题
- • qiniu pythonsdk提示ImportError错误求解
- • 问一个关于Hadoop Python中读写文件统计分析
- • 求问str()同__str__原理上有什么不同,分别在
- • 大神帮忙看下20行的python代码,文件io和数
- • python 爬虫爬wiki 报错 [Errno 65] No route to
- • python续点上传问题None bad token...
- • python3环境下文本中超链接出错,要如何修
- • Python环境保存操作思路问题求助
图文精华 RECOMMEND
-
Python程序员解决棘手问题的常用库
-
求问str()同__str__原理上有什么不同
-
scrapy框架里面用link extractor怎么能
-
python {}.fromkeys创建字典append添加操
-
python3 类型Type str doesn't support th
-
python里面为什么系统的时区是东八
热点文章 HOT
- 学习Python有什么好的书籍推荐?
- Python匿名函数 Lambda表达式作用
- Python与Java、C、Ruby、PHP等编程语言有什么
- Python 正则中文网页字符串提取问题
- 如何为实时性应用存取经纬度?django my
- 想用python做个客户端,在二维码登录这个地
- 有让IDE可识别Python函数参数类型的方法吗
- Python字符串转换成列表正则疑问