>

您当前的位置:主页 > 谁有bet365网址 >

分析爬行动物的三种方法

发布时间:2019-09-03 08:30编辑:365bet足球开户阅读(

    XPath的
    分析原则
    1
    创建etree对象的实例并将其源加载到对象中。
    2
    使用xpath表达式和xpath方法的组合来标记位置和数据提取
    物业方向:
    #Class属性值找到了歌曲的div标签
    // div[@ class =“song”]
    索引的分层定位
    #在类属性值为tang的部分之后立即在子标签下面的第二个子标签li下方找到子标签。
    // div[@ class =“tang”]/ ul / li[2]/ a
    逻辑运算:
    找到#href属性值为空且类属性值为du的标记
    // a[@href =“”和@ class =“du”]
    模糊配对:
    // div[contains(@class,“ng”)]
    // div[begin-with(@class,“ta”)]
    拿文字:
    #/意味着获取标签下的文本内容
    #//表示获取一个标签下的文本内容和所有二级标签下的文本内容。
    // div[@ class =“song”]/ p[1]/ text()
    // div[@ class =“tang”]// text()
    采取属性:
    // div[@ class =“tang”]// li[2]/ a / @ href
    该代码使用xpath表达式进行数据分析。
    1
    下载:pipinstalllxml
    2
    指南包:fromlxmlimportetree