Python爬虫笔记


BeautifulSoup

from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text, 'lxml')

根据class查找

r=soup.find_all(class_="list-inline-item")

xpath

from lxml import etree
html = etree.HTML(r.text)
print(html.xpath('/html/body/div/div[3]/div[1])')

取值

取属性值

选value的值 使用/@value

取字符串

/text()


文章作者: 巡璃
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 巡璃 !
评论
  目录