文章摘要: 首先要使用開發者工具找到全部商品分類所在的層級,接下來寫程式碼來讀取該層級下的文字和超鏈接。先看原始碼;圖上還顯示了使用了京東自己的框架Nerv框架,相關內容及生態你可以通過官網瞭解更多。
python讀取京東首頁的全部商品分類,首先要使用開發者工具找到全部商品分類所在的層級,
接下來寫程式碼來讀取該層級下的文字和超鏈接。
data:image/s3,"s3://crabby-images/96fb6/96fb695bb6ff0dcce066d6f101b6cfac66620572" alt=""
圖上還顯示了使用了京東自己的框架Nerv框架,相關內容及生態你可以通過官網瞭解更多。
https://nerv.aotu.io/
data:image/s3,"s3://crabby-images/2e78f/2e78f5076aa58463f1ed87ba4074ab02d0dea783" alt=""
data:image/s3,"s3://crabby-images/d735f/d735f2e225e0eba3d6770c3890ef03efdb2de9de" alt=""
顯示了所有商品分類。
from __future__ import print_function
import requests
import sys
#reload(sys)
#sys.setdefaultencoding(“utf-8”)
import importlib
importlib.reload(sys)
from lxml import etree;
#列印京東商品分類
resp =requests.get(‘https://www.jd.com’)
doc_main=etree.HTML(resp.content.decode(“utf-8”))
for x in doc_main.xpath(“//body/div/div/div/div/div/ul/li”):
print(*x.xpath(“a/text()”)+x.xpath(“a/@href”))