八爪魚如何采集亞馬遜商品

  

八爪魚是常用的采集軟件之一,做亞馬遜時(shí)也是會(huì)經(jīng)常用到的,今天一米軟件就來(lái)教教大家八爪魚如何采集亞馬遜商品。


步驟1:創(chuàng)建采集任務(wù)


1)進(jìn)入主界面,選擇“自定義采集”


八爪魚如何采集亞馬遜商品


2)將要采集的網(wǎng)站URL復(fù)制粘貼到輸入框中,點(diǎn)擊“保存網(wǎng)址”


八爪魚如何采集亞馬遜商品


步驟2:創(chuàng)建翻頁(yè)循環(huán)


1)將頁(yè)面下拉到底部,點(diǎn)擊“1-20“,然后在右側(cè)的提示框中選擇“選中全部”


八爪魚如何采集亞馬遜商品


2)然后在右側(cè)的操作提示框中,選擇“循環(huán)點(diǎn)擊每個(gè)鏈接”


八爪魚如何采集亞馬遜商品


步驟3:提取商品信息


1)移動(dòng)鼠標(biāo),選中頁(yè)面里的第一條商品內(nèi)容,選中后,評(píng)價(jià)框會(huì)變成綠色,其中的字段會(huì)變?yōu)榧t色底色。選擇右側(cè)操作提示框中的“選中子元素”


八爪魚如何采集亞馬遜商品


2)之后接著選擇“選中全部”


八爪魚如何采集亞馬遜商品


步驟4:Ajax點(diǎn)擊


1)因?yàn)樵摼W(wǎng)使用了Ajax技術(shù)腳本,所以我們?cè)凇包c(diǎn)擊元素”時(shí)候,可以設(shè)置AJax點(diǎn)擊加載,如下圖,鼠標(biāo)先點(diǎn)擊左邊流程規(guī)則中的“點(diǎn)擊元素”,然后打開高級(jí)選項(xiàng)進(jìn)行設(shè)置,在AJax加載一項(xiàng)中勾選AJax加載數(shù)據(jù),超時(shí)2秒,


八爪魚如何采集亞馬遜商品


注:AJAX即延時(shí)加載、異步更新的一種腳本技術(shù),通過(guò)在后臺(tái)與服務(wù)器進(jìn)行少量數(shù)據(jù)交換,可以在不重新加載整個(gè)網(wǎng)頁(yè)的情況下,對(duì)網(wǎng)頁(yè)的某部分進(jìn)行更新。


表現(xiàn)特征:1、點(diǎn)擊網(wǎng)頁(yè)中某個(gè)選項(xiàng)時(shí),大部分網(wǎng)站的網(wǎng)址不會(huì)改變;2網(wǎng)頁(yè)不是完全加載,只是局部進(jìn)行了數(shù)據(jù)加載,有所變化


如何驗(yàn)證:點(diǎn)擊操作后,在瀏覽器中,網(wǎng)址輸入欄不會(huì)出現(xiàn)加載中的狀態(tài)或者轉(zhuǎn)圈狀態(tài)。


步驟5:修改Xpath


點(diǎn)擊左上角的“保存并啟動(dòng)”,選擇“啟動(dòng)本地采集”。采集過(guò)程中我們發(fā)現(xiàn),采集的數(shù)據(jù)出現(xiàn)大量重復(fù)。手動(dòng)運(yùn)行檢查整個(gè)采集流程,我們發(fā)現(xiàn)在翻頁(yè)循環(huán)的時(shí)候,數(shù)據(jù)并沒有定位到下一頁(yè)。所以需要修改Xpath


1)選擇第一個(gè)“循環(huán)”步驟,打開高級(jí)選項(xiàng),查看固定元素列表文本,可以看到第一條和后面的格式不一樣,所以參照后面的對(duì)第一條的格式進(jìn)行修改


八爪魚如何采集亞馬遜商品


2)修改以后,文本列表如下圖


八爪魚如何采集亞馬遜商品


3)然后選擇“保存并啟動(dòng)”,啟動(dòng)本地采集,再次采集數(shù)據(jù)


八爪魚如何采集亞馬遜商品


步驟5:數(shù)據(jù)采集及導(dǎo)出


1)采集完成后,會(huì)跳出提示,選擇“導(dǎo)出數(shù)據(jù)”選擇“合適的導(dǎo)出方式”,將采集好的數(shù)據(jù)導(dǎo)出


八爪魚如何采集亞馬遜商品


2)這里我們選擇excel作為導(dǎo)出為格式


八爪魚如何采集亞馬遜商品


導(dǎo)出后的數(shù)據(jù)如下圖


八爪魚如何采集亞馬遜商品


如果想要更方便、更快捷的采集亞馬遜商品信息可以使用一米亞馬遜采集軟件來(lái)幫助自己,簡(jiǎn)單設(shè)置之后即可一鍵采集。

相關(guān)資訊

推薦軟件