97人妻人人做人碰人人爽台湾_无码精品久久久久久98久久_品人妻无码区二区三区_51午夜精品免费视频

每周一數(shù)丨數(shù)據(jù)+采集規(guī)則,免費送!

2019-10-31 13:43:41 瀏覽:5262
采集網(wǎng)址:

http://www.bio-equip.com/Suppliers.asp?=&page=1

QQ截圖20191031133635.png


采集目標:


廠商名稱,地區(qū),電話,網(wǎng)站,瀏覽數(shù)


使用工具:
1. 火車采集器
2. Fidder抓包軟件
采集成果:

QQ截圖20191031133709.png



那么我們接下來看如何用火車采集器來獲取法律法規(guī)數(shù)據(jù)。
第一步:打開火車官網(wǎng) m.zxsww.com 下載最新版火車采集器并安裝
第二步:


在桌面瀏覽器中打開列表頁網(wǎng)址:

http://www.bio-equip.com/Suppliers.asp?=&page=1 

 

點擊下一頁,可以看到網(wǎng)址中有頁數(shù)變化:

http://www.bio-equip.com/Suppliers.asp?=&page=2

 

同時可以觀察到需要采集的字段都在列表頁頁面上顯示



QQ截圖20191031133836.png

第三步:


那么在采集器中起始網(wǎng)址可以使用批量網(wǎng)址的操作


QQ截圖20191031133906.png




打開列表頁網(wǎng)址源碼,在源碼中獲取提取內(nèi)容頁網(wǎng)址的字符串:

QQ截圖20191031133934.png



同時可以看到需要采集的字段在列表頁源碼中也存在(且列表頁源碼中可以看到td位置對應(yīng)需要采集字段的值),那么就可以直接在列表頁中采集

QQ截圖20191031134006.png

把所有需要的數(shù)據(jù)用組合標簽在列表頁中獲取下來,然后在內(nèi)容頁采集規(guī)則中細分多個標簽中去。


第四步:


把組合標簽處理下,讓組合標簽中的數(shù)據(jù)只有<td>數(shù)據(jù)</td>,方便細分標簽的提取。

QQ截圖20191031134044.png


然后細分標簽中使用組合標簽,按照td的數(shù)量進行提?。罕热鐝S商名稱(是第一個td中的值)

QQ截圖20191031134115.png



第五步:


比如電話標簽(是第三個td中的值)

QQ截圖20191031134141.png




每周一數(shù)數(shù)據(jù)以及采集規(guī)則領(lǐng)取時間為2019/10/30日發(fā)文后5個工作日內(nèi)。采集規(guī)則涉及到商業(yè)版本功能,建議用戶登錄商業(yè)版本使用此規(guī)則。


數(shù)據(jù)領(lǐng)取資格:火車采集器/火車瀏覽器/觸控精靈商業(yè)版軟件用戶(服務(wù)年限內(nèi)),如果您不是商業(yè)用戶或者已經(jīng)過了服務(wù)年限,但也想?yún)⑴c活動的話,可以新購軟件或者升級續(xù)費,這樣就能參與活動啦!通知一下哦,雙11火車活動優(yōu)惠折扣很大呢!活動將于11月1日開始,詳情登陸官網(wǎng):m.zxsww.com 查看。


數(shù)據(jù)領(lǐng)取方式

第一步:掃碼添加火車運營微信號,火車運營助手會拉你進入活動群。

微信圖片_20191024173419.jpg


第二步:進群后添加數(shù)據(jù)咨詢客服.雅的微信號,經(jīng)客服驗證為服務(wù)年限內(nèi)商業(yè)用戶身份后,即可領(lǐng)取


好啦,本期的“每周一數(shù)”就到這里了。如果您還有想要獲取更多的數(shù)據(jù)資源以及采集器規(guī)則的話,可以在文章下方或是公眾號后臺留言,小采會綜合大家的意見選擇下一期贈送數(shù)據(jù)的主題哦!

掃碼關(guān)注微信