火車頭采集器電腦版免費(fèi)下載 最新更新|軟件分類|軟件專題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置: 首頁(yè)網(wǎng)絡(luò)軟件網(wǎng)絡(luò)輔助 → 火車頭采集器免費(fèi)版 v10.2 官方正式版

火車頭采集器免費(fèi)版

v10.2 官方正式版

火車頭采集器免費(fèi)版下載
  • 軟件大小:47.51 MB
  • 軟件語(yǔ)言:中文
  • 軟件類型:國(guó)產(chǎn)軟件 / 網(wǎng)絡(luò)輔助
  • 軟件授權(quán): 免費(fèi)軟件
  • 更新時(shí)間:2022-11-01 18:09:23
  • 軟件等級(jí):4星
  • 軟件廠商: -
  • 應(yīng)用平臺(tái):WinAll, WinXP
  • 軟件官網(wǎng):

ITMOP本地下載文件大?。?7.51 MB

點(diǎn)贊 好評(píng) 0%(0) 差評(píng) 差評(píng) 0%(0)

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評(píng)論下載地址

小編為您推薦: 火車頭采集器 數(shù)據(jù)采集

火車頭采集器免費(fèi)版是一款功能強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)信息挖掘工具,具有批量采集網(wǎng)頁(yè)、論壇內(nèi)容等功能,你可以使用它采集各大主流網(wǎng)站文章系統(tǒng),論壇系統(tǒng)等,速度高速下載穩(wěn)定,需要的朋友快來(lái)IT貓撲下載吧!

軟件功能

支持最新的Win10系統(tǒng)中運(yùn)行。

支持SSH(Sftp文件)上傳。

任務(wù)運(yùn)行合并到統(tǒng)一界面,添加“實(shí)時(shí)數(shù)據(jù)”查看和“任務(wù)詳情”統(tǒng)計(jì)。

列表頁(yè),分頁(yè),多頁(yè)自定義任意Header請(qǐng)求頭等功能。

批量修改任務(wù)規(guī)則細(xì)節(jié)參數(shù),批量修改Web發(fā)布配置。

起始網(wǎng)址批量網(wǎng)址的地址格式可添加多個(gè)地址參數(shù),支持自定義列表參數(shù)。

標(biāo)簽數(shù)據(jù)來(lái)源更細(xì)致化,可設(shè)置從默認(rèn)頁(yè),分頁(yè),多頁(yè)的源碼,URL地址及返回頭信息中提取。

標(biāo)簽數(shù)據(jù)處理新增統(tǒng)計(jì)標(biāo)簽字符串長(zhǎng)度、批量替換功能。

火車頭采集器

火車頭采集器免費(fèi)版特色

1、擴(kuò)展性強(qiáng)、適用范圍廣

自定義web發(fā)布,自定義主流的數(shù)據(jù)庫(kù)的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都能為你所用。

2、穩(wěn)定、高效

七年磨一劍,軟件不斷更新進(jìn)步,采集速度快,性能穩(wěn)定,占用資源少。

3、通用性強(qiáng)

無(wú)論新聞、論壇、視頻、黃頁(yè)、圖片、下載類網(wǎng)站,只要通過(guò)瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過(guò)指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。

火車頭采集器采集文章使用教程實(shí)例

任務(wù):

采集某一個(gè)指定頁(yè)面的文章包括(標(biāo)題、圖片、描述、內(nèi)容)導(dǎo)入到自己網(wǎng)站數(shù)據(jù)庫(kù)對(duì)應(yīng)欄目(欄目id為57),數(shù)據(jù)庫(kù)字段分別(title,thumb,descrption,content)。

頁(yè)面里面第一張圖作為文章縮略圖,這邊一個(gè)獲取縮略圖名稱并添加上對(duì)應(yīng)網(wǎng)站路徑放入數(shù)據(jù)庫(kù)thumb字段,另一個(gè)是下載下本地,統(tǒng)一上傳到指定文件夾,(當(dāng)然看軟件可以直接ftp,目前還沒弄,后期弄了會(huì)補(bǔ)充)

1、新建分組--新建任務(wù)

火車頭采集器免費(fèi)版

?

2、添加網(wǎng)址+ 編輯獲取網(wǎng)址的規(guī)則

火車頭采集器免費(fèi)版

選擇范圍在 ul 里面的 li 里面的鏈接,注意排除重復(fù)地址,可以點(diǎn)擊下面測(cè)試網(wǎng)址采集獲取。

火車頭采集器免費(fèi)版

可以看到有采集到的文章鏈接了。

火車頭采集器免費(fèi)版

?

3、采集內(nèi)容規(guī)則

我這邊需要采集下面圖上展示數(shù)據(jù)(catid是欄目id,可以將采集到的數(shù)據(jù)放入對(duì)應(yīng)欄目,設(shè)置固定值就好)

火車頭采集器免費(fèi)版

著重說(shuō)下內(nèi)容和圖片的采集,標(biāo)題和描述同理內(nèi)容采集

火車頭采集器電腦版

?內(nèi)容采集:

打開一個(gè)采集的文章頁(yè)面,查看源代碼(禁了右鍵的f11 或者在網(wǎng)址前面加上 view-source:?一樣可以查看):

選中文章開頭一個(gè)位置,截取一段在ctrl+f 搜下是否唯一一段,若是就可以放在位置下圖1處,結(jié)尾同開頭一樣。

我截取內(nèi)容不想里面還帶有鏈接圖片可以數(shù)據(jù)處理,添加--html標(biāo)簽排除--選好確定--確定

?火車頭采集器電腦版

還有需要下載頁(yè)面圖片,勾選和填寫下面選項(xiàng)

火車頭采集器電腦版

?

圖片采集:

(1)選中范圍和內(nèi)容一樣(文章內(nèi)圖片)

(2)數(shù)據(jù)處理選 提取第一張圖片 ?內(nèi)容是:http://www.xxx.com/2017/33/aa.jpg

(3)只要aa.jpg,正則過(guò)濾,獲取內(nèi)容:aa.jpg  

火車頭采集器電腦版

(4)數(shù)據(jù)庫(kù)存儲(chǔ)有前綴,添加上, upload/xxxxx/

火車頭采集器電腦版

找一個(gè)頁(yè)面測(cè)試一下,可以看到對(duì)應(yīng)項(xiàng)目都獲取到了。

?

4、發(fā)布內(nèi)容設(shè)置,這里以方式三發(fā)布到數(shù)據(jù)庫(kù)為例子,編輯后回到這邊勾選剛定義的模塊就好:

火車頭采集器電腦版

火車頭采集器電腦版

?

?5、我需要保存圖片到本地,要設(shè)置下保存文件的路徑(ftp后續(xù)會(huì)試著使用)。

火車頭采集器電腦版

?

6、保存,查看剛新建的任務(wù),右鍵 開始任務(wù)運(yùn)行,這邊就可以看到文字和圖片都下載下來(lái)了,數(shù)據(jù)庫(kù)里面也可以看到了。

火車頭采集器電腦版

更新日志

火車采集器V10.2版

1.新增:User-Agent支持從文本讀取并隨機(jī)切換。教程:http://faq.locoy.com/q-1348.html。

2.新增:自動(dòng)識(shí)別手機(jī)號(hào)功能支持14、15、16、17、19開頭的新號(hào)段。

3.優(yōu)化:文件下載完畢插件接口優(yōu)化。

4.優(yōu)化:探測(cè)文件下載時(shí)正式下載文件,提升下載速度。

5.修復(fù):http請(qǐng)求頭“Header或設(shè)置名”以數(shù)字開頭的名稱報(bào)錯(cuò)的問(wèn)題修復(fù)。

6.修復(fù):發(fā)布到word文檔,如果數(shù)據(jù)包含特殊字符或本地圖片異常會(huì)導(dǎo)致發(fā)布失敗問(wèn)題修復(fù)。

7.修復(fù):拷貝任務(wù)時(shí),任務(wù)備注未拷貝問(wèn)題修復(fù)。

8.修復(fù):標(biāo)簽引用支持調(diào)用“列表頁(yè)”標(biāo)簽。

9.修復(fù):json提取時(shí)如果json對(duì)象的“鍵”是整型導(dǎo)致提取有誤。

10.優(yōu)化:網(wǎng)址解析替換html問(wèn)題。

11.修復(fù):get、post分頁(yè)問(wèn)題處理。

12.修復(fù):生成固定格式的數(shù)據(jù)中“系統(tǒng)時(shí)間”選中“06-16”生成時(shí)間格式“yyyy-MM”

13.新增:數(shù)據(jù)庫(kù)發(fā)布模塊支持replace into語(yǔ)句。

火車采集器V9.10版

1.二級(jí)代理重大修改并增加了商業(yè)代理支持

2.post獲取網(wǎng)址POST頁(yè)碼增加遞增數(shù)值

3.修復(fù)php和python插件不支持cookie的問(wèn)題

4.當(dāng)成功失敗標(biāo)識(shí)都為空時(shí)認(rèn)為是發(fā)布成功

5.調(diào)整發(fā)布和入庫(kù)模塊界面大小和操作bug

6.修復(fù)web發(fā)布不登錄時(shí)不發(fā)UA的問(wèn)題

7.修復(fù)web發(fā)布測(cè)試時(shí)超時(shí)不起效的問(wèn)題

8.修復(fù)Web發(fā)布時(shí)特殊情況下死循環(huán)問(wèn)題

更多>> 軟件截圖

推薦應(yīng)用

其他版本下載

    精品推薦 采集器

    采集器
    更多 (53個(gè)) >> 采集器 采集器一般指是采集網(wǎng)頁(yè)數(shù)據(jù)的智能軟件,數(shù)據(jù)采集系統(tǒng)以完全自主研發(fā)的分布式云計(jì)算平臺(tái)為核心,可以在很短的時(shí)間內(nèi),輕松從各種不同的網(wǎng)站或者網(wǎng)頁(yè)獲取大量的規(guī)范化數(shù)據(jù),幫助任何需要從網(wǎng)頁(yè)獲取信息的客戶實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集,編輯,規(guī)范化,擺脫對(duì)人工搜索及收集數(shù)據(jù)的依賴,降低獲取信息的成本,提

    相關(guān)文章

      下載地址

      • 火車頭采集器免費(fèi)版 v10.2 官方正式版

      查看所有評(píng)論>> 網(wǎng)友評(píng)論

      發(fā)表評(píng)論

      (您的評(píng)論需要經(jīng)過(guò)審核才能顯示) 網(wǎng)友粉絲QQ群號(hào):374962675

      查看所有 0條 評(píng)論>>

      更多>> 猜你喜歡