火車頭采集器免費(fèi)版
v10.2 官方正式版- 軟件大小:47.51 MB
- 軟件語(yǔ)言:中文
- 軟件類型:國(guó)產(chǎn)軟件 / 網(wǎng)絡(luò)輔助
- 軟件授權(quán): 免費(fèi)軟件
- 更新時(shí)間:2022-11-01 18:09:23
- 軟件等級(jí):
- 軟件廠商: -
- 應(yīng)用平臺(tái):WinAll, WinXP
- 軟件官網(wǎng): http://www.locoy.com/download
相關(guān)軟件
CreAiTv1.5.5安卓版
46.04 MB/中文/10.0
外業(yè)采集軟件v1.01.3安卓版
131.90 MB/中文/10.0
數(shù)道云調(diào)研系統(tǒng)v5.2.7.3 安卓版
23.57 MB/中文/5.0
標(biāo)貝易采app手機(jī)版v1.3.9.3 安卓版
19.77 MB/中文/10.0
DocShotLite官方版v3.15.1 安卓版
123.20 MB/中文/10.0
軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評(píng)論下載地址
火車頭采集器免費(fèi)版是一款功能強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)信息挖掘工具,具有批量采集網(wǎng)頁(yè)、論壇內(nèi)容等功能,你可以使用它采集各大主流網(wǎng)站文章系統(tǒng),論壇系統(tǒng)等,速度高速下載穩(wěn)定,需要的朋友快來(lái)IT貓撲下載吧!
軟件功能
支持最新的Win10系統(tǒng)中運(yùn)行。
支持SSH(Sftp文件)上傳。
任務(wù)運(yùn)行合并到統(tǒng)一界面,添加“實(shí)時(shí)數(shù)據(jù)”查看和“任務(wù)詳情”統(tǒng)計(jì)。
列表頁(yè),分頁(yè),多頁(yè)自定義任意Header請(qǐng)求頭等功能。
批量修改任務(wù)規(guī)則細(xì)節(jié)參數(shù),批量修改Web發(fā)布配置。
起始網(wǎng)址批量網(wǎng)址的地址格式可添加多個(gè)地址參數(shù),支持自定義列表參數(shù)。
標(biāo)簽數(shù)據(jù)來(lái)源更細(xì)致化,可設(shè)置從默認(rèn)頁(yè),分頁(yè),多頁(yè)的源碼,URL地址及返回頭信息中提取。
標(biāo)簽數(shù)據(jù)處理新增統(tǒng)計(jì)標(biāo)簽字符串長(zhǎng)度、批量替換功能。
火車頭采集器免費(fèi)版特色
1、擴(kuò)展性強(qiáng)、適用范圍廣
自定義web發(fā)布,自定義主流的數(shù)據(jù)庫(kù)的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都能為你所用。
2、穩(wěn)定、高效
七年磨一劍,軟件不斷更新進(jìn)步,采集速度快,性能穩(wěn)定,占用資源少。
3、通用性強(qiáng)
無(wú)論新聞、論壇、視頻、黃頁(yè)、圖片、下載類網(wǎng)站,只要通過(guò)瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過(guò)指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。
火車頭采集器采集文章使用教程實(shí)例
任務(wù):
采集某一個(gè)指定頁(yè)面的文章包括(標(biāo)題、圖片、描述、內(nèi)容)導(dǎo)入到自己網(wǎng)站數(shù)據(jù)庫(kù)對(duì)應(yīng)欄目(欄目id為57),數(shù)據(jù)庫(kù)字段分別(title,thumb,descrption,content)。
頁(yè)面里面第一張圖作為文章縮略圖,這邊一個(gè)獲取縮略圖名稱并添加上對(duì)應(yīng)網(wǎng)站路徑放入數(shù)據(jù)庫(kù)thumb字段,另一個(gè)是下載下本地,統(tǒng)一上傳到指定文件夾,(當(dāng)然看軟件可以直接ftp,目前還沒弄,后期弄了會(huì)補(bǔ)充)
1、新建分組--新建任務(wù)
?
2、添加網(wǎng)址+ 編輯獲取網(wǎng)址的規(guī)則
選擇范圍在 ul 里面的 li 里面的鏈接,注意排除重復(fù)地址,可以點(diǎn)擊下面測(cè)試網(wǎng)址采集獲取。
可以看到有采集到的文章鏈接了。
?
3、采集內(nèi)容規(guī)則
我這邊需要采集下面圖上展示數(shù)據(jù)(catid是欄目id,可以將采集到的數(shù)據(jù)放入對(duì)應(yīng)欄目,設(shè)置固定值就好)
著重說(shuō)下內(nèi)容和圖片的采集,標(biāo)題和描述同理內(nèi)容采集
?內(nèi)容采集:
打開一個(gè)采集的文章頁(yè)面,查看源代碼(禁了右鍵的f11 或者在網(wǎng)址前面加上 view-source:?一樣可以查看):
選中文章開頭一個(gè)位置,截取一段在ctrl+f 搜下是否唯一一段,若是就可以放在位置下圖1處,結(jié)尾同開頭一樣。
我截取內(nèi)容不想里面還帶有鏈接圖片可以數(shù)據(jù)處理,添加--html標(biāo)簽排除--選好確定--確定
?
還有需要下載頁(yè)面圖片,勾選和填寫下面選項(xiàng)
?
圖片采集:
(1)選中范圍和內(nèi)容一樣(文章內(nèi)圖片)
(2)數(shù)據(jù)處理選 提取第一張圖片 ?內(nèi)容是:http://www.xxx.com/2017/33/aa.jpg
(3)只要aa.jpg,正則過(guò)濾,獲取內(nèi)容:aa.jpg
(4)數(shù)據(jù)庫(kù)存儲(chǔ)有前綴,添加上, upload/xxxxx/
找一個(gè)頁(yè)面測(cè)試一下,可以看到對(duì)應(yīng)項(xiàng)目都獲取到了。
?
4、發(fā)布內(nèi)容設(shè)置,這里以方式三發(fā)布到數(shù)據(jù)庫(kù)為例子,編輯后回到這邊勾選剛定義的模塊就好:
?
?5、我需要保存圖片到本地,要設(shè)置下保存文件的路徑(ftp后續(xù)會(huì)試著使用)。
?
6、保存,查看剛新建的任務(wù),右鍵 開始任務(wù)運(yùn)行,這邊就可以看到文字和圖片都下載下來(lái)了,數(shù)據(jù)庫(kù)里面也可以看到了。
更新日志
火車采集器V10.2版
1.新增:User-Agent支持從文本讀取并隨機(jī)切換。教程:http://faq.locoy.com/q-1348.html。
2.新增:自動(dòng)識(shí)別手機(jī)號(hào)功能支持14、15、16、17、19開頭的新號(hào)段。
3.優(yōu)化:文件下載完畢插件接口優(yōu)化。
4.優(yōu)化:探測(cè)文件下載時(shí)正式下載文件,提升下載速度。
5.修復(fù):http請(qǐng)求頭“Header或設(shè)置名”以數(shù)字開頭的名稱報(bào)錯(cuò)的問(wèn)題修復(fù)。
6.修復(fù):發(fā)布到word文檔,如果數(shù)據(jù)包含特殊字符或本地圖片異常會(huì)導(dǎo)致發(fā)布失敗問(wèn)題修復(fù)。
7.修復(fù):拷貝任務(wù)時(shí),任務(wù)備注未拷貝問(wèn)題修復(fù)。
8.修復(fù):標(biāo)簽引用支持調(diào)用“列表頁(yè)”標(biāo)簽。
9.修復(fù):json提取時(shí)如果json對(duì)象的“鍵”是整型導(dǎo)致提取有誤。
10.優(yōu)化:網(wǎng)址解析替換html問(wèn)題。
11.修復(fù):get、post分頁(yè)問(wèn)題處理。
12.修復(fù):生成固定格式的數(shù)據(jù)中“系統(tǒng)時(shí)間”選中“06-16”生成時(shí)間格式“yyyy-MM”
13.新增:數(shù)據(jù)庫(kù)發(fā)布模塊支持replace into語(yǔ)句。
火車采集器V9.10版
1.二級(jí)代理重大修改并增加了商業(yè)代理支持
2.post獲取網(wǎng)址POST頁(yè)碼增加遞增數(shù)值
3.修復(fù)php和python插件不支持cookie的問(wèn)題
4.當(dāng)成功失敗標(biāo)識(shí)都為空時(shí)認(rèn)為是發(fā)布成功
5.調(diào)整發(fā)布和入庫(kù)模塊界面大小和操作bug
6.修復(fù)web發(fā)布不登錄時(shí)不發(fā)UA的問(wèn)題
7.修復(fù)web發(fā)布測(cè)試時(shí)超時(shí)不起效的問(wèn)題
8.修復(fù)Web發(fā)布時(shí)特殊情況下死循環(huán)問(wèn)題
更多>> 軟件截圖
推薦應(yīng)用
純真ip數(shù)據(jù)庫(kù) 4.64 MB
下載/中文/5.0 v2022.04.20 中文最新版百度網(wǎng)盤極速上傳控件 440.00 KB
下載/中文/8.0 v2.0.0.3 正式版Proxifier(socks5客戶端) 3.47 MB
下載/中文/5.0 v3.42 漢化優(yōu)化安裝版世紀(jì)前線測(cè)速(Avltool網(wǎng)速測(cè)試) 537.00 KB
下載/中文/10.0 v3.00 綠色版逆火網(wǎng)站日志分析器破解版 127.00 MB
下載/中文/0.0 v4.18 企業(yè)版傲杰關(guān)鍵字排名查詢系統(tǒng)百度專版 3.00 MB
下載/中文/0.0 v3.0 官方版P2P后臺(tái)終結(jié)者 4.91 MB
下載/中文/10.0 v2.4 官方簡(jiǎn)體中文版華為stb管理工具密碼 692.00 KB
下載/中文/10.0 v4.03 中文版
其他版本下載
精品推薦 采集器
- 更多 (53個(gè)) >> 采集器 采集器一般指是采集網(wǎng)頁(yè)數(shù)據(jù)的智能軟件,數(shù)據(jù)采集系統(tǒng)以完全自主研發(fā)的分布式云計(jì)算平臺(tái)為核心,可以在很短的時(shí)間內(nèi),輕松從各種不同的網(wǎng)站或者網(wǎng)頁(yè)獲取大量的規(guī)范化數(shù)據(jù),幫助任何需要從網(wǎng)頁(yè)獲取信息的客戶實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集,編輯,規(guī)范化,擺脫對(duì)人工搜索及收集數(shù)據(jù)的依賴,降低獲取信息的成本,提
火車采集器v9破解版 20.48 MB
/中文/0.0淘金閣視頻采集器 294.00 KB
/中文/7.0火車頭采集器免費(fèi)版 47.51 MB
/中文/0.0飛訊QQ采集器 6.38 MB
/中文/10.0京東商品圖片采集器 1.22 MB
/中文/10.0條碼采集器 2.38 MB
/中文/10.0caipda條碼采集器 17.62 MB
/中文/10.0火車頭采集器v8免費(fèi)版 33.13 MB
/中文/2.0
相關(guān)文章
下載地址
火車頭采集器免費(fèi)版 v10.2 官方正式版
查看所有評(píng)論>> 網(wǎng)友評(píng)論
更多>> 猜你喜歡