火車采集器/火車頭采集器v9破解版是一款非常強(qiáng)大的網(wǎng)頁信息采集軟件,通過靈活的配置,我們可以輕松的抓去網(wǎng)頁上的文字、圖片等任何信息資源,是近幾年來十分流行的采集系統(tǒng),為網(wǎng)絡(luò)用戶大批量采集網(wǎng)頁帶來了很大的便利。
火車頭采集器軟件功能:
程序流程支持遠(yuǎn)程管理圖片文件,支持網(wǎng)站登錄后的信息獲得,支持檢測(cè)文檔真正詳細(xì)地址,支持代理,支持防盜鏈的采集,支持采集數(shù)據(jù)信息立即進(jìn)庫和效仿人手工制作公布等很多功能特性。
列車采集器支持從一切種類的網(wǎng)站采集獲得您所必須的信息,如各種各樣新聞報(bào)道類網(wǎng)站、社區(qū)論壇、電商網(wǎng)站、招聘求職網(wǎng)站等。
另外具備強(qiáng)勁的網(wǎng)站登陸采集、多張和分頁查詢的采集、網(wǎng)站跨層采集、POST采集、腳本制作網(wǎng)頁頁面采集、動(dòng)態(tài)性網(wǎng)頁頁面采集等高級(jí)采集功能。
強(qiáng)勁的php和c#軟件支持,讓您能夠 根據(jù)二次開發(fā)完成您所要想的一切更強(qiáng)勁的功能。
火車頭采集器特色:
1、實(shí)用性強(qiáng)
不管新聞報(bào)道、社區(qū)論壇、視頻、企業(yè)黃頁、圖片、下載類網(wǎng)址,要是根據(jù)電腦瀏覽器能見到的結(jié)構(gòu)型的內(nèi)容,根據(jù)特定配對(duì)標(biāo)準(zhǔn),都能采集到您所必須的內(nèi)容。
2、平穩(wěn)、高效率
五年磨一劍,手機(jī)軟件不斷創(chuàng)新發(fā)展,采集速度更快,性能平穩(wěn),占有資源少。
3、可擴(kuò)展性強(qiáng)、應(yīng)用領(lǐng)域廣
自定義web公布,自定義流行的數(shù)據(jù)庫查詢的儲(chǔ)存和公布,自定義當(dāng)?shù)豴hp及.net外界程序編寫插口解決數(shù)據(jù)信息,讓數(shù)據(jù)信息都能給你常用。
火車頭采集器亮點(diǎn):
1、支持所有網(wǎng)站編碼:完美支持采集所有編碼格式的網(wǎng)頁,程序還可以自動(dòng)識(shí)別網(wǎng)頁編碼。
2、多種發(fā)布方式:支持目前所有主流和非主流的CMS,BBS等網(wǎng)站程序,通過系統(tǒng)的發(fā)布模塊能實(shí)現(xiàn)采集器和網(wǎng)站程序間的完美結(jié)合。
3、全自動(dòng):無人值守工作,配置好程序后,程序?qū)⒁罁?jù)您的設(shè)置自動(dòng)運(yùn)行,完全無需人工干預(yù)。
4、本地編輯:本地可視化編輯已采集的數(shù)據(jù)。
5、采集測(cè)試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結(jié)果并測(cè)試發(fā)布。
6、管理方便:使用站點(diǎn)+任務(wù)方式管理采集節(jié)點(diǎn),任務(wù)支持批量操作,再多的數(shù)據(jù)管理也很輕松。
基本功能
1、規(guī)則自定義 - 通過采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類型的信息。
2、多任務(wù),多線程 - 可以同時(shí)進(jìn)行多個(gè)信息獲取任務(wù),每個(gè)任務(wù)可以使用多個(gè)線程。
3、所見即所得 - 任務(wù)采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯(cuò)誤信息等都會(huì)及時(shí)的反映在軟件界面中。
4、數(shù)據(jù)保存 - 數(shù)據(jù)邊采集邊自動(dòng)保存到關(guān)系數(shù)據(jù)庫中,并且數(shù)據(jù)結(jié)構(gòu)能夠自動(dòng)適應(yīng),軟件可以根據(jù)采集規(guī)則自動(dòng)創(chuàng)建數(shù)據(jù)庫,以及其中的表和字段,也可以通過導(dǎo)庫方式靈活的將數(shù)據(jù)保存到客戶已有的數(shù)據(jù)庫結(jié)構(gòu)中。
5、斷點(diǎn)續(xù)采 - 信息收集任務(wù)可以在停止后從斷點(diǎn)開始繼續(xù)采集,從此你用不再擔(dān)心你的采集任務(wù)意外中斷了。
6、網(wǎng)站登錄 - 支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時(shí)需要驗(yàn)證碼的網(wǎng)站也能采集。
7、計(jì)劃任務(wù) - 通過這個(gè)功能可以讓你的采集任務(wù)定時(shí)、定量或者一直循環(huán)執(zhí)行。
8、采集范圍限制 - 可以根據(jù)采集的深度和網(wǎng)址的標(biāo)識(shí)來限制采集的范圍。
9、文件下載 - 可以將采集到的二進(jìn)制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結(jié)果數(shù)據(jù)庫中。
10、結(jié)果替換 - 可以將采集的結(jié)果根據(jù)規(guī)則替換成你定義的內(nèi)容。
11、條件保存 - 可以根據(jù)某個(gè)條件來決定那些信息保存,那些信息過濾。
12、過濾重復(fù)內(nèi)容 - 軟件可根據(jù)用戶設(shè)置和實(shí)際情況對(duì)重復(fù)內(nèi)容和重復(fù)網(wǎng)址自動(dòng)刪除重復(fù)內(nèi)容。
13、特殊鏈接識(shí)別 - 運(yùn)用此功能可以將用JavaScript動(dòng)態(tài)生成的鏈接或其他更古怪的連接識(shí)別出來。
14、數(shù)據(jù)發(fā)布 - 可以通過自定義接口,將已采集的結(jié)果數(shù)據(jù)發(fā)布到任意的內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫中。現(xiàn)在已支持的目標(biāo)發(fā)布媒體包括:數(shù)據(jù)庫(access, sql server,my sql,oracle) ,靜態(tài)htm文件。
15、預(yù)留編程接口 - 定義多個(gè)編程接口,用戶可以在事件中利用PHP,C#語言進(jìn)行編程,擴(kuò)充采集功能。
更新日志:
1: 自動(dòng)獲取cookie功能優(yōu)化
2: 數(shù)據(jù)庫發(fā)布增加事務(wù),優(yōu)化數(shù)據(jù)庫發(fā)布速度
3: 數(shù)據(jù)轉(zhuǎn)換速度優(yōu)化(針對(duì)Mysql和SqlServer數(shù)據(jù)庫的導(dǎo)入), 同時(shí)去除網(wǎng)址庫的清空邏輯
4: html標(biāo)簽處理錯(cuò)誤問題處理
5: json提取關(guān)于數(shù)字轉(zhuǎn)換為科學(xué)計(jì)數(shù)法問題處理
6: 發(fā)布測(cè)試時(shí),圖片上傳無效的問題處理
7: 采集內(nèi)容頁處理錯(cuò)誤時(shí),增加對(duì)于當(dāng)前出錯(cuò)標(biāo)簽的提示,以便快速定位出錯(cuò)標(biāo)簽
8: 任務(wù)批量編輯,增加可操作范圍
9: 循環(huán)匹配匹配空格問題處理
10: 刷新分組中增加統(tǒng)計(jì)數(shù)據(jù)的刷新
11: post分頁處理
12: 部分功能邏輯優(yōu)化