teleport pro 教程 teleport up
大家好,小宜來(lái)為大家講解下。teleport,pro,教程,teleport,up這個(gè)很多人還不知道,現(xiàn)在讓我們一起來(lái)看看吧!
一、介紹:
1.Teleport Pro是一款用來(lái)抓取網(wǎng)頁(yè)上空間非常大、或者具有若干外部連接的網(wǎng)站全部或部分內(nèi)容的工具軟件。它可以讓用戶將一個(gè)網(wǎng)站克隆到本地,并且下載外部鏈接所指向的網(wǎng)頁(yè)、圖片、文件等內(nèi)容,最終將一個(gè)選定的網(wǎng)站結(jié)構(gòu)完整的復(fù)制到本地,能夠方便快捷的完成下載工作,是當(dāng)前最常用的網(wǎng)站抓取的軟件之一。
2.Teleport Pro 是以其獨(dú)特的“自我調(diào)整”的功能和技術(shù)優(yōu)勢(shì)受到廣大網(wǎng)友的歡迎。它可以爬行任何形式的鏈接,包括重定向,它可以自動(dòng)處理網(wǎng)頁(yè)上給出的圖片,它還可以根據(jù)配置文件和一些其他參數(shù)來(lái)爬行受控范圍內(nèi)的網(wǎng)頁(yè),因此Teleport Pro 被公認(rèn)為最完善的爬行器。
二、Teleport Pro介紹及功能:
1.\tTeleport Pro的主要功能包括:抓取網(wǎng)站全部或部分內(nèi)容,抓取包括重定向在內(nèi)的鏈接,快速下載外部鏈接指向的Web頁(yè)面,自動(dòng)處理網(wǎng)頁(yè)上給出的圖片等等。
2.\tTeleport Pro采用“自我調(diào)整”的方式來(lái)完成抓取工作,它可以根據(jù)配置文件和參數(shù)來(lái)爬行網(wǎng)站,并自行解析并整理抓取到的網(wǎng)站內(nèi)容。
3.\tTeleport Pro還擁有重定向查找和處理機(jī)制、網(wǎng)絡(luò)調(diào)度、多線程抓取和定義路徑等特性,并可以在抓取過(guò)程中處理Cookies;此外,它還可以把抓取出來(lái)的內(nèi)容存儲(chǔ)在數(shù)據(jù)庫(kù)中,從而形成一個(gè)非常大的的網(wǎng)站網(wǎng)絡(luò)。
4.\t通過(guò)指定參數(shù)不僅可以抓取指定的站點(diǎn)內(nèi)容,還可以把站點(diǎn)內(nèi)容制作成獨(dú)立的文件形式。除此之外,Teleport Pro還可以對(duì)網(wǎng)頁(yè)的訪問(wèn)權(quán)限進(jìn)行設(shè)置,支持用戶名密碼認(rèn)證,從而獲得所有需要權(quán)限認(rèn)證的網(wǎng)站抓取。
三、Teleport Pro如何使用:
1.\t抓取一個(gè)網(wǎng)站:使用Teleport Pro來(lái)抓取一個(gè)網(wǎng)站時(shí),首先需要把網(wǎng)站的地址輸入Teleport Pro的“地址”窗口內(nèi),如果網(wǎng)站需要進(jìn)行密碼認(rèn)證,則需要在“密碼”窗口中輸入用戶名和密碼,最后點(diǎn)擊“站點(diǎn)抓取”,就可以開(kāi)始抓取網(wǎng)站內(nèi)容了。
2.\t抓取多個(gè)網(wǎng)站:如果要抓取多個(gè)網(wǎng)站,在“地址”窗口中輸入多個(gè)網(wǎng)站地址,并且在“密碼”窗口輸入相關(guān)的用戶名和密碼,然后點(diǎn)擊“站點(diǎn)抓取”按鈕,就可以開(kāi)始抓取多個(gè)網(wǎng)站內(nèi)容了。
3. 社交網(wǎng)站抓取:Teleport Pro可以幫助我們抓取社交網(wǎng)站上的內(nèi)容,在抓取社交網(wǎng)站上的內(nèi)容時(shí),我們可以設(shè)置“抓取策略”窗口來(lái)指定某個(gè)社交網(wǎng)站的內(nèi)容抓取深度,以及指定抓取某個(gè)內(nèi)容的各個(gè)評(píng)論子窗口等信息。
Teleport Pro 教程
一、概述
Teleport Pro是一款爬蟲(chóng)(Web爬蟲(chóng))軟件,主要功能是抓取網(wǎng)絡(luò)上的網(wǎng)頁(yè)、圖像、文件等內(nèi)容,自動(dòng)保存到電腦中,也可以把相關(guān)內(nèi)容打包成數(shù)據(jù)庫(kù),以供日后檢索和被jquery遠(yuǎn)程訪問(wèn)。
二、主要功能
Teleport Pro能夠分析、解析網(wǎng)頁(yè)中的鏈接,能夠根據(jù)鏈接判斷外部鏈接,并可以自動(dòng)抓取相關(guān)內(nèi)容,包括HTML主頁(yè)、文件、圖片等等。Teleport Pro 可以把相關(guān)內(nèi)容集中到一個(gè)資源目錄,方便網(wǎng)站管理人員以數(shù)據(jù)庫(kù)的形式處理網(wǎng)絡(luò)上的網(wǎng)頁(yè)、圖像、文件等。
三、特點(diǎn)
1.多種抓取模式:Teleport Pro支持在給定的網(wǎng)址、文本文件列表中抓取,也可以從外部資源和鏈接中自動(dòng)抓取;
2.智能判斷:Teleport Pro可以自動(dòng)設(shè)置抓取范圍,根據(jù)網(wǎng)頁(yè)的鏈接判斷外部連接,自動(dòng)忽略重復(fù)鏈接,并支持?jǐn)帱c(diǎn)續(xù)傳;
3.多種數(shù)據(jù)庫(kù):Teleport Pro支持?jǐn)?shù)據(jù)庫(kù)存儲(chǔ),可以對(duì)網(wǎng)絡(luò)上抓取的內(nèi)容以數(shù)據(jù)庫(kù)的形式結(jié)構(gòu)化,并可以通過(guò)jQuery遠(yuǎn)程訪問(wèn);
4.高效抓取:Teleport Pro可以多線程抓取,并可以通過(guò)調(diào)節(jié)抓取速度,盡快獲取抓取的內(nèi)容;
5.強(qiáng)大的文件管理:Teleport Pro可以在抓取網(wǎng)頁(yè)和圖片的同時(shí),自動(dòng)將抓取的內(nèi)容轉(zhuǎn)換為指定格式,有效維護(hù)管理資源;
6.安全可靠:Teleport Pro使用多級(jí)加密保護(hù)抓取的內(nèi)容,并可以設(shè)置訪問(wèn)權(quán)限,確保抓取網(wǎng)絡(luò)上的內(nèi)容安全可靠。
四、使用方法
1、安裝Teleport Pro,并安裝后將其配置到瀏覽器;
2、配置抓取范圍,選擇抓取模式,然后設(shè)置抓取限制,例如:最大抓取深度、抓取延遲、資源類別等;
3、點(diǎn)擊開(kāi)始抓取按鈕,Teleport Pro開(kāi)始執(zhí)行全局抓取;
4、抓取完畢后,可以通過(guò)資源目錄來(lái)查看抓取的內(nèi)容;
5、存儲(chǔ)為數(shù)據(jù)庫(kù):在抓取后,可以將符合條件的內(nèi)容,保存到SQLserver、MYSQL中,以便日后檢索和jQuery 遠(yuǎn)程訪問(wèn);
6、調(diào)節(jié)抓取狀態(tài):可以調(diào)整抓取速度、抓取數(shù)量和其他一些抓取參數(shù);
7、可以設(shè)置斷點(diǎn)續(xù)傳,重試失敗的抓取操作;
8、可以完全控制連接和抓取連接,并支持日志文件記錄,以便用戶檢查和調(diào)整抓取設(shè)置。
本文到此分享完畢,希望對(duì)大家有所幫助。
作者:baidianfeng365本文地址:http://www.xh368.com/bdf/33843.html發(fā)布于 2024-02-27
文章轉(zhuǎn)載或復(fù)制請(qǐng)以超鏈接形式并注明出處白癜風(fēng)知識(shí)網(wǎng)