bestlong 怕失憶論壇's Archiver

bestlong 發表於 2010-9-21 16:08

Scrapy - 用 Python 寫的 Web Crawler (網站爬蟲) 框架



[url=http://scrapy.org/]Scrapy[/url] 是一個快速的高級別屏幕抓取和網頁抓取框架,用來抓取網站的結構化數據和提取自己的網頁。 可用於範圍廣泛的用途,從數據挖掘技術監測和自動化測試。



下圖為 Scrapy 的架構概念圖,其中綠線表達資料在各個元件的流動方向

圖片來源 [url]http://doc.scrapy.org/topics/architecture.html[/url]

[url=http://scrapy.org/]Scrapy[/url]
[url=http://blog.scrapy.org/]Scrapy Blog[/url]
[url=http://snippets.scrapy.org/]Scrapy Snippets[/url]
[url=http://dev.scrapy.org/wiki/ScrapyRecipes]Scrapy Recipes[/url]
[url=http://groups.google.com/group/scrapy-users]Scrapy 在 Google 的討論區[/url]
頁: [1]

Powered by Discuz! X1.5 Archiver   © 2001-2010 Comsenz Inc.