使用 GoColly 抓取贝壳房源信息
使用 Golang
的爬虫工具 Gocolly
抓取贝壳的出租房源信息。由于公司项目之一是长租公寓 SaaS
管理系统,需要为公寓的老板或管家们提供当地的租房价格参考。出于对 Golang
学习的目的,没有采用 Python
那些成熟的爬虫框架,而是采用了 Gocolly
,抓取的数据存储在 MongoDB
。
使用 Golang
的爬虫工具 Gocolly
抓取贝壳的出租房源信息。由于公司项目之一是长租公寓 SaaS
管理系统,需要为公寓的老板或管家们提供当地的租房价格参考。出于对 Golang
学习的目的,没有采用 Python
那些成熟的爬虫框架,而是采用了 Gocolly
,抓取的数据存储在 MongoDB
。
因项目需要,要对网络上某些信息进行抓取,以便加工后做数据分析。提到爬虫框架,知名度最高的当属基于Python
的爬虫框架 Scrapy
。但是由于本人对 Python
并不熟悉,并且暂时也不准备去深入学习,因此不在考虑范围。同时也是基于学习的目的,因此选择了 Golang
方向。基于 Golang
的成熟爬虫框架其实并不多,因此在选择上不用太纠结,就用 Go-Colly
了。