<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Gocolly on PHPHA</title><link>https://blog.phpha.com/tag/gocolly/</link><description>Recent content in Gocolly on PHPHA</description><generator>Hugo</generator><language>zh</language><lastBuildDate>Mon, 02 Sep 2019 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.phpha.com/tag/gocolly/index.xml" rel="self" type="application/rss+xml"/><item><title>使用 GoColly 抓取贝壳房源信息</title><link>https://blog.phpha.com/archives/140/</link><pubDate>Mon, 02 Sep 2019 00:00:00 +0000</pubDate><guid>https://blog.phpha.com/archives/140/</guid><description>&lt;p&gt;使用 &lt;code&gt;Golang&lt;/code&gt; 的爬虫工具 &lt;code&gt;Gocolly&lt;/code&gt; 抓取贝壳的出租房源信息。由于公司项目之一是长租公寓 &lt;code&gt;SaaS&lt;/code&gt; 管理系统，需要为公寓的老板或管家们提供当地的租房价格参考。出于对 &lt;code&gt;Golang&lt;/code&gt; 学习的目的，没有采用 &lt;code&gt;Python&lt;/code&gt; 那些成熟的爬虫框架，而是采用了 &lt;code&gt;Gocolly&lt;/code&gt;，抓取的数据存储在 &lt;code&gt;MongoDB&lt;/code&gt;。&lt;/p&gt;</description></item><item><title>基于 Golang 的网络爬虫 Gocolly</title><link>https://blog.phpha.com/archives/122/</link><pubDate>Tue, 23 Oct 2018 00:00:00 +0000</pubDate><guid>https://blog.phpha.com/archives/122/</guid><description>&lt;p&gt;因项目需要，要对网络上某些信息进行抓取，以便加工后做数据分析。提到爬虫框架，知名度最高的当属基于&lt;code&gt;Python&lt;/code&gt;的爬虫框架 &lt;code&gt;Scrapy&lt;/code&gt;。但是由于本人对 &lt;code&gt;Python&lt;/code&gt; 并不熟悉，并且暂时也不准备去深入学习，因此不在考虑范围。同时也是基于学习的目的，因此选择了 &lt;code&gt;Golang&lt;/code&gt; 方向。基于 &lt;code&gt;Golang&lt;/code&gt; 的成熟爬虫框架其实并不多，因此在选择上不用太纠结，就用 &lt;code&gt;Go-Colly&lt;/code&gt; 了。&lt;/p&gt;</description></item></channel></rss>