Java 自定义 URL 规则解析

正如上文说的,最近再写一个 Proxy 的爬取工具。那么有个问题就接着来了。如何快速的定义一个方便的 URL 配制方法。 举个简单的例子。我们可以看到: public final static String VPS_LIST_URL[] = { "http://www.cz88.utils/proxy/[|http_[2-3|7-9].shtml]", "http://www.site-digger.com/html/articles/20110516/proxieslist.html", "http://www.kuaidaili.com/proxylist/[0-10]" }; 这边在 cz88 这个站点,他的路径是比较奇怪的。页码为1的时候,他是直接根目录访问,但是从之后就是 2-3 和 7-9 两个区间。所以,这边我... [阅读全文]

一个爬虫引发的 Java AES 问题

写在开头,为什么有这一篇文章呢?因为,最近我开始了一个项目组,就是 HTTP Proxy 的信息采集。因为之前一直有个写爬虫的习惯,但是因为一直没有一个稳定的 Proxy 的提供渠道,或者说,并没有限制的资金购买这个服务。导致了我之前的刷某些服务器,被封了 IP (也是因为懒)。 所以,为了避免以上的悲剧不再发生,就开始了这个项目组。那么,这个项目和 AES 加密有什么关系呢。其实,我的计划里,并没有关系。但是,在写爬虫爬取各个网站上的 Proxy 的时候,遇到了这么个情况。有些网站本身也是通过提供 VPS 盈利的,所以他们会在前端显示的时候,做一些加密处理。 比如: http://www.site-digger.com/html/articles/20110516/proxieslist.html 当时,我很简单的以为,他和其他的网站一样,直接脱... [阅读全文]

Android 开发总结

忙碌的一个月终于结束了,因为老板觉得我天天在公司就负责扫地,有点物过其用。就让我接手了一个同事离职的安卓代码。因为这个属于外包吧,有明确的时间要求,所以就只能天天加班来实现。 不过,在实现的过程中,确实找到了一些共性的东西。这边拿出来分享下。 选用的设计模式 MVP 首先就是安卓项目的代码划分。之前的说法,都是MVC式的划分方式,所以会出现一个问题。Activity 中代码杂糅。所以之后就出现了 MVP 的设计模式,也算是在 MVVM 成熟之前的一个过渡方案吧。 所以这样的代码设计起来是这样的: Ξ src/main git:(master) ▶ tree . ├── java │   └── com │   └── szjlxh │   └── ehs │ &nbs... [阅读全文]

Singleton模式的一些事情

    几个项目下来,对于设计模式还是比较熟悉了,比如什么适配器模式,工厂模式,单例模式,什么原型模式等等。     但是,对于单例模式还是有些东西可以好好说一下的。比如,写一个简单的单例模式的例子。下面的代码应该是大多数人的选择: public class Singleton_Test_1{ public Singleton_Test_1() { System.out.println("I was built"); } private static Singleton_Test_1 singleton_Test_1 = new Singleton_Test_1(); public static Singleton_Test_1 getInstance() { return s... [阅读全文]