gae

    在google app engine上做代理服务(for crawler)

    12 Sep 2009

    本来是想在GAE上做一个完整的代理服务器的,结果发现不可行,好像当HTTP的URL和HOST不匹配的时候,GAE就会把你拦截。怪不得GAE上找到的代理服务器都必须安装客户端或者是网页式的呢。

    但是我在hostmonster上的crawler还被挡在国门之外,没办法,只能通过QUERY_STRING来实现一个比较奇怪的代理了:

    package com.huangzhimin.gae.proxy;
    
    import java.io.IOException;
    import java.io.InputStream;
    import java.net.HttpURLConnection;
    import java.net.URL;
    import java.util.Enumeration;
    
    import javax.servlet.http.*;
    
    @SuppressWarnings("serial")
    public class RichardProxyServlet extends HttpServlet {
        public void doGet(HttpServletRequest req...
    Read More

    Tags