首先解释下什么是GFW,全称Great Firewall,是对中华人民共和国政府在其管辖互联网内部建立的多套网络审查系统(包括相关行政审查系统)的称呼。主要致力于GFW的院校有北邮和上交(Sroan:都是些不要脸的学校),主要公司有启明星辰(002439)等。
在分析之前先大致介绍下GFW一些常用屏蔽方法。
1、DNS劫持
DNS劫持主要表现为访问一些不存在的网站或者访问出现故障的时候会挑战到114这种垃圾搜索上,或者访问谷歌页面却掉到了度娘的页面上。
解决办法:使用国外的DNS,比如谷歌的8.8.8.8
2、DNS污染
举个例子比如解析一个域名 www.sroan.com 正确解析出来的IP是1.1.1.1,但是DNS污染后解析出来的IP是2.2.2.2
解决办法:加密代理访问
3、IP封锁
比如访问国外一个IP无法访问,PING不通,tracert这个IP后发现,全部在边缘路由器(GFW)附近被拦截。换言之,GFW直接拦截带有这个IP头的数据包。
解决办法:加密代理访问
4、TCP连接重置
这个是GFW最擅长的方法,比如你在谷歌中输入一些所谓的敏感词,GFW发现你发送的请求中包含有敏感词,马上reset你的链接,并断开1分钟,于是在1分钟内你无法登陆上谷歌了。还有一种重置并不是基于敏感词的,因为使用https协议后数据经过加密无法再过滤,所以GFW发现使用https协议就直接断开服务,比如谷歌文档。
解决办法:加密代理访问
5、HTTP会话劫持
使用电信的用户应该会比较多的体验到:每次重新连接上网后,返回第一个页面的顶部经常是有广告的。这是因为无耻的电信劫持了你的HTTP会话,在返回数据中加入了那些广告。
以上5种是GFW比较常见的功能,其次分析下谷歌问答的情况,谷歌问答通过GFW审核后的情况后,问答地址(http://www.google.com.hk/wenda/)无法访问,但是谷歌香港(http://www.google.com.hk)是可以正常访问的。那基本可以排除DNS劫持、DNS污染、HTTP会话劫持、IP封锁。那只有基于关键词的TCP连接重置,首先想到的是“wenda”和“/wenda”,在谷歌中输入相关关键词发现可以正常访问。

看来是把域名也带上了,在谷歌中搜索www.google.com.hk/wenda,出现无法访问的信息。

至于为什么谷歌中输入google.com.hk/wenda可以正常搜索,但是无法访问呢?(不带WWW),那是因为谷歌设置了google.com.hk重定向到了www.google.com.hk,所以最后总结下来是GWF通过基于关键词“www.google.com.hk/wenda”对谷歌问答进行TCP连接重置导致其无法访问。
只要在浏览器里输入http://www.google.com.hk///wenda/ 就可以看见能“正常”访问了。

PS:本人长期帮助他人访问任何网站,小姑娘优先。
记得原来开玩笑地跟TX说:最好做一个网站,每天晚上5点打电话回家,让老妈单击下鼠标,然后网站内容全部自动更新完毕。当然这里只是对网站高度自动化的一种设想,如今想想还缺了很多。做了N年的网站,总结的一句话是:网站很难做,赚钱很容易。于是想把自己目前觉得一个优秀网站所具备的条件(主要技术方面)汇总一下。
一、核心内容(创意)
网站的核心内容是什么?核心内容才是网站价值的关键。QQ、SINA、baidu、renren、微博我们的核心价值是否都是拿来主义。微软之后有google,facebook之后有twitter,谷歌的核心是信息整合,QQ的核心就是有钱就赚。
二、美工UI
优秀的UI是用户良好体验的关键。美工作为网站设计实现的第一个流程,需要为程序员预留空间,各个功能位置,对于用户而言美工的好坏占到网站评价的70%以上。
三、程序代码
网站功能的实现还是需要程序员一行行把代码敲出来的,程序员如何和美工协调是网站设计的一个关键。其次动态脚本与静态Html分离,也是为了帮助两者更好的协调。
四、seo
“酒香也怕巷子深”,良好的seo有助于网站在搜索引擎中的表现,是直接提高网站流量的最好办法。seo往往对于页面的部分文字、部分结构有着某些特殊要求,同样需要与美工或者程序员协调。
五、网站安全
如果一个程序员知道要过滤引号,那他还算是知道一点网站安全的只是。只是一个网站安全何止一个引号?今年被黑过3次,一次变量未定义上传,一次旁注,一次ARP欺骗,被黑后是件很麻烦的事情,清理代码,修改数据库密码、后台密码等。好吧,出来混迟早要还的。
六、性能优化
性能优化主要考察服务器的吞吐量和带宽。美工总是喜欢放大图片,程序员总是喜欢把没用的函数一起调用过来,网站安全人员总是加一些复杂的过滤代码。怎么和他们协商呢?当然一般中小网站(LAMP)基本不考虑,毕竟APACHE再怎么不好,就像一个小姑娘长的白,所谓一白遮百丑,即使APACHE内存占得多,并发支持弱,但人家就是稳定。
七、广告优化
一直有人问我,网站怎么赚钱。目前网站主要靠广告收入,其中google的分成比例大概在70%,至于度娘大概超过了10%吧。所以如果我投放百度广告的话,我大概现在要去申请救济金了,投放google的话,每个月去银行存钱。广告优化需要考虑广告大小、颜色、位置等等,只有用户点击率提高,广告关联度提高,网站的利润才会提高。优化与不优化,其中相差甚至可以是1-2倍。
八、政策风险
你要是问到底是什么政策风险,我也不好说,因为这个经常变。用户提供内容的网站不要做,其次在国内创办论坛需要100W注册资本,网络游戏(包括网页游戏)需要1000W注册资本,否则你都没有资格去和有关部门打交到。假如你侥幸成功了,做出了一个杰出的网站,如果你的服务器在国内,肯定要被查封。如果你的服务器在国外,好吧,DNS污染、DNS劫持、关键词过滤等等会等着你的。
文章写得肤浅得很好,只是些个人体会,除了美工,都可以与大家详细探讨。
1、静态页面对用户与爬虫来说比动态页面要好得多
2、每个页面的连接数少于100条(尽量)
3、最新搜索排名技术把页面访问速度作为一个重要参数
4、文本格式要多样性:图片、视频、博客(非常看重) 文本要准确、独特
5、图片的优化——重要的信息一定要用文字而不是图片来表示,非用图片的话得在图片的替代描述信息里进行描述
今天谷歌问答正式推出测试版(http://www.google.com.hk/wenda/),之前谷歌与天涯社区合作开发天涯问答,谷歌提供技术支持,此次谷歌与天涯断绝了合作关系单独开设谷歌问答。
可以看出谷歌问答上线首日受到了广泛关注,其中一些问题回答数量几多,尤其是一些在百度不知道以及新浪不爱问中无法出现的问题受到很大的关注,其次网民的回答也极为富有娱乐性。例如家祭无忘告乃翁

但是也有网友担忧谷歌问答很可能被当局封杀,GFW可能对其数据进行RESET。
至于谷歌问答为什么如此欢乐?有网友回答道:因为和蟹国的国民们憧憬自由.而这里恰巧提供了这样的一个场所..
所以在长期压抑的生活中活的着河蟹国民开始在这里欢乐起来了..
向往自由是需要付出代价的,这个代价包括时间、金钱、甚至……
首先,赶紧找个女人结婚,然后生孩子,然后快要临产的时候,办张旅游签证或者其他签证去美国,在美国把孩子生下来,美国法律规定任何人只要在美国领土出生都算美国人,享有公民权,能享受到美国的教育制度以及社会环境。然后等孩子21岁,依据美国宪法第十四修正案及相关法规,在美国领土出生自然拥有美国国籍,年满21岁后,就可申请其外国籍父母赴美定居。
不要觉得这不可能,对于赴美产子,美使馆发言人形容,这并不犯法,只是利用了美国宪法第十四修正案赋予的出生公民权。
20多年的等待不算什么,反正20年内不会有什么改变,天朝还是天朝,屁民还是屁民。我有自由,你有吗?
最近评论