上网不知GFW,拉条光纤也枉然~

發佈 | 2008-07-08 | 電腦技術進化論


旁的都不说,给大家扫盲了,别上了一辈子网,都不知道是怎么一回事.
防火长城,也称中国防火墙中国国家防火墙,是对中华人民共和国政府在其管辖互联网内部建立的多套网络审查系统(包括相关行政审查系统)的俗称。其名称得自于2002年5月17日 Charles R. Smith所写的一篇关于中国网络审查的文章《The Great Firewall of China》,取与Great Wall(长城)相谐的效果,简写为Great Firewall,缩写GFW,戏称功夫网(Gong Fu Wang)。随着使用的广泛,GFW已被用于动词,GFWed是指被防火长城所屏蔽。
一般情况下防火长城主要指中国政府对互联网内容进行监控和过滤的一套由服务器和路由器等设备加上相关的应用程序所构成的软硬件系统。由于中国网络审查较为完备,中国国内含有“不合适”内容的的网站会受到政府直接的行政干预,从而需要进行自我审查和自我监管乃至严重的会被关闭,故防火长城主要作用在于对中国境内外的网络资讯互相访问进行分析和过滤。
然而,利用防火长城等技术手段对网络内容的审查在一定程度上限制了言论自由,在何种程度上、采取何种手段进行网络审查一直是受争议的话题。也有报告认为,防火长城其实是一种圆形监狱式的全面监控,以达到自我审查的目的[3]。
此外还有一套网络安全软件构架的金盾工程,它与防火长城的关系目前还没有发现明确的关联。
据法新社报道,中国政府正在讨论是否在北京奥运会期间放宽GFW的屏蔽范围.
目录
1 主要技术
1.1 域名劫持
1.2 国家入口网关的IP封锁
1.3 主干路由器关键字过滤阻断
1.3.1 关键字过滤-复位包分析
1.4 HTTPS证书过滤
1.5 对破网软件的反制
2 对电子邮件通讯的拦截
3 GFW测试
3.1 中国大陆境外
3.2 中国大陆境内
主要技术
域名劫持
主条目:域名劫持
全球一共有13组根(Root)级别的DNS服务器,目前中国大陆有 F、I、J 这3个根域DNS镜像[5]。
2002年左右,中国大陆网络安全单位开始采用域名劫持技术,用路由器提供的IDS监测系统来进行域名劫持,防止了一般民众访问被过滤的网站。
2.png
国家入口网关的IP封锁
从90年代初期,中国大陆只有教育网、高能所和公用数据网3个国家级网关出口,中国政府对认为违反中国国家法律法规的站点进行IP封锁,这是有效的封锁技术。对于IP封锁,用普通Proxy技术就可以绕过。只要找到一个普通的海外Proxy,然后通过Proxy就可以浏览自己平时看不到的资讯了。所以,网络安全部门现在通常会将中国政府认为特别反动的网站的网址加入关键字过滤系统,以防止民众透过普通海外HTTP代理服务器访问。
一般情况下,GFW对于海外“非法”网站会采取独立IP封锁技术。然而,部分“非法”网站使用的是由虚拟主机服务提供商提供的多域名、单(同)IP的主机托管服务,这就会造成了封禁某个IP,就会造成所有使用该服务提供商服务的其他使用相同IP的网站用户一同遭殃,就算是内容健康、正当的网站,也不能幸免(如森美的个人网站,内容并无不当之处,但网站使用的是虚拟主机托管服务,而因为有一个香港BBS亦使用该托管服务,这就造成了GFW为了封锁该BBS,直接把这个固定IP:203.80.210.5封禁了。随之,有82个香港网站由于GFW封锁了这个IP地址,不论合法与否,都不能在中国大陆访问)。
以下圖略,可自行測試

Firefox的“连线被重设”错误讯息。当碰触到GFW设定的关键词后,即可能马上出现这种画面。
当Google新闻中的图片地址[6]含有某些敏感字符时被GFW拦截的画面,在图中可以见到网页只开启了部分就停止了。
当Google新闻网在下载带有列入关键字过滤网址网站的图片时,就会导致全站所有透过Google服务器下载的图片全部无法显示或突然出错(画面中的情况是第一条新闻的图片链接是被关键字过滤的网址“philly.com”)。

主干路由器关键字过滤阻断
主条目:关键词过滤和防火长城关键字列表
在2002年左右,中国大陆研发了一套系统,并规定各个因特网服务提供商必须使用。思科等公司的高级路由设备帮助中国大陆实现了关键字过滤,最主要的就是IDS(Intrusion Detection System)--- 入侵检测系统[7]。它能够从计算机网络系统中的关键点(如国家级网关)收集分析信息,过滤、嗅探指定的关键字,并进行智能识别,检查网络中是否有违反安全策略的行为。利用这些设备主要进行IP数据包内容的过滤,如果符合既定的规则,则向该连接两端的计算机发送IP欺骗性质(从前后IP报头TTL值相差较大可知)的RST复位包,干扰两者间正常的TCP连接,使数据流中断,而在终端主机上会显示连接失败。这种关键字过滤-复位技术只对TCP连接有效(如今被广泛应用的HTTP协议正是使用TCP作为传输层协议,从目前来看,GFW对HTTP报文的过滤似乎仅限于HTTP头,通常URL请求就位于HTTP头部分,而GFW对HTTP数据部分很可能不作过滤[8],这正是某些用PHP编写的HTTP在线代理能避开关键字过滤的原因,例如PHProxy,它将明文的URL请求放在HTTP数据部分),对UDP(DNS通常使用UDP,GFW对捕获的DNS查询报文也进行关键字过滤并返回伪DNS响应[9],但因UDP没有复位标志而无法进行传输层的干扰)及其他第四层协议无效,对明文数据有效,对加密数据无效。不同的IDS有可能在一段预定或随机的时间内持续干扰刚刚被干扰中断的两计算机间的所有TCP通信。所以在访问境外网站时,如果数据流里有敏感字词,即会立即被提示“该页无法显示”或网页开启一些后突然停止,随后在1-3分钟或更长时间内无法用同一IP浏览此域名或IP地址上的内容,屏蔽时间据猜测和敏感词等级以及所属网站有关。此种过滤是双向的,也就是说,国内含有关键词的网站在国外不可访问(如在百度搜索一塌糊涂BBS),国外含有关键词的网站在国内不可访问[10]。
被屏蔽过滤的关键词主要是与民运、法轮功相关的词汇及部分网站的网址上。
在任何海外搜索引擎网站搜索防火长城关键字列表里面的任何关键字时,会马上触发GFW导致“该页无法显示”。
任何海外网站网页中如果含有防火长城关键字列表的小部分关键字时,就有机会触发GFW而导致网页下载突然出错、停止或立即出现“该页无法显示”。
某些特定的海外网站网址会被列入关键字过滤[11],即使IP地址未被封锁,也不能访问。
不过,GFW对于网页中含有的关键字字符并不是100%可以过滤成功,即使某些网页被成功拦截并导致“该页无法显示”,此时只要在浏览器进行多番刷新就有机会显示出来。而且,GFW还会偶尔出现故障而导致关键字过滤系统失效,此时部分只被网址关键字过滤的网站就能正常使用(如my.opera.com)。
对于Google.com的查询返回结果有报道称是专门过滤的,即GFW针对Google.com返回结果中的网页地址进行过滤,对关键字的过滤并不严格。而Google.cn对返回结果的过滤仅只是对网页网址的,这就说明对于Google.com返回的大量网页,中国网络审查更经济而有效的方法便是像前面所说的一样,而且事实上对于Google.com的审查也正是如此。
从GFW的分布来看,审查过滤系统主要位于国际出口处,但最近通过对审查过滤系统返回的RST复位包IP头进行(TTL值)分析,发现存在两个欺骗源,其一位于国际出口处,另一个位于骨干网省级接入处。因此推测GFW对于境内的非法内容也具有一定审查能力。值得提到的是,对于境内网络内容的审查主要是通过ICP备案来实现的。
从2007年2月前后,GFW开始对境外及境内的WAP网站含有的敏感字符进行过滤,原本在移动版Google可以打开的维基百科中文版现已不能通过Google网页转换功能进行访问,连带的就是在访问含有“zh.wikipedia.org”的Google链接后,5分钟内再次访问Google被阻断。
关键字过滤-复位包分析
3.jpg
Flickr图片服务器网址被列入关键字系统导致无法显示任何图片。
分析过程采用任意sniffer软件记录HTTP客户端PC进出站数据包,只考虑TCP连接本身,忽略DNS、ARP及其他。分析进站RST复位包IP头TTL字段值可认为逻辑上存在两个欺骗源(实际可能只是初始TTL不同),为方便叙述,将它们分别称为“伪源1”和“伪源2”,伪源1离客户端PC路由跳计数较大,逻辑位置大致在互联网运营商国际出口处,伪源2离客户端PC路由跳计数较小,逻辑位置大致在互联网运营商骨干网省级大节点处。
IP头部分: Identification(标识)字段:在第一批RST包中,伪源1和伪源2将其设置为一个固定的值,而正常的处理方式是发送的每个IP报文都有不同的标识值,一般按生成次序递增。观察中发现伪源2的第二批RST包中该字段值会改变。
Flags(分片标志)字段:伪源1和伪源2处理方式不同,例如伪源1将DF(不分片)标志置0,伪源2将DF标志置1。
Time to Live(生存时间)字段:如前所述,伪源1的RST包到达客户端PC时经过的跳计数较大,而伪源2较小,且可推测与真正的源物理位置有差距。
TCP头部分: Sequence number(序列号)字段:关键字过滤系统很可能会偶而繁忙导致本地出口堵塞,以致RST包发送延迟并晚于真正的源发回的数据包到达客户端PC,造成RST包被客户端PC丢弃,从而整个过滤干预行为失败。考虑到这个因素,伪源还具有序列号预测功能,例如伪源2相邻的3个RST包中该值分别相差1460(以太网默认MSS值)和2920(即1460*2)。
Window size(窗口大小)字段:伪源1和伪源2处理方式不同,例如伪源1似乎为该字段设置了一个随机值,伪源2将其置0。正常的RST包是将该字段置0。
HTTPS证书过滤
部分人发现少数特定证书的传输被阻断,导致HTTPS连接中断。由于HTTPS本身的特点,这并不意味着与网站传输的内容可被破译。
对破网软件的反制
针对网上突破防火长城的各类破网软件,防火长城也在技术上做了应对措施以减弱破网软件的穿透能力。比如每年的特定关键时间点,无界等软件就可能会无法正常连接或连接异常缓慢,这时境内外的正常网络互联亦会受到干扰。
针对Tor,有分析认为中国大陆公安网络审查部门采取了新的封锁措施——建立虚假Tor节点。鉴于无法真正的完全封锁Tor,网络安全部门在中国国内网络中安装了大量虚假 Tor节点服务器,所有经过这些"节点"的信息都将被最大程度的审查,与此同时,所有到达这些虚假节点的网络请求都将被屏蔽。有意见认为因为此举会暴露防火长城的位置,中国大陆公安网络审查部门对虚假节点的设立有所节制。但另一方面,tor节点的大量增加很可能仅仅是因为国内用户增加的缘故,即使存在有虚假节点,对于使用图形界面Vidalia的用户也可以轻松将含有境内节点的路由删除,以确保安全。
对电子邮件通讯的拦截
2007年7月17日,大量使用中国国内邮件服务商的用户与国外通信出现了退信、丢信等普遍现象,症状为:
中国国内邮箱给国外域发信收到退信,退信提示“Remote host said: 551 User not local; please try ”
中国国内邮箱用户给国外域发信,对方收到邮件时内容均为“aaazzzaaazzzaaazzzaaazzzaaazzz”。
中国国内邮箱给国外域发信收到退信,退信提示“Connected to ***.***.***.*** but connection died. (#4.4.2)”
国外域给中国国内邮箱发信时收到退信,退信提示“Remote host said: 551 User not local; please try ”
国外域给中国国内邮箱发信后,中国国内邮箱用户收到的邮件内容均为“aaazzzaaazzzaaazzzaaazzzaaazzz”。
对此,新浪的解释是“近期互联网国际线路出口不稳定,国内多数大型邮件服务提供商均受到影响,在此期间您与国外域名通信可能会出现退信、丢信等现象。为此,新浪VIP邮箱正在采取措施,力争尽快妥善解决该问题。”而万网客户服务中心的解释是“关于近期国内互联网国际出口存在未知的技术问题导致国内用户与国外通信可能会出现退信、丢信等普遍现象,万网公司高度重视,一直积极和国家相关机构汇报沟通,并组织了精良的技术力量努力寻找解决方案。”[12]
有网友推测由于GFW会过滤进出邮件,当发现敏感(关键)字后往两边各发送三个伪造的reset断掉连接,通常都发生在数据传输中间,所以会干扰到内容。[13]
GFW测试
4.jpg
部分网站的IP Tracert图,依次为Google Blogspot、维基百科、亚洲电视
测试网站IP是否被屏蔽或网址是否被列入了关键字过滤名单,可以使用以下方法。
中国大陆境外
打开这个网站,然后按指引测试(仅测试IP是否被屏蔽)。
打开百度,输入要测试网站网址的全部或要测试的关键字,若返回“无法显示”就证明该字符的关键字过滤生效。
中国大陆境内
对于境外所有不能直接访问的网址:
在浏览器中设置一位于境外的有效的普通HTTP代理服务器。如果能访问,说明该网址可能是被域名劫持或IP封锁(或两者同时生效),需要进一步排查;如果还不能访问,排除网站故障的因素,则该网址已被列入关键字过滤黑名单。
使用操作系统的trace route命令对网址进行IP路由跟踪,windows系统使用tracert -d命令(加参数-d以避免逆向DNS解析等待)。如果在运营商骨干网段出现“timeout”或者“reports: Destination host unreachable”,说明IP封锁生效(也可能是域名劫持,两者很难区分,可以通过设置不同的DNS服务器进行比较)。
如果同时出现设置普通HTTP代理服务器仍无法访问并且trace route路径中断,则IP封锁和关键字过滤同时生效。
GFW 目前所屏蔽的网站及测试是否被屏蔽方法

简单统计的知名网站如下:
* wiki:
o 中文维基百科 (zh.wikipedia.org)
o 偽基百科正體中文版 (zh.uncyclopedia.info);
* 博客(网誌):
o LiveJournal(www.livejournal.com)(2007年2月起);
o Xanga(www.xanga.com)(2007年3月起,网址列入关键字过滤);
o Windows Live Spaces(spaces.live.com)
o Opera Community(my.opera.com)(IP并未封锁,网址列入关键字过滤);
o 台湾奇摩(雅虎)Blog (tw.myblog.yahoo.com);
o Yam天空 Blog (blog.yam.com)(IP并未封锁,网址列入关键字过滤);
o 香港新浪Blog(mysinablog.com);
o 乐多日志 (blog.roodo.com);
o WordPress (www.wordpress.com)
o Blogsome (www.blogsome.com);
o Blogeasy (www.blogeasy.com);
o Tblog (www.tblog.com);
o Vox (www.vox.com);
o Blogger/Blogspot。
o Xuite blog (blog.xuite.net,首页可正常访问);
o Blogware (user.blogware.com);
o Blog Ireland (blogs.ie);
o 無名小站 (www.wretch.cc)(2007年7月中旬起);
o HKIBBS香港网站blog(myblog.hk);
* 论坛:
o 一塌糊涂BBS (www.ytht.org);
o 香港讨论区(www.discuss.com.hk)(www.uwants.com);
o 香港大众(www.hk-pub.com)(IP并未封锁,网址列入关键字过滤);
o Pcdiscuss(www.pcdiscuss.com)(IP并未封锁,网址列入关键字过滤);
o 微风论坛(www.wefong.com);
o 香港制造论坛(www.mihk.hk);
o 伊莉讨论区(www.eyny.com);
o 猫猫讨论区(www.catcatforum.com);
o EasyTalking(www.ectalking.com);
o Vwet讨论区(www.vwet.hk);
o KYO討論區 (kyohk.net);
o 惠之杰欧洲信息网 (www.worldbbs.info);
o 天梦游城 (bbs.hkdreams.com);
o FUNG@Musicwww.bbs.fungmusic.com);
o 超凡国度(www.nirhk.com);
o 写意论坛(hkfreezone.com);
o 香港地 (www.hkday.net);
o (www.3boys2girls.com);
o (forum.gamehit.net);
o (www.hkhostcity.com);
* 門戶信息类网站:
o Yahoo!雅虎香港 (hk.yahoo.com)(网址列入关键字过滤);
o yam寬頻電視 (www.webs-tv.net)(IP并未封锁,网址列入关键字过滤);
o 乐多 (www.roodo.com);
o 未名空间(mitbbs.com)(IP并未封锁,网址列入关键字过滤);
o Seesaa (seesaa.jp);
o 德国中文网 (www.csuchen.de);
o 华程网 (www.huachengnz.com);
o 中国大全 (www.chinasite.com);
o 德国热线 (www.dolc.de);
o 辣椒城 (www.chilicity.com);
o 华人乐园 (www.chinameetusa.com);
o 北冥家园 (www.beiming.net);
o im.tv数位电视 (www.im.tv)(IP并未封锁,网址列入关键字过滤);
o yam天空 (www.yam.com)(可访问,但主页图片几乎全部被过滤);
* 搜索引擎類網站:
o Lalulu論壇搜索 (www.lalulu.com);
* Google的大部份功能:
* 新闻(电视、电台、报刊)类网站:
o 英国广播公司(BBC)中文网 (www.bbc.co.uk/chinese)(网址列入关键字过滤);
o 英国广播公司(BBC)新闻网 (news.bbc.co.uk)(网址列入关键字过滤);
鉴于太多,其余就不一一列举。

 

標籤
沒有標籤

© 著作權歸作者所有

本文由 蔚藍部落 創作,採用 CC BY-SA 4.0 授權。

吐槽列表

взрослые женщины с большой грудью  Windows 8 Google Chrome 39.0.2171.99 @ 2017-04-15 回復

Amazing issues here. I am very glad to peer your
article. Thanks a lot and I am taking a look ahead to touch
you. Will you kindly drop me a mail?

瓶幾  GNU/Linux x64 Pale Moon 26.2.2 @ 2017-04-16 回復

Go to About me , and you can contact me via QQ

吐槽一下吧

贴图表情
* 選項為必填