资深程序员教你如何分辨假网站

资深程序员教你如何分辨假网站

小张同学马上就要毕业了,最近在努力赶论文,发表到学术期刊来满足毕业条件。今天跑来跟我说自己的文章可能投递到了假的期刊网站,被“钓鱼”了。

“马上2020年了,竟然还有人会被假网站骗”。作为程序员的我有点不敢相信。如今已是移动互联网时代,再加上各项监管完善(可以说是非常严格),上线一个网站得审核你各种资质,毕竟出了事情要找到人负责任的。怎么还有可能被骗呢?

“百度搜索,点进去第一个就是了”。小张同学说到。

哦,熟悉的老套路。百度这几年因其付费推广机制导致网民被骗的事情大量被曝光,多次被推上舆论的风口浪尖,最有影响的当属魏则西事件。之后舆论发酵,百度股价开始一落千丈,到现在仅有巅峰时期的40%不到。

20岁的大学生魏则西身患晚期滑膜肉瘤,在采取各种化疗、放疗的方法后,魏则西家庭通过百度推荐的武警北京市总队第二医院肿瘤生物中心尝试所谓的“肿瘤生物免疫疗法”(DC-CIK疗法),在付出大量医药费(超过人民币20万)和时间后,仍然没有效果,2016年4月12日,因病身亡。

维基百科-魏则西事件

看来诸多事件对像小张同学这种不关心互联网的人来说并没有任何影响。脑中没有防骗意识,没有防骗的基本常识,所以才会上当。

随后在小张同学电脑上操作了一下,了解了整个被骗的流程。本篇文章就以此为案例,教大家如何在众多网站中来分辨真假,避免上当受骗。

一、 分辩搜索引擎广告

小张同学要投稿的杂志叫做《护理学报》,要在网上找到杂志的官网来投稿。她自称是在“百度”上搜索的,实际上她是在“360搜索”上搜索的。

360安全浏览器的默认首页

虽然我已经给小张同学安装上了谷歌、火狐浏览器,但是她依旧习惯使用360安全浏览器(安全?)。这个浏览器有个默认的首页就是这个360导航(看这个页面有多少广告,据这个浏览器的官网宣传,其有4亿用户,应该挣了很多钱了吧)。

搜索结果第一条,“护理学报在线征稿”,嗯,很自然就点进去了,没有一点防备,100%信任。接来下的事情就顺理成章啦,准备好的宣传话术和套路早就在等着鱼儿上钩了。所以防止被骗的第一步就是要分辨搜索引擎的广告,并且不要点击。这些广告是搜索引擎“恰饭”,“恰烂饭”,甚至是“恰人血馒头”。

恰饭是指某些有影响力的自媒体/组织/创作机构/up主/接受第三方广告并将其向自己的读者/粉丝/订阅者/观众推广的行为

https://zh.moegirl.org 萌娘百科

如何分辨搜索引擎广告呢?其实只要仔细看,搜索结果页都会将广告做标识,就上面的搜索结果来说,仔细看可以发现有橙色标注的“广告”字样(标注是标注了,但是也不能太醒目是吧,不然谁还点呢?顺便说一下360导航那个花里胡哨的页面,看惯了也很难注意到这里有个广告标识),同样百度搜索也会标注“广告”字样。所以在你使用的搜索引擎结果页,仔细看一下还是能看出区别的,当你习惯了之后,就能很快分辨哪些是搜索引擎给你投放的广告了。

百度搜索的广告示例,满满一屏全是广告

成为搜索引擎的金主爸爸,让儿子帮着推广一下,也是很正常的。对于假网站来说,这种推广太适合引流了。搜索引擎看中假网站的钱,假网站看中搜索引擎的流量,一切都是这么的自然。

有小朋友会问了,你不是说有监管吗,不是越来越严格了吗?对呀,只能说是我们的敌人太狡猾啦。在敌人如此狡猾的情况下,就得多靠我们自身提高意识,不要对搜索引擎有信任,不要相信他们标榜的安全可靠等等宣传,他们也是要“恰饭”的。

二、分辨假网站

有聪明的小朋友又问了,那些搜索结果不带广告标的,是不是就放心了呢。

对于第一个结果就套路你的搜索引擎,接下来的几千几万条结果就都是真的了吗?当然不是。其实不光是搜索结果,还有你的朋友通过微信、邮件等发给你的网页地址、链接,都要学会如何分辨。

上面分辨搜索引擎广告只是一个需要注意但是很重要的细节。这里开始教大家真正的技术。

2.1 什么是链接

所有网站的入口,都是链接。在你使用的浏览器软件,上方有一个地址栏,当前访问的网页的地址就会显示在地址栏上。很多人是不看这个地址栏的,因为看不懂。这是一个什么概念呢,相当于去街上吃饭,不看招牌就进去了,人家说卖的是肯德基就真的是肯德基?(没准是下图的。。。)

Image result for 肯德基 山寨
图片来源于网络

所以要识别假网站的最一步就是要认得网站的链接,认得网站的招牌。

网站的地址,也就是链接,都是以http开头,例如百度的链接:https://www.baidu.com ,在地址栏输入这一串文本,你就能访问到百度的首页。

链接有的是以http,有的是以https,之后跟着一个冒号和两个斜杠开头。这样的写法是固定格式,含义是表明这一串文本是一个链接,更专业的说是代表着http或者https协议。(也许你的浏览器地址栏目没有显示http://或者https://,如果你尝试着到地址栏复制再粘贴到其他地方,就能看见了,是否显示取决于你的浏览器软件)

再继续看这串字符,在两个斜杠之后,是一串由点号分隔的文本,www.baidu.com ,这部分称作域名(domain name)。域名是互联网上的唯一标示,也就是互联网这条大街上的唯一招牌。

在域名之后呢,有可能还会跟着一个斜杠,斜杠后面还有内容。这部分称为网页路径,对于识别假网站来说意义不大,不是重点。

域名这部分规则很简单,但是十分重要,学会如何分辨域名,你就能分辨出谁是李鬼,谁是李逵。接下来详细说明一下。

2.2 什么是域名

继续来看 www.baidu.com ,这是个域名。域名是由点号分隔的,我们在点号的位置把域名拆分开,得到了www baidu com,三个英文词。看域名呢,最重要的是要倒过来看,也就变成 com baidu www.

首先看倒过来的域名的第一部分,这部分被称作为顶级域名

如果对应到商场里,这部分就是各个门店的分类,例如餐饮、服装、婴童等等。除了com之外,还有很多顶级域名如 edu , net, org, cn等等,不同的顶级域名也有不同的含义。例如com表示公司,edu表示学校,org表示组织。各个顶级域名都有其管理机构,每个顶级域名的政策取决于其管理机构。不是所有的顶级域名都是严格要求的,学校也可以用com等其他顶级域名。

再看倒过来的域名的第二部分,这部分叫做二级域名。之后的部分依次叫做三级、四级域名等等。

二级域名就是各家店的具体招牌了,baidu qq weibo taobao tmall apple等等。接下来的三级、四级域名其实不太重要,这部分是由域名的拥有者自行配置的,叫什么都行。比如 chaoshi.tmall.com,对应的是天猫超市的地址。习惯上把网站的主入口命名为www,相当于门店里的欢迎光临。

照着这个逻辑,我们就可以解读域名的含义了。例如www.baidu.com,可以看作是“公司-百度-入口”;chaoshi.tmall.com可以看作为“公司-天猫-超市”。www.gzucm.edu.cn可以看作为“中国教育-广州中医药大学-入口”。

有一些特殊的二级域名,通常都被看作为顶级域名,例如edu.cn com.cn gov.cn等等。

看得懂二级域名基本上就能分辨当前访问的是真网站还是假网站,这部分是识别真假李逵的关键。来看一个真实的例子:

苹果手机以安全性著称,比较重要的就是苹果账号(apple id),能够保证手机内资料的隐私性。经常有丢了(被偷)苹果手机的同学收到邮件或者短信称其是apple官方,能够找回手机,只需要简单登录验证一下就行。进入链接之后要求输入apple id的账号和密码,输完之后信息其实就直接提交到钓鱼者手上。。。

虽然这些链接经过精心设计,但是细心的话一定能发现,链接地址是以www.Appleid.com开头的,但二级域名根本就不是apple,而是appkoe。一级域名也和apple的对不上,apple官方为com。可以确定这就是一个钓鱼链接。

2.3 域名备案的查询方法

上面提到的域名分辨方法,对自己熟悉的网站是很有效的。如果遇到初次访问,自己不熟悉的域名,如何分辨真假呢。

这里就要提到中国的域名监管制度了,在中国大陆运营的网站必须经过工信部备案,才可以在线上被访问到。备案的域名均可在工信部网站查询。通过比对域名的备案主体(域名的拥有者)信息,就可以知道访问的是不是真网站。

工信部的域名管理系统的地址是:http://beian.miit.gov.cn/state/outPortal/loginPortal.action,在网站的右侧下方,有公共查询的入口。

点击进入之后,在左侧的导航菜单中选择备案查询-备案信息查询。

选择通过网站域名查询,注意备案查询输入到二级域名就可以了,比如查询www.baidu.com,只需要查询baidu.com就可以。这里又回到小张同学的例子,通过360搜索广告第一条给的域名来核实一下,到底是不是真正的护理学报网站。广告链接的域名是www.ys168.shop (顶级域名竟然是个shop,学术网站路子这么野的吗?),果然,没有查询到任何结果。由此我们可以断定这是个假网站。

注意不是没查到的都是假网站,而是在中国大陆境内的机构、企业的官网一定都是有备案的,而你验证的这个网站打着对应机构、企业的旗号却没有查询到备案信息或者备案主体不相符(也有组织将网站交给其他企业代为管理,这种情况会出现主体不符的情况,要具体看一下两者是否有关联),就可以断定为是假冒的。

三、结束

在互联网上 没人知道你是一条狗

你也不知道互联网的对面是谁,在互联网上浏览信息,提交信息,始终都要有清醒的头脑,才不至于发生小张同学这样的悲剧。


One thought on “资深程序员教你如何分辨假网站

发表评论

电子邮件地址不会被公开。 必填项已用*标注