如何计算网站相似度?
作者:佚名 时间:2014-04-14
目前,网站建设的市场鱼龙混杂,模版网站、仿站,甚至是纯抄袭的网站层出不穷。就那我们自己的官网来说,被抄袭了不只一次两次了。对待这种抄袭者,我们不给予深究。我们只能将他们当做是一群鞭策者,时时刻刻鞭策着我们进步。下面,我们就来说说如何计算网站的相似度。
相似度,就是两个或两个以上网页的相似程度。网页中包含了大量的图片和文字,还包括了网站的框架结构、一系列的程序代码等。如果两个相似度很高的网站摆在你面前,你一定不喜欢浏览。对于搜索引擎来说,这样的两个网站也会被定义为垃圾网站。通常,60%相似的网站会被认为是整站抄袭。
网站相似度计算方式:
1.如果多个网页摘要的MD5值一样,证明这些网页具有很高的相似性。
2.根据网站中出现的文字、图片,按照排列顺序,可以提出一些出现次数较多的如果MD5值相同,那么也会增加相似度。
那么,在企业网站建设时,如何降低与其他网站的相似度呢?
1.使用iframe框架,把认为的高度相似的页面嵌套进去。
2.编写出不一样的JS效果,搜索引擎认为JS是一种无用代码,可以将高度相似的页面放进JS中。通常来说,搜索引擎是不对JS进行抓取的。
3.在网页中加入Flash动画,或者加入大量图片。
4.增加原创内容,原创的内容就可以不用担心和其他网站内容相思。这样也符合搜索引擎的抓取标准,是提高网站权重的最佳途径。