noarchive、noindex与nofollow的区别
noarchive、noindex与nofollow共同点:均是Meta元标记
它们都是Meta元标记,是内嵌在网页中,它给搜索引起传递你的网站一些信息需要被隐藏,从而达到保护网站隐私的行为。比如:针对雅虎,<head>标记对里写上<meta name=”robots” content=”noodp“>可防止搜索引擎调用ODP上面的描述性语句。
noarchive、noindex与nofollow不同点:表达含义不同
nofollow: 不允许追踪抓取页面上的链接。
noarchive: 不允许搜索引起给网页建立快照(但没限制是否抓取)。
noindex: 不允许搜索引擎蜘蛛抓取网页。
noarchive、noindex与nofollow写法:限制robots行为
不允许所有机器人追踪页面链接:<meta name=”robots” content=”nofollow“>
不允许某一个搜索引起的机器人追踪页面链接,如限制百度蜘蛛:<meta name=”Baiduspider” content=”nofollow“>
noarchive、noindex的写法同nofollow一样,只需要替换即可表达不同意义。
其他,组合表达的写法:
允许所有机器人抓取本页内容,但不建立快照并且不允许追踪此页面上的链接继续索引:<meta name=”robots” content=”index,nofollow,noarchive”>
这样根据自己的意愿还可以组合多种表达方式来限制机器人的行为。
各大搜索引起对noarchive、noindex与nofollow支持度:
Google完全支持词三个标签,但Google并非100%遵守; 百度完全支持noarchive与nofollow,但对noindex支持不良好,并且并非100%遵守。
针对不支持和不良好支持标签的补救措施有二:
补救措施一:采用robots.tx文件限制 。
补救措施二:服务器禁止访问。
在服务器上设定搜索引擎所在的ip段禁止访问即可,这个需要技术支持,这个方法比较好的地方在于直接禁止搜索引擎的访问,除了HTTP请求头,几乎不耗费流量,也是禁止搜索引擎收录的最好方法。缺点在于你不可能得到Google的所有IP段,这个就得靠收集了。
综述:
对于noarchive、noindex与nofollow的区别介绍就到此结束,在做优化的时候这些都是常用到的meta标签,熟记这些标签,以便在以后的工作中能得心应手地使用,让我们的工作效率有所提高是很要必要的。