阿七 |
2006-04-06 08:51 |
2、Robots META标签的写法: /g BB ze@NqCF 8QDs4Bv| Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。 # -e pC2ZN INDEX 指令告诉搜索机器人抓取该页面; e[.c^Hw Ab ,n^ FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去; ? FGz
w ,:Qy%k}f Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。 ACm9H9:Vd
Ir'(GB v10p]=HmO 这样,一共有四种组合: ,#:*dl qkVGa%^ <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW"> dfl| 6R o=@0Bd8 <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> RZ 4xR ChO?Lm$y <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> })RT2zw} 8s(?zK\ <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> C%_^0#8-0 9c9FC =%P'?(o| 其中 ^PA[fL" .#0),JJZ[ <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">可以写成 ~_<I}!j/B jyQBx <META NAME="ROBOTS" CONTENT="ALL">; WvSh i=
C$Pe<C# <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">可以写成 ?g9mDe;k 6QS[mWU <META NAME="ROBOTS" CONTENT="NONE"> DE"KbA0} bL*;6TzRK 需要注意的是:上述的robots.txt和Robots META标签限制搜索引擎机器人(ROBOTS)抓取站点内容的办法只是一种规则,需要搜索引擎机器人的配合才行,并不是每个ROBOTS都遵守的。 ^@f%A
< s33< }O0 ER,,K._?B 目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如: [)UF@Sq4+Q 2B&Y
w <META NAME="googlebot" CONTENT="index,follow,noarchive"> ^,S
\-Uy9 {6MLbL{ 表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。 |
|