SEO,如何掌控搜索引擎最佳优化

admin · 发表于 2009-11-6 11:38:24

搜索引擎是可以控制的，用robot控制。我们都遇到过这样的情况，就是我们不想被搜索引擎收录的页面却被收录了。
好比，在百度里面搜索“后台管理”的时候，就会搜索到一些网站的后台登陆入口，对于网站的安全性有很大威胁。
遇到这样的情况的时候，就要学会控制搜索引擎。
一般的方法有两个，一个是根据自身的需要编辑robots.txt文件。
另外一个是在不想被收录的页面头部放置META NAME="ROBOTS"标签。
所谓robots.txt文件，是每一个搜索引擎到你的网站之后要寻找和访问的第一个文件， robots.txt是你对搜索引擎制定的一个如何索引你的网站的规则。通过这个文件，搜索引擎就可以知道在你的网站中，哪些文件是可以被索引的，哪些文件是被拒绝索引的。
对于robots的写法稍后我会传到群共享里面。
有些时候，为了节省服务器资源，需要禁止各类搜索引擎来索引我们网站上的图片。
有两种办法：一个是使用disallow，可以直接屏蔽掉images这个文件夹；还有个方法是屏蔽图片的后缀名，像jpg gif等。
还有一些特殊情况，比如说限制网页快照，很多搜索引擎都提供一个网页快照的功能，但是网页快照功能却有很多的弊端，例如内容在网页快照中更新不及时，索引网页快照浪费大量的服务器资源等。因此有些时候可能并不需要搜索引擎来索引我们某个页面的网页快照。
办法很简单，就是在head区域中加上一点代码，拿百度为例吧。
<meta name="Baiduspider" content="noarchive">
这段代码就可以禁止搜索引擎为你的网站建立快照。
还有一种是禁止搜索引擎抓取一个页面。
在SEO中，禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。那样的话，我们就要用到这样的代码：
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
META NAME="ROBOTS" ，这一小段是限制所有的搜索引擎的。我们也可以单独限制某个搜索引擎。例如：
META NAME="Googlebot"和META NAME="Baiduspide"。
CONTENT= 这一小段的内容有4个命令。index、noindex、follow、nofollow 这些命令之间一定要以英文逗号隔开。这4个命令的具体意思是：
INDEX命令：告诉搜索引擎抓取这个页面。
FOLLOW命令：告诉搜索引擎可以从这个页面上找到链接，然后继续访问抓取下去。
NOINDEX命令：告诉搜索引擎不允许抓取这个页面。
NOFOLLOW命令：告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
用以上的方法就可以控制搜索引擎访问或者收录你的页面了。

SEO,如何掌控搜索引擎最佳优化

底部导航

积分管理

关于我们