王卡卡的博客

王卡卡(卡卡SEO)博客致力于介绍SEO基础知识,网站优化基础知识,医疗产品网站推广方案,结交更多SEO和推广方面的高手!
联系QQ:279112698    交流QQ群:38413058    QQ微薄:http://t.qq.com/wxj-0813 (欢迎大家收听--王卡卡)

上一篇: 王卡卡:中小企业网站策划人员应该具备的新能力 下一篇:王卡卡:怎么样稳定网站关键词排名(二)
          最近群里面好所的人新手站长开始问robots.txt是什么以及它的写法和作用等问题,很高兴他们已经意识到了robots.txt的重要作用了,下面就把我知道的一些经验和大家分享一下,希望对大家有帮助!

robots.txt的概念

        robots.txt是一个纯文本文件,必须放置在一个站点的根目录下,而且文件名必须全部小写.在robots.txt文件中可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

robots.txt的作用

        当一个搜索机器人访问一个网站时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

robots.txt的基本用法:


1.允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file

2.禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /

3.禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/

4.禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /

5.只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:

User-agent: *
Disallow: /

robots.txt的具体实例
 

1.如果下面的这两个链接的内容差不多,那么根据利于优化的原则,第一个链接我们可以屏蔽掉! 
         /XXX?123  /123.html
         如果像第一个的链接这样的链接非常多的话,其实只要屏蔽/XXX?就可以屏蔽所有的链接了。      
         具体代码如下:Disallow: /XXX?

2.用robots.txt屏蔽多余的链接,一般保留静态的链接(HTML、htm、shtml等)
  由于网站中经常会出现多个链接指向同一个页面的情况,而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况,我们就可以通过robots.txt把非主要的链接去掉。
  比如以下两个链接指向同样的页面:  /OOO?123  /123.html
  那么根据利于优化的原则,第一个链接我们可以屏蔽掉.
        代码如下:  Disallow: /OOO?123

3.用robots.txt屏蔽死链
  死链就是曾经存在的网页,因为改版或其他原因而失去效用后就变成死链,也就是说看似一个正常的网页链接,但点击后不能打开相对应的网页页面。
       比如,原来在目录为/kakaseo下的所有链接,因为目录地址的改变,现在都变成死链接了,那么我们可以用robots.txt把它屏蔽掉。
       代码如下:Disallow: /seo/

4.告诉搜索引擎你的sitemap.xml地址
   利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址,而不需要在网站上添加sitemap.xml的链接。
         以本人博客为例代码如下:Sitemap: http://www.kakaseo.com/sitemap.xml 

        以上说明了robots.txt的概念、基本写法,具体实例,希望你的网站可以有一个好的robots.txt,因为robots.txt是搜索引擎了解你网站的一个非常重要的途径。

        以上的一些关于robots.txt的看法纯属个人观点,如果您觉得有一定道理或者有更好的建议和意见,欢迎大家一起交流,QQ:279112698,QQ群:38413058。如果您觉得纯属扯淡,那么就一笑而过吧,不要拍砖,手下留情啊!最后还是希望能够得到和各位高手交流的机会![文章原创,转载请注明出处 (王卡卡 www.kakaseo.com )! 在这里强烈的鄙视盗用文章的人,最可恨的是把版权改成他自己的人] 

点击这里获取该日志的TrackBack引用地址

  • Gravatar Icon
    回复
  • quote 1.珠海SEO2010-8-9 23:27:35
  • 刚做站,正在寻找有关robots.txt的操作,谢谢老兄!
    卡卡SEO 于 2010-8-10 9:39:54 回复
    希望对你的网站有帮助!
  • Gravatar Icon
    回复
  • quote 2.长沙网络推广2010-9-6 14:33:34
  • 很全很具体,我拿过去试试。

发表评论:

◎欢迎大家参与讨论并发表您的看法和观点,具体联系作者方式见网站底部版权!

关于本文

您正在阅读的是:王卡卡:最全robots.txt基本用法和具体实例
卡卡SEO 发表于:2010-8-7 16:46:54
分类:SEO基础知识
关键词:robots.txt  王卡卡  卡卡SEO  西安SEO  

王卡卡简介

     拥有4年个人站长经历和3年的SEO行业经验,擅长于中小企业网站搜索引擎优化(SEO)和搜索引擎营销(SEM)、网站推广以及网络品牌的维护。对医疗产品网站的的关键词和整站优化积累了一定的经验,希望能和各位SEO、推广高手一起交流学习!

博客作者

王卡卡

王卡卡最近发表

最新评论及回复

最近留言

王卡卡博客控制面板

王卡卡博客站内搜索

王卡卡博客文章分类

王卡卡博客文章归档

王卡卡博客图标汇集

  • RainbowSoft Studio Z-Blog
  • 本站支持WAP访问
  • 订阅本站的 RSS 2.0 新闻聚合

Copyright © 2009 www.kakaseo.com Inc. All Rights Reserved. 王卡卡(卡卡SEO)
陕ICP备09015573号,如需转载请注明文章来源!版权所有,违者必究!
联系QQ:279112698  联系邮箱:kakaseo@kakaseo.com  QQ微薄:http://t.qq.com/wxj-0813  欢迎大家收听--王卡卡

Powered By Z-Blog 1.8 Arwen Build 90619 Code detection by Codefense Template Designed By houbenbo