SEO私馆
问题咨询、疑难诊断、优化运营、培训教学

robots.txt协议文件设置教程

robots.txt协议文件设置教程

我们在建设运营网站时,有很多文件和路径是要对搜索引擎屏蔽的,其中的原因有安全风险、隐私保护、资源浪费等等,这个时候就需要用到robots.txt,这是全球所有搜索引擎都支持的协议文件,也是SEO优化必不可缺的重要环节。

什么是robots文件?

robots是网络默认的爬虫协议,诞生于互联网初期便于搜索引擎蜘蛛快速识别网站内容的结构和信息,随着各类网络爬虫的发展,现如今的robots已经是默认遵循的爬虫协议,robots协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私,但是理论上不遵守robots协议的网络爬虫都属于违规行为。

Robots是站点与spider沟通的重要渠道,站点通过robots文件声明本网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

robots.txt文件放在哪里?

robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如 http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果 Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。

网站 URL

相应的 robots.txt URL

https://www.seosiguan.com/

https://www.seosiguan.com/robots.txt

http://www.seosiguan.com/:80/

http://www.seosiguan.com/:80/robots.txt

https://www.seosiguan.com/:443/

https://www.seosiguan.com/:443/robots.txt

http://www.seosiguan.com/

http://www.seosiguan.com/robots.txt

robots.txt文件的格式

 robots文件往往放置于根目录下,包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

"<field>:<optional space><value><optionalspace>"

 在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:

User-agent:该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。"Disallow:"说明允许robot访问该网站的所有url,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。

Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL 是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url。

"*" 匹配0或多个任意字符

"$" 匹配行结束符。

以上为百度搜索官方给出的robots讲解示例,也基本使用所有搜索引擎的robots设置规范。

但是我们在使用robots时要注意避免设置失误导致网站负面情况,在设置禁止抓取文件路径和页面URL地址时一定要准确,不建议用泛路径字母,比如:ABC*、*CBA、A*B*C,除非已经仔细整理了网站所有文件路径名称和页面URL地址,为了保密安全隐私文件路径名称,单独设置禁止抓取。

网站设置keywords关键字的技巧方法

理论上网站是要keywords值的关键字,但是实际作用已经不大,只能作为定位属性,如果不设置最好是删除<meta name="Keywords" content="...

花瓣搜索引擎提交网站收录教程说明

我们做SEO优化的核心要素之一就是先到先得,作为国内潜力很大的华为搜索引擎(花瓣)也已经有了网站后台管理了,下面说教程。打开花瓣站长后台地址https://webmaster.petalsearch....

OG标签协议的网站SEO使用方法

OG协议(开放内容协议)用最简单的理解就是一种网络识别协议,我们通常叫法是OG标签,常用于网站meta头部,让搜索引擎和外部其他网站平台进行结构化识别我们网站的内容信息。一、什么是Open Graph...

网站设置description描述的技巧方法

由于description描述可以在搜索引擎中展示出来,而且可以设置的字数也够长,这就让description描述非常重要,对SEO优化来说仅次于title标题,如果使用得当可以提升关键字和长尾词数量...

SEO博客一站式分享解答SEO技巧思路的教程网站

本站以个人博客形式(SEO私馆),由国内多名SEO从业者共同组建,记录SEO优化技巧及思路的心得,以教程的方式进行分享,纯字原创为主,主要提供SEO新人和有经验的SEO人员参考学习,形成互相学习、交...

什么是OG(标签)协议?

OG协议全称开放内容图谱协议,英名称Open Graph Protocol,用于网站准确标注内容的信息和机构,适合社媒属性平台的分享显示,目前也已经被大部分搜索引擎默认支持。OG协议可以用于网站内容...

SEO课教程有什么区别,去上哪种培训课

很多SEO人员喜欢到处查询SEO的资料学习,也有不少掉进SEO培训公司的坑里,分不清什么是SEO课和SEO教程。搞清楚课教程的区别,根据自己的需要和SEO知识基础选择。什么是SEO课呢SEO课...

深圳坪山网站建设公司高港区网站优化关键词任县网站优化推广冷门行业网站优化韶关网站竞价优化外包武汉网站域名优化家用电器网站优化多少钱北京市网站排名优化横沥电子网站优化什么价格塔城网站优化推广黄山网站排名优化代理哈尔滨网站优化公司 鹊起科技调兵山优化网站推广亳州企业网站优化哪家价格便宜成都哪个网站优化最好佛山首页网站关键词优化费用长春电商网站优化咨询热线网站快速优化去联火30星网站制作百度优化保定正规的网站优化seo铜川网站优化保定网站搜索优化排名要多少钱香洲区网站优化排名蒙自网站优化乌海海南外贸网站优化阳春网站优化seo上饶网络推广网站优化优化网站就选a火20星大冶网站优化推广优化软件 网站网站站长如何优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化