问题场景:
robots.txt 文件的参数配置详细说明
凯铧互联小编回复:

| 参数 | 说明 |
|---|---|
| User-agent:* | 搜索引擎的种类。其*代表所有的搜索引擎种类,是一个通配符。这种表示网站容许所有的搜索引擎收录 |
| Disallow: /admin/ | 禁止爬取 admin 目录下面的目录。 |
| Disallow: /require/ | 禁止爬取 require 目录下面的目录。 |
| Disallow: /ABC/ | 禁止爬取 ABC 目录下面的目录。 |
| Disallow: /cgi-bin/*.htm | 禁止访问/cgi-bin/目录下的所有以.htm为后缀的 URL(包含子目录)。 |
| Disallow: /? | 禁止访问网站中所有包含问号(?)的网址。 |
| Disallow: /.jpg$ | 禁止抓取网页所有.jpg格式的图片。 |
| Disallow:/ab/adc.html | 禁止爬取 ab 目录下面的adc.html文件。 |
| Allow: /cgi-bin/ | 允许爬取 cgi-bin 目录下面的目录。 |
| Allow: /tmp | 允许爬取 tmp 整个目录。 |
| Allow: .htm$ | 仅允许访问以.htm为后缀的 URL。 |
| Allow: .gif$ | 允许抓取网页和.gif格式图片。 |
| Sitemap | 网站地图,告诉爬虫这个页面是网站地图。sitemap.xml是google网站地图;sitemap.html是百度网站地图。需要单独制作 |
今天的分享就到这里啦,若您需要帮助可以直接扫描添加联系上方我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。

为什么选择我们:北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云,腾讯云,百度云,金山云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案。总部设在北京,并在内蒙设有办事处。做为一家综合性方案商,凯铧互联向各行业用户提供基于云计算的各种解决方案。为用户获得优质服务的同时,秉承"专业规划、周到服务"的服务理念,根据用户的实际情况,充分考虑各种网络资源的特点及功效,为用户量身定做一套适合于其实际应用需求的网络应用方案。帮助用户利用互联网的力量展开新的营销方式,并大大缩短了项目实施周期,获得用户的一致好评。
凯铧互联专属服务:阿里云代理商凯铧互联为每一个用户提供专属网络架构服务,提供7x24一对一技术服务,远程协助等。同时还能提供阿里云服务器ECS、阿里云CDN等产品等的专属折扣优惠购买,让用户能够便捷、更省的上云。如果您需要详细的为您的企业选择最适合自己的服务器配置类型,请您联系客服,专业人员为您提供服务,同时还能获得更多的优惠折扣,电话专线:136-5130-9831,QQ:3398234753。


阿里云代理商凯铧互联提供阿里云服务器,云服务器解决方案,万网虚拟主机,阿里云邮箱,云数据库RDS,对象存储OSS,负载均衡,CDN、云盾安全,DDOS高防IP等产品的全国代买服务,直属会员+双重售后服务+更多优惠政策。