Robots.txt详解 - 查问我看

转搜索引擎优化（SEO)相关整理

|-转 Robots.txt详解

PHPer 2022-04-12 1067 0 0

Robots协议（也称爬虫协议，机器人协议等）的全称是“网络爬虫排除协议”，网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。

Robots.txt的作用：

可以让蜘蛛更高效的爬行网站；

可以阻止蜘蛛爬行动态页面，从而解决重复收录的问题；

可以减少蜘蛛爬行无效页面，节省服务器带宽；

如何制作Robots.txt文件？

创建一个文本文档，重命名为Robots.txt，编写规则，用FTP把文件上传到空间；

创建robots.txt文件需要注意的问题：

必须是txt结尾的纯文本文件；

文件名所有字母必须是小写；

文件必须要放在网站根目录下；

Robots参数：

User-agent：

作用：用于描述搜索引擎蜘蛛的名字；

技巧：

1，当robots.txt不为空的时候，必须至少有一条user-agent的记录；

2，相同名字，只能有一条，但是不同的蜘蛛，可以有多条记录；

Disallow：

作用：用于描述不允许搜索引擎蜘蛛爬行和抓取的url；

使用技巧：

在robots.txt中至少要有一条disallow；

Disallow记录为空，则表示网站所有页面都允许被抓取；

使用disallow，每个页面必须单独分开声明； ...

浏览更多内容请先登录。 立即注册

网站建设

更新于：2022-04-12 08:03:10

您需要登录后才可以评论。立即注册

转 搜索引擎优化（SEO)相关整理

|-转 Robots.txt详解

7

1222

137w+

229

服务器搭建

WEB

个人爱好

游戏

linux

互联网

操作系统

mysql

Python

Yii2

php

WEB后端

网站建设

采集

WEB前端

Centos

经济

工具

生活

内容整理

数据库

资源

OS

电影

JS

常用命令

保险

php项目

问题整理

IT

网站

魔兽世界

composer

NodeJs

观点

AI

欧美电影

Yii扩展

美女

学习

LAMP

全文索引

Apache

前端

发现

Windows

Android

影评

服务器维护

国产电影

uwow

PHP框架

邮件服务器

评测

随笔

服务器

音乐

历史

推荐内容

转搜索引擎优化（SEO)相关整理