今天改了博客一些版块的伪静态规则,一些页面的地址发生了变化。
如果百度已经收录的网站,会出现搜索结果打不开或者错误 404 的问题,我们可以在百度提交一下网站改版。
登录百度搜索资源平台(原百度站长工具),找到“优化与维护”下的“网站改版”。
今天主要讲一下“规则改版”,我搞了半天才整明白,一开始老是提示“第一对旧URL 第二对旧URL 第三对旧URL url校验不通过”,我也是郁闷了半天。
举个例子:
我之前的网址是:https://www.w3h5.com/date/2020-4-6/
修改后是:https://www.w3h5.com/date/2020-4-6.html
我这样提交的,date/([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})/
每一个括号对应后面新 URL 的 $
:date/${1}-${2}-${3}.html
可以正常提交。
但是最终还是校验失败,提示“正则格式不正确”,我针对此问题进行了反馈,百度官方说是把 date 也换成正则的形式。
其实原因并不在此,需要使用百度官方提供的格式进行提交。参考:平台工具使用帮助_网站改版
正则必须使用:(\d+)
或者 (\w+)
这样的匹配符号。
(\d+)
表示纯数字字符串,(\w+)
表示字母数字下划线组成的字符串。
于是我改成下面这样,就可以提交成功了:
改版前规则:date/(\d+)-(\d+)-(\d+)/
改版后规则:date/${1}-${2}-${3}.html
因为有部分改版前旧链接抓取失败,这里提示的是“部分改版中”。
注意:
1. 改版规则中的新旧链接一定要使用301的方式进行跳转。
2. 百度搜索资源平台对改版规则的校验时间范围为0.5——2小时,改版生效时间范围为12——48小时,整体来看,您从提交改版规则到线上生效,最短12.5小时,最长50小时。
更多规则可以参考我的这篇文章:一些Apache环境常用的.htaccess伪静态规则范例