批量检测帝国cms死链,并提取出来提交百度(适用于任何网站)

我们在网站被黑或者网站大改版后,会产生大量的死链。其中被黑基本是在织梦站点,这时站长会选择转移到帝国cms平台,但百度已经收录的死链和恶意链接还要清除,这时我们怎么办呢。

如果只有几篇链接还好,如果有数万的死链,我们一个一个的手工收集显然不现实,时间成本太高。

其实我们也可以用工具来解决,下面帝国cms大学来跟大家分享一下批量清楚死链的步骤。

我们这里需要用到的工具是Xenu 1.3.8版本软件,该软件用于批量检测网页内链接的状态,我们以此来检测网站链接是否为死链。

首先我们打开软件,然后点击 文件 - 检查网址,填入以下链接。之所以用以下地址是可以减少链接查询时间和内容。(请把www.cmsdx.com换成你的网址)

http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Awww.cmsdx.com

在包含以此开头的网址,我们输入需要检测的域名,也就是www.cmsdx.com,填写完成后点“开始检查”

QQ图片20160321105847.jpg

检测完成后,会弹出通知,是否查看报告,这时我们就看到结果了。

QQ图片20160321110210.jpg

列表中显示的链接的状态,其中“not found”状态就是404,这些也就是网站的死链。

接下来我们点文件 - 导出以制表符分割txt文件...

这样我们就得到了一个文件列表,但数据非常多,也很乱。我们需要把死链网址提取出来。

这里就有很多方法了。提取出来的文件内容如下(我们只展示一部分):

QQ图片20160321111401.jpg

其中记录了链接状态,有200、404

接下来我们可以用正则提取出404链接,正则如下:

http:\/\/www.cmsdx.com(.*?)[^\s]*404

接下来我们在正则工具中测试一下。

QQ图片20160321111937.jpg

下面我们可以愉快的去百度做死链提交了。

软件下载链接: http://pan.baidu.com/s/1slilnkT 密码: 1uqp

Tags: 死链
cms大学,为帝国cms用户提供动力
Copyright © 2016 CmsDX.com All Rights Reserved.