博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
WordPress纯PHP代码实现记录搜索引擎蜘蛛爬行记录
阅读量:6575 次
发布时间:2019-06-24

本文共 1617 字,大约阅读时间需要 5 分钟。

在新站或网站收录有问题时,可能需要持续关注搜索引擎蜘蛛的抓取情况。每次打开服务器端访问日志查看非常麻烦,特别是当日志文件比较大时更是不便。最好的办法就是在线直接打开看蜘蛛爬行记录。为此,我们可以免插件使用纯PHP代码来实现这个功能,以下是具体实现代码。

// 记录蜘蛛访问记录        function get_naps_bot(){      $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);      if (strpos($useragent, 'googlebot') !== false){      return 'Googlebot';      }      if (strpos($useragent, 'bingbot') !== false){      return 'Bingbot';      }      if (strpos($useragent, 'slurp') !== false){      return 'Yahoobot';      }      if (strpos($useragent, 'baiduspider') !== false){      return 'Baiduspider';      }      if (strpos($useragent, 'sogou web spider') !== false){      return 'Sogouspider';      }      if (strpos($useragent, 'haosouspider') !== false){      return 'HaosouSpider';      }      if (strpos($useragent, 'yodaobot') !== false){      return 'YodaoBot';      }      return false;      }      function nowtime(){      date_default_timezone_set('Asia/Shanghai');      $date=date("Y-m-d G:i:s");      return $date;      }      $searchbot = get_naps_bot();     if ($searchbot) {      $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);      $url=$_SERVER['HTTP_REFERER'];     $addr=$_SERVER['REMOTE_ADDR'];     $file="robotslogs.txt";  //根目录下记录蜘蛛访问的文件    $time=nowtime();      $data=fopen($file,"a");      $PR="$_SERVER[REQUEST_URI]";      fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage \r\n");      fclose($data);      }

使用说明:将以上代码插入funtion.php文件,并在网站根目录下创建一个名为robotslogs.txt的文件即可,文件名可自定义。注意需为robotslogs.txt设置可写权限,最好是777权限,755权限某些主机配置下可能存在无法写入的情况。以上代码能记录搜索蜘蛛的基本抓取信息,但有个缺陷,目前还不能记录抓取网址时的状态,比如404、404状态码等都无法显示,有知道如何获取状态码的同学请留言教我哦!

转载地址:http://kpwno.baihongyu.com/

你可能感兴趣的文章
magento url rewrite规则
查看>>
potala(5)——Unit Test and Cache
查看>>
计算几何-Andrew法-凸包
查看>>
在java中String类为什么要设计成final
查看>>
前端框架——Jquery——基础篇7__工具函数(Utils)
查看>>
日常学习随笔-数组、单链表、双链表三种形式实现队列结构的基本操作(源码注释)...
查看>>
select 中添加option的注意
查看>>
Codeforces #369 div2 D.Directed Roads
查看>>
vijos1153猫狗大战
查看>>
炮(棋盘DP)
查看>>
改造二叉树 (长乐一中模拟赛day2T1)
查看>>
Cloud Foundry 在 Azure 中国正式发布
查看>>
transform 二维转变
查看>>
v-on指令
查看>>
[存档]xx-09210xxx-2010-ACM-ICPC竞赛总结
查看>>
万能的林萧说:我来告诉你,一个草根程序员如何进入BAT。 - 今日头条(www.toutiao.com)...
查看>>
devenv /ResetSkipPkgs
查看>>
【转载】如何使员工更敬业
查看>>
[转注自官网]Cocos2d-x Tutorial 4 - 如何放出子弹(Glede Edition for 2.0.3)
查看>>
第十一讲:集合
查看>>