美国主机Lunarpages

Mediawiki中文技术论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 5337|回复: 1

MediaWiki百度收录的问题

[复制链接]
发表于 2011-6-7 14:52:42 | 显示全部楼层 |阅读模式
RAKsmart美国服务器
当用MediaWiki做网站几年时间,一直去关注搜索引擎对这些网站的收录的时候,就可以看出Google对MediaWiki平台做的网站收录很正常,而百度就不理想,特别是在收录的初始阶段。
  甚至Wiki网站会有收录错了内容、收录错到其它网站的情况,而且很长时间难以纠正过来。
  另外百度对UTF-8编码的支持不好,搜索页面中网址都是乱码,而Google、Yahoo都可以看到正常的汉字。
  百度对MediaWiki收录的页面让人莫名其妙,例如收录了好多“链出更新”的无用页面,还有内容很少的“QC”、“QC talk”等页面,可以自己编辑一个robots.txt文件,把这些网址屏蔽起来,顺便把用户页面、用户对话页也屏蔽起来:
User-agent: *
Disallow: /Special:Recentchangeslinked/*
Disallow: /User:*
Disallow: /User_talk:*
Disallow: /QC:*
Disallow: /QC_talk:*
还在LocalSettings.php中也设置了屏蔽这几个Namespace:
$wgNamespaceRobotPolicies = array(
NS_USER => 'noindex' ,
NS_USER_TALK => 'noindex' ,
NS_QC => 'noindex' ,
NS_QC_TALK => 'noindex' ,
NS_DATA => 'noindex' ,
NS_DATA_TALK => 'noindex' ,
NS_TASK => 'noindex' ,
NS_TASK_TALK => 'noindex' ,
NS_TALK => 'nofollow' );
还有更重要的,目前百度对“人工搜索”这个网站的收录更新极慢,一周之内的新收录页面都没有,而谷歌是每天都新收录好多,这可能是我们网站在不同的搜索引擎中权重不同,似乎没有捷径好走,只有等百度自己逐步去调整。
回复

使用道具 举报

发表于 2011-6-20 23:22:50 | 显示全部楼层
美国主机侦探
谢谢老大指导。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

BlueHost美国主机优惠码

Archiver|手机版|小黑屋|Mediawiki中文技术论坛

GMT+8, 2024-11-24 20:35 , Processed in 0.039698 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2024, Tencent Cloud.

快速回复 返回顶部 返回列表