3、进阶优化:重复内容
在你完成了基础技术优化之后,你会发现余下的将是一件很简单的事情:重复内容。WordPress本身自带了几种不同的归类方法:
1、按时间归类
2、按分类归类
3、按Tag归类
所以,这看起来好像你必须从首页开始一页一页的翻看,然后再回到第一页,还有,每一个作者都有一个存档在author/< author-name>/目录,从而导致内容的重复。(译者注:本段非直译)
从根本上讲就意味着,最坏的情况类似这样,一篇相同的文章出现在5个不同的单独页面上。我们必须要解决这个问题,同时,允许搜索引擎爬行这些内容,但是不被检索,并且改变一下翻页的习惯。
3.1、Noindex,follow archive pages
安装我写的插件robots meta plugin,然后设置插件,阻止一切存档页面,让它们不被检索,如下图:

这时候,搜索引擎将会依照这些存档页面的设置进行检索,但是不会让这些内容出现在检索结果中。可能不是所有人都这么认为,并且有人可能会告诉你,在存档页面可以只显示一个摘要就可以了,其实这样也可以,不过我的观点会比他们的都奏效。
3.2、禁用不必要的存档页面
如果你的Blog仅仅只有你一个作者,或者你认为你不需要一个作者存档页面,用上述插件robots meta plugin禁用作者存档页面,同时,如果你觉得你不需要一个按日期存档的页面,那么,也把它禁用掉,甚至,如果你所用的主题不用这些存档页面,而有的人可能会链接到这些页面,从而打乱你的WordPress SEO效果。
3.3、关于WordPress的翻页
第3点就是,你要知道,只要搜索引擎机器人爬行到一个分类页面,它要找到这个页面下的所有其它的页面是没有任何问题的,要不然,如果你的某个分类中有很多的文章,那么,机器人在找到较早的文章之前,可能不得不翻页10次。
这里有一个简单的办法,来调整WordPress的翻页功能,Jaimie Sirovich写了一个插件,名为Pagerfix,让你的WordPress翻页看起来像下图这样:

要达到这样的效果,首先你需要安装这个插件,然后修改你所用主题的index.php,找到如下代码(友情提示:本文中涉及代码的地方,在每个“ < ”标记之后都加了一个空格,使用的时候请去掉这些空格)
< div class=”navigation”>
< div class=”alignleft”>
< ?php next_posts_link(’? Older Entries’) ?>
< /div>
< div class=”alignright”>
< ?php previous_posts_link(’Newer Entries ?’) ?>
< /div>
< /div>
然后把这段代码修改为
< div class=”navigation”>
< ?php
pager_fix(” “,” “,” “,”? Previous page”,”Next Page ?”,”strong”);
?>
< /div>
按照上面的方法修改你所用主题的其它诸如archives.php等存档页面。
3.4、Nofollowing unnecessary links
另一个简单的提升WordPress SEO效果的办法就是,不要把登录、注册链接放在你的Blog的每一个页面上,订阅链接也一样,上面提到的robots meta plugin插件有一个选项,可以很轻松地把你的注册、登录链接检索给禁用掉,但是订阅链接的话,你就需要手动修改robots.txt了。
译者注:只需要在你的robots.txt中添加如下信息就可以了
User-agent: *
Disallow: /feed/
此节翻译的时候涉及到很多的专业术语,无法直译,所以并没有翻译,看看文章就可以理解这些专业术语了,另外有可能此节翻译得不够到位,不过不会有错误和遗漏的地。
学习了,支持!
写得很详细啊
学习好文章了
看了你的文章很受教,我正在学习SEO,谢谢
也准备用WP建立一个博客 现在对WP还不是很懂正在学习中 文章很实用
独木你好,感谢你的迅速回复.
我使用了你文中说的那个插件,robots的插件. 然后发现了一个有意思的问题,使用上以后,查看我的页面源码,所有的侧栏标题都成了H2级别的了,不用时候的源码正常,这个有没有办法修正呢,用了这个插件后源码多了一倍还多,也不知道该怎么搞.
另外加不加www的问题,是不是加不加都可以,只要用一个就行了? 我申请了个免费的域名,还必须加上,不加的话就不知道跳哪里去了..不知道咋回事.
2、Google sitemap生成的2个地图文件是一样的文件不用理,而阻止某些不希望被抓取的页面是靠robots.txt实现的
3、关于H 标签要有级别概念,根据你认为的重要性排序来使用而不滥用,比如我博客的侧栏中最新文章使用了H3 就是一种浪费(该去掉的);我曾尝试在文章页面在标题上使用H1,目的是突出独立文章页面的权重也有一定的效果,但是H1标签尽量避免重复使用,那是最高级别
4、super cache是解决被访问页面频繁调用数据库的插件,与作弊无关
5、右上角有RSS FEED,文章底端也有收藏书签
另外一家之言不足全信,多实践积累经验、多学习是最佳途径
啊.第3个问题可能代码屏蔽掉了…
就是关于标题级别H 1 和H 2 的问题.我的模板除了博客标题是H 1其余都是H 2,该怎么处理呢,是不是博客标题和 文章标题都弄成H 1? 两个H 1行吗
非常感谢你的回复解答,而且非常快.
这几天我一直在按照你的这个文章介绍的在一步步的做,只是还有些不明白的地方,向你请教一下.问题有点多哦 呵呵.
1. 优化的第3部分(进阶优化及: 重复内容 ),这个看起来确实很多页面重复,你帮我推荐个最终方案吧,比如就使用那个插件(robots meta plugin,),或者还需要其他方法配合吗,还有这个插件和robots.txt 会不会矛盾,robots.txt这个文件我查了一下,说法大概有上百种,你能帮我推荐一个吗,我就按照你说的写.我想做一个autoblog,想尽量做好seo.我现在好多方法都看糊涂了,你帮我拿个最后的主意吧,呵呵.
2. 有个东西不太理解,Google sitemap这个插件生成的2个地图文件为什么要阻止机器人抓取呢,还添加到robots.txt里面,不理解…
3. 关于的问题,你在2.2标题级别里面是不是说要有2个标签呢,我看我的模板里面处了博客名字剩下都是,这个该怎么处理呢?
4. 我知道有个super cache 的插件,我那自动博客刚弄,估计也没几个IP,这个插件到底用不用呢,有什么弊端吗
5. 问题有点多啊 呵呵. 现在这个问题是你的博客的邮件订阅在哪里呢,我只找到rss,可是rss我一般不怎么注意,还是邮件看的及时.呵呵.
麻烦详细给解答一下啊,我要按照你说的操作呢.O(∩_∩)O~
关于收录的问题,我相信应该独立页面也会被收录进去的,只是页面权重不高而已。关于收录问题,给SE提供ROBOTS.txt和Sitemap.xml是十分必要的,建议你每个博客都要安装google sitemap插件,效果会好狠多
第三个问题,我没有认真比较过,而且我现在根本就不用那些插件了
发现你的博客最近打开非常困难,非常慢,是什么原因呢, 关于你写的东西有写东西想请教下 呵呵
就是你上面3.1提到的那个插件.我记得原来我 有个新站,垃圾站哈,谷歌收录的都是分类和标签下的文章,单独的文章收录很少,你的意思是让SE只收录单独的文章页是吗,这样会不会影响索引呢,这个我不太明白,麻烦多讲讲吧 呵呵.
还有一个 headspace2 和另一个插件
platinum ,这两个插件是不是差不多呢,该如何选择呢
多谢分享
[...] 主题优化 [...]
欢迎转载,不过要保留链接哦
网站文章都很不错啊.我可以转载一下文章吗?元旦将至。祝福大家元旦快乐
好,多交流
博客弄得很不错啊 wordpress过来的,,有机会交流一下,,我是英文SEO
哈哈,把原译者给勾引来了,多谢提醒标题已改,希望能看到你博客上更多精彩翻译的文章。
这篇文章个别小地方我也结合了原文做了点修正,谅解。
多谢支持,标题好像少了个字,呵呵~