时间:2010-07-04 20:46
过年放假,空余时间相较平时来的多了些,谋划着想写一些东西自动采集软件,也算是自己思路的一种整理和记录。于是有了《闲话搜索引擎优化(seo)》系列。
草拟完提纲,zblog自动更新《闲话搜索引擎优化(seo)》的开篇写了一半的时候,损友发来一篇旧文:seo讲座之关键字布局、密度、相关性及转换。丘仕达的这篇文章较早的时候就已拜读过,对他的一些观点有一些不同的看法。于是停笔站群系统,暂停《闲话搜索引擎优化(seo)》开篇的写作,关键词优化软件写下了这篇《关于关键词(字)布局-闲话搜索引擎优化(seo)》
seo讲座之关键字布局、密度、相关性及转换一文中对于关键字布局提到:
1,关键字布局简单的说,就是关键字在页面中出现在那些位置
2,丘仕达比较喜欢集中布局+分散布局的混合方式
3,均匀的分布关键字,合理的增加关键字
4,顶部和页面左上方集中出现关键字,对搜索引擎优化(seo)的效果比较好
在提我的观点前,有一本书是不可不提的。科学出版社2004出版的《搜索引擎-原理、技术与系统》。做搜索引擎优化(seo)的zblog自动采集,此书不可不看。而我的观点或者说《闲话搜索引擎优化(seo)》更多的将是从搜索引擎的工作原理上来阐述。
回到关键词(字)布局的问题,帝国CMS自动采集搜索引擎的spider或者说crawler将某一页面抓取后(这之前,之中,之后的工作将会在《闲话搜索引擎优化(seo)》系列中一一阐述帝国站群,建议首先阅读《搜索引擎-原理、技术与系统》一书),DEDE自动更新进行页面分析、索引,索引的内容并不仅仅只是简单的将html代码过滤后的数据。搜索引擎有一个内容提取的动作(《闲话搜索引擎优化(seo)》系列中另有文章详细阐述)。简单来说就是要知道该页面主要说的是什么,提取出主要内容帝国CMS自动更新,这里面会去除导航链接,站群管理系统广告,版权信息等等对某一站点来说比较通用的内容,或者说是页面分析过程中的噪音。(不排除搜索引擎会针对站点首页做比较特殊的处理动易站群,因为多数站点的首页是链接的海洋)
而关键词(字)布局是指将我们的关键词(字)尽可能的出现在页面分析,动易自动采集去除噪音后的主要内容中,避免因为内容提取后关键词(字)被过滤而造成损失。我的建议是:每个页面中都要有一段文字内容,该段内容离链接尽可能的远。
有意思的是,我对丘仕达的chinaseo首页做了内容提取后得到的,只有一行字:“seo工具、seo教程下载请点击这里”(个人工具的个人测试行为……)
DEDE自动采集,