时间:2010-06-18 23:46
张栋伟
一技术篇
1图片链接
调用图片有个特别的属性就是替换文本属性标签,他可以将某一个图片的alt标签内的信息替换为文本信息,如果这个图片在网页上显示不出来,在该图片的位置会出现替换文本的信息。图片的alt标签原本是考虑到残障人士(如盲人)的访问网页而准备的,他们在浏览网页的时候很难获取图片上的文字信息,只能通过alt标签替换文本的描述来了解图片内容。而现在搜索引擎会把alt标签的内容纳入整个页面的文本分析,所以建议在填写图片alt标签部分的内容时要灵活地在描述中布置合适的关键词。
2js的链接
由于js的内容不能被大多数主流搜索引擎检索,所以做网站的seo时一般强调导航菜单等重要的代码部分尽量不使用js。如果大面积的链接都使用js,无疑将大大降低搜索引擎抓取收录的机会。采用javascript技术的网页往往在页面一开始就堆积大量java代码,以致meta及关键词迟迟不能出现,对搜索引擎很不友好。虽然把html代码封装到js文件里是给网页减肥的最佳办法之一。但是在seo工作中有可能成为最糟糕的办法之一。在实际操作中如果网站的内部链接正好封装在js文件中,那么搜索引擎可能永远都不能收录到你的网页。
3链接相关性
内部链接的相关性是相对于外部链接的相关性而言的。但是他们本身在原理上并没有什么大的区别。也就是说一个网站的构建需要按内容相关性去分类栏目,使同一个栏目下的内容相链接。例如一个构建音乐网站的栏目分类,然后按每个歌星去建立主题栏目。周杰伦相关的新闻就不能和陈奕迅的相关新闻安排在同一个栏目下。很多大型新闻网站也都是这么构建的,例如新浪网。
(图8-1)新浪网明星全接触栏目按明星名字进行分类
二思路篇
1首页链接入口
首页是一个网站的门面,也是爬虫程序最常光顾的页面。而且从另一种角度上讲首页就是一张网站地图。尤其对一些分类比较复杂的网站,首页上链接起着通向内页和栏目页的纽带。所以合理设计首页网站日后能被搜索引擎大量收录的一项重要任务。
(图8-2)阿里巴巴网站右侧产品列表就巧妙的利用了这点,实现了首页与热门产品页的链接。
2面包屑导航
关于面包屑还有个童话故事。很久很久以前,在大森林的边上住着一个贫穷的樵夫,他妻子和两个孩子与他相依为命。他的儿子名叫汉赛尔,女儿名叫格莱特。后来樵夫的妻子去世了,他又给孩子们娶了一个后母。后母计划把两个孩子带到森林的深处,然后趁他们睡着的时候跑掉。汉赛尔无意中知道了后母的计划,于是偷偷地把一块面包藏在了口袋里。在去森林的路上,汉赛尔悄悄地捏碎了他的面包,并不时地停下脚步,把碎面包屑撒在路上。后母顺利地趁孩子们睡着的时候溜掉了,汉赛尔和格莱特醒来已是一片漆黑。汉赛尔安慰他的妹妹说:“等太阳一出来,我们就看得见我撒在地上的面包屑了,它一定会指给我们回家的路。”但是当太阳升起来时,他们在地上却怎么也找不到一点面包屑了,原来它们都被那些在树林里、田野上飞来飞去的鸟儿一点点地啄食了。
这是《格林童话》中所描述的与面包屑有关的故事。不知道从哪一天开始,汉赛尔的面包屑开始悄悄地出现在某个网站的导航位置上,然后迅速地撒遍了全世界,变成了今天大家所熟知的“面包屑导航”。
在童话里,面包屑是汉赛尔在进入森林的路中偷偷撒下的,这是一种“历史记录”的应用方式,目的是帮助你追溯来路,因而它应该是一种线性的导航方式。不过在网页的应用中,“追溯来路”这件事浏览器已经做得足够好了,所以“面包屑”慢慢地就变成用来表达内容归属关系的界面元素,也就是我们经常看到的“主分类>一级分类>二级分类>三级分类>……>最终内容页面”这样的方式。但是一般正常的来讲目录结构由3层结构组成。分别是首页>栏目页>内容页。合理的构建目录结构可以让用户随时随地的找到自己所在的位置又能保证栏目分类后的各个栏目的权重不至于太分散。同时在许多关于网站用户使用体验的调查报告中也得出超过3次点击访客还没有找到需要的信息,访客就很大的可能性会离开网站。所以,3层目录结构也是浏览体验的需要。
3与用户换位思考
与浏览者换位思考从某种程度上也是体现内部链接相关性的一种操作方式。
(8-3)右侧的链接列表的安排方便了浏览者,又在内部链接建立了相关性。
这样的网页链接设计会使浏览者就像冲浪一样,一页一页的浏览下去,直到找到需要的产品信息。
4pr值的传递
前几章谈论了pr值的意义,这里不再阐述。只要有好的网站整体结构,整个网站的pr传递应该是很均匀的,首页最高,栏目页次之,内容页再次。但有的时候可以通过网页的链接影响pr和重要性的传递,使某一页或某几页的pr值和重要性升高,这几页也是你重点要推广的网页,例如在首页上将某条信息长期置顶。在搜索引擎优化的过程中每个seo工作者应该产生这样pr传递的意识。
5主题的返还归一
在一个网站中内部链接就像人类的血管,而每个网页在同一个搜索引擎中的排名的位置和权重就像人类的血液。一个简单的网站的首页往往就像人类的心脏,从首页传递给每一级栏目页的权重,然后又由栏目页把权重传递给内容页,最后又由内容页传递给首页。这样正好产生了一个网站内部权重传递的回路。在此供读者思考一下,网站不同种类的页面的比例。首页在一个网站内只有一个,栏目页一般是若干个,内容页往往是栏目页数量的几倍甚至几十倍。结合前面讲过的面包屑导航,我们就不难看出一个栏目页由本栏目下的内容页推荐投票产生排名权重,而一个网站的首页是由全网站所有内容页推荐投票和所有栏目页推荐投票共同产生的排名权重。这也就是为什么我们在搜索引擎里搜索一下热门关键字返回的自然排名列表内一般都是某某网站的首页的原因。同时前面讲到的网站页面收录量多少的问题也是为了现在能够有多少为首页推荐投票奠定基础。本小节是全书重要的seo工作指导思想,请读者仔细领会。
三高级篇
1链接安全性
链接安全性问题在一些中小型网站普遍存在。一般主要反映在网站改版之后,新版模板与旧版模板的衔接处了。为了避免这样问题除了使用一些网站地图工具查询外,不外乎就是靠网站程序员仔细的检查和测试。除此以外你还可以建立404错误页来保证你的网站不会因外链错误导致访客浏览。更重要的是网站内部链接错误会引起搜索引擎的爬虫程序找不到你链接的网页,导致无法正常收录网页。在此介绍一款网站链接完全软件xenu是使用。
(图8-4)输入查询网址
(图8-5)xenu可以把错误的链接一一列出来。
2链接速度
链接速度同样是衡量网站可靠性的一个重要参数。缓慢的服务器速度不但影响访客浏览网站,也影响搜索引擎爬虫程序下载你的网页。每个爬行程序不但有下载数据包的大小限制外同时还有下载时钟限制。超过一定秒数无法下载完整网页,爬虫程序多数会采取放弃处理,导致你的网站页面收录数量不高,被收录页面信息不全。影响链接速度的原因基本有2点。a服务器超过承受的负载,导致打开新网页过慢。b单个网页文件过大,下载速度较慢。常用的网站修改方案可以将网站由动态页面,转向静态页面。调整服务器数据库的负载均衡等等。其中有测试表明静态化页面后,网站运行能力可以提高一倍。