时间:2010-04-28 23:37
第一章认知搜索引擎一:你心中的搜索引擎是什么样子?
搜索引擎已经走入了网民的生活,每天只要你上网,那么或多或少的都会接触到它。也许是被动的,比114;或者是主动的,比如你使用了百度、雅虎、谷歌或者是连带的,比如你用了msn,里面有livesearch的整合。那么每天和我们频繁发生的搜索引擎在你心中到底映像成什么呢?
这个问题也许很愚笨,至少我还有找到合适的物品来形容它,但如果把它比作异性,那么可能是对极了。让你又爱又恨,但又不能离开。一旦离开,那么就是这个搜索引擎被另一个有姿色的新人给代替了,这就是搜索引擎在我们生活的意义。而作为一个搜索引擎的研究者,称之为于搜索谈恋爱也不为过。
每个人对于搜索引擎的看法都会不同,但它确实真真切切的走入了我们的生活。
二:搜索引擎有多少种?
通用搜索引擎,它的搜索范围是面向整个互联网的。也就是说,这些搜索引擎的web页的搜索范围非常大。企业搜索引擎,这不属于互联网范畴,因为它的搜索目标是企业内容的各种系统,比如crm、erp、sap等等。这些信息没有对互联网公开,但对于企业来说这些信息是非重要中的。垂直搜索,它的搜索范围是面向某一个行业的。比如求职搜索、旅游搜索、商机搜索、交友搜索等等。社会化搜索,它的搜索范围也是面向通用搜索引擎的。通过聚合一个或者多个搜索引擎的结果,以次来比对,提供给用户更为细化的搜索结果。元搜索是metasearch的翻译,这是从技术上分得,它的数据来源也是来自搜索引擎,通过提供某些功能或者与某些信息进行整合。超搜索就是超级搜索,可以把它当作社会化搜索来看。第二章网站什么时候需要搜索引擎
一:标准的网站开发流程
二:各个流程搜索引擎的作用描述
立案立案过程是一个商业目的的思考,也是一句广告语的锤炼过程。比如某网站的定位描述是“出售廉价机票”,这就是最简单的商业目的。那么我们建立一个网站的最本质目的也就如此。即便如阿里巴巴这样复杂的网站,也可以有一句话的定位“商人们的交易平台”。这个时候能够确定的就是网站的主关键词及其同义词。调研如何调研不是我们今天的话题,而是说在调研过程中不要忘记互联网调研。尤其是通过搜索引擎来调研,比如你是一家北京销售灯具的公司,正打算建立一家灯具的销售网站。那么你要明白你最主要的竞争对手就是北京及其周边地区的同样销售灯具的公司。虽然互联网已经拓展了交易的边界,这个边界是受限于你的实际商业行为及定向客户所限的;比如,你的网站是面向全国的青少年,那么你的竞争对手也就是同样行为的网站,在立案之后确定了的网站主关键词来进行调研是一定要做的事情。策划策划也是计划的意思,虽然我们不一定做的很详细,但这个过程还是不能省的。在确定了网站的定位及进行调研之后,我们要策划即符合商业定位,又有一定的特色的商业流程。(当然了,如果你能找到国外的网站,那么可以考虑使用,会节省策划的时间)。在这时候我们可能用网站群、网站、二级域名、目录来规划整个商业行为。每个节点都是一个大的或者小的商业行为的描述。比如阿里巴巴,它的china.alibaba.com是中国站,而china.alibaba.com/buy则是一个买东西的商业目录。虽然在网站建立的初期做不到这么多,只能实现一个基本的功能。比如视频网站,开始最先实现的功能必然是播放功能。但我们一定要意识到这种规划未来会带给我们什么样的后果。这个世界就是这样公平,尤其是新网站,老的网站域名、二级目录比比皆是,而新的网站作为站在巨人肩膀上看世界,可以避免很多麻烦。uiui是网站的框架页,比如首页、分类页、专题页、内容页、登陆页、管理页等核心页面的布局,对于网站的核心页面未来也是搜索引擎最为看重的点,所以他们的布局一定要有一定的取舍。不能因为商业行为而忽略互联网营销,也不能因为互联网营销而舍弃商业行为。至于排版的,我们只看一个简单的例子。很简单,十分钟就可以临摹出的最简单的产品设计。当然最后产品经理会和ui经理确认相关的细节,这里我们不在讨论。
实现实现的话题很简单,但也最难做,因为一件事情他有表面和瓤子之分。看表面都一样,看代码发现哪个更专业,事情总要做的,只是看其面作还是后面做。当你的项目经理问你,如果按照开发标准,将不能完成老板的开发时间,你的回答是什么?按照标准来,还是开发出来就行?上线上线是个简单的事情,就像纳斯达克按个电子按钮那么简单。但是如果你的宣传到位,那么第一天你的信息可能淹没搜索引擎。就如某某公司开业典礼,造成交通堵塞一样。推广当你发现别人的商业利润总比你高,你去找原因,原来是搜索引擎在进行辅助。然后你也去找搜索引擎优化专家去做。其实慢慢你会发现,他们的秘诀除了具有广大的资源优势外,另外最重要的就是为你前面的工作还债。比如立案的时候你的关键词范围太大、调研的时候选错了竞争毒手、策划的网站架构有错误、ui的排版不够合理、实现的时候不够标准或者上线的时候不够节制。如果说资源优势可以压倒一切的话,那么只是小的项目,对于一家有着40万页面以上的网站来讲,能找到4万个链接不知道要做多久。看看百度有多少个link,24万个,可能数据不够准确,但我们要反思的是link资源不是无限的。它就像一个24位的数码排列。尤其是大型网站,核心工作是维护,而不是开拓,当然也要为某方面的工作还债。三:可能是一个迭代的过程
如今的互联网,采用的都是beta开发模式。这是节省了测试费用,因为都是网民在帮你测试,但确也制造了网络垃圾或者积累相关资源。这时候最重要的就是每次跌代,无论是升级还是完全替代,一定要利用好原有的资源,而不是彻底放弃。
第三章搜索引擎的什么资源可以使用
我简单的将google的产品群列出来,后面是相关的pr值,其实我们可以把它看作节点的权值。看图你是否找到你要用的资源呢?如果你要做博客营销,不妨试试blogsearch和blogger。但正如我们介绍的搜索引擎的种类一样,搜索引擎是如此之多,你一定要查找你的网站访问量最主流的前几个搜索引擎为主。而不要妄想所有的搜索引擎都存在你的身影。全球性的搜索引擎虽然在很多国家都设置了数据中心,但你能使用的资源,也正是用户使用的习惯,哪是受语言限制的。你可能是一个语言专家,或者你可以在google的translate的帮助下初步了解一些东西,但记住,发生交易行为的用户是不会使用看不懂的语言的。如果你是一个全球性的网站群,那么可能是你的二级域名这个门页需要在哪个国家,针对哪个国家的最大搜索引擎进行优化。
看这些产品点,每个人的感悟可能不一样。有的人会想,其中的某些功能可以用,但要提醒的是每一种资源都是某个人经营了一段时间的成果,当你使用的时候、借用的时候、偷用的时候一定不要太过分。否则会遭遇人家的举报,监控者的封杀。
可能你会明白,google这样的产品群架构正是你想要的,而不是使用三级域名、四级域名的架构。当然我们更应该学习的是ebay,采用ebay.fr(法国),ebay.ca(加拿大)这样的多域名结构。无论使用哪一种,一定要它当作一个独立的产品来对待,看看它需要什么。
上面是baidu的产品图,对于百度来讲,它很奇怪因为它开放出来的接口不多。而且有自己的特点,而这正是人们努力去猜测的东西。对于百度来说我们要研究的除了它的习惯之外,还要去了解的是中国网民的访问习惯,更确切的说是中文的使用习惯。对于百度来说,目前的产品还是比较整齐的,当然瘦瘦身还是比较好的。比如movie.baidu.com,v.baidu.com等等都是一个产品。这会造成网民的误解的,确定用哪一个,其他的暂时封存起来。我们知道百度未来的产品可能像google那样复杂,所以趁早规划,未来应该会省力一些。
第四章标准的seo工作流程
一些事情看起来简单,但一当开始做的时候,每件事情做起来都有很多步骤。比如就拿seo优化来说,看看要有多少步骤的工作。
很多网站,尤其是那些已经运营了很久的大型网站,在做sem的时候不是砍砍杀杀的事情,而是慢工出细活。不做事比把错事做的很对强,尤其是sem。你了解哪个网站么,别看我画了谷歌、百度两个产品图,但还是个门外汉。当一个大的网站运营起来的时候,它的一个自动增长就像滚雪球一样,在不了解网站的架构、服务器分布情况的时候,优化内容页比优化架构更值得做;当你优化了内容页、开始优化布局的时候,是优化某一个功能的布局;当你单个功能也优化完毕的时候,开始优化架构;当这些都完成得时候,这些事情再来一遍。这就是互联网。
第五章国内部分搜索引擎的简单评测
一:目录深度
对于二级域名或者三级域名以上、或者对于子目录、二级目录或者多级目录。测试的结果最准确的不是百度、也不是搜狗、而是爱问。
a、百度存在的问题是如果其他目录的内容标题含有另一个目录的名字,则会产生干扰。
b、而搜狗存在的问题是对于子目录都无法区分,实在够逊。
建议:无论如何分列内容,是多级域名也好,还是多级目录也好。一定要减少内容的交叉。这其实也是数据库设计及数据存储的原则。说的深一点你把同一内容存入两个数据表,已经数据冗余了,那么当你以网页的形式展示出来的时候,就会对搜索引擎产生干扰。
二:网页标题
大家都知道这个在title中的东西,但百度、爱问、搜狗又有些微小的不同。
a.百度的标题是60个字节,也就是30个汉字。会自动加上来源,比如wkcow的原发内容,会自动加上wkcow的,可能是在前,也可能在后面。
b.爱问的标题是50个字节,也就是25个汉字。会自动加上来源,比如wkcow的原发内容,会自动加上wkcow的,可能是在前,也可能在后面。
c.搜狗的标题是50个汉字,也就是25个汉字。不会加上来源,简单的读取title的内容。
建议:网页标题不要超过15个汉字,因为有些搜索引擎会加上来源。所以如果你自己加入来源,那么不要超过50个字节长,比如本文的标题“搜索引擎的体验_wkcow”这样的方式。注意一定要使用”_”,其他的就别用,强制使用。
三:网页快照
大家都知道google的快照是可以控制的,但百度、爱问、搜狗的网页快照都不可控,那么有什么规律呢
a、搜狗的网页快照比较简单,是去标签后的文字截取。文字截取的左面是正文开始,这和网页的布局有一定的关系,但一般都是一个网页的中间部门;site你的网页,看几个就知道它的截取规则了。
建议:以布局为主,保持代码的干净,尽量保持导航条的简单。
b、百度的网页快照很复杂,但是有一定规则的。如果你是一个从业者,那么你会发现百度的快照是有权重计算的。下面我告诉你我的研究结果:
a)标题在正文中出现,则很可能从这里截取
b)标题中某些词语在正文里出现频率最高的地方
c)如果正文很短,则会考虑描述description
d)如果描述description的某段词和标题一致,那么会干扰百度快照,直接转入粗暴的正文截取。
e)粗暴的正文截取
建议:以布局为主,控制title和description何时一致,主动去干扰百度的快照,如果布局设计不适宜干扰网页快照,则放弃干扰行为,增加正文里的关键词密度。
c、爱问的网页快照也很复杂,但可以参考百度的快照。
a)标题在正文中出现,则很可能从这里截取
b)标题某些词语在全文出现频率最高的地方,这和百度不同,因为百度去除了诸如评论、回复等影响。
c)如果正文很短,则会考虑描述description
d)用的比较少,怀疑一样可以进行干扰,让其直接转入粗暴的正文截取。
e)粗暴的正文截取
建议:以布局为主,干扰还有待研究。如果布局实现干扰不合时宜,则增加关键词密度。另外要注意别人使用回复、评论来进行spam。
总结:对于网页快照来讲,除了title、description、关键词密度影响之外,最重要的是网页的布局和代码的清洁,做到这一步很难。
四:frame框架
frame会干扰搜索引擎进行标题、快照的抓取。如果你在正文处使用了frame广告或者frame内容,你会发现,网页标题的异常,网页快照位置的转移。尽管你在frame包裹的正文中使用各种手段,你会发现都没有什么作用。对于frame来说,能不能就不用吧,对于搜索引擎的干扰太大。
第六章善待seo、sem人员
seosem涉及的知识非常多,包含了软件、数据库、搜索引擎、网站布局、市场营销、经济管理等各个方面的知识和智慧。所以在此希望大家能理解并将眼光看得更宽一些,而不是仅仅将关键词选择、链接building作为seosem的核心考核。当然关键词选择是一种智慧之间的感悟,比如机票预定、机票预订,你说客户会输入什么来搜索呢?这是一种大概率事件或者小概率事件的抉择,对于某个关键词,排名会带来的实际的转化率;而链接建设则是获取排名靠前的基础,好的链接建设会获得好的排名。但还是那句话,先问问你的网站有没有理由排名靠前,当然推广、赞助除外。在这里无论你对seosem有什么误解,但从我的角度来看:
a、seosem是一个测试人员
反复测试网站自身的架构、代码、布局等情况,测试的结果很多时候都包含了一部分的用户体验,所以seo人员一定要记下自己的感受。
b.seosem是一个监控人员
监控搜索引擎对于网站的抓取、索引、降权、关键词排名、网页快照、链接导向等等情况。作为一个seo从业者,每星期、甚至每天都会去看得一件事情就是访问日志。无论是免费统计软件、webtrends、或者自架clickz的流分析系统,这些信息都是由seosem人员去读取、分析的。
c、seosem是一个改造人员
项目在开发的过程中,存在问题不要怕,当测试人员将测试报告提上来的时候,要设法改造自身。可能是小手术,让代码更规范;让链接更合理;让关键词更有导向性。也可能是大手术,让导航更合理;让布局更科学;让架构更艺术。所有这些都需要seosem人员的参与。
d、seosem是一个市场营销人员
互联网营销是什么,从seosem的工作方向,是链接建设。linkbuilding的行使权在那里,在站长那里。如果seosem人员与某网站达成链接交换协议,而站长,ceo不同意如此操作,那么后果是什么?小的网站打声招呼就好,大的网站的链接不是随便建设的。可能是广告链接-要付费的、可能是友情链接-信任度的建立、也可能是内容合作-赢利分成谈判。所以有人把linkbuilding更多的是友情建设relationshipbuilding。
e、seosem更是一个策划人员
互联网的内容需要创造、互联网的网民需要诱导。以一个什么样的模式、linkbait、linkninja等等.这些策划是要动一番脑筋的。当你能够成功的诱导某一部分网民2-3个星期,那么这个策划就算成功了。
abcdhi.baidu.com/lewutian
注:本文转摘自—武汉seo,网友转摘也请注明。。。。