您现在的位置是:芭奇站群管理系统 > 经验心得 > -> 搜索引擎的使用方法以及其识别网页语言分析

搜索引擎的使用方法以及其识别网页语言分析

时间:2010-07-01 23:36

  。

  网站浏览器和搜索蜘蛛程序假定网页按照西方语言编码,因此使用这些语言写的网页不需要这个标签。为了浏览器显示正确,亚洲、阿拉伯和古代斯拉夫语的文本确实需要这个标签。因此,当搜索引擎看到针对这些语言的表情,它对正确显示网页的语言有了很高的保证。

  3、内容分析

  搜索引擎通过研究内容中的字符模式来最终判定网页的语言,哪怕是短到只有两句话的网页,内容分析的精确度也非常高。meta标签只有在内容分析后还不确定的情况下才被使用。

  多数情况下,搜索引擎会自行正确地判断网页的内容,对于只有很少几个词的网页,要保证网页被正确识别,正确的编码语言和meta语言标签很重要。

  下面就让我们看看什么是山寨搜索引擎

  “百google度”-baigoogledu.com

  最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。

  “百谷虎”-baigoohoo.com

  由于某家新闻媒体的报道,最近声名大振,高举着“山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。

  “山寨文化”在每个人的心目中可能都有着不同的感觉,但随着这股风越刮越烈,可见草根对“山寨”的内涵还是有相当的认同,百度和谷歌的嘴仗打的不亦热乎,都指责对方结果不公正,山寨搜索却硬要把这两个冤家放在一起。也许很多人对“山寨搜索”嗤之以鼻,但是对于普通网民来说,是谁的搜索并不重要,是我们需要的结果才是最重要的么。如果是你,你会选择谁呢?

  搜索引擎优化(searchengineoptimization,简称seo)搜索引擎优化即searchengineoptimization,用英文描述是tousesometechnicstomakeyourwebsiteinthetopplacesinsearchenginewhensomebodyisusingsearchenginetofindsomething,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。与之相关的搜索知识还有searchenginemarketing(搜索引擎营销),searchenginepositioning(搜索引擎定位)、searchengineranking(搜索引擎排名)等。

  随着互联网的发展,网上可以搜寻的网页变得愈来愈多,而网页内容的质素亦变得良莠不齐,没有保证。所以,未来的搜索引擎将会朝着知识型搜索引擎的方向发展,期以为搜寻者提供更准确及适用的资料。目前,网上的百科全书如雨后春笋般发展起来;另一方面,近年来亦有不少公司尝试在搜寻方面改进,务求更符合用户的要求。当中诸如copernicagent之类的搜寻代理就是其中之一。

  在台湾,威知资讯(webgenie)是利用文字探勘(textmining)技术发展搜寻引擎产品的公司,利用人工智能算法,可达成目前搜寻引擎所缺乏的简易人机互动模式,诸如关联字提示、动态分类字提示等[1],算是较另类的搜寻引擎产品。

  搜索引擎的使用方法

  搜索关键词提炼

  选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子里要形成一个比较清晰概念,即我要找的到底是什么?是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位你要找的东西,而且多数时候你根本不需要用到其他更复杂的搜索技巧。

  细化搜索条件

  你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。

  比方说你想查找有关电脑冒险游戏方面的资料,输入game是无济于事的。computergame范围就小一些,当然最好是敲入computeradventuregame,返回的结果会精确得多。

  此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(stopwords)或过滤词(filterwords),在搜索时这些词都将被搜索引擎忽略。

  用好搜索逻辑命令

  搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(boolean)逻辑命令and、or和not。用好这些命令符号可以大幅提高我们的搜索精度。

  精确匹配搜索

  除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英文字符。虽然现在一些搜索引擎已支持中文标点符号,但顾及到其他引擎,最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。

  特殊搜索命令

  标题搜索

  多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。

  网站搜索

  此外我们还可以针对网站进行搜索,命令是“site:”(google)、“host:”(altavista)、“url:”(infoseek)或“domain:”(hotbot)。

  链接搜索

  在google和altavista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inboundlinks)。其他一些引擎也有同样的功能,只不过命令格式稍有区别。你可以用这个命令来查看是谁以及有多少网站与你做了链接。(编选:中国电子商务研究中心)