SEO 初学笔记之一

SEO 是什么?
SEO 是英文 Search Engine Optimization 的缩写,它的含义是通过对网站内外各部分进行优化以增加来自搜索引擎的流量。考虑到各种搜索引擎目前在互联网所占的分量,所以 SEO 的重要性也就不言而喻了。

搜索引擎的工作原理
工作原理简单地说可以分为下面四步:
1. 搜索引擎使用一些名为“蜘蛛”的自动化程序根据超级链接来抓取互联网的网页。
2. 一旦网页被抓取到,它们就会被存储到搜索引擎那巨大的文档数据库里,这就构成了搜索引擎的“索引”。
3. 当搜索引擎接到一个搜索请求时,它就会从它的索引中取得符合要求的文档。
4. 一旦搜索引擎取到符合要求的文档,它会根据特定的算法来对这些文档的相关性进行计算,随后按照相关性对它们进行排序显示最终结果给用户。

减速板和墙(Speed Bumps & Walls)
一些类型的导航可能会妨碍和完全阻止搜索引擎访问你的网站。当搜索引擎的蜘蛛在网页上爬行时,它们依靠超级链接的架构来发现新网页和重新访问那些改变的网页。复杂的链接和深层的站点结构被称为“减速板”。那些无法访问的数据被称为“墙”。

下面列举一些“减速板”:
1. 网页地址含有2个以上的动态参数。
2. 站点中一个网页含有100个以上别的网页的唯一链接。
3. 从站点首页需要三次点击才能到达的页面。
4. 页面需要“Session ID”和 Cookie 才能访问。
5. 使用 frame 的页面会妨碍蜘蛛爬行,同时也会使搜索引擎困惑应该给那个页面评分。

下面列举一些“墙”:
1. 那些只能通过选择表单和提交按钮来访问的页面。
2. 那些只能通过下拉菜单才能访问的页面。
3. 那些只能通过搜索框才能访问的页面。
4. 那些有目的阻止搜索引擎索引的页面
5. 那些需要登陆才能访问的页面
6. 那些含有重定向功能的页面

保证站点页面全部能被搜索引擎抓取的关键是使用直接的 HTML 链接。

相关性和流行度
目前所流行的商业搜索引擎的理论基础是信息检索学。在检索系统的发展过程中,信息检索科学家意识到搜索功能主要有两个关键组件构成:

相关性 (relevance)
相关性是指信息检索系统针对用户的查询从文档集中检出的文档与查询之间的一种匹配关系。

流行度
流行度是指符合用户查询文档的引用频度。如果这个文档很重要,很权威,其他的文档就会去引用它。

这两个概念后来被应用于网页搜索,并出现在文档分析和链接分析中。

搜索引擎所能信任的信息
互联网上就信息来说简单可以分为两类,一类是站点或者网页本身的属性,另外一类就是其他站点或者网页对其的描述。搜索引擎就是根据这两类信息来判断网页的级别。理论是这样子地,如果数以百计或者数以千计的站点都是链接你的站点,表明你的站点很受欢迎,因此也就有价值。

现在最为著名站点评级系统就是 Google 的 Pagerank,Google 是这样子描述它的:
作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它网页的“重要性”。

下面是搜索引擎衡量一个链接是否有价值所考虑的因素:
1. 链接的锚文本。所谓锚文本就是超级链接的可见文字部分,也有人叫链接文本。
2. 站点的全局流行度。越受欢迎的站点提供的链接越有价值。
3. 主题站点群的站点流行度。主题站点提供有关主题的链接更有价值。
4. 环绕链接的文本占有更多的权重。
5. 链接页面的主题。

超级链接的架构(The Anatomy of a HyperLink)
超级链接的架构本身比较简单,也就不多废话了,不过其中的两个属性值得注意。
属性 title 是作为链接的附加描述而存在的,特别是当链接本身并不是十分清楚的表达了链接的目的。这样就使得访问者知道那些链接将会带他们到什么地方,他们就不会加载一个可能完全不感兴趣的页面。
属性 rel 原来是被设计用来描述当前文档和目标文档之间的关系,但是随着标签 nofollow 的出现,情况变得有点复杂。
标签 nofollow 是专为搜索引擎而设计的,它会告诉搜索引擎的蜘蛛程序将不再跟踪这个 url 继续爬取,而对应的链接,在排名计算是也不会计算入目标网站的权重。

关键词和查询(Keywords and Queries)
搜索引擎不只是简单地罗列搜索结果,它还用语义学的知识分析用户的意图从而提供一个更为精准、职能、贴心的搜索结果。

Sorting the Wheat from the Chaff
搜索 spam 和 电子邮件 spam 相同之处在于 spam 的数量是决定性的因素,这很容易理解。

如何进行关键词研究?
关键词的研究对于 seo 来说是不可或缺的。它包括以下几步:
1. 运用头脑风暴法尽可能地列出终端用户可能在搜索时使用的短语。在这里推荐 Freemind 来帮助你整理思路,这个工具是 SourceForge 推荐的一个桌面画图工具,开源,免费,程序速度快。
2. 如果有条件,可以作问卷调查,不过需要花费一些钱。
3. 利用 Google AdWords Keyword Tool 来收集相关的关键词。
4. 把得到的关键词做成图表进行分析,从而选择出网站所用的关键词。
5. 分析日志对关键词进一步调整。

2 Comments

  1. g.zhen.ning said,

    October 11, 2007 at 7:35 pm

    您好,我最近在做www.rubyer.com.cn(wordpress’s blog)时,我查seo的”speed bump”来到你这里,这单词字面不是加速撞击么?怎么变了减速板呢?

  2. cAreLeZz said,

    October 12, 2007 at 7:30 pm

    speed bump 的准确说法应该是“减速路脊”,这里有个链接,你可以参考一下。
    http://bbs.zjol.com.cn/viewthread.php?tid=262568

Post a Comment