" I5 H2 H, J. V; g
百度互联网创业俱乐部搜
) V/ j+ x; H- u) @索引擎优化指南
: I+ `' p+ i/ ]版本号:V1.0
) C& J. i. F- S- n+ c t6 i@ Baidu 2010
" [ {) Z/ _' N. K9 s2 百度搜索引擎优化指南
! x2 b8 H* G% ^6 j9 l6 z2 i& ?0 |/ G/ B4 [$ n7 @0 v# {2 \7 ~% O+ q
6 F7 U M1 G+ g+ ?9 C
: L/ F% s& \) D0 T( Z: M+ C. X( G前言
' _3 G# g* d j2 ~SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 ! B8 }0 m& H4 w
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为
& s* W0 T9 G7 p( u的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search 7 ^3 j3 V" W& r, b7 d7 `
engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。 + X0 g3 ~7 @% j& W( R# R3 k9 B6 q
毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种
1 s- F! e8 c0 M% P. S对立源于两方面:
+ L9 W# g3 ]. |; d一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否
6 n- v6 w* I) g# }9 w- E2 J符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
. J: c' e: K! E: h6 T" L* a严厉打击。 & x0 Y8 B( m, Z9 }( j2 p
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立 1 b. s0 v+ s" [- k6 A
的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 2 R3 j# P3 B8 [8 @, b& A$ M5 p2 a# w
就是不可调和的。
( I& a4 r$ b6 V# N# V9 g但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的 ! g! v! P% I& A9 M" D3 v
地方的:
' A/ B( O$ u8 l首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源, + d4 \8 A% l# c$ T8 [! F1 G
是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
* W; }' x+ D& W1 h9 I这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改
p/ z5 x$ s. k$ @. ^1 l9 r善用户搜索体验。
: t1 b( K# Q9 R' j; W w其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市 " l% R `: |2 n- y& Z
场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以 # M7 d- p0 r t4 o$ V
扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。
3 Y; W X& W- N8 f基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更 1 W& G4 e4 S! n0 U2 R8 {) S
加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百 ( e9 J* w5 k) f2 l
度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。 " p& R+ S- {* w) U
我们先来看一下过去的问题所在。
; {2 i& B5 M$ Z$ p6 v(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
3 f/ l1 P. ?/ s% J0 _4 U9 J黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 + @& M1 G) |# t9 n: l, A# F
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害 4 U! R; p$ U* Q+ ~
3 百度搜索引擎优化指南 4 r8 [1 c* R- U6 u' D; w8 U3 A( c
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短 9 F( G) s* E' q0 e/ m) I
期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领
( p V0 ?. k0 J( e o' a0 V$ L3 {域,破窗效应是非常明显的。 ! C0 ^9 R& U9 e
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
, Y! d6 H6 ~9 F8 i2 x的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, , ?7 {' V- ^. V% O# d Q
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。 7 X! I9 A2 ?/ E7 ]
对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 1 }" }- h% T7 V1 x
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
# |& d; ?: q5 |! t* J5 }+ KSEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆 : M# B3 a' N& q3 ^
论氛围。这是我们必须要去扭转的。 6 ? ?+ n; Z9 q1 l' u: P
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, , R; F" Y, c, M N* m$ V
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 - j+ ?. _1 x0 K2 B& N3 C) v
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
% ~+ a& d4 u) m" s' E0 t2 r+ I(2) 白帽SEO 行为得到的指引不够清晰 6 {4 C1 s8 z& ^+ a& l4 D/ ]3 [
所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好,
( f% K `* H [3 S并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 1 s; Q' V0 x6 h* i+ d) D& D
行为是推荐的。这导致很多白帽优化心存顾虑。
0 \/ ]% G, {) x, e" V( o( E正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围, . D, [% |( ^& Z6 s% z
以使SEO 行业,有更加良性的发展。 . L/ A" C* c% U' l% O
需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 * `& ^1 `+ m. l0 M
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
" H& p2 V J# A来不断的完善这一指南。
( G& b9 E7 _2 A% g, C4 百度搜索引擎优化指南
6 l3 F5 U1 p0 d2 K6 a/ @目录 % |0 X; s- X" A# B9 H5 F; N u5 ^
前言.. 2
+ Z1 A; ?) B" R6 r. \; p0 ~4 j目录.. 4
" Z2 j# I+ B8 c# ?3 x! f1 前期准备.................................................................................................................... 5
+ N: E! g# v# p1.1 域名注册.................................................................................................................... 5 0 w B5 h2 h4 d' R: e
1.2 服务器、空间租用..................................................................................................... 5
3 I/ ]* f2 I8 O& ]2 面向搜索引擎的网站建设.......................................................................................... 6
I: T7 m% M5 F3 w0 |7 H6 z2.1 良好收录.................................................................................................................... 6
1 |' a, L2 _7 c2 S& x2.2 良好排序.................................................................................................................. 11
" {( D1 `( S+ q5 r2 s2.3 良好展现.................................................................................................................. 13
& d* Z$ \/ Y: s! V- W3 网站运营.................................................................................................................. 15 - C' X& s3 E# `* C4 R/ P. a
3.1 目标=转化率............................................................................................................ 15
( B" J' `; G: ?) }3.2 搜索引擎流量分析................................................................................................... 15
* j; {. ?3 J/ u8 R; [; a" B3.3 网站信任度.............................................................................................................. 16
4 l. N$ R( `& L* Q: Y5 I0 E3.4 不断强化品牌概念................................................................................................... 16 " j6 m* u; G5 M C3 q1 Z
4 作弊与惩罚.............................................................................................................. 16 . h& Y, V; k, S% z8 H
4.1 百度如何定义作弊................................................................................................... 16
5 r7 m/ p- L$ d4.2 作弊会受到怎样的惩罚............................................................................................ 18
1 m# T+ t! @ l4.3 改正后能否解除惩罚? ............................................................................................ 18 ) |6 q6 r; |9 i# ]- [, c
5 联系与反馈.............................................................................................................. 18 9 y' N2 O, Q( V
6 关于百度的十万个为什么........................................................... 错误!未定义书签。 / L, q. F4 k8 a
5 百度搜索引擎优化指南 . W. s7 i! g2 s6 c
1 前期准备
# N6 r! N" A0 p& k D4 a域名和服务器空间是网站建设的基础。 ( @/ h7 e- Y0 G9 n. ]! r
1.1 域名注册
) O6 j9 s0 U" a7 c域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 4 {; k( a( o" ~* y; o
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
& v6 Y+ a0 d4 g. O6 e- C推荐。 ( s) Z5 \; \4 U& V. Y
(1) 域名尽量简短,越短的域名,用户的记忆成本就越低
/ R/ b3 f- a: ]$ M' M' D- `(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如
( W9 b! B3 g5 R) F$ B m6 {( L1 D% @! {使用公司名称、商标、网站名称或者公司产品等信息来选择域名 8 ? Q% W+ X+ q$ K; d$ J
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
0 `( d l( F. F4 {+ w( ~户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
' h" Q# r$ e! J N1 ^0 I4 j1 C( T能会让用户产生不信任感,增加用户的判断成本。
3 m6 p$ m1 U& F5 m5 q& G5 H8 @( {( Z2 M1.2 服务器、空间租用
, E1 N* g) P) k- b9 \' \- u服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 ' |. h1 t7 C# v' b* `2 S
议选择服务稳定、速度快的服务器或者空间。
- @4 U- N X0 c/ p(1) 选择有实力的正规空间商
" w9 E( _9 p* R% @服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 . u, p4 K' }3 ~9 Y( A3 l; `
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
- E$ o% ^) j% x2 Z" Z$ G$ U2 aBaiduspider 的抓取,导致网站无法被百度网页搜索收录。
# S4 J6 C: F, u) f(2) 保证用户的访问速度和稳定性 ! {/ K7 E1 v4 L) H) O0 I& U
(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器)
- v. ~8 o, q9 k# |* D. i通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳
. d. @5 I+ F4 @5 C& X+ u定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可
( e/ y* f& R9 d3 b以根据自己的需求来进行合理的选择。 2 ?& f3 j+ h* P
(4) 根据用户群分布选择接入商
9 T$ c9 [ O$ Z由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通 # `; \" u. t6 E# j" X
访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 % m2 @# u; G/ _9 f
全国,那就选择一家互通处理的比较好的接入商。
5 Y& Q! _& F- p' p6 百度搜索引擎优化指南
. Z/ N1 q* ?' m' k购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
) e! ^- P" l' t; B! T% N+ Q2 面向搜索引擎的网站建设
9 d8 ]: U! g! U; g搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断, 1 T$ R/ R& _% j' F4 r( F
也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
" s3 Z* t. i! L优化,同时也会让用户受益。
e: z( m3 L) U' d面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内
8 P; r( B& f5 m" f3 R/ t容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简 4 m1 N1 S' H9 ~
单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 ( A% w1 G+ u) j2 w
2.1 良好收录 % U& T, p/ |& U: ~1 l4 @
2.1.1 机器可读
^ J; _! p' l, Q% p5 T百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
) s P! V: @! u( t0 H目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、 " j8 f# p+ {2 n. z9 N6 f
图片中的文字,百度无法识别。 , k" t& U% ~/ n+ @# o3 P/ F# e# M
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 0 y# M/ ^/ k8 U. |: T
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
: {2 y0 U. |. S! D& TJavascript 中包含链接指向的网页,百度可能无法收录。 ; f6 K0 P8 g4 L3 s% l5 c& q4 j
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接
+ T, Y# T- Z* w+ k" I冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页 [8 S' Y/ \2 D2 y6 j/ M
使用文本链接指向文字版 1 N: `5 I1 I& D6 j- G8 j
冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看” 9 ^- q- \# {; f9 j: P4 ?
到的导航及正文内容放到Ajax 中
* @2 i% O, y5 J$ A ]$ t7 T1 F冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
. U/ T1 n/ @6 I+ s我们建议: 3 w9 c# u4 ^0 L3 Z/ B1 I" E
7 百度搜索引擎优化指南
. ^( _% l& p, T, b8 y3 @上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
% w2 d# K0 v: x8 M" r搜索引擎来讲,这个网页没有任何内容。
% R" k8 O+ A% g. t2.1.2 网站结构 ^9 I: T" i- W7 D
网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 : c; p8 e$ f. V. k0 M! k. _
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。
1 E+ l; ?# `+ ?, j9 q( A3 L网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章
3 W' l' e, W- B+ g1 z页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
$ W8 q# b0 Z5 J. }4 j; i内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应 . | |1 V; w6 X5 E
对。
6 E/ A: d5 T8 r9 Q& Q; D# @理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理 ! x) W S! M" q$ F. F" ~
起来,会更简单。
6 ^( N0 N: `! i8 t, D同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
% l, m. ^9 T6 D1 p- o. ^4 U- r关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页
* t \) T/ }! Z/ j* E# ~' A& g有到上级频道以及首页的链接、内容相关的网页间互相有链接。
* u6 ]7 x8 C: ]* P9 B网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。
\/ U3 g. Z# l$ M; B; m" c总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
" g6 R& F5 ^9 J! [- K6 p) T冘 确保每个页面都可以通过至少一个文本链接到达。 5 E ^. j9 L5 K9 u, W+ ?- n
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 % a' `. s; I' V5 [
我们建议: 0 a. k, b' o3 A' l' S
8 百度搜索引擎优化指南
3 T) Q5 S. G7 W. ^% |0 K* M冘 合理分类网站上的内容,不要过度细分。
2 E2 r1 h' {: u+ r0 u/ [4 K& T网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 * P7 X/ E& H, T5 j* L; z3 O
搜索引擎更好的了解网站的结构。 6 d7 V% ^$ F& G) e: ~( o
冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎 5 R0 v" _: s& Y. R
方便的定位网页在网结构中的层次。 0 T6 e% r/ d+ r$ ]3 s$ m' h
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网 $ L* T4 N0 k }# N
站首页> 频道> 当前浏览页面 + A. r8 }& o) L- I2 R9 y9 J
通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 # `4 [: ^3 A8 ^, T7 R1 ^
一级频道或者首页也很方便。
! _& c- d% I% l+ c冘 导航中使用文字链接,不使用复杂的js 或者flash 4 g5 j& G; o! E' I
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
( ~2 w& e6 e+ i( b# S$ h2 @6 ]2.1.3 子域名与目录的选择
- X# C( O" v6 r" q2 q( d选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
8 W1 @+ r+ u! ^9 \的影响。 9 c3 V- x/ O- w* j0 M: `% \% t# E
冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
. M4 `0 p) P& K+ ^# c, M7 K) h9 }1 S- t道下积累了足够的内容,再转换成子域名的形式
5 k( V/ l) M+ ?$ N; _4 x# ?一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的 " C" A' _2 s6 d5 [, o
网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的, ) Z0 _" e& a5 ~: S, m0 h; P
子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。 ' g; H, t; E" O3 M9 R# g4 `
在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在 # N4 G, R# u; p
搜索引擎中获得更好的表现。 ! Y+ R ^/ v1 ]# u& L; h
冘 内容差异度较大、关联度不高的内容,使用子站点形式 5 D% u4 e! ^& M1 d2 _8 ^
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
5 e5 {, k/ O3 Z8 \$ s! {+ }的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点 7 T9 D6 `* c% B6 u/ D% \1 E7 V
的主题。 6 f4 Y$ H( ]7 u! r; f; t
冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
7 B: {0 m2 k+ P& B8 B& }: }$ ~) yexample.com 访问 , g- g {0 ~9 q0 }$ ~
子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, / E4 |" j5 I; w
我们建议:
7 v. O0 |- u; m f1 {0 W我们建议:
' m3 l5 M# f7 \; ~ d3 y4 S$ X- x9 百度搜索引擎优化指南
1 E. o- R& V& A; x保留的url 不一定是正常域名下的。
8 ~, S& W& l6 e5 b冘 不要滥用子域名 8 G9 X& Q9 r. Z4 \
无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|