外贸营销就找引擎力
200+国企、上市企业的选择
当前位置: 首页 » Google优化 » 正文

引擎力Google SEO实战总结:URL地址

谷歌优化 发表于 Google优化  | 阅读: 59 次 

字号:

URL作为谷歌索引的唯一标识,其重要性不言而喻。一个URL地址就是一个链接,谷歌蜘蛛通过链接爬取内容并在确定特定页面或资源与搜索查询的相关性时提取页面。因此,加强技术性SEO优化的URL地址能够获得更多的机会。

什么是URL地址

在www上,每一个信息资源都有统一的且唯一的地址,该地址就是URL(Uniform Resource Locator,统一资源定位符),它是www的统一资源定位标志,即指网络地址,简称网址。

URL的一般语法格式(带[]的为可选项)为:protocol://hostname[:port]/path/[;parameters][?query]#fragment。

URL地址组成部分

1.协议(Protocol)

协议(Protocol)是对数据格式和计算机之间交换数据时必须遵守的规则的描述。file资源是本地计算机上的文件。格式为file://。

ftp通过FTP访问资源。格式为ftp://。

http通过HTTP访问该资源。格式为http://。

https通过安全的HTTPS访问该资源。格式为https://。

mailto资源为电子邮件地址,通过SMTP访问。格式为mailto://。

mms通过支持MMS(Multimedia Messaging Service,流媒体)协议播放该资源。代表软件:Windows Media Player。格式为mms://。

ed2k通过支持ed2k(eDonkey2000 network,专用下载链接)协议的P2P软件访问该资源。代表软件:电驴。格式为ed2k://。

news通过NNTP访问该资源。

2.主机名(Hostname)

主机名是指存放资源的服务器的域名系统(DNS)主机名或IP地址。有时,在主机名前也可以包含连接到服务器所需的用户名和密码(格式为username:password@hostname)。

互联网上的主机或Web站点由主机名识别。主机名有时称为域名。主机名映射到IP地址,但是主机名和IP地址之间不是一对一的关系。当Web客户机发出到主机的HTTP请求时,使用主机名。对于用户来说,主机名比数字IP地址更方便。公司、组织和个人常常选择其Web站点的主机名,因为用户能很容易地记住这些主机名。

3.端口号(Port)

整数、可选、省略时使用方案的默认端口,各种传输协议都有默认的端口号,如HTTP的默认端口为80。如果输入时省略,则使用默认端口号。有时出于安全或其他考虑,可以在服务器上对端口进行重定义,即采用非标准端口号,此时,URL中就不能省略端口号这一项。

4.路径(Path)

由0或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址。

5.参数(Parameters)

这是用于指定特殊参数的可选项。

6.查询(Query)

可选,用于给动态网页(如使用CGI、ISAPI、PHP/JSP/ASP/ASP,NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。

7.信息片段(Fragment)

字符串,用于指定网络资源中的片断。例如,一个网页中有多个名词解释,可使用Fragment直接定位到某一名词解释。

动态URL地址和静态URL地址

动态URL又称动态页面、动态链接,指在URL中出现“?”这样的参数符号。原始的URL地址都是动态URL地址。区别动态地址与静态地址最大的特点是动态地址包含问号,静态地址是没有问号的。

动态网址的生成是采集数据库的内容,不能保证网页内容的稳定性和链接的永久性,所以不利于反向链接的建设,同时也很难被搜索引擎收录索引。搜索引擎更青睐于静态URL,可以更加方便搜索引擎蜘蛛抓取网页,有利于页面收录。

一般通过URL中是否带有“?”“=”“&”“php”“asp”等字符来分辨,换句话说就是不带有任何参数的URL就是静态URL。静态URL地址内容稳定,链接唯一,利于搜索引擎索引和收录。

纯静态URL地址和伪静态URL地址

URL地址静态化分为纯静态和伪静态两种。

1.纯静态

纯静态网址的网站可以通过FTP在服务器上找到真实的文件,每个网页都会对应一个文件(纯静态是一对一,伪静态是多对一),就像在本地电脑上浏览文件夹一样,有多少个文件、文件夹,文件名字都能直接找到,层次结构一目了然。

纯静态URL的优势:

(1)加载的时候不需要调用数据库,打开速度快。

(2)减少了服务器对数据响应的负荷。

(3)从安全角度讲,纯静态网页不易遭受攻击。

(4)从网站稳定性来讲,即使网站代码或数据库出了问题,静态网站也不会受到影响。

纯静态最大的缺点就是程序生成了大量文件,占用了过多的网站空间,增加了网站制作的成本。

2.伪静态

伪静态实际上也是动态地址的一种,只是表现形式为静态。伪静态即URL地址重写,文件都放在数据库中,只是将动态文件伪装成了静态,就是截取传入的Web请求并自动将请求重定向到其他URL的过程。其目的主要是通过重写URL的方法去掉动态网页的参数,从而更加有利于搜索引擎的收录。伪静态路径看起来像静态路径,但它是由动态路径转化过来的。

伪静态URL的优势:

(1)维护方便,网页每天都自动变化,不用维护或者说极大地减少了维护量。

(2)可以方便地实现对搜索引擎的优化,易于被搜索引擎收录。

(3)缩短了URL的长度,隐藏文件实际路径提高了安全性,易于用户记忆和输入。

(4)占空间比较小,不像纯静态那样占用过多的空间。

(5)安全性能通过URL地址隐藏或加密,让黑客无法找到真实的动态页面,同时动态文件不需要太高的权限,从而避免了木马的注入。

伪静态URL最大的缺点就是会占用一定量的CPU使用率,增加服务器的响应时间。

3.关于纯静态与伪静态的几点说明

(1)从SEO角度来看,伪静态和纯静态的URL地址都能够很好地被谷歌索引。

(2)不管使用纯静态还是伪静态都有一定的弊端,如纯静态,需要全站生成纯静态页面,会导致服务器空间使用率增加,而伪静态对CPU会有一定的压力。

(3)推荐使用伪静态,最主要是考虑网站更新的问题,纯静态的所有内容都是写死在HTML代码里面的,因此修改的时候,哪怕改个单词,都要去HTML代码端调整,这样不但效率低,也会导致维护不方便,因为一般的运营人员操作不了或是容易出错。而伪静态是页面内容,可以直接在后台中更改,不需要接触代码。在后台数据有修改时,会自动生成一张缓存静态页面,而这个页面已经非常接近纯静态页面了。

URL层级

URL层级对于SEO来说,主要在于层级代表着蜘蛛爬行的难度,层级浅有利于网站的优化,也有利于用户的体验。

在SEO优化中,建议URL层级控制在三层以内,如图1所示。

第120页-12.PNG图1 URL层级说明

URL层次结构减少,层级变浅,有助于搜索引擎的收录;另外,层次结构越浅意味着关键程度越高,一定程度上能提升网站页面的权重。

URL地址中为什么建议包含关键词

1.能够提升用户体验度

在谷歌搜索结果中,通过搜索关键词,谷歌会展示几项重要的内容,标题、URL地址、页面所在路径、描述以及站内链接。通过关键词体现,可以让用户更加确信页面的相关度,从而提高用户体验度。

2.能够提升关键词排名

关键词在SEO优化中至关重要,常见的关键词体现在TDK(Title,Description,Keyword)中,这是最基本的设置。除此之外,关键词体现在合理的位置能够更好地帮助提升排名,如在URL地址中,这可以帮助搜索引擎确定相关性,但建议URL地址中关键词数量最多为2个,用一堆关键词填满URL地址不会帮助提升,反而降低用户体验度。

为什么URL地址单词之间用中划线

URL地址结构对于搜索引擎优化非常重要,因此需要设置正确。根据谷歌,带有连字符(-)的URL要优于使用下划线(_)的URL,主要考虑URL的可读性。以下举例说明:

(1)带有连字符的URL:htps://www.example.com/new-york-real-estate-agent。

(2)使用下划线的URL:https://www.example.com/new_york_real_estate_agent。

(3)不使用避免连字符或下划线的情况:http://www.example.com/newyorkrealestateagent.html。

(4)单词之间空格的情况:https://www.example.com/new20%york20%real20%estate20%agent。

上面例子哪个比较容易记住呢?是连字符,因为它更符合标准的标点用法。一个URL对人们来说越容易阅读,对搜索引擎就越好。从表面上看,搜索引擎对连字符和下划线的处理是一样的。然而,事实并非如此。

一方面,谷歌将连字符视为空格或单词分隔符。URL不能添加一个传统的空格,但在谷歌那里连字符就表示空格了。

另一方面,下划线被认为是“单词连接”,也就是说new_york_real_estate_agent与newyorkrealestateagent对于谷歌而言是相同的。如果URL是wordl_word2,只有当用户搜索wordl_word2的时候谷歌才会返回该页面。如果URL是word1-word2,当用户搜索word1,word2,甚至“wordlword2”时,谷歌都可能返回该页面。

为什么URL地址要使用小写字母

1.服务器处理大写的方式不同

如果您的网站是在Windows服务器上,那么www.example.com/ABOUT和www.example.com/about会指向同一个页面,因为Windows服务器不区分大小写。如果网站托管在Linux上,那么这两个地址将被视为两个不同的页面。这意味着一个将返回正确的页面,而另一个将返回一个404页面。因此,如果最初驻留在Windows服务器上,然后转移到Linux服务器上,可能会让用户混乱并造成大量404页面。此外,如果在Linux服务器上使用大写字母作为URL,那么如果用户试图使用所有小写字母来访问一个页面,就会得到一个404页面。

2.两个URL指向同一个页面不利于搜索排名

正如上文提到的,Windows服务器将网址www.example.com/ABOUT与网址www.example.com/about同等看待。这意味着虽然URL不同,但它们指向相同的内容,搜索引擎称其为重复内容,并建议尽可能避免使用。而且,像谷歌这样的搜索引擎将把两个URL看作是独立的页面,并在它们之间划分链接量。这将导致页面的排名可能低于它可能达到的水平。

最合适的处理方法是使用301重定向来确保用户只能通过一个URL看到每个页面。避免上述问题的最好方法是所有URL地址使用小写字母,既符合用户体验也不会影响搜索排名。

Tags:

未注明作者或来源均属原创文章,转载请注明:转自 Google优化-引擎力

本文链接地址: https://www.googleseo.com.cn/seo/yinqingligoogle-seoshizhanzongjieurldizhi.html