当前位置:首页 >> 互联网 >> 2006年11月19日
"Times New Roman", Times, serif; align="center">404错误 处理方式及对SEO 影响
[ 关键词:seo 404错误 原文/来源链接 ]
推荐者:草根帮主 (积分 142071) | 原作者:
在"通过HTTP状态码查看搜索引擎蜘蛛如何爬行你 网站”一文中, 我介绍了一些经常涉及到 HTTP状态码及含义, 譬如大家经常探讨并且与本文相关 Http状态码:
404:服务器找不到指定 资源, 请求 网页不存在(譬如浏览器请求 网页被删除或者移位, 但不排除日后该链接有效 可能性);
410:请求 网页不存在(注意:410表示永久性, 而404表示临时性);
200:服务器成功返回请求 网页;
301:网址永久性重定向
302:网址临时性重定向
注意:大部分搜索引擎将"404”与"410”状态同等对待, 如Google. (参见Matt Cutts 说明)
对HTTP404状态码 理解
HTTP 404 错误意味着链接指向 网页不存在, 即原始网页 URL失效, 这种情况经常会发生, 很难避免, 比如说:网页URL生成规则改变,网页文件更名或移动位置,导入链接拼写错误等, 导致原来 URL地址无法访问;当Web 服务器接到类似请求时, 会返回一个404 状态码, 告诉浏览器要请求 资源并不存在. 但 , Web服务器默认 404错误页面, 无论Apache还 IIS, 均十分简陋,呆板且对用户不友好, 无法给用户提供必要 信息以获取更多线索, 无疑这会造成用户 流失.
因此, 很多网站均使用自定义404错误 方式以提供用户体验避免用户流失. 一般而言, 自定义404页面通用 做法 在页面中放置网站快速导航链接,搜索框以及网站提供 特色服务, 这样可以有效 帮助用户访问站点并获取需要 信息.
HTTP404对SEO 影响
自定义404错误页面 提供用户体验 很好 做法, 但在应用过程中往往并未注意到对搜索引擎 影响, 譬如:错误 服务器端配置导致返回"200”状态码或自定义404错误页面使用Meta Refresh导致返回"302”状态码. 正确设置 自定义404错误页面, 不仅应当能够正确地显示, 同时, 应该返回"404”错误代码, 而不 "200”或"302”. 虽然对访问 用户而言, HTTP状态码究竟 "404”还 "200”来说并没有什么区别, 但对搜索引擎而言, 这则 相当重要 .
(一)自定义404错误页返回"200”状态码
当搜索引擎蜘蛛在请求某个URL时得到"404”状态回应时, 即知道该URL已经失效, 便不再索引该网页, 并向数据中心反馈将该URL表示 网页从索引数据库中删除, 当然, 删除过程有可能需要很长时间;而当搜索引擎得到"200”状态回应时, 则会认 该url 有效 , 便会去索引, 并会将其收录到索引数据库, 这样 结果便 这两个不同 url具有完全相同 内容:自定义404错误页面 内容, 这会导致出现复制网页问题. 对搜索引擎而言, 特别 Google, 不但很难获得信任指数TrustRank, 会大大降低Google对网站质量 评定. ( 什么会出现返回"200”状态码 情况??请参看下面内容"自定义404错误页面 基本原则”)
我一直在使用Google Sitemap, 当我们提交XML格式网站地图文件时, Google会验证我们 身份以确保 网站合法 管理者. 验证方式有两种:上传指定名称 html页到网站根目录或者在网页meta区域添加一个标识身份 meta标签. 我通常 使用上传html网页 方式, 但Google却提示我网站根目录下找不到这个网页(实际上我已上传, 并且通过浏览器可以访问), 这 一个很可怕 问题, 见图:
404:服务器找不到指定 资源, 请求 网页不存在(譬如浏览器请求 网页被删除或者移位, 但不排除日后该链接有效 可能性);
410:请求 网页不存在(注意:410表示永久性, 而404表示临时性);
200:服务器成功返回请求 网页;
301:网址永久性重定向
302:网址临时性重定向
注意:大部分搜索引擎将"404”与"410”状态同等对待, 如Google. (参见Matt Cutts 说明)
对HTTP404状态码 理解
HTTP 404 错误意味着链接指向 网页不存在, 即原始网页 URL失效, 这种情况经常会发生, 很难避免, 比如说:网页URL生成规则改变,网页文件更名或移动位置,导入链接拼写错误等, 导致原来 URL地址无法访问;当Web 服务器接到类似请求时, 会返回一个404 状态码, 告诉浏览器要请求 资源并不存在. 但 , Web服务器默认 404错误页面, 无论Apache还 IIS, 均十分简陋,呆板且对用户不友好, 无法给用户提供必要 信息以获取更多线索, 无疑这会造成用户 流失.
因此, 很多网站均使用自定义404错误 方式以提供用户体验避免用户流失. 一般而言, 自定义404页面通用 做法 在页面中放置网站快速导航链接,搜索框以及网站提供 特色服务, 这样可以有效 帮助用户访问站点并获取需要 信息.
HTTP404对SEO 影响
自定义404错误页面 提供用户体验 很好 做法, 但在应用过程中往往并未注意到对搜索引擎 影响, 譬如:错误 服务器端配置导致返回"200”状态码或自定义404错误页面使用Meta Refresh导致返回"302”状态码. 正确设置 自定义404错误页面, 不仅应当能够正确地显示, 同时, 应该返回"404”错误代码, 而不 "200”或"302”. 虽然对访问 用户而言, HTTP状态码究竟 "404”还 "200”来说并没有什么区别, 但对搜索引擎而言, 这则 相当重要 .
(一)自定义404错误页返回"200”状态码
当搜索引擎蜘蛛在请求某个URL时得到"404”状态回应时, 即知道该URL已经失效, 便不再索引该网页, 并向数据中心反馈将该URL表示 网页从索引数据库中删除, 当然, 删除过程有可能需要很长时间;而当搜索引擎得到"200”状态回应时, 则会认 该url 有效 , 便会去索引, 并会将其收录到索引数据库, 这样 结果便 这两个不同 url具有完全相同 内容:自定义404错误页面 内容, 这会导致出现复制网页问题. 对搜索引擎而言, 特别 Google, 不但很难获得信任指数TrustRank, 会大大降低Google对网站质量 评定. ( 什么会出现返回"200”状态码 情况??请参看下面内容"自定义404错误页面 基本原则”)
我一直在使用Google Sitemap, 当我们提交XML格式网站地图文件时, Google会验证我们 身份以确保 网站合法 管理者. 验证方式有两种:上传指定名称 html页到网站根目录或者在网页meta区域添加一个标识身份 meta标签. 我通常 使用上传html网页 方式, 但Google却提示我网站根目录下找不到这个网页(实际上我已上传, 并且通过浏览器可以访问), 这 一个很可怕 问题, 见图:
[ 关键词:seo 404错误 原文/来源链接 ]
|
|
[收藏至站内网摘] [ 'del','scrollbars=no,width=475,height=575,left=75,top=20,status=no,resizable=yes'));del.focus();">Del.icio.us收藏] [%22_blank%22,%22scrollbars=no,width=600,height=450,left=75,top=20,status=no,resizable=yes%22); void 0">百度搜藏] [抓虾 订阅] [鲜果 订阅] |
顶一个呀.5672418