椰子 发表于 2012-3-27 11:02:48

soso的sitemap的提交入口

什么是Sitemap协议
Sitemap 是一种站点地图协议。加入了Sitemap文件的网站将更有利于搜索引擎网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度. 用户通过提交Sitemap将明确告知搜索引擎,希望自己网站的哪些页面被收录。(下载Sitemap协议规范) Sitemap说明


[*]Sitemap文件采用.xml格式
[*]Sitemap文件必须使用utf-8编码
[*]可以采用gzip(.gz)格式来压缩Sitemap文件
[*]Sitemap文件未压缩前不能大于2MB
[*]一个Sitemap文件中包含的Url不能超过50000个
[*]Sitemap中Url的优先权的值是一个表示当前站点中Url重要程序的相对值
[*]Sitemap中Url的优先仅的缺省值是0.5
[*]Sitemap中的Url必须是xml安全的(URL's must be XML Safe (use XMLFormat())

标签
是否必须
说明

<urlset>

Sitemap文件最顶层的标签,Sitemap文件中的其它标签都必须包含在该标签内部

<url>

每一条记录的父标签,下面的其它标签都得包含在该标签内部

<loc>

页面Url, 长度不能超过2048

<lastmod>

页面最后的更新时间,时间格式参见ISO 8601,通常使用YYYY-MM-DD格式

<changefreq >

页面更新频率,取值为:always, hourly, daily, weekly, monthly, yearly, never。
这里需要注意:
always表示页面在每次被访问到时就更新
never表示当前Url的是一个目录

<priority>

当前Url的相对优先权,这个优先权是相对于当前Sitemap中其它Url而言的

Sitemap举例 <?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
    <url>
    <loc>http://example.com/</loc>
    <lastmod>2006-11-18</lastmod>
    <changefreq>daily</changefreq>
   <priority>0.8</priority>
   </url>
    <url>
    <loc>http://example2.com/</loc>
    <lastmod>2006-11-19</lastmod>
    <changefreq>daily</changefreq>
   <priority>0.9</priority>
   </url>
</urlset>

Sitemap索引说明
一个站点可以有多个Sitemap文件,对于多个Sitemap的站点,需要一个名为sitemap_index.xml的索引文件来指定各个Sitemap文件的位置。 关于Sitemap Index需要注意:


[*]Sitemap Index名字必须为sitemap_index.xml
[*]Sitemap Index文件必须使用utf-8编码
[*]Sitemap Index中包含的Sitemap数不能超过50000个
[*]Sitemap Index压缩前的大小不能超过2MB

标签
是否必须
说明

<sitemapindex>

Sitemap Index文件最顶层的标签,Sitemap Index文件中的其它标签都必须包含在该标签内部

<sitemap>

每一条记录的父标签,下面的其它标签都得包含在该标签内部

<loc>

用来指定某一个Sitemap文件位置的Url, 长度不能超过2048

<lastmod>

该Sitemap文件最后的更新时间,时间格式参见ISO 8601,通常使用YYYY-MM-DD格式

Sitemap索引举例 <?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
    <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>



入口:http://open.soso.com/datacoop/sitemap/
页: [1]
查看完整版本: soso的sitemap的提交入口