Google支援數種Sitemap格式、瞭解Sitemap檔案格式建立並提交

瞭解 Sitemap
什麼是 Sitemap?
「Sitemap」是一種檔案,您可以在其中列出網站上的網頁,讓 Google 和其他搜尋引擎瞭解您的網站內容架構。搜尋引擎網路檢索器 (例如 Googlebot) 會讀取這個檔案,以更靈活的方式檢索您的網站。

此外,Sitemap 可以針對 Sitemap 中列出的網頁提供有價值的關聯「中繼資料」:中繼資料是指網頁相關資訊,例如網頁上次更新的日期、網頁變更頻率,以及相對於網站中其他網址的重要性。

您可以使用 Sitemap 提供與特定網頁內容類型 (包括影片和圖片內容) 相關的中繼資料給 Google。舉例來說,您可以為 Google 提供影片與圖片內容的相關資訊:

Sitemap「影片項目」可以指定影片的播放時間、類別以及適當的年齡分級。
Sitemap「圖片項目」可以包含圖片主題、類型與授權的相關資訊。
是否該使用 Sitemap?
如果網站上的頁網頁連結妥當,我們的網路檢索器通常可以找出大部分的網站內容。即使如此,Sitemap 還是能夠改善網站的檢索結果,尤其當您的網站符合下列其中一項條件時更有幫助:

網站規模極大: Google 網路檢索器很有可能會因此漏失部分新網頁或近期更新的網頁,沒有檢索到。
網站擁有大量的內容網頁,但這些網頁處於隔離狀態或彼此之間沒有適當的連結: 如果網站上的網頁無法彼此參照,您可以將這些網頁列在 Sitemap 中,確保 Google 不會漏失部分網頁。
網站才剛建立,而且連往該網站的連結不多: Googlebot 和其他網路檢索器是透過網頁層層連結的方式來檢索網頁,因此如果沒有其他網站連往您的網頁,Googlebot 可能很難發現這些網頁。
網站使用 Google 新聞中顯示的互動式多媒體內容,或使用其他與 Sitemap 相容的註解。在適當的情況下,Google 會把 Stiemap 所提供的額外資訊納入搜尋範圍。
由於 Google 的處理程序仰賴複雜的演算法來安排檢索作業,因此即便您使用 Sitemap,Google 也無法保證一定會檢索 Sitemap 中的所有項目並建立索引。不過,提交 Sitemap 絕對不會造成負面影響;在大多數情況下,網站都能因此而受惠。
建立並提交 Sitemap
本頁說明如何建立 Sitemap,以及如何讓 Google 存取 Sitemap。如要進一步瞭解 Sitemap,請參閱這篇文章。

建立並提交 Sitemap:
決定您要讓 Google 檢索網站上的哪些網頁,同時確認每個網頁的標準版本。
決定要使用的 Sitemap 格式。您可以手動建立 Sitemap,也可以選擇透過各種第三方工具產生 Sitemap。
使用 Search Console Sitemap 測試工具來測試您的 Sitemap。
在 robots.txt 檔案中加入您的 Sitemap,或是直接將您的 Sitemap 提交到 Search Console,讓 Google 存取您的 Sitemap。
Sitemap 格式
Google 支援數種 Sitemap 格式,以下提供進一步的說明。

不論採用何種格式,單一 Sitemap 的檔案大小上限為 50MB (未壓縮),且其中包含的網址數量最多為 50,000 個。如果您的檔案較大或網址數量較多,則必須將清單分割成數個 Sitemap。您可以選擇建立 Sitemap 索引檔 (指向 Sitemap 清單的檔案),然後將單一索引檔案提交給 Google,也可以將多個 Sitemap 和/或 Sitemap 索引檔提交給 Google。

針對其他媒體類型使用 Sitemap 擴充元素
Google 支援以下媒體類型的 Sitemap 擴充語法。您可以使用這些擴充元素描述您網站上的影片檔、圖片和其他不易剖析的內容,協助 Google 提升索引效能。

影片
圖片
新聞
Sitemap 通用規範
使用一致且完全符合規定的網址。Google 會完全按照列出的網址進行檢索。舉例來說,如果您的網站位於 http:// www . example . com/,請不要將網址指定為 http:// example . com/ (不含 www) 或 ./mypage.html (相對網址)。
請勿加入 Sitemap 中網址的工作階段 ID,以避免重複檢索這些網址。
指出網址的翻譯版本以供 Google 檢索及建立索引,方法是在 Sitemap 檔案中列出每種語言的標準網址,並使用 hreflang 註解。
Sitemap 檔案必須使用 UTF-8 編碼,並且適當逸出網址。
將大型 Sitemap 分割成數個較小的 Sitemap,以免 Google 頻繁要求 Sitemap,造成伺服器發生超載情形。每個 Sitemap 檔案最多只能包含 50,000 個網址,而且解壓縮後的檔案大小不得大於 50 MB。
使用 Sitemap 索引檔,在其中列出您所有 Sitemap 並提交給 Google,而不要提交個別 Sitemap。
如果從您的 www 網域和非 www 網域都能存取您的網站,請使用建議的標準化方法告知 Google。您只需針對偏好的網域提交 Sitemap。
如果您考慮聘請顧問來協助您進行 Sitemap 最佳化作業,請熟讀我們的《網站管理員指南》和《搜尋引擎最佳化 (SEO) 入門指南》。此外,諮詢經營相似網站或公司的同業也能幫助您善用 Sitemap。
使用 Sitemap 擴充元素指向其他媒體類型,例如影片、圖片和新聞。
如果行動版和桌面版網頁的網址不同,建議您只需指向其中一種版本。不過,如果您認為有必要指向兩個不同網址,請為網址加上註解來指定桌面版和行動版。
如果您有針對不同語言或地區提供替代網頁,您可以使用 Sitemap 或 hreflang 來指定替代網址。
非英數字元和非拉丁字元。 我們要求您將 Sitemap 檔案以 UTF-8 編碼 (您通常可以在儲存檔案時這麼做)。與所有 XML 檔案一樣,下表所列字元的資料值 (包括網址) 都必須使用實體逸出碼。Sitemap 只能包含 ASCII 字元,不可包含大寫 ASCII 字元、特定控制碼或特殊字元,例如 * 和 {}。如果您的 Sitemap 網址包含這些字元,您新增網址時就會收到錯誤訊息。
字元 逸出碼
& 符號 和 &
單引號 ' '
雙引號 " "
大於 > >
小於 < &lt;此外,所有網址 (包含您 Sitemap 的網址在內) 都必須以網址所在與逸出的網路伺服器可解讀的方式編碼。不過,如果您使用任何類型的指令碼、工具或記錄檔來產生網址 (除了手動輸入外的任何方式),那麼通常這些方式都已經執行此動作。提交 Sitemap 後,如果收到 Google 找不到部分網址的錯誤訊息,請確定您的網址符合 RFC-3986 URI 標準、RFC-3987 IRI 標準及 XML 標準。
以下這個範例網址使用了非 ASCII 字元 (ü) 和需要實體逸出的字元 (&):
http:// www . example . com/ümlat.html&q=name
以下是同一個網址,但使用了 ISO-8859-1 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
http:// www . example . com/%FCmlat.html&q=name
以下是同一個網址,但使用了 UTF-8 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
http:// www . example . com/%C3%BCmlat.html&amp;q=name
以下是同一個網址,且實體已逸出:
http:// www . example . com.tw/%C3%BCmlat.html&amp;q=name
讓 Google 存取您的 Sitemap (將您的 Sitemap 提交給 Google)
您可以透過兩種方式讓 Google 存取您的 Sitemap:

使用 Search Console Sitemap 工具將 Sitemap 提交給 Google

在 robots.txt 檔案中任一處插入以下這一行,指定 Sitemap 的路徑。
Sitemap: http:// example . com/sitemap_location.xml
排解 Sitemap 問題
利用 Sitemap 報告管理 Sitemap

「Sitemap」是一種可供網路檢索器 (例如 Googlebot) 使用的檔案,能夠讓這類程式知道您的網站上有哪些可檢索的網頁。雖然大部分的網路檢索器都可以探索及發掘網站上的所有檔案,但 Sitemap 不僅可為檢索器提供協助,還可提供中繼資料 (例如網頁資料異動的頻率,有助於檢索器判定檢索頻率),以及針對搜尋引擎不易剖析的內容 (例如影片或圖片檔案說明) 提供詳細的相關資料。您可以在 Search Console 中利用 Sitemap 報告查看、新增及測試 Sitemap。

使用 Sitemap 報告
Sitemap 報告到達網頁會顯示您已提交給 Search Console 的 Sitemap 清單。不過,只有透過這項工具提交的 Sitemap 才會列在其中;報告中不會列出透過其他方式 (例如 robots.txt 或 google . com/ping) 提供的 Sitemap。

點選表格中的 Sitemap,即可進一步查看其他的相關資訊,包含錯誤訊息在內。如果檔案是 Sitemap 索引(指向多個 Sitemap 的容器檔案),點選後即可進一步查看該索引檔内的 Sitemap 清單。

我的 Sitemap 未列在報告中!

如果報告中並未顯示您的 Sitemap,請檢查下列設定:

資源的偏好網域為何?Google 會把 http:// www . example . com、http:// example . com、https://www . example . com 和 https://example . com 視為不同的網站。因此,您為 http:// example . com 這個網站所提交的 Sitemap 不會出現在 http:// www . example . com 的 Search Console「Sitemap」網頁中。如要解決這個問題,請確認您已加入所有的網站版本,然後告訴 Google 您的偏好網域,並且僅提交偏好網域的 Sitemap。
Sitemap 的提交者是誰? 您所提交的 Sitemap 會顯示在「由我提交」分頁中,而他人所提交的 Sitemap 僅會顯示在「全部」分頁中。
您當初是透過這個網頁提交 Sitemap 的嗎? 只有使用這份報告所提交的 Sitemap 才會列在其中;即使 Google 可以找出並使用透過 google . com/ping 或 robots.txt 所提交的 Sitemap,但報告中依然不會列出這類 Sitemap。
完整的錯誤清單
無法存取網址
出現這項錯誤代表 Google 嘗試檢視 Sitemap 中的網址時發生錯誤。

請確定該檔案放在指定的位置。
使用 robots.txt 測試工具進行驗證,確認哪個檔案造成封鎖。
使用 Google 模擬器工具查看 robots.txt是不是造成封鎖的原因。
如果我們曾嘗試檢索您 Sitemap 中的網址 (但已失敗),請確定您 Sitemap 中的網址正確無誤。
無法追蹤網址
如果出現這項錯誤,通常代表您有部分網址包含過多重新導向連結,導致 Google 網路檢索器無法追蹤,因而造成 Google 無法順利處理 Sitemap 中的所有內容。建議您替換每個會重新導向其他網頁的網址,改為重新導向後會指向實際連結網址的網址。

下列幾點說明了 Google 無法追蹤重新導向的另一些原因和可能的解決方案:

請使用 Lynx 這類文字瀏覽器來檢查您的網站,因為許多搜尋引擎檢視網站的方法與 Lynx 十分類似。如果 JavaScript、Cookie、工作階段 ID、頁框、DHTML 或 Flash 等功能讓您無法透過文字瀏覽器瀏覽網站上的所有內容,則搜尋引擎的自動尋檢程式在檢索您網站時可能會發生問題。
如果您固定會將網頁重新導向至另一個網址,可以使用永久重新導向機制;不過請避免使用 JavaScript 或自動定時更新的重新導向方式。
儘可能使用絕對路徑或完整連結,而不要使用相對連結。舉例來說,如要連結至您網站上的另一個網頁,請連到 https://www . example . com/mypage.html,而不要只連到 mypage.html。
不允許的網址
您的 Sitemap 中部分網址所處的路徑階層高於 Sitemap 檔案,或是所處的網域與 Sitemap 檔案不同。

層級較高:如果您的 Sitemap 是列在 http:// www . example . com/<我的網站>/sitemap.xml 之下,則下列網址對於該 Sitemap 是無效的:

http:// www . example . com/:所處的路徑階層高於 Sitemap
http:// www . example . com/<您的網站>/:位於與 Sitemap 平行的目錄中
網域不同:檢查所有網址開頭的網域是否都與 Sitemap 所在的網域相同。舉例來說,如果您的 Sitemap 是列在 http:// www . example . com/sitemap.xml 之下,則下列網址對於該 Sitemap 是無效的:

http:// example . com/:缺少「www」
www . example . com/:缺少「http」
https://www . example . com/:使用 https (而不是 http)
壓縮錯誤
Google 在嘗試解壓縮您的 Sitemap 壓縮檔時發生錯誤。請使用 gzip 等工具重新壓縮 Sitemap 並上傳到您的網站,然後重新提交 Sitemap。

Sitemap 檔案內容空白
您的 Sitemap 中沒有任何網址。請檢查您的 Sitemap,並確定內容並非空白。如果您的 Sitemap 使用 Sitemap 通訊協定,請確認網址均已正確標記。

Sitemap 檔案大小錯誤:您的 Sitemap 超過檔案大小上限...
您的 Sitemap 解壓縮後大於 50MB。如果您的 Sitemap 超過大小上限,請分割成數個較小的 Sitemap,並將這些 Sitemap 列在另一個 Sitemap 索引檔中,然後再提交這個索引檔。

屬性值無效
您為 XML 標記屬性指派了無效的值。請檢查您的 Sitemap,確保其中的屬性都是允許的屬性,而您也完全根據 Sitemap 規範指派允許的值。另請檢查屬性和值是否有錯字。

日期無效
您的 Sitemap 中含有一或多個無效的日期。這可能是因為日期格式不正確,或日期本身是無效的。您可以忽略時間部分,但必須使用 W3C 日期時間編碼來指定日期。請確認您的日期符合下列任一種 W3C 日期時間格式:

2005-02-21
2005-02-21T18:00:15+00:00
您可以選擇是否指定時間 (預設時間為 00:00:00Z)。如果選擇指定時間,則必須一併指定時區。

標記值無效
您的 Sitemap 中有一或多標記值是無效的。這則錯誤訊息通常會列出有問題的標記。請查看 Sitemap 類型的相關規範 (索引、標準、影片等)。

網址無效
您的 Sitemap 中有無效的網址。這可能是因為該網址含有不支援的字元、空格或其他字元 (例如引號),或是網址的格式可能不正確 (例如將 http:// 誤植為 htp://)。請確認 Sitemap 中所列的網址均採用可解讀的編碼格式以及正確的字元逸出方式。檢查網址是否含有任何不正確的字元 (例如空格或引號)。您也可以試著將網址複製到瀏覽器,看看瀏覽器是否能辨識網址並載入網頁。
Sitemap 索引檔中的網址無效:網址不完整
您的 Sitemap 索引檔沒有包含每個所列 Sitemap 檔案的完整網址。查詢 Sitemap 索引檔時,我們會嘗試在相同的目錄中查看其中的檔案。舉例來說,如果您的 Sitemap 索引檔位於 http:// www . example . com/folder1/sitemap_index.xml,並將某一 Sitemap 列為 sitemap.xml,那麼我們會在 http:// www . example . com/folder1/sitemap.xml 尋找該 Sitemap。如果在該處找不到 Sitemap,您就會看到這次嘗試的錯誤訊息。

更新您的 Sitemap 索引檔案,納入所有列載的 Sitemap 檔案的完整路徑,然後再進行提交。

XML 無效:過多標記
您的 Sitemap 內含重複的標記。舉例來說,以下檔案就會發生這類錯誤,因為它列出了兩次 <loc> 標記:

<url>
<loc>http:// www . example . com/</loc>
<loc>http:// www . example . com/page1.html</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
錯誤訊息會列出有問題的標記及行號。請移除重複的標記,然後重新提交您的 Sitemap。

缺少 XML 屬性
您的 Sitemap 中有標記缺少必要的屬性。請檢查您的 Sitemap,確認沒有缺少任何必要的屬性。修正這類屬性值後,請重新提交 Sitemap。
缺少 XML 標記
您的 Sitemap 中有一或多個項目缺少必要的標記。錯誤訊息會列出有錯誤的行號。如需必要標記的相關資訊,請參閱 Sitemap 基本資訊頁面。

缺少縮圖網址
有一或多個影片項目缺少縮圖網址。請務必使用 <video:thumbnail_loc> 標記來指定任何縮圖網址的位置。

缺少影片標題
有一或多個影片項目缺少標題。請務必使用 <video:title> 標記來指定 Sitemap 中每部影片的標題。

Sitemap 索引格式不正確:巢狀 Sitemap 索引
您的 Sitemap 索引檔中有一或多個項目使用本身的網址或其他 Sitemap 索引檔的網址。

Sitemap 索引檔不得含有其他 Sitemap 索引檔,只能列出 Sitemap 檔案。

移除任何指向 Sitemap 索引檔的項目,然後重新提交您的 Sitemap。
剖析錯誤
Google 無法剖析 Sitemap 的 XML。
通常,這是因為其中所列網址含有未照規定逸出的字元。如同所有 XML 檔案,任何資料值 (包括網址) 都必須針對特定字元使用實體逸出碼,例如連字符號 (&)、單引號 (')、雙引號 (")、小於 (<) 和大於 (>) 符號。請務必確認您的網址是否適當逸出。

暫時性錯誤
系統暫時遇到問題,無法處理您的 Sitemap。一般而言,出現這個錯誤時,您無需重新提交 Sitemap。Google 稍後會再次嘗試擷取您的 Sitemap。如果數小時後這項錯誤依然存在,請嘗試重新提交 Sitemap。

Sitemap 索引檔中含有過多 Sitemap
您的 Sitemap 索引檔列出的 Sitemap 超過 50,000 個。請將 Sitemap 索引分割成多個 Sitemap 索引檔,並確認每個檔案所包含的 Sitemap 數量未超過上限 (50,000 個)。

Sitemap 中含有過多網址
您的 Sitemap 列出的網址超過 50,000 個。請將 Sitemap 分割成多個 Sitemap,並確認每個 Sitemap 所包含的網址未超過 50,000 個。此外,您也可以使用 Sitemap 索引檔管理 Sitemap。

不支援的格式
系統不支援您的 Sitemap 格式。Sitemaps 必須是 XML 格式,並使用正確標頭。
常見的 XML 錯誤:

您的 Sitemap 必須使用正確的標頭。例如,如果您的 Sitemap 含有影片資訊,則必須具備下列標頭:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http:// www . sitemaps . org/schemas/sitemap/0.9"
xmlns:video="http:// www . google . com/schemas/sitemap-video/1.1">
標頭中的命名空間必須為 "http:// www . sitemaps . org/schemas/sitemap/0.9" (而不是 .9)。
所有的 XML 屬性都必須用單引號 (') 或雙引號 (") 括住,而且必須是半形引號而非全形引號,Microsoft Word 這類文書處理程式可能會插入全形引號。
路徑不符:缺少 www
您的 Sitemap 路徑不含 www 前置字串 (例如 http:// example . com/sitemap.xml),但實際列出的網址卻包含前置字串 (例如 http:// www . example . com/myfile.html)。

如果您想將包含 www 網址的 Sitemap 提交到非 www 網域,請選擇 www 網域做為您網站的偏好網域。

否則,請在 Sitemap 中移除所有網址前面的「www」,使這些網址和 Sitemap 位於相同網域。

路徑不符:包含 www
您的 Sitemap 路徑包含 www 前置字串 (例如 http:// www . example . com/sitemap.xml),但實際列出的網址卻不含前置字串 (例如 http:// example . com/myfile.xml)。

如果您想將不含 www 網址的 Sitemap 提交到 www 網域,請選擇非 www 網域做為您網站的偏好網域。

否則,請在 Sitemap 中為所有網址添加「www」,使這些網址和 Sitemap 位於相同網域。

命名空間不正確
您的 Sitemap 的根元素可能並未使用正確的命名空間,也可能是命名空間宣告不正確,或是拼字或網址錯誤。

請務必依檔案類型使用正確的命名空間。例如:

Sitemap 檔案:xmlns="http:// www . sitemaps . org/schemas/sitemap/0.9"
影片 Sitemap 檔案:xmlns:video="http:// www . google . com/schemas/sitemap-video/1.1"
Sitemap 索引檔案:<sitemapindex xmlns="http:// www . sitemaps . org/schemas/sitemap/0.9">
其他 Sitemap 類型...
開頭為空格
您的 Sitemap 開頭為空格,而不是命名空間宣告。XML 檔案的開頭必須是 XML 宣告,用於指定要使用的 XML 版本。

這項錯誤並不會妨礙 Google 處理您的 Sitemap,但建議您移除空格,讓檔案符合 XML 標準,以後就不會再看到這個錯誤。

HTTP 錯誤
Google 嘗試下載您的 Sitemap 時發生 HTTP 錯誤。這個訊息會顯示我們收到的狀態碼 (例如 404)。請確認您指定的 Sitemap 網址是正確的,且您的 Sitemap 的確位於該位置,然後重新提交 Sitemap。

縮圖過大
您的 Sitemap 中所指定的影片縮圖過大。詳情請參閱「影片 Sitemap 研究室功能」網頁,並請將您的影片縮圖大小調整為 160x120 像素,然後更新 Sitemap 中的縮圖資訊,再重新提交 Sitemap。進一步瞭解如何在 Sitemap 中加入影片資訊。

縮圖過小
您的 Sitemap 中所指定的影片縮圖過小。請將您的影片縮圖大小調整為 160x120 像素,必要時請更新您的 Sitemap。

影片位置和播放網頁位置相同
影片 Sitemap 中的影片內容網址不得與播放器網址相同。如果您同時提供 <video:player_loc> 和 <video:content_loc>,則必須使用不同的網址。

影片位置網址是播放網頁網址
影片 Sitemap 中的 <video:content_loc> 網址指向代管播放器的網頁。

Googlebot 遭到 robots.txt 封鎖
Google 遭到 robots.txt 封鎖,因此無法存取您的 Sitemap,或是無法存取其中列出的所有內容。請使用 robots.txt 測試工具進行驗證,確認哪個檔案封鎖了 Googlebot,然後據此修改 robots.txt 檔案中的相關設定,允許 Googlebot 存取 Sitemap。
分類