Blog · ⏱ 6 phút đọc · 1,050 từ

Sitemap XML Là Gì? Cách Tạo & Submit Sitemap Lên Google

AD
admin
Vidco Group
📅 25/03/2026 • Cập nhật: 07/04/2026
Sitemap XML Là Gì? Cách Tạo & Submit Sitemap Lên Google

Sitemap XML là gì? Sitemap XML là một file có định dạng XML đặt tại thư mục gốc của website (example.com/sitemap.xml), liệt kê tất cả URL quan trọng của site cùng metadata bổ sung (ngày cập nhật, tần suất thay đổi, mức độ ưu tiên) để giúp search engine bot crawl và index website hiệu quả hơn. Theo Google Webmaster Guidelines 2025, Sitemap XML giúp Googlebot discover URL nhanh hơn 50-80% so với chỉ dựa vào crawl tự nhiên, đặc biệt quan trọng với site mới hoặc site có cấu trúc phức tạp.

Tại Sao Sitemap XML Quan Trọng Với SEO?

Sitemap giải quyết vấn đề cốt lõi: Googlebot có thể không tìm thấy mọi URL trên site của bạn — đặc biệt URL mới, URL ít backlink, URL sâu trong cấu trúc. Sitemap là “bản đồ” chỉ đường cho bot. Kết hợp với Robots.txt (nói bot đừng đi đâu) và Canonical Tag (nói URL nào là chính), Sitemap hoàn thiện bộ ba technical SEO cơ bản.

Khi Nào Sitemap Đặc Biệt Cần Thiết?

  • Website mới — chưa có backlink, bot khó tự discover URL
  • Site lớn (+1,000 trang) — đảm bảo mọi trang quan trọng được crawl
  • E-commerce — hàng nghìn product pages cần index nhanh
  • Content thay đổi thường xuyên — news site, blog daily cần lastmod cập nhật
  • Orphan pages — trang không có internal link trỏ đến

Cấu Trúc Sitemap XML Cơ Bản

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/bai-viet/</loc>
    <lastmod>2026-04-01</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Sitemap Index — Cho Site Lớn

Google giới hạn 50,000 URL và 50MB mỗi sitemap. Site lớn dùng Sitemap Index file để tổ chức nhiều sitemap con. WordPress Yoast SEO tự động tạo sitemap_index.xml chia thành: post sitemap, page sitemap, category sitemap, image sitemap.

Các Loại Sitemap Chuyên Biệt

Loại SitemapDùng choTag đặc biệt
Standard SitemapTất cả URL<loc>, <lastmod>
Image SitemapẢnh cần index trong Google Images<image:image>
Video SitemapVideo cần xuất hiện rich results<video:video>
News SitemapBài viết tin tức (24h gần nhất)<news:news>
hreflang SitemapSite đa ngôn ngữ<xhtml:link>

Tạo Sitemap Tự Động Cho WordPress

Yoast SEO và Rank Math đều tự động tạo và cập nhật sitemap.xml. Cài đặt: Yoast → General → Features → XML Sitemaps (bật). URL sitemap: example.com/sitemap_index.xml. Kiểm tra sitemap accessible bằng cách truy cập URL trực tiếp trên browser.

Submit Sitemap Lên Google Search Console

Trong Google Search Console: Sitemaps → Add new sitemap → Nhập URL sitemap → Submit. GSC sẽ crawl sitemap và báo cáo: số URL submitted, số URL indexed, và lỗi nếu có. Check lại sau 48h. Nếu URL indexed thấp hơn submitted nhiều → có vấn đề về Duplicate Content, noindex, hoặc content quality.

Lỗi Sitemap Phổ Biến

  • URL trong sitemap bị disallow trong robots.txt — mâu thuẫn, Google sẽ bỏ qua URL đó
  • URL bị redirect (301/302) — chỉ đưa URL canonical cuối cùng vào sitemap
  • URL noindex trong sitemap — mâu thuẫn: muốn index (sitemap) nhưng lại noindex
  • lastmod luôn là ngày hôm nay — bot nhận ra trick này và bỏ qua lastmod của bạn
  • Không cập nhật sitemap khi xóa trang — URL 404 trong sitemap gây crawl lãng phí

Sitemap Và Crawl Budget

Sitemap giúp phân bổ Crawl Budget hiệu quả: chỉ đưa URL quan trọng, có content chất lượng vào sitemap. Không đưa vào: trang tag/category không có nội dung riêng, trang faceted navigation, URL với parameter, trang author archive (nếu ít content). Priority tag (0.0-1.0) và changefreq là gợi ý, Google có thể không tuân theo.

Câu Hỏi Thường Gặp (FAQ)

Website nhỏ có cần sitemap không?

Về kỹ thuật: site nhỏ <10 trang với internal link tốt, Google tự tìm được. Nhưng tạo sitemap luôn là best practice — miễn phí, không hại, và giúp index nhanh hơn. Đặc biệt cần khi site mới (chưa có backlink) hoặc muốn đảm bảo URL mới được discover sớm.

Sitemap HTML khác sitemap XML thế nào?

Sitemap XML là cho search engine bots (robot-readable). Sitemap HTML là trang web cho người dùng xem cấu trúc site (human-readable). SEO hiện đại chủ yếu nói về XML sitemap. HTML sitemap vẫn hữu ích cho UX nhưng ít ảnh hưởng SEO hơn trước.

Bao lâu nên cập nhật sitemap một lần?

Với WordPress + Yoast/Rank Math: sitemap tự động cập nhật khi publish post mới hoặc xóa post. Với site static: cập nhật thủ công khi có thay đổi URL. Google crawl sitemap định kỳ (thường 1-7 ngày) nên không cần push thủ công trừ khi có batch URL mới cần index gấp.

AD
admin
Content Strategist · Vidco Group
10+ năm kinh nghiệm về SEO, AEO và GEO. Chuyên gia tối ưu hóa nội dung cho các công cụ tìm kiếm thế hệ mới — Google, ChatGPT, Gemini và Perplexity.

Thương hiệu bạn xứng đáng
được AI nhắc đến.

Đặt lịch AI Visibility Audit miễn phí — Vidco Group sẽ cho bạn thấy bức tranh toàn cảnh.

034.301.8345 Chat Zalo