BLOG · PROGRAMMATIC SEO

Jak poprawnie dzielić sitemapy XML na mniejsze pliki?

✍️ Autor: Zespół semprojekt 🎯 Kategorie: Programmatic SEO, Ruch organiczny

Podziel sitemap XML na mniejsze pliki, tak aby każdy plik zawierał maksymalnie URL-i i nie przekraczał 50 MB (uncompressed). Następnie utwórz plik indeksu sitemapów, który odwołuje się do tych mniejszych plików. Dzięki temu spełnisz wymogi protokołu sitemaps i ułatwisz de facto indeksowanie całej treści strony.

Zasady i limity

  • Maksymalny rozmiar jednego pliku sitemap: do 50 MB niecompression (oraz do URL-i).
  • Maksymalny rozmiar pliku indeksu: do 10 MB (uncompressed) i do odwołań do plików sitemap.
  • Struktura plików: każdy sitemap to URLset z namespace http://www.sitemaps.org/schemas/sitemap/0.9; plik indeksu to SitemapIndex z tym samym namespace.
  • Pola w każdej pozycji: loc (wymagany), lastmod (opcjonalny), changefreq (opcjonalny), priority (opcjonalny).
  • Kompresja: zalecana — gzip zwiększa efektywność transferu bez utraty danych.

Jak podzielić sitemapy krok po kroku

  1. Zbierz wszystkie URL-e z źródła (baza danych, CMS, plik CSV).
  2. Wybierz rozmiar paczki, np. 40 000–wpisów na plik.
  3. Uruchom generator, który zapisuje kolejne pliki sitemap-001.xml, sitemap-002.xml, …
  4. Dla każdego pliku wygeneruj poprawny header, urlset i wpisy URL.
  5. Utwórz plik indeksu sitemap_index.xml z listą lokacji poszczególnych plików (lokacje to ścieżki do plików sitemap-xxx.xml).
  6. Zweryfikuj poprawność XML dla każdego pliku oraz dla indeksu.
  7. Wgraj pliki na serwer i przetestuj dostępność z zewnątrz.
  8. W Google Search Console i / lub Bing Webmaster Tools dodaj plik indeksu.

Przykładowa struktura plików

  • sitemaps/sitemap_index.xml
  • sitemaps/sitemap-001.xml
  • sitemaps/sitemap-002.xml
  • sitemaps/sitemap-003.xml.gz

Najczęstsze błędy i jak ich unikać

  • Błąd przekroczenia limitów: nie mieszczaj zbyt wielu URL w jednym pliku. Używaj automatycznego podziału.
  • Brak poprawnej składni XML: waliduj każdy plik przed publikacją.
  • Nieaktualne URL-e: utrzymuj lastmod zgodnie z rzeczywistymi zmianami.
  • Nieprawidłowe wpisy w indeksie: każda lokacja powinna prowadzić do istniejącego pliku sitemap.
  • Brak aktualizacji indeksu po zmianach: za każdym ponownym podziałem aktualizuj plik indeksu.
  • Nieoptymalna kompresja: jeśli serwer nie obsługuje gzip, nie zaszkodzi pozostawić niezwinięte pliki, ale warto użyć gzip jeśli to możliwe.
  • Niezgodność z protokołem: używaj właściwych namespace i struktur URLset / SitemapIndex.
  • Brak testów po publikacji: sprawdź, czy wszystkie URL-e są dostępne i zwracają poprawny status 200.

Narzędzia i techniki automatyzacji

  • Skrypty generujące sitemapy: Python, Perl, PHP, JavaScript (Node.js) mogą bez problemu tworzyć wiele plików i indeks.
  • Wtyczki i moduły CMS: w ekosystemach CMS znajdziesz gotowe rozwiązania do dzielenia sitemapów na mniejsze pliki.
  • Walidacja i testy: używaj lokalnych walidatorów XML i narzędzi do weryfikacji sitemaps online.

Weryfikacja i monitoring

  • Sprawdź, czy każdy plik sitemap-xxx.xml jest dostępny po zgłoszeniu w narzędziach dla webmasterów.
  • Sprawdź, czy plik indeksu zawiera wszystkie odnośniki do plików sitemap i że nie ma duplikatów.
  • Regularnie aktualizuj mapę, gdy dodajesz nowe strony lub usuwasz stare.

Podsumowanie praktyki

  • Dbaj o limity: URL-i i 50 MB na plik, 10 MB na plik indeksu.
  • Generuj pliki automatycznie z jednego źródła danych.
  • Używaj pliku indeksu i publikuj go w Google Search Console/Bing Webmaster Tools.
  • Waliduj każdy plik i monitoruj dostępność.

Często Zadawane Pytania

Co to jest plik indeksu sitemapy

Plik indeksu sitemapy zawiera odniesienia do wielu plików sitemap i pomaga wyszukiwarkom łatwo je odnaleźć.

Jaki jest maksymalny rozmiar jednego pliku sitemap

Maksymalnie 50 MB uncompressed i do 50 000 URL-i.

Czy warto kompresować sitemapy

Tak, gzip zmniejsza rozmiar i przyspiesza transfer.

Czy zawsze muszę umieszczać lastmod

Nie, ale warto dodać lastmod dla lepszej informacji o aktualizacjach.

Jak wygenerować podzielone pliki sitemapy automatycznie

Użyj skryptu w wybranym języku programowania, który odczytuje źródło URL i zapisuje kolejne pliki sitemap-xxx.xml.

Jak zgłosić sitemapy do wyszukiwarek

Zaloguj się do narzędzi dla webmasterów i dodaj plik indeksu sitemapowego w odpowiednim interfejsie.

Co zrobić jeśli jeden plik zawiera błędy

Zweryfikuj plik, napraw błędy, usuń uszkodzone wpisy i zaktualizuj indeks.

Czy mogę dzielić sitemapy na różne wersje językowe

Tak, możesz tworzyć osobne sitemapy dla różnych regionów lub języków i łączyć je w oddzielnym indeksie.

ZOBACZ TAKŻE:

Zdobądź darmowy ruch organiczny
Programmatic SEO w praktyce
Pobierz bezpłatny materiał o tym, jak zbudować system, który generuje stały ruch z Google bez zwiększania budżetu reklamowego.
Pobierz PDF
Plik PDF. Zero spamu.