Podziel sitemap XML na mniejsze pliki, tak aby każdy plik zawierał maksymalnie URL-i i nie przekraczał 50 MB (uncompressed). Następnie utwórz plik indeksu sitemapów, który odwołuje się do tych mniejszych plików. Dzięki temu spełnisz wymogi protokołu sitemaps i ułatwisz de facto indeksowanie całej treści strony.
Zasady i limity
- Maksymalny rozmiar jednego pliku sitemap: do 50 MB niecompression (oraz do URL-i).
- Maksymalny rozmiar pliku indeksu: do 10 MB (uncompressed) i do odwołań do plików sitemap.
- Struktura plików: każdy sitemap to URLset z namespace http://www.sitemaps.org/schemas/sitemap/0.9; plik indeksu to SitemapIndex z tym samym namespace.
- Pola w każdej pozycji: loc (wymagany), lastmod (opcjonalny), changefreq (opcjonalny), priority (opcjonalny).
- Kompresja: zalecana — gzip zwiększa efektywność transferu bez utraty danych.
Jak podzielić sitemapy krok po kroku
- Zbierz wszystkie URL-e z źródła (baza danych, CMS, plik CSV).
- Wybierz rozmiar paczki, np. 40 000–wpisów na plik.
- Uruchom generator, który zapisuje kolejne pliki sitemap-001.xml, sitemap-002.xml, …
- Dla każdego pliku wygeneruj poprawny header, urlset i wpisy URL.
- Utwórz plik indeksu sitemap_index.xml z listą lokacji poszczególnych plików (lokacje to ścieżki do plików sitemap-xxx.xml).
- Zweryfikuj poprawność XML dla każdego pliku oraz dla indeksu.
- Wgraj pliki na serwer i przetestuj dostępność z zewnątrz.
- W Google Search Console i / lub Bing Webmaster Tools dodaj plik indeksu.
Przykładowa struktura plików
- sitemaps/sitemap_index.xml
- sitemaps/sitemap-001.xml
- sitemaps/sitemap-002.xml
- sitemaps/sitemap-003.xml.gz
Najczęstsze błędy i jak ich unikać
- Błąd przekroczenia limitów: nie mieszczaj zbyt wielu URL w jednym pliku. Używaj automatycznego podziału.
- Brak poprawnej składni XML: waliduj każdy plik przed publikacją.
- Nieaktualne URL-e: utrzymuj lastmod zgodnie z rzeczywistymi zmianami.
- Nieprawidłowe wpisy w indeksie: każda lokacja powinna prowadzić do istniejącego pliku sitemap.
- Brak aktualizacji indeksu po zmianach: za każdym ponownym podziałem aktualizuj plik indeksu.
- Nieoptymalna kompresja: jeśli serwer nie obsługuje gzip, nie zaszkodzi pozostawić niezwinięte pliki, ale warto użyć gzip jeśli to możliwe.
- Niezgodność z protokołem: używaj właściwych namespace i struktur URLset / SitemapIndex.
- Brak testów po publikacji: sprawdź, czy wszystkie URL-e są dostępne i zwracają poprawny status 200.
Narzędzia i techniki automatyzacji
- Skrypty generujące sitemapy: Python, Perl, PHP, JavaScript (Node.js) mogą bez problemu tworzyć wiele plików i indeks.
- Wtyczki i moduły CMS: w ekosystemach CMS znajdziesz gotowe rozwiązania do dzielenia sitemapów na mniejsze pliki.
- Walidacja i testy: używaj lokalnych walidatorów XML i narzędzi do weryfikacji sitemaps online.
Weryfikacja i monitoring
- Sprawdź, czy każdy plik sitemap-xxx.xml jest dostępny po zgłoszeniu w narzędziach dla webmasterów.
- Sprawdź, czy plik indeksu zawiera wszystkie odnośniki do plików sitemap i że nie ma duplikatów.
- Regularnie aktualizuj mapę, gdy dodajesz nowe strony lub usuwasz stare.
Podsumowanie praktyki
- Dbaj o limity: URL-i i 50 MB na plik, 10 MB na plik indeksu.
- Generuj pliki automatycznie z jednego źródła danych.
- Używaj pliku indeksu i publikuj go w Google Search Console/Bing Webmaster Tools.
- Waliduj każdy plik i monitoruj dostępność.
Często Zadawane Pytania
Co to jest plik indeksu sitemapy
Plik indeksu sitemapy zawiera odniesienia do wielu plików sitemap i pomaga wyszukiwarkom łatwo je odnaleźć.
Jaki jest maksymalny rozmiar jednego pliku sitemap
Maksymalnie 50 MB uncompressed i do 50 000 URL-i.
Czy warto kompresować sitemapy
Tak, gzip zmniejsza rozmiar i przyspiesza transfer.
Czy zawsze muszę umieszczać lastmod
Nie, ale warto dodać lastmod dla lepszej informacji o aktualizacjach.
Jak wygenerować podzielone pliki sitemapy automatycznie
Użyj skryptu w wybranym języku programowania, który odczytuje źródło URL i zapisuje kolejne pliki sitemap-xxx.xml.
Jak zgłosić sitemapy do wyszukiwarek
Zaloguj się do narzędzi dla webmasterów i dodaj plik indeksu sitemapowego w odpowiednim interfejsie.
Co zrobić jeśli jeden plik zawiera błędy
Zweryfikuj plik, napraw błędy, usuń uszkodzone wpisy i zaktualizuj indeks.
Czy mogę dzielić sitemapy na różne wersje językowe
Tak, możesz tworzyć osobne sitemapy dla różnych regionów lub języków i łączyć je w oddzielnym indeksie.