Posts RSS Comments RSS 33 Wpisy and 8 Komentarze till now

XML oraz GoogleSitemaps – jak to zrobić?

Co to sÄ… sitemaps i do czego siÄ™ je stosuje?

Mapy stron – sÄ… to pliki napisane w formacie XML’a (extensible markup language), które zawierajÄ… listÄ™ wszystkich podstron naszego serwisu www. SÄ… one najlepszym sposobem poinformowania crawlerów (robotów przeglÄ…darek) o caÅ‚ej zawartoÅ›ci naszej strony. ZgÅ‚aszajÄ…c stronÄ™ np. do google klasycznym sposobem poprzez podanie jej adresu w formularzu na stronie google.pl/addurl nie mamy pewnoÅ›ci, że wszystkie podstrony zostanÄ… odpowienio skrupulatnie dodane do cache.

Tutaj z pomocÄ… przychodzi GoogleSipemaps, które udostÄ™pniajÄ… nam protokół informowania silników wyszukiwarek o naszych zasobach. Istotne, że nie posiada on limitów (praktycznie) – możemy dodać naprawdÄ™ nieograniczenie wysokÄ… liczbÄ™ adresów podstron. Dodatkowo w praktyce indeksowanie odbywa siÄ™ szybciej (nawet do 24 h) oraz jesteÅ›my w stanie umieÅ›cić informacjÄ™ o najlepszym interwale kolejnej wizyty robota – np. w zależnoÅ›ci jak czÄ™sto uaktalniamy zawartość naszych stron.

Co robi dla nas XML w tej sprawie?

Strukturalnie mapa strony to plik .xml i zgodnie z jego skÅ‚adniÄ… tworzony jest listing dla google’a. Szkielet pliku sitemap.xml wyglÄ…da nastÄ™pujÄ…co:

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
 <loc>http://www.example.com/</loc>
 <lastmod>2005-01-01</lastmod>
 <changefreq>monthly</changefreq>
 <priority>0.8</priority>
 </url>
 </urlset>

Ok, teraz sÅ‚owem wyjaÅ›nienia. Jak widać dokument xml to opis struktury, stworzony na bazie odpowiednio użytych znaczników (tagów np: <url></url>). To one opisujÄ… hierarchiÄ™ budowy strony w sposób zrozumiaÅ‚y dla aplikacji indeksujÄ…cych. Widzimy w naszym przykÅ‚adzie kilka dodatkowych deklaracji: “xml version”mówi o wersji xml’a z jakiego korzystaliÅ›my przy budowaniu dokumentu, “loc” to adres URL naszej strony, “lastmod” informuje o dacie ostatniej modyfikacji, “changefreq” informuje boty co jaki okres czasu powinny odwiedzać nasze strony, “priority” to znacznik niosÄ…cy informacjÄ™ o wadze danej podstrony w zbiorze wszystkich zgÅ‚aszanych.

NarzÄ™dzia – pomocny Sitemap Generator.

Można by pisać sitemap’s rÄ™cznie ;) ale jeÅ›li masz 800 podstron do zindeksowania w google to bardzo niepolecana metoda. Nie jest jednak tak źle jakby można byÅ‚o sÄ…dzić – w sieci jest wiele użytecznych aplikacji, które wykonujÄ… wszystkie czynnoÅ›ci (no prawie) za nas. WystarczÄ… trzy kroki aby stać siÄ™ posiadaczem sitemap.xml z indeksem naszych podstron.

SitemapGenerator to skrypt napisany w języku Python, który uruchomiony na serwerze dokonuje indeksacji podstron danego adresu http/https do formatu sitemap.xml . Korzysta on z SitemapProtocol. Do dzieła:

pobieramy z adresu

http://sourceforge.net/project/showfiles.php?group_id=137793&package_id=153422 paczkÄ™ zawierajÄ…cÄ… pliki naszego skryptu

  1. modyfikujemy plik konfiguracji example_config.xml i zapisujemy jako config.xml
  2. odpalamy sitemap_gen.py (za pomocÄ… interpretera perl’a)
  3. naszą mapę dodajemy korzystając z narzędzi google

Podsumowanie – zasady.
Google stawia pewne wymagania na sitemap’y, które majÄ… być zgÅ‚oszone do indeksacji należy o nich pamiÄ™tać jeÅ›li chcemy aby nasze metody byÅ‚y skuteczne:

  • plik mapy strony nie może zawierać wiÄ™cej niż 50,000 url’i (adresów)
  • plik nie może być wiÄ™kszy niż 10Mb
  • wszystkie tagi xml majÄ… posiadać tag zamykajÄ…cy (<np></np>)
  • zawartość pliku musi przechodzić poprawnie walidacjÄ™ (weryfikacja poprawnoÅ›ci)

Co jeszcze ? Mapy – Map ?

Jako uzupełnienie podam informację, że możemy również tworzyć mapy map ;) czyli spis map wszystkich posiadanych przez nas serwisów. W tym artykule pominę ten temat gdyż wybiega poza zamysł autora. Być może powstanie druga część na ten temat.

Zakończenie.

Tematyka tworzenia map jest bardzo obszerna, gdyż daje webmasterom duże możliwoÅ›ci. W przypadku problemów najlepiej jest siÄ™ zwócić do dokumentacji google’a, która doskonale opisuje wszystkie opcje konfiguracji oraz metody.

Powodzenia!

One Response to “XML oraz GoogleSitemaps – jak to zrobić?”

  1. [...] Bardzo dobrym rozwiązaniem jest stworzenie mapy strony i zgłoszenie jej w narzędziach dla webmasterów google. Jeśli chcesz się dowiedzieć więcej odsyłam do mojego tekstu na temat tworzenia google sitemap (mapy stron). [...]

Trackback this post | Feed on Comments to this post

Leave a Reply

You must be logged in to post a comment.