<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Efrenzy Interactive Webdesign&#38;SEO Kraków &#187; robots.txt</title>
	<atom:link href="http://blog.efrenzy.pl/tag/robotstxt/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.efrenzy.pl</link>
	<description>Blog by Michał Kowalski.</description>
	<lastBuildDate>Fri, 11 Jun 2010 20:28:04 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Plik robots.txt poprawna składnia.</title>
		<link>http://blog.efrenzy.pl/2008/01/07/plik-robotstxt-poprawna-skladnia/</link>
		<comments>http://blog.efrenzy.pl/2008/01/07/plik-robotstxt-poprawna-skladnia/#comments</comments>
		<pubDate>Mon, 07 Jan 2008 12:35:38 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO & Pozycjonowanie]]></category>
		<category><![CDATA[Webdesign]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[robots.txt]]></category>
		<category><![CDATA[webdesign]]></category>

		<guid isPermaLink="false">http://blog.efrenzy.pl/2008/01/07/plik-robotstxt-poprawna-skladnia/</guid>
		<description><![CDATA[Krótki tekst o tym jak powinien wyglądać poprawnie napisany plik dla robotów wyszukiwarek internetowych. Jeśli nie wiesz jeszcze jak się do tego zagadnienia zabrać to zapraszam to czytania.
Co to i po co to &#8211; wprowadzenie.
Mniej więcej na przełomie lat 1993/1994 wraz z coraz większym natężeniem ruchu crawler&#8217;ów, (zwanych też pająkami) na różnych serwerach stron www [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Krótki tekst o tym jak powinien wyglądać poprawnie napisany plik dla robotów wyszukiwarek internetowych. Jeśli nie wiesz jeszcze jak się do tego zagadnienia zabrać to zapraszam to czytania.</strong><span id="more-23"></span></p>
<p><strong>Co to i po co to &#8211; wprowadzenie.</strong></p>
<p>Mniej więcej na przełomie lat 1993/1994 wraz z coraz większym natężeniem ruchu crawler&#8217;ów, (zwanych też pająkami) na różnych serwerach stron www zdarzały się sytuacje, że indeksowały one treści, które nie były z różnych powodów przeznaczone do rozpowszechniania. Przykładowo strony, które nie były tworzone z koncepcją udostępniania ich zawartości dla ogółu internetowej społeczności, a z różnych względów nie posiadały odpowiednich mechanizmów zabezpieczających. Dodatkową możliwością jest generowanie zbyt dużego ruchu w ramach lokalizacji internetowej, co mogło powodować zwiększone obciążenie serwerów. Wymyślono wówczas sposób na poinformowanie robota, które części serwisów mają pozostać niezindeksowane, omawianym rozwiązaniem jest właśnie plik robots.txt, w nim właśnie podajemy nazwy katalogów do których pająki nie będą zaglądały.</p>
<p><strong>Format pliku &#8211; dopuszczalna składnia.</strong></p>
<p>Plik robots.txt umieszczamy na serwerze w głównej lokalizacji do której prowadzi adres URL, i powinien on zawierać linijki, których ogólna składnia jest zgodna z poniższym schematem:</p>
<p><font COLOR="#333399">&#8220;&lt;field&gt;:&lt;optionalspace&gt;&lt;value&gt;&lt;optionalspace&gt;&#8221;</font></p>
<p><font COLOR="#333399">&#8220;&lt;pole&gt;:&lt;opcjonalna-spacja&gt;&lt;wartość&gt;&lt;opcjonalna-spacja&gt;&#8221;</font></p>
<p>Dozwolone jest umieszczanie komentarzy w treści omawianego pliku, które wpisujemy po standardowym znaku komentarza, zaczęrpniętym z konwencji stosowanej w systemach UNIX&#8217;owych czyli &#8220;#&#8221; (hasza). Wszystkie linijki zaczynające się od tego znaku są ignorowane.</p>
<p>Wpis zaczyna się od dyrektywy &#8220;User-agent&#8221;, którą poprzedzamy wyrażeniem &#8220;Disallow&#8221; czyli odmowy dostępu, a kończymy znakami opsiującymi lokalizację dla jakiej roboty mają mieć zabroniony dostęp. Dla podania lokalizacji możemy stosować znak / (ukośnik) aby odnieść się do aktualnej lokalizacji, oraz * (gwiazdka), która daje wieloznaczne podstawienie, czyli zabrania dostępu w ramach wszystkich plików/podkatalogów w naszym katalogu głównym. Przykładowa składnia pliku znajduje się poniżej:</p>
<p># oto przykład:<br />
<font COLOR="#333399">User-agent: *    #dotyczy wszystkich typów crawler&#8217;ów<br />
Disallow: /tmp   #zabrania dostępu do katalogu &#8216;tmp&#8217;<br />
Disallow: test.html #zabrania dostępu do pliku &#8216;test.html</font></p>
<p>&#8211;<br />
Można dla pola &#8216;User-agent&#8217; zastosować konkretny typ pająka, np. google/msn i w ten sposób jeden z nich nie będzie miał dostępu do naszych plików.</p>
<p><strong>Zakończenie.</strong></p>
<p>Zagadnienie proste jednak wierzę, że znajdzie się kilka osób, dla których to opracowanie stanie się pomocne. Pozdrowienie!</p>
<p><em>~Michał Kowalski 2008 </em></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.efrenzy.pl/2008/01/07/plik-robotstxt-poprawna-skladnia/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
