Tworzenie stron internetowych a strona kodowa dokumentów, jakie kodowanie wybrać?
Co to jest kodowanie? Jakie typy kodowania możesz wybrać?
Komputery nie zapisują liter wklepywanych z klawiatury wprost, stosują do tego nieco bardziej wyrafinowanego sposobu liczbowego. Każdej literze (znakowi) jest przypisana jakaś cyfra i w zależności od typu kodowania może ona przyjmowac różne wartości, zawarte w różnym typie oraz zakresie. Brzmi poważnie;) Czytaj dalej!
Pierwsze kodowania zawieraÅ‚y znaki wyłącznie z alfabetu angielskiego oraz kilkudziesiÄ™ciu znaków specjalnych typu ‘/?><’, najbardziej rozpowszechniony standard to ASCII (American Standard Code for Information Interchange – AmerykaÅ„ski Standardowy Kod dla Wymiany Informacji). Ponieważ w tym pierwotnym kodowaniu nie byÅ‚y uwzglÄ™dnione znaki diakrytyczne dla innych jÄ™zyków Å›wiata, powstaÅ‚y strony kodowe, które pozwalaÅ‚y na zapisanie w jÄ™zyku komputerów wszystkich ogonków, umlautów, etc — ISO 8859. I tutaj zamieszanie, gdyż jak wiele jest odmian alfabetycznych przypisanych jÄ™zykom tak wiele powstaÅ‚o stron kodowych, dla polskich znaków byÅ‚o ich conajmniej kilka. Najpopularniejsze i obecnie uznane jako standard jest iso-8859-2 oraz standard “windowsowy” win-1250. Z mnogoÅ›ci odmian jÄ™zykowych wynika niemaÅ‚e zamieszanie, które ma rozwiÄ…zać najnowszy standard kodowania znaków UTF. PowstaÅ‚ on z myÅ›lÄ… zawarcia wszelkich regionalizmów, i tak z technicznego punktu widzenia, ponieważ unikod jest 4 bitowym kodowaniem (stosuje do zapisu liter 4 bity znaków cyfrowych) zawiera on w sobie pierwotny standard ASCII (w pierwszym bajcie można zapisać wszystkie znaki ASCII -co daje im peÅ‚nÄ… zgodność). PozostaÅ‚a nadmiarowość pozwala na zawarcie diakrytyzmów. Jest tu pewnien kompromis w stosowaniu UTF’u, gdyż ze wspomnianej nadmiarowoÅ›ci powstaje problem ekonomii zapisu znaków – jednak sÄ… równiez zalety, które moim zdaniem w peÅ‚ni rekompensujÄ… tÄ… niedogodność.
Dla zapisu polskich znaków, możemy stosować poniżej wymienione kodowania:
- win-1250 — mocno niezalecane, rozumiane i stosowane przez niektóre windowsy
- iso-8859-2 — jest przyjÄ™tym standardem dla kodowania polskich ogonków, jednak przez jego niszowość nie pozwala na swobodne stosowanie w obrÄ™bie wielojÄ™zycznego internetu
- utf-8 — zalecany dla stron wielojÄ™zycznych, potrafi poprawnie obsÅ‚użyć polskie znaki, jest elastyczny oraz Å›ciÅ›le zalecany przez agencje ustalajÄ…ce standardy.
Który typ kodowania znaków jest najlepszy?
Dla tworzenia polskich stron internetowych zalecanym kodowaniem jest utf-8 (utf-8 to trochę bardziej oszczędna wersja unikodu, jego nadmiarowość w przypadku zapisu polskiej treści wynosi ok. 5%). Drugą poprawna stroną kodową jest iso-8859-2. Został on uznany przez ustawę Polskiej Normy, jako standard zapisu polskich znaków w internecie. Natomiast, wspomniany wcześniej win-1250 nie jest w pełni zgodny ze światowym standardem ASCII i przez to nie jest porpawnie rozumiany przez część aplikacji, szczególnie odradzam jego stosowanie.
Na bazie powyższych rozważań zwycięzcą ogłaszam uniwersalny UTF-8. Jest niewątpliwie przyszłością wielojęzycznego internetu, daje nam wiele możliwości stosowania różnych jezyków na stronach oraz, wyklucza ryzyko niezgodności z przeglądarkami internetowymi za kilka lat
Praktyczne uwagi do wybranego charset.
Od strony praktycznej, sprawa kodowania przedstawia się następująco: najpierw musimy zapisać znaki w określonym kodowaniu, czyli albo używamy edytora, który ma opcję zmiany użytego kodowania, albo mamy świadomość, że windowsowy notatnik pisze w win-1250 ;S
Następnie w odpowiednim tagu meta musimy zawrzeć deklarację użytego kodowania, tak aby przeglądarki internetowe interpretujące nasz (x)html wiedziały jak go rozkodować, może to wyglądać tak:
<meta http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-2*”>.
JeÅ›li stosujemy xhtml, który jest strikte XML’em musimy również do naszego dokumentu dołączyć deklaracje w jego “dialekcie”, co wyglÄ…da nastÄ™pujÄ…co:
<?xml version=”1.0″ encoding=”iso-8859-2*”?>,
umieszczamy go na samym początku dokumentu. Niestety w przypadku stron wysyłanych jako text/html deklaracja xml znajdująca się przed doctype rodzi pewne problemy w rozumieniu stron przez przeglądarke IE w wersji 6.x . Ale to już problem do dyskusji na osobny wpis.
Zakończenie.
Boje z kodowaniem nie dotyczą wyłącznie dokumentów hipertekstowych, również inne dokumenty, dane w zbiorach bazodanowych opierają się na zapisie kodowym. Stąd świadomość omawianych zagadnień jest niezbędna aby opóźnić objawy starzenia i utrzymać zdrowie psychiczne w dobrej kondycji ;p Szczególnie jeśli interesuje Cię profesjonalne tworzenie stron internetowych.
~Michał Kowalski 2008
(*)Zakładam, że stosujemy kodowanie iso-8859-2, jednak przypominam, że lepiej jest stosować UTF-8.
admin :: lut.01.2008 :: Peryskop, Uncategorized, Webdesign, xHTML/css :: 1 Comment »
One Response to “Tworzenie stron internetowych a strona kodowa dokumentów, jakie kodowanie wybrać?”
Leave a Reply
You must be logged in to post a comment.
[...] adresem: http://validator.w3.org, wcześniej upewnij się, że masz poprawnie ustalony doctype oraz kodowanie dokumentów. Poprawność arkusza stylów CSS możesz sprawdzić pod adresem: [...]