søndag, februar 06, 2005

Validering og norsk tegnsett

Sidene du lager til klasseprosjektet skal være valide for å godkjennes. Det vil si at koden skal være gyldig XHTML 1.0 eller HTML 4.01 (eller velg en annen standard om du vil - XHTML er imidlertid det tryggeste og lureste å venne seg til). Da trenger vi to nye tagger som melder fra om hvilken standard koden vår bruker. Vi må spesifisere dokumenttypen og karaktersettet vi bruker. Ofte funker websider uten denne informasjonen, men det skyldes kun godviljen til nettleseren. Ikke alle nettlesere vil kunne vise siden uten dokumenttype og karaktersett. Spesielt fremtidige nettlesere vil kunne få problemer.

Dokumenttypen skal opplyses aller først i dokumentet, som forklart i Castro s 59-60. W3 har en liste over korrekte DOCTYPEr.

Det andre vi må legge til er karaktertypen, så nettlesere vet om de skal vise europeiske, kyrilliske eller japanske tegn, f.eks. Dersom du bruker feil tegnsett, vet ikke nettleseren at "å" skal vises som "å". Du kan løse det ved alltid å skrive æ, ø og å som HTML-entiteter (450-51 i Castro), men det beste er helt klart å opplyse om riktig tegnsett. For norsk skal du bruke iso-8859-1. Du må da passe på å lagre dokumentet i dette tegnsettet også. På Mac kalles det forvirrende nok ikke iso-8859-1, men "Western (ISO Latin-1)". [Kan noen hjelpe meg med hva det heter på Windows? Det er i hvert fall et poeng å ikke lagre som "Windows-1252", og ikke bruke smart quotes og andre Windows tegn som ikke fines i iso-8859-1.]

I nettsiden din, annonserer du tegnsettet slik (bare med hakeparanteser ikke klammer):

[meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /]

Prøv så å validere koden din på http://validator.w3.org/. De vanligste feilene er enkle: du har glemt å lukke en tag, utelatt anførselstegn eller glemt en alt-tag på et bilde osv.

Her er en fin innføring i validering med liste over de vanligste problemene folk får. Også på seinere oppgaver teller det positivt om nettstedene dine validerer.

I framtiden er det høyst sannsynlig at staten og mange store bedrifter vil kreve at alle websider som utvikles for dem skal validere og følge web standarder. Dette sikrer adgang for folk som er blinde, f.eks., eller som av andre grunner ikke kan bruke vanlige nettlesere. I USA og mange EU-land er dette allerede innfelt i lovgivningen, på samme måte som vi i Norge må lage ramper på offentlige bygninger slik at de som bruker rullestol slipper til. Norge vil sannsynligvis følge etter innen et par-tre år.

2 Comments:

Blogger elzapp said...

Igjen, som jeg sa da jeg forsøkte å forklare dette for gruppen min.

Ja. [meta equiv="Content-Type" content="text/html; charset=iso-8859-1"] hjelper deg å få siden validert, men det hjelper ikke det spøtt på å få nettleseren til å rendre HTML'en med riktig tegnsett. den Content-Typen serveren sender vil ALLTID overstyre den Content-Typen en setter i html'en...

Men fortvil ikke... det finnes en løsning, skal skrive en post på bloggen min om det.

9:55 a.m.  
Blogger Jill said...

Jo, men i mange tilfeller er ikke serveren satt opp til å sende noen charset i det hele tatt, og da er det lurt med meta-taggen.

Det er uansett lurt å kunne HTML-entitetene for æ, ø og å, som du skriver om i bloggen din! Takk!

9:00 a.m.  

Legg inn en kommentar

<< Home