Vraag & Antwoord

Webdesign (HTML, CSS, Flash)

Karakterset UTF-8

Anoniem
michelsw
4 antwoorden
  • Ik ben bezig met het ontwikkelen van een nieuwe website. Naar aanleiding van testresultaten via webrichtlijnen.nl heb ik de gebruikte karakterset aangepast van iso-8859-1 naar utf-8.

    Na deze aanpassing zou volgens de validator van W3C mijn pagina niet meer correct strict-html te bevatten. Ik krijg een melding over een ongeldig karakter wat niet is toegestaan met utf-8. De boosdoener blijkt het teken ë te zijn.

    Dit is toch vreemd? utf-8 zou toch juist een uitgebreidere karakter set zijn? Of zie ik iets over het hoofd?
  • hier voor gebruik je ë :)
    dat komt omdat de e en i niet in US-ASCII zit nog.
  • Bedankt! Zo gaat het wel goed! :D
  • De ë zit niet in US-ASCII en zal er ook wel nooit in komen, maar UTF-8 is een encoding scheme voor Unicode. Daar zit die uiteraard wel in (plus nog ruim 100.000 andere karakters).

    Het probleem wordt veroorzaakt doordat je pagina kennelijk nog altijd ISO-8859-1 encoded is. De ë vergt in ISO-8859-1 één byte, terwijl hetzelfde karakter in UTF-8 twee bytes in beslag neemt.

    Als je graag UTF-8 wilt gebruiken, moet je ervoor zorgen dat je HTML ook echt UTF-8 encoded is. Zo'n beetje iedere teksteditor (zelfs kladblok) bevat tegenwoordig de optie om op te slaan in UTF-8 formaat. Script- en programmeertalen kennen er daarnaast speciale functies voor.

Beantwoord deze vraag

Dit is een gearchiveerde pagina. Antwoorden is niet meer mogelijk.