6. Tehtävä - Merkistön kertominen selaimelle

Maailmassa on useita satoja kieliä ja melkein kaikki kielet vaativat omia erikoismerkkejään. Meillä on käytössämme niin sanotut skandinaaviset lisämerkit å,ä ja ö. Jotta saamme ne näkyviin oikein, meidän pitää kertoa selaimelle, että haluamme käyttää näitä merkkejä. Mikäli emme sitä tee, näkyvät kirjaimet kysymysmerkkeinä, sekasotkuna tai ne jäävät täysin puuttumaan. Se miten ne näkyvät riippuu täysin käytettävästä selaimesta.

Käytännössä meillä on kaksi tapaa saada merkit näkymään. Ensimmäinen tapa on merkitä jokainen skandi tekstiin erikseen. Se onnistuu kertomalla selaimelle, että ’tähän tulee erikoismerkki. Erikoismerkki alkaa ’&’ -merkillä ja loppuu puolipisteeseen ’;’. Esimerkiksi Ä saataisiin näkymään siten, että kerrotaan merkkien & ja ; välissä mikä merkki tulee, tässä tapauksessa A ja mitä sille tehdään. Ä-kirjaimen tapauksessa A:n päälle halutaan pisteet, ns. umlaut:it.  Lopullinen merkki muodostuisi siis muotoon Ä  .

Tämä on hieman hankalaa ja mieluummin sitä kirjoittaa näppäimistöltä Ä:än Ä:äänä, kuin kirjoittaa yhden ä:än sijaan kuusi merkkiä. Tämän tehdäksemme meidän pitää ensin kertoa selaimelle mitä merkistöä käytämme ja mitä merkistöä käyttämämme tekemämme HTML –tiedosto on.  Käytettävän merkistön ja oman HTML –tiedoston tulee olla samaa tyyppiä, muuten merkit hajoavat aina.

Windowsin standardi merkistö ANSI riippuu siitä, mille kielelle Windows on asennettu Vakiona suomenkielisissä Windows –ympäristössä kaikki tiedostot ovat koodattu ISO-8859-1 merkistöä käyttäen. Huomattavasti yksinkertaisempaa on kuitenkin muuttaa merkistöksi UTF-8, joka sisältää käytännössä kaikki maailman merkit. Useat palveluntarjoajat suostuvat tarjoamaan merkistöiksi ainoastaan UTF-8:a, joten sen käyttämiseen kannattaa totutella heti alusta alkaen (ja etuna on se, että tulee varmasti kerralla tehtyä oikeellista koodia).


TLDR;

Kerrottaessa selaimelle jotain, tehdään se aina <head> -tagin sisälle.

Headiin kirjoitetaan seuraava rivi:

   <meta charset="utf-8" />

Tällä rivillä kerrotaan tiedon olevan ns. metatietoa, jossa kerrotaan käytettävä merkistö. Merkistönä tässä on UTF-8, mutta se voisi olla myös ISO-8859-1, joka on suomenkielisen Windowsin vakio merkistö.

Headin tulisi näyttää kutakuinkin tältä:

<head>
   <meta charset="utf-8" />
</head>

 

Tehtävä: 

Muuta HTML -tiedostoissa (kaikissa) käyttämäsi merkistö UTF-8:si.

Comments