Hyppää sisältöön, linkkilistaan.
Arkisto › Elokuu 2004 › 1. päivä
Tänään olen käyttänyt hyvän tovin miettiessäni miten saisin kyrillisiä kirjaimia nettisivuille. Netin venäjänkielisiä sivuja selatessani ensimmäinen havaintoni oli käyttää suoraan vastaavien kirjaimien koodeja ja vaihtaa merkistökoodaus selaimesta kyrilliseksi. Tämä tosin muuttaisi samalla myös skandinaaviset merkit kyrillisiksi eikä menetelmä näyttänyt muutenkaan oikealta tavalta. Mieluiten laittaisin merkit entiteettimerkintöinä. Mutta mitkä ne koodit sitten olisivat? Lisää hakukoneilua ja vastauskin alkoi selvitä.
Kyrilliset merkit saa näkyville käyttämällä UTF–8-merkistökoodausta ja entiteettimerkintöjä. Venäjänkielinen ensimmäinen aakkonen löytyy kohdasta 1040 eli koodattuna ampersandi #1040;. Tein esimerkkisivun, jonne laitoin kaikki tietämäni kyrilliset kirjaimet. Tosin venäjän kielen taitoni huonompi kuin auttava, joten en ole ihan varma teinkö kaikki oikein.
Tämän seikkailun aikana minulle on alkanut valjeta UTF–8-koodauksen merkitys. Joel Spolsky on kirjoittanut laajasti viitatun artikkelin Unicoden merkityksestä, mutta omasta mielestäni web-suunnittelijalle suunnatun sanoman voi tiivistää yhteen lauseeseen: UTF–8-koodatut nettisivut mahdollistavat kaikenlaisten kirjaimien käytön samalla sivulla ilman, että täytyy välillä vaihtaa merkistökoodausta. Ei ihme, että esimerkiksi Anne van Kesteren on paasannut merkistökoodausten merkityksestä vähän väliä.
Haittapuolena tässä on tietenkin se, että kaikkien sivujen koodaus täytyisi vaihtaa UTF–8:ksi nykyisestä ISO-8859-1:stä. Ehkä seuraavan uudistuksen yhteydessä.
Copyright © 2004–2005 Lauri Seppänen. Kommentointi HaloScan.