ISO 8859-1

Wikipedia

ISO 8859-1 on kahdeksanbittinen ASCII-merkistön laajennos johon on otettu mukaan useimmat länsieurooppalaiset merkit. Merkistö tukee virallisesti seuraavia kieliä: albania, baski, englanti, espanja, fääri, gaeli, hollanti, iiri, islanti, italia, katalaani, norja, portugali, retoromaani, ruotsi, saksa, suomi ja tanska. Lisäksi sitä voi käyttää ainakin afrikaansin, eteläsaamen ja swahilin kirjoittamiseen.

Merkistön seuraaja on ISO 8859-15, joka täydentää ranskan ja suomen tukea sekä lisää merkistöön euron merkin. ISO 8859-1 on kuitenkin niin laajasti käytetty, ettei sen korvaaminen ole realistisesti mahdollista.

Sisällysluettelo

[muokkaa] Historia ja standardointi

ISO 8859-1 perustuu DEC Multilanguage Character Set -merkistöön jota käytettiin ensimmäisen kerran VT220 ja VT240-päätteissä vuonna 1982. DEC MCS eroaa ISO 8859-1 -merkistöstä islantilaisten merkkien osalta.

Virallisempi nimi merkistölle on ISO/IEC 8859-1 ja se tunnetaan myös nimellä Latin1 (Latinalainen 1). IANA:n standardoinnissa merkistö tunnetaan ISO-8859-1 -nimellä. IANA määrittelee myös merkitykset kontrollimerkeille 0-31 (vastaavat ASCII-merkistön merkityksiä), joihin ISO ei ota kantaa.

Maaliskuussa 1985 ECMA (European Computer Manufacturer's Association) standardoi nykyisin nimillä ISO 8859-1:sta ISO 8859-4:aan tunnettavat merkistöt ECMA-94 nimellä. ISO-standardointia saatiin kuitenkin odottaa vuoteen 1987.

Vuonna 1987 julkaistiin MS-DOS 3.30 jossa oli mukana koodisivu CP850, joka sisältää samat merkit kuin ISO 8859-1, kuitenkin eri järjestyksessä. PC-koneissa ISO-merkistöä muistuttava Windows koodisivu-1252 tuli käyttöön lopulta Windows-ympäristön mukana 1990-luvulla. UNIX-puolella siirtymistä hidasti erilaisten päätelaitteiden kirjavuus, kattavaan 8-bittisen merkistön käyttöön päästiin vasta kun vanhat päätteet korvattiin itsenäisillä työasemakoneilla ja pääasialliseksi yhteydeksi UNIX-koneisiin tuli Windowsista otettu telnet- tai ssh-yhteys.

ISO 8859-1 laajentaa ISO 646-IRV -merkistöä kahdella lohkolla; ASCIIn kontrollimerkkien ja latinalaisen perusosan lisäksi merkistöön on lisätty laajennetut kontrollimerkit ja Latinalaisen merkistön täydennys Latin-1:ksi osa. Laajennetuille kontrollimerkeille ei ole keksitty käyttöä ja merkkipaikat ovat käyttämättä.

[muokkaa] ISO 8859-1 merkit

0   01   02   03   04   05   06   07  
08   09   0a   0b   0c   0d   0e   0f  
10   11   12   13   14   15   16   17  
18   19   1a   1b   1c   1d   1e   1f  
20 sp 21 ! 22 " 23 # 24 $ 25 % 26 & 27 '
28 ( 29 ) 2a * 2b + 2c , 2d - 2e . 2f /
30 0 31 1 32 2 33 3 34 4 35 5 36 6 37 7
38 8 39 9 3a : 3b ; 3c < 3d = 3e > 3f ?
40 @ 41 A 42 B 43 C 44 D 45 E 46 F 47 G
48 H 49 I 4a J 4b K 4c L 4d M 4e N 4f O
50 P 51 Q 52 R 53 S 54 T 55 U 56 V 57 W
58 X 59 Y 5a Z 5b [ 5c \ 5d ] 5e ^ 5f _
60 ` 61 a 62 b 63 c 64 d 65 e 66 f 67 g
68 h 69 i 6a j 6b k 6c l 6d m 6e n 6f o
70 p 71 q 72 r 73 s 74 t 75 u 76 v 77 w
78 x 79 y 7a z 7b { 7c | 7d } 7e ~ 7f del
80   81   82   83   84   85   86   87  
88   89   8a   8b   8c   8d   8e   8f  
90   91   92   93   94   95   96   97  
98   99   9a   9b   9c   9d   9e   9f  
a0 a1 ¡ a2 ¢ a3 £ a4 ¤ a5 ¥ a6 ¦ a7 §
a8 ¨ a9 © aa ª ab « ac ¬ ad ­ ae ® af ¯
b0 ° b1 ± b2 ² b3 ³ b4 ´ b5 µ b6 b7 ·
b8 ¸ b9 ¹ ba º bb » bc ¼ bd ½ be ¾ bf ¿
c0 À c1 Á c2 Â c3 Ã c4 Ä c5 Å c6 Æ c7 Ç
c8 È c9 É ca Ê cb Ë cc Ì cd Í ce Î cf Ï
d0 Ð d1 Ñ d2 Ò d3 Ó d4 Ô d5 Õ d6 Ö d7 ×
d8 Ø d9 Ù da Ú db Û dc Ü dd Ý de Þ df ß
e0 à e1 á e2 â e3 ã e4 ä e5 å e6 æ e7 ç
e8 è e9 é ea ê eb ë ec ì ed í ee î ef ï
f0 ð f1 ñ f2 ò f3 ó f4 ô f5 õ f6 ö f7 ÷
f8 ø f9 ù fa ú fb û fc ü fd ý fe þ ff ÿ

Merkistössä merkki 20 (32 desimaalisena) on tavallinen välilyönti ja A0 sitova välilyönti. Merkki AD, SOFT HYPHEN, on määritelty HTML-kielessä tavutusvihjeeksi, eikä sen pitäisi olla näkyvissä (vaikkakaan useimmat selaimet eivät tue tavutusta). Merkkiä 7F ei ole määritelty, mutta ASCII:ssa se on kontrollimerkki, joka saadaan BackSpace-näppäimestä.

[muokkaa] Katso myös

[muokkaa] Lisätietoja