ISO 8859-1
Wikipedia
ISO 8859-1 on kahdeksanbittinen ASCII-merkistön laajennos johon on otettu mukaan useimmat länsieurooppalaiset merkit. Merkistö tukee virallisesti seuraavia kieliä: albania, baski, englanti, espanja, fääri, gaeli, hollanti, iiri, islanti, italia, katalaani, norja, portugali, retoromaani, ruotsi, saksa, suomi ja tanska. Lisäksi sitä voi käyttää ainakin afrikaansin, eteläsaamen ja swahilin kirjoittamiseen.
Merkistön seuraaja on ISO 8859-15, joka täydentää ranskan ja suomen tukea sekä lisää merkistöön euron merkin. ISO 8859-1 on kuitenkin niin laajasti käytetty, ettei sen korvaaminen ole realistisesti mahdollista.
Sisällysluettelo |
[muokkaa] Historia ja standardointi
ISO 8859-1 perustuu DEC Multilanguage Character Set -merkistöön jota käytettiin ensimmäisen kerran VT220 ja VT240-päätteissä vuonna 1982. DEC MCS eroaa ISO 8859-1 -merkistöstä islantilaisten merkkien osalta.
Virallisempi nimi merkistölle on ISO/IEC 8859-1 ja se tunnetaan myös nimellä Latin1 (Latinalainen 1). IANA:n standardoinnissa merkistö tunnetaan ISO-8859-1 -nimellä. IANA määrittelee myös merkitykset kontrollimerkeille 0-31 (vastaavat ASCII-merkistön merkityksiä), joihin ISO ei ota kantaa.
Maaliskuussa 1985 ECMA (European Computer Manufacturer's Association) standardoi nykyisin nimillä ISO 8859-1:sta ISO 8859-4:aan tunnettavat merkistöt ECMA-94 nimellä. ISO-standardointia saatiin kuitenkin odottaa vuoteen 1987.
Vuonna 1987 julkaistiin MS-DOS 3.30 jossa oli mukana koodisivu CP850, joka sisältää samat merkit kuin ISO 8859-1, kuitenkin eri järjestyksessä. PC-koneissa ISO-merkistöä muistuttava Windows koodisivu-1252 tuli käyttöön lopulta Windows-ympäristön mukana 1990-luvulla. UNIX-puolella siirtymistä hidasti erilaisten päätelaitteiden kirjavuus, kattavaan 8-bittisen merkistön käyttöön päästiin vasta kun vanhat päätteet korvattiin itsenäisillä työasemakoneilla ja pääasialliseksi yhteydeksi UNIX-koneisiin tuli Windowsista otettu telnet- tai ssh-yhteys.
ISO 8859-1 laajentaa ISO 646-IRV -merkistöä kahdella lohkolla; ASCIIn kontrollimerkkien ja latinalaisen perusosan lisäksi merkistöön on lisätty laajennetut kontrollimerkit ja Latinalaisen merkistön täydennys Latin-1:ksi osa. Laajennetuille kontrollimerkeille ei ole keksitty käyttöä ja merkkipaikat ovat käyttämättä.
[muokkaa] ISO 8859-1 merkit
0 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | ||||||||
08 | 09 | 0a | 0b | 0c | 0d | 0e | 0f | ||||||||
10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | ||||||||
18 | 19 | 1a | 1b | 1c | 1d | 1e | 1f | ||||||||
20 | sp | 21 | ! | 22 | " | 23 | # | 24 | $ | 25 | % | 26 | & | 27 | ' |
28 | ( | 29 | ) | 2a | * | 2b | + | 2c | , | 2d | - | 2e | . | 2f | / |
30 | 0 | 31 | 1 | 32 | 2 | 33 | 3 | 34 | 4 | 35 | 5 | 36 | 6 | 37 | 7 |
38 | 8 | 39 | 9 | 3a | : | 3b | ; | 3c | < | 3d | = | 3e | > | 3f | ? |
40 | @ | 41 | A | 42 | B | 43 | C | 44 | D | 45 | E | 46 | F | 47 | G |
48 | H | 49 | I | 4a | J | 4b | K | 4c | L | 4d | M | 4e | N | 4f | O |
50 | P | 51 | Q | 52 | R | 53 | S | 54 | T | 55 | U | 56 | V | 57 | W |
58 | X | 59 | Y | 5a | Z | 5b | [ | 5c | \ | 5d | ] | 5e | ^ | 5f | _ |
60 | ` | 61 | a | 62 | b | 63 | c | 64 | d | 65 | e | 66 | f | 67 | g |
68 | h | 69 | i | 6a | j | 6b | k | 6c | l | 6d | m | 6e | n | 6f | o |
70 | p | 71 | q | 72 | r | 73 | s | 74 | t | 75 | u | 76 | v | 77 | w |
78 | x | 79 | y | 7a | z | 7b | { | 7c | | | 7d | } | 7e | ~ | 7f | del |
80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | ||||||||
88 | 89 | 8a | 8b | 8c | 8d | 8e | 8f | ||||||||
90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | ||||||||
98 | 99 | 9a | 9b | 9c | 9d | 9e | 9f | ||||||||
a0 | a1 | ¡ | a2 | ¢ | a3 | £ | a4 | ¤ | a5 | ¥ | a6 | ¦ | a7 | § | |
a8 | ¨ | a9 | © | aa | ª | ab | « | ac | ¬ | ad | | ae | ® | af | ¯ |
b0 | ° | b1 | ± | b2 | ² | b3 | ³ | b4 | ´ | b5 | µ | b6 | ¶ | b7 | · |
b8 | ¸ | b9 | ¹ | ba | º | bb | » | bc | ¼ | bd | ½ | be | ¾ | bf | ¿ |
c0 | À | c1 | Á | c2 | Â | c3 | Ã | c4 | Ä | c5 | Å | c6 | Æ | c7 | Ç |
c8 | È | c9 | É | ca | Ê | cb | Ë | cc | Ì | cd | Í | ce | Î | cf | Ï |
d0 | Ð | d1 | Ñ | d2 | Ò | d3 | Ó | d4 | Ô | d5 | Õ | d6 | Ö | d7 | × |
d8 | Ø | d9 | Ù | da | Ú | db | Û | dc | Ü | dd | Ý | de | Þ | df | ß |
e0 | à | e1 | á | e2 | â | e3 | ã | e4 | ä | e5 | å | e6 | æ | e7 | ç |
e8 | è | e9 | é | ea | ê | eb | ë | ec | ì | ed | í | ee | î | ef | ï |
f0 | ð | f1 | ñ | f2 | ò | f3 | ó | f4 | ô | f5 | õ | f6 | ö | f7 | ÷ |
f8 | ø | f9 | ù | fa | ú | fb | û | fc | ü | fd | ý | fe | þ | ff | ÿ |
Merkistössä merkki 20 (32 desimaalisena) on tavallinen välilyönti ja A0 sitova välilyönti. Merkki AD, SOFT HYPHEN, on määritelty HTML-kielessä tavutusvihjeeksi, eikä sen pitäisi olla näkyvissä (vaikkakaan useimmat selaimet eivät tue tavutusta). Merkkiä 7F ei ole määritelty, mutta ASCII:ssa se on kontrollimerkki, joka saadaan BackSpace-näppäimestä.
[muokkaa] Katso myös
[muokkaa] Lisätietoja
- Eurooppalaisen merkistön merkkien suomenkieliset nimet http://www.ling.helsinki.fi/filt/info/mes2/