Hans Wittwer

Geschichten, die das Leben schrieb

Nachrichtentechnik

ANSI-Code

🏁

Der ANSI-Code (American National Standards Institute) ist eine Erweiterung des ASCII-Codes von 7 auf 8 Bit. Das Paritätsbit wurde gestohlen und zum 8. Datenbit umfunktioniert. Damit wurde Raum für weitere 128 Zeichen geschaffen, von 27 = 128 Zeichen auf 28 = 256 Zeichen.

Findige Köpfe kamen auf die Idee, für die zusätzlich geschaffenen 128 Zeichen verschiedene Zeichensatzvarianten zu erfinden, damit alle Zeichen abgebildet werden können. Der Kodierer auf der Sendeseite (Encoder) und der Decoder auf der Empfangsseite (Decoder) mussten den gleichen Zeichensatz (Codepage) verwenden, sonst wurden scheinbar «falsche» Zeichen übertragen. Genau genommen wurden sie nur missinterpretiert. Wie, wenn ein Berner mit einem Zürcher redet. In Bern sagt man Kuchen und die Zürcher verstehen Torte oder die Zürcher sagen Wähe und die Berner verstehen nichts.

Meiner Kiste habe ich gesagt sie soll die oberen 128 Byte nach ISO-8859-1 und Windows-1252 Latin 1 interpretieren. Damit kommen bei mir folgende Zeichen heraus.

Obere 128 Byte (128 bis 255) nach ISO-8859-1 Latin 1 interpretiert.
#Z #Z #Z #Z #Z #Z #Z #Z
128€ 144 160  176° 192À 208Ð 224à 240ð
129 145‘ 161¡ 177± 193Á 209Ñ 225á 241ñ
130‚ 146’ 162¢ 178² 194 210Ò 226â 242ò
131ƒ 147“ 163£ 179³ 195à 211Ó 227ã 243ó
132„ 148” 164¤ 180´ 196Ä 212Ô 228ä 244ô
133… 149• 165¥ 181µ 197Å 213Õ 229å 245õ
134† 150– 166¦ 182 198Æ 214Ö 230æ 246ö
135‡ 151— 167§ 183· 199Ç 215× 231ç 247÷
136ˆ 152˜ 168¨ 184¸ 200È 216Ø 232è 248ø
137‰ 153™ 169© 185¹ 201É 217Ù 233é 249ù
138Š 154š 170ª 186º 202Ê 218Ú 234ê 250ú
139‹ 155› 171« 187» 203Ë 219Û 235ë 251û
140Œ 156œ 172¬ 188¼ 204Ì 220Ü 236ì 252ü
141 157 173­ 189½ 205Í 221Ý 237í 253ý
142Ž 158ž 174® 190¾ 206Î 222Þ 238î 254þ
143 159Ÿ 175¯ 191¿ 207Ï 223ß 239ï 255ÿ
Obere 128 Byte (128 bis 255) nach Windows-1252 interpretiert.
#Z #Z #Z #Z #Z #Z #Z #Z
128 144 160  176° 192À 208Ð 224à 240ð
129 145 161¡ 177± 193Á 209Ñ 225á 241ñ
130 146 162¢ 178² 194Â 210Ò 226â 242ò
131ƒ 147 163£ 179³ 195Ã 211Ó 227ã 243ó
132 148 164¤ 180´ 196Ä 212Ô 228ä 244ô
133 149 165¥ 181µ 197Å 213Õ 229å 245õ
134 150 166¦ 182 198Æ 214Ö 230æ 246ö
135 151 167§ 183· 199Ç 215× 231ç 247÷
136ˆ 152˜ 168¨ 184¸ 200È 216Ø 232è 248ø
137 153 169© 185¹ 201É 217Ù 233é 249ù
138Š 154š 170ª 186º 202Ê 218Ú 234ê 250ú
139 155 171« 187» 203Ë 219Û 235ë 251û
140Œ 156œ 172¬ 188¼ 204Ì 220Ü 236ì 252ü
141 157 173­ 189½ 205Í 221Ý 237í 253ý
142Ž 158ž 174® 190¾ 206Î 222Þ 238î 254þ
143 159Ÿ 175¯ 191¿ 207Ï 223ß 239ï 255ÿ

Fazit: Windows-1252 (Codepage 1252 westeuropäische Version) ist fast gleich wie ISO-8859-1 (ISO/IEC 8859-1 Latin1). Unterschiede sind in den Zeichen 128 bis 159.

Auf die unzähligen anderen Varianten zwischen Thailand und Alaska gehe ich nicht ein, denn schlaue Köpfe hatten die Idee, zwei Byte pro Zeichen zu verwenden und alle Varianten eindeutig einzubauen. Damit erübrigt sich die Übung, sich mit Zeichensätzen auseinanderzusetzen.

Dazu mehr im Kapitel Unicode …