Nachrichtentechnik
ANSI-Code
Der ANSI-Code (American National Standards Institute) ist eine Erweiterung des ASCII-Codes von 7 auf 8 Bit. Das Paritätsbit wurde gestohlen und zum 8. Datenbit umfunktioniert. Damit wurde Raum für weitere 128 Zeichen geschaffen, von 27 = 128 Zeichen auf 28 = 256 Zeichen.
Findige Köpfe kamen auf die Idee, für die zusätzlich geschaffenen 128 Zeichen verschiedene Zeichensatzvarianten zu erfinden, damit alle Zeichen abgebildet werden können. Der Kodierer auf der Sendeseite (Encoder) und der Decoder auf der Empfangsseite (Decoder) mussten den gleichen Zeichensatz (Codepage) verwenden, sonst wurden scheinbar «falsche» Zeichen übertragen. Genau genommen wurden sie nur missinterpretiert. Wie, wenn ein Berner mit einem Zürcher redet. In Bern sagt man Kuchen und die Zürcher verstehen Torte oder die Zürcher sagen Wähe und die Berner verstehen nichts.
Meiner Kiste habe ich gesagt sie soll die oberen 128 Byte nach ISO-8859-1 und Windows-1252 Latin 1 interpretieren. Damit kommen bei mir folgende Zeichen heraus.
| Obere 128 Byte (128 bis 255) nach ISO-8859-1 Latin 1 interpretiert. | |||||||||||||||
| # | Z | # | Z | # | Z | # | Z | # | Z | # | Z | # | Z | # | Z |
| 128 | | 144 | | 160 | 176 | ° | 192 | À | 208 | Ð | 224 | à | 240 | ð | |
| 129 | | 145 | | 161 | ¡ | 177 | ± | 193 | Á | 209 | Ñ | 225 | á | 241 | ñ |
| 130 | | 146 | | 162 | ¢ | 178 | ² | 194 | Â | 210 | Ò | 226 | â | 242 | ò |
| 131 | | 147 | | 163 | £ | 179 | ³ | 195 | Ã | 211 | Ó | 227 | ã | 243 | ó |
| 132 | | 148 | | 164 | ¤ | 180 | ´ | 196 | Ä | 212 | Ô | 228 | ä | 244 | ô |
| 133 | 149 | | 165 | ¥ | 181 | µ | 197 | Å | 213 | Õ | 229 | å | 245 | õ | |
| 134 | | 150 | | 166 | ¦ | 182 | ¶ | 198 | Æ | 214 | Ö | 230 | æ | 246 | ö |
| 135 | | 151 | | 167 | § | 183 | · | 199 | Ç | 215 | × | 231 | ç | 247 | ÷ |
| 136 | | 152 | | 168 | ¨ | 184 | ¸ | 200 | È | 216 | Ø | 232 | è | 248 | ø |
| 137 | | 153 | | 169 | © | 185 | ¹ | 201 | É | 217 | Ù | 233 | é | 249 | ù |
| 138 | | 154 | | 170 | ª | 186 | º | 202 | Ê | 218 | Ú | 234 | ê | 250 | ú |
| 139 | | 155 | | 171 | « | 187 | » | 203 | Ë | 219 | Û | 235 | ë | 251 | û |
| 140 | | 156 | | 172 | ¬ | 188 | ¼ | 204 | Ì | 220 | Ü | 236 | ì | 252 | ü |
| 141 | | 157 | | 173 | | 189 | ½ | 205 | Í | 221 | Ý | 237 | í | 253 | ý |
| 142 | | 158 | | 174 | ® | 190 | ¾ | 206 | Î | 222 | Þ | 238 | î | 254 | þ |
| 143 | | 159 | | 175 | ¯ | 191 | ¿ | 207 | Ï | 223 | ß | 239 | ï | 255 | ÿ |
| Obere 128 Byte (128 bis 255) nach Windows-1252 interpretiert. | |||||||||||||||
| # | Z | # | Z | # | Z | # | Z | # | Z | # | Z | # | Z | # | Z |
| 128 | € | 144 | | 160 | 176 | ° | 192 | À | 208 | Ð | 224 | à | 240 | ð | |
| 129 | | 145 | ‘ | 161 | ¡ | 177 | ± | 193 | Á | 209 | Ñ | 225 | á | 241 | ñ |
| 130 | ‚ | 146 | ’ | 162 | ¢ | 178 | ² | 194 | Â | 210 | Ò | 226 | â | 242 | ò |
| 131 | ƒ | 147 | “ | 163 | £ | 179 | ³ | 195 | Ã | 211 | Ó | 227 | ã | 243 | ó |
| 132 | „ | 148 | ” | 164 | ¤ | 180 | ´ | 196 | Ä | 212 | Ô | 228 | ä | 244 | ô |
| 133 | … | 149 | • | 165 | ¥ | 181 | µ | 197 | Å | 213 | Õ | 229 | å | 245 | õ |
| 134 | † | 150 | – | 166 | ¦ | 182 | ¶ | 198 | Æ | 214 | Ö | 230 | æ | 246 | ö |
| 135 | ‡ | 151 | — | 167 | § | 183 | · | 199 | Ç | 215 | × | 231 | ç | 247 | ÷ |
| 136 | ˆ | 152 | ˜ | 168 | ¨ | 184 | ¸ | 200 | È | 216 | Ø | 232 | è | 248 | ø |
| 137 | ‰ | 153 | ™ | 169 | © | 185 | ¹ | 201 | É | 217 | Ù | 233 | é | 249 | ù |
| 138 | Š | 154 | š | 170 | ª | 186 | º | 202 | Ê | 218 | Ú | 234 | ê | 250 | ú |
| 139 | ‹ | 155 | › | 171 | « | 187 | » | 203 | Ë | 219 | Û | 235 | ë | 251 | û |
| 140 | Œ | 156 | œ | 172 | ¬ | 188 | ¼ | 204 | Ì | 220 | Ü | 236 | ì | 252 | ü |
| 141 | | 157 | | 173 | | 189 | ½ | 205 | Í | 221 | Ý | 237 | í | 253 | ý |
| 142 | Ž | 158 | ž | 174 | ® | 190 | ¾ | 206 | Î | 222 | Þ | 238 | î | 254 | þ |
| 143 | | 159 | Ÿ | 175 | ¯ | 191 | ¿ | 207 | Ï | 223 | ß | 239 | ï | 255 | ÿ |
Fazit: Windows-1252 (Codepage 1252 westeuropäische Version) ist fast gleich wie ISO-8859-1 (ISO/IEC 8859-1 Latin1). Unterschiede sind in den Zeichen 128 bis 159.
Auf die unzähligen anderen Varianten zwischen Thailand und Alaska gehe ich nicht ein, denn schlaue Köpfe hatten die Idee, zwei Byte pro Zeichen zu verwenden und alle Varianten eindeutig einzubauen. Damit erübrigt sich die Übung, sich mit Zeichensätzen auseinanderzusetzen.
Dazu mehr im Kapitel Unicode …
