Hans Wittwer

Nachrichtentechnik

ANSI-Code

Der ANSI-Code (American National Standards Institute) ist eine Erweiterung des ASCII-Codes von 7 auf 8 Bit. Das Paritätsbit wurde gestohlen und zum 8. Datenbit umfunktioniert. Damit wurde Raum für weitere 128 Zeichen geschaffen, von 2⁷ = 128 Zeichen auf 2⁸ = 256 Zeichen.

Findige Köpfe kamen auf die Idee, für die zusätzlich geschaffenen 128 Zeichen verschiedene Zeichensatzvarianten zu erfinden, damit alle Zeichen abgebildet werden können. Der Kodierer auf der Sendeseite (Encoder) und der Decoder auf der Empfangsseite (Decoder) mussten den gleichen Zeichensatz (Codepage) verwenden, sonst wurden scheinbar «falsche» Zeichen übertragen. Genau genommen wurden sie nur missinterpretiert. Wie, wenn ein Berner mit einem Zürcher redet. In Bern sagt man Kuchen und die Zürcher verstehen Torte oder die Zürcher sagen Wähe und die Berner verstehen nichts.

Meiner Kiste habe ich gesagt sie soll die oberen 128 Byte nach ISO-8859-1 und Windows-1252 Latin 1 interpretieren. Damit kommen bei mir folgende Zeichen heraus.

Obere 128 Byte (128 bis 255) nach ISO-8859-1 Latin 1 interpretiert.
#	Z	#	Z	#	Z	#	Z	#	Z	#	Z	#	Z	#	Z
128		144		160		176	°	192	À	208	Ð	224	à	240	ð
129		145		161	¡	177	±	193	Á	209	Ñ	225	á	241	ñ
130		146		162	¢	178	²	194	Â	210	Ò	226	â	242	ò
131		147		163	£	179	³	195	Ã	211	Ó	227	ã	243	ó
132		148		164	¤	180	´	196	Ä	212	Ô	228	ä	244	ô
133		149		165	¥	181	µ	197	Å	213	Õ	229	å	245	õ
134		150		166	¦	182	¶	198	Æ	214	Ö	230	æ	246	ö
135		151		167	§	183	·	199	Ç	215	×	231	ç	247	÷
136		152		168	¨	184	¸	200	È	216	Ø	232	è	248	ø
137		153		169	©	185	¹	201	É	217	Ù	233	é	249	ù
138		154		170	ª	186	º	202	Ê	218	Ú	234	ê	250	ú
139		155		171	«	187	»	203	Ë	219	Û	235	ë	251	û
140		156		172	¬	188	¼	204	Ì	220	Ü	236	ì	252	ü
141		157		173		189	½	205	Í	221	Ý	237	í	253	ý
142		158		174	®	190	¾	206	Î	222	Þ	238	î	254	þ
143		159		175	¯	191	¿	207	Ï	223	ß	239	ï	255	ÿ
Obere 128 Byte (128 bis 255) nach Windows-1252 interpretiert.
#	Z	#	Z	#	Z	#	Z	#	Z	#	Z	#	Z	#	Z
128	€	144		160		176	°	192	À	208	Ð	224	à	240	ð
129		145	‘	161	¡	177	±	193	Á	209	Ñ	225	á	241	ñ
130	‚	146	’	162	¢	178	²	194	Â	210	Ò	226	â	242	ò
131	ƒ	147	“	163	£	179	³	195	Ã	211	Ó	227	ã	243	ó
132	„	148	”	164	¤	180	´	196	Ä	212	Ô	228	ä	244	ô
133	…	149	•	165	¥	181	µ	197	Å	213	Õ	229	å	245	õ
134	†	150	–	166	¦	182	¶	198	Æ	214	Ö	230	æ	246	ö
135	‡	151	—	167	§	183	·	199	Ç	215	×	231	ç	247	÷
136	ˆ	152	˜	168	¨	184	¸	200	È	216	Ø	232	è	248	ø
137	‰	153	™	169	©	185	¹	201	É	217	Ù	233	é	249	ù
138	Š	154	š	170	ª	186	º	202	Ê	218	Ú	234	ê	250	ú
139	‹	155	›	171	«	187	»	203	Ë	219	Û	235	ë	251	û
140	Œ	156	œ	172	¬	188	¼	204	Ì	220	Ü	236	ì	252	ü
141		157		173		189	½	205	Í	221	Ý	237	í	253	ý
142	Ž	158	ž	174	®	190	¾	206	Î	222	Þ	238	î	254	þ
143		159	Ÿ	175	¯	191	¿	207	Ï	223	ß	239	ï	255	ÿ

Fazit: Windows-1252 (Codepage 1252 westeuropäische Version) ist fast gleich wie ISO-8859-1 (ISO/IEC 8859-1 Latin1). Unterschiede sind in den Zeichen 128 bis 159.

Auf die unzähligen anderen Varianten zwischen Thailand und Alaska gehe ich nicht ein, denn schlaue Köpfe hatten die Idee, zwei Byte pro Zeichen zu verwenden und alle Varianten eindeutig einzubauen. Damit erübrigt sich die Übung, sich mit Zeichensätzen auseinanderzusetzen.

Dazu mehr im Kapitel Unicode …