Wiktionary:UTF-8/Testseite

Die folgende Tabelle enthält einige Sprachen, mit den bei ihr jeweils üblichen Sonderzeichen. In der zweiten Spalte werden die Sonderzeichen in Form vom Entitäten angegeben, in der dritten Spalte wird dasselbe Wort bzw. dasselbe Zeichen in UTF-8-Kodierung angegeben. Eine unterschiedliche Ausgabe der Einträge in der zweiten und dritten Spalte weist auf eine fehlende oder eingeschränkte UTF-8-Unterstützung des Browsers hin.

Zeichen, die in den drei letzten Spalten gleichermaßen nicht korrekt angezeigt werden, sondern als Platzhalter erscheinen (je nach Browser häufig „?“ oder „□“), sind nicht auf ein Problem mit UTF-8 zurückzuführen. Hier weiß der Rechner einfach nur nicht, wie das entsprechende Zeichen aussieht, weil der nötige Zeichensatz nicht installiert ist. Mit Texten, die solche Zeichen enthalten, kann in der Regel ganz normal gearbeitet werden – auch wenn der Rechner nicht weiß, wie das Zeichen aussieht, so weiß er doch, um welches Zeichen es sich handelt, und behandelt das Zeichen also z. B. nicht wie ein Fragezeichen, sondern wie dasjenige Zeichen, für das der Platzhalter jeweils steht. Für eine korrekte Darstellung sollte dann ein Unicode-Zeichensatz installiert und eventuell der Browser entsprechend konfiguriert werden.

Hilfe zur Abhilfe für verschiedene Browser/Betriebssystem-Konfigurationen gibt es auf Wiktionary:Browser-Hinweise.

Sonderzeichen aus verschiedenen Sprachen
	Sprache	Angabe der Sonderzeichen in
	Sprache	benannten Entitäten¹	numerischen Entitäten (dezimal)	numerischen Entitäten (hexadezimal)	UTF-8-Kodierung
		a	b	c	d
1	Spanisch	Español	Español	Español	Español
2	Türkisch	Türkçe	Türkçe	Türkçe	Türkçe
3	Slowenisch	Slovenščina	Slovenščina	Slovenščina	Slovenščina
4	Rumänisch	Română	Română	Română	Română
5	Tschechisch	Česky	Česky	Česky	Česky
6	Griechisch	Ελληνικά	Ελληνικά	Ελληνικά	Ελληνικά
7	Bulgarisch (Kyrillisch)		Български	Български	Български
8	Russisch (Kyrillisch)		Русский	Русский	Русский
9	Hebräisch		עברית	עברית	עברית
10	Arabisch		لعربية	لعربية	لعربية
11	Japanisch		日本語	日本語	日本語
12	Koreanisch		한국어	한국어	한국어
13	Chinesisch (vereinfacht)		用统一码	用统一码	用统一码
14	Chinesisch (traditionell)		讓統一碼	讓統一碼	讓統一碼
15	Lautschrift (IPA)		[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]
16	- `<code>Lautschrift</code>`		`[ʃɪˈkaːɡəʊɛ]`	`[ʃɪˈkaːɡəʊɛ]`	`[ʃɪˈkaːɡəʊɛ]`
17	- mit vorgeg. Zeichensatz		[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]
17b	- allg. Zeichensatz ohne Serifen		[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]
17c	- allg. Zeichensatz ohne Serifen		[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]
17d	- benutzerdef. Zeichensatzvorgabe (in Skin.css)		[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]	[ʃɪˈkaːɡəʊɛ]
18	Silbentrennzeichen	Sil｜ben｜trenn·zei·chen	Sil｜ben｜trenn·zei·chen	Sil｜ben｜trenn·zei·chen	Sil｜ben｜trenn·zei·chen
19	kurzer/langer Gedankenstrich	– / —	– / —	– / —	– / —
20	Anführungszeichen unten/oben	„ / “	„ / “	„ / “	„ / “
21	Eurosymbol	€	€	€	€
22	Hochgestellte Zahlen	km² m³	km² m³	km² m³	km² m³
23	Zeichen Ux2302 Haus		⌂	⌂	⌂
24	Zusammengesetzte diakritische Zeichen		č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲	č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲	č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲
25	- Mehrfach zusammengesetzte		ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝	ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝	ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝

¹) Nicht für alle Sonderzeichen sind benannte Entitäten definiert, daher enthält dies Spalte nicht alle Beispielwörter. Vereinzelt wurden auch in dieser Spalte numerische Entitäten verwendet: für den Kleinbuchstaben c mit Hatschek (č), den Großbuchstaben C mit Hatschek (Č), den Kleinbuchstaben a mit Hatschek (ă), den griechischen Kleinbuchstaben alpha mit Akzent Akut (ά) und den senkrechten Silbentrennstrich (｜).

Weblinks

Seite auf Unicode.org, die zum Testen dienen kann