Wiktionary:UTF-8/Testseite

Die folgende Tabelle enthält einige Sprachen, mit den bei ihr jeweils üblichen Sonderzeichen. In der zweiten Spalte werden die Sonderzeichen in Form vom Entitäten angegeben, in der dritten Spalte wird das selbe Wort, bzw. das selbe Zeichen in UTF-8-Kodierung angegeben. Eine unterschiedliche Ausgabe der Einträge in der zweiten und dritten Spalte weist auf eine fehlende oder eingeschränkte UTF-8-Unterstützung des Browsers hin.

Zeichen, die in den drei letzten Spalten gleichermaßen nicht korrekt angezeigt werden, sondern als Platzhalter erscheinen (je nach Browser häufig „?“ oder „□“) sind nicht auf ein Problem mit UTF-8 zurückzuführen. Hier weiß der Rechner einfach nur nicht, wie das entsprechende Zeichen aussieht, weil der nötige Zeichensatz nicht installiert ist. Mit Texten, die solche Zeichen enthalten kann in der Regel ganz normal gearbeitet werden - auch wenn der Rechner nicht weiß wie das Zeichen aussieht, so weiß er doch, um welches Zeichen es sich handelt, und behandelt das Zeichen also z. B. nicht wie ein Fragezeichen, sondern wie dasjenige Zeichen, für das der Platzhalter jeweils steht. Für eine korrekte Darstellung sollte dann ein Unicode-Zeichensatz installiert und eventuell der Browser entsprechend konfiguriert werden.

Hilfe zur Abhilfe für verschiedene Browser/Betriebssystem-Konfigurationen gibt es auf Wiktionary:Browser-Hinweise.

Sonderzeichen aus verschiedenen Sprachen
Sprache Angabe der Sonderzeichen in
benannten Entitäten¹ numerischen Entitäten
(dezimal)
numerischen Entitäten
(hexadezimal)
UTF-8-Kodierung
a b c d
1 Spanisch Español Español Español Español
2 Türkisch Türkçe Türkçe Türkçe Türkçe
3 Slowenisch Slovenščina Slovenščina Slovenščina Slovenščina
4 Rumänisch Română Română Română Română
5 Tschechisch Česky Česky Česky Česky
6 Griechisch Ελληνικά Ελληνικά Ελληνικά Ελληνικά
7 Bulgarisch (Kyrillisch) Български Български Български
8 Russisch (Kyrillisch) Русский Русский Русский
9 Hebräisch עברית עברית עברית
10 Arabisch لعربية لعربية لعربية
11 Japanisch 日本語 日本語 日本語
12 Koreanisch 한국어 한국어 한국어
13 Chinesisch (vereinfacht) 用统一码 用统一码 用统一码
14 Chinesisch (traditionell) 讓統一碼 讓統一碼 讓統一碼
15 Lautschrift (IPA) [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
16 - <code>Lautschrift</code> [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
17 - mit vorgeg. Zeichensatz [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
17b - allg. Zeichensatz ohne Serifen [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
17c - allg. Zeichensatz ohne Serifen [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
17d - benutzerdef. Zeichensatzvorgabe (in Skin.css) [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ] [ʃɪˈkaːɡəʊɛ]
18 Silbentrennzeichen Sil|ben|trenn·zei·chen Sil|ben|trenn·zei·chen Sil|ben|trenn·zei·chen Sil|ben|trenn·zei·chen
19 kurzer/langer Gedankenstrich – / — – / — – / — – / —
20 Anführungszeichen unten/oben „ / “ „ / “ „ / “ „ / “
21 Eurosymbol
22 Hochgestellte Zahlen km² m³ km² m³ km² m³ km² m³
23 Zeichen Ux2302 Haus
24 Zusammengesetzte diakritische Zeichen č Č ā A̅ h̵ h̶ h̷ h̴ a̱ č Č ā A̅ h̵ h̶ h̷ h̴ a̱ č Č ā A̅ h̵ h̶ h̷ h̴ a̱
25 - Mehrfach zusammengesetzte ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝ ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝ ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝

¹) Nicht für alle Sonderzeichen sind benannte Entitäten definiert, daher enthält dies Spalte nicht alle Beispielwörter. Vereinzelt wurden auch in dieser Spalte numerische Entitäten verwendet: für den Kleinbuchstaben c mit Hatschek (&#269;), den Großbuchstaben C mit Hatschek (&#268;), den Kleinbuchstaben a mit Hatschek (&#259;), den griechischen Kleinbuchstaben alpha mit Akzent Akut (&#940;), und den senkrechten Silbentrennstrich (&#65372;).

WeblinksBearbeiten