Wiktionary:Projekt:Sortierung
Sortierung: Fakten, Ziele und Grenzen
BearbeitenDie alphabetische Sortierung von Listen und Aufzählungen sorgt immer wieder für Diskussionen, welche Sortierung die richtige sei, insbesondere wenn unterschiedliche Alphabete, Diakritika, Groß-/Kleinschreibung und nationale Besonderheiten Berücksichtigung finden sollen. Ziel ist es, eine Regelung für das deutschsprachige Wiktionary zu finden, die im Rahmen der gegebenen technischen Möglichkeiten umsetzbar ist, gegebenenfalls durch Werkzeuge unterstützt werden kann und für die Benutzer nachvollziehbar und praktikabel ist.
Wo wird im Wiktionary sortiert?
BearbeitenSeitenlisten, die von der Mediawikisoftware automatisch erstellt werden
Bearbeiten- Hier wird wohl nach Unicode Codepoints sortiert, da Großbuchstaben vor Kleinbuchstaben aufgelistet werden.
- In automatisch erzeugten Aufzählungen innerhalb von Kategorien z.B.: Kategorie:adjektivische Deklination (Deutsch)
- Hier werden Großbuchstaben und Kleinbuchstaben nicht unterschieden. Was aber auch dazu führt, dass deren Reihenfolge vom Zufall abhängt und mal der Großbuchstabe vor dem Kleinbuchstaben erscheint, mal umgekehrt: Labe, labe, label, Label
- Bei sortierbaren Tabellen
Listen, Aufzählungen, die von Benutzern erstellt werden
BearbeitenDabei kann man Listen unterscheiden, die von Bots oder Helferlein erstellt werden oder die vom Benutzer manuell gepflegt werden. Es ist jedoch nie auszuschließen, dass auch hier eigentlich maschinell gepflegte Listen von Benutzern manuell bearbeitet werden.
- Listen in Verzeichnissen, auf Reimseiten,
- Einträge:
- Sortierung der Sprachabschnitte
- Sortierung der Sprachen in der Übersetzungstabelle
- Im Eintrag: Oberbegriffe, Unterbegriffe, Wortbildungen etc.
Mit maschineller Unterstützung gepflegte Listen
BearbeitenBei von Benutzern mit maschineller Unterstützung gepflegten Listen kann man nach den verwendeten Hilfsmitteln unterscheiden.
- Javascript als clientseitige Skriptsprache
- Lua, als serverseitige Skriptsprache
Weitere Hilfsmittel, wie Tabellenkalkulationen, Skripte, Datenbanken (SQL) etc., haben je nach Einstellungen des Benutzer-Rechners Auswirkungen auf das Ergebnis der Sortierung.
- Bots in diversen Sprachen (nur einige genannt) unterliegen den sprachbedingten Einstellungen und Einschränkungen.
- Python
- C# (C-Sharp)
- Java
Sortierung numerischer Werte
BearbeitenNumerische statt alphabetischer Sortierung wurde bei uns zwar gewünscht: Archiv
Ist bisher aber nicht eingerichtet (1337 wird vor 143 einsortiert): Kategorie:Netzjargon
Umfrage in der Wikipedia zur Umstellung: https://de.wikipedia.org/wiki/Wikipedia:Umfragen/Sortierschl%C3%BCssel_vereinfachen Projekt: https://meta.wikimedia.org/wiki/Community_Tech/Numerical_sorting_in_categories
Grenzen
BearbeitenGrenzen gibt es da, wo die Wörter aus mehreren Sprachen gemeinsam sortiert werden sollen. Zum Beispiel Schwedisch: a, b, c, ... x, y, z, å, ä, ö
Deutsch: a, ä, b, c, .. o, ö, ... x, y, z
.
In den meisten Sprachen ist der Großbuchstabe zum i das I
. Im Türkischen gibt es ein kleines i ohne Punkt und ein großes I mit Punkt i İ
und ı I
. Das hat natürlich Auswirkungen auf die Sortierung.
Grenzen gibt es auch für die Sortierung der Kategorien im Namensraum Reim. Die dort verwendeten IPA-Zeichen stammen zum Teil aus verschiedenen Aphabeten.