Wiktionary:Projekt:Sortierung

Sortierung: Fakten, Ziele und Grenzen

Bearbeiten

Die alphabetische Sortierung von Listen und Aufzählungen sorgt immer wieder für Diskussionen, welche Sortierung die richtige sei, insbesondere wenn unterschiedliche Alphabete, Diakritika, Groß-/Kleinschreibung und nationale Besonderheiten Berücksichtigung finden sollen. Ziel ist es, eine Regelung für das deutschsprachige Wiktionary zu finden, die im Rahmen der gegebenen technischen Möglichkeiten umsetzbar ist, gegebenenfalls durch Werkzeuge unterstützt werden kann und für die Benutzer nachvollziehbar und praktikabel ist.

Wo wird im Wiktionary sortiert?

Bearbeiten

Seitenlisten, die von der Mediawikisoftware automatisch erstellt werden

Bearbeiten
  • Alle Seiten des Wiktionarys [1]
  • Liste der Kategorien: [2]
Hier wird wohl nach Unicode Codepoints sortiert, da Großbuchstaben vor Kleinbuchstaben aufgelistet werden.
Hier werden Großbuchstaben und Kleinbuchstaben nicht unterschieden. Was aber auch dazu führt, dass deren Reihenfolge vom Zufall abhängt und mal der Großbuchstabe vor dem Kleinbuchstaben erscheint, mal umgekehrt: Labe, labe, label, Label
  • Bei sortierbaren Tabellen

Listen, Aufzählungen, die von Benutzern erstellt werden

Bearbeiten

Dabei kann man Listen unterscheiden, die von Bots oder Helferlein erstellt werden oder die vom Benutzer manuell gepflegt werden. Es ist jedoch nie auszuschließen, dass auch hier eigentlich maschinell gepflegte Listen von Benutzern manuell bearbeitet werden.

  • Listen in Verzeichnissen, auf Reimseiten,
  • Einträge:
Sortierung der Sprachabschnitte
Sortierung der Sprachen in der Übersetzungstabelle
  • Im Eintrag: Oberbegriffe, Unterbegriffe, Wortbildungen etc.
Mit maschineller Unterstützung gepflegte Listen
Bearbeiten

Bei von Benutzern mit maschineller Unterstützung gepflegten Listen kann man nach den verwendeten Hilfsmitteln unterscheiden.

Weitere Hilfsmittel, wie Tabellenkalkulationen, Skripte, Datenbanken (SQL) etc., haben je nach Einstellungen des Benutzer-Rechners Auswirkungen auf das Ergebnis der Sortierung.

  • Bots in diversen Sprachen (nur einige genannt) unterliegen den sprachbedingten Einstellungen und Einschränkungen.
    Python
    C# (C-Sharp)
    Java

Sortierung numerischer Werte

Bearbeiten

Numerische statt alphabetischer Sortierung wurde bei uns zwar gewünscht: Archiv

Ist bisher aber nicht eingerichtet (1337 wird vor 143 einsortiert): Kategorie:Netzjargon

Umfrage in der Wikipedia zur Umstellung: https://de.wikipedia.org/wiki/Wikipedia:Umfragen/Sortierschl%C3%BCssel_vereinfachen Projekt: https://meta.wikimedia.org/wiki/Community_Tech/Numerical_sorting_in_categories

Grenzen gibt es da, wo die Wörter aus mehreren Sprachen gemeinsam sortiert werden sollen. Zum Beispiel Schwedisch: a, b, c, ... x, y, z, å, ä, ö Deutsch: a, ä, b, c, .. o, ö, ... x, y, z. In den meisten Sprachen ist der Großbuchstabe zum i das I. Im Türkischen gibt es ein kleines i ohne Punkt und ein großes I mit Punkt i İ und ı I. Das hat natürlich Auswirkungen auf die Sortierung. Grenzen gibt es auch für die Sortierung der Kategorien im Namensraum Reim. Die dort verwendeten IPA-Zeichen stammen zum Teil aus verschiedenen Aphabeten.

Bearbeiten