MediaWiki Diskussion:Titleblacklist

Letzter Kommentar: vor 5 Jahren von Udo T. in Abschnitt nur [ʁ] und [ɐ̯] bei Reimseiten
Automatische Archivierung
Automatische Archivierung
Auf dieser Seite werden Abschnitte automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=~~~~}} versehen sind. Die Archivübersicht befindet sich unter Archiv.

Silbische Konsonanten

Bearbeiten

Die letzten drei Regeln in der Titleblacklist müssen von

Reim( Diskussion)?:Deutsch:.*[bdfkmnpstvzçðʤɡŋʃθʦʧχʒ]əl <casesensitive>        # [əl] wird, falls es nach Obstruenten oder Nasalen am Ende eines Wortes steht, als [l̩] geschrieben.
Reim( Diskussion)?:Deutsch:.*[fsvzçðʤʃθʦʧχʒ]əm <casesensitive>                 # [əm] wird, falls es nach Reibelauten oder Affrikaten am Ende eines Wortes steht, als [m̩] geschrieben.
Reim( Diskussion)?:Deutsch:.*[bdfkpstvzðʤɡʃθʦʧχʒ]ən <casesensitive>            # [ən] wird, falls es nach Obstruenten am Ende eines Wortes steht, als [n̩] geschrieben; dies gilt nicht für das Diminutivsuffix „-chen“.

zu

Reim( Diskussion)?:Deutsch:.*[bdfkmnpstvzçðʤɡŋʃθʦʧχʒ]əln?s?t? <casesensitive>  # [əl] wird, falls es nach Obstruenten oder Nasalen in der letzten Silbe eines Wortes steht, als [l̩] geschrieben.
Reim( Diskussion)?:Deutsch:.*[fsvzçðʤʃθʦʧχʒ]əms? <casesensitive>               # [əm] wird, falls es nach Reibelauten oder Affrikaten in der letzten Silbe eines Wortes steht, als [m̩] geschrieben.
Reim( Diskussion)?:Deutsch:[^̩]*[bdfkpstvzðʤɡʃθʦʧχʒ]ən[tsʃ]? <casesensitive>    # [ən] wird, falls es nach Obstruenten in der letzten Silbe eines Wortes steht, als [n̩] geschrieben; dies gilt nicht, wenn die vorletzte Silbe ein [n̩] enthält, und auch nicht für das Diminutivsuffix „-chen“.

geändert werden. Grund: Laut den Beispielen im Ausspracheduden kann

  1. ein in der letzten Silbe stehendes [əm/m̩] von [s] gefolgt werden, und
  2. ein in der letzten Silbe stehendes [ən/n̩] von [t], [s] oder [ʃ] gefolgt werden.

Außerdem gibt es Wörter, wo ein in der letzten Silbe stehendes [əl/l̩] von [n], [s], [t] oder zwei dieser Konsonanten gefolgt wird. Ferner wird laut Ausspracheduden [] nicht in zwei aufeinanderfolgenden Silben artikuliert. --84.61.136.79 21:59, 28. Aug. 2014 (MESZ)Beantworten

Ein Beispiel: Die Wörter passenden und umfassenden gehören zum Reim:Deutsch:-asn̩dən, der aber von der Regel

Reim( Diskussion)?:Deutsch:.*[bdfkpstvzðʤɡʃθʦʧχʒ]ən <casesensitive>            # [ən] wird, falls es nach Obstruenten am Ende eines Wortes steht, als [n̩] geschrieben; dies gilt nicht für das Diminutivsuffix „-chen“.

erfasst wird; sie muss also wohl zu

Reim( Diskussion)?:Deutsch:[^̩]*[bdfkpstvzðʤɡʃθʦʧχʒ]ən <casesensitive>          # [ən] wird, falls es nach Obstruenten am Ende eines Wortes steht, als [n̩] geschrieben; dies gilt nicht, wenn die vorletzte Silbe ein [n̩] enthält, und auch nicht für das Diminutivsuffix „-chen“.

geändert werden. --84.61.136.79 09:53, 29. Aug. 2014 (MESZ)Beantworten

Da außerdem Reim:Deutsch:-aːbənt im Widerspruch zu unseren IPA-Konventionen erstellt wurde, muss die Regel für [ən] wohl zu
Reim( Diskussion)?:Deutsch:[^̩]*[bdfkpstvzðʤɡʃθʦʧχʒ]ən[tsʃ]? <casesensitive>    # [ən] wird, falls es nach Obstruenten in der letzten Silbe eines Wortes steht, als [n̩] geschrieben; dies gilt nicht, wenn die vorletzte Silbe ein [n̩] enthält, und auch nicht für das Diminutivsuffix „-chen“.
geändert werden. --84.61.136.79 22:42, 31. Aug. 2014 (MESZ)Beantworten

Damit bin ich also der Meinung, dass die letzten drei Regeln der Titleblacklist zu

Reim( Diskussion)?:Deutsch:.*[bdfkmnpstvzçðʤɡŋʃθʦʧχʒ]əl[nstʃ]* <casesensitive> # [əl] wird, falls es nach Obstruenten oder Nasalen in der letzten Silbe eines Wortes steht, als [l̩] gesprochen.
Reim( Diskussion)?:Deutsch:.*[fsvzçðʤʃθʦʧχʒ]əms? <casesensitive>               # [əm] wird, falls es nach Reibelauten oder Affrikaten in der letzten Silbe eines Wortes steht, als [m̩] gesprochen.
Reim( Diskussion)?:Deutsch:[^̩]*[bdfkpstvzðʤɡʃθʦʧχʒ]ən[stʃ]? <casesensitive>    # [ən] wird, falls es nach Obstruenten in der letzten Silbe eines Wortes steht, als [n̩] gesprochen; dies gilt nicht, wenn die vorletzte Silbe ein [n̩] enthält, und auch nicht für das Diminutivsuffix „-chen“.

geändert werden sollen. Die erste Regel deckt auch Wörter wie Bummelns, bummelnd, bummelst und hegelsch ab. Die zweite Regel deckt auch Wörter wie Cochems ab. Die dritte Regel deckt auch Wörter wie Lesens, lesend und haydnsch ab. Außerdem wird berücksichtigt, dass Wörter wie passenden und umfassenden in der letzten Silbe nicht mit [] gesprochen werden. --84.61.136.79 12:04, 6. Sep. 2014 (MESZ)Beantworten

Lieber Kronf, kannst du diese Änderungen bitte heute noch ausführen? Beim Reim:Deutsch:-asn̩dən, zu dem die Wörter passenden und umfassenden gehören, bekomme ich eine Warnung. --84.61.136.79 12:16, 6. Sep. 2014 (MESZ)Beantworten

Epsilon im Twi

Bearbeiten

Um zu verhindern, dass das griechische Epsilon in lateinschriftliche Wörter hereingemischt wird, sollen zwei Regeln

.*[A-Za-zÄÖÜäöüß][Εε].* <casesensitive>                                        # Du sollt keine griechischen Buchstaben in lateinschriftliche Wörter hereinmischen!
.*[Εε][A-Za-zÄÖÜäöüß].* <casesensitive>                                        # Du sollt keine griechischen Buchstaben in lateinschriftliche Wörter hereinmischen!

eingeführt werden. Bitte diese Regeln nicht sofort verallgemeinern, weil ansonsten auch IPA (β, θ, χ) oder Maßeinheitenzeichen (μ, Ω) Probleme bereiten. Siehe auch: εna, εnanom und ɔyareε. --84.61.170.155 21:02, 26. Sep. 2014 (MESZ)Beantworten

Affrikaten

Bearbeiten

Bitte noch eine Regel

Reim( Diskussion)?:Deutsch:.*t[sʃ]t? <casesensitive>                           # [ts] und [tʃ] werden, falls keine Wortfuge dazwischen steht, als [ʦ] bzw. [ʧ] ausgesprochen.

hinzufügen. Grund: Damit wird verhindert, dass Reim:Deutsch:-antst erneut angelegt werden kann. --84.61.151.122 19:01, 18. Okt. 2014 (MESZ)Beantworten

Byte Order Mark

Bearbeiten

Bitte noch eine Regel

(Diskussion:)?(|þÿ|ÿþ).* <casesensitive>                                    # Diese Zeichenkombinationen entstehen, wenn Unicode-Texte als ANSI fehlinterpretiert werden; sie kommen so gut wie nie in korrekten Texten vor.

hinzufügen. Grund: Damit kann kein Lemma mehr mit einer ANSI-Repäsentation des Byte Order Marks anfangen. --84.61.152.191 10:49, 31. Okt. 2014 (MEZ)Beantworten

Japanisch

Bearbeiten

Bitte noch eine Regel

.*[イキギシジチヂニヒビピミリヰ][ァゥォ].* <autoconfirmed|casesensitive>               # Nach Lauten der i-Stufe stehen niemals ァ, ゥ und ォ; stattdessen stehen ャ, ュ und ョ.

hinzufügen. Grund: Laut der japanischen Wikipedia gibt es nicht viele Wörter, die diese Zeichenkombinationen enthalten. Auch das deutsche, das englische und das japanische Wiktionary liefern keine relevanten Treffer. --84.61.152.191 11:13, 5. Nov. 2014 (MEZ)Beantworten

Bitte noch zwei Regeln

.*[ぁ-ぅぇ-ぎけ-ぴぶ-ゖ]ゎ.* <casesensitive>                                        # ゎ steht nur nach う, く, ぐ oder ふ.
.*[ァ-ゥェ-ギケ-ピブ-ヺ]ヮ.* <casesensitive>                                        # ヮ steht nur nach ウ, ク, グ oder フ.

hinzufügen. Grund: Das kleine Silbenschriftzeichen für wa, welches in der heutigen japanischen Sprache nicht mehr verwendet wird, wurde früher nach den Zeichen für ku und gu verwendet, um kwa und gwa zu schreiben; im Okinawanischen kommt es auch nach den Zeichen für u und fu vor, um 'wa und fa zu schreiben. Weitere Verwendungsmöglichkeiten bestehen anscheinend weder im Ainu, noch im Japanischen, im Ryukyuanischen oder im Taiwanesischen. --84.61.152.191 19:04, 6. Nov. 2014 (MEZ)Beantworten

Flexionsseiten

Bearbeiten

Um zu verhindern, dass Flexionsseiten im Eintragsnamensraum angelegt werden, soll

.* \((Deklin|Konjug)ation\)  # Flexionsseiten gehören in den Flexionsnamensraum.

zur MediaWiki:Titleblacklist hinzugefügt werden. --84.61.141.207 12:28, 19. Jan. 2015 (MEZ)Beantworten

In den letzten Tagen wurden immer noch einige Flexionsseiten im Eintragsnamensraum angelegt, die dann verschoben werden mussten. Kann jemand den obigen Wunsch abhandeln? --84.61.141.207 15:29, 22. Jan. 2015 (MEZ)Beantworten
Diese Fälle zeigen uns auf, wo noch Links umgestellt werden müssen. Lieber die Ursache heilen als bloß das Symptom verhindern. Ist auch gegenüber den Benutzern freundlicher. --Kronf (Diskussion) 15:29, 23. Jan. 2015 (MEZ)Beantworten

Doppelte Diakritika in Reimseiten

Bearbeiten

Um zu verhindern, dass doppelte Diakritika in Reimseiten verwendet werden, muss wohl eine Regel

Reim( Diskussion)?:.*\x{032F}\x{032F}.* <casesensitive>                        # Im IPA kann das Diakritikum für unsilbische Vokale nicht doppelt stehen.

zur MediaWiki:Titleblacklist hinzugefügt werden. Siehe auch: Reim:Deutsch:-ɔɪ̯̯stn̩. --84.61.135.139 18:43, 5. Nov. 2015 (MEZ)Beantworten

Kyrillisch-Vandalismus

Bearbeiten

Bitte eine Regel

gelöscht, wurde in einen nicht öffentlichen Missbrauchsfilter eingebaut

zur MediaWiki:Titleblacklist hinzufügen; sie deckt alle heute gelöschten kyrillischen Lemmata ab. --84.61.159.159 14:22, 19. Aug. 2016 (MESZ)Beantworten

Danke für den Hinweis. Ich hab es getestet und mal eingebaut, schauen wir mal. Gruß --Udo T. (Diskussion) 14:30, 19. Aug. 2016 (MESZ)Beantworten

Stückchen-Vandalismus

Bearbeiten

Bitte eine Regel

.*stückchen <autoconfirmed|casesensitive>

zur MediaWiki:Titleblacklist hinzufügen; sie deckt alle heute gelöschten Lemmata ab. --84.61.159.159 10:33, 21. Aug. 2016 (MESZ)Beantworten

Danke für den Hinweis, aber das wird zukünftig anderweitig geregelt werden. Außerdem würde es nichts bringen, denn der Vandale liest hier evtl. mit und passt die Lemmas entsprechend an. Gruß --Udo T. (Diskussion) 12:30, 21. Aug. 2016 (MESZ)Beantworten

Reimseiten mit unsinniger Sprachbezeichnung

Bearbeiten

Wären Regeln wie

Reim( Diskussion)?:(Kyrill|Sowjet)isch([\/:].*)? # Es gibt keine Sprachen namens „Kyrillisch“ oder „Sowjetisch“, sondern nur „Bulgarisch“, „Russisch“, „Serbisch“, …

,

Reim( Diskussion)?:Klingonisch([\/:].*)? # Klingonisch ist urheberrechtlich geschützt.

oder

Reim( Diskussion)?:Sentinelesisch([\/:].*)? # Die sogenannten Sentinelesen lehnen jeden Kontakt mit der restlichen Welt ab.

sinnvoll, oder kann ggf. ein Bot solche Fehlanlagen aufspüren? --84.61.138.217 14:45, 26. Okt. 2016 (MESZ)Beantworten

Bitte die Regel

Reim( Diskussion)?:[a-zäöüß].* <casesensitive>                                 # In Reimseiten werden Sprachen mit großem Anfangsbuchstaben geschrieben.

durch

Reim( Diskussion)?:([a-hj-zß-ÿ]|i[^s]|is[^i]|isi[^A-Z]).* <casesensitive>      # In Reimseiten werden Sprachen mit großem Anfangsbuchstaben geschrieben.

ersetzen. Begründung: Im Unicode stehen zwischen ß und ÿ außer dem Divisionszeichen (÷) nur Kleinbuchstaben; außerdem gibt es afrikanische Sprachen, die mit isi + ASCII-Großbuchstabe anfangen. --84.61.152.80 11:31, 14. Apr. 2017 (MESZ)Beantworten

Reim:Deutch:-ɔpsn̩

Bearbeiten

Damit sich so was wie Reim:Deutch:-ɔpsn̩ nicht wiederholt, ist m. E. eine Regel

Reim( Diskussion)?:De?utch:.*                                                  # „Deutch“ ist eine Falschschreibung von „Deutsch“; „Dutch“ ist das englische Wort für „Niederländisch“.

nötig. --84.61.131.17 16:12, 3. Dez. 2016 (MEZ)Beantworten

Nö --Udo T. (Diskussion) 16:42, 3. Dez. 2016 (MEZ)Beantworten

Projektnamen im Versalsatz

Bearbeiten

Bitte

.*WIK(I[MP]EDIA|TIONARY).* <casesensitive>

zur Titleblacklist hinzufügen. --84.61.144.160 12:55, 24. Mai 2017 (MESZ)Beantworten

Nein, das bringt doch nichts. Dann wird halt WIKIPPEDIA, WIKTIONNARY etc. genommen. --Udo T. (Diskussion) 12:57, 24. Mai 2017 (MESZ)Beantworten

Zu meinen Erweiterungen der letzten Tage

Bearbeiten

Hallo zusammen,

nachdem ich festgestellt habe, dass die Spam-Bots (vor allem die mit IPs) in ihren Spam-Zielen (also den Titeln der Einträge, die sie erstellen wollen) überwiegend alle Wörter mit großem Anfangsbuchstaben schreiben, habe ich ein paar sehr häufig vorkommende, vorne großgeschriebene englische Begriffe in die Titleblacklist aufgenommen. Solche Lemmas kann es, nachdem im Englischen ja nahezu alles kleingeschrieben wird, bei uns nicht geben.

Alle von mir vorgenommenen Einträge greifen nur bei IPs sowie neuen Benutzern, die noch nicht automatisch bestätigt sind (autoconfirmed).

Zusätzlich habe ich in der Titlewhitelist Freigaben für Benutzer(in)(-Diskussions)-Seiten eingetragen, für den unwahrscheinlichen Fall, dass ein Benutzer genau so ein Schlüsselwort in seinem Benutzernamen gewählt hat. Denn ansonsten könnte ja so ein Benutzer die ersten 4 Tage (bis er "autoconfirmed" ist) keine eigene Benutzer-Seite anlegen und IPs und neue Benutzer könnten auch keine Nachrichten hinterlassen.

Ich erhoffe mir dadurch einfach eine deutliche Reduzierung von Einträgen im Spam-Blacklist-Logbuch; alles verhindern lässt sich natürlich trotzdem nicht.

Spam-Bots mit Benutzernamen steuern sowieso meistens ihre eigene Benutzer-Seite an, aber dort wird der Spam meist durch mehrere globale Missbrauchsfilter oder letztendlich auch den lokalen Filter 7 wirksam verhindert.

Gruß --Udo T. (Diskussion) 19:27, 9. Aug. 2018 (MESZ)Beantworten

Silbische Plosive

Bearbeiten

Falls es keine silbischen Plosive gibt, sollte

Reim( Diskussion)?:.*[ptʈckqʡʔbdɖɟɡɢ]̩.* # Unmögliche Lautschrift.

zur Titleblacklist hinzugefügt werden. --2.203.2.0 08:02, 11. Aug. 2018 (MESZ)Beantworten

Ich nehme an, dass du aufgrund deiner Sachkenntnis so etwas eh nicht erstellst. Es wäre schön, wenn du bei solchen Irrtümern (Spezial:Diff/6514906) angemeldet deutlicher auf den Fehler hinweisen würdest. --Peter -- 08:11, 11. Aug. 2018 (MESZ)Beantworten

Steuerzeichen

Bearbeiten

Bitte

.*[\x{AD}].*

zu

.*[\x{80}-\x{9F}\x{AD}].*

abändern, da auch Steuerzeichen nicht für Seitentitel geeignet sind. --2.203.76.111 15:00, 25. Aug. 2018 (MESZ)Beantworten

nur [ʁ] und [ɐ̯] bei Reimseiten

Bearbeiten

Hallo Alexander,

das war noch ein offener Punkt bei der IPA-Reform. Da ich allerdings nicht beurteilen konnte, ob [ʀ] nicht evtl. bei anderen Sprachen noch Verwendung findet, hatte ich da bisher nichts geändert.

Gruß --Udo T. (Diskussion) 12:49, 5. Mär. 2019 (MEZ)Beantworten

Ah..., jetzt sehe ich gerade, dass es ja "Reim( Diskussion)?:Deutsch:.*[ʀr].* <casesensitive>" heißt... Ok, hat sich damit erledigt. Gruß --Udo T. (Diskussion) 12:51, 5. Mär. 2019 (MEZ)Beantworten
Zurück zur Seite „Titleblacklist“.