Wiktionary:Treffen/Mai 2014/Protokoll

im Alphabet-Workspace in Berlin
Owefoin, ein Beitrag zur Völkerverständigung
Rainbow unter den Linden

Protokoll des 2. Wiktionary-Treffens am 10. und 11.05.2014 in Berlin.

Bitte an die Teilnehmer: Vielleicht können wir diesmal in Gemeinschaftsarbeit das Protokoll erstellen (jeder übernimmt ein paar Themen?), zur Erinnerung kann ja Live-Protokoll: link verwendet werden.

10.05.2014

Bearbeiten

Teilnehmer:

Alle Teilnehmer stellen sich kurz vor: Beruflicher, sprachlicher Hintergrund, Interessen, Weg zu Wiktionary etc.

Grundsätzlich: Zu keinem der besprochenen Themen können beim Treffen endgültige Beschlüsse gefasst werden. Wir sammeln Vorschläge, Tendenzen, Meinungen, die dann in der Teestube diskutiert und gegebenenfalls per Meinungsbild beschlossen werden.

Ausspracheabschnitt

Bearbeiten

Immer wieder monieren Wiktionary-Mitarbeiter oder -Nutzer die ausschließliche Angabe der standardsprachlichen IPA laut Duden oder Krech/Stock. Besonders süddeutsche und österreichische Sprecher irritieren Ausspracheangaben wie Ludwig [ˈluːtvɪç], da dies der Aussprache in Schule und regionalen Fernseh-/Radiosendern widerspricht. Es werden Möglichkeiten der Darstellung am Beispiel von pfiffig diskutiert. Um den Ausspracheabschnitt nicht in unübersichtlicher Weise aufzublähen, wäre eine aus-/einblendbare Tabelle wünchenswert, die Platz für die zugehörigen Hörbeispiele (und Reime?) bietet.

Wie eine solche Tabelle konkret aussehen könnte, muss noch erarbeitet und mit der Community diskutiert werden.

Eine Überlegung war auch, in den Ausspracheabschnitt nur begrenzt Varianten aufzunehmen, also evtl. Standard/Bühne/norddeutsch/süddeutsch, alle anderen Varianten sollen bei Bedarf im jeweiligen Dialektabschnitt angeführt werden.

Übersetzungs-/Dialektabschnitt

Bearbeiten

Datenbank der bairischen Mundarten in Österreich

Bearbeiten

Präsentation Benutzer:Hubertl zu w:Wörterbuch der bairischen Mundarten in Österreich. Es besteht Aussicht, dass die unglaubliche Anzahl an gesammelten Daten unter Freier Lizenz genutzt werden kann.

Die Geschäftsstelle in Wien (Claudia Garád) hat vor annähernd 8 Monaten den Kontakt zur österr. Akademie der Wissenschaften aufgebaut, um langfristig, nach dem Modell des Bundesdenkmalamts, eine Zusammenarbeit auf verschiedenen Ebenen zu ermöglichen. Die ersten Schritte werden nun mit Eveline Wandl-Vogt, Projektleiterin der Datenbank der bairischen Mundarten in Österreich @ Electronically Mapped gemacht. Sie war schon in Bremen beim Glam-Treffen als Vortragende dabei, ein gemeinsamer Vortrag bei der Wikimania ist vorgesehen. Ein Dialektprojekt war aber schon seit dem Sommer geplant, denn wir konnten letztes Jahr bereits 3.200 Audiodateien vor dem Verfall retten. (Amstetten, Niederösterreich).

Ziel des Projekts ist die Schaffung einer Struktur in Wikimedia-Projekten - in dieser Angelegenheit vorerst und vorrangig auch auf Wiktionary-Ebene - welche die Übernahme von Daten der ÖAW ermöglichen soll. Darüber hinaus solle eine Software erstellt werden, welche es ermöglicht, Worte, Phraseme, Texte auf einfache Art als Hörbeispiel einzugeben. Wobei das keinesfalls auf Regionalsprachen beschränkt sein soll, sondern es ermöglichen soll, jegliche Sprache mit Audiodaten durch ausgewählte Sprecher erweitern bzw. ersterfassen zu können. Inzwischen hat sich auch bereits Rudolf Muhr bereiterklärt, sich am Projekt als wissenschaftlicher Betreuer zu beteiligen und ebenfalls einen außergewöhnlich großen Beitrag bestehender Daten (so zB. das Aussprachewörterbuch des Österr. Deutsch) zum Wikimedia-Projekt beizutragen.

Eine erste Präsentation vor internationalem akad. Fachpublikum wird auf der Konferenz Pluricentric languages worldwide and pluricentric theory Anfang Juli an der Universität Surrey, Guildford, UK durchgeführt, gemeinsam mit R. Muhr, der die wissenschaftliche Seite präsentieren wird, sowie ich als entsendeter Vertreter von Wikimedia Österreich mit dem Anliegen, dieses Projekt unter den Prämissen und Möglichkeiten von Wikimedia darzustellen und Kooperationen auf internationaler Ebene auszuloten. Ein Monat darauf wird dieses Projekt dann bei der Wikimania vorgestellt werden. (Update 13. Mai). ...

Sprache oder Dialekt

Bearbeiten

Wir sprechen über die unterschiedlichen Vorgehensweisen bei der Angabe von regionalsprachlichen/mundartlichen Varianten im Übersetzungsabschnitt: Beispielsweise wird {{nds}} (Niederdeutsch/Plattdeutsch) mal unter den „normalen“ Sprachen eingetragen, mal im Dialektabschnitt. Das englische Wiktionary hat gar keinen extra Abschnitt für Dialekte und sortiert alles, auch {{bar}} (Bairisch), ganz normal ein.

Wir sollten möglichst einfache Kriterien dafür finden, was an welcher Stelle eingetragen werden soll.

→?

Lemma für Dialekteinträge

Bearbeiten

Zur Problematik der (Haupt-)Lemma-Findung für „Dialekteinträge“ (zahlreiche verschriftlichte Varianten des gleichen Wortes) erläutert Benutzer:Seidenkäfer die Vorgehensweise einschlägiger Wörterbücher und wird ein Beispiel erstellen, wie Dialekt-Einträge aussehen können.

→ erster Vorschlag aufhin und Diskussion:aufhin (Benutzer:Balû hat seine bairischen Einträge meist auch nach diesem Prinzip erstellt)

Einträge für rekonstruierte Sprachen

Bearbeiten

...

Wortarten

Bearbeiten

Wortverbindung

Bearbeiten

Wir diskutieren den Sinn der „Wortart“ Wortverbindung. Gibt es eine Begründung für Einträge, die allein Wortverbindung sind? Können nicht alle wünschenswerten Einträge Wortkategorien wie Substantiv, Verb, Adjektiv, Adverb, Redewendung, Sprichwort etc. zugeordnet werden? Evtl. auch Adverbialphrase, Nominalphrase ...?

Tendenz: Wortart „Wortverbindung“ auflösen.

→muss diskutiert werden

Geflügeltes Wort

Bearbeiten

Tendenz: Auflösen, gehört – wenn nicht Redewendung – in Wikiquote. Es gibt ein paar Problemfälle, z. B. zurück zur Natur.

→muss diskutiert werden

Abkürzungen

Bearbeiten

...

Einblick in Bot-Programmierung

Bearbeiten

Präsentation Benutzer:Betterknower, Benutzer:BetterkBot


In der kurzen Präsentation wurde gezeigt, wie ein Botlauf denn so funktioniert. Voraussetzung dafür ist ein kleines Skript auf der Basis regulärer Ausdrücke, die Installation von Python, ein aktueller Dump als Datenquelle, sowie natürlich ein Botflag. Das Programm läuft im cmd-Fenster. Siehe auch mw:Manual:Pywikibot. Nach diesem Test wurde auch die Möglichkeit aufgezeigt, mit dem AutoWikiBrowser zu arbeiten, bei dem vor allem die Scan-Funktion für die Analyse des Wiktionary-Datenbestands zu erwähnen ist; als Bot eignet er sich ja nicht besonders. Auch hier sind oft Regex-Kenntnisse und auf jeden Fall ein Dump erforderlich.

Fördermöglichkeiten

Bearbeiten

Benutzer:DerHexer weist auf verschiedene Fördermöglichkeiten hin: Wikipedia:Förderung, zum Beispiel speziell Wikipedia:Literaturstipendium, Österreich: Wikimedia Österreich.

Es besteht auch für das Wiktionary die Möglichkeit, sich um Unterstützung für Programmierung zu bemühen. Hätten wir beispielsweise ein Konzept für eine benutzerfreundliche Oberfläche für das Erfassen/Formatieren von Einträgen oder Ähnliches, könnten wir da mal nachfragen, ob das jemand für uns programmiert. Oder wir schlagen jemanden vor, der das leisten könnte und dann dafür bezahlt wird.

Bilderwunschseite

Bearbeiten

Benutzer:Stepro regt an, eine Wunschseite für fehlende Bilder einzurichten. Es kommt ja öfter mal vor, dass man auf Commons kein geeignetes Bild findet. Fleißige Fotografen würden vielleicht gerne mal solche Wünsche erfüllen. Kann man an einer geeigneten Stelle bei Commons einen Link auf diese Wiktionary-Bilderwunschliste unterbringen?

Der Vorschlag wurde von allen begrüßt und auch gleich umgesetzt.

Wiktionary:Wunschliste/Bilder

Wörterraten

Bearbeiten

Ein bisschen Spaß muss sein am Abschluss eines Tages, wo man sich heiser geredet hat und die Köpfe rauchten:

Wörterraten (User: Formatierer)

11.05.2014

Bearbeiten

Charakteristische Wortkombinationen

Bearbeiten

Präsentation Benutzer:Alexander Gamauf (Kurzfassung):

Was sind Kollokationen?

Bearbeiten
  1. Im weiteren Sinne das erwartbare Miteinandervorkommen (Kookkurrenz) von Lexemen aufgrund von
a) semantischer Assoziation (Mut <-> Zuversicht)
b) Sachrelationen der Denotate (Regen <-> Wolke)
c) lexikalischer Solidarität (Pfotevierfüßiges Tier
d) halbidiomatischer Verbindung (Anordnung treffen versus Befehle erteilen)
e) konzeptueller Stereotypie (tragischer Unfall, bedauerlicher Zwischenfall, ...)
  1. Im engeren Sinne die kontextuelle Erklärung der Bedeutung für die oben genannten Fälle (a-c)
  2. Im speziellen Sinne: Syntagmen, deren polyseme Glieder sich monosemieren (kaputte Birne; saftige <- Ohrfeige; saftige Birne)[1]

Kollokationen als Bestandteil eines Wörterbuchs

Bearbeiten
  • „Kollokationen sind insgesamt nicht gut untersucht, aber es gibt gute Gründe, sie als Lexikonelemente zu betrachten.“[2]
  • „… Konstruktionen wie z.B. eingefleischter Junggeselle, blonde Haare oder bitter nötig. In solchen Paaren besteht eine semantische Abhängigkeit der Elemente voneinander.“[2]
  • „Zum Beispiel kann bei eingefleischt ____ nur eine Personenbezeichnung eingesetzt werden; ohne diesen Bezug auf eine Personenbezeichnung wüsste man gar nicht, was eingefleischt bedeuten soll.“[2]

Kollokationstests

Bearbeiten
  • siehe Kollokationstest
  • ergänzend: wechselnde Bedeutung des Adjektivs dick in dicker Mann/dickes Buch/dicke Lüge/dicke Freundschaft
  • diese Beispiele zeigen, dass die Angabe der Nummer der Bedeutung bei ChaWo's essentiell sind

Kollokationen im DWDS

Bearbeiten
  • DWDS benennt zusätzlich grammatikalische Eigenschaften des Lexems (Beispiel: Wortprofil in Digitales Wörterbuch der deutschen Sprache „Automobil“)
  • DWDS stellt die Häufigkeit der Wortverbindung durch unterschiedliche Schriftgröße und Schriftart dar

Frage: Sollen wir die präsentierte Ideen aufgreifen?

Bearbeiten
  • Ergänzungen durch grammatikalische Angaben (attributiv vs. prädikativ); Beispiele: Substantiv Senfgas, Adjektiv flugunfähig; ==> interessant bei Adjektiven deren adverbialischen Form gleich ist
  • Verstärkt Bedeutungsunterschiede durch Kollokationstests mit geeigneten Kollokationen herausarbeiten

Diskussion

Bearbeiten

Die Diskussion ergab die grundsätzliche Zustimmung, Charakteristische Wortkombinationen nach syntaktischen Kriterien zu gliedern ("mit Attribut:", "als Akkusativobjekt:"). Zweifel wurden bei der Gliederung attributiv/prädikativ/adverbial bei Adjektiven (siehe z. B. "flugunfähig") geäußert, da keine vollständige Darstellung angegeben wurde. Kollokationstests ergäben sich automatisch durch Angabe von Kollokationen bei verschiedenen Bedeutungen.

Quellen:

  1. Helmut Glück (Herausgeber): Metzler-Lexikon Sprache. 4., aktualisierte und überarbeitete Auflage. Metzler, Stuttgart/Weimar 2010, ISBN 978-3-476-02335-3, DNB 1002407257, Seite 340f, Eintrag „Kollokation“.
  2. 2,0 2,1 2,2 Jörg Meibauer u.a.: Einführung in die germanistische Linguistik. 2. Auflage. J.B.METZLER, Stuttgart/Weimar 2007, ISBN 978-3-476-02141-0, Seite 19.

Förderung ortsspezifischer Wortkombinationen bei Toponymen

Bearbeiten

Es gibt Vorschläge, die bisherige Praxis des schematischen Eintrags Charakteristischer Wortkombinationen nach Muster von Gotha nicht mehr zu unterstützen und die Benutzer zu ermutigen, stattdessen nur noch ortstypische Wortkombinationen einzutragen, wie zum Beispiel in den Karpaten. Die schon vorhandenen Einträge können natürlich erhalten bleiben und werden durch neue ergänzt. Die Hilfeseite soll entsprechend angepasst werden und im Abschnitt Toponyme nur Beispiele mit ortsspezifischen Wortkombinationen zeigen.

Für Charakteristische Wortkombinationen wie „nach Gotha reisen, aus Gotha stammen etc.“ wäre ein besserer Platz bei den entsprechenden Verben.

Verbesserung der Benutzerfreundlichkeit bei nummerierten Objekten

Bearbeiten

Zur Unterscheidung verschiedener Bedeutungen dienen bisher Zahlen in eckigen Klammern (z.B. [1], im Folgenden [i]-Markierung genannt), die der jeweiligen Bedeutung eines Lemmas vorangestellt werden. Diese [i]-Markierungen werden dann in weiteren Einträgen auf der Seite zur Identfikation der spezifischen Bedeutung benutzt, zum Beispiel bei Synonymen, Textbeispielen, Übersetzungen und Referenzen. Auf umfangreichen Seiten kann es dazu kommen, dass der Benutzer häufig auf der Seite herumblättern muss, um [i]-markierte Einträge einer Bedeutung zuordnen zu können.

Ein Verbesserungsvorschlag besteht darin, dass bei allen Einträgen, die sich über die [i]-Markierung auf eine Bedeutung beziehen, der Bedeutungstext durch Bewegung des Mauszeigers auf die [i]-Markierung angezeigt wird. Auf diese Weise kann die jeweilige Bedeutung an jeder Stelle mit einer [i]-Markierung abgelesen werden.

Das gleiche Verfahren bietet sich für die Betrachtung der Referenzen und Quellenangaben an, wie es bei der englischen Wikipedia schon realisiert ist.

Einführung weiterer Textbausteine

Bearbeiten

Es gab grundsätzliche Zustimmung zur Einführung einiger weiterer Textbausteine. Sie sollen dazu dienen, relevante Informationen unterzubringen, die bisher in keinem Textbaustein untergebracht werden können. Damit sie nur dann eingesetzt werden, wenn sie wirklich gebraucht werden, sollen sie eher nicht in den Formatvorlagen enthalten sein, sondern über das Auswahlmenü über dem Bearbeitungsfenster extra eingefügt werden müssen.

  • Holonyme (z. B. bei Festplatte: Computer) und Teilbegriffe (z. B. bei Computer: Festplatte) – stoßen auf allgemeine Zustimmung
  • semantisch naheliegende Wörter, wie sie oft in älteren Einträgen bei den CWK stehen (z. B. bei Vogel: Nest), Baustein könnte „Wortfeld“ oder „Kookkurrenzen“ heißen – tendenziell Zustimmung, lädt aber zum Aufblähen von Einträgen ein, vielleicht eine quantitative Begrenzung festlegen
  • Syntax vor allem bei Verben und Präpositionen – wenn, dann nur dort, wo längere Angaben nötig sind; transitiv, reflexiv etc. soll weiterhin vor der Bedeutung stehen

Das Sichten sollte auf die Namensräume Verzeichnis, Reim und Thesaurus ausgeweitet werden. Dazu muss wohl bei Bugzilla angefragt werden. →Anfrage

Wir haben lange Listen von Seiten mit ungesichteten Versionen und gänzlich ungesichteten Seiten. Unser größtes Problem beim Sichten sind Übersetzungen, die schwer zu überprüfen sind. Unter den Teilnehmern wird die Vorgehensweise befürwortet:

  • einfach zu kontrollierende Übersetzungen grob zu überprüfen und zu sichten
  • sonst ein Fragezeichen zu setzen ({{Ü?|...}}) und zu sichten

Bei den gänzlich ungesichteten Seiten sind oft Qualitätsmängel das Problem. In diesen Fällen kann ein QS-Baustein gesetzt und der Eintrag mit dieser Kennzeichnung gesichtet werden.

Literaturliste

Bearbeiten

Die wenigen noch verbliebenen Einträge aus der alten Literaturliste sollen zeitnah durch das Erstellen neuer Vorlagen ersetzt werden. Bei sehr selten eingebunden Vorlagen (1- bis 5-mal) kann die allgemeine Literaturvorlage verwendet werden. Georges wenn möglich mit Hilfe eins Bots ersetzen.

Wiktionary:Literaturliste/neu/Liste

Autorenportal

Bearbeiten

Benutzer:Kronf hat sich bereits vor einiger Zeit des veralteten Portals angenommen und Themen, Seiten und Kategorien überarbeitet, zusammengefasst, aktualisiert für Autoren, die sich bei der Wartung des Wiktionarys beteiligen wollen. Das Ergebnis findet allgemeinen Anklang.

Für weitere Ideen ist im Portal noch genügend Platz. Eventuell auch zur Dokumenation des Fortschritts für gemeinsam in Angriff zu nehmende Projekte wie „alle noch nie gesichteten Einträge abarbeiten“, „Prüfung der Hörbeispiele“ etc.

Wiktionary:Autorenportal

Reim-Ergänzungs-Skript

Bearbeiten

Kurze Überlegung, die beim Mittagessen aufkam.

Formatierer hat ein Skript von Conrad.Irwin importiert, das ein Eingabefeld zur Ergänzung von Listen bereitstellt. Wir setzen es standardmäßig auf den Verzeichnis- und Reim-Seiten ein. Im Falle der Reime übernimmt beim Abspeichern ein weiterer Teil des Skripts die Einfügung der Reim-Zeile in den Ausspracheabschnitten der eingetragenen Wörter. Diese Edits werden im Namen (mit dem Konto) des Benutzers durchgeführt, der die Reim-Seite ergänzt hat. Probleme dabei:

  • die Letzten Änderungen werden gefüllt (was eines unserer Argumente gegen Massenedits ohne Botflag ist)
  • bei unangemeldeten/nicht bestätigten Benutzern sind alle Änderungen zu sichten

Daher Vorschlag: Diese Edits soll ein spezieller Account mit Botflag und Sichterrecht vornehmen, falls das möglich ist.