Texvc2LaTeXBot Bearbeiten

Texvc2LaTeXBot (Diskussion • Beiträge • Sperrlogbuch • sulutil)

  • Botbetreiber: Debenben (und Salix_alba, zuständig für englischsprachige Projekte)
  • Funktion/Aufgaben des Bots: Inkompatible texvc Makros durch normale LaTeX-Syntax ersetzen
  • Programmiersprachen/Framework: Pywikibot Quellcode
  • Bemerkungen: Der Bot hat bereits einen Edit getätigt und es ist ehr unwahrscheinlich, dass weitere Edits nötig sind. Ganz ausschließen kann ich es aber nicht, daher möchte ich der Aufforderung [1] gerne nachkommen und die Gelegenheit nutzen über den aktuellen Stand zu informieren.

Das ganze ist Teil eines größeren Projekts um die Math-Erweiterung zu verbessern. Zum Hintergrund des Projekts habe ich hier ein bisschen geschrieben. Wir freuen uns immer über Anregungen und Kritik, es stehen auch eine ganze Menge anderer Fragen im Raum. Meinungen usw. am Besten gleich hier: phab:T195861, mw:Extension:Math/Roadmap. Außerdem kann man der user group beitreten, Feedback zu inline svg geben, dies unterstützen...

Zum aktuellen Stand und zur Präzisierung von "unwahrscheinlich": Vor einer Syntaxumstellung müssen wir natürlich sichergehen, dass der Quellcode der Formeln kompatibel ist. Es gibt jedoch leider keine Datenbank mit dem Quellcode von allen Formeln bzw. die es erlauben würde eine Formel einer Wikipedia Seite zuzuordnen. Daher durchsuchen wir im Moment die Database-Dumps nach math-Tags. Das Durchsuchen des normalen Wikitexts ist bereits aufwändig und fehleranfällig. Math-Tags lassen sich aber auch über Einbinden von Vorlagen bzw. Parserfunktionen wie {{#tag: math|A+B=C}} generieren und werden somit im normalen Wikitext nicht gefunden. Dies wird z.B. viel in dewikiversity verwendet. Dort haben wir die Liste der Seiten die der Bot bearbeiten soll generiert indem wir jede Vorlage in dewikiversity mit der Mediawiki-API expandiert haben. Das hat ca. 2 Tage gedauert und wenn man anhand der Gesamtzahl der durchsuchten Seiten grob auf alle Projekte hochrechnet kommt man auf ca. 20 Jahre. Vielleicht hat ja jemand eine Idee wie man das am Besten lösen kann. Mit anderen Worten: Falls in dewiktionary noch mehr Ersetzungen vorgenommmen werden müssen besteht keine Eile bei der Erteilung des Botflags.--Debenben (Diskussion) 20:27, 3. Feb. 2019 (MEZ)[Beantworten]

  • Datum: 20:27, 3. Feb. 2019 (MEZ)

Diskussion Texvc2LaTeXBot Bearbeiten

Hallo Debenben, grundsätzlich bin ich dafür, zumal es ja um eine (offizielle?) Verbesserung einer Mediawiki-Erweiterung geht. Ich denke auch nicht, dass der Bot hier in einem Wörterbuch viel machen müsste. Ich habe vorhin mal schnell mit dem DB-Scanner vom AWB im letzten XML-Dump von uns geschaut und es gibt derzeit bei uns 234 math-Einbindungen und keine mit chem bzw. ce. Trotzdem ist natürlich das Bot-Flag notwendig, damit die Bearbeitungen nach Möglichkeit gesichtet sind (autoreview).
Die in mw:Extension:Math/Roadmap#Step_1_Part_A:_Remove_problematic_texvc_redefinitions aufgeführten Formeln gibt/gab es nur im heute geänderten Eintrag Disjunktion.

Kannst Du evtl. noch Auskunft darüber geben, wie hoch bisher die Fehlerrate in der de.WP war, wo der Bot ja schon länger läuft. Ab und zu musstest Du ja anscheinend schon korrigieren, wie ich gesehen habe. Und bist Du auch willens und in der Lage, die Bearbeitungen Deines Bots (zumindest stichprobenartig, falls es viele werden) hier bei uns zu kontrollieren? Wenn Du das sicherstellen kannst, dann von meiner Seite   Pro. Gruß --Udo T. (Diskussion) 20:52, 3. Feb. 2019 (MEZ)[Beantworten]

Wie hoch die Fehlerrate ist, ist schwierig zu sagen da der Bot nur die Seiten der vorher generierten Liste bearbeitet. Die Bearbeitungen kontrollieren wir immer stichprobenartig und falls wir einen Fehler sehen, dann beheben wir ihn und kontrolliere dass der gleiche Fehler in den anderen Bearbeitungen nicht gemacht wurde. Dieser Fehler sowie die nachfolgenden Fehler, bei denen <math.h> als Beginn eines Math-tags erkannt wurden war zum Beispiel schon immer im Code, ist aber bei den ~8000 vorherigen Bearbeitungen nie aufgetaucht, weil das awk-script mit dem die Seitenlisten vorher generiert wurden diesen Fehler nicht hatte (dafür aber andere Math-tags übersehen hat) und es daher diese problematischen Seiten nie in die Liste geschafft haben. In der beim letzten Mal habe ich dann die Seitenliste mit der tag-Erkennungsfunktionalität der pywikibot Bibliothek generiert und von den 11 zusätzlichen Seiten auf der Liste für dewiki waren 4 falsch. Dieser Fehler ist behoben [2] und kann nicht mehr auftreten, genauso wie dieser der mal in enwiki aufgetreten ist. Ich hoffe, dass das der letzte Fehler war aber garantieren kann ich es nicht, dafür ist der wikicode einfach zu kompliziert.--Debenben (Diskussion) 21:26, 3. Feb. 2019 (MEZ)[Beantworten]
Hallo Debenben, danke für die Infos. Ich kann mir gut vorstellen, dass das nicht immer gänzlich ohne Fehlbearbeitungen geht. Aber solange Du bzw. Deine Kollegen das überprüfen und dann sogar im Fehlerfall einen Fehler auch noch in allen vorherigen Bearbeitungen überprüf(s)t, hört sich das für mich gut an. Ich betreibe ja selber einen Bot hier (und früher vor „Cognate“ noch zusätzlich einen globalen Interwiki-Bot für alle Wiktionarys). Gruß --Udo T. (Diskussion) 21:36, 3. Feb. 2019 (MEZ)[Beantworten]

Hallo Betterknower und Formatierer (die 2 anderen Haupt-Bot-Betreiber bei uns), aber natürlich auch gerne jeder andere, wie ist Eure Meinung dazu? Gruß --Udo T. (Diskussion) 20:16, 4. Feb. 2019 (MEZ)[Beantworten]

Tja, viel Arbeit wird es für diesen Bot hier im Wörterbuch nicht geben. Meine Einstellung für diesen Antrag lautet 'neutral'. --Betterknower (Diskussion) 22:17, 4. Feb. 2019 (MEZ)[Beantworten]
Wenn es wirklich nicht so viel zu tun geben sollte und wenn es dann auch nur eine zeitlich befristete Aktion ist, dann könnten wir es sicherlich auch ähnlich wie beim CommonsDelinker handhaben. Der ist ja absichtlich kein Bot und auch kein passiver Sichter, damit man eben seine Bearbeitungen (vor allem das Entfernen von auf Commons gelöschten Bild-Einbindungen bei uns) nachbearbeiten kann. Dann müssten halt alle Stamm-Benutzer (vor allem alle Admins) via Teestube darüber informiert werden. Gruß --Udo T. (Diskussion) 22:52, 4. Feb. 2019 (MEZ)[Beantworten]
Weil mögliche Fehler nicht auszuschließen sind und weil es hier nur wenige Änderungen geben würde, befürworte ich, dass er wie der CommonsDelinker arbeitet. D.h. ohne Botflag und ohne Sichterstatus. Schöne Grüße --Yoursmile (Diskussion) 06:03, 5. Feb. 2019 (MEZ)[Beantworten]
Als gelegentlicher CommonsDelinker-Nachbearbeiter schließe ich mich dieser Meinung an. -- Peter -- 06:43, 5. Feb. 2019 (MEZ)[Beantworten]
Dito. -- Formatierer (Diskussion) 09:52, 5. Feb. 2019 (MEZ)[Beantworten]

Hallo Debenben, wie Du am Disk.-Verlauf sehen kannst, haben wir uns nun entschieden, Deinen Bot zwar zu authorizieren, ihm aber ganz bewußt kein Bot-Flag zu erteilen, da er aller Voraussicht nach nur sehr wenige Bearbeitungen machen wird und so seine Bearbeitungen auch von hiesigen Benutzern besser kontrolliert werden können.

Der CommonsDelinker (ein Bot von Commons) hat bei uns aus ähnlichen Gründen kein Bot-Flag, da insbesondere beim Entfernen von gelöschten Bildern bei uns Nachbearbeitungen notwendig sind.

Ich werde auf der Benutzer-Seite Deines Bots einen Bot-Kasten setzen und auch deutlich darauf hinweisen, dass Dein Bot bei uns absichtlich keine Bot-Flag hat, aber trotzdem authorisiert ist. Zusätzlich werd ich in unserer Teestube darauf hinweisen.

Gruß --Udo T. (Diskussion) 12:48, 7. Feb. 2019 (MEZ)[Beantworten]