banner

Blog

Aug 20, 2023

Stapelüberlauf: Wie stark sinkt der Datenverkehr und wie wurde der Moderator-„Streik“ gelöst? • DEVCLASS

Stack Overflow, die Website, an die sich Entwickler bei Codierungsfragen häufig wenden, gab an, dass der Traffic-Rückgang aufgrund der Konkurrenz durch KI-Assistenten übertrieben sei, obwohl unsere Analyse darauf hindeutet, dass er nach wie vor erheblich ist. Das Unternehmen hat jedoch seinen Moderatorenstreik, der wegen Problemen im Zusammenhang mit KI-generierten Inhalten ausgerufen wurde, größtenteils gelöst.

Es gab verschiedene Berichte über einen Traffic-Rückgang, darunter auch unseren eigenen, da Entwickler die Bequemlichkeit von Codierungsassistenten im Editor nutzen, um Probleme zu lösen. Das Unternehmen gibt nun an, dass die extremeren Analysen, die einen Rückgang von 35 bis 50 Prozent zeigten, falsch waren und auf Änderungen an der Google Analytics-Konfiguration zurückzuführen waren.

„Insgesamt verzeichnen wir in diesem Jahr im Vergleich zu 2022 durchschnittlich etwa 5 % weniger Traffic“, sagte Des Darilek, Leiter Produktmanagement. Sie räumte jedoch auch ein, dass der Datenverkehr im April um 14 % zurückgegangen sei, was darauf zurückzuführen sei, dass „Entwickler GPT-4 ausprobierten“, die OpenAI-Engine des Unternehmens, das auch GitHub Copilot antreibt. Daher ist ein Rückgang zu verzeichnen, auch wenn dieser in manchen Berichten übertrieben dargestellt wird.

Eine andere Möglichkeit, dies zu betrachten, besteht darin, zu zählen, wie viele Fragen gestellt werden. Dieser Bericht zeigt, dass seit letztem Jahr neue Fragen zurückgegangen sind. Anschließend führten wir unsere eigene SEDE-Abfrage (Stack Exchange Data Explorer) durch, die zeigte, dass der April kein Einzelfall war. Im Jahresvergleich lag der April laut den gestellten Fragen um 22,5 %, der Mai um 25,6 %, der Juni um 24,5 % und der Juli um 22,2 % zurück.

Die erhoffte Lösung von Stack Overflow ist ein in Vorbereitung befindlicher neuer Dienst namens OverflowAI sowie etwas vielleicht Wichtigeres, ein Visual Studio Code-Add-In, das mit der Bequemlichkeit von Copilot mithalten könnte – obwohl sein Fokus anders ist, da es keinen direkten Code einfügt.

Die gute Nachricht für das Unternehmen ist jedoch, dass der Moderatorenstreik größtenteils vorbei ist und sich die Beziehungen zwischen den Mitarbeitern und den ehrenamtlichen Moderatoren verbessert haben. Das Hauptproblem, das in einem offenen Brief beschrieben wurde, bestand darin, dass es Moderatoren untersagt war, Antworten auf technische Fragen zu entfernen, wenn der Grund für die Entfernung darin bestand, dass sie von der KI generiert wurden. Die Moderatoren argumentierten, dass solche Antworten anfällig für „falsche Informationen und Plagiate“ seien.

Die Möglichkeit falscher Antworten ist ein Problem der generativen KI, die von ChatGPT von Open AI, Bard von Google und anderen solchen Systemen verwendet wird. Generative KI ist stark im Sinne ihrer Fähigkeit, fließende Antworten auf die gestellte Frage zu geben, es gibt jedoch keine Garantie für die Richtigkeit. In den FAQ zu GitHub Copilot heißt es beispielsweise: „Öffentlicher Code kann unsichere Codierungsmuster, Fehler oder Verweise auf veraltete APIs oder Redewendungen enthalten.“ Wenn GitHub Copilot Codevorschläge basierend auf diesen Daten synthetisiert, kann es auch Code synthetisieren, der diese unerwünschten Muster enthält.“

Das Ergebnis der Verhandlungen war, dass Stack Exchange (das Unternehmen hinter Stack Overflow) zustimmte, die Entfernung von Inhalten auf der Grundlage „eines einzigen starken Indikators der GPT-Nutzung oder mehrerer schwächerer Indikatoren“ zuzulassen. Die zuvor vom Unternehmen festgelegte Richtlinie zu diesem Thema wurde überholt. Darüber hinaus verpflichtete sich das Unternehmen, weiterhin Daten-Dumps von Abonnenteninhalten, API-Zugriff und dem Stack Exchange Data Explorer zu pflegen, allerdings mit dem Zusatz, dass es „Schutzmaßnahmen um diese herum aufstellen könnte, um sicherzustellen, dass Unternehmen, die Sprachmodelle usw. erstellen, für den Zugriff Gebühren zahlen müssen.“ ” – eine Bedingung, die einige Community-Mitglieder als unangemessen erachten, da Daten-Dumps unter einer Creative-Commons-Lizenz, CC by-SA 4.0, lizenziert sind, die die Adaption für jeden Zweck bei entsprechender Quellenangabe erlaubt. Darüber hinaus gibt es Änderungen an der Art und Weise, wie Stack Exchange mit Moderatoren kommuniziert, und einen Prozess für den Fall, dass Stack Exchange selbst offenbar gegen seine Moderatorenvereinbarung verstoßen hat.

Dieser Streik war nicht mit einem Mitarbeiterstreik vergleichbar, da die Moderatoren von Stack Overflow Freiwillige sind; Und im typischen Stack Overflow-Stil war die Frage, ob der Streik beendet war, selbst Gegenstand einer Debatte – obwohl es in der Praxis so aussieht, als sei die Moderation wieder normal.

KI ist der rote Faden zwischen dem Streik, dem Verkehr und den neuen Diensten. Stack Overflow ist für viele Entwickler nach wie vor von enormer Bedeutung. Der Vorteil gegenüber KI liegt in der Moderation und dem Konsens der Experten, die sich auf die Fragen konzentrieren – vorausgesetzt, sie wecken ausreichend Interesse. Allerdings kämpfen die Websites mit KI und ihre Auswirkungen dürften auch weiterhin anhalten.

AKTIE