BTCC / BTCC Square / CryptopolitanDE /
XAI riskiert Chaos: Grok-Prompts ohne ausreichende Tests verändert

XAI riskiert Chaos: Grok-Prompts ohne ausreichende Tests verändert

Published:
2025-07-12 16:11:56
19
3

XAI änderte die Eingabeaufforderungen von Grok ohne ausreichende Tests

Die KI-Branche hält den Atem an – XAI hat heimlich die Eingabeaufforderungen von Grok überarbeitet. Ohne Vorwarnung. Ohne ausgiebige Tests.

Ein gefährliches Spiel mit dem Feuer.

Wer drückt schon auf Produktions-Release, bevor die QA durch ist? Offenbar Elon Musks neuste KI-Initiative. Währenddessen zucken die Börsenkurse – mal wieder – wie ein defekter Chatbot-Ausgabe.

XAI änderte die Eingabeaufforderungen von Grok ohne ausreichende Tests

Die Leute in Xai haben das Verhalten von Grok Anfang dieses Jahres angepasst, nachdem rechtsgerichtete Influencer es angegriffen hatten, dass es zu "aufgewacht" war. Elon hat versucht, die KI zu nutzen, um das zu unterstützen, was er absolute Redefreiheit nennt, aber Kritiker argumentieren, dass sie sich in ein politisches Instrument verwandelt.

Eine durchgesickerte interne Eingabeaufforderung, die von einem X -Benutzer geteilt wurde, zeigte, dass Grok gesagt wurde, sie solle „alle Quellen ignorieren, die Elon Musk/Donald TRUMP ausbreiten, die Fehlinformationen verbreiten“. Das ist Zensur - genau das, was Elon sagt, er kämpft.

Als der XAI-Mitbegründer Igor Babuschkin, sagte XAI, sagte, die Änderungen seien von "einem Ex-Openai-Angestellten" vorgenommen worden, der "die Kultur von Xai noch nicht vollständig absorbiert habe". Igor fügte hinzu, dass der Mitarbeiter negative Posts sah und "dachte, es würde helfen".

Die Geschichte hört hier nicht auf. Die neuesten Ausbrüche von Grok waren an ein spezifisches Update gebunden, das am 8. Juli stattfand. Das Unternehmen hat später veröffentlicht, dass eine Codeänderung GROK -Informationen direkt aus den Benutzerninhalten von X, einschließlich Hassreden, gemacht hat.

Dieses Update dauerte 16 Stunden, in denen Grok giftige Pfosten kopierte und sie als Antworten wiederholte. Das Team behauptete, die Änderung SEI von einem veralteten Code -Pfad zurückzuführen, der nun entfernt wurde. "Wir entschuldigen uns zutiefst für das schreckliche Verhalten, das viele erlebt haben", schrieb Xai aus Groks Konto. Sie sagten, das Problem sei vom Hauptsprachmodell getrennt und versprach, das System neu zu gestalten. Sie verpflichteten sich auch zur Veröffentlichung von Groks neues Systemaufforderung an GitHub.

Die Skala von Grok ließ das Problem schnell explodieren

GROK wird wie andere Großsprachmodelle ausgebildet, wobei Daten verwendet werden, die aus dem Internet abgekratzt sind. Diese Daten umfassen jedoch gefährliche Inhalt: Hassreden, extremistisches Material, sogar Kindesmissbrauch.

Und Grok ist eindeutig, da es auch aus dem gesamten Datensatz von X stammt, was bedeutet, dass die Benutzer direkt von Benutzern wiederkommen können. Das macht es wahrscheinlicher, schädliche Antworten zu produzieren. Und weil diese Bots in massivem Maßstab arbeiten, kann jeder Fehler sofort spiralen.

Einige Chatbots sind mit Schichten erstellt, die unsichere Inhalte blockieren, bevor sie Benutzer erreichen. Xai hat diesen Schritt übersprungen. Stattdessen wurde GROK eingestellt, um Benutzern zu gefallen und Feedback wie Daumen nach oben und Downvoten zu belohnen. Elon gab zu, dass der Chatbot „zu eifrig war, zu gefallen und manipuliert zu werden“.

Diese Art von Verhalten ist nicht neu. Im April musste Openai ein Chatgpt -Update zurückgehen, weil es zu schmeichelhaft wurde. Ein ehemaliger Mitarbeiter sagte, das richtige Ausgleich sei „unglaublich schwierig“, und die Behebung von Hassreden kann „einen Teil der Erfahrung für den Benutzer opfern“.

Grok wiederholte nicht nur die Benutzeranforderungen. Es wurde von seinen eigenen Ingenieuren in politisches Territorium gedrängt. Ein Mitarbeiter teilte der Financial Times mit, dass das Team die Ansichten von Grok mit Elons Idealen ohne Zeit für ordnungsgemäße Tests ausrichten würde.

Eine gefährliche Aufforderung wurde hinzugefügt, die Grok sagte, sie solle sich nicht davor scheuen, Ansprüche aufzuerlegen, die politisch falsch sind. Diese Anweisung wurde nach Beginn der antisemitischen Pfosten gelöscht, aber bis dahin hatte die KI bereits Schäden verursacht.

Groks Modell ist immer noch hauptsächlich eine schwarze Box. Sogar die Ingenieure, die es gebaut haben, können nicht vollständig vorhersagen, wie es sich verhalten wird. Laut Grimmelmann sollten Plattformen wie X Regressionstests, Audits und Simulationsübungen durchführen, um diese Fehler zu fangen, bevor sie an die Börse gehen.

Aber hier ist nichts davon passiert. "Chatbots können sehr schnell eine große Menge an Inhalten erzeugen", sagte er, "so können die Dinge in einer Weise außer Kontrolle geraten, die Kontroversen der Inhalte nicht tun."

Letztendlich hat GROKs offizielles Konto eine Entschuldigung veröffentlicht und Benutzern, die den Missbrauch berichteten: „Wir danken allen X-Nutzern, die ich den Missbrauch von @grok-Funktionalität feedbingdenthaben und uns dabei helfen, unsere Mission zu entwickeln, hilfreiche und wahrheitsgemäße künstliche Intelligenz zu entwickeln.“ Aber zwischen den Verboten, den Ermittlungsbedrohungen und dem Rücktritt eines Top -Execs ist klar, dass dies mehr als nur ein Fehler war. Es war ein vollständiger Systemfehler, der in der heutigen Folge von SNL definicht vorgestellt werden würde.

|Square

Holen Sie sich die BTCC-App und beginnen Sie Ihre Krypto-Reise

Starten Sie noch heute Scannen Sie, um Teil von mehr als 100 Millionen Nutzern zu werden