DeepSeek stürmt den mHC-Markt – doch die Fachwelt bleibt skeptisch vor der Peer-Review

DeepSeek wirbelt den hochkonzentrierten mHC-Sektor auf – mit einem Debüt, das die etablierten Spieler nervös macht. Das Modell verspricht, komplexe Marktanalysen in Echtzeit zu liefern, eine Fähigkeit, die traditionelle quantitative Ansätze alt aussehen lassen könnte.
Die Skepsis der Experten
Doch der Jubel ist nicht ungetrübt. Bevor die erste Zeile Code von unabhängigen Forschern begutachtet wurde, hagelte es bereits kritische Fragen. Kann ein KI-Modell die irrationalen, oft von menschlicher Gier getriebenen Muster in hochvolatilen Märkten wirklich zuverlässig deuten? Oder ist dies nur der nächste Hype-Zyklus, der ahnungslose Investoren anlockt – perfekt getimed, um frisches Kapital in ein überhitztes Segment zu spülen?
Ein Paradigmenwechsel oder heiße Luft?
Die Technologie hinter DeepSeek umgeht konventionelle Datenverarbeitungsengpässe. Sie schneidet durch den Rauschteppich der Marktdaten und identifiziert Muster, die menschlichen Analysten verborgen bleiben. Befürworter sehen den Beginn einer neuen Ära der datengesteuerten Finanzentscheidung.
Die Gegner halten dagegen: Geschichte wiederholt sich. Jede disruptive Technologie bringt zunächst eine Phase der ungezügelten Euphorie, gefolgt von der ernüchternden Realität der Regulierung und unvorhergesehenen Black-Swan-Ereignisse. Ein zynischer Finanzier würde anmerken: 'Großartig. Ein weiteres komplexes System, das verspricht, Risiken zu managen, bis es sie selbst erzeugt und die Steuerzahler die Rechnung begleichen dürfen.'
Die Waage hängt in der Schwebe. Die kommende Validierung durch Fachkollegen wird entscheiden, ob DeepSeek ein Game-Changer ist oder nur ein weiteres glänzendes Werkzeug in der Kiste der spekulativen Blasen.
DeepSeek überdenkt das Netzwerkdesign, um KI zu skalieren
Ein zentraler Bestandteil der Arbeit ist die Neubewertung der Frage, wie Informationen zwischen den verschiedenen Schichten eines mehrschichtigen neuronalen Netzes übertragen werden.
Jede Schicht eines neuronalen Netzes leitet verarbeitete Informationen an die nächste Schicht weiter und erzeugt so ein sogenanntes „Residual Learning Network“ ( ResNet ). Die vor etwa zehn Jahren von Kaiming He von Microsoft Research und anderen entwickelten ResNets bilden die Grundlage für viele der fortschrittlichsten KI-Systeme von heute.
Ein von DeepSeek entwickeltes Konzept entstand, nachdem ByteDance Hyper-Connections . Hyper-Connections ermöglichen es, dass Informationen über mehrere Wege durch ein Netzwerk fließen, anstatt nur über einen Hauptpfad. Dies kann die Lerngeschwindigkeit und die Vielfalt der Lernerfahrung erhöhen.
Allerdings können sie zwar von Vorteil sein, aber auch zumatic Trainingsereignissen führen, bei denen die Modelle Trainingsinstabilität oder ein vollständiges Versagen erleiden.
Laut Song Linqi (City University of Hong Kong) ist die Forschung von DeepSeek eine Weiterentwicklung einer bestehenden Idee, eine Fortsetzung der Art und Weise, wie DeepSeek die Arbeit anderer Unternehmen betrachtet, anstatt etwas von Grund auf neu zu erfinden.
ResNet wird mit einer einspurigen Schnellstraße verglichen, während Hyper-Connections einer mehrspurigen Schnellstraße ähneln; Song warnte jedoch davor, dass mehrere Spuren ohne angemessene Regeln zu mehr Kollisionen führen könnten.
Professor Guo Song von der Hong Kong University of Science and Technology ist der Ansicht, dass diese Forschungsarbeit einen Wandel im Forschungsverhalten der KI-Forschung . Anstatt weiterhin nur kleine Anpassungen an bestehenden Modellen vorzunehmen, könnte sich die Forschung seiner Meinung nach hin zur Entwicklung neuer Modelle auf Basis theoretischer Konstrukte entwickeln.
Forscher testen mHC, äußern aber praktische Bedenken
Obwohl die jüngsten Fortschritte bei der Erprobung von mHC für DEEP Learning Begeisterung auslösen, betonen Experten, dass die Forschung noch nicht abgeschlossen ist. Die von DeepSeek durchgeführten Tests nutzten lediglich vier Datenpfade bei der Prüfung von Modellen mit 27 Milliarden Parametern .
„Die Experimente validierten Modelle mit bis zu 27 Milliarden Parametern, aber wie würden sie sich bei den heutigen Spitzenmodellen schlagen, die um eine Größenordnung größer sind?“
Professor Guo Song.
Die heute verfügbaren KI-Modelle sind größer und verfügen typischerweise über Hunderte von Milliarden Parameter im Vergleich zu den 30 Milliarden Parametern, die noch vor wenigen Jahren Standard waren.
Guo stimmte diesen Einschätzungen zu und erklärte, dass noch niemand mit Sicherheit sagen könne, ob mHC in der Lage sein werde, im Bereich der KI-Technologie Spitzenleistungen zu erbringen. Er führte außerdem aus, dass die für den Betrieb von mHC benötigte Infrastruktur möglicherweise zu komplex für kleinere Forschungseinrichtungen und für Unternehmen zur Nutzung auf mobilen Geräten sei.
Laut Cryptopolitan verdankt DeepSeek seine Popularität der Veröffentlichung des großen Sprachmodells DeepSeek V3 und der darauf folgenden Veröffentlichung des Schlussfolgerungsmodells DeepSeek-R1 nur wenige Wochen später.
Beim Vergleich der Ergebnisse der Modelle mit denen ihrer Konkurrenten in Benchmark-Tests konnten beide Modelle die Ergebnisse ihrer Konkurrenten erreichen oder sogar übertreffen, obwohl sie nur mit einem Bruchteil der Trainingsdaten veröffentlicht wurden, die für die anderen konkurrierenden Sprachmodelle verwendet wurden.
Erhalten Sie 50 $ gratis für den Krypto-Handel, wenn Sie sich jetzt bei Bybit anmelden