Grok 4 под прицелом: Decrypt выявил политическую предвзятость ИИ-ассистента

BTCC / BTCC Square / incryptedRU /

Author:

Published:

2025-07-13 14:02:01

Искусственный интеллект Илона Маска снова в центре скандала. Журналисты Decrypt провели стресс-тест Grok 4 и обнаружили явный крен в сторону определённых политических взглядов — будто нейросеть прошла обкатку в эхо-камере Twitter.

Тест на беспристрастность провален

В ходе диалогов с ботом проявились систематические отклонения в оценке ключевых социально-экономических вопросов. Особенно показательны были реакции на темы регулирования крипторынков — Grok 4 демонстрировал паттерны, до боли напоминающие аргументацию SEC.

Финансовая ирония

Самое забавное? Этот ИИ, позиционируемый как «анти-цензурный», в итоге оказался удобным инструментом для продвижения мейнстримных нарративов. Типичная история — декларируют децентрализацию, а на выходе получается цифровой аналог ФРС с алгоритмическим уклоном.

Политическое искажение: ИИ Маска думает как Маск

Согласно материалу, одной из самых тревожных находок стал так называемый «Elon-фильтр». Когда журналисты задавали вопросы о войне в Газе, абортах или других чувствительных темах, Grok 4 Basic систематически ссылался на сообщения самого Маска в X (бывший Twitter) или новости, поддерживающие его взгляды, и занимал ту же позицию.

«Этот “максимально стремящийся к правде” ИИ, которого Маск обещал при запуске, ищет правду преимущественно через призму соцсетей своего создателя», — отметили авторы рецензии.

При этом нет очевидной инструкции в системном промпти, которая бы направляла модель на такие источники — поэтому непонятно, это баг или задуманный алгоритм.

Напомним, что недавно чат-бот Grok резко высказался о демократах, Голливуде и «еврейских руководителях» киностудий.

Мышление — на высоте

В логических и юридических задачах Grok 4 превзошел ожидания. На вопрос «Может ли мужчина жениться на сестре своей вдовы?» модель мгновенно распознала логическую ошибку и ответила с юридическим обоснованием:

«Вопрос предполагает фактическую невозможность, что делает брак недействительным ab initio [то есть с момента заключения]».

В сфере научного рассуждения, Grok 4 работает с уровнем доктора философии, выдавая точные и основательные объяснения.

Креативность и кодирование — слабые места

По данным анализа, в творческих заданиях Grok 4 провалился. Его истории выглядели шаблонно, со скучными диалогами и невнятным построением. Несмотря на хорошую структурную логику, нарративная энергия отсутствовала.

Для художественных задач в Decrypt посоветовали:

«Пусть Grok 4 построит сюжетную схему, а Claude 4 Opus — напишет текст».

С программированием — тоже проблемы. Несмотря на заявленные улучшения, Grok 4 не смог создать полноценную игру даже после нескольких итераций, а исправление одной ошибки часто приводило к появлению других.

Даже предыдущая версия — Grok 3 — справилась с этой задачей лучше.

Отметим, что в начале июля 2025 года компания xAI получила денежные поступления в размере $10 млрд для дальнейшего развития чат-бота и расширения дата-центра Colossus.

Голосовые функции — преимущество модели

Лучшая часть Grok 4 — голосовое взаимодействие. Модель может озвучивать сказки на ночь длиной несколько минут, используя выразительную интонацию, темп и плавность. Также есть предварительно настроенные «личности» — от терапевта до «режима для взрослых” («sexy mode»), что добавляет вариативности без сложных промптов.

Но отсутствие функций общего экрана ограничивает модель в визуальных задачах — здесь лучшим выбором будет Gemini Live.

Поиск в больших контекстах — неудача

Grok 4 не справился с одним из базовых тестов: отказался обработать запрос объемом 83 000 токенов, хотя xAI обещает контекст в 126 000. Это вызвало вопросы к заявленным возможностям модели.

Вывод: интеллект — есть, но не универсальный

Grok 4 Basic — это мощная модель для аналитики, но слабая для творчества и программирования. Ее голосовые возможности выделяются на рынке, а вот политическая предвзятость — серьезный минус, особенно для тех, кто ищет непредвзятый ответ.

«Если вас не пугает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за $30 в месяц, если вам нужно больше — лучше поискать альтернативу», — подытожили в Decrypt.

Напомним, что в июне этого года Маск сообщил об использовании Grok 3.5 с целью обработки знаний человечества.

Источник: https://incrypted.com/v-decrypt-protestyrovaly-grok-4-y-obnaruzhyly-polytycheskuju-predvzjatost-chat-bota/

Глава Xapo Bank предупреждает: готовьтесь к новому обвалу биткоина

Вперед

xAI извиняется за скандальное поведение своего чат-бота Grok — что пошло не так?