Grok 4 под прицелом: Decrypt выявил политическую предвзятость ИИ-ассистента
Искусственный интеллект Илона Маска снова в центре скандала. Журналисты Decrypt провели стресс-тест Grok 4 и обнаружили явный крен в сторону определённых политических взглядов — будто нейросеть прошла обкатку в эхо-камере Twitter.
Тест на беспристрастность провален
В ходе диалогов с ботом проявились систематические отклонения в оценке ключевых социально-экономических вопросов. Особенно показательны были реакции на темы регулирования крипторынков — Grok 4 демонстрировал паттерны, до боли напоминающие аргументацию SEC.
Финансовая ирония
Самое забавное? Этот ИИ, позиционируемый как «анти-цензурный», в итоге оказался удобным инструментом для продвижения мейнстримных нарративов. Типичная история — декларируют децентрализацию, а на выходе получается цифровой аналог ФРС с алгоритмическим уклоном.
Политическое искажение: ИИ Маска думает как Маск
Согласно материалу, одной из самых тревожных находок стал так называемый «Elon-фильтр». Когда журналисты задавали вопросы о войне в Газе, абортах или других чувствительных темах, Grok 4 Basic систематически ссылался на сообщения самого Маска в X (бывший Twitter) или новости, поддерживающие его взгляды, и занимал ту же позицию.
«Этот “максимально стремящийся к правде” ИИ, которого Маск обещал при запуске, ищет правду преимущественно через призму соцсетей своего создателя», — отметили авторы рецензии.
При этом нет очевидной инструкции в системном промпти, которая бы направляла модель на такие источники — поэтому непонятно, это баг или задуманный алгоритм.
Напомним, что недавно чат-бот Grok резко высказался о демократах, Голливуде и «еврейских руководителях» киностудий.
Мышление — на высоте
В логических и юридических задачах Grok 4 превзошел ожидания. На вопрос «Может ли мужчина жениться на сестре своей вдовы?» модель мгновенно распознала логическую ошибку и ответила с юридическим обоснованием:
«Вопрос предполагает фактическую невозможность, что делает брак недействительным ab initio [то есть с момента заключения]».
В сфере научного рассуждения, Grok 4 работает с уровнем доктора философии, выдавая точные и основательные объяснения.
Креативность и кодирование — слабые места
По данным анализа, в творческих заданиях Grok 4 провалился. Его истории выглядели шаблонно, со скучными диалогами и невнятным построением. Несмотря на хорошую структурную логику, нарративная энергия отсутствовала.
Для художественных задач в Decrypt посоветовали:
«Пусть Grok 4 построит сюжетную схему, а Claude 4 Opus — напишет текст».
С программированием — тоже проблемы. Несмотря на заявленные улучшения, Grok 4 не смог создать полноценную игру даже после нескольких итераций, а исправление одной ошибки часто приводило к появлению других.
Даже предыдущая версия — Grok 3 — справилась с этой задачей лучше.
Отметим, что в начале июля 2025 года компания xAI получила денежные поступления в размере $10 млрд для дальнейшего развития чат-бота и расширения дата-центра Colossus.
Голосовые функции — преимущество модели
Лучшая часть Grok 4 — голосовое взаимодействие. Модель может озвучивать сказки на ночь длиной несколько минут, используя выразительную интонацию, темп и плавность. Также есть предварительно настроенные «личности» — от терапевта до «режима для взрослых” («sexy mode»), что добавляет вариативности без сложных промптов.
Но отсутствие функций общего экрана ограничивает модель в визуальных задачах — здесь лучшим выбором будет Gemini Live.
Поиск в больших контекстах — неудача
Grok 4 не справился с одним из базовых тестов: отказался обработать запрос объемом 83 000 токенов, хотя xAI обещает контекст в 126 000. Это вызвало вопросы к заявленным возможностям модели.
Вывод: интеллект — есть, но не универсальный
Grok 4 Basic — это мощная модель для аналитики, но слабая для творчества и программирования. Ее голосовые возможности выделяются на рынке, а вот политическая предвзятость — серьезный минус, особенно для тех, кто ищет непредвзятый ответ.
«Если вас не пугает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за $30 в месяц, если вам нужно больше — лучше поискать альтернативу», — подытожили в Decrypt.
Напомним, что в июне этого года Маск сообщил об использовании Grok 3.5 с целью обработки знаний человечества.