Сравниваем ChatGPT 5, Grok 4 и DeepSeek V3-1: какая из нейросетей точнее следует указаниям

Сравниваем ChatGPT 5, Grok 4 и DeepSeek V3-1: какая из нейросетей точнее следует указаниям

Арина Филатова
ChatGPTСтатья

7 августа компания OpenAI выпустила новую версию своей языковой модели. Многие блогеры, новостные каналы и просто обыватели сразу же приступили к тестированию нейросети самыми различными запросами. И VICTORY group — не исключение. В статье рассказываем, так ли хорош ChatGPT-5 и чем он отличается от DeepSeek и Grok.

Коротко о GPT-5: что это и что нового

Как рассказали OpenAI у себя на сайте, GPT-5 – поколение специально разработанного подмножества машинного обучения с упором на более устойчивое рассуждение, длинный контекст и работу с несколькими типами данных (текст, изображения, документы).

Ключевая идея новой модели – меньше «фокусов», больше предсказуемости в рабочих сценариях, где нужно помочь с подготовкой каких-либо материалов, написать программный код, провести аналитику.

Как отмечают создатели ИИ, была улучшена связность длинных ответов, стабильность при повторных переформулировках, аккуратная работа с инструкциями и готовность к интеграциям. Если говорить коротко, то модель получила больше «попаданий с первого раза» и меньше ручной доводки.

Границы применения

На сегодняшний день ChatGPT-5, по нашему опыту, поможет со следующими несложными задачами:

  • Написание лендингов;

  • Аналитика (сводки, метрики);

  • Техническая поддержка (FAQ-боты на базе знаний, маршрутизация обращений);

  • Составление документов (регламенты, шаблоны);

  • Dev-ассистент (рефакторинг, тестирование).

Однако даже здесь GPT не стоит доверять на 100%, ведь нейросеть требует очень подробного указания и малейшая неточность в промте может привести к ошибке. Важно помнить, что все результаты генерации обязательно нуждаются в проверке специалиста.

Сравнение: ChatGPT 5/Grok 4/DeepSeek-V3

Глядя на стремительное развитие нейросетей, сложно удержаться от сравнения разных вариантов. VICTORY group провела небольшое исследование, чтобы выяснить, какая из трех самых популярных нейросетей лучше справляется с одной и той же задачей, и действительно ли GPT-5 способен оставить конкурентов позади.

Мы выбрали самые базовые языковые модели на данный момент в каждой нейросети – никаких улучшенных и глубоко думающих моделей. Каждой нейросети мы дали следующую задачку:

«Расскажи кратко, как правильно производить лидогенерацию для маленькой компании»

Посмотрим, кто справится с задачей лучше.

Результат исследования: DeepSeek-V3

Китайская нейронка выдала результат сразу же – она не стала думать, искать информацию или что-то просчитывать.

<i>Начало ответа от DeepSeek</i>

Начало ответа от DeepSeek

DeepSeek выдал информативный, но очень громоздкий текст, несмотря на то, что в запросе мы обозначили, что ответ должен быть кратким.

Продолжение ответа от DeepSeek

Продолжение ответа от DeepSeek

После этого мы попросили нейронку выдать более краткий ответ.

<i>Краткий ответ от DeepSeek</i>

Краткий ответ от DeepSeek

Результат вы видите сами. В целом, не так уж и плохо, но все же китайский ИИ в «базовой комплектации» не очень качественно обрабатывает запрос, упуская некоторые моменты, обозначенные в задаче.

Итог: на выполнение изначального запроса потребовалось 2 промпта.

Результат исследования: Grok 4

Переходим к нейронной сети Илона Маска. Grok начал сразу же анализировать запрос, произвел поиск в интернете по запросу «best lead generation strategies for small businesses 2025». В общей сумме, он просканировал 18 ресурсов, чтобы найти необходимую информацию.

<i>Начало работы Grok</i>

Начало работы Grok

Далее он начал выписывать полноценный гайд: «Шаги по лидогенерации для маленькой компании».

<i>Ответ от Grok</i>

Ответ от Grok

По итогу, Grok, как и его китайский коллега, вывел на экран полноценную инструкцию, а не краткий ответ, который изначально у него запрашивался. А если все же на него «надавить» и попросить дать так, как планировалось изначально, то ответ последовал следующий:

<i>Продолжение ответа от Grok</i>

Продолжение ответа от Grok

Grok не стал искать информацию (хотя мы и попросили сформировать ответ заново) и вывел результат за 6 секунд. Он взял свой предыдущий итог и вынес основную суть, которую от него запрашивали.

Итог: Grok ушел недалеко от DeepSeek, ведь на полноценный краткий ответ у него ушло также 2 промпта.

Результат исследования: ChatGPT 5

ChatGPT практически сразу после получения задачи выдал следующий ответ:

<i>Ответ от ChatGPT</i>

Ответ от ChatGPT

И вот тут мы поймали ИИ «за руку» – он выдал ответ для обычной компании, а уже после спросил, нужно ли дать список именно для маленькой компании. Либо ChatGPT в базовой версии не сумел прочитать промпт нормально, либо он решил нас подло провести, выведя уточняющий вопрос уже после вывода информации.

Итог: Базовая версия ChatGPT не совсем правильно справилась с поставленной задачей. Хоть базовая версия и отличается от той же «Thinking» (более тщательный анализ запроса, улучшенный вывод результата), но она также обязана правильно выполнять свою задачу.

Подводя итоги

Новая языковая модель GPT-5 неплоха в выполнении несложного запроса, но не так хороша, как другие нейронные сети. А не так давно мы опубликовали статью про то, как ИИ помогает бизнесу уже сейчас и чего ожидать в будущем, где рассказали все особенности и риски.

21

Комментарии (0)

Для добавления комментариев необходимо