ИИ и машинное обучение

Meta заявила о паритете Watermelon с GPT-5.5, но тесты не раскрыла

По данным Business Insider, Александр Ван сообщил сотрудникам Meta о паритете Watermelon с GPT-5.5. Названия тестов, результаты и независимая проверка пока отсутствуют.

Автор admin
1 мин чтения

Менло-Парк, США. Руководитель подразделения искусственного интеллекта Meta Александр Ван сообщил сотрудникам, что разрабатываемая модель под кодовым названием Watermelon сравнялась с GPT-5.5 от OpenAI по ряду отраслевых тестов. Об этом сообщило издание Business Insider со ссылкой на два источника, знакомых с содержанием внутреннего собрания.

Заявление пока нельзя считать подтверждённым сравнением моделей. Watermelon всё ещё находится на стадии обучения, Meta не назвала использованные бенчмарки, не опубликовала результаты и не предоставила систему для независимого тестирования. Компания также не выпускала официального сообщения о Watermelon.

Что, по данным СМИ, сказал Александр Ван

На общем собрании Ван, как утверждается, назвал Watermelon следующей моделью после Avocado — внутреннего кодового имени Muse Spark. Он также заявил, что обучение Watermelon использует «на порядок» больше вычислительных ресурсов, чем предыдущий проект. В численном выражении эту формулировку обычно понимают как увеличение примерно в десять раз.

Business Insider не указал, о каком именно виде вычислений идёт речь: общем объёме операций, количестве ускорителей, продолжительности обучения или произведении этих показателей. Без методики число нельзя напрямую сопоставить с размером модели, стоимостью разработки или качеством результата.

Meta и OpenAI не представили публичных комментариев к этому сравнению. Поэтому наиболее точная формулировка на данный момент — руководство Meta сообщило о внутреннем достижении, которое ещё предстоит проверить.

Почему «догнала по тестам» не означает полный паритет

Результат зависит от выбора задач, версии набора данных, настроек рассуждения, числа попыток и того, учитываются ли стоимость и скорость ответа. Две модели могут показать близкие цифры в математике и заметно отличаться в программировании, работе с инструментами, мультимодальности или устойчивости длинных заданий.

Материал по теме:  Alpamayo автономное вождение: NVIDIA открывает новую архитектуру ИИ для беспилотного транспорта

Особенно важно, что Watermelon ещё обучается. Итоговая версия может измениться после дополнительного обучения, настройки поведения и проверок безопасности. До публикации технического отчёта неизвестно даже то, сравнивали ли одну контрольную точку модели или конфигурацию, близкую к выпуску.

Cifrum.kz ранее разбирал, почему совпадение результатов ИИ в отдельных тестах по кибербезопасности нельзя автоматически переносить на все способности системы. То же ограничение применимо к заявлению о Watermelon.

Инфографика о статусе Watermelon, заявлении Meta, вычислительных ресурсах и отсутствии независимой проверки
Watermelon ещё обучается, использованные тесты не названы, а публичной независимой проверки нет. Инфографика: Cifrum.kz.

Что известно о GPT-5.5

OpenAI официально выпустила GPT-5.5 23 апреля 2026 года. Компания опубликовала результаты модели в агентном программировании, работе с компьютером, профессиональных задачах, научных тестах и кибербезопасности. Доступ к GPT-5.5 появился в ChatGPT, Codex и API.

Публичные цифры OpenAI также являются результатами разработчика и требуют внешней проверки, но у исследователей есть названия наборов, условия оценки и доступ к самой модели. Для Watermelon сопоставимого набора данных пока нет.

GPT-5.6 уже сдвинула ориентир

26 июня OpenAI начала ограниченный предварительный запуск серии GPT-5.6. Флагманская версия Sol, по заявлению компании, превосходит GPT-5.5 в нескольких агентных, биологических и кибербезопасностных задачах. Широкий доступ планируется позднее, а первоначальный preview ограничен небольшой группой партнёров.

Это делает GPT-5.5 понятным, но уже не самым новым ориентиром OpenAI. Даже если внутренний паритет Meta воспроизводим, он показывает положение Watermelon относительно апрельской модели, а не всей текущей линейки конкурента.

От Muse Spark к Watermelon

Meta представила Muse Spark 8 апреля как первую модель новой серии Meta Superintelligence Labs. Компания описывает её как компактную и быструю систему для сложных рассуждений и мультимодальных задач. Muse Spark уже используется в Meta AI, а более крупное следующее поколение официально находилось в разработке ещё во время анонса.

Материал по теме:  Казахстан и 01.AI объявили о создании Q.AI

Связь кодового имени Avocado с Muse Spark и название Watermelon исходят из сообщений СМИ о внутренних проектах. На официальных страницах Meta новое поколение пока не получило публичного названия, даты выпуска или карточки модели.

Что означает десятикратное увеличение вычислений

Больший объём вычислений может позволить увеличить модель, объём данных или длительность обучения. Однако масштабирование не гарантирует пропорционального роста качества. Результат зависит от архитектуры, данных, алгоритмов оптимизации и последующей настройки.

Сама Meta в объяснении своей вычислительной инфраструктуры указывает, что обучение и обслуживание моделей опираются на сочетание графических ускорителей, собственных чипов, сетей и центров обработки данных. Поэтому фраза о «compute» без единицы измерения остаётся ориентиром масштаба, а не технической спецификацией.

Meta планирует капитальные затраты до $145 млрд

В отчёте за первый квартал Meta повысила прогноз капитальных затрат на 2026 год до $125–145 млрд. Компания связала изменение с ростом цен на компоненты и дополнительными расходами на центры обработки данных для будущих мощностей.

Этот диапазон включает основные платежи по финансовой аренде и охватывает инфраструктуру компании в целом. Его некорректно называть бюджетом Watermelon или даже полностью относить к генеративному ИИ.

Что нужно для подтверждения заявления Meta

  • названия бенчмарков, версии наборов данных и полные условия запуска;
  • результаты нескольких моделей при одинаковом вычислительном бюджете;
  • стоимость, задержка ответа и число попыток, использованных для получения результата;
  • системная карточка с описанием ограничений и проверок безопасности;
  • доступ независимых исследователей или публичный API.

До появления этих данных Watermelon следует рассматривать как перспективную, но непроверенную модель. Внутренний результат может оказаться важным этапом для Meta, однако он ещё не устанавливает новый баланс сил на рынке.

Гонка моделей включает не только производительность, но и безопасность, воздействие на пользователей и интерпретацию поведения систем. Отдельно Cifrum.kz рассказывал, почему технологические компании начали изучать возможное сознание ИИ, не утверждая, что оно обнаружено.

Материал по теме:  Облачные технологии для малого бизнеса: простыми словами о выгоде и возможностях

Источники: сообщение Business Insider в изложении Investing.com, анонс Muse Spark, отчёт Meta за первый квартал, анонс GPT-5.5, предварительный запуск GPT-5.6.

Главное изображение создано искусственным интеллектом для Cifrum.kz и носит концептуальный характер. Оно не показывает реальные серверы Meta или OpenAI и не подтверждает результаты тестов. Инфографика подготовлена редакцией Cifrum.kz.

Комментарии к статье

Оставьте комментарий

Ваш email-адрес не будет опубликован. Обязательные поля помечены *

Прокрутить наверх