МАУНТИН-ВЬЮ (Калифорния) — Google компаниясы бүгінгі күнге дейінгі ең қуатты жасанды интеллект моделін — Gemini 2.5 Pro-ны ресми түрде шығарды. Негізгі жаңалық — Deep Think («Терең ойлау») режимі, ол нейрожеліге жауап бермес бұрын күрделі тапсырмаларды ойлануға көбірек уақыт жұмсауға мүмкіндік береді.
Өнімділіктің жаңа рекордтары
Жарияланған бенчмарктарға сәйкес, Gemini 2.5 Pro негізгі пәндер бойынша OpenAI және Anthropic бәсекелестерін басып озып, индустрияда жаңа рекордтар орнатты:
- MMLU-Pro (жалпы білім): 89.8% — барлық жария модельдер арасындағы ең жоғары көрсеткіш.
- GPQA Diamond (магистратура деңгейіндегі ғылым): 82.4% — Fable 5 (79.1%) және GPT-5.5 (76.3%) модельдерінен озады.
- HumanEval+ (бағдарламалау): 94.1% — тесттер тарихындағы ең үздік нәтиже.
- MATH-500: 97.2% — күрделі математикалық есептерді шешудегі мінсіз көрсеткіш.
2 миллион токендік контекст
Тағы бір сенсация — «контекст терезесінің» 2 миллион токенге дейін екі есе артуы. Бұл нейрожелінің бір уақытта мыңдаған беттік құжаттарды, бағдарламалардың толық кодтық базаларын немесе бірнеше сағаттық жоғары сапалы бейнені оқып, талдай алатынын білдіреді. Бизнес үшін бұл деректердің үлкен архивтерін бөліктерге бөлмей-ақ талдауға мүмкіндік береді.
Deep Think қалай жұмыс істейді?
Deep Think режимі — Google-дың бәсекелестердің «пайымдаушы» типтегі модельдеріне берген жауабы. Лездік жауаптың орнына модель мәселені бөлшектейді, шешудің әртүрлі жолдарын зерттейді және өзінің логикасын тексереді. Google-дың мәлімдеуінше, бұл көп сатылы есептеулердің дәлдігін 15–25%-ға арттырады, бірақ жауап беру уақыты 3–5 есе ұзағырақ болуы мүмкін.
Дереккөз: Medium / DevQuill Insights, Build Fast with AI

Мақалаға пікірлер