Искусственный интеллект

Как установить Ollama в 2026 году: пошаговая инструкция

Пошаговая установка Ollama на macOS, Windows и Linux: выбор локальной модели, проверка API, настройка Open WebUI и решение частых проблем.

Автор admin
2 мин чтения

Ollama позволяет запускать языковые модели на собственном компьютере: запросы к локальной модели обрабатываются без передачи текста в сторонний облачный чат. В этой инструкции установим Ollama на macOS или Windows, запустим первую модель, проверим API и при желании добавим графический интерфейс Open WebUI.

Актуально на 21 июня 2026 года. Последний стабильный релиз — Ollama v0.30.10, опубликованный 17 июня. Интерфейс и команды могут измениться в будущих версиях.

Что такое Ollama и зачем она нужна

Ollama — бесплатный инструмент для загрузки и локального запуска открытых моделей. В официальной библиотеке доступны Qwen, Llama, DeepSeek, Gemma, Mistral и другие семейства. Ollama управляет файлами моделей, использует доступное ускорение GPU и предоставляет локальный API по адресу http://localhost:11434.

После загрузки локальной модели интернет для обычного диалога не нужен. Однако он требуется для установки, обновлений и скачивания моделей. Кроме того, в Ollama существуют облачные модели: если конфиденциальность принципиальна, выбирайте именно локальный тег модели и проверяйте, где выполняется запрос.

Системные требования: сколько памяти понадобится

Официальная документация задаёт требования к операционной системе и совместимости GPU, но не устанавливает универсальный минимум RAM или VRAM. Потребление памяти зависит от размера модели, квантования и длины контекста. Поэтому таблица ниже — практический ориентир, а не гарантия производительности.

КонфигурацияС чего начатьКомментарий
8 ГБ RAMllama3.2:1b или llama3.2:3bПодходит для знакомства; закройте тяжёлые приложения
16 ГБ RAM / unified memoryqwen3:4b, иногда qwen3:8bПрактичный минимум для компактных моделей
32 ГБМодели 8B–14BБольше запаса для контекста и параллельных программ
32–64 ГБ и большеqwen3:30b, qwen3-coder:30bФайл модели занимает около 19 ГБ, но нужен дополнительный запас памяти
  • macOS: требуется macOS Sonoma 14 или новее. Apple Silicon использует GPU через Metal и общую память; Intel Mac поддерживается в CPU-режиме.
  • Windows: требуется Windows 10 22H2 или новее. Установщик работает без прав администратора.
  • NVIDIA: по официальному списку совместимости нужны compute capability 5.0+ и актуальный драйвер; для новых версий документация указывает драйвер 531+.
  • Диск: Windows-установке требуется не менее 4 ГБ, а модели занимают от сотен мегабайт до десятков и сотен гигабайт.
Материал по теме:  Оптическая сортировка в пищевой промышленности в 2025 году: как машины видят лучше людей

Шаг 1. Установка Ollama на macOS

Самый понятный способ — открыть официальную страницу загрузки, скачать Ollama.dmg, перенести приложение в папку Applications и запустить его. При первом запуске Ollama предложит добавить команду ollama в системный PATH.

Способы установки Ollama на macOS и проверка версии в терминале
Установка Ollama на macOS: официальный DMG остаётся самым простым способом, а команда в терминале удобна для разработчиков.

Альтернативный официальный способ — установка одной командой:

curl -fsSL https://ollama.com/install.sh | sh

Через Homebrew Ollama тоже доступна, но это пакет стороннего менеджера. Если вы уже используете Homebrew:

brew install ollama

После установки закройте и снова откройте Terminal, затем проверьте версию:

ollama --version

Шаг 2. Установка Ollama на Windows

На Windows рекомендуется скачать OllamaSetup.exe с официальной страницы. В релизе v0.30.10 файл занимает около 1,3 ГБ. Установщик не требует прав администратора и по умолчанию размещает программу в домашнем каталоге пользователя.

Установка Ollama на Windows через установщик и PowerShell
Ollama на Windows можно установить через OllamaSetup.exe или официальную команду PowerShell.

Официальная установка через PowerShell:

irm https://ollama.com/install.ps1 | iex

После завершения откройте новое окно PowerShell и выполните:

ollama --version

Как перенести модели на другой диск

Если на диске C мало места, откройте «Изменение переменных среды для учётной записи», создайте переменную OLLAMA_MODELS и укажите, например, D:\OllamaModels. После сохранения полностью закройте Ollama в системном трее и запустите снова. Этот порядок описан в документации Ollama для Windows.

Установка на Linux

Для большинства Linux-систем официальный проект предлагает тот же установочный скрипт:

curl -fsSL https://ollama.com/install.sh | sh

После установки проверьте службу командами ollama --version и systemctl status ollama. Для NVIDIA, AMD и экспериментального Vulkan сверяйтесь с актуальной страницей аппаратной поддержки.

Шаг 3. Скачайте и запустите первую модель

Команда ollama run сначала скачивает модель, а затем открывает интерактивный чат. Для компьютера с 8 ГБ RAM безопаснее начать с компактной Llama 3.2:

ollama run llama3.2:3b

Для 16 ГБ памяти можно попробовать qwen3:4b, а при достаточном запасе — qwen3:8b:

ollama run qwen3:4b
ollama run qwen3:8b
Сравнение локальных моделей Ollama по размеру и назначению
Начинайте с небольшой модели и переходите к более крупной только при наличии запаса RAM или unified memory.

Введите вопрос после приглашения >>>. Для выхода используйте /bye или сочетание Ctrl+D. Полезные команды:

ollama list
ollama ps
ollama pull qwen3:8b
ollama rm qwen3:8b
  • ollama list — показать скачанные модели.
  • ollama ps — показать модели, загруженные в память.
  • ollama pull — скачать или обновить модель.
  • ollama rm — удалить модель с диска.
Материал по теме:  Космический центр обработки данных: Пекин запускает ИИ-вычисления на орбите в 2025 году

Какие модели выбрать в июне 2026 года

МодельРазмер загрузкиПодходит для
llama3.2:3b2,0 ГБПервый запуск, суммаризация, простые задачи
qwen3:4b2,5 ГБКомпактный универсальный помощник
qwen3:8b5,2 ГБТексты, анализ, многоязычные задачи
deepseek-r1:8b5,2 ГБРассуждения, математика и аналитика
qwen3:30b19 ГББолее сложные универсальные задачи
qwen3-coder:30b19 ГБПрограммирование и работа с большим контекстом

Размеры взяты из официальных карточек Qwen 3, Qwen3-Coder, DeepSeek-R1 и Llama 3.2. Это объём скачиваемых файлов, а не точное потребление оперативной памяти.

Шаг 4. Проверьте локальный API

Когда Ollama работает, API доступен локально на порту 11434. Проверка списка моделей:

curl http://localhost:11434/api/tags

Пример одиночного запроса к модели:

curl http://localhost:11434/api/generate \
  -d '{"model":"qwen3:4b","prompt":"Объясни, что такое локальная LLM","stream":false}'

Шаг 5. Установите Open WebUI

Если терминал неудобен, Open WebUI добавляет интерфейс, похожий на привычный чат. Сначала установите Docker Desktop, затем выполните команду из официальной инструкции Open WebUI:

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
  -v open-webui:/app/backend/data \
  --name open-webui --restart always \
  ghcr.io/open-webui/open-webui:main
Локальный интерфейс Open WebUI, подключённый к Ollama
После запуска контейнера откройте http://localhost:3000 и создайте локальную учётную запись администратора.

Тег :main обновляется со временем. Для стабильной рабочей установки Open WebUI рекомендует закреплять конкретную версию образа. Также не открывайте порт 3000 в интернет без аутентификации, HTTPS и базовой защиты сервера.

Что делать, если Ollama не работает

  • Команда не найдена: перезапустите терминал; на macOS проверьте наличие ссылки в /usr/local/bin.
  • Модель работает слишком медленно: выберите меньшую модель, уменьшите контекст и закройте приложения, занимающие память.
  • Используется CPU вместо GPU: обновите драйвер и сверьте видеокарту с официальным списком поддержки.
  • Не хватает места: удалите ненужные модели через ollama rm или перенесите каталог моделей.
  • Open WebUI не видит Ollama: проверьте, отвечает ли http://localhost:11434/api/tags, и правильно ли задан OLLAMA_BASE_URL.

FAQ

Ollama полностью бесплатна?

Сам инструмент бесплатен. У каждой модели есть собственная лицензия, которую нужно проверить перед коммерческим использованием. Облачные функции также могут иметь отдельные условия.

Материал по теме:  Оптические вычисления: ИИ работает на скорости света

Можно ли пользоваться Ollama без видеокарты?

Да, локальные модели могут работать на CPU, но генерация обычно заметно медленнее. Начните с модели 1B–3B.

Работает ли Ollama без интернета?

После установки и загрузки локальной модели — да. Интернет понадобится для скачивания и обновления моделей, а также для облачных функций.

Какая модель лучше для первого запуска?

Для 8 ГБ RAM начните с llama3.2:3b. Для 16 ГБ попробуйте qwen3:4b, а затем qwen3:8b, если система сохраняет достаточный запас памяти.

Вывод

Для первого знакомства достаточно установить Ollama официальным способом, проверить ollama --version и запустить компактную модель. Не начинайте с 30B-моделей только потому, что они выглядят мощнее: небольшая модель, полностью помещающаяся в доступную память, часто даёт более удобный и быстрый локальный опыт.

Обложка и пошаговые изображения созданы как обезличенные демонстрационные экраны. Они не содержат реальных аккаунтов, ключей, домашних каталогов или иных персональных данных.

Комментарии к статье

Оставьте комментарий

Ваш email-адрес не будет опубликован. Обязательные поля помечены *

Прокрутить наверх