Ollama позволяет запускать языковые модели на собственном компьютере: запросы к локальной модели обрабатываются без передачи текста в сторонний облачный чат. В этой инструкции установим Ollama на macOS или Windows, запустим первую модель, проверим API и при желании добавим графический интерфейс Open WebUI.

Актуально на 21 июня 2026 года. Последний стабильный релиз — Ollama v0.30.10, опубликованный 17 июня. Интерфейс и команды могут измениться в будущих версиях.

Что такое Ollama и зачем она нужна

Ollama — бесплатный инструмент для загрузки и локального запуска открытых моделей. В официальной библиотеке доступны Qwen, Llama, DeepSeek, Gemma, Mistral и другие семейства. Ollama управляет файлами моделей, использует доступное ускорение GPU и предоставляет локальный API по адресу http://localhost:11434.

После загрузки локальной модели интернет для обычного диалога не нужен. Однако он требуется для установки, обновлений и скачивания моделей. Кроме того, в Ollama существуют облачные модели: если конфиденциальность принципиальна, выбирайте именно локальный тег модели и проверяйте, где выполняется запрос.

Системные требования: сколько памяти понадобится

Официальная документация задаёт требования к операционной системе и совместимости GPU, но не устанавливает универсальный минимум RAM или VRAM. Потребление памяти зависит от размера модели, квантования и длины контекста. Поэтому таблица ниже — практический ориентир, а не гарантия производительности.

Конфигурация	С чего начать	Комментарий
8 ГБ RAM	`llama3.2:1b` или `llama3.2:3b`	Подходит для знакомства; закройте тяжёлые приложения
16 ГБ RAM / unified memory	`qwen3:4b`, иногда `qwen3:8b`	Практичный минимум для компактных моделей
32 ГБ	Модели 8B–14B	Больше запаса для контекста и параллельных программ
32–64 ГБ и больше	`qwen3:30b`, `qwen3-coder:30b`	Файл модели занимает около 19 ГБ, но нужен дополнительный запас памяти

macOS: требуется macOS Sonoma 14 или новее. Apple Silicon использует GPU через Metal и общую память; Intel Mac поддерживается в CPU-режиме.
Windows: требуется Windows 10 22H2 или новее. Установщик работает без прав администратора.
NVIDIA: по официальному списку совместимости нужны compute capability 5.0+ и актуальный драйвер; для новых версий документация указывает драйвер 531+.
Диск: Windows-установке требуется не менее 4 ГБ, а модели занимают от сотен мегабайт до десятков и сотен гигабайт.

Материал по теме: Оптическая сортировка в пищевой промышленности в 2025 году: как машины видят лучше людей

Шаг 1. Установка Ollama на macOS

Самый понятный способ — открыть официальную страницу загрузки, скачать Ollama.dmg, перенести приложение в папку Applications и запустить его. При первом запуске Ollama предложит добавить команду ollama в системный PATH.

Способы установки Ollama на macOS и проверка версии в терминале — Установка Ollama на macOS: официальный DMG остаётся самым простым способом, а команда в терминале удобна для разработчиков.

Альтернативный официальный способ — установка одной командой:

curl -fsSL https://ollama.com/install.sh | sh

Через Homebrew Ollama тоже доступна, но это пакет стороннего менеджера. Если вы уже используете Homebrew:

brew install ollama

После установки закройте и снова откройте Terminal, затем проверьте версию:

ollama --version

Шаг 2. Установка Ollama на Windows

На Windows рекомендуется скачать OllamaSetup.exe с официальной страницы. В релизе v0.30.10 файл занимает около 1,3 ГБ. Установщик не требует прав администратора и по умолчанию размещает программу в домашнем каталоге пользователя.

Установка Ollama на Windows через установщик и PowerShell — Ollama на Windows можно установить через OllamaSetup.exe или официальную команду PowerShell.

Официальная установка через PowerShell:

irm https://ollama.com/install.ps1 | iex

После завершения откройте новое окно PowerShell и выполните:

ollama --version

Как перенести модели на другой диск

Если на диске C мало места, откройте «Изменение переменных среды для учётной записи», создайте переменную OLLAMA_MODELS и укажите, например, D:\OllamaModels. После сохранения полностью закройте Ollama в системном трее и запустите снова. Этот порядок описан в документации Ollama для Windows.

Установка на Linux

Для большинства Linux-систем официальный проект предлагает тот же установочный скрипт:

curl -fsSL https://ollama.com/install.sh | sh

После установки проверьте службу командами ollama --version и systemctl status ollama. Для NVIDIA, AMD и экспериментального Vulkan сверяйтесь с актуальной страницей аппаратной поддержки.

Шаг 3. Скачайте и запустите первую модель

Команда ollama run сначала скачивает модель, а затем открывает интерактивный чат. Для компьютера с 8 ГБ RAM безопаснее начать с компактной Llama 3.2:

ollama run llama3.2:3b

Для 16 ГБ памяти можно попробовать qwen3:4b, а при достаточном запасе — qwen3:8b:

ollama run qwen3:4b
ollama run qwen3:8b

Сравнение локальных моделей Ollama по размеру и назначению — Начинайте с небольшой модели и переходите к более крупной только при наличии запаса RAM или unified memory.

Введите вопрос после приглашения >>>. Для выхода используйте /bye или сочетание Ctrl+D. Полезные команды:

ollama list
ollama ps
ollama pull qwen3:8b
ollama rm qwen3:8b

ollama list — показать скачанные модели.
ollama ps — показать модели, загруженные в память.
ollama pull — скачать или обновить модель.
ollama rm — удалить модель с диска.

Материал по теме: Космический центр обработки данных: Пекин запускает ИИ-вычисления на орбите в 2025 году

Какие модели выбрать в июне 2026 года

Модель	Размер загрузки	Подходит для
`llama3.2:3b`	2,0 ГБ	Первый запуск, суммаризация, простые задачи
`qwen3:4b`	2,5 ГБ	Компактный универсальный помощник
`qwen3:8b`	5,2 ГБ	Тексты, анализ, многоязычные задачи
`deepseek-r1:8b`	5,2 ГБ	Рассуждения, математика и аналитика
`qwen3:30b`	19 ГБ	Более сложные универсальные задачи
`qwen3-coder:30b`	19 ГБ	Программирование и работа с большим контекстом

Размеры взяты из официальных карточек Qwen 3, Qwen3-Coder, DeepSeek-R1 и Llama 3.2. Это объём скачиваемых файлов, а не точное потребление оперативной памяти.

Шаг 4. Проверьте локальный API

Когда Ollama работает, API доступен локально на порту 11434. Проверка списка моделей:

curl http://localhost:11434/api/tags

Пример одиночного запроса к модели:

curl http://localhost:11434/api/generate \
  -d '{"model":"qwen3:4b","prompt":"Объясни, что такое локальная LLM","stream":false}'

Шаг 5. Установите Open WebUI

Если терминал неудобен, Open WebUI добавляет интерфейс, похожий на привычный чат. Сначала установите Docker Desktop, затем выполните команду из официальной инструкции Open WebUI:

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
  -v open-webui:/app/backend/data \
  --name open-webui --restart always \
  ghcr.io/open-webui/open-webui:main

Локальный интерфейс Open WebUI, подключённый к Ollama — После запуска контейнера откройте `http://localhost:3000` и создайте локальную учётную запись администратора.

Тег :main обновляется со временем. Для стабильной рабочей установки Open WebUI рекомендует закреплять конкретную версию образа. Также не открывайте порт 3000 в интернет без аутентификации, HTTPS и базовой защиты сервера.

Что делать, если Ollama не работает

Команда не найдена: перезапустите терминал; на macOS проверьте наличие ссылки в /usr/local/bin.
Модель работает слишком медленно: выберите меньшую модель, уменьшите контекст и закройте приложения, занимающие память.
Используется CPU вместо GPU: обновите драйвер и сверьте видеокарту с официальным списком поддержки.
Не хватает места: удалите ненужные модели через ollama rm или перенесите каталог моделей.
Open WebUI не видит Ollama: проверьте, отвечает ли http://localhost:11434/api/tags, и правильно ли задан OLLAMA_BASE_URL.

FAQ

Ollama полностью бесплатна?

Сам инструмент бесплатен. У каждой модели есть собственная лицензия, которую нужно проверить перед коммерческим использованием. Облачные функции также могут иметь отдельные условия.

Материал по теме: Оптические вычисления: ИИ работает на скорости света

Можно ли пользоваться Ollama без видеокарты?

Да, локальные модели могут работать на CPU, но генерация обычно заметно медленнее. Начните с модели 1B–3B.

Работает ли Ollama без интернета?

После установки и загрузки локальной модели — да. Интернет понадобится для скачивания и обновления моделей, а также для облачных функций.

Какая модель лучше для первого запуска?

Для 8 ГБ RAM начните с llama3.2:3b. Для 16 ГБ попробуйте qwen3:4b, а затем qwen3:8b, если система сохраняет достаточный запас памяти.

Вывод

Для первого знакомства достаточно установить Ollama официальным способом, проверить ollama --version и запустить компактную модель. Не начинайте с 30B-моделей только потому, что они выглядят мощнее: небольшая модель, полностью помещающаяся в доступную память, часто даёт более удобный и быстрый локальный опыт.

Обложка и пошаговые изображения созданы как обезличенные демонстрационные экраны. Они не содержат реальных аккаунтов, ключей, домашних каталогов или иных персональных данных.

Редакционное уведомление

Редакционное уведомление и отказ от ответственности

Настоящий материал опубликован в информационных целях. Редакция стремится проверять достоверность сведений, однако опубликованная информация может со временем изменяться, уточняться или обновляться официальными источниками.

Мнения, цитаты, внешние ссылки, изображения и иные материалы, использованные в публикации, могут принадлежать их авторам или правообладателям. По вопросам авторских прав, уточнения информации или внесения исправлений просим обращаться в редакцию.

Материал не является юридической, финансовой, медицинской или иной профессиональной консультацией. Перед принятием значимых решений рекомендуется обращаться к официальным источникам или профильным специалистам.

Как установить Ollama в 2026 году: пошаговая инструкция

Что такое Ollama и зачем она нужна

Системные требования: сколько памяти понадобится

Шаг 1. Установка Ollama на macOS

Шаг 2. Установка Ollama на Windows

Как перенести модели на другой диск

Установка на Linux

Шаг 3. Скачайте и запустите первую модель

Какие модели выбрать в июне 2026 года

Шаг 4. Проверьте локальный API

Шаг 5. Установите Open WebUI

Что делать, если Ollama не работает

FAQ

Ollama полностью бесплатна?

Можно ли пользоваться Ollama без видеокарты?

Работает ли Ollama без интернета?

Какая модель лучше для первого запуска?

Вывод

Комментарии к статье

Оставьте комментарий Отменить ответ

Что такое Ollama и зачем она нужна

Системные требования: сколько памяти понадобится

Шаг 1. Установка Ollama на macOS

Шаг 2. Установка Ollama на Windows

Как перенести модели на другой диск

Установка на Linux

Шаг 3. Скачайте и запустите первую модель

Какие модели выбрать в июне 2026 года

Шаг 4. Проверьте локальный API

Шаг 5. Установите Open WebUI

Что делать, если Ollama не работает

FAQ

Ollama полностью бесплатна?

Можно ли пользоваться Ollama без видеокарты?

Работает ли Ollama без интернета?

Какая модель лучше для первого запуска?

Вывод

Комментарии к статье

Оставьте комментарий Отменить ответ

Бесплатный ИИ в 2025 году: обзор отличных сервисов.

Исторический рубеж: боты впервые обогнали людей по объему веб-трафика

Биологический ИИ: ученые вырастили живой мини-мозг в 2025 году

Оптические вычисления: ИИ работает на скорости света