UI-TARS Desktop
bytedance/UI-TARS-desktopUI-TARS Desktop — открытый стек мультимодальных AI-агентов. Включает Agent TARS (CLI и Web UI для автоматизации задач через LLM и MCP-инструменты) и UI-TARS Desktop (нативное приложение для управления компьютером и браузером). Подходит для разработчиков AI-агентов и GUI-автоматизации.
Подключение
git clone https://github.com/bytedance/UI-TARS-desktop.gitREADME
Введение
English | 简体中文
TARS* — стек мультимодальных AI-агентов, включающий два проекта: Agent TARS и UI-TARS-desktop:
Содержание
Новости
- [2025-11-05] 🎉 Объявляем о выходе Agent TARS CLI v0.3.0! В этой версии добавлена потоковая поддержка для нескольких инструментов (shell-команды, многофайловое структурированное отображение), настройки времени выполнения со статистикой вызовов инструментов и глубокого мышления, просмотрщик Event Stream для отслеживания и отладки потока данных. Также добавлена эксклюзивная поддержка AIO agent Sandbox как изолированной среды выполнения инструментов.
- [2025-06-25] Выпущены Agent TARS Beta и Agent TARS CLI — Представляем Agent TARS Beta: мультимодальный AI-агент, исследующий форму работы, максимально приближённую к человеческому выполнению задач, через богатые мультимодальные возможности (GUI-агент, компьютерное зрение) и бесшовную интеграцию с реальными инструментами.
- [2025-06-12] 🎁 Объявляем о выходе UI-TARS Desktop v0.2.0! В обновлении представлены две мощные новые функции: Remote Computer Operator и Remote Browser Operator — обе полностью бесплатны. Настройка не требуется: просто нажмите, чтобы удалённо управлять любым компьютером или браузером.
- [2025-04-17] 🎉 Объявляем о выходе UI-TARS Desktop v0.1.0 с переработанным интерфейсом агента. Приложение улучшает опыт работы с компьютером, вводит новые функции управления браузером и поддерживает продвинутую модель UI-TARS-1.5.
- [2025-02-20] 📦 Представлен UI TARS SDK — мощный кроссплатформенный инструментарий для создания агентов GUI-автоматизации.
- [2025-01-23] 🚀 Обновлён раздел Cloud Deployment с новой информацией о платформе ModelScope.
Agent TARS
Примеры использования
Подробнее см. на сайте agent-tars.com.
Основные возможности
- 🌐 Управление браузером — полноценное взаимодействие с веб-страницами через встроенный браузер
- 🖥️ Управление компьютером — выполнение задач на уровне операционной системы
- 🔧 Интеграция с MCP — бесшовное подключение к реальным инструментам через протокол MCP
- 👁️ Мультимодальное восприятие — анализ скриншотов и визуального контента
- 💻 CLI и Web UI — гибкие варианты использования для разработчиков и конечных пользователей
- 🤖 Поддержка нескольких LLM — совместимость с ведущими мультимодальными моделями
Быстрый старт
Установите Agent TARS CLI глобально:
npm install -g @agent-tars/cli
Запустите агента:
agent-tars
Подробнее см. в документации по CLI.
Документация
Полная документация доступна на agent-tars.com.
UI-TARS Desktop
Примеры использования
Подробнее см. в документации.
Возможности
- 🖥️ Локальный оператор компьютера — управление локальным рабочим столом через модель UI-TARS
- 🌐 Удалённый оператор компьютера — удалённое управление любым компьютером
- 🔍 Удалённый оператор браузера — удалённое управление браузером без настройки
- 🤖 Поддержка UI-TARS-1.5 — улучшенная производительность и точность управления
- 📦 UI TARS SDK — кроссплатформенный инструментарий для разработчиков
Быстрый старт
Скачайте последнюю версию со страницы Releases.
Подробные инструкции см. в руководстве по быстрому старту.
Участие в разработке
Приветствуются любые вклады! Ознакомьтесь с руководством по участию.
Лицензия
Данный проект распространяется под лицензией Apache 2.0.
Цитирование
Если вы используете UI-TARS в своих исследованиях, пожалуйста, цитируйте:
@misc{qin2025uitars,
title={UI-TARS: Pioneering Automated GUI Interaction with Native Agents},
author={Yujia Qin and others},
year={2025},
eprint={2501.12326},
archivePrefix={arXiv},
primaryClass={cs.AI}
}