Mobile MCP
mobile-next/mobile-mcpMCP-сервер для мобильной автоматизации и скрейпинга на iOS и Android. Поддерживает реальные устройства, симуляторы и эмуляторы. Работает через дерево доступности или координаты по скриншоту — без знания платформо-специфичных инструментов.
Подключение
claude mcp add mobile-mcp -- npx -y @mobilenext/mobile-mcp@latestREADME
Mobile Next — MCP-сервер для разработки и автоматизации мобильных приложений | iOS, Android, симуляторы, эмуляторы и реальные устройства
Это сервер Model Context Protocol (MCP), обеспечивающий масштабируемую мобильную автоматизацию и разработку через платформо-независимый интерфейс — без необходимости разбираться в специфике iOS или Android. Работает на эмуляторах, симуляторах и реальных устройствах (iOS и Android).
Сервер позволяет агентам и LLM взаимодействовать с нативными iOS/Android-приложениями и устройствами через структурированные снимки дерева доступности или тапы по координатам на основе скриншотов.
https://github.com/user-attachments/assets/bb084777-beb3-4930-ae6f-8d3fe694ddde
🚀 Дорожная карта Mobile MCP: строим будущее мобильной автоматизации
Присоединяйтесь к нам — мы постоянно развиваем Mobile MCP! Изучите подробную дорожную карту с запланированными функциями, улучшениями и этапами. Ваши отзывы бесценны для формирования будущего мобильной автоматизации.
Основные сценарии использования
Как мы помогаем масштабировать мобильную автоматизацию:
- 📲 Автоматизация нативных приложений (iOS и Android) для тестирования или сценариев ввода данных.
- 📝 Скриптовые сценарии и взаимодействие с формами без ручного управления симуляторами/эмуляторами или реальными устройствами (iPhone, Samsung, Google Pixel и др.)
- 🧭 Автоматизация многошаговых пользовательских сценариев под управлением LLM
- 👆 Универсальное взаимодействие с мобильными приложениями для агентных фреймворков
- 🤖 Поддержка взаимодействия агент-агент для задач мобильной автоматизации и извлечения данных
Основные возможности
- 🚀 Быстрый и лёгкий: использует нативные деревья доступности для большинства взаимодействий или координаты по скриншоту там, где метки a11y недоступны.
- 🤖 Дружелюбен к LLM: в режиме доступности (Snapshot) модель компьютерного зрения не требуется.
- 🧿 Визуальный анализ: оценивает и анализирует то, что реально отображается на экране, чтобы определить следующее действие. Если данные доступности или координаты иерархии представлений недоступны — переключается на анализ скриншота.
- 📊 Детерминированное применение инструментов: снижает неоднозначность, характерную для подходов на основе только скриншотов, опираясь на структурированные данные везде, где это возможно.
- 📺 Извлечение структурированных данных: позволяет извлекать структурированные данные из всего, что видно на экране.
🎯 Поддерживаемые платформы
| Платформа | Поддержка |
|---|---|
| iOS реальное устройство | ✅ |
| iOS Simulator | ✅ |
| Android реальное устройство | ✅ |
| Android Emulator | ✅ |
🔧 Доступные MCP-инструменты
Подробные описания реализации и параметров см. в
src/server.ts
Управление устройствами
mobile_list_available_devices— список всех доступных устройств (симуляторы, эмуляторы и реальные устройства)mobile_get_screen_size— получить размер экрана устройства в пикселяхmobile_get_orientation— получить текущую ориентацию экрана устройстваmobile_set_orientation— изменить ориентацию экрана (портретная/альбомная)
Управление приложениями
mobile_list_apps— список всех установленных приложений на устройствеmobile_launch_app— запустить приложение по имени пакетаmobile_terminate_app— остановить и завершить работающее приложениеmobile_install_app— установить приложение из файла (.apk,.ipa,.app,.zip)mobile_uninstall_app— удалить приложение по bundle ID или имени пакета
Взаимодействие с экраном
mobile_take_screenshot— сделать скриншот для анализа содержимого экранаmobile_save_screenshot— сохранить скриншот в файлmobile_list_elements_on_screen— список UI-элементов с координатами и свойствамиmobile_click_on_screen_at_coordinates— клик по конкретным координатам x,ymobile_double_tap_on_screen— двойной тап по конкретным координатамmobile_long_press_on_screen_at_coordinates— долгое нажатие по конкретным координатамmobile_swipe_on_screen— свайп в любом направлении (вверх, вниз, влево, вправо)
Ввод и навигация
mobile_type_keys— ввод текста в сфокусированные элементы с опциональной отправкойmobile_press_button— нажатие кнопок устройства (HOME,BACK,VOLUME_UP/DOWN,ENTERи др.)mobile_open_url— открыть URL в браузере устройства
Поддержка платформ
- iOS: симуляторы и реальные устройства через нативную доступность и WebDriverAgent
- Android: эмуляторы и реальные устройства через ADB и UI Automator
- Кросс-платформенный: единый API работает на всех поддерживаемых платформах