Page Agent
alibaba/page-agentJavaScript-агент, встраиваемый прямо в веб-страницу без расширений и headless-браузеров. Управляет DOM через текстовый анализ, поддерживает любые LLM, включает MCP-сервер и Chrome-расширение для многостраничных сценариев.
Подключение
npm install page-agentREADME
Page Agent
GUI-агент, живущий прямо в вашей веб-странице. Управляйте веб-интерфейсами на естественном языке.
English | 🌐 Русский
🚀 Демо | 📖 Документация | 📢 Обсуждение на HN | 𝕏 Подписаться в X
✨ Возможности
- 🎯 Простая интеграция
- Не требует
browser extension/python/ headless-браузера. - Только JavaScript внутри страницы. Всё происходит прямо в вашем веб-приложении.
- Не требует
- 📖 Текстовая работа с DOM
- Без скриншотов. Не нужны мультимодальные LLM или специальные разрешения.
- 🧠 Используйте собственные LLM
- 🐙 Опциональное расширение для Chrome для многостраничных задач.
- А также MCP-сервер (Beta) для управления извне.
💡 Сценарии использования
- AI-копилот для SaaS — Добавьте AI-копилота в свой продукт буквально в несколько строк кода. Без переписывания бэкенда.
- Умное заполнение форм — Превратите 20 кликов в одну фразу. Идеально для ERP, CRM и административных систем.
- Доступность — Сделайте любое веб-приложение доступным через естественный язык: голосовые команды, экранные дикторы, нулевой порог входа.
- Многостраничный агент — Расширьте возможности вашего веб-агента на несколько вкладок браузера с помощью расширения для Chrome.
- MCP — Позвольте вашим агентским клиентам управлять браузером.
🚀 Быстрый старт
Интеграция в одну строку
Самый быстрый способ попробовать PageAgent с нашим бесплатным демо-LLM:
<script src="{URL}" crossorigin="true"></script>
⚠️ Только для технической оценки. Этот демо-CDN использует наш бесплатный тестовый LLM API. Используя его, вы соглашаетесь с его условиями.
| Зеркало | URL |
|---|---|
| Глобальное | https://cdn.jsdelivr.net/npm/page-agent@1.8.0/dist/iife/page-agent.demo.js |
| Китай | https://registry.npmmirror.com/page-agent/1.8.0/files/dist/iife/page-agent.demo.js |
Установка через npm
npm install page-agent
import { PageAgent } from 'page-agent'
const agent = new PageAgent({
model: 'qwen3.5-plus',
baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1',
apiKey: 'YOUR_API_KEY',
language: 'en-US',
})
await agent.execute('Click the login button')Для более детального программного использования см. 📖 Документацию.
🌟 Awesome Page Agent
Создали что-то интересное с PageAgent? Добавьте сюда! Откройте PR, чтобы поделиться своим проектом.
Это проекты сообщества — мы их не поддерживаем и не одобряем официально. Используйте на своё усмотрение.
| Проект | Описание |
|---|---|
| Ваш? | Откройте PR 🙌 |
🤝 Участие в разработке
Мы приветствуем вклад сообщества! См. CONTRIBUTING.md для руководства и docs/developer-guide.md для описания локального рабочего процесса.
Пожалуйста, прочитайте заметку мейнтейнера о принципах и текущем состоянии проекта.
Вклады, полностью сгенерированные ботами или AI без существенного участия человека, приниматься не будут.
⚖️ Лицензия
👏 Благодарности
Этот проект основан на отличной работе browser-use.
PageAgent предназначен для клиентского улучшения веб-страниц, а не для серверной автоматизации.
Компоненты обработки DOM и промпты заимствованы из browser-use:
Browser Use <https://github.com/browser-use/browser-use>
Copyright (c) 2024 Gregor Zunic
Licensed under the MIT License
Мы выражаем искреннюю благодарность проекту browser-use и его контрибьюторам
за отличную работу по автоматизации браузера и паттернам взаимодействия с DOM,
которая помогла сделать этот проект возможным.
⭐ Поставьте звезду репозиторию, если PageAgent оказался полезным!