Claude Info
Web-автоматизация

Page Agent

alibaba/page-agent

JavaScript-агент, встраиваемый прямо в веб-страницу без расширений и headless-браузеров. Управляет DOM через текстовый анализ, поддерживает любые LLM, включает MCP-сервер и Chrome-расширение для многостраничных сценариев.

Подключение

terminal
bash
npm install page-agent

README

Page Agent

License: MIT TypeScript Bundle Size Downloads GitHub stars

GUI-агент, живущий прямо в вашей веб-странице. Управляйте веб-интерфейсами на естественном языке.

English | 🌐 Русский

🚀 Демо | 📖 Документация | 📢 Обсуждение на HN | 𝕏 Подписаться в X


✨ Возможности

  • 🎯 Простая интеграция
    • Не требует browser extension / python / headless-браузера.
    • Только JavaScript внутри страницы. Всё происходит прямо в вашем веб-приложении.
  • 📖 Текстовая работа с DOM
    • Без скриншотов. Не нужны мультимодальные LLM или специальные разрешения.
  • 🧠 Используйте собственные LLM
  • 🐙 Опциональное расширение для Chrome для многостраничных задач.

💡 Сценарии использования

  • AI-копилот для SaaS — Добавьте AI-копилота в свой продукт буквально в несколько строк кода. Без переписывания бэкенда.
  • Умное заполнение форм — Превратите 20 кликов в одну фразу. Идеально для ERP, CRM и административных систем.
  • Доступность — Сделайте любое веб-приложение доступным через естественный язык: голосовые команды, экранные дикторы, нулевой порог входа.
  • Многостраничный агент — Расширьте возможности вашего веб-агента на несколько вкладок браузера с помощью расширения для Chrome.
  • MCP — Позвольте вашим агентским клиентам управлять браузером.

🚀 Быстрый старт

Интеграция в одну строку

Самый быстрый способ попробовать PageAgent с нашим бесплатным демо-LLM:

<script src="{URL}" crossorigin="true"></script>

⚠️ Только для технической оценки. Этот демо-CDN использует наш бесплатный тестовый LLM API. Используя его, вы соглашаетесь с его условиями.

ЗеркалоURL
Глобальноеhttps://cdn.jsdelivr.net/npm/page-agent@1.8.0/dist/iife/page-agent.demo.js
Китайhttps://registry.npmmirror.com/page-agent/1.8.0/files/dist/iife/page-agent.demo.js

Установка через npm

npm install page-agent
js
import { PageAgent } from 'page-agent'

const agent = new PageAgent({
    model: 'qwen3.5-plus',
    baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1',
    apiKey: 'YOUR_API_KEY',
    language: 'en-US',
})

await agent.execute('Click the login button')

Для более детального программного использования см. 📖 Документацию.

🌟 Awesome Page Agent

Создали что-то интересное с PageAgent? Добавьте сюда! Откройте PR, чтобы поделиться своим проектом.

Это проекты сообщества — мы их не поддерживаем и не одобряем официально. Используйте на своё усмотрение.

ПроектОписание
Ваш?Откройте PR 🙌

🤝 Участие в разработке

Мы приветствуем вклад сообщества! См. CONTRIBUTING.md для руководства и docs/developer-guide.md для описания локального рабочего процесса.

Пожалуйста, прочитайте заметку мейнтейнера о принципах и текущем состоянии проекта.

Вклады, полностью сгенерированные ботами или AI без существенного участия человека, приниматься не будут.

⚖️ Лицензия

MIT License

👏 Благодарности

Этот проект основан на отличной работе browser-use.

PageAgent предназначен для клиентского улучшения веб-страниц, а не для серверной автоматизации.

Компоненты обработки DOM и промпты заимствованы из browser-use: Browser Use <https://github.com/browser-use/browser-use> Copyright (c) 2024 Gregor Zunic Licensed under the MIT License Мы выражаем искреннюю благодарность проекту browser-use и его контрибьюторам за отличную работу по автоматизации браузера и паттернам взаимодействия с DOM, которая помогла сделать этот проект возможным.

⭐ Поставьте звезду репозиторию, если PageAgent оказался полезным!

Похожие MCP-серверы