Claude Info
AI-инструменты

EverOS

EverMind-AI/EverOS

EverOS — платформа для создания, оценки и интеграции долгосрочной памяти в AI-агентов. Включает архитектуры памяти EverCore и HyperMem, бенчмарки EverMemBench и EvoAgentBench, а также готовые примеры использования с Claude Code.

Подключение

terminal
bash
git clone https://github.com/EverMind-AI/EverOS.git

README

banner-gif

Сайт · Документация · Блог

[!IMPORTANT]

Обновление структуры проекта

Мы объединили EverCore, HyperMem, EverMemBench и EvoAgentBench вместе с примерами использования в единый репозиторий.

EverOS даёт разработчикам единое место для создания, оценки и интеграции долгосрочной памяти в самоэволюционирующих агентов. 🎉

Обзор проекта

EverOS — коллекция методов долгосрочной памяти, бенчмарков и примеров использования для построения самоэволюционирующих агентов.

EverOS/ └── methods/ ├── EverCore/ # Операционная система долгосрочной памяти └── HyperMem/ # Архитектура памяти на основе гиперграфов ├── benchmarks/ │ ├── EverMemBench/ # Оценка качества памяти │ └── EvoAgentBench/ # Оценка самоэволюции агентов └── use-cases/ # Примеры использования ├── claude-code-plugin/ └── game-of-throne-demo/

Методы

Методы — это готовые к продакшену архитектуры памяти, обеспечивающие агентам персистентную структурированную долгосрочную память. Каждый метод можно использовать отдельно или комбинировать в зависимости от задачи.

banner-gif

EverCore

Самоорганизующаяся операционная система памяти, вдохновлённая биологическим импринтингом. Извлекает, структурирует и извлекает долгосрочные знания из диалогов — позволяя агентам запоминать, понимать и непрерывно эволюционировать.

Статья · Документация

banner-gif

HyperMem

Иерархическая архитектура памяти на основе гиперграфов, фиксирующая ассоциации высокого порядка через гиперрёбра. Организует память по слоям тем, событий и фактов для поиска в долгосрочных диалогах от общего к частному. LoCoMo 92.73%.

Статья · Документация

Бенчмарки

Бенчмарки разработаны как открытые публичные стандарты. Любая архитектура памяти или агентный фреймворк может быть оценён по единой шкале.

banner-gif

EverMemBench

Трёхуровневая оценка качества памяти: фактическое воспроизведение, прикладное рассуждение и персонализированное обобщение. Оценивает системы памяти и LLM по единому стандарту.

Статья · Датасет · Документация

banner-gif

EvoAgentBench

Оценка самоэволюции агентов — не статичные снимки, а кривые продольного роста. Измеряет эффективность переноса знаний, избегание ошибок и качество попаданий по навыкам через контролируемые эксперименты с эволюцией и без.

Документация

Похожие MCP-серверы