EverOS
EverMind-AI/EverOSEverOS — платформа для создания, оценки и интеграции долгосрочной памяти в AI-агентов. Включает архитектуры памяти EverCore и HyperMem, бенчмарки EverMemBench и EvoAgentBench, а также готовые примеры использования с Claude Code.
Подключение
git clone https://github.com/EverMind-AI/EverOS.gitREADME
Сайт · Документация · Блог
[!IMPORTANT]
Обновление структуры проекта
Мы объединили EverCore, HyperMem, EverMemBench и EvoAgentBench вместе с примерами использования в единый репозиторий.
EverOS даёт разработчикам единое место для создания, оценки и интеграции долгосрочной памяти в самоэволюционирующих агентов. 🎉
Обзор проекта
EverOS — коллекция методов долгосрочной памяти, бенчмарков и примеров использования для построения самоэволюционирующих агентов.
EverOS/
└── methods/
├── EverCore/ # Операционная система долгосрочной памяти
└── HyperMem/ # Архитектура памяти на основе гиперграфов
├── benchmarks/
│ ├── EverMemBench/ # Оценка качества памяти
│ └── EvoAgentBench/ # Оценка самоэволюции агентов
└── use-cases/ # Примеры использования
├── claude-code-plugin/
└── game-of-throne-demo/
Методы
Методы — это готовые к продакшену архитектуры памяти, обеспечивающие агентам персистентную структурированную долгосрочную память. Каждый метод можно использовать отдельно или комбинировать в зависимости от задачи.
EverCore
Самоорганизующаяся операционная система памяти, вдохновлённая биологическим импринтингом. Извлекает, структурирует и извлекает долгосрочные знания из диалогов — позволяя агентам запоминать, понимать и непрерывно эволюционировать.
HyperMem
Иерархическая архитектура памяти на основе гиперграфов, фиксирующая ассоциации высокого порядка через гиперрёбра. Организует память по слоям тем, событий и фактов для поиска в долгосрочных диалогах от общего к частному. LoCoMo 92.73%.
Бенчмарки
Бенчмарки разработаны как открытые публичные стандарты. Любая архитектура памяти или агентный фреймворк может быть оценён по единой шкале.
EverMemBench
Трёхуровневая оценка качества памяти: фактическое воспроизведение, прикладное рассуждение и персонализированное обобщение. Оценивает системы памяти и LLM по единому стандарту.
Статья · Датасет · Документация
EvoAgentBench
Оценка самоэволюции агентов — не статичные снимки, а кривые продольного роста. Измеряет эффективность переноса знаний, избегание ошибок и качество попаданий по навыкам через контролируемые эксперименты с эволюцией и без.