Autosearch
0xmariowu/AutosearchСамоэволюционирующая система глубокого исследования для AI-разработчиков. Структурированный охват англо- и русскоязычных источников, отчёты в markdown со ссылками. Работает через CLI, HTTP, MCP и slash-команды в Claude Code.
Установка
git clone https://github.com/0xmariowu/Autosearch.gitREADME
Статус
AutoSearch проходит полный рефакторинг v2 (тег legacy-v1 сохраняет состояние v1). v2 заменяет монолитный v1 модульным пайплайном (M0–M8) с жёсткой привязкой к исходным кодам проверенных deep-research проектов. Адаптеры каналов (реальные источники данных) запланированы в roadmap — текущий релиз поставляется с заглушкой DemoChannel, чтобы сквозной пайплайн можно было запустить и протестировать.
Постатейный чеклист по модулям — в docs/delivery-status.md.
Быстрый старт
Установка для разработки (текущая — релиза на PyPI пока нет):
git clone https://github.com/0xmariowu/Autosearch
cd Autosearch
uv venv --python 3.12
uv pip install -e . --python .venv/bin/python
.venv/bin/autosearch query "your topic"После первого тегированного релиза v2:
pipx install autosearch
autosearch query "your topic"Требования: Python 3.12+. Задайте одну из переменных ANTHROPIC_API_KEY, OPENAI_API_KEY, GOOGLE_API_KEY, либо убедитесь, что CLI claude доступен в PATH — LLM-слой автоматически определяет первого доступного провайдера.
Потоковый вывод прогресса в stderr включён по умолчанию (--stream); отключить можно флагом --no-stream, либо используйте --json для машиночитаемого вывода:
autosearch query "retrieval-augmented generation survey" --json
Архитектура
query
↓
M0 Knowledge Recall (известные факты + пробелы)
M1 Goal Crystallization + Clarify (рубрики + режим)
M2 Search Strategy (подзапросы)
M3 Iteration Controller (цикл reflect-on-gaps по каналам)
M4 Material Cleaner (trafilatura)
M5 Evidence Processor (дедупликация URL + SimHash + BM25)
M7 Report Synthesizer (структура + посекционная генерация + ремаппинг цитат)
M8 Quality Gate (оценка по рубрикам, одна повторная попытка при неудаче)
↓
markdown + References + разбивка по Sources
Наблюдаемость (CostTracker) и персистентность (SessionStore, трёхтабличная схема SQLite) доступны как аргументы конструктора Pipeline.
Каждый модуль имеет соответствие 1:1 с источником в известном deep-research проекте — маппинг см. в docs/delivery-status.md.
Интерфейсы
AutoSearch работает в следующих режимах:
- CLI:
autosearch query "..." - HTTP + SSE:
autosearch serve—POST /searchстримит типизированные события (phase/iteration/gap/quality/finished) - MCP-сервер:
autosearch mcp(или консольный скриптautosearch-mcp) — предоставляет инструментresearchдля Claude Code, Cursor и других MCP-клиентов. Примеры конфигурации для каждого клиента — вdocs/mcp-clients.md. - Slash-команда Claude Code:
/autosearch(поставляется вcommands/autosearch.md)
Поддерживаемые каналы
Генерируется из autosearch/skills/channels/*/SKILL.md. После добавления или изменения канала выполните .venv/bin/python scripts/generate_channels_table.py.
Tier 0 — всегда активны (21)
| Канал | Языки | Описание | Типичный охват |
|---|---|---|---|
| arxiv | en | Поиск академических препринтов по CS/ML/физике для англоязычных и смешанных запросов, ожидающих рецензируемые или препринтные статьи. | средний-высокий |
| crossref | en | Межиздательский научный поиск через реестр DOI Crossref — журнальные статьи, главы книг и метаданные исследований с привязкой к цитированиям. | средний |
| dblp | en | Библиографический поиск по информатике — технические статьи, материалы конференций и журнальные публикации с индексацией по площадке, автору и году. | средний |
| ddgs | en, mixed | DuckDuckGo Search — бесплатный общий веб-поиск без авторизации, используется как широкий дефолт для любых англоязычных и смешанных запросов. | средний |
| devto | en, mixed | Статьи блогов разработчиков с тегами по технологиям через публичный API dev.to. | средний |
| github | en | Поиск на уровне кода, issues и репозиториев, когда запрос касается библиотеки, фреймворка или деталей реализации. | высокий |
| google_news | en, mixed | Актуальные новостные заголовки от различных издателей через Google News RSS (лента для США на английском). | высокий |
| hackernews | en | Обсуждения разработчиков в реальном времени, мнения об инструментах и ранние сигналы о продуктах от сообщества HN. | средний-высокий |
| huggingface_hub | en, mixed | Поиск открытых ML-моделей на Hugging Face Hub через публичный API поиска моделей. | высокий |
| infoq_cn | zh, mixed | Китайские инженерные статьи по архитектуре, AI и корпоративным технологиям от InfoQ 中文 через публичный RSS. | средний |
| kr36 | zh, mixed | Китайские технологические бизнес-новости, раунды финансирования стартапов и отраслевая аналитика от 36kr. | средний |
| openalex | en, mixed | Поиск научных работ через публичный API OpenAlex с фолбэком на URL открытого доступа. | высокий |
| package_search | en, mixed | Поиск пакетов в реестрах PyPI (точный поиск по имени) и npm (полнотекстовый поиск). | средний |
| papers | en, mixed | Многоисточниковый поиск академических статей (arxiv, pubmed, biorxiv, medrxiv и др.). | средний |