Claude Info
Исследования

Autosearch

0xmariowu/Autosearch

Самоэволюционирующая система глубокого исследования для AI-разработчиков. Структурированный охват англо- и русскоязычных источников, отчёты в markdown со ссылками. Работает через CLI, HTTP, MCP и slash-команды в Claude Code.

Установка

terminal
bash
git clone https://github.com/0xmariowu/Autosearch.git

README


Статус

AutoSearch проходит полный рефакторинг v2 (тег legacy-v1 сохраняет состояние v1). v2 заменяет монолитный v1 модульным пайплайном (M0–M8) с жёсткой привязкой к исходным кодам проверенных deep-research проектов. Адаптеры каналов (реальные источники данных) запланированы в roadmap — текущий релиз поставляется с заглушкой DemoChannel, чтобы сквозной пайплайн можно было запустить и протестировать.

Постатейный чеклист по модулям — в docs/delivery-status.md.

Быстрый старт

Установка для разработки (текущая — релиза на PyPI пока нет):

bash
git clone https://github.com/0xmariowu/Autosearch
cd Autosearch
uv venv --python 3.12
uv pip install -e . --python .venv/bin/python
.venv/bin/autosearch query "your topic"

После первого тегированного релиза v2:

bash
pipx install autosearch
autosearch query "your topic"

Требования: Python 3.12+. Задайте одну из переменных ANTHROPIC_API_KEY, OPENAI_API_KEY, GOOGLE_API_KEY, либо убедитесь, что CLI claude доступен в PATH — LLM-слой автоматически определяет первого доступного провайдера.

Потоковый вывод прогресса в stderr включён по умолчанию (--stream); отключить можно флагом --no-stream, либо используйте --json для машиночитаемого вывода:

autosearch query "retrieval-augmented generation survey" --json

Архитектура

query ↓ M0 Knowledge Recall (известные факты + пробелы) M1 Goal Crystallization + Clarify (рубрики + режим) M2 Search Strategy (подзапросы) M3 Iteration Controller (цикл reflect-on-gaps по каналам) M4 Material Cleaner (trafilatura) M5 Evidence Processor (дедупликация URL + SimHash + BM25) M7 Report Synthesizer (структура + посекционная генерация + ремаппинг цитат) M8 Quality Gate (оценка по рубрикам, одна повторная попытка при неудаче) ↓ markdown + References + разбивка по Sources

Наблюдаемость (CostTracker) и персистентность (SessionStore, трёхтабличная схема SQLite) доступны как аргументы конструктора Pipeline.

Каждый модуль имеет соответствие 1:1 с источником в известном deep-research проекте — маппинг см. в docs/delivery-status.md.

Интерфейсы

AutoSearch работает в следующих режимах:

  • CLI: autosearch query "..."
  • HTTP + SSE: autosearch servePOST /search стримит типизированные события (phase / iteration / gap / quality / finished)
  • MCP-сервер: autosearch mcp (или консольный скрипт autosearch-mcp) — предоставляет инструмент research для Claude Code, Cursor и других MCP-клиентов. Примеры конфигурации для каждого клиента — в docs/mcp-clients.md.
  • Slash-команда Claude Code: /autosearch (поставляется в commands/autosearch.md)

Поддерживаемые каналы

Генерируется из autosearch/skills/channels/*/SKILL.md. После добавления или изменения канала выполните .venv/bin/python scripts/generate_channels_table.py.

Tier 0 — всегда активны (21)

КаналЯзыкиОписаниеТипичный охват
arxivenПоиск академических препринтов по CS/ML/физике для англоязычных и смешанных запросов, ожидающих рецензируемые или препринтные статьи.средний-высокий
crossrefenМежиздательский научный поиск через реестр DOI Crossref — журнальные статьи, главы книг и метаданные исследований с привязкой к цитированиям.средний
dblpenБиблиографический поиск по информатике — технические статьи, материалы конференций и журнальные публикации с индексацией по площадке, автору и году.средний
ddgsen, mixedDuckDuckGo Search — бесплатный общий веб-поиск без авторизации, используется как широкий дефолт для любых англоязычных и смешанных запросов.средний
devtoen, mixedСтатьи блогов разработчиков с тегами по технологиям через публичный API dev.to.средний
githubenПоиск на уровне кода, issues и репозиториев, когда запрос касается библиотеки, фреймворка или деталей реализации.высокий
google_newsen, mixedАктуальные новостные заголовки от различных издателей через Google News RSS (лента для США на английском).высокий
hackernewsenОбсуждения разработчиков в реальном времени, мнения об инструментах и ранние сигналы о продуктах от сообщества HN.средний-высокий
huggingface_huben, mixedПоиск открытых ML-моделей на Hugging Face Hub через публичный API поиска моделей.высокий
infoq_cnzh, mixedКитайские инженерные статьи по архитектуре, AI и корпоративным технологиям от InfoQ 中文 через публичный RSS.средний
kr36zh, mixedКитайские технологические бизнес-новости, раунды финансирования стартапов и отраслевая аналитика от 36kr.средний
openalexen, mixedПоиск научных работ через публичный API OpenAlex с фолбэком на URL открытого доступа.высокий
package_searchen, mixedПоиск пакетов в реестрах PyPI (точный поиск по имени) и npm (полнотекстовый поиск).средний
papersen, mixedМногоисточниковый поиск академических статей (arxiv, pubmed, biorxiv, medrxiv и др.).средний

Похожие скиллы