humanize-chinese
voidborne-d/humanize-chineseБесплатный локальный инструмент для обнаружения и переработки китайских AI-текстов. N-gram анализ перплексии, 20+ паттернов детекции, снижение AIGC-оценки для академических работ (知网/维普/万方), 7 стилей трансформации. Без зависимостей и API-ключей.
Установка
git clone https://github.com/voidborne-d/humanize-chinese.gitREADME
🔧 Инструмент удаления следов AI из китайских текстов 
Бесплатно, работает локально, без зависимостей, без LLM. Детекция + переработка за один шаг.
Результат за 30 секунд
./humanize academic 论文.txt -o 改后.txt -a --compare
AIGC融合评分(rule+stat × 0.2 + LR × 0.8):
原文: 92/100 VERY HIGH 🔴
改写后: 6/100 LOW 🟢
✅ 降低了 86 分
Среднее снижение оценки на 86 баллов на трёх тестовых образцах. Без регистрации, без оплаты, без интернета, без API-ключа. По умолчанию выполняется 10 итераций переработки с выбором лучшего результата по LR (--best-of-n 0 отключает это и возвращает скорость одиночного прохода ~5 секунд).
Сравнение до и после переработки
🎓 Академическая статья (VERY HIGH → LOW, −86 баллов)
До переработки 🔴 92 балла:
本文旨在探讨人工智能对高等教育教学模式的影响,具有重要的理论意义和实践价值。研究表明,人工智能技术已被广泛应用于课堂教学、学生评估和个性化学习等多个方面。
После переработки 🟢 6 баллов:
本文尝试探讨人工智能对高等教育教学模式的影响,兼具理论探索与实践参考的双重价值。相关研究揭示,人工智能技术已广泛用于课堂教学、学生评估和个性化学习等多个层面。
💬 Общий текст (VERY HIGH → LOW, −81 балл)
До переработки 🔴 100 баллов:
综上所述,人工智能技术在教育领域具有重要的应用价值和广阔的发展前景。值得注意的是,随着技术的不断发展,AI 将在个性化学习、智能评估等方面发挥越来越重要的作用,为教育行业的数字化转型赋能。
После переработки 🟢 19 баллов:
总之,人工智能技术在教育领域具有重要的应用价值和广阔的演进前景。有个点,现在,AI 将在个性化学习、智能评估等方面发挥越来越重要的作用,为教育行业的数字化赋能。
🌸 Социальные сети → стиль 小红书 (VERY HIGH → LOW, −90 баллов)
До переработки 🔴 100 баллов:
在当今快节奏的生活中,时间管理对于每个人来说都具有至关重要的意义。值得注意的是,通过合理规划和科学管理时间,不仅能够显著提升工作效率,更能够实现工作与生活的完美平衡。
После переработки 🟢 10 баллов (сначала автоматически применяется humanize для удаления AI-маркеров, затем добавляются элементы стиля 小红书):
姐妹们冲!~
在当今快节奏的生活中,时间管理对于每个人来说都具有至关重要的意义💫!
有个点,通过合理规划和科学管理时间,不仅能够醒目提升工作效率,更能够实现工作与生活的完美平衡🎀。
Все AIGC-оценки в примерах основаны на комбинированном детекторе (rule+stat × 0.2 + LR ensemble × 0.8) и воспроизводимы при seed=42 + best_of_n=10.
📚 Техническая база (источники)
Алгоритмы детекции основаны на конкретных исследованиях — каждый признак соответствует опубликованной статье или датасету:
| Технология | Источник / датасет | Назначение |
|---|---|---|
| HC3-Chinese калибровка | Hello-SimpleAI/chatgpt-comparison-detection | 12 853 пары человек/ChatGPT, все пороги откалиброваны на 300+300 образцах |
| DivEye surprisal | Basani & Chen, TMLR 2026 | skew/kurtosis/spectral flatness временного ряда символьного surprisal |
| GLTR rank-бакеты | Gehrmann et al., ACL 2019 | AI предпочитает top-10 по вероятности символов, люди — более рассеянно |
| Fast-DetectGPT | Bao et al., ICLR 2024 | Локальная кривизна: AI-текст имеет низкую кривизну под предсказаниями модели |
| Binoculars | Hans et al., ICML 2024 | Отношение perplexity двух моделей для разделения AI/человек |
| MPU (AIGC_detector_zhv2) | Tian et al., ICLR 2024 | PU learning для китайского AIGC-детектора |
| Ghostbuster multi-scale ngram | Verma et al., NAACL 2024 | Комбинация log-prob признаков нескольких слабых LM |
| Глубокое обучение для китайского AIGC | AIMS 2025 | Дисперсия длины предложений, плотность пунктуации и др. |
| Психолингвистические различия | arxiv 2505.01800 | Человеческий текст содержит больше конкретных существительных и именованных сущностей |
| Stumbling Blocks taxonomy | Wang et al., ACL 2024 | Карта векторов атак на AI-детекторы |
| CNKI три цепочки | linggantext tech blog | Официальные три цепочки CNKI AIGC 3.0: языковые паттерны / семантическая логика / знаниевое усиление |
| CiLin синонимический словарь | Расширенный тезаурус HIT LTP | 38 873 слова в синонимическом маппинге, включается флагом --cilin |
Бесплатно для некоммерческого использования, все числа воспроизводимы любым пользователем.
Установка
# Способ 1: ClawHub
clawhub install humanize-chinese
# Способ 2: Git Clone
git clone https://github.com/voidborne-d/humanize-chinese.git
# Способ 3: Claude Code Skill
npx skills add https://github.com/voidborne-d/humanize-chinese.gitpip install ничего не требуется. Скачал — готово к работе.
Claude Code
4 slash-команды, достаточно скопировать в .claude/commands/:
git clone https://github.com/voidborne-d/humanize-chinese.git
cp humanize-chinese/claude-code/*.md YOUR_PROJECT/.claude/commands/Затем в Claude Code:
/detect 综上所述,人工智能技术在教育领域具有重要的应用价值...
/humanize 本文旨在探讨人工智能对高等教育教学模式的影响...
/academic 论文.txt
/style xiaohongshu 在当今快节奏的生活中...
| Команда | Функция |
|---|---|
/detect | Детекция AI-следов, оценка 0–100 |
/humanize | Переработка для удаления AI-маркеров |
/academic | Снижение AIGC-оценки академических работ |
/style [стиль] | Трансформация стиля (7 вариантов) |
Быстрый старт
Единый CLI (рекомендуется)
./humanize --list
./humanize detect 论文.txt # детекция
./humanize academic 论文.txt -o 改后.txt --compare # снижение AIGC для академических работ
./humanize rewrite text.txt --quick -o clean.txt # общая переработка (быстрый режим)
./humanize style text.txt --style xiaohongshu # трансформация стиля
./humanize compare text.txt -a # сравнение до/после
./humanize <sub> --help # справка по подкомандеВнутри по-прежнему используются отдельные скрипты scripts/*_cn.py; ./humanize — лишь диспетчер, прямой вызов старых скриптов также полностью поддерживается.
🎓 Снижение AIGC-оценки академических работ
./humanize academic 论文.txt # только детекция
./humanize academic 论文.txt -o 改后.txt --compare # переработка + сравнение
./humanize academic 论文.txt -o 改后.txt --quick # быстрый режим (без статистики, ~18× быстрее)
./humanize academic 论文.txt -o 改后.txt -a --compare # агрессивный режим🔍 Удаление AI-маркеров из общего текста
./humanize detect text.txt -v # детекция (подробно)
./humanize rewrite text.txt -o clean.txt # переработка
./humanize rewrite text.txt --quick # только замены, максимальная скорость
./humanize compare text.txt -a # сравнение🎨 Трансформация стиля
./humanize style text.txt --style xiaohongshu # 小红书
./humanize style text.txt --style zhihu # 知乎
./humanize style text.txt --style weibo # 微博