Manusiawi
abualif120/manusiawiClaude skill для очистки текстов на малайзийском Bahasa Melayu от характерных AI-паттернов. Детектирует 32 BM-шаблона, 24 английских паттерна и индонезийские вкрапления в «малайзийский» вывод LLM.
Установка
git clone https://github.com/abualif120/manusiawi.gitREADME
Manusiawi
Убирает «запах AI» из текстов на малайзийском Bahasa Melayu. Вы знаете эти маркеры — «di era globalisasi ini», «secara holistik dan komprehensif», «telah dibuktikan bahawa». Manusiawi распознаёт 32 подобных BM-паттерна, плюс 24 английских для смешанного контента, и помечает индонезийскую лексику, которая просачивается, когда модель не различает малайзийский BM и индонезийский.
Claude skill yang buang penulisan berbau AI dari tulisan Bahasa Melayu Malaysia. Korang tahu la gaya tu, "di era globalisasi ini", "secara holistik dan komprehensif", "dengan demikian dapatlah disimpulkan". Manusiawi boleh detect 32 pattern BM macam ni, 24 pattern English untuk content campuran, plus detector perkataan Indonesia yang leak (AI selalu lupa dia tulis untuk orang Malaysia, bukan Indonesia).
Почему я это создал
Меня это достало.
Каждый раз, читая AI-сгенерированный BM-контент, я распознаю его за 3 секунды. Зачины с «era globalisasi», лексика «holistik» и «komprehensif», нагромождение «Selain itu... Di samping itu... Tambahan lagi...». Я перестаю читать, как только это вижу. Настолько очевидно.
Проблема в BM острее, чем в английском. Для английского существуют инструменты и гайды по устранению AI-маркеров — например, blader/humanizer, основанный на статье Wikipedia Signs of AI writing. Для BM? Ничего. Ни гайда, ни инструмента, ни skill. LLM по умолчанию выдают BM в стиле karangan-SPM-tahun-90an — статистически «безопасный» вывод, который читается как правительственный pekeliling, который никто не хочет читать.
Вдобавок LLM постоянно путают малайзийский BM с Bahasa Indonesia. Получаете «kantor» вместо «pejabat», «gimana» вместо «macam mana», вкрапления «banget» и «dong» — слова, которые ни один малазиец не употребляет. Детектора таких вторжений тоже не существовало.
Поэтому я создал Manusiawi:
- 32 BM-специфичных AI-паттерна с примерами до/после — маркеры, выдающие AI-написанный BM
- Детектор индонезийских вторжений — ловит индонезийскую лексику, просачивающуюся в «BM»-вывод
- 24 английских AI-паттерна — для смешанного BM-EN контента, который малазийцы естественно производят при code-switching
Установка
Claude Code
Клонируйте напрямую в директорию skills Claude Code:
mkdir -p ~/.claude/skills
git clone https://github.com/abualif120/manusiawi.git ~/.claude/skills/manusiawi
OpenCode
Клонируйте напрямую в директорию skills OpenCode:
mkdir -p ~/.config/opencode/skills
git clone https://github.com/abualif120/manusiawi.git ~/.config/opencode/skills/manusiawi
Примечание: OpenCode также сканирует
~/.claude/skills/для совместимости, поэтому одного клонирования в~/.claude/skills/manusiawi/достаточно для обоих инструментов.
Claude Desktop / Claude.ai
Поместите SKILL.md и папку references/ в директорию skills Claude.
Использование
Claude Code
/manusiawi
[вставьте ваш BM-текст здесь]
Прямой запрос
Скажите Claude напрямую — на BM, английском или смешанно:
Humanize teks ni: [paste text]
Tolong betulkan BM ni, nampak AI sangat: [paste text]
Please humanize this Malay text: [paste text]
Калибровка голоса
Хотите, чтобы вывод соответствовал вашему стилю письма? Сначала дайте образец:
/manusiawi
Ni sample tulisan aku untuk voice matching:
[вставьте 2-3 абзаца вашего текста]
Sekarang humanize teks ni:
[вставьте AI-текст]
Skill проанализирует ритм ваших предложений, выбор слов, частицы, которые вы обычно используете, и применит это к рерайту — вместо generic-вывода.
Обзор
Основан на гайде Wikipedia «Signs of AI writing», поддерживаемом WikiProject AI Cleanup. Адаптирован из skill blader/humanizer с добавлением BM-специфичных паттернов, детектора индонезийских вторжений и поддержки английских паттернов для смешанного контента.
Manusiawi расширяет подход humanizer тремя дополнениями:
- 32 BM Malaysia-специфичных AI-паттерна — паттерны, появляющиеся только когда LLM пишут BM (зачины era globalisasi, лексика holistik/komprehensif, злоупотребление пассивом telah di-, adalah перед прилагательными, di mana как союз).
- Детектор индонезийских вторжений — ловит индонезийскую лексику, просачивающуюся в «BM»-вывод LLM (kantor, mobil, uang, kamu, banget, gue, dong, sih).
- 24 английских AI-паттерна — для смешанного BM-EN контента, который малазийцы естественно производят. Сохраняет технический английский, убирает AI-бизнес/академический/промо-стиль. См.
references/patterns-en.md.
Ключевой инсайт из Wikipedia
«LLM используют статистические алгоритмы для предсказания следующего токена. Результат тяготеет к наиболее статистически вероятному, применимому к наибольшему числу случаев.»
В контексте BM LLM по умолчанию выдают язык karangan SPM 90-х годов — наиболее «безопасный», но наименее человечный.
32 малайзийских BM-паттерна с примерами до/после
Номера паттернов соответствуют references/patterns-bm.md для полных деталей.
Паттерны содержания / Corak Kandungan
| # | Паттерн | До | После |
|---|---|---|---|
| 1 | Зачины era globalisasi | "Dalam era globalisasi yang serba mencabar ini, pendidikan memainkan peranan penting..." | "Kos pendidikan tinggi di Malaysia naik purata 6% setahun sejak 2019." |
| 2 | Раздувание значимости | "memainkan peranan yang amat penting, menjadi tunggak utama" | "Sektor IT menyumbang RM44.8 bilion kepada GDP 2024" |
| 3 | Тяжёлая академическая лексика | "pendekatan holistik yang menyeluruh" | "Kerajaan keluar RM2.3 bilion untuk 14 inisiatif pendidikan" |
| 4 | Раздувание известности | "telah terkenal seantero negara, mendapat pengiktirafan luas" | "Dah beroperasi sejak 1998. Queue panjang setiap Sabtu pagi." |
| 5 | Поверхностный анализ с -kan | "mencerminkan komitmen, menonjolkan kepentingan, menggambarkan keupayaan" | Говорите прямо, что было сделано |
Языковые паттерны / Corak Bahasa
| # | Паттерн | До | После |
|---|---|---|---|
| 6 | AI-лексика | "holistik", "komprehensif", "sinergistik", "transformatif" | Конкретные слова с конкретными значениями |
Полный список всех 32 паттернов см. в references/patterns-bm.md.