ivanintouch-labs

jtbd-segmentation

Универсальная методология JTBD-сегментации СВОИХ клиентов по СВОИМ разговорам (звонки/чаты/мессенджеры/боты). Self-serve для предпринимателя или продакта, который работает со своими данными — без discovery с внешним заказчиком. Извлекает из каждого диалога полное JTBD-досье на лида (per-lead JSON) и собирает 5-12 JTBD-сегментов с отнесением каждого лида к одному из них. Адаптируется к любому уровню глубины данных — от «только разговоры» до «полная воронка + конверсия». Используй, когда нужно сегментировать своих клиентов по реальным мотивам (не по демографии и не по CRM-типу), отнести каждого лида к сегменту с описанием и evidence. Триггеры — «сегментировать клиентов», «JTBD из звонков», «JTBD из переписок», «понять кто наши клиенты», «отнести лидов к сегментам».

ivanintouch-labs 0 Updated 2d ago

Resources

9
GitHub

Install

npx skillscat add ivanintouch-labs/jtbd-segmentation-skill

Install via the SkillsCat registry.

SKILL.md

Skill: jtbd-segmentation (методология)

Что это. Self-serve методологический скилл: как из СВОИХ сырых разговоров с СВОИМИ клиентами извлечь per-lead JTBD-досье и собрать 5-12 сегментов с отнесением каждого лида к одному из них.

Для кого. Для предпринимателя, продакта, аналитика, который работает со своим собственным материалом. Никаких discovery-интервью, согласований выгрузок, ТЗ для внешнего заказчика — ты сам владеешь данными и сам ведёшь анализ.

Что НЕ входит. Конкретные скрипты, схемы БД, парсеры CRM — только методология. Реализацию пиши под себя.


Когда применять

  • Сегментировать своих клиентов по мотивам (не по демографии и не по CRM-типу)
  • Отнести каждого лида к сегменту с обоснованием и evidence-цитатами
  • Понять структуру спроса — какие жизненные ситуации приводят клиентов
  • Сравнить сегменты по конверсии (если есть данные воронки)
  • Когда есть массив разговоров с клиентами и хочется понять, кто эти люди и зачем они приходят

Что на выходе

Главное: jtbd/<lead_id>.json — полное JTBD-досье на КАЖДОГО лида, к которому удалось привязать диалог. См. полную схему в `prompts/01-jtbd-extraction.md`.

В каждом JSON'е сохраняется:

  • jtbd — job_statement + push/pull/anxieties/barriers + habits с дословными цитатами и evidence_event_id
  • operational_axes — subtype, urgency, attachment/price_sensitivity (закрытые перечни)
  • industry_profile_blocks — то, что хочет купить (адаптируется под индустрию)
  • segment_hypothesis — гипотеза сегмента (после Stage 2 → каноническая привязка)
  • special_situations — инверсия диаризации, лид-агент, QA-опрос, повторник, свитчер
  • evidence_events — id событий, на которых основан анализ
  • overall_confidence — 0.0-1.0

Дополнительно (по уровню данных):

  • segments.json — таксономия 5-12 сегментов с типичными сигналами и описаниями
  • funnel_per_segment.csv — CR / drop-stages по сегментам (если есть воронка)
  • contextual_cells.csv — сегмент × город × канал × время (если есть контекст)
  • REPORT_jtbd.md — итоговый отчёт + playbook (опционально)

Главный принцип

Адаптируйся к тому, что у тебя есть.

Перед началом определи Tier 0/1/2/3 по своим данным (см. `data-readiness-tiers.md`). На каждом Tier'е честно скажи себе, что можно сделать, а что — нет.

Tier Что есть Что доступно
T0 Только разговоры JTBD-досье на лида + таксономия сегментов
T1 + базовая воронка (статусы, конверсия) T0 + CR per segment + drop-stages
T2 + контекст (источник/время/город/канал) T1 + контекстные ячейки (сегмент × контекст)
T3 + операции после конверсии (платежи, продления, churn) T2 + lifecycle-сегментация

6 фаз методологии

Полное описание — в `METHODOLOGY.md`. Кратко:

# Фаза Артефакт Tier
0 Tier-assessment — определить уровень глубины своих данных data-tier.md все
1 Inventory & landscape — что есть, как связано, где разрывы data_landscape.md все
2 Channel normalization — все каналы → единый timeline.json на лида timelines/<lead_id>.json все
3 Funnel & cohorts — этапы, конверсия, когорты funnel_conversion.csv T1+
4 Intent routing (если несколько продуктов) — раскладка по корзинам canonical_intents.jsonl все (опц.)
5 JTBD-разметка лида — мотивы + push/pull/anxieties + цитаты jtbd/<lead_id>.json все
6 Stage 2 кластеризация — 5-12 сегментов + отнесение каждого лида segments.json + lead_to_segment.csv все
7 Contextual layering — сегмент × контекст ячейки contextual_cells.csv T2+

⭐ Фаза 5 — главная. После неё каждый лид имеет полное JTBD-досье. Всё остальное — поверх него.


Decision flow — куда идти от своей точки

                  ┌──────────────────────────────┐
                  │ У тебя уже есть корпус       │
                  │ разговоров со своими         │
                  │ клиентами?                   │
                  └────────────┬─────────────────┘
                       да      │      нет
              ┌────────────────┴──────────────┐
              ▼                                ▼
        Какой Tier?                   Сначала собери
        (Фаза 0)                     корпус — выгрузи
              │                       транскрипты звонков
              │                       и/или чатов с
              ▼                       привязкой к lead_id
        METHODOLOGY.md
        ├ T0 → Фазы 1, 2, 4, 5, 6
        ├ T1 → Фазы 1-6
        ├ T2 → Фазы 1-7
        └ T3 → Фазы 1-7 + lifecycle

Минимальная сборка по Tier'у

Tier 0 — только разговоры

Фаза 1 (inventory) → Фаза 2 (normalization) → Фаза 4 (intent routing, опц.) →
Фаза 5 (JTBD-разметка) → Фаза 6 (кластеризация + отнесение)

Результат: 5-12 JTBD-сегментов + per-lead JSON для каждого лида с цитатами и гипотезой сегмента. CR не считается (нет воронки).

Tier 1 — + базовая воронка

Добавляется: Фаза 3 (funnel/cohorts). Фаза 6 даёт ещё CR per segment + drop-stages.

Tier 2 — + контекст

Добавляется: Фаза 7 (контекстные слои). Сегмент × источник × город × время — где сегмент конвертит лучше / хуже.

Tier 3 — + операции после Won

Добавляется: lifecycle-сегментация. Поведение клиентов после первой сделки → вторичная сегментация.


Архитектурное ядро

Двухстадийный анализ с сохранением полного per-lead JSON:

Стадия Что делает Модель Артефакт
Stage 1 На каждом лиде — извлечь полное JTBD-досье Haiku / Sonnet jtbd/<lead_id>.json
Stage 2 На агрегатах из Stage 1 — собрать 5-12 сегментов Opus / Sonnet-thinking segments.json + lead_to_segment.csv

Принцип. Stage 2 НЕ запускается на сырых лидах — это слишком дорого и нестабильно. Сначала pre-aggregation по операционным осям → подавать модели агрегаты с типичными цитатами.

См. `prompts/01-jtbd-extraction.md` и `prompts/02-stage2-clustering.md`.


Ключевые антипаттерны (полный список — `antipatterns.md`)

Топ-5, на которые наступили мы сами:

  1. Не сегментировать по CRM type — у части лидов он врёт. Использовать canonical_intent из диалога.
  2. Не сегментировать по демографии — один демосегмент = 3-5 разных мотивов.
  3. Не задавать сегменты заранее в первой итерации — пусть LLM откроет их из данных (open discovery первой когорты → taxonomy hint потом).
  4. Не объединять разные продукты в одну сегментацию — раздельные таксономии по корзинам (intent routing на Фазе 4).
  5. Не пускать сырые PII через границы анализа — маскировка ДО записи в любой артефакт.

Структура скилла

.claude/skills/jtbd-segmentation/
├── SKILL.md                          ← ты здесь
├── METHODOLOGY.md                    ← полные 6 фаз с детализацией
├── data-readiness-tiers.md           ← T0/T1/T2/T3, что доступно на каждом
├── channel-adapters.md               ← как нормализовать разные каналы в timeline
├── antipatterns.md                   ← «не делай так» с примерами из практики
├── prompts/
│   ├── 00-intent-routing.md          ← раскладка по продуктовым корзинам (опц.)
│   ├── 01-jtbd-extraction.md ⭐      ← главный промпт: per-lead JSON
│   └── 02-stage2-clustering.md       ← Opus-кластеризация в JTBD-сегменты
└── templates/
    ├── report-jtbd.md                ← структура итогового отчёта
    └── playbook.md                   ← структура playbook по сегментам (опц.)

Как пользоваться

  1. Прочитай `METHODOLOGY.md` полностью один раз — это база.
  2. На новой задаче — открой `data-readiness-tiers.md` и определи Tier.
  3. Иди по фазам соответствующей минимальной сборки (см. выше).
  4. Промпты в prompts/ — это шаблоны. Адаптируй под свою индустрию и продукт.
  5. Главный артефакт — jtbd/<lead_id>.json. Всё остальное собирается ПОВЕРХ него.

Правила статистической честности

Выборка Маркер Формулировка
< 10 лидов «Гипотеза для проверки»
10-29 лидов «Предварительный вывод»
30+ лидов жирный «Надёжный вывод»
  • Никогда не делай вывода «масштабировать» при N < 30 → «тестировать».
  • Всегда абсолютные числа рядом с процентами: CR 50% (3/6) ⚠.
  • Прогнозы — «при подтверждении на бо́льшей выборке».

Categories