Магическое A/B-тестирование 😎Для многих сия тема кажется весьма простой: показали одной группе старую версию, другой новую, метрика выросла, стало быть тест успешен.Но на практике именно тут и скрывается одна из главных ловушек.Смысл A/B-теста не в одном лишь ответе на вопрос, выросла метрика или нет.Куда важнее понять:
можно ли вообще считать сей рост полезным для продукта 🤔Разберём на простом примере.Допустим, в городе есть кофейня. Долгое время она работает с одним меню, а потом решает его обновить. После этого выручка растёт 🔥На первый взгляд всё ладно: хозяин доволен, цифры стали лучше.
Но если копнуть глубже, может оказаться, что выручка выросла только за счёт новых гостей, постоянные посетители стали приходить реже, а средний чек поднялся вместе с количеством жалоб 🤦♂️И тут открывается истинна: смотреть только на одну метрику опасно.Сам по себе рост выручки ещё не означает, что решение было верным.Вполне может статься, что сработал эффект новизны: пришли новые люди, им стало любопытно, а вот ядро аудитории начало отваливаться.А коли уходят постоянные посетители, для бизнеса это уже тревожный знак.Потому в A/B-тестах важно смотреть шире.Вот несколько вещей, которые действительно нужно проверять.
1️⃣ Не сломали ли вы что-то рядомЦелевая метрика может вырасти, но вместе с ней могут просесть соседние показатели: retention, качество пользователей, глубина использования продукта и другие важные метрики.Это как с машиной: можно сделать двигатель мощнее, и она поедет быстрее.Но ежели при этом она начнёт хуже тормозить, вряд ли такое улучшение можно назвать удачным.
2️⃣ Держится ли эффект во времениНа всё новое люди часто реагируют положительно.Просто потому, что это новое, непривычное и притягивает внимание.Например, вы сделали перестановку мебели в квартире. Первые несколько дней всё кажется свежим и занятным.Но потом проходит эффект новизны, и вы начинаете замечать, что жить удобнее не стало.С продуктом ровно та же история.Посему важно смотреть не только на первые дни после запуска изменений, но и на то, что происходит дальше.
3️⃣ Одинаков ли эффект для разных групп пользователейСредний результат по продукту может выглядеть хорошо.Но если разложить данные по сегментам, окажется, что рост был только у одной группы, а другой стало хуже.У новичков метрика выросла, а у старых пользователей просела.Именно поэтому полезно сегментировать результаты.На что обычно стоит смотреть:- Давность регистрации.- Уровень активности.- Пол и возраст.- Тип пользователя или род деятельности, если платформа это позволяет.Одна и та же функция может отлично зайти новичкам, но раздражать пользователей, которые давно привыкли к старому сценарию.Или наоборот: активные пользователи быстро увидят ценность изменения, а редкие вообще не заметят разницы.
Но и тут важно не переусердствовать ❗️Не стоит раскладывать данные на все возможные сто разрезов просто потому, что вы можете это сделать.Иначе анализ легко превращается в охоту за случайными совпадениями.Сегментация должна быть логичной и объяснимой.Если вы не можете словами обосновать, зачем смотрите именно этот разрез и что хотите в нём проверить, скорее всего, он вам не нужен.В итоге сильный анализ A/B-теста не сводится к выводу в духе
«метрика выросла, значит всё хорошо».Сильный анализ это ответ сразу на несколько вопросов:- у кого именно выросла метрика;- за счёт чего произошёл рост;- не сломали ли вы что-то рядом;и можно ли после этого раскатывать решение на весь продукт.Вот тогда тест и впрямь радует глаз, а не создаёт красивую иллюзию роста.
А у вас от слова A/B тесты трясутся поджилки, али наоборот воодушевление испытываете ? 👇#собесы
@data_dzen 🙂