Что такое А/Б тестирование и почему оно необходимо
A/B тестирование являет формат метод сопоставления нескольких либо дополнительных вариантов раздела, дизайна, сообщения, CTA-элемента, анкеты, рассылки, рекламного объявления либо иного онлайн объекта. Его цель заключается в этом, для того чтобы понять, какая версия лучше показывает себя при фактической аудитории. Взамен предположений и субъективных суждений применяется эксперимент среди настоящей посетителей, когда одна часть получает формат A, и тестовая — вариант B.
Такой метод позволяет формировать решения на результатах данных, а не индивидуальных предпочтений либо единичных выводов. Внутри аналитических материалах, включая 1 win, нередко отмечается, поскольку сплит эксперимент особо эффективно в ситуациях, где небольшие изменения способны сказываться по части действия аудитории: клики, оформления профилей, заполнение заявок, глубину сессии, лояльность, транзакции, подписки или иные нужные действия. Метод дает возможность увидеть, на самом деле ли изменение усиливает 1win результат.
Как работает А/Б тестирование
Логика А/Б эксперимента относительно понятен. На первом этапе выбирается элемент, который необходимо оценить. Таким элементом способен стать название, визуальный тон элемента действия, последовательность секций, сообщение сообщения, структура формы, картинка, тариф, формат оффера а также позиция целевого шага. Затем создаются минимум двух решения: первоначальный плюс обновленный. Затем подготовкой поток пользователей делится по версиями согласно до запуска определенным параметрам.
Контрольная доля посетителей сохраняет возможность просматривать первоначальную страницу, тогда как другая получает обновленную. Платформа накапливает показатели касательно поведении любой категории затем анализирует результаты. Когда решение B демонстрирует более высокий результат с учетом достаточном массиве данных, такой вариант можно внедрять. Если прироста нет а также новая версия функционирует слабее, корректировка отклоняется. Как раз в этом а также проявляется практическая польза эксперимента: он позволяет оценивать гипотезы до момента окончательного 1вин релиза.
Для чего необходимо A/B эксперимент
сплит проверка нужно с целью уменьшения неопределенности. Внутри веб продуктах включая незначительная правка может воздействовать на восприятие дизайна. Одиночный headline имеет шанс стать доступнее альтернативного, краткая форма имеет шанс проходиться чаще длинной, а намного более видимая CTA может усилить объем переходов. Если не использовать проверки такие решения обычно остаются предположениями.
Подход позволяет улучшать платформу поэтапно. Без необходимости крупной реконструкции полного проекта или аппа можно тестировать конкретные элементы и фиксировать фактический эффект. Такая логика снижает угрозу слабых решений, сберегает затраты плюс дает возможность формировать знания касательно действиях пользователей. Через периодом проект 1 win собирает не набор суждений, но систему подтвержденных подходов.
Какого типа объекты получается тестировать
Тестировать допустимо почти любой блок, который сказывается в отношении поведение аудитории. Обычно преимущественно оценивают названия, подзаголовки, обращения для переходу, тексты кнопок, поля создания профиля, позицию секций, картинки, блоки продуктов, последовательность действий, фильтры, меню, баннеры, подсказки, письма плюс промо креативы. Существенно, дабы выбранный объект был объединен с конкретной точной метрикой.
Если цель проявляется в повышении заполненных обращений, правильно проверять анкету, текст рядом с этого блока, объем элементов ввода и видимость кнопки. В случае если важно повысить длину сессии, имеет смысл тестировать навигацию, модули рекомендаций, связанные ссылки и структуру материала. Если точнее соотношение 1win в паре правкой плюс задачей, тем полезнее результат эксперимента.
Проверяемая идея как основа теста
Всякий корректный А/Б эксперимент начинается на основе проверяемой идеи. Предположение объясняет, какое именно правка предлагается, по какой причине такая правка имеет шанс повлиять в отношении показатель плюс какой результат может сдвинуться. Например, получается допустить, если уменьшение анкеты оформления аккаунта сократит объем отказов, поскольку ведь человеку будет необходимо меньший объем минут с целью выполнения действия.
Хорошая проверяемая идея не должна оставаться очень широкой. Идея вроде «сделать страницу удобнее» не помогает помогает оценить эффект. Более ценный формат: «если заменить длинный надпись CTA с помощью короткий и точный, число переходов вырастет, так как что именно ожидаемый результат станет понятнее». Эта гипотеза сразу же 1вин определяет объект эксперимента, основание и метрику.
Базовая а также измененная выборки
На уровне A/B тестировании контрольная аудитория видит первоначальный вариант, а проверочная — обновленный. Это разделение необходимо для объективного сопоставления. В случае если просто заменить версию и сравнить метрики перед и после изменения, итог имеет шанс стать неточным по причине сезонности, рекламной активности, изменения каналов трафика, информационного фона, служебных ошибок или других внешних условий.
Одновременный показ отличающихся вариантов снижает влияние внешних факторов. Обе аудитории оказываются в похожей среде: тот же а также же одинаковый отрезок, одинаковые самые каналы посещений, похожие устройства а также общий окружение. Следовательно различие в результатах с 1 win повышенной вероятностью связано в первую очередь с данным изменением, и не не только с сторонними факторами.
Какие метрики задействуются внутри А/Б экспериментах
Критерий — представляет собой показатель, согласно чему проверяется результат теста. Выбор показателя строится на основе задачи теста. Ради раздела с активной заявкой существенны передачи форм, для интернет-магазина — добавления к заказ а также транзакции, в случае медиаресурса — объем просмотра и период чтения, ради аппа — оформления профилей, активации, возвращаемость плюс повторные 1win действия.
Существенно различать главную и вспомогательные критерии. Главная демонстрирует, для какого результата запускается эксперимент. Вторичные помогают понять побочные результаты. К примеру, обновление CTA может повысить нажатия, но снизить результативность последующих событий. Следовательно полезно оценивать не исключительно исключительно по начальный клик, а также и в сторону следующее развитие: окончание формы, возвращения, уходы, сбои и итоговую ценность события.
Статистическая существенность
Математическая достоверность отражает, в какой степени вероятно, что полученная разница в паре версиями не является является статистическим шумом. Если конкретный вариант незначительно обходит другой вслед за пары десятков визитов, подобный итог еще не показывает выигрыш. В условиях небольшом массиве данных результат имеет шанс резко сдвинуться, после того как 1вин аудитория будет шире.
С целью надежного итога необходимо значительное число наблюдений. Если ниже предполагаемая отличие среди вариантами, тем самым больше сведений необходимо накопить. Если изменение должна улучшить результат всего на пару процентов, проверке потребуется значительно больше времени а также пользователей. Расчетная достоверность помогает избегать принимать преждевременные действия по основе нестабильных колебаний.
Масштаб выборки а также срок эксперимента
Масштаб аудитории воздействует в отношении качество результата. Если проверка охватывает очень ограниченный объем людей, результаты могут оказаться сомнительными. В частности, пять новых переходов внутри первой аудитории способны выглядеть как рост, при этом при крупном количестве будут обычной случайностью. Следовательно до момента запуском разумно понимать, какое количество людей 1 win а также действий потребуется с целью оценки предположения.
Срок проверки также получает значение. Слишком сжатый период проверки может не учитывать отличия между обычными а также выходными сутками, рабочей а также вечерней активностью, несколькими потоками трафика. Чаще всего проверка должен охватывать полный цикл действий посетителей. При этом слишком затянутый период проверки тоже неподходящ, если сторонние факторы могут существенно сдвинуться.
Почему опасно менять эксперимент в течение процесс запуска
Распространенная из частых проблем — вносить изменения в тест вслед за запуска. Когда в центре эксперимента изменить сообщение, сегмент, дизайн, правила вывода либо цель, данные смешаются. В таком случае станет непросто определить, какой фактор конкретно повлияло по части итог. Проверка снизит прозрачность, а результаты будут ненадежными 1win.
Перед старта нужно установить проверяемую идею, варианты, показатели, деление выборки а также условия остановки. Вслед за запуска правильнее не нужно менять условия при отсутствии важной основания. В случае если выявлена проблема на уровне запуске или технический дефект, лучше прервать эксперимент, исправить ошибку а также создать новый проверку, нежели пытаться анализировать смешанные данные.
Параллельное сравнение нескольких изменений
В отдельных случаях формируется желание проверить одновременно несколько изменений: обновленный headline, альтернативную кнопку, упрощенную форму и обновленный расположение блоков. Подобный метод может выдать итоговый показатель, при этом не покажет объяснит, какого типа точно блок воздействовал на метрику. В случае если обновленная страница победила, сохранится неочевидно, какая правка повлияло лучше прочего.
Для корректной проверки как правило корректируют один существенный фактор на 1вин одну проверку. В случае если требуется сопоставить несколько сочетаний, используется многофакторное тестирование. Такой метод сложнее, нуждается повышенного числа пользователей плюс аккуратной расшифровки. Ради основной части целей A/B проверка с одной понятной гипотезой обеспечивает намного более корректный плюс полезный эффект.
Примеры сплит тестирования на уровне UI
В дизайнах А/Б проверка нередко применяется для оптимизации доступности шагов. К примеру, можно сравнить несколько форматы формы: расширенную с большим количеством строк а также короткую с минимальным малым набором данных. Если упрощенная анкета увеличивает количество оконченных созданий аккаунтов без одновременного снижения результативности форм, ее допустимо оценивать более эффективной.
Следующий случай — тестирование формулировки кнопки. Сдержанная надпись имеет шанс быть не такой понятной, относительно конкретное объяснение результата. Кроме того тестируют позицию элементов действия, очередность смысловых разделов, подачу 1 win hint-элементов, наличие прогресс-бара, метод отображения предупреждений и количество этапов в сценарии. Любой подобный фактор воздействует в отношении то, насколько легко выполнить заданное действие.
A/B проверка на уровне содержании
Внутри содержании тестирование дает возможность понять, какие заголовки, описания, построения и типы лучше удерживают интерес. Получается сравнивать отличающиеся вступления, размер материала, логику объяснений, присутствие перечней, оформление карточек, описание преимуществ а также стиль раскрытия сложной информации. Однако при этом сценарии необходимо измерять не только лишь переходы, но и последующее поведение.
Headline способен усилить число переходов, однако если материал не будет соответствует интересам, повысится доля уходов. Поэтому контентные проверки нужны чтобы учитывать глубину взаимодействия: период просмотра, прокрутку, перемещения внутри сайта, возвраты а также завершение целевых действий. Качественный итог — представляет собой не исключительно привлечение интереса, а согласование ожидания и контента.
А/Б тестирование на уровне email-кампаниях
Внутри email-кампаниях обычно проверяют темы писем, подпись адресанта, начальные фразы, период рассылки, объем письма, позицию кнопок а также описания условий. Один сегмент получателей получает одну версию письма, часть — другую. Затем рассылкой сравниваются просмотры, нажатия, unsubscribes, жалобы а также дальнейшие события в пределах платформе.
Важно не стоит ограничиваться показателем открытий. Тема письма может стать заметной и привлекать реакцию, при этом когда тема не сможет совпадает наполнению, клики и уверенность способны снизиться. Поэтому полезный почтовый эксперимент оценивает всю последовательность: открытие, переход, поведение вслед за перехода плюс реакцию получателей касательно рассылку.
