Nội dung chính
- 1 Что именно такое сплит эксперимент плюс зачем оно используется
- 1.1 По какому принципу функционирует A/B тестирование
- 1.2 Для чего необходимо А/Б тестирование
- 1.3 Какие объекты допустимо тестировать
- 1.4 Проверяемая идея в качестве фундамент эксперимента
- 1.5 Базовая плюс тестовая выборки
- 1.6 Какие именно метрики применяются внутри A/B экспериментах
- 1.7 Расчетная существенность
- 1.8 Объем аудитории и срок теста
- 1.9 По какой причине не стоит менять эксперимент в течение период проведения
- 1.10 Синхронное тестирование нескольких правок
- 1.11 Варианты A/B экспериментов на уровне UI
- 1.12 А/Б проверка в содержании
- 1.13 А/Б тестирование внутри почтовых рассылках
Что именно такое сплит эксперимент плюс зачем оно используется
сплит эксперимент составляет собой способ проверки нескольких либо разных решений раздела, экрана, текста, кнопки, поля ввода, письма, промо сообщения либо другого онлайн элемента. Главная задача заключается в том задаче, дабы определить, какая вариант эффективнее функционирует на фактической аудитории. Без опоры на гипотез без проверки а также субъективных мнений используется эксперимент среди живой посетителей, когда первая доля просматривает версию A, тогда как тестовая — формат B.
Этот метод позволяет принимать действия на основе показателей, вместо этого не личных вкусов либо единичных наблюдений. В аналитических источниках, в том числе 1win, нередко указывается, что сплит эксперимент особо ценно в ситуациях, где небольшие корректировки имеют шанс сказываться по части действия посетителей: переходы, регистрации, заполнение форм, длину просмотра, лояльность, транзакции, подписки а также прочие целевые результаты. Подход дает возможность проверить, реально ли конкретно изменение улучшает 1win эффект.
По какому принципу функционирует A/B тестирование
Принцип А/Б проверки довольно несложен. Сначала определяется блок, какой требуется проверить. Это способен стать название, визуальный тон кнопки, последовательность секций, сообщение подсказки, построение формы, изображение, цена, вариант предложения а также позиция целевого действия. Далее формируются как минимум пары версии: первоначальный а также тестовый. Затем этим поток пользователей распределяется между ними на основе заранее заданным правилам.
Контрольная группа пользователей сохраняет возможность просматривать старую страницу, а другая видит новую. Инструмент собирает данные о поведении каждой части затем анализирует метрики. В случае если решение B показывает более высокий показатель при нужном объеме данных, эту версию получается использовать. Когда прироста не видно а также новая страница показывает себя слабее, корректировка отклоняется. Именно в таком подходе как раз проявляется практическая значимость эксперимента: он позволяет тестировать гипотезы перед полного 1вин запуска.
Для чего необходимо А/Б тестирование
А/Б проверка необходимо с целью сокращения сомнений. На уровне онлайн продуктах включая малая деталь может сказываться в отношении восприятие интерфейса. Конкретный текстовый блок может стать яснее иного, сжатая анкета способна заполняться активнее длинной, при этом заметно более выразительная кнопка действия может повысить объем кликов. При отсутствии эксперимента эти выводы нередко выглядят догадками.
Подход позволяет развивать платформу поэтапно. Взамен масштабной реконструкции всего проекта а также аппа допустимо тестировать конкретные элементы плюс записывать фактический результат. Это уменьшает угрозу неудачных решений, сокращает расход время и средства плюс позволяет формировать понимание о реакциях аудитории. С течением накоплением тестов команда 1 win собирает не просто совокупность суждений, но базу проверенных решений.
Какие объекты допустимо тестировать
Сравнивать получается почти каждый блок, что сказывается на реакции посетителя. Обычно всего тестируют названия, разделы, обращения на переходу, формулировки кнопок, формы создания профиля, место секций, изображения, страницы позиций, порядок шагов, фильтры, список разделов, визуальные блоки, сообщения, письма и маркетинговые объявления. Важно, для того чтобы выбранный блок оставался связан с определенной заданной целью.
Когда задача проявляется в процессе росте заполненных обращений, правильно проверять анкету, сообщение возле этого блока, число полей а также выразительность элемента действия. Если необходимо повысить длину просмотра, имеет смысл тестировать меню, секций рекомендаций, связанные ссылки а также построение раздела. Насколько прямее связь 1win в паре правкой а также целью, настолько информативнее результат тестирования.
Проверяемая идея в качестве фундамент эксперимента
Любой корректный A/B тест стартует от предположения. Проверяемая идея формулирует, какого типа решение рассматривается, почему такая правка имеет шанс сказаться по части эффект а также какой именно показатель может измениться. К примеру, получается предположить, будто упрощение анкеты создания профиля снизит количество отказов, так как что посетителю будет необходимо меньше минут ради окончания шага.
Качественная гипотеза не должна оставаться слишком размытой. Идея типа «улучшить раздел удобнее» не позволяет позволяет зафиксировать эффект. Гораздо более точный пример: «когда поменять объемный надпись кнопки на более короткий а также понятный, количество нажатий увеличится, потому что именно действие станет яснее». Подобная идея сразу же 1вин указывает элемент проверки, основание плюс критерий.
Базовая плюс тестовая выборки
В А/Б тестировании контрольная аудитория просматривает исходный вариант, а проверочная — новый. Подобное деление важно с целью корректного анализа. Когда только заменить версию а также оценить показатели до изменения плюс после, итог имеет шанс стать неточным по причине сезонности, маркетинговой активности, смены каналов трафика, новостей, системных сбоев а также других окружающих причин.
Параллельный показ разных решений уменьшает воздействие случайных обстоятельств. Две аудитории находятся в похожей ситуации: единый плюс самый же срок, те же источники посещений, похожие платформы и единый фон. Следовательно различие внутри показателях с большей 1 win большей долей уверенности соотносится как раз с данным изменением, и не не с посторонними случайными факторами.
Какие именно метрики применяются внутри A/B экспериментах
Показатель — это показатель, на основе которого измеряется итог проверки. Определение критерия строится с учетом задачи эксперимента. Ради раздела с размещенной анкетой значимы передачи форм, для торговой площадки — добавления к корзину а также покупки, ради медиа — глубина просмотра и период чтения, в случае аппа — оформления профилей, активации, удержание а также следующие 1win события.
Важно разграничивать основную а также дополнительные показатели. Главная отражает, зачем какого результата делается эксперимент. Дополнительные дают возможность оценить побочные последствия. К примеру, правка CTA может усилить клики, при этом снизить ценность дальнейших событий. Поэтому полезно анализировать не исключительно только на первый шаг, однако еще на последующее действие: завершение формы, повторные визиты, выходы, сбои а также суммарную эффективность события.
Расчетная существенность
Математическая достоверность демонстрирует, в какой степени вероятно, поскольку наблюдаемая отличие в паре решениями не оказывается статистическим шумом. Когда первый решение немного обходит второй вслед за нескольких десятков посещений, это все еще не означает преимущество. На фоне небольшом объеме данных итог имеет шанс быстро сдвинуться, когда 1вин выборка окажется шире.
Для достоверного заключения нужно нужное количество данных. Насколько меньше ожидаемая отличие среди вариантами, настолько больше наблюдений нужно собрать. В случае если правка должно улучшить метрику только около малое число процентов, эксперименту будет необходимо значительно больше срока и посещений. Математическая достоверность помогает не делать формировать поспешные выводы по основе случайных колебаний.
Объем аудитории и срок теста
Объем выборки сказывается на достоверность итога. В случае если эксперимент получает слишком небольшое число посетителей, заключения имеют шанс стать ненадежными. В частности, несколько новых кликов у конкретной аудитории имеют шанс выглядеть словно прирост, но на значительном масштабе станут простой погрешностью. Поэтому до старта полезно понимать, сколько пользователей 1 win или действий необходимо для проверки гипотезы.
Срок теста тоже имеет значение. Очень сжатый период проверки способен не отражать отличия в паре обычными и праздничными сутками, дневной по времени плюс вечерней реакцией, несколькими источниками пользователей. Как правило тест должен захватывать полный период поведения пользователей. Вместе с этом условии очень долгий тест равно неоптимален, когда внешние факторы начинают заметно измениться.
По какой причине не стоит менять эксперимент в течение период проведения
Одна из среди типичных проблем — добавлять правки по ходу эксперимент вслед за старта. В случае если по ходу процессе проверки изменить текст, аудиторию, дизайн, условия демонстрации или задачу, данные станут неоднородными. Тогда окажется трудно понять, какой фактор точно повлияло по части результат. Проверка снизит прозрачность, при этом результаты станут спорными 1win.
До начала следует определить предположение, версии, показатели, распределение выборки и критерии завершения. После начала правильнее не стоит менять условия при отсутствии серьезной необходимости. В случае если найдена неточность на уровне запуске либо системный сбой, лучше закрыть проверку, исправить ошибку и создать новый эксперимент, чем стараться интерпретировать смешанные показатели.
Синхронное тестирование нескольких правок
В отдельных случаях формируется желание оценить сразу несколько решений: другой текстовый блок, альтернативную CTA, сокращенную анкету а также измененный порядок блоков. Такой метод способен показать итоговый результат, однако не объяснит, какой конкретно фактор сказался по части метрику. Когда новая страница выиграла, сохранится неочевидно, что сработало сильнее всего.
Для точной оценки обычно корректируют отдельный важный элемент в 1вин одну проверку. Когда необходимо проверить несколько комбинаций, применяется многофакторное эксперимент. Такой метод труднее, требует значительного трафика и корректной расшифровки. Ради большинства целей сплит проверка с одной единственной точной идеей дает гораздо более понятный а также полезный эффект.
Варианты A/B экспериментов на уровне UI
Внутри дизайнах сплит эксперимент часто задействуется для оптимизации ясности шагов. В частности, получается проверить две вариации формы: расширенную с полным количеством строк а также краткую с минимальным числом полей. Когда короткая анкета увеличивает объем завершенных созданий аккаунтов без одновременного ухудшения результативности заявок, ее допустимо признавать намного более результативной.
Следующий сценарий — тестирование формулировки кнопки. Общая надпись способна оказаться менее очевидной, относительно конкретное объяснение шага. Кроме того проверяют позицию кнопок, порядок смысловых секций, оформление 1 win подсказок, наличие прогресс-бара, формат вывода сбоев плюс количество шагов в пути. Каждый этот объект сказывается по части то, как просто завершить заданное шаг.
А/Б проверка в содержании
Внутри контенте тестирование дает возможность выяснить, какие названия, описания, построения а также варианты лучше привлекают интерес. Получается проверять разные первые абзацы, объем контента, логику доводов, присутствие списков, оформление блоков, представление плюсов или манеру раскрытия непростой задачи. Однако при таком подходе необходимо измерять не исключительно лишь клики, однако еще последующее поведение.
Название имеет шанс увеличить количество нажатий, но в случае если контент не совпадает запросам, повысится часть отказов. Поэтому текстовые проверки обязаны анализировать глубину контакта: длительность изучения, скролл, клики на уровне ресурса, возвраты а также выполнение нужных результатов. Хороший эффект — является не исключительно получение клика, а совпадение ожидания и материала.
А/Б тестирование внутри почтовых рассылках
На уровне email-рассылках обычно сравнивают subject-строки писем, имя адресанта, первые предложения, время доставки, длину сообщения, позицию кнопок и формулировки условий. Одна часть аудитории получает контрольную вариацию email, другая часть — вторую. Вслед за этого анализируются open rate, переходы, отказы от подписки, жалобы и дальнейшие действия внутри сайте.
Важно не нужно останавливаться метрикой открытий. Тема рассылки способна стать выразительной плюс получать реакцию, но в случае если она не сможет соответствует наполнению, нажатия плюс лояльность способны ослабнуть. Из-за этого качественный email-тест оценивает полную последовательность: просмотр, переход, активность после клика и реакцию аудитории на письмо.