Tanto si tienes una amplia experiencia con tu negocio online como si acabas de empezar, es muy probable que hayas visto innumerables artículos y recursos sobre pruebas A/B. Incluso es posible que ya las estés aplicando en tus campañas de email marketing o en tus publicaciones en las redes sociales.
Sin embargo, a pesar de que se ha hablado mucho sobre las pruebas A/B en el campo del marketing, se siguen cometiendo bastantes errores. ¿Cuál es el resultado? Decisiones empresariales importantes basadas en resultados inexactos de pruebas A/B mal ejecutadas.
Las pruebas A/B a menudo se simplifican demasiado, especialmente en los contenidos dirigidos a los vendedores online. Aquí encontrarás todo lo que necesitas saber para empezar con los diferentes tipos de pruebas A/B para ecommerce, explicado de la forma más sencilla posible. Las pruebas A/B pueden cambiar las reglas del juego a la hora de elegir el posicionamiento de producto adecuado, aumentar las conversiones en una landing page y mucho más.
¿Qué son las pruebas A/B?
Las pruebas A/B, también conocidas como split testing o pruebas divididas, son el proceso de comparar dos versiones de la misma página web, correo electrónico u otro recurso digital para determinar cuál funciona mejor en base al comportamiento del usuario.
Es una herramienta clave para mejorar el rendimiento de una campaña de marketing y entender qué versión tiene una mayor conversión con respecto a tu público objetivo.
Las pruebas A/B te permiten responder a preguntas cruciales para tu negocio, generar más ingresos a partir del tráfico que ya tienes y establecer una estrategia de marketing basada en datos.
¿Cómo hacer una prueba A/B?
- Define tu objetivo. Establece las metas de la prueba A/B, como aumentar la tasa de conversión, el número de clics o las ventas totales.
- Elige qué vas a probar. Puedes testear diferentes elementos como títulos, imágenes, asuntos de correos electrónicos, llamadas a la acción (CTAs), precios, diseños y más.
-
Crea las variaciones. Desarrolla dos versiones del mismo elemento:
- Versión A: la versión original de tu contenido, también conocida como "control".
- Versión B: la nueva versión con los cambios que quieres probar, llamada "variante".
En marketing, se muestra la Versión A al 50 % de los visitantes y la Versión B al otro 50 % para medir su rendimiento.
- Ejecuta la prueba. Muestra ambas versiones a grupos de usuarios durante un período determinado. Por ejemplo, si pruebas un botón de CTA en la página de inicio de una tienda online, podrías ejecutar la prueba durante dos semanas para obtener resultados estadísticamente significativos.
- Recopila los datos. Mide y analiza las conversiones, los clics, el nivel de interacción y las ventas en ambas versiones.
- Analiza los resultados. Compara el rendimiento de la Versión A y la Versión B para determinar cuál cumple mejor con tu objetivo. La versión con mayor tasa de conversión es la ganadora.
- Declara la versión ganadora. Si la Versión B tiene la mayor tasa de conversión, se convierte en la nueva versión principal y se muestra al 100 % de los visitantes. Esta versión se establece como nuevo "control", y se puede diseñar una nueva variante para futuras pruebas.
Importante: la tasa de conversión en las pruebas A/B no siempre es un indicador fiable del éxito.
Por ejemplo, si en una página el precio de un producto es de 50 euros y en otra es gratuito, los resultados no serán realmente útiles para la toma de decisiones.
Para que una prueba A/B aporte valor, es clave diseñarla con lógica, analizar métricas adicionales y asegurarse de que todas las variables sean comparables desde el inicio hasta la venta final.
¿Qué son las pruebas A/B/n?
Con las pruebas A/B/n, puedes testear más de una variante frente al control. Así, en lugar de mostrar al 50 % de los visitantes el control y al otro 50 % la variante, puedes presentar al 25 % de los visitantes el control, a un 25 % la primera variante, a otro 25 % la segunda variante y al último 25 % la tercera variante.
Nota: esto es diferente de las pruebas multivariantes, que también implican múltiples variantes. Cuando se realizan pruebas multivariantes, no solo se prueban variantes diferentes, sino que también se prueban múltiples elementos, como las pruebas A/B UX o el SEO split testing. El objetivo es averiguar qué combinación funciona mejor.

Para hacer tests multivariantes necesitarás una gran cantidad de tráfico en tu web, por lo que, si estás en una etapa inicial de tu negocio de momento puedes saltarte esta parte.
¿Cuánto tiempo deben durar las pruebas A/B?
Las pruebas A/B deben ejecutarse durante al menos un ciclo comercial completo y, preferiblemente, dos. No interrumpas la prueba solo porque hayas alcanzado significación estadística, también es fundamental llegar al tamaño de muestra predeterminado. Por último, asegúrate de que la prueba cubra al menos una semana completa para incluir todas las variaciones de tráfico.
¿Por qué dos ciclos económicos completos?
- Tiene en cuenta a los compradores que necesitan más tiempo para decidirse.
- Considera todas las fuentes de tráfico: Facebook, newsletter por correo electrónico, búsqueda orgánica, etc.
- Reduce el impacto de las anomalías. Por ejemplo, la newsletter de los viernes.
Dos ciclos comerciales suelen ser tiempo suficiente para obtener información valiosa sobre el comportamiento de los usuarios del público objetivo.
Si has utilizado algún tipo de herramienta de prueba A/B de landing page, es probable que hayas visto un indicador visual (el icono verde), que señala cuando una variante ha alcanzado ‘significación estadística’. Para muchos, esa es la señal universal de que “la prueba está cocinada, cancélala”, pero, como verás más adelante, el hecho de que se haya alcanzado la significación estadística en una prueba A/B no significa que debas detenerla.
¿Y el tamaño predeterminado de la muestra? No es tan intimidante como parece. Abre una calculadora de tamaño de muestra, como la de Evan Miller, para consultarla en tus páginas web y ayudarte a mejorar tus tasas de conversión.

Este cálculo indica que si tu tasa de conversión actual es del 5 % y quieres poder detectar un efecto del 15 %, necesitas una muestra de 13.533 por variación. Así que, en total, hacen falta más de 25.000 visitantes si se trata de una prueba A/B estándar.
Observa lo que ocurre si quieres detectar un efecto menor:

Lo único que ha cambiado es el Efecto Mínimo Detectable (MDE por sus siglas en inglés). Si el efecto mínimo detectable (MDE) se reduce del 15 % al 8 %, la muestra necesaria aumenta a 47.127 por variación. En total, necesitarás más de 100.000 visitantes para una prueba A/B estándar.
En las pruebas A/B, el tamaño de la muestra debe calcularse antes de iniciar el test, y no debe detenerse, incluso si alcanza significación estadística, hasta llegar al tamaño de muestra predeterminado. De lo contrario, los resultados no serán válidos.
Esta es la razón por la que no puedes hacer caso a algunos consejos como “parar después de 100 conversiones”.
También es importante realizar una prueba A/B dividida para incrementos de una semana completa. El tráfico varía según el día de la semana y la hora del día, por lo que las pruebas deben abarcar semanas completas (de lunes a domingo) para obtener resultados más fiables.
¿Por qué hacer pruebas A/B?
Imagina que gastas 100 euros en anuncios de Facebook para enviar a 10 personas a tu sitio web. El valor medio de los pedidos es de 25 euros. Ocho de esos visitantes se van sin comprar nada y los otros dos gastan 25 euros cada uno. ¿Cuál es el resultado? Has perdido 50 euros.
En el siguiente intento gastas igualmente 100 euros en anuncios de Facebook para enviar a 10 personas a tu sitio web. El valor medio del pedido sigue siendo de 25 euros. Esta vez, sin embargo, solo cinco de esos visitantes se van sin comprar nada y los otros cinco gastan 25 euros cada uno. ¿Cuál es el resultado? Ha ganado 25 euros.
Este es un ejemplo muy simplificado de pruebas A/B, pero sirve para comprender cómo al aumentar la tasa de conversión de tu ecommerce, has conseguido que el mismo tráfico sea más valioso.
Hacer pruebas A/B con fotografías de producto o textos también te permite descubrir ideas efectivas, tanto si la prueba gana como si pierde. Este aprendizaje es fácilmente aplicable a otras áreas. Por ejemplo, una idea de redacción de una prueba A/B sobre descripciones de productos podría ayudar a informar sobre la propuesta de valor, un vídeo de producto u otras descripciones.
Además, no se puede ignorar el valor de mantener una mejora continua en la eficacia de tu tienda online.
¿Siempre es necesario hacer pruebas A/B?
No siempre. Si tienes una página con poco tráfico o una aplicación web o móvil, tal vez las pruebas A/B no sean la opción más eficaz para ti. Es probable que consigas un mayor retorno de la inversión (ROI) realizando pruebas de usuario o hablando con tus clientes, por ejemplo.
A pesar de la creencia popular, la optimización de la tasa de conversión no se limita a las pruebas A/B.
Considera los datos de la calculadora de tamaño de muestra mencionada anteriormente: se requieren 47.127 visitantes por variación para detectar un efecto del 8 %, asumiendo que la tasa de conversión de referencia sea del 5 %. En otras palabras, si quieres probar una página de producto, debería recibir cerca de 100.000 visitantes en un periodo de dos a cuatro semanas.
¿Por qué de dos a cuatro semanas? Porque la prueba debe ejecutarse durante al menos dos ciclos comerciales completos para obtener resultados representativos. Tal vez pienses: "No hay problema, simplemente alargaré la prueba más allá de cuatro semanas para alcanzar el tamaño de muestra necesario". Eso tampoco es una solución efectiva.
Cuanto más tiempo se ejecute una prueba A/B, más susceptible será a las amenazas de validez externa y a la contaminación de la muestra. Por ejemplo, los visitantes podrían borrar sus cookies y entrar de nuevo en la prueba A/B como un nuevo visitante. O alguien podría cambiar de su teléfono móvil a su ordenador y ver una variación alternativa.
En esencia, dejar que las pruebas A/B se ejecuten durante demasiado tiempo es tan malo como no dejar que se ejecuten el tiempo suficiente.
La inversión en pruebas A/B merece la pena para las tiendas online que pueden alcanzar el tamaño de muestra necesario en dos o cuatro semanas. Las que no lo consigan deberían valorar otras formas de optimización hasta que aumente su tráfico.
Julia Starostenko, Product Manager en Pinterest, está de acuerdo y explica: “¡Experimentar es divertido! Pero es importante que te asegures de que los resultados son correctos”. “Pregúntate: ¿es tu público lo bastante amplio? ¿Has recopilado suficientes datos? Para lograr una verdadera significación estadística (dentro de un plazo razonable), el tamaño de la audiencia debe alcanzar un tamaño adecuado”.
¿Qué hay que medir en las pruebas A/B?
No existe una fórmula universal de elementos que deban testearse en una prueba A/B. Aunque sería útil contar con un listado de 99 ideas para hacer pruebas A/B de inmediato, muchas de esas sugerencias solo buscan generar clics.
La realidad es que las únicas pruebas que realmente aportan valor son aquellas basadas en datos propios. Nadie más que tú tiene acceso a la información específica de tu negocio o tus clientes, por lo que ninguna lista genérica puede garantizar resultados.
En su lugar, es recomendable responder a estas preguntas mediante un análisis cualitativo y cuantitativo. Algunos ejemplos comunes de pruebas A/B son:
Análisis técnico
¿Tu tienda online se carga correcta y rápidamente en todos los dispositivos y navegadores? Puede que en un iPhone de última generación funcione sin problemas, pero hay usuarios que todavía usan terminales de hace más de diez años, en los que tu web quizá no responde de forma tan fluida como debería y, consecuentemente, no convierte tanto como desearías.
Encuestas in situ
Se activan mientras los visitantes navegan por la tienda. Por ejemplo, una encuesta puede preguntar a los usuarios que llevan un tiempo en la misma página: "¿Hay algo que te impida completar tu compra hoy?". Si la respuesta es afirmativa, se les pide que especifiquen el motivo.
Con las respuestas obtenidas podrás formular hipótesis más precisas y realizar pruebas A/B realmente útiles.
Entrevistas con los clientes
No hay nada mejor que ponerse al teléfono y hablar con tus clientes. ¿Por qué eligieron tu tienda en lugar de las de la competencia? ¿Qué problema intentaban resolver cuando llegaron a tu página web? Hay un millón de preguntas que puedes hacer para saber quiénes son tus clientes y por qué te compran a ti.
Encuestas a clientes
Las encuestas a clientes son encuestas completas que se envían a personas que ya han realizado una compra (no a visitantes). Al diseñar una encuesta, debes centrarte en: definir a tus clientes, identificar sus problemas y dudas antes de comprar, así como recoger las palabras y frases que utilizan para describir tu ecommerce.
Herramientas de Análisis
¿Tus herramientas de análisis rastrean e informan de tus datos correctamente? Puede parecer una tontería, pero te sorprendería saber cuántas herramientas de análisis están mal configuradas. El análisis de analíticas consiste en averiguar cómo se comportan tus visitantes. Por ejemplo, puedes centrarte en el embudo. ¿Dónde están las mayores fugas del embudo de ventas? En otras palabras, ¿dónde hay más abandonos en este proceso? Ese es un buen lugar para empezar a hacer pruebas.
Pruebas de usuario
Consisten en observar a personas reales en un experimento controlado mientras intentan realizar acciones en la web. Por ejemplo, se les podría pedir que busquen un videojuego de entre 40 y 60 euros y lo añadan al carrito, narrando en voz alta su experiencia.
Repeticiones de sesión
Las repeticiones de sesión son similares a las pruebas de usuario, pero ahora se trata de personas reales con dinero real e intención real de comprar. Observarás cómo navegan por tu web los usuarios reales. ¿Qué les cuesta encontrar? ¿Dónde se sienten frustrados? ¿Dónde parecen confundidos?
Existen otras metodologías de investigación para las pruebas A/B, pero en este listado ya puedes empezar a elegir las que mejor se adapten a tu caso. Si repasas algunas de ellas, tendrás una enorme lista de variaciones basadas en datos que merece la pena probar. Esta lista te aportará mucho más valor que cualquier artículo de «99 cosas que probar ahora mismo».
Qué ideas priorizar en las pruebas A/B
Una lista enorme de propuestas para pruebas A/B es emocionante, pero no precisamente útil para decidir qué probar. ¿Por dónde empezar? Ahí es donde entra en juego la priorización.
Hay algunos marcos de priorización comunes que puede utilizar:
- ICE. Son las siglas en inglés de impacto, confianza y facilidad. Cada uno de estos factores recibe una puntuación del 1 al 10. Por ejemplo, si puedes realizar la prueba tú mismo sin la ayuda de un desarrollador o diseñador, podrías asignar un 8 a la facilidad. En este caso, se usa el criterio personal, por lo que, si varias personas realizan pruebas, las clasificaciones pueden volverse subjetivas. Es recomendable contar con directrices claras para mantener la objetividad.
- PIE. Significa potencial, importancia y facilidad. De nuevo, cada factor recibe una puntuación del 1 al 10. Por ejemplo, si la prueba afectará al 90 % de tu tráfico, podrías darle un 8 en importancia. Al igual que el marco ICE, este modelo también puede ser subjetivo, por lo que contar con criterios definidos ayuda a reducir sesgos.
- PXL. Es el marco de priorización más detallado y que permite tomar decisiones más objetivas. En lugar de basarse en tres factores, usa preguntas de Sí/No y una evaluación de facilidad de implementación. Por ejemplo, podría preguntar: "¿La prueba está diseñada para aumentar la motivación?" Si la respuesta es sí, obtiene 1 punto. Si la respuesta es no, obtiene 0 puntos.
Ahora ya tienes una idea de por dónde empezar y cómo categorizar tus propuestas. Además, durante una investigación sobre conversión también puedes utilizar estas tres categorías:
- Implementar. Se trata de cambios evidentes que no requieren pruebas. Simplemente aplícalos y evalúa su impacto.
- Investigar. Algunas ideas requieren más análisis antes de definir un problema o encontrar la mejor solución.
- Probar. La idea tiene respaldo en datos y es sólida, por lo que vale la pena testearla en una prueba A/B.
Con esta categorización y los marcos de priorización, ya puedes tomar decisiones estratégicas en tus pruebas A/B.
Estadísticas en las pruebas A/B: conceptos clave
Antes de realizar una prueba A/B, es importante profundizar en las estadísticas. Aunque no suele ser el tema más atractivo, conocer sus fundamentos es esencial para interpretar correctamente los resultados.
Afortunadamente, las herramientas de pruebas A/B y el software de split testing han simplificado gran parte del proceso. Sin embargo, tener un conocimiento básico sobre cómo funcionan los cálculos detrás de cada prueba te permitirá tomar mejores decisiones y evitar errores al analizar los datos.
Alex Birkett, antiguo Growth Marketing Manager en HubSpot y actual cofundador de Omniscient Digital, lo explica:
“La estadística no es un número mágico de conversiones ni una cuestión binaria de éxito o fracaso. Es un proceso que se utiliza para tomar decisiones en condiciones de incertidumbre y reducir el riesgo tratando de aclarar la confusión sobre cuál será el resultado de una decisión concreta”.
“Teniendo esto en cuenta, creo que lo más necesario es conocer los conceptos básicos: qué es una media, la varianza, el muestreo, la desviación estándar, la regresión a la media y qué constituye una muestra representativa. Además, cuando se empieza con las pruebas A/B, resulta útil establecer algunos límites o criterios específicos para mitigar en la medida de lo posible el error humano”.
¿Qué es la media?
La media es el promedio de un conjunto de datos. El objetivo es obtener una media que represente adecuadamente el total del grupo. Por ejemplo, si quieres calcular el precio medio de los videojuegos, no vas a sumar el precio de todos los videojuegos del mundo para dividirlo entre su cantidad total (porque es imposible). En su lugar, seleccionarás una muestra representativa de títulos que reflejen el mercado en general.
Podrías, por ejemplo, calcular la media a partir de una muestra de 200 videojuegos. Si la selección es representativa, el precio medio obtenido debería aproximarse al valor real del total de videojuegos en el mercado.
¿Qué es el muestreo?
Cuanto mayor sea el tamaño de la muestra, menor será la variabilidad, lo que significa que la media será más precisa.
Así, si aumentas la muestra de 200 a 2.000 videojuegos, la varianza se reducirá y la media reflejará con mayor exactitud el precio medio real.
¿Qué es la varianza?
La varianza mide cuánto varían los datos con respecto a la media. En términos simples, cuanto mayor sea la varianza, menos precisa será la media al predecir un valor individual dentro del conjunto de datos.
Al calcular la media del precio de los videojuegos, por ejemplo, la varianza indica cuánto fluctúan (o se alejan) los precios con respecto a ese valor medio.
¿Qué es la significación estadística?
La significación estadística indica la probabilidad de que una diferencia observada entre A y B sea producto de la casualidad en lugar de una verdadera diferencia.
Cuanto menor sea el nivel de significación estadística, mayor es la posibilidad de que la variante ganadora no lo sea realmente en términos absolutos.
En pocas palabras, un nivel de significación bajo implica una alta probabilidad de que el “ganador” no sea un verdadero ganador, lo que se conoce como falso positivo.
Muchas herramientas de pruebas A/B y software de código abierto determinan la significación estadística sin esperar a que se alcance un tamaño de muestra adecuado o un periodo de prueba suficiente. Por ello, es posible que una prueba A/B muestre resultados estadísticamente significativos en un momento y luego deje de hacerlo.
Peep Laja, fundador de CXL, enfatiza la importancia de comprender qué significa realmente la significación estadística de las pruebas A/B:
“La significación estadística no equivale a la validez, no es una regla de oro. Alcanzar una significación estadística del 95 % o superior tiene poca relevancia si no se cumplen otras dos condiciones más importantes:
- El tamaño de la muestra es adecuado, lo que se determina con calculadoras de tamaño de muestra. Es decir, han participado en el experimento las personas necesarias para obtener resultados concluyentes.
- El test ha durado el tiempo necesario para que la muestra sea representativa, sin extenderse demasiado para evitar la contaminación de los datos. En la mayoría de los casos, conviene realizar las pruebas A/B durante dos, tres o cuatro semanas, dependiendo de la rapidez con que se pueda reunir la muestra necesaria”.
¿Qué es la regresión a la media?
Al inicio de las pruebas A/B, es posible que observes fluctuaciones extremas en los resultados. La regresión a la media es un fenómeno estadístico que indica que, si un valor es extremo en una primera medición, es probable que en la siguiente medición se acerque más a la media.
Si realizas una prueba A/B únicamente porque has alcanzado significación estadística, podrías estar viendo un falso positivo. Aunque, con el tiempo, la variación ganadora terminará estabilizándose en torno a la media.
¿Qué es la potencia estadística?
Suponiendo que haya una diferencia entre A y B, ¿con qué frecuencia se detectará este efecto? Cuanto menor sea el nivel de potencia estadística, mayor será la probabilidad de que un ganador pase desapercibido (falso negativo). Por el contrario, un nivel de potencia más alto reduce el riesgo de no detectar un cambio significativo. En términos prácticos, la mayoría de las herramientas de pruebas A/B y los servicios de split testing utilizan un 80 % de potencia estadística como estándar.
Ton Wesseling, fundador de Online Dialogue, destaca la importancia de la potencia estadística: “Mucha gente se preocupa por los falsos positivos. A nosotros nos preocupan mucho más los falsos negativos. ¿Por qué realizar experimentos en los que las probabilidades de encontrar pruebas de que el cambio positivo tiene un impacto son realmente bajas?”
¿Qué son las amenazas a la validez externa?
Hay factores externos que amenazan la validez de las pruebas A/B. Por ejemplo:
- Las ventas del Black Friday y Cyber Monday (BFCM).
- Una mención en prensa positiva o negativa.
- El lanzamiento de una gran campaña de pago.
- El día de la semana.
- El cambio de estación.
Uno de los ejemplos más comunes de pruebas A/B en el que las amenazas a la validez externa afectan a los resultados es durante los eventos estacionales. Supongamos que realizas una prueba A/B en diciembre. Los días festivos importantes significarán un aumento del tráfico en tu tienda durante ese mes. Aunque es posible que en enero descubras que tu ganador de diciembre ya no rinde bien.
¿Por qué? Por una amenaza de validez externa: las vacaciones. Los datos en los que se basó tu decisión de prueba eran una anomalía. Cuando las cosas se calmen en enero, puede que te sorprendas al ver que el ganador está perdiendo.
No puedes eliminar las amenazas de validez externa, pero puedes mitigarlas realizando pruebas durante semanas completas (por ejemplo, no empieces una prueba un lunes y la termines un viernes), incluyendo diferentes tipos de tráfico (no pruebes solo con tráfico de pago y luego apliques los resultados a todas las fuentes) y siendo consciente de las amenazas potenciales.
Cómo configurar una prueba A/B
Antes de hacer cualquier prueba, necesitas una hipótesis bien fundamentada. (Sí, primero matemáticas y ahora ciencia, pero será sencillo).
Por ejemplo: “Si reduzco los costes de envío, las tasas de conversión aumentarán”.
Aunque lo parezca, no es complicado. Básicamente, necesitas probar una hipótesis, no solo una idea. Una hipótesis debe ser medible, abordar un problema específico de conversión y basarse en datos en lugar de suposiciones.
Para escribir una hipótesis puedes utilizar una fórmula prestada del Kit de Hipótesis de Craig Sullivan:
- Dado que observas [insertar datos/retroalimentación de la investigación]
- Esperas que [cambio que estás probando] cause [impacto que anticipas]
- Lo medirás utilizando [métrica de datos].
Fácil, ¿verdad? Todo lo que tienes que hacer es rellenar los espacios en blanco y tu idea de prueba A/B se habrá transformado en una hipótesis válida.
Elige una herramienta de pruebas A/B
A la hora de escoger una herramienta de pruebas A/B, casi todo el mundo piensa en primer lugar en Optimizely y VWO. Google Optimize también ha sido muy popular, pero ya no está disponible. Ahora, para realizar pruebas A/B en Google Analytics, es necesario integrar una herramienta de terceros.
En cambio, estas dos opciones siguen siendo efectivas y seguras:
- Optimizely: facilita la implementación de pruebas menores sin necesidad de amplios conocimientos técnicos. Su herramienta Stats Engine simplifica el análisis de resultados. Por contra, es la alternativa más costosa.
- VWO: ofrece SmartStats para facilitar el análisis y cuenta con un editor WYSIWYG adecuado para principiantes. Sus planes incluyen funcionalidades adicionales como mapas de calor, encuestas in situ y análisis de formularios.
También encontrarás algunas herramientas de pruebas A/B en la Shopify App Store que pueden serte útiles.
Una vez que selecciones la herramienta adecuada, sigue el proceso de registro e instalación según las instrucciones proporcionadas por el proveedor. Esto suele implicar añadir un fragmento de código a tu sitio web y definir los objetivos de las pruebas A/B.
Decide cómo analizar los resultados de las pruebas A/B
Si elaboras tu hipótesis correctamente, incluso una prueba A/B que no haya tenido éxito puede aportar información valiosa para futuras pruebas A/B y otras áreas de tu negocio. Al analizar los resultados, es fundamental centrarse en los conocimientos obtenidos, en lugar de enfocarse únicamente en conceptos como “ganador” o “perdedor”.
Siempre hay algo que aprender y analizar, así que no descartes los resultados que no sean los esperados.
El aspecto más importante a tener en cuenta es la segmentación. Una prueba A/B puede no haber sido efectiva de manera global, pero es probable que haya funcionado bien en al menos un segmento de tu audiencia.
Algunos ejemplos de segmentos son los visitantes:
- Nuevos
- Recurrentes
- De iOS
- De Android
- De Chrome
- De Safari
- De escritorio
- De tablets
- De búsqueda orgánica
- De pago
- De redes sociales
- Compradores registrados
Lo más probable es que la hipótesis se haya demostrado correcta en ciertos segmentos. Esto también es información relevante. El análisis va mucho más allá de determinar si la prueba A/B fue ganadora o perdedora. Segmenta los datos para encontrar información oculta que pueda revelar patrones clave.
Las herramientas de pruebas A/B no realizan este análisis automáticamente, por lo que es una habilidad importante que debe desarrollarse con el tiempo.
Archiva los resultados de tus pruebas A/B
Supongamos que mañana haces tu primera prueba A/B. Dentro de dos años, ¿recordarás todos los detalles? Casi seguro que no.
Por eso es importante archivar los resultados de las pruebas A/B. Sin un registro bien organizado, toda la información obtenida se perderá. Además, es fácil terminar probando lo mismo dos veces si no se lleva un control adecuado.
Sin embargo, no hay una única forma correcta de hacerlo. Puedes utilizar una herramienta como Effective Experiments o Excel. Depende de ti, sobre todo si estás empezando. Solo asegúrate de llevar un registro de:
- La hipótesis.
- Capturas de pantalla de la versión de control y la variación.
- Si la prueba A/B resultó ganadora o no.
- La información obtenida del análisis
A medida que tu negocio crezca, te alegrarás de haber mantenido este archivo. No solo te será útil a ti, sino también a nuevos empleados, asesores y otras partes interesadas.
Los procesos de pruebas A/B de los profesionales
Ahora que ya conoces a fondo cómo funcionan las pruebas A/B, echa un vistazo a los procesos que siguen los profesionales expertos.
Krista Seiden, KS Digital
Mi proceso paso a paso para las pruebas A/B de aplicaciones y páginas web comienza con el análisis; en mi opinión, este es el elemento central de cualquier buen programa de pruebas. Durante esta etapa, el objetivo es examinar datos analíticos, encuestas, información de UX u otras fuentes de conocimiento del cliente para identificar oportunidades de optimización.
Una vez recopiladas suficientes ideas en la fase de análisis, el siguiente paso es formular hipótesis sobre qué podría estar fallando y cómo se podrían mejorar o corregir esas áreas.
A continuación, es hora de construir y ejecutar las pruebas A/B. Asegúrate de ejecutarlas durante un periodo de tiempo razonable (yo suelo hacerlo durante dos semanas para asegurarme de que tengo en cuenta los cambios o anomalías semanales) y, cuando tengas suficientes datos, analiza los resultados para determinar qué variante ha funcionado mejor.
También es fundamental analizar las variaciones que no han dado buenos resultados y ver qué puedes aprender de ellas.
Por último, y puede que solo llegues a esta fase una vez que hayas dedicado tiempo a sentar las bases de un programa de optimización sólido, es el momento de considerar la personalización. Esto no requiere necesariamente un conjunto de herramientas sofisticadas, sino que surge de los datos que tienes sobre tus usuarios.
La personalización del marketing puede ser tan sencilla como dirigir el contenido adecuado a las ubicaciones correctas o tan compleja como basarse en las acciones individuales de los usuarios. Pero no te lances de golpe a esta fase final. Asegúrate de que dedicas primero el tiempo suficiente a conocer bien los aspectos básicos.
Alex Birkett, Omniscient Digital
A grandes rasgos, intento seguir este proceso:
- Recopilar datos y asegurarme de que las implementaciones analíticas son precisas.
- Analizar los datos y encontrar información relevante.
- Convertir los hallazgos en hipótesis.
- Priorizar en función del impacto y la facilidad, maximizando la asignación de recursos (especialmente los técnicos).
- Ejecutar una prueba A/B (siguiendo las mejores prácticas estadísticas en la medida de mis conocimientos y capacidad).
- Analizar los resultados e implementar o descartar los cambios según los hallazgos.
- Ajustar en función de los resultados y repetir.
En pocas palabras: investigar, probar, analizar y repetir.
Estos pasos, que pueden ajustarse según el contexto (¿estoy probando una característica crítica del producto? ¿Una llamada a la acción (CTA) en un artículo de blog? ¿Cuál es el perfil de riesgo y el equilibrio entre innovación y mitigación de riesgos?), son aplicables a empresas de cualquier tamaño o sector.
La cuestión es que se trata de un proceso ágil, pero que también recopila suficientes datos, tanto cualitativos como analíticos, para poder crear mejores hipótesis de pruebas A/B y priorizarlas con más precisión, de modo que puedas atraer más tráfico a tu tienda online.
Ton Wesseling, Online Dialogue
La primera pregunta a la que siempre respondemos cuando queremos optimizar el recorrido de un cliente es: ¿dónde encaja este producto o servicio en el modelo ROAR (riesgo, optimización, automatización y replanteamiento) que creamos en Online Dialogue? ¿Se encuentra todavía en la fase de riesgo, en la que podríamos investigar mucho, pero no podemos validar nuestras conclusiones mediante pruebas A/B (por debajo de 1.000 conversiones al mes), o se encuentra en la fase de optimización? ¿O incluso por encima?
- Fase de riesgo: mucha investigación, que se traducirá en cualquier cosa, desde un ajuste en el modelo de negocio hasta un rediseño completo de la propuesta de valor.
- Fase de optimización: grandes experimentos para mejorar la propuesta de valor y el modelo de negocio, así como pequeños experimentos para validar hipótesis sobre el comportamiento de los usuarios, acumulando conocimientos para futuras modificaciones de mayor escala.
- Automatización: si todavía hay margen de experimentación (visitantes disponibles), significa que no se necesita todo el potencial de pruebas A/B para validar el recorrido del usuario. Lo que queda debe aprovecharse para acelerar el crecimiento de inmediato, sin enfocarse en aprendizajes a largo plazo. Esto podría automatizarse mediante métodos como multi-armed bandits o algoritmos de aprendizaje automático.
- Replanteamiento: se dejan de realizar muchas investigaciones, salvo que se aplique un cambio significativo en el enfoque o en el modelo de negocio.
Así que las pruebas A/B en la web o la aplicación solo son importantes en la fase de optimización de ROAR y más allá (hasta que se replantee).
La investigación que realizamos se basa en nuestro Modelo 5V:
Reunimos todos estos datos para desarrollar una hipótesis principal basada en la investigación, que dará lugar a subhipótesis. Estas se priorizan según los datos recopilados mediante pruebas A/B en dispositivos móviles o de escritorio. Cuanto mayor sea la probabilidad de que una hipótesis sea cierta, más alta será su clasificación.
Una vez que determinamos si la hipótesis es cierta o falsa, podemos empezar a combinar los aprendizajes y dar pasos más grandes, rediseñando o ajustando partes más amplias del recorrido del cliente. Sin embargo, en algún punto, todas las optimizaciones alcanzarán un pico de optimización local. Entonces hay que dar un paso todavía más grande para poder alcanzar un máximo global potencial.
Y, por supuesto, los aprendizajes clave se difundirán por toda la empresa, lo que impulsará nuevas optimizaciones e innovaciones basadas en conocimientos validados de primera mano.
Julia Starostenko, Pinterest
El propósito de las pruebas A/B es comprobar si realizar determinados cambios en una página web tendrá un impacto positivo en el negocio.
Antes de empezar, es importante determinar si es realmente necesario realizar una prueba A/B. Plantéate el siguiente escenario: hay un botón con una tasa de clics extremadamente baja. Sería casi imposible empeorar el rendimiento de este botón. Por lo tanto, no es necesario validar la eficacia de un cambio propuesto en el botón (es decir, realizar un experimento).
Del mismo modo, si el cambio sugerido en el botón es pequeño, probablemente no merezca la pena dedicar tiempo a preparar, ejecutar y cerrar una prueba A/B. En este caso, los cambios deberían aplicarse a todos los usuarios y se podría supervisar el rendimiento del botón.
Si se determina que realizar una prueba A/B sería beneficioso, el siguiente paso es definir las métricas de negocio que deberían mejorarse (por ejemplo, aumentar la tasa de conversión de un botón). A continuación, nos aseguramos de que se recopilan los datos adecuados.
Una vez hecho esto, se realiza una asignación aleatoria del público, dividiéndolo en dos grupos: a un grupo se le muestra la versión existente del botón, mientras que el otro recibe la nueva versión. Se controla la tasa de conversión de cada público y, una vez alcanzada la significación estadística, se determinan los resultados de la prueba A/B.
Peep Laja, CXL
Las pruebas A/B forman parte de un proceso más amplio de optimización de la conversión. En mi opinión, se trata en un 80 % de la investigación y solo en un 20 % de las pruebas A/B. La investigación de la conversión te ayudará a determinar por dónde empezar.
Mi proceso suele ser el siguiente (un resumen simplificado):
- Lleva a cabo la investigación de conversión utilizando un marco como ResearchXL para identificar los problemas en el sitio.
- Elige un problema de alta prioridad (uno que afecte a una gran parte de los usuarios y sea un problema grave), y haz una lluvia de ideas con tantas soluciones como puedas para este problema. Apoya tu proceso de ideación con los resultados de la investigación sobre la conversión.
- Determina en qué dispositivo quieres realizar la prueba A/B (el test para móviles debe realizarse separado del de ordenadores de escritorio). Calcula cuántas variaciones puedes probar (en función de tu nivel de tráfico/transacciones) y, a continuación, elige las dos mejores ideas de solución para probarlas contra el control.
- Crea un wireframe con los tratamientos exactos (escribe el texto, realiza los cambios de diseño, etc.) Dependiendo del alcance de los cambios, puede que también necesites incluir a un diseñador para que elabore los nuevos elementos.
- Pide a tu desarrollador front-end que implemente los tratamientos en tu herramienta de pruebas. Configura las integraciones necesarias (Google Analytics) y establece los objetivos adecuados.
- Realiza el aseguramiento de la calidad (QA) de la prueba A/B (los tests con errores son, con diferencia, el mayor obstáculo para obtener resultados precisos) y asegúrate de que funciona con cada combinación de navegador/dispositivo.
- Lanza la prueba A/B.
- Una vez finalizada la prueba A/B, realiza un análisis posterior.
- En función del resultado, implementa el ganador, repite los tratamientos o testea otra cosa.
Optimiza las pruebas A/B para tu empresa
Tienes el proceso, ¡tienes el poder! Así que, sal ahí fuera, consigue el mejor software de pruebas A/B y empieza a testear tu tienda online. Antes de que te des cuenta, esos conocimientos se traducirán en más ventas y beneficios.
Si quieres seguir aprendiendo sobre optimización, plantéate hacer un curso gratuito, como el de Introducción a las pruebas A/B de Udacity (en inglés). Aprenderás sobre pruebas A/B en aplicaciones web y móviles, lo que te ayudará a perfeccionar tus habilidades de optimización.
Más información
- Cómo preparar tu tienda virtual para la temporada navideña
- Haz tu venta de garaje en tu tienda online
- Caso de éxito- Empieza una nueva etapa como emprendedor iniciando tu tienda virtual
- 3 elementos que los clientes esperan de una marca
- Utiliza las opiniones de tus clientes para impulsar las ventas de tu tienda virtual
- Tips sobre el comercio electrónico- Aprende de los Expertos de Shopify
- Cuenta regresiva para lanzar tu negocio de comercio electrónico
- 7 acciones efectivas para captar leads online
- 5 reglas para elegir un nombre de dominio memorable
Preguntas frecuentes sobre las pruebas A/B
¿Qué son las pruebas A/B?
En términos generales, las pruebas A/B consisten en probar dos versiones de algo para ver cuál funciona mejor. Puedes hacer pruebas A/B en una variedad de elementos relacionados con tu negocio, incluyendo publicaciones en redes sociales, contenidos, correo electrónico y páginas de productos.
¿Qué ejemplos de pruebas A/B existen?
Un ejemplo de pruebas A/B sería dirigir tráfico de pago a dos páginas de producto ligeramente diferentes para ver cuál de ellas tiene la tasa de conversión más alta. Para garantizar que las pruebas A/B proporcionan información de valor, se recomienda tener un tráfico de más de 5.000 visitantes en las páginas que se estudian.
¿Por qué debería hacer pruebas A/B?
La razón principal para hacer pruebas A/B es aumentar la tasa de conversión de tu tienda online. Con un testeo adecuado, conseguirás que el mismo tráfico que llega a tu ecommerce sea más valioso. Además, estas pruebas A/B también te sirven para hacer una mejora continua de tu tienda online, aumentar su eficacia, optimizar sus contenidos, actualizar su diseño, etc.
¿Qué elementos de tu tienda online puedes someter a pruebas A/B?
Existen una gran variedad de elementos que puedes someter a pruebas A/B. Entre los más habituales y útiles, sobre todo si son test iniciales, se encuentran las siguientes opciones:
- Elementos visuales, como imágenes de productos, vídeos, botones de CTA o diseño de la web.
- Elementos de copywriting, como los títulos, subtítulos, las descripciones de los productos, los textos de los CTA, los correos de email marketing y las newsletters.
- Elementos técnicos, como los procesos de pago, los formularios, las opciones de envío o los precios.
- Elementos externos, como los testimonios de clientes, las publicaciones en distintas redes sociales o las acciones publicitarias y de influencers.