Saltar al contenido principal
Loading...
Skip to article
  • Customer Experience
    Customer Experience
  • Employee Experience
    Employee Experience
  • Brand Experience
    Brand Experience
  • Core XM
    Core XM
  • Design XM
    Design XM

Regresión e importancia relativa


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


Acerca de la regresión y la importancia relativa

Regresión le muestra cómo varias variables de entrada juntas afectan a una variable de salida. Por ejemplo, si las entradas “Años como cliente” y “Tamaño de la empresa” están correlacionadas con la salida “Satisfacción” y entre sí, podría utilizar la regresión para averiguar cuál de las dos entradas era más importante para crear “Satisfacción”.El

análisis de importancia relativa es el método recomendado para la regresión de los datos de la encuesta y el resultado predeterminado de las regresiones realizadas en Stats iQ. Importancia relativa es una extensión moderna de la regresión que da cuenta de situaciones en las que las variables de entrada están correlacionadas entre sí, un problema muy común en la investigación de encuestas (conocido como “multicolinealidad”). La importancia relativa también se conoce como los pesos relativos de Johnson, es una variación del análisis de Shapley, y está estrechamente relacionado con el análisis de dominancia.

A continuación encontrará instrucciones sobre cómo configurar una regresión en Stats iQ. Para obtener más orientación sobre la reflexión a través de las partes analíticas del análisis de regresión, consulte las siguientes páginas:

Consejo Q: Ahora hay información sobre herramientas útil en la plataforma Stats iQ. Mientras trabaja en Stats iQ, puede hacer clic en los iconos i que aparecen en toda la plataforma para obtener información y definiciones adicionales.
Flecha que apunta a la quick info junto al título de importancia relativa en el gráfico
Consejo Q: Es posible que tenga hasta 750 tarjetas en su área de trabajo. Si alcanza este límite, aparecerá un error cuando intente crear una tarjeta nueva, advirtiéndole de que se eliminarán las tarjetas más antiguas.

 

Para la regresión lineal, la importancia relativa en Stats iQ sigue las técnicas descritas en Lipovetsky, Stan & Conklin, Michael. (2001). Analysis of Regression in Game Theory Approach (en inglés). Modelos estocásticos aplicados en negocios e industria. 17. 319 – 330. 10.1002/asmb.446.

Selección de variables para tarjetas de regresión

La creación de una tarjeta de regresión le permitirá comprender cómo el valor de una variable en su conjunto de datos se ve afectado por los valores de los demás.

Al seleccionar variables, una variable tendrá una clave. Para la regresión, la variable clave será la variable de salida. Cada otra variable seleccionada después de la variable clave será una variable de entrada. En otras palabras, estamos intentando explicar cómo el valor de la variable de salida es impulsado por las variables de entrada.

Clave que indica que la variable de salida es Impact-Time-At-Home

Aspectos a tener en cuenta al seleccionar variables para la regresión:

  • Puede modificar la variable clave haciendo clic en el icono de clave junto a cualquier variable en el panel de variable.
  • Si se seleccionan más variables que el número de respuestas que tiene, la regresión no se ejecutará.
  • Puede seleccionar hasta 25 variables de entrada. Sin embargo, debería intentar seleccionar entre 1 y 10 variables de entrada, de lo contrario, los resultados podrían complicarse mucho.

Si tiene una gran cantidad de variables que desea incluir en un análisis, tenga en cuenta los siguientes enfoques:

  • Ejecute algunas regresiones iniciales y excluya las variables que tengan muy poca importancia en el modelo.
  • Combine varias variables, por ejemplo, promediándolas.
  • Si la estructura de sus datos lo permite, puede utilizar un proceso de importancia relativa de dos pasos, como se describe en la página 341 aquí.

Por ejemplo, imagine que tiene diez medidas de satisfacción por la autonomía de los empleados y diez medidas de satisfacción por la remuneración de los empleados.

  • Promediar esos grupos en dos variables de resumen diferentes: una para autonomía y otra para compensación.
  • Ejecute un análisis de importancia relativa con satisfacción general como salida y las dos variables de resumen como entrada para ver qué grupo es más importante.
  • A continuación, ejecute un análisis de importancia relativa con satisfacción global como salida y solo las diez variables de autonomía como las entradas para ver cuáles son más importantes dentro de ese grupo.
  • Ejecute un análisis de importancia relativa con satisfacción general como resultado y solo las diez variables de compensación como entradas para ver cuáles son las más importantes dentro de ese grupo.

Una vez seleccionadas las variables, haga clic en Regresión para ejecutar una regresión.

Arriba a la izquierda de stats iQ, seleccionando el botón de regresión

Consejo Q: en la parte superior de la tarjeta de regresión habrá una línea verde (y a veces roja). Si hace clic en él, verá la cantidad de respuestas marcadas como “Incluidas” o “Faltantes” para esa tarjeta específica.

  • Incluido: Encuestados que respondieron la pregunta para cada pregunta o punto de datos utilizado en el análisis de regresión, o que tenían sus datos de variables de entrada faltantes imputados. Estos datos se utilizarán en el análisis de regresión.
  • Falta: Encuestados a los que les falta un valor para la variable dependiente de resultado. Estos datos no se utilizarán en el análisis de regresión.

Tipos de regresión

Existen dos tipos principales de ejecución de regresión en Stats iQ. Si la variable de salida es una variable numérica, Stats iQ ejecutará una regresión lineal. Si la variable de salida es una variable de categoría, Stats iQ ejecutará una regresión logística.

Más específicamente, los tipos de regresión que Stats iQ ejecutará son los siguientes:

Regresión lineal

La importancia relativa se combina con los mínimos cuadrados ordinarios (OLS). El resultado proviene de una combinación de los dos análisis:

  • Importancia relativa: todo en esta sección proviene de la Importancia relativa excepto el R-cuadrado, que proviene de la regresión OLS.
  • Explore el modelo en detalle: todo en esta sección proviene de la Importancia relativa excepto las distribuciones, que se extraen de los propios datos.
  • Analizar el diagnóstico de regresión OLS y los valores residuales para mejorar el modelo: todo en esta sección proviene de la regresión OLS.

Regresión logística

La regresión logística es un método de clasificación binaria que se utiliza para comprender los impulsores de un binario (por ejemplo, Sí o No) resultado dado un conjunto de variables de entrada. Si ejecuta una regresión en una variable de salida con más de dos grupos, Stats iQ seleccionará un grupo y agrupará los demás para convertirlos en una regresión binaria (puede cambiar el grupo que se está analizando después de ejecutar la regresión).

Consejo Q: Stats iQ ejecutará la ecuación de regresión más adecuada para su tipo de variable. Cambiar el tipo de variable podría cambiar qué tipo de regresión se aplica, alterando así la salida.

Importancia relativa

Las variables de entrada en los datos de la encuesta a menudo están muy correlacionadas entre sí; se trata de un problema llamado “Multicolinealidad”. Esto puede llevar a una producción de regresión que aumenta artificialmente la importancia de una variable y disminuye la importancia de otra variable correlacionada. Se reconoce la importancia relativa como el método de mejores prácticas para dar cuenta de esto.

La importancia relativa (específicamente las ponderaciones relativas de Johnson) no sufre este problema y equilibrará adecuadamente la importancia de las variables de entrada, independientemente del tipo de regresión que se esté ejecutando.  También calcula la ponderación relativa (o importancia relativa) de cada variable, la proporción de variación explicable en el resultado debido a esa variable. Esto se muestra como una serie de porcentajes que se suman al 100%.

La columna Importancia relativa se resalta en Explorar el modelo en detalle

Devuelve resultados similares a ejecutar una serie de regresiones, uno para cada variación de las variables de entrada. Por ejemplo, si tuviera dos variables, haría el equivalente de ejecutar tres regresiones: una con la variable A, otra con la variable B y otra con ambas. Esto le permite cuantificar la importancia de cada variable y aplicar esa cuantificación de nuevo al resultado de la regresión.

Consejo Q: Si está familiarizado con el análisis de dominancia, se trata de una extensión de la regresión de Shapley que es una aproximación más eficiente computacionalmente del análisis de dominancia.
Consejo Q: En función del ejemplo anterior, sus resultados se pueden comunicar como “El 34 % de lo que el modelo nos explica sobre NPS se puede atribuir a la edad del encuestado”.

Salida de regresión

Al ejecutar una regresión en Stats iQ, los resultados del análisis contienen las siguientes secciones:

Resumen numérico

Resumen numérico de la regresión
En la parte superior de la tarjeta hay un resumen para el análisis de regresión. Observando las variables seleccionadas, este resumen escrito explica qué variables son los impulsores principales frente a secundarios, así como los impulsores que tuvieron un impacto acumulativo bajo. La tabla de datos incluye el tamaño de muestra y el valor R cuadrado.

Importancia relativa

Gráfico que muestra el impacto bajo y las variables de impacto alto de importancia relativa

  1. Variables de impacto bajo: Las variables que individualmente tienen una importancia relativa del 10% o menos se agruparán. Cuando se selecciona, se muestra una sección en la que se explica la importancia relativa y la significación estadística de cada variable de impacto bajo.
  2. Variables de alto impacto: cada variable de alto impacto se separará y se podrá hacer clic en ella. Una vez seleccionada una variable, debajo del gráfico de barras, podrá ver la variación considerada y lo que sucedería si se controlaran otras variables en el modelo.

Detalles de modelo adicionales

Al seleccionar Explorar el modelo en detalle, verá sus variables de entrada y su variable de salida enumeradas. Sus variables de entrada vendrán con la siguiente información:
Tabla con variables de entrada, importancia relativa, coeficiente, coeficiente estandarizado, valor p, frecuencia y transformación

  • Importancia relativa: La proporción de r-cuadrado que es aportada por una variable individual. R-cuadrado es la proporción de la variación de la variable de resultado que se puede explicar mediante las variables de entrada en este modelo. Consulte Importancia relativa para obtener más detalles.
  • Odds ratio: Solo relevante para la regresión logística. El ratio de probabilidades para una variable de entrada dada indica el factor por el cual la probabilidad cambia para cada unidad de aumento en la variable explicativa.
    Por ejemplo, si el ratio de probabilidades para Satisfaction with Manager es 1.1 y los grupos de la variable de salida son Satisfied y Not Satisfied, entonces para cada instancia en la que Satisfaction with Manager es 1 superior, las probabilidades de la variable de salida de ser Satisfied son 1,1 superiores (10% más).  Si la fila de datos es una categoría, como color[azul], el coeficiente representa el cambio en las probabilidades de la variable de respuesta si la variable Categorías es esa categoría particular (azul) en lugar del grupo “base” (rojo, verde, etc.).
  • Coeficiente: Cada aumento de 1 unidad en una variable de entrada está asociado con un aumento del coeficiente en la variable de salida. Estos coeficientes se construyen basándose en los resultados del análisis de importancia relativa y, por lo tanto, se ajustan para multicolinealidad y no coinciden con los coeficientes que resultarían de una regresión de mínimos cuadrados ordinarios estándar.
  • Coeficiente estandarizado: el coeficiente estandarizado es el coeficiente dividido por la varianza de la variable de entrada. Esto pone a cada variable en la misma escala para que sus coeficientes puedan compararse más directamente.
  • Valor P: El valor p es la medida de la significación estadística. Los valores más bajos se asocian con probabilidades más bajas de que la relación sea una coincidencia. Para variables categóricas, el valor p indica la significación estadística de la diferencia entre un grupo y el grupo de “línea base” en la variable.
  • Transform: See Transforming Variables (en inglés).

Análisis de regresión OLS

Para la regresión lineal, haga clic en Analizar diagnósticos y valores residuales de regresión OLS para mejorar el modelo por debajo de la variable clave/de salida para ver los gráficos Previsto frente a real y Residuales. Consulte Interpretación de diagramas residuales para mejorar su regresión para obtener más información.
Analizar el diagnóstico de regresión OLS y los valores residuales para mejorar la tabla de modelo

Variable incluida

A lo largo de la cabecera superior de la tarjeta de regresión, verá las variables utilizadas en la regresión.

El encabezado más alto dice CES, arrow, Department, porque CES y Department son las variables que usamos en la regresión

Haga clic en el nombre de una variable para abrir una ventana nueva en la que pueda recodificar o agrupar valores. Haga clic en las flechas para cambiar cuáles son las variables de entrada y de salida en el análisis.

Si tiene demasiadas variables implicadas para mostrarlas en el encabezado, habrá un menú desplegable Variables explicativas donde puede elegir entre las variables que desea recodificar.

La cabecera superior tiene un nombre de variable, una flecha y, a continuación, la lista desplegable descrita

Añadir y eliminar variables

Una vez creada una tarjeta de regresión, puede añadir variables adicionales al análisis siguiendo estos pasos:
Añadir una variable utilizando Explorar el modelo en detalle

  1. Haga clic en Explorar el modelo en detalle.
  2. Seleccione Añadir variables a su modelo en la parte inferior de la tarjeta. Esto mostrará una lista de variables que aún no se han utilizado para la regresión.
  3. Seleccione una variable de esta lista.
  4. Haga clic en Aplicar para volver a ejecutar el análisis con la nueva variable incluida.

Para eliminar una variable de la regresión, pase el ratón por encima de la variable deseada y haga clic en la X azul situada en el extremo derecho de la tabla. Después de seleccionar variables para añadir o eliminar, asegúrese de seleccionar “Aplicar” para ejecutar el modelo nuevo.

Añadir una variable utilizando Explorar el modelo en detalle

Imputar variables

La regresión solo tendrá en cuenta las filas en las que todas las variables de entrada tengan datos. Sin embargo, a menudo faltan datos en la recopilación de datos de encuesta, lo que puede afectar negativamente al análisis de regresión y al modelo. Si solo incluye filas que no tienen datos faltantes en su regresión, los resultados del análisis pueden ser parciales porque la muestra no es representativa de todo el conjunto de datos.

Con la imputación, Stats iQ rellenará automáticamente los datos que falten con valores estimados. Cuando se completan los datos que faltan, puede incluir más de sus datos originales en el análisis de regresión, lo que resulta en un modelo de regresión con menos sesgo que pueda explicar mejor la variación en la variable de resultado deseada.

La imputación es automática, por lo que cuando ejecuta un análisis de regresión en un conjunto de datos con valores que faltan, su conjunto de datos se imputará antes de que se realicen los cálculos.

Atención: Stats iQ solo imputa valores para variables de entrada y nunca imputará el valor de una variable de resultado.
Consejo Q: La imputación no se aplica a las tarjetas de regresión existentes. Solo las tarjetas de regresión nuevas tendrán la imputación aplicada automáticamente. Para utilizar la imputación en una tarjeta de regresión antigua, deberá volver a crear la regresión antigua en una tarjeta nueva.
Haga clic aquí para ver un conjunto de datos de ejemplo antes y después de la imputación de variables.
Antes de la imputación:
Para esta regresión, “Uso de datos” es la variable de resultado y “Edad”, “Servicio de Internet” y “Minutos de Tiempo de Pantalla” son las variables de entrada.

ID de fila Uso de datos Edad Servicio Internet Tiempo de pantalla (minutos)
1 75 39 Satélite 503
2 19 41 Fibra óptica 52
3 87 434
4 54 23 Satélite
5 14 101
6 75 Satélite
7 81 57 DSL 329
Atención: Si ha ejecutado una regresión sin rellenar los valores que faltan, solo se incluirán las filas 1, 2 y 7.

Después de la imputación:

ID de fila Uso de datos Edad Servicio Internet Tiempo de pantalla (minutos)
1 75 39 Satélite 503
2 19 41 Fibra óptica 52
3 87 50,9 FALTA 434
4 54 23 Satélite 359.0
5 14 50,9 FALTA 101
6 75 50,9 Satélite 359.0
7 81 57 DSL 329
Consejo Q: “Servicio de Internet” es una variable categórica, no numérica, por lo que el valor que falta se rellena como “FALTA”.

Métodos de imputación

Stats iQ utiliza actualmente los siguientes métodos de imputación:

  • Categoría predeterminada: Stats iQ creará un nuevo valor de categoría “FISSING” para completar los datos que faltan. Este método se utiliza para variables categóricas.
  • Media: Si Stats iQ no detecta valores atípicos en la distribución de la variable numérica, los datos que faltan para la variable se completan con el valor medio (promedio). Este método se utiliza para variables numéricas.
  • Mediana: Si Stats iQ detecta valores atípicos en la distribución de la variable numérica, los datos que faltan para la variable se rellenan con el valor de mediana. Este método se utiliza para variables numéricas.

Indicadores de imputación

Cuando realiza un análisis de regresión en el conjunto de datos, verá un indicador de imputación en la parte superior de la tarjeta de regresión.

Tarjeta de regresión con opción de imputación resaltada

Para obtener más información sobre la imputación, haga clic en el símbolo de información ( i ) junto al Método de imputación.

información disponible al hacer clic en el método de información

Desactivar imputación

Stats iQ aplica automáticamente la imputación a todas las tarjetas de regresión. Para desactivar la imputación automática, haga clic en Imputar automáticamente los datos que faltan para su muestra en la parte superior de la tarjeta de regresión.

botón para desactivar/activar la imputación automática

Advertencias de imputación

  • Si se imputan demasiados datos, su modelo de regresión se volverá sesgado y poco fiable. Cuando se haya completado más del 50% de su conjunto de datos, Stats iQ le advertirá sobre extraer conclusiones de los resultados de regresión.
    mensaje de advertencia cuando faltan más del 50% de los datos
  • Cuando se detectan valores atípicos en cualquiera de las variables de entrada numéricas, Stats iQ imputará las variables utilizando el valor de mediana en lugar de la media. En este escenario, Stats iQ le avisará cuando explore el modelo en detalle.
    mensaje de advertencia de valores extremos

Transformación de variables

Al ejecutar un análisis de regresión en Stats iQ, es posible que tenga que mejorar el modelo. La forma más común de mejorar un modelo es transformar una o más variables, generalmente utilizando un “registro” u otra transformación funcional.

La transformación de una variable cambia la forma de su distribución. En general, los modelos de regresión funcionan mejor con distribuciones más simétricas en forma de campana. Pruebe diferentes tipos de transformaciones hasta que encuentre una que le proporcione este tipo de distribución.

Consejo Q: Puede que no sea posible encontrar una transformación que dé como resultado una distribución simétrica.

Para transformar una variable:
Pasos para acceder a las transformaciones

  1. En la opción Explorar el modelo en detalle, desplácese hasta la columna Transformar.
  2. Haga clic en el botón de función (f(x)) para la variable que desea transformar.
  3. En la lista, seleccione la función que desea aplicar y Stats iQ volverá a calcular la tarjeta con la nueva variable transformada.

Las siguientes transformaciones están disponibles en Stats iQ:

Funciones cuarentina, cúbica, cuadrada, raíz cuadrada, logarítmica y recíproca

Con diferencia, la transformación más común es log(x). Transforma una distribución de “potencia” (como el tamaño de la población de la ciudad) que tiene muchos valores más pequeños y un pequeño número de valores más grandes en una “distribución normal” en forma de campana (como la altura) donde la mayoría de los valores se agrupan hacia el medio.

Utilice log(x+1) si la variable que se está transformando tiene algunos valores de cero, ya que log(x) no se puede calcular cuando x es cero.

Para obtener más detalles sobre cuándo transformar sus variables, consulte Interpretación de diagramas residuales para mejorar su regresión lineal

Otras técnicas de regresión lineal disponibles en Stats iQ

Importancia relativa combinada con mínimos cuadrados ordinarios es la salida predeterminada para una regresión lineal. Sin embargo, hay otras opciones disponibles.

Para acceder a la estimación M, los mínimos cuadrados ordinarios y la regresión estrecha, haga clic en el engranaje de configuración en la esquina superior derecha de su tarjeta de regresión. Al hacer clic en el nombre de la técnica de regresión en Métodos de regresión, podrá modificar la técnica de regresión utilizada para la tarjeta de regresión. Esto solo se puede hacer para la regresión lineal.
Selección y explicaciones de otros métodos de regresión

  • Estimación M: Diseñado para manejar valores atípicos en la variable de salida mejor que los mínimos cuadrados ordinarios (OLS).
  • Los mínimos cuadrados ordinarios: mínimos cuadrados ordinarios (OLS) es la técnica clásica de regresión. Es sensible a los valores atípicos y otras infracciones en sus supuestos, por lo que recomendamos métodos más robustos como la estimación M. Dado que OLS se utiliza en la salida de importancia relativa por defecto, solo debe seleccionar esta opción si está interesado en las funciones que aún no se han adaptado en la salida de importancia relativa: predecir resultados y añadir términos de interacción.
  • Regresión Ridge: Ridge regression es una técnica similar a la regresión OLS estándar, pero con un parámetro de ajuste alfa. Este parámetro alfa ayuda a lidiar con la alta varianza y los datos que sufren de multicolinealidad. Cuando se ajusta adecuadamente, la regresión de cresta generalmente produce mejores predicciones que OLS debido a un mejor compromiso entre el sesgo y la varianza. En Stats iQ, podrá elegir el parámetro alfa al usar la regresión de cresta.

Una vez que haya seleccionado Estimación M, Menos cuadrados ordinarios o Regresión estrecha, podrá ver el resultado. El resultado aparecerá debajo de la sección Métodos de regresión.
Resumen numérico, detalles de coeficiente y datos de diagnósticos y residuos

  1. Resumen numérico: en la parte superior de la tarjeta hay un resumen para el análisis de regresión. Esto incluye el tamaño de muestra, los casos que faltan, el método, el valor R cuadrado, el error estándar, el coeficiente de variación y el ajuste de modelo.
  2. Detalles de coeficiente: los resultados principales de la regresión, la ecuación matemática, se encuentran bajo el resumen. La variable de salida/clave se encuentra a la izquierda de la ecuación. Las variables de entrada se encuentran en el lado derecho. Al pasar el ratón por encima de una variable se muestra una quick info que explica en términos simples cómo esa variable contribuye a la variable de salida. Aquí también puede introducir valores en la ecuación matemática para estimar valores para su variable de salida. Consulte la siguiente sección sobre la estimación de valores de variable de salida para obtener más información.
  3. Diagnósticos y residuos: Stats iQ proporciona diagnósticos para ayudarle a evaluar la precisión y validez de su modelo. Para obtener más información, consulte Interpretación de diagramas residuales para mejorar su regresión lineal o La matriz de confusión y la compensación precisión-recuperación en regresión logística.

Estimación de valores de variable de salida

Consejo Q: Esta opción solo está disponible para la estimación M, los mínimos cuadrados ordinarios y la regresión estrecha. Para acceder a estas opciones, haga clic en la marcha de configuración en la esquina superior derecha de su tarjeta de regresión. Al hacer clic en el nombre de la técnica de regresión en Métodos de regresión, podrá modificar la técnica de regresión utilizada para la tarjeta de regresión. Esto solo se puede hacer para la regresión lineal.

Una vez que haya ejecutado una regresión, podrá utilizar la ecuación matemática de la sección Detalles de coeficiente para estimar los valores de la variable de salida en función de los valores de entrada que seleccione. En el lado derecho de la ecuación, verá sus variables de entrada. Puede fijar valores para cada una de sus variables de entrada. En la parte izquierda de la ecuación se encuentra su variable de salida. Después de introducir valores para sus variables de entrada, la ecuación calculará una estimación para la variable de salida basada en el modelo de regresión.
Introducir valores para variables de entrada

  1. Estas variables de entrada son una variable de tipo de categoría. Para introducir un valor para las variables de categoría, haga clic en el valor deseado fuera de la lista de opciones.
  2. Estas variables de entrada son variables de tipo número. Para introducir un valor para variables numéricas, haga clic en Introducir un valor y escriba un número.
  3. Esta variable es la variable de salida de su ecuación de regresión. Después de seleccionar valores para sus variables de entrada, aparecerá un valor estimado para su variable de salida junto a donde dice Estimar.
Ejemplo: En el siguiente ejemplo, estamos intentando predecir el NPS del cliente en función de unas pocas variables de entrada. Después de seleccionar valores para las variables de entrada, podemos ver una puntuación NPS estimada de 4,98.
una imagen de los detalles del coeficiente después de introducir los valores de variable de entrada. En el lado izquierdo de la ecuación, se ha predicho una puntuación NPS de 4,98 basada en el modelo de regresión.

Predicción de resultados

Consejo Q: Esta opción solo está disponible para la estimación M, los mínimos cuadrados ordinarios y la regresión de borde. Para acceder a estas opciones, haga clic en la rueda dentada de opciones en la esquina superior derecha de su tarjeta de regresión. Al hacer clic en el nombre de la técnica de regresión en Métodos de regresión, podrá modificar la técnica de regresión utilizada para la tarjeta de regresión. Esto solo se puede hacer para la regresión lineal.

Por lo general, utilizará el análisis de regresión en Stats iQ para comprender la relación entre las variables de entrada y las variables de salida. Sin embargo, una vez creado un modelo de regresión, también se puede utilizar para predecir el valor de salida para filas de datos en las que tiene valores para las entradas.
Análisis de regresión OLS con predicciones de fabricación resaltadas

Términos de interacción y otras preocupaciones avanzadas

Agregación de términos de interacción

Al buscar mejorar su modelo de regresión, es posible que desee añadir términos de interacción además de las variables de entrada existentes. Se añadiría un término de interacción si sospecha que el valor de una de las variables de entrada cambia la forma en que una variable de entrada diferente afecta a la variable de salida.

Por ejemplo, quizás para las personas con niños presentes durante una estancia en un hotel, las personas más jóvenes están más satisfechas que las personas mayores, pero para las personas sin hijos presentes, las personas más jóvenes están menos satisfechas. Eso significaría que existe una interacción entre “Niños presentes” y “Edad”.

Si selecciona dos variables en Añadir una interacción entre en la parte inferior de la lista de variables de entrada en la tarjeta, se añadirá un término de interacción a la regresión. Esta funcionalidad solo está disponible en mínimos cuadrados ordinarios, M-estimación y regresión estrecha.
Interacción de resaltado entre opciones
Puede lograr el mismo efecto para las variables categóricas en un análisis de importancia relativa creando una nueva variable que combine las dos. Por ejemplo, puede combinar la variable Color (con grupos rojo y verde) con Tamaño (con grupos grandes y pequeños) para crear una variable llamada ColorSize (con los grupos BigRed, BigGreen, SmallRed y SmallGreen).

Multicolinealidad

La multicolinealidad ocurre en un contexto de regresión cuando dos o más de las variables de entrada están altamente correlacionadas entre sí.

Cuando dos variables están altamente correlacionadas, las matemáticas para la regresión generalmente ponen tanto valor como sea posible en una variable y no en la otra. Esto se manifiesta en un coeficiente más grande para esa variable. Pero si el modelo se modifica incluso una pequeña cantidad (añadiendo un filtro, por ejemplo), entonces la variable en la que se ha colocado la mayor parte del valor puede cambiar. Esto significa que incluso una pequeña modificación puede tener un efecto drástico en el modelo de regresión.

El análisis de importancia relativa gestiona este problema para que no tenga que preocuparse por ello. Si prefiere utilizar uno de los otros métodos y su modelo tiene este problema, la presencia de multicolinealidad (medida por “Factor de inflación de desviación”) desencadenará una advertencia y sugerirá que elimine una variable o combine variables promediándolas, por ejemplo.

Mensajes de advertencia

Stats iQ le avisará cuando haya problemas potenciales con sus resultados de regresión. Entre ellas se incluyen las siguientes situaciones:

  • Las variables de entrada de su regresión no son estadísticamente significativas.
  • Su transformación ha eliminado datos de la regresión.
  • Dos o más variables están muy correlacionadas entre sí y están haciendo que sus resultados sean inestables, es decir, multicolinealidad.
  • Los residuos tienen un patrón que sugiere que el modelo podría ser mejorado.
  • Se ha eliminado automáticamente una variable con solo un valor.
  • El tamaño de muestra es demasiado bajo en relación con el número de variables de entrada de la regresión.
  • Se ha agregado una variable de categorías con demasiadas opciones de respuesta.

Preguntas frecuentes

Muchas de las páginas de este sitio han sido traducidas del inglés original utilizando la traducción automática. Aunque en Qualtrics hemos realizado nuestra diligencia debida para obtener las mejores traducciones automáticas posibles, la traducción automática nunca es perfecta. El texto original en inglés se considera la versión oficial, y cualquier discrepancia entre el inglés original y las traducciones automáticas no son legalmente vinculantes.