Scripts R precompuestos
Acerca de los scripts R precompuestos
R es un lenguaje de programación estadístico que se utiliza ampliamente para el análisis flexible y potente. Al utilizar el código R en Stats iQ, puede seleccionar entre varios scripts de análisis para que el uso de R sea más fácil y eficiente.
Selección de un script para el código R
- Seleccione las variables que desea analizar. Consulte Selección de variables de dataframe para código R para obtener más información.
- Haga clic en Avanzado.
- Haga clic en Código R.
- Seleccione un script. Para obtener más información sobre las opciones de análisis, consulte las siguientes secciones.
- Haga clic en Siguiente.
- Confirme las variables que ha seleccionado. Si desea modificar una variable, haga clic en el menú desplegable y seleccione una nueva.
- Edite el nombre de sus variables, si lo desea. Para obtener más información, consulte Nombrar variables de dataframe para código R.
Consejo Q: Puede realizar cambios en las variables que ha seleccionado directamente desde esta ventana. Para editar los valores recodificados, haga clic en Editar. Si desea eliminar la variable, haga clic en el icono ( – ). Si desea agregar una nueva variable, haga clic en Agregar variable en la parte inferior izquierda.
- Cuando haya terminado de editar sus variables de dataframe, haga clic en Crear tarjeta de código.
Navegación por scripts de código R precompuestos
Su script se pegará en la sección de código de la tarjeta de código R. Este código contendrá consejos junto con los comandos para generar el análisis que ha seleccionado. Para ejecutar el análisis, haga clic en Ejecutar todo. Los resultados se mostrarán en el cuadro de salida de la derecha.
Puede editar sus variables de dataframe o añadir un filtro al análisis haciendo clic en las opciones de la parte superior derecha. Haga clic en el menú de tres puntos para añadir notas a su tarjeta de código, copiar el análisis o abrir la tarjeta en pantalla completa.
CORTCUTOS
Los accesos directos de teclado se pueden utilizar para navegar más eficientemente por la tarjeta de código R. Haga clic en Accesos directos para obtener una lista de posibles acciones.
PAQUETES
La codificación R en Stats iQ viene preinstalada con cientos de los paquetes de R más populares que se utilizan para el análisis. Haga clic en la pestaña Paquetes en la mitad derecha de la tarjeta para ver la lista de paquetes disponibles. Para obtener más información sobre el uso de paquetes, consulte Codificación R en Stats iQ.
Fiabilidad de la escala
La fiabilidad de la escala evalúa hasta qué punto los elementos de una escala de varios elementos pueden medir de forma fiable una construcción. En otras palabras, si se mide lo mismo utilizando el mismo conjunto de preguntas, ¿habrá resultados similares de manera fiable? Si es así, hay confianza en que cualquier cambio que veamos en el futuro se deba a cambios en la población encuestada o intervenciones que se han realizado para mejorar la puntuación.
MEDIDAS DE CONFIABILIDAD INTERPRETAS
Las medidas de fiabilidad de escala están entre 0 y 1 y son esencialmente una correlación agregada entre todos los elementos de la escala.
El alfa de Cronbach, una medida de fiabilidad ampliamente utilizada, a menudo subestima la fiabilidad debido a ciertas suposiciones. El omega de McDonald’s, una alternativa recomendada, evita estos defectos. Usamos el omega de McDonald’s por defecto, pero el alfa de Cronbach sigue siendo ampliamente aceptado.
No hay una única forma correcta de interpretar el número resultante, pero nuestra regla general preferida para ambos omega se describe a continuación:
Menos de 0,65 | Inaceptable |
0,65 | Aceptable |
0,8 | Muy bueno |
Si su escala fiable no es aceptable, hay algunas opciones para corregir su conjunto de datos :
- Retire cualquier elemento que esté bajando el omega o alfa.
- Es posible que haya dos construcciones distintas que se miden. Si ese es el caso, separar las variables en dos grupos y ejecutar este análisis en cada uno daría lugar a puntuaciones de fiabilidad superiores a las del análisis inicial. Puede explorarlo revisando la matriz de correlación en la salida o utilizando el script Análisis de factores exploratorios para ver qué agrupaciones se caen naturalmente de los datos.
- En última instancia, puede ser necesario modificar y ejecutar la encuesta de nuevo. Es posible que los elementos que tienen una correlación baja con los demás deban aclararse o revisarse, o es posible que deban añadirse otros elementos.
Los resultados muy altos (por ejemplo, 0,95) también pueden indicar un problema con la escala, por lo general, que todavía podría tener una escala que sea muy fiable sin tener tantos elementos. En este caso, recomendamos eliminar los elementos menos útiles de la escala y volver a ejecutar el análisis.
ESTADÍSTICAS DE INTERPRETACIÓN A NIVEL DE ARTÍCULO
El script primero ejecuta una medida de fiabilidad global y luego ejecuta una iteración para cada variable. El objetivo del análisis de fiabilidad por artículo es comprender qué artículos son más útiles para la construcción de la escala. Stats iQ mostrará una tabla similar a la siguiente:
Omega general de McDonald’s: 0,71
N | Media | Correlación posición-total | McDonald’s Omega si se elimina | |
A1 | 2784 | 4.59 | 0.31 | 0.72 |
A2 | 2773 | 4.80 | 0.56 | 0.69 |
A3 | 2774 | 4.60 | 0,59 | 0.61 |
… | … | … | … | … |
- El objetivo general es tener un McDonald’s Omega más alto con un menor número de artículos. Por lo tanto, si un investigador estuviera creando una nueva escala, es probable que quiera eliminar A1, ya que el omega es en realidad más alto sin él.
- El resto de los elementos que disminuirían la fiabilidad si se eliminaran son cosa del investigador para determinar. Por ejemplo, si un investigador está preocupado por la fatiga de la encuesta, podrían permitir una mayor disminución en la fiabilidad al decidir eliminar una variable.
- La correlación posición-total es la correlación entre esa posición y el promedio de todas las demás. Correlación baja posición-total sugiere que la variable no es suficientemente representativa de la construcción subyacente. La regla general más común es sospechar de cualquier cosa con una correlación posición-total de 0,3 o inferior, especialmente si tiene muchos elementos, lo que infla artificialmente la métrica de fiabilidad.
Si decide eliminar una posición, debe volver a ejecutar todas las demás estadísticas antes de decidir si desea eliminar otra posición. En Stats iQ, esto significa que solo se elimina la variable de toda la tarjeta; el resto se producirá automáticamente.
MATRIZ. CORRELACIÓN ENTRE POSICIONES
La Matriz de correlación entre posiciones muestra la correlación entre cada variable en el análisis y entre sí. Por ejemplo, si una variable está muy correlacionada con otra (por ejemplo, 0,9), esas preguntas pueden ser redundantes y eliminarlas solo tendrá un pequeño impacto en su fiabilidad.
La correlación media entre posiciones es el promedio de los números en la matriz. Los números más altos sugieren que algunos elementos pueden ser redundantes y podrían eliminarse. Generalmente, las variables deben estar en el rango de 0,2 a 0,4.
MÁS RECURSOS
- El análisis de fiabilidad en Stats iQ lo ejecuta la función compRelSem() del paquete semTools R. En la documentación se describe una variedad de opciones avanzadas. No es necesario utilizar o comprender estas opciones para ejecutar un análisis de fiabilidad.
- La matriz de correlación es ejecutada por la función corrplot() del paquete de corrplot R. Una variedad de configuraciones y personalizaciones avanzadas se describen en la documentación y en este recorrido.
Fiabilidad entre calificadores
La fiabilidad entre calificadores (IRR) se utiliza para evaluar el grado en que dos o más calificadores están de acuerdo en su evaluación. Por ejemplo, tres codificadores diferentes podrían evaluar un comentario de texto como si tuviera un sentimiento positivo, neutral o negativo; IRR describe cuánto estuvieron de acuerdo entre sí.
MEDIDAS DE CONFIABILIDAD INTERRÁPIDA
La TIR se evalúa utilizando métricas ligeramente diferentes en función de la estructura de los datos. Por ejemplo, un análisis de la interfiabilidad de dos calificadores utilizará una métrica ligeramente diferente a la de la interfiabilidad de 3 calificadores.
Stats iQ seleccionará automáticamente la métrica adecuada para sus datos.
RESULTADOS DE INTERPRETACIÓN
La métrica Kappa o ICC es el resultado principal, entre 0 y 1, e indica cuán bien correlacionados están los calificadores. Sugerimos los siguientes rangos para interpretar el Kappa:
0,75 a 1 | Excelente |
0,6 a 0,75 | Buena |
0,4 a 0,6 | Justo |
0,4 o inferior | Malo |
MÁS RECURSOS
- Este análisis de fiabilidad lo ejecutan las funciones del paquete IRR R. En la documentación se describe una variedad de opciones avanzadas. No es necesario utilizar o comprender estas parametrizaciones para ejecutar este análisis.
Análisis de factores exploratorios
El análisis de factores exploratorios (EFA) es una técnica estadística que ayuda a reducir un gran número de variables en un conjunto más pequeño y manejable de “factores” resumidos. Esto hace que sean mucho más fáciles de interpretar, comunicar y ejecutar análisis adicionales (por ejemplo, análisis de regresión). Por lo general, EFA sigue este conjunto de pasos:
- Diagnóstico: Ejecutar e interpretar un conjunto de diagnósticos que determinan si los datos son adecuados para el análisis de factores. Las variables deben estar lo suficientemente correlacionadas entre sí para formar agrupaciones significativas, pero no deben estar tan correlacionadas que sean esencialmente redundantes.
- Factores de selección: Determine el número de factores presentes en los datos. Los factores son las agrupaciones de variables similares juntas. De forma predeterminada, el script R utilizará un criterio que se calcula y se ejecuta automáticamente.
- Factores de nomenclatura: Usted se quedará con varios factores después de ejecutar la EFA que mejor representan los temas clave en los datos. Es útil etiquetar estos factores con nombres legibles que capten su significado.
- Métricas y medidas asociadas: el análisis de factores se ejecuta con el número de factores del paso anterior. El resultado es un conjunto de agrupaciones de variables junto con alguna descripción estadística del cálculo alícuota.
El resultado es un conjunto de factores con nombre y sus elementos de encuesta de componentes. Estos factores pueden servir como marco conceptual para análisis adicionales, o pueden volver a aplicarse a los datos.
DIAGNOSTICOS
El script ejecuta primero una serie de diagnósticos para garantizar que los datos son adecuados para EFA:
- Tamaño de la muestra: Generalmente, se sugiere una relación 10:1 de respuestas a los elementos. Por ejemplo, si tiene 10 preguntas, debería tener al menos 100 encuestados.
- Test of Sphericity de Bartlett: Esta prueba evalúa si los ítems están lo suficientemente correlacionados como para ser agrupados útilmente en factores. Si esto falla, es probable que haya varios elementos que no se correlacionen lo suficiente con los demás. Puede considerar la posibilidad de eliminar elementos de su análisis que no se correlacionen con otras personas o añadir más elementos relacionados a la encuesta.
- Determinante: El determinante evalúa si los elementos están demasiado altamente correlacionados para ser agrupados útilmente en factores. Si este diagnóstico falla, es probable que haya elementos demasiado similares entre sí para separarlos en factores. Considere editar los elementos de la encuesta para que sean más distintos.
- Medida Kaiser-Meyer-Olkin (KMO): esta medida comprueba si los elementos de su encuesta tienen suficiente en común para agruparlos en factores significativos. Superar este diagnóstico significa que las respuestas de su encuesta tienen mucho en común y se pueden agrupar correctamente. De lo contrario, los elementos no se agrupan en categorías. Si falla este diagnóstico, es posible que desee revisar los elementos de la encuesta para capturar temas más similares y plantearse la posibilidad de eliminar elementos que no muestren una relación clara con otras personas.
FACTORES DE ELEGIÓN
El punto de EFA es reducir muchas variables en un número relativamente pequeño que son útiles para el análisis, por lo que es posible que deba ejecutar el análisis de factores varias veces con diferentes números de factores para encontrar una agrupación que funcione para usted. El script EFA sugerirá el número de factores mediante el uso de sus valores propios.
El script EFA emitirá un diagrama de pantalla, que muestra los valores propios de las variables en orden descendente. Puede examinar el gráfico para ver cuántos factores ocurren antes del “codo” en el gráfico, después de lo cual añadir más factores es menos útil.
NOMBRAR A SUS FACTORES
Después de ejecutar EFA, cada variable se asigna a un factor. Es útil darle a cada factor un nombre que le dé una abreviatura para hablar de ellos, lo que hace que sus hallazgos sean más accesibles. El objetivo aquí es simplificar sus datos complejos en algunos temas comprensibles.
Estas son algunas pautas para nombrar sus factores:
- Sea descriptivo: Intente capturar el tema común que resume las variables del grupo.
- Manténgalo simple: sus nombres de factores deben ser fáciles de entender y comunicar. Evite la jerga técnica o frases demasiado complejas.
- Considere a su audiencia: los nombres de los factores deben tener sentido para las personas que utilizarán su análisis. Por ejemplo, “Limpieza” sería significativo tanto para los gerentes de hotel como para los huéspedes del hotel.
- Coherencia: si su encuesta o conjunto de datos abarca diferentes dominios o sujetos, asegúrese de que los nombres de los factores sean coherentes.
MEDIDAS Y MEDIDAS ASOCIADAS; METRICES
La Tabla de cargas de factor es una de las salidas clave de EFA. La carga de factor para un par de factor variable dado es la correlación entre esa variable y el factor. Si una variable tiene una carga de factor alta para un factor determinado, significa que la pregunta está estrechamente relacionada con ese factor.
La univocidad es la porción de la varianza que es única para la variable específica y no se comparte con otras variables. Los valores de univocidad van de 0 a 1 con valores más altos que indican que la variable es única y no encaja bien en ninguno de los factores…
Por lo general, se recomienda eliminar variables si sus cargas de factor están por encima de 0,3 o su univocidad está por encima de 0,7.
UTILIZACIÓN DE SUS RESULTADOS
El análisis de factores es un proceso iterativo, por lo que es posible que deba ejecutarlo varias veces con diferentes números de factores para encontrar una agrupación que funcione para usted. Para la mayoría de los investigadores, la conclusión clave es encontrar agrupaciones de factores que puedan proporcionar una nueva visión de sus datos, pero puede utilizar estos factores como nuevas variables en análisis subsiguientes, como regresión o análisis de clústeres. Por ejemplo, podría crear una nueva variable para cada factor que tome el valor promedio de todas las variables que se agrupan en ella.
Matriz de correlación
La matriz de correlación es una tabla que muestra la correlación entre cada par de variables proporcionadas. Esta tabla utiliza la r de Pearson de forma predeterminada para medir la correlación, pero puede cambiarla por la rho de Spearman si lo desea.
Puede editar los parámetros de la función corrplot() para modificar la tabla y hacerla más legible. Para obtener más información, puede ver el recorrido oficial y la documentación.