Un reciente artículo, titulado «Escalas Likert: Una Guía Práctica para su Diseño, Construcción y Uso«, ofrece una exhaustiva revisión y un conjunto de directrices prácticas para optimizar el empleo de las escalas tipo Likert.
El artículo, publicado en la revista Psicothema, ha sido elaborado por Pere J. Ferrando, Fabia Morales-Vives y José M. Casas pertenecientes a la Universitat Rovira i Virgili, y José Muñiz, de la Universidad Nebrija.
La conclusión principal del trabajo es que, a pesar de su amplia popularidad y sencillez, existen numerosos aspectos en la construcción, análisis y uso de estas escalas que son susceptibles de mejora. Los autores sintetizan sus hallazgos en quince recomendaciones clave, diez dedicadas a la creación y análisis de nuevas escalas, y cinco orientadas a la utilización adecuada de instrumentos ya existentes. De esta forma, el artículo tiene como objetivo desmitificar y guiar a investigadores y profesionales en el manejo de lo que describen como un «gigante incomprendido» en el campo de la evaluación.

Foto: Pexels. Autor: jannoon028. Descarga: 15/09/2025.
Las Escalas Likert: un gigante incomprendido en la medición psicométrica.
Los autores describen el origen y utilidad de las escalas tipo Likert, que fueron propuestas por Rensis Likert en 1932 y que se han consolidado como uno de los instrumentos de evaluación más utilizados en diversas áreas científicas y profesionales debido a su sencillez y eficacia. Según se expone en el artículo, su influencia ha trascendido desde sus orígenes en la medición de actitudes dentro de las ciencias sociales hasta campos tan variados como la agricultura, el turismo, la electrónica y la robótica, e incluso han permeado la cultura popular. Así, en sus 92 años de existencia, han generado más de un millón de publicaciones, con una tendencia creciente en monografías y guías de usuario, señalan los autores.
Según exponen los investigadores, el éxito de las escalas Likert radica en dos ingredientes principales: su concepción práctica, sencilla y rentable, y su atractivo intuitivo, quizás más que cualquier otro modelo de escalamiento. Sin embargo, a pesar de su ubicuidad, los autores señalan que estas escalas son un «gigante incomprendido», rodeado de interpretaciones erróneas, recomendaciones infundadas y «leyendas urbanas». Por tanto, el presente estudio subraya la importancia de discernir lo crucial de lo secundario, con el fin de proporcionar una guía clara y fundamentada que sea útil para cualquier investigador o usuario, independientemente de su campo de estudio.
Metodología y hallazgos clave del estudio.
El estudio se realizó mediante una revisión crítica y sistemática de la literatura y de las directrices publicadas sobre la construcción, análisis, puntuación, uso e interpretación de las escalas Likert. Los resultados revelaron varias áreas clave susceptibles de mejora en el diseño y la aplicación de estas escalas. Entre ellas se incluyen la definición operativa de los constructos a medir, la formulación de los ítems, la elección del número de categorías de respuesta, el análisis de las respuestas, la aportación de evidencias de validez, la calibración de los ítems y la interpretación de los resultados.
Definición de las escalas tipo Likert.
Según se expone en el artículo, las escalas Likert son instrumentos multi-ítem donde la puntuación final surge de la combinación de varios ítems, no de uno solo ni de su formato de respuesta. Asimismo, están diseñadas para medir constructos dimensionales, concebidos como continuos. Si bien originalmente se pensaron para constructos bipolares (ej. extraversión–introversión, aprobación–desaprobación), también pueden aplicarse a constructos unipolares (ej. ideación suicida). De acuerdo con la revisión realizada por los autores, estas escalas funcionan mejor en los bipolares y buscan ser unidimensionales, aunque pueden extenderse a modelos multidimensionales. Los ítems son considerados indicadores del constructo, reflejando en parte su influencia.
La Guía Práctica: 15 recomendaciones esenciales.
La guía se estructura en dos bloques principales: diez recomendaciones para construir una escala Likert y cinco para usar una escala ya existente.
A. Construyendo una Escala Likert.
1. Especificar claramente el tipo de constructo y la población objetivo.
Es crucial definir la amplitud (más ítems para constructos amplios, menos para específicos) y la polaridad del constructo. Además, la población objetivo determinará el lenguaje, las habilidades de lectura y abstracción necesarias para comprender los ítems.
2. Diseñar los enunciados rigurosamente.
Los ítems deben ser indicadores de alta calidad del constructo, fuertemente influenciados por este y mínimamente por el error. Se recomienda que sean específicos, breves (menos de 20 palabras), claros, con una sola idea, evitando negaciones, jerga o lenguaje sesgado. La mayoría de los ítems deben ser «prototípicos», es decir, que capturen el núcleo del constructo. Para constructos unipolares, es más apropiado un formato de respuesta de intensidad, frecuencia o cantidad en lugar del de acuerdo/desacuerdo. Los autores sugieren redactar enunciados con un grado «medio» de extremidad, permitiendo que el formato de respuesta abarque el rango del constructo, y evaluar empíricamente la amplitud cubierta.
3. Elegir el formato de respuesta apropiado.
Las etiquetas verbales de las categorías deben ser coherentes con el enunciado, sugerir distancias conceptuales iguales y, si se usa una categoría central, esta debe indicar una posición neutral clara. No hay un número «óptimo» universal de categorías. Para el diseñador, la fiabilidad aumenta entre 4 y 7 categorías, mientras que la estabilidad factorial alcanza un máximo en siete. Para el respondedor, la mayoría divide el continuo en 5 a 11 agrupaciones (siendo 7 la más común). Se sugiere un rango de 5 a 7 categorías para poblaciones con niveles cognitivos razonables; incluso escalas binarias para perfiles con dificultades.
4. Decidir sobre el balanceo de enunciados.
Balancear ítems (con redacción positiva y negativa) es efectivo para constructos bipolares medidos con formatos bipolares, proporcionando información útil sobre la aquiescencia. Sin embargo, para constructos unipolares, balancear puede generar enunciados «forzados» o antinaturales. En estos casos, es mejor orientar todos los enunciados en la misma dirección.
5. Incluir ítems tipo Likert en instrumentos multidimensionales.
Es una práctica común. Para subescalas significativas, los ítems deben asignarse unívocamente a subescalas no solapadas, buscando una estructura lo más «limpia» posible, con al menos tres ítems marcadores por factor y una carga dominante clara para los ítems complejos.
6. Elegir el modelo más apropiado para calibrar los ítems.
Se pueden usar modelos de Análisis Factorial (FA) lineal o no lineal. El FA lineal es defendible si los ítems son no extremos, con umbrales espaciados uniformemente y discriminaciones no muy altas. El FA no lineal es más informativo y alineado con los fundamentos de Likert, pero más exigente en cuanto a datos, adecuado para muestras grandes y no demasiados ítems o categorías.
7. Evaluar la idoneidad de la solución elegida.
Se evalúa por el ajuste del modelo a los datos, la fuerza, estabilidad y replicabilidad de los resultados de calibración, y la interpretación unívoca de las puntuaciones. Es fundamental verificar la invariancia de los resultados en al menos dos muestras.
8. Selección óptima de ítems.
El objetivo es una solución adecuada, estable y replicable, donde los ítems cubran un amplio rango de niveles del constructo, sean de buena calidad y representen adecuadamente sus manifestaciones. Se deben examinar los umbrales de los ítems (su distribución en el continuo de respuesta) y su índice de discriminación (calidad del ítem como indicador del constructo).
9. Puntuación de la escala Likert y evaluación de la idoneidad.
Se consideran tres opciones de puntuación:
- Puntuaciones sumadas: Las más simples, asignan igual peso a todos los ítems. Son teóricamente subóptimas, pero prácticas en escalas bien diseñadas. Requieren normas para ser interpretables en términos relativos.
- Estimaciones de puntuación factorial: En el modelo FA lineal, son compuestos ponderados que reflejan la calidad del ítem, ofreciendo mayor precisión y siendo directamente interpretables en métrica estándar.
- Puntuaciones basadas en el modelo FA no lineal (GRM-IRT): Las más informativas y precisas teóricamente, basadas en el patrón de respuesta completo de cada individuo y escaladas en métrica estándar. Los autores indican que se debe reportar siempre una estimación de fiabilidad apropiada para las puntuaciones elegidas, junto con los intervalos de confianza para cada estimación de puntuación individual.
10. La importancia de la validez: Aportar evidencia de validez externa.
Es crucial ir más allá de la estructura interna y proporcionar evidencia de validez externa. Esto incluye la evidencia convergente (relaciones con otras variables) y la evidencia relacionada con el criterio. Las medidas de variables relacionadas deben ser de constructos claramente diferenciables. Los autores recomiendan reportar correlaciones puntuales con intervalos de confianza y correlaciones disatenuadas. Para una evaluación más profunda, se sugiere el uso de modelos de ecuaciones estructurales (SEM) para evaluar conjuntamente diversas fuentes de validez, incluyendo la capacidad predictiva.
B. Usando una Escala Likert existente.
11. ¡Advertencia al comprador! Revisar a fondo las características e información existente del instrumento.
Antes de seleccionar una escala, es fundamental verificar cómo se define el constructo, si el número de ítems es adecuado para constructos de banda ancha, y si los ítems inversos en constructos unipolares son apropiados. También es crucial la adecuación del vocabulario, longitud y complejidad gramatical de los enunciados al público objetivo, según indican los autores.
12. Examinar las propiedades psicométricas de la escala.
Además de la validez de contenido y la estructura interna, se debe buscar evidencia sobre la estabilidad de la estructura en diferentes muestras y la capacidad predictiva de las puntuaciones (validez convergente y de criterio).
13. Ajustar y mejorar la escala si es posible y necesario.
Es común que una escala necesite ajustes, advierten los autores. Así, si el número de categorías es inapropiado, se pueden añadir o eliminar. Las etiquetas de respuesta deben alinearse conceptualmente con los enunciados, evitando el sobre-etiquetado en escalas con muchas categorías. Asimismo, es esencial asegurar distancias conceptuales similares entre categorías, ajustando las etiquetas si es necesario, y que la categoría central, si se usa, represente una posición neutra clara.
14. Realizar un estudio piloto.
Los ajustes, especialmente si son sustanciales, pueden alterar el rendimiento de la escala. Se recomienda un estudio piloto para evaluar si los cambios mejoran la comprensión y facilidad de uso del instrumento, requiriendo muestras mayores si se busca demostrar la conservación de las propiedades estructurales.
15. Puntuación: Aprovechar al máximo la elección apropiada.
La elección del enfoque de puntuación dependerá de los objetivos del usuario. Las puntuaciones sumadas son ideales para clasificar respondedores y priorizar la simplicidad y la comunicabilidad. Por su parte, las puntuaciones factoriales o IRT son más apropiadas para mediciones individuales precisas, como en diagnóstico o selección, con las IRT ofreciendo mayor precisión y estimaciones de fiabilidad «a medida».
El futuro de las escalas Likert en la era digital.
Los autores reflexionan sobre el futuro de este tipo de escalas, señalando que, a pesar de los avances en inteligencia artificial y tecnologías digitales, las escalas Likert mantienen su vigencia gracias a su objetividad, eficiencia y simplicidad. Por tanto, se espera que sigan siendo una herramienta central, aunque complementadas con nuevas metodologías, tales como evaluaciones multi-informantes, pruebas situacionales, medición digital en tiempo real y modelos de análisis flexibles como los de redes.
En suma, las escalas Likert continúan siendo “unidades básicas de evaluación”: prácticas, económicas y resistentes al paso del tiempo, indican los autores, y su futuro dependerá de un uso riguroso y de su integración con enfoques metodológicos innovadores.
Fuente.
Ferrando, P. J., Morales-Vives, F., Casas, J. M., & Muñiz, J. (2025). Likert scales: A practical guide to design, construction and use. Psicothema, 37(4), 1-15. https://doi.org/10.70478/psicothema.2025.37.24
