Ecuaciones de López Rodríguez

; Comentarios

Advertencia

Esto es un borrador; puede contener errores. Para informarse mejor, lea el artículo académico original.

Natividad López Rodríguez publicó sus ecuaciones de predicción de la dificultad de comprensión lectora del texto castellano en su tesis doctoral [1], que presentó en 1981 y fue dirigida por José Luis Rodríguez Diéguez.

1.   Variables

En sus fórmulas se incluyen hasta 27 variables lingüísticas del texto

  • x₁: Porcentaje de comas
  • x₂: Porcentaje de puntos y comas
  • x₃: Porcentaje de puntos y seguido
  • x₄: Porcentaje de puntos y aparte.
  • x₅: Porcentaje de dos puntos y seguido.
  • x₆: Porcentaje de dos puntos y aparte.
  • x₇: Porcentaje de signos de admiración.
  • x₈: Porcentaje de signos de interrogación.
  • x₉: Porcentaje de guiones de diálogo.
  • x₁₀: Porcentaje de palabras compuestas.
  • x₁₁: Porcentaje de nombres propios.
  • x₁₂: Porcentaje de numerales.
  • x₁₃: Porcentaje de palabras superiores a 10 letras
  • x₁₄: Porcentaje de palabras de 9 y 10 letras.
  • x₁₅: Porcentaje de palabras superiores a 8 letras.
  • x₁₆: Número promedio de palabras por frase.
  • x₁₇: Número de frases por cien palabras.
  • x₁₈: Número promedio de letras por palabra.
  • x₁₉: Porcentaje de palabras mayores de 3 sílabas.
  • x₂₀: Número promedio de silabas por palabra.
  • x₂₁: Indice de redundancia (TTR).
  • x₂₂: Porcentaje depalabras ausentes del Vocabulario Común de García Hoz.
  • x₂₃: Porcentaje de palabras ausentes del Vocabulario Común Fundido de García Hoz
  • x₂₄: Porcentaje de palabras ausentes de la Lista de Densidad de Spaulding.
  • x₂₅: Porcentaje de pronombres personales de primera y segunda persona.
  • x₂₈: Porcentaje palabras ausentes de la Lista de Densidad en sentido amplio

La variable x₂₈ puede ser una errata porque no menciona las variables x₂₆ y x₂₇. Creo que quiere decir x₂₆ por el orden, pero no seré yo quien la corrija.

2.   Fórmulas propuestas

Natividad López agrupa las fórmulas en su tesis con estos criterios:

  1. Conjunto de variables de la fórmula:

    1. Usan algunas de las 26 variables originales
    2. Usan un subconjunto optimizado de las 18 variables (se eliminan las que sobran por redundantes)
  2. nivel escolar; 2 cursos:

    1. 7º de E.G.B. (1º de E.S.O.)
    2. 8ª de E.G.B. (2º de E.S.O.)
  3. necesidad de ordenador:

    1. informáticas: requieren uso de ordenador
    2. manuales: no lo requieren (en textos pequeños).

En mi herramienta de análisis de legibilidad no puedo incluir las que requieren ordenador porque algunas de sus variables son el porcentaje de palabras en unas listas de frecuencias que no son libres [2] [3] [4]. No es difícil de programar, pero no quiero que me multen por no respetar los derechos de autor.

Resumen de las fórmulas de Natividad Rodríguez
CursoAplicaciónFórmulaImportane
8º E.G.B.ordenador4No
8º E.G.B.ordenador5
8º E.G.B.manual6No
8º E.G.B.manual7No
8º E.G.B.manual8
8º E.G.B.ordenador9No
8º E.G.B.ordenador10
7º E.G.B.ordenador11
7º E.G.B.manual12
7º E.G.B.manual13

2.1.   Fórmulas de 8º de E.G.B.

2.1.1.   Fórmulas con algunas de las 26 variables originales

2.1.1.1.   Fórmulas para ordenador

Por su complejidad, es necesario el uso del ordenador para calcular el índice de dificultad (I.D.).

Fórmula nº 4 (diez variables):

\begin{equation*} ID = 102.4184 - .0843 x_{1} + .2895 x_{4} - .1002 x_{9} - .65 x_{16} - .0749 x_{19} -31.6028 x_{21} - .6295 x_{22} - .4343 x_{23} + 1.4490 x_{24} - .8064 x_{28} \end{equation*}

Fórmula nº 5 (siete variables):

\begin{equation*} ID = 95.4399 - .0756 x_{1} + .2012 x_{4} - .0669 x_{16} - 0.728 x_{19} - 35.2020 x_{21} -1.0601 x_{22} + .7783 x_{24} \end{equation*}
2.1.1.2.   Fórmulas manuales

Fórmula nº 6 (con 6 variables):

\begin{equation*} ID = 66.8333 - .1228 x_{1} + .3288 x_{4} - .1357 x_{9} + .0917 x_{11} - .0758 x_{16} -0.873 x_{19} \end{equation*}

Fórmula nº 7 (cinco variables:

\begin{equation*} ID = 66.5733 - .1120 x_{1} + .1979 x_{4} + .0816 x_{11} -.0780 x_{16} - .0820 x_{19} \end{equation*}

Fórmula nº 8 (cuatro variables):

\begin{equation*} ID = 67,0692 - .1029 x_{1} + .2193 x_{4} - .0779 x_{16} - .0802 x_{19} \end{equation*}

2.1.2.   Fórmulas con el subconjunto optimizado de 18 variables

Se quitan las redundantes porque no aportan gran valor predictivo. Así quedan más sencillas las fórmulas para calcular el índice de dificultad de comprensión lectora.

2.1.2.1.   Fórmulas para ordenador

Fórmula nº 9 (doce variables):

\begin{equation*} ID = 89.9835 - .0879 x_{1} + .0490 x_{3} + .2879 x_{4} - .1102 x_{9} - .4618 x_{10} + .0795 x_{11} + .1356 x_{12} - .0576 x_{16} - .0562 x_{19} -33.5654 x_{21} - .8762 x_{22} + .5710 x_{24} \end{equation*}

Fórmula nº 10 (nueve variables):

\begin{equation*} ID = 94.6324 - .0920 x_{1} + .2776 x_{4} - .1012 x_{9} - .0700 x_{11} - .0654 x_{16} - .0712 x_{19} - 32.3625 x_{21} - .9718 x_{22} - .6469 x_{24} \end{equation*}
2.1.2.2.   Fórmulas manuales

Las fórmulas obtenidas a partir de las 18 variables optimizadas con 7 variables quedan igual que las obtenidas de las 26 originales.

2.2.   Fórmulas de 7º de E.G.B.

2.2.1.   Fórmulas para ordenador

Fórmula nº 11 (nueve variables):

\begin{equation*} ID = 70.1970 - .1173 x_{1} + .1944 x_{4} - .2639 x_{8} + .1100 x_{11} - .2109 x_{13} - .0396 x_{16} + 8.9394 x_{18} - 54.6556 x_{21} - .5998 x_{22} \end{equation*}

Fórmula nº 12 (siete variables):

\begin{equation*} ID = 62.618 - .0999 x_{1} + .1589 x_{4} + .1069 x_{11} - .2416 x_{13} + 10.8036 x_{18} - 55.6562 x_{21} - .6509 x_{22} \end{equation*}

2.2.2.   Fórmulas manuales

Fórmula nº 13 (cuatro variables):

\begin{equation*} ID = 61.6527 - .1363 x_{1} + .2293 x_{4} - .2308 x_{13} - .0499 x_{16} \end{equation*}

3.   Referencias

[1]López Rodríguez, Natividad. (1981). Fórmulas de legibilidad para la lengua castellana. Páginas 1-650.
[2]Spaulding, S. (1956). A Spanish Readability Formula.
[3]Buchanan, Milton (1941). A Graded Spanish Word Book. Toronto. University of Toronto Press.
[4]García Hoz, Víctor. (1953). Vocabulario Usual. Común y Fundamen­tal. Madrid. C.S.I.C. Instituto de Pedagogía.