Cómo funciona el analizador de legibilidad
Esta herramienta de análisis de legibilidad de texto usa un algoritmo para aplicarle las fórmulas de lecturabilidad.
Un algoritmo es una serie de pasos para resolver un problema. Es como una receta de cocina: necesitas los ingredientes y los pasos para obtener un plato sabroso. En este caso, el ingrediente es el texto que quieres analizar. Los pasos que da mi analizador de legibilidad de texto para averiguar si es fácil de leer son los siguientes: Al pulsar el botón «analizar», comprueba si el texto introducido es una dirección web o URI. Pueden pasar dos cosas: La herramienta solo funciona si se introduce texto plano o ficheros marcados XML o HTML. No es compatible con archivos binarios como .pdf o .doc de Word. Pueden pasar dos cosas: El programa borra todas las etiquetas XML y HTML (si las tiene), porque no hay que analizarlas. Sobran. Solo cuenta el texto. Si se trata de una web o código HTML, intenta eliminar lo más irrelevante (publicidad, menús, encabezado, pie de página, aviso de cookies). Para eso usa Python Readability, que suele funcionar muy bien. También elimina todo código malicioso que pudiera insertarse para piratearme la web. Todos los días lo intentan varias veces y, al final, lo conseguirán con su perseverancia. Si hay menos de dos caracteres, da un mensaje de error porque no tiene sentido analizar un texto de un solo carácter o de ninguno. Si no, pasa al siguiente paso. La herramienta está pensada para la lengua española. Usa Langdetect para detectar el idioma. Si no es castellano, para el proceso y da este mensaje de error «El texto no es castellano. La herramienta solo funciona con el español.». Cuenta todos los datos del texto: Obtiene los resultados de aplicar las fórmulas de legibilidad al texto. Crea una lista de palabras en orden de su frecuencia y detecta si están en la base de datos SUBTLEX-ESP por si estuviese mal escrita. Crea una lista de letras en orden de su frecuencia. La e suele ser la más frecuente del español. Presenta la información en pantalla: 1. Detecta si se introdujo una dirección web
2. Detecta texto
3. Limpia el texto
4. Cuenta los caracteres
5. Detecta el idioma
6. Cuenta todo
7. Hace los cálculos
8. Listas de palabras
9. Lista de letras
10. Muestra el resultado
Comentarios