Индексы удобочитаемости текста

1. Индекс Lively-Pressey (1923)

Индекс Ливли-Пресси (Lively-Pressey) — это один из традиционных статистических индексов, применяемых в экономическом анализе для оценки изменений различных показателей во времени или между группами. В отличие от индексов читаемости, этот индекс чаще используется для измерения динамики или структуры экономических данных.

  • Авторы: Берта Лавли (Bertha Lively) и Сидней Пресси (Sidney Pressey)
  • Формула:
    LP = 0.141 × (слова/предложение) + 0.086 × (% сложных слов) + 0.839
  • Значение: Первая научно обоснованная формула оценки сложности текста
  • Контекст: Разработан для анализа школьных учебников в рамках прогрессивного образования

2. Индекс Флеша (Flesch Reading Ease, 1948)

Индекс Флеша (Flesch Reading Ease, FRE) — это классический показатель удобочитаемости текста, созданный доктором Рудольфом Флешем в 1940-х годах. Его цель — определить уровень сложности текста и насколько легко его смогут понять читатели.

  • Автор: Рудольф Флеш (Rudolf Flesch)
  • Формула:
    FRE = 206.835 − 1.015 × (слова/предложение) − 84.6 × (слоги/слово)
  • Назначение: Оценка легкости восприятия текста для англоязычной аудитории
  • Шкала: 0-100 баллов (чем выше, тем проще текст)

Для русского языка используется следующая адаптация оригинальной формулы Флеша:

Особенности адаптации:

  • Коэффициенты 1,3 и 60,1 отличаются от оригинальных (1,015 и 84,6 для английского), потому что в русском предложения, как правило, короче, а слова — длиннее по количеству слогов.
  • Индекс показывает читаемость текста: чем выше значение, тем проще читается текст (максимум около 100 — очень лёгкий).
  • Значения примерно от 0 до 100, где:
    • 90–100 — очень лёгкий текст (подходит для детей младших классов),
    • 60–70 — текст средней сложности для обычного читателя,
    • 0–30 — очень сложный текст (научные или юридические документы).
  • Менее точен для:
    • Поэтических текстов
    • Материалов с именами собственными
    • Текстов <150 слов

Пример. Если средняя длина предложения = 15 слов, а среднее число слогов в слове = 2,2, тогда индекс будет: 206.835−1.3×15−60.1×2.2=206.835−19.5−132.22=55.115. Это означает текст, подходящий для взрослой аудитории.


3. Индекс Дейла-Чалла (Dale-Chall, 1948)

Индекс Дейла-Чалла — это формула оценки удобочитаемости текста, созданная Эдгаром Дейлом и Джоан Чалл в 1948 году и основанная на списке простых слов, знакомых большинству учеников 4-го класса.

  • Авторы: Эдгар Дейл, Джин Чалл
  • Формула:
    DC = 0.1579 × (% слов вне списка 3000 базовых) + 0.0496 × (слова/предложение)
  • Описание: Первый словарно-ориентированный метод
  • Назначение: Оценка сложности текста на основе словарного запаса и длины предложений
  • Особенность: Использует список из 3000 «простых» слов, известных 80% американских четвероклассников

4. Индекс Spache (1953)

Индекс Spache — это один из популярных показателей удобочитаемости текста, разработанный для оценки сложности текстов, ориентированных на детей младшего школьного возраста и людей с базовым уровнем владения языком.

  • Автор: Джордж Спаш (George Spache)
  • Формула:
    S = 0.121 × (слова/предложение) + 0.082 × (% слов вне списка 1000 детских) + 0.659
  • Назначение: Оценка сложности текстов для детей младшего школьного возраста (1-4 классы).
  • Особенность: Использует список из 1000 базовых слов, известных большинству детей этой возрастной группы

5. Индекс Фог (Gunning Fog, 1952)

Индекс Ганнинга (Gunning Fog Index) — это показатель удобочитаемости текста, который определяет, какой уровень образования необходим читателю для комфортного восприятия материала.

  • Автор: Роберт Ганнинг
  • Формула:
    Fog = 0.4 × [(слова/предложение) + % слов ≥3 слогов]
  • Цель: выявить «туманность» текста — степень сложности и запутанности, обеспечив более простой и понятный язык, изначально для журналистики, сейчас — для копирайтинга и редактуры.
  • Особенности:
    • Сложные слова — слова, состоящие из трёх или более слогов (для русского языка чаще берут слова более 4 слогов); при этом исключаются имена собственные, составные слова, глаголы в усложнённых формах.
    • Коэффициент 0,78 служит поправкой, которая снижает итоговое значение индекса, адаптируя его под российскую языковую специфику — учитывает, что в русском языке часто встречаются длинные слова и иные синтаксические конструкции, которые не обязательно делают текст трудным для понимания.

6. Индекс ARI (Automated Readability, 1967)

Индекс ARI (Automated Readability Index) — это автоматический индекс удобочитаемости текста, который оценивает сложность восприятия текста и сопоставляет её с уровнем школьного класса в американской системе образования, для которого текст будет понятен.

  • Разработчик: Разработан ВВС США в 1967 году для оценки технических документов
  • Формула:
    ARI = 4.71 × (буквы/слово) + 0.5 × (слова/предложение) − 21.43
  • Назначение: Определение уровня сложности текста на основе длины слов и предложений без подсчета слогов.
  • Особенность: Использует количество букв вместо слогов, что упрощает компьютерный анализ

7. Индекс SMOG (1969)

Индекс SMOG (Simple Measure of Gobbledygook) — это показатель удобочитаемости текста, который оценивает, сколько лет обучения необходимо для понимания данного текста. Он базируется на подсчёте количества многосложных слов (слова с тремя и более слогами) в выборке из текста.

  • Автор: Гарри МакЛафлин (Harry McLaughlin)
  • Формула:
    SMOG = 1.043 × √(30 × сложных слов/предложение) + 3.1291
  • Назначение: Оценка сложности текста с акцентом на медицинские и научные материалы
  • Особенность: Один из самых точных индексов для текстов, требующих высокого уровня грамотности
  • Критерий: Сложные слова: слова с 3+ слогами (исключая: имена собственные, составные слова, глаголы с приставками).

8. Индекс FORCAST (FORmula for CASTing, 1973) 

Индекс FORCAST (FORmula for CASTing) — это формула удобочитаемости, разработанная армией США в 1973 году для анализа технических инструкций и учебных материалов. Целью индекса было обеспечить объективную оценку сложности текстов, ориентированных на военных и технических специалистов, чтобы адаптировать документацию под уровень понимания пользователей.

  • Разработчик: Разработан армией США в 1973 году для анализа технических инструкций и учебных материалов
  • Формула:
    FORCAST = 20 − (N слов ≥2 слогов/10)
  • Назначение: Оценка сложности текста для функционально неграмотных (например, новобранцев) с упором на распознавание многосложных слов.
  • Особенность: Использует подсчет слов с 2+ слогами вместо 3+ (как в индексе SMOG), что делает его более строгим

9. Индекс Колман-Лиау (Coleman-Liau, 1975)

Индекс Колман-Лиау — это простой, но точный инструмент для измерения читаемости текстов, основанный на средней длине слов в буквах и длине предложений.

  • Авторы: Мери Колман (Meri Coleman) и Т.Л. Лиау (T.L. Liau)
  • Формула:
    CLI = 5.89 × (буквы/слово) − 30 × (предложения/100 слов) − 15.8
  • Назначение: Оценка сложности текста на основе длины слов (букв) и длины предложений, без подсчета слогов, что упрощает компьютерный анализ 512.
  • Особенность: Используется для быстрой оценки больших текстов, включая технические документы и образовательные материалы

10. Индекс Флеша-Кинкаде (Flesch-Kincaid Grade Level, 1975)

Индекс Флеша-Кинкаде — это один из классических индексов удобочитаемости текста, который показывает, сколько лет обучения (по американской системе) нужно читателю, чтобы понять текст. Он основан на двух параметрах: средней длине предложения и средней длине слова в слогах.

  • Разработчик: Адаптация формулы Рудольфа Флеша для ВМС США 
  • Формула:
    FKGL = 0.39 × (слова/предложение) + 11.8 × (слоги/слово) − 15.59
  • Назначение: Определение уровня образования, необходимого для понимания текста
  • Особенность: Переводит результат в эквивалент школьных классов (США)

11. Индекс Linsear Write (1979)

Индекс Linsear Write — это формула удобочитаемости текста, разработанная для оценки сложности технических материалов, в частности, изначально созданная ВВС США для анализа руководств и инструкций.

  • Разработчик: Джон О’Хэйр (John O’Hayre), 1966 год, для ВВС США
  • Метод:
    1. Выборка 100 слов
    2. +1 балл за простое слово, +3 за сложное (≥3 слогов)
    3. LW = (Σ баллов / предложения) × 0.33
  • Назначение: Оценка сложности технических документов и учебных материалов на основе длины предложений и многосложных слов.
  • Особенность: Результат соответствует годам обучения в американской системе (1–12 классы + университет)

Microsoft Word использует модифицированную версию индекса Флеша-Кинкаде для оценки удобочитаемости текста в функции «Статистика удобочитаемости» (Файл → Параметры → Правописание → «Показывать статистику удобочитаемости») после прохождения проверки орфографии и грамматики.


Онлайн-инструменты

  • Readable (https://readable.com)
    • Анализирует по 7 формулам (включая Кинкаде)
    • Показывает уровень образования для понимания текста

Для русского языка оба индекса требуют корректировки — слоги считаются иначе, чем в английском. Лучше использовать адаптированные формулы (например, в сервисах Glvrd.ru или Тургенев).

Прокрутить вверх