Анализ текста: Текстомéтр

Текстомéтр (https://textometr.ru/) позволяет оценить уровень сложности текста, провести частотный анализ слов, найти ключевые слова и самые полезные для изучения слова, коэффициент лексического разнообразия текста, а также статистику по вхождению слов в лексические минимумы для изучающих русский язык как иностранный.

Определение уровня текста для иностранных учащихся

Определение уровня по шкале CEFR от А1 до С2 происходит автоматически, с помощью регрессионной модели, обученной на корпусе из 700 текстов из пособий по РКИ. Подробнее о параметрах модели и признаках, на которых она обучалась, можно почитать здесь [2].

Может ли она ошибаться? Эксперименты показывают, что модель склонна немного завышать уровень сложности текста, поскольку она производит расчеты исходя из данных лексических минимумов. Практика же показывает, что студенты обычно знают (или угадывают из контекста) больше слов, чем в минимумах. Особенно это касается интернационализмов и слов, которые похоже звучат на родном языке ученика. Это стоит учитывать при подготовке текстов для славяно- или англоговорящих учеников. Подробнее об эксперименте со сравнением работы программы, мнения экспертов-преподавателей и самих студентов можно почитать здесь [3].

Определение уровня текста для носителей языка

Уровни сложности текста для иностранцев хорошо стандартизированы и задокументированы. В текстах для носителей языка понятие сложности текста многограннее: текст бывает написан короткими словами и фразами, что позволяет стандартным формулам читабельности отнести его к простым, но “продраться” сквозь незнакомые слова или стилистические особенности затруднительно.

Поэтому тексты для чтения носителем языка система оценивает по двум критериям: структурная сложность и лексическая. Структурная сложность учитывает классическую формулу читабельности Флеша, адаптированную для русского языка, а также наличие частей речи и оборотов, затрудняющих чтение (причастия, пассивные формы и др.) Лексическая сложность рассчитывается на основании вхождения слов текста в специализированные частотные списки.

https://textometr.ru/

Дополнительно:

  • Automatic Readability Checker
  • Оценка читабельности текста – инструмент оценки читабельности текстов позволяет определить удобство чтения и простоту восприятия материалов. Он подходит для сайтов, брошюр, руководств, инструкций и других текстов. Позволяет при необходимости своевременно внести необходимые исправления в текст.
Share this article
Shareable URL
Prev Post

Анализ текста и его обработка: обзор программ

Next Post

Модель Фрайера (Frayer Model)

Read next

Анализ текста. RusTXT

RusTXT  https://rustxt.ru/ – это портал с огромным количеством полезных и нужных в работе…