Матрица контекстной совстречаемости (Co-occurrence Matrix)
Применение: Анализ семантики, векторные представления слов (например, в word2vec до его появления).
Описание:
- Показывает, как часто слова встречаются вместе в определённом контексте (окне предложения или документа).
- Используется для построения семантических моделей (например, латентно-семантического анализа, LSA).
Пример:
Для предложений:
- «Кот ловит мышь»
- «Собака гонит кота»
| кот | мышь | собака | ловит | гонит | |
|---|---|---|---|---|---|
| кот | 0 | 1 | 1 | 1 | 1 |
| мышь | 1 | 0 | 0 | 1 | 0 |
| собака | 1 | 0 | 0 | 0 | 1 |
(Здесь значения — количество совместных вхождений в одном контексте.)
Матрица переходов (Transition Matrix)
Применение: Марковские модели, предсказание следующего слова.
Описание:
- Используется в n-граммных моделях (например, для генерации текста).
- Показывает вероятность перехода от одного слова к другому.
Пример:
Для текста «кот ест рыбу, кот спит»:
| кот | ест | рыбу | спит | |
|---|---|---|---|---|
| кот | 0 | 0.5 | 0 | 0.5 |
| ест | 0 | 0 | 1 | 0 |
| рыбу | 0 | 0 | 0 | 0 |
| спит | 0 | 0 | 0 | 0 |
(Вероятность перехода «кот» → «ест» = 0.5, так как после «кот» два варианта: «ест» и «спит».)
Матрица синтаксических расстояний (Syntactic Distance Matrix)
Применение: Анализ структуры предложения, сравнение языков.
Описание:
- Показывает расстояние между словами в синтаксическом дереве.
- Используется в исследованиях языковой универсальности.
Пример:
Для предложения «Быстрый кот ест рыбу»:
| Быстрый | кот | ест | рыбу | |
|---|---|---|---|---|
| Быстрый | 0 | 1 | 2 | 3 |
| кот | 1 | 0 | 1 | 2 |
| ест | 2 | 1 | 0 | 1 |
| рыбу | 3 | 2 | 1 | 0 |
(Числа — количество шагов между словами в дереве зависимостей.)
Матрица внимания (Attention Matrix)
Применение: Нейросетевые модели (Transformer, BERT).
Описание:
- Показывает веса внимания между словами.
- Используется в механизме self-attention.
Пример:
Для «кот ест рыбу» (упрощённо):
| кот | ест | рыбу | |
|---|---|---|---|
| кот | 0.9 | 0.1 | 0.0 |
| ест | 0.3 | 0.4 | 0.3 |
| рыбу | 0.1 | 0.2 | 0.7 |
(Числа — степень влияния одного слова на другое.)
Матрица морфологических признаков (Feature Matrix)
Применение: Морфологический анализ, машинный перевод.
Описание:
- Каждая строка — слово, столбцы — признаки (род, число, падеж и т.д.).
Пример:
| Слово | Часть речи | Падеж | Число |
|---|---|---|---|
| кот | существительное | именительный | ед. |
| ест | глагол | — | ед. |
| рыбу | существительное | винительный | ед. |
Матрица синтаксических n-грамм (Syntactic N-gram Matrix)
Применение: Анализ устойчивых синтаксических паттернов, стилометрия.
Описание:
- Фиксирует частоту появления определенных синтаксических конструкций (например, «прилагательное + существительное»).
- Используется для сравнения авторских стилей или языковых норм.
Пример:
Для текста: «Красный мяч летит. Синий шар падает.»
| Конструкция | Частота |
|---|---|
| прил. + сущ. (ном.) | 2 |
| глагол (ед.ч.) | 2 |
Матрица семантических ролей (Semantic Role Matrix)
Применение: Глубинный семантический анализ.
Описание:
- Сопоставляет словам их семантические роли (Агенс, Пациенс, Инструмент и т.д.).
- Используется в системах извлечения событий.
Пример для «Повар ножом режет хлеб»:
| Слово | Роль | Аргумент |
|---|---|---|
| Повар | Агенс | режет |
| ножом | Инструмент | режет |
| хлеб | Пациенс | режет |
Матрица дискурсных связей (Discourse Relation Matrix)
Применение: Анализ связей между предложениями.
Описание:
- Кодирует логические отношения между частями текста (причина, следствие, противопоставление).
- Важна для суммаризации и анализа аргументации.
Пример:
Для текста: «Шел дождь. Поэтому мы остались дома.»
| Предложение 1 | Предложение 2 | Отношение |
|---|---|---|
| Шел дождь | остались дома | причина |
Матрица фонетических признаков (Phonetic Feature Matrix)
Применение: Фонологический анализ, синтез речи.
Описание:
- Представляет звуки через бинарные признаки (±гласный, ±звонкий и т.д.).
- Используется в системах TTS (text-to-speech).
Пример для русского:
| Звук | Гласный | Звонкий | Губной |
|---|---|---|---|
| [а] | + | + | — |
| [п] | — | — | + |
Матрица кросс-языковых соответствий (Cross-lingual Alignment Matrix)
Применение: Машинный перевод, сопоставительная лингвистика.
Описание:
- Показывает вероятности соответствия слов между языками.
- Основа для выравнивания параллельных корпусов.
Пример (русский-английский):
| рус.\англ. | cat | dog | eat |
|---|---|---|---|
| кот | 0.9 | 0.1 | 0.0 |
| собака | 0.05 | 0.85 | 0.1 |
Матрица эмоциональной окраски (Sentiment Matrix)
Применение: Анализ тональности, эмоций в тексте.
Описание:
- Приписывает словам/фразам числовые значения эмоций (положит./отриц.).
- Используется в соц.медиа аналитике.
Пример:
| Фраза | Полярность | Интенсивность |
|---|---|---|
| «Обожаю этот фильм!» | +0.9 | 0.8 |
| «Ужасная погода» | -0.7 | 0.6 |
Матрица онтологических связей (Ontological Relation Matrix)
Применение: Семантические сети, извлечение знаний.
Описание:
- Кодирует отношения типа «is-a», «part-of» между концептами.
- Основа для построения тезаурусов (например, WordNet).
Пример:
| Концепт 1 | Концепт 2 | Отношение |
|---|---|---|
| яблоко | фрукт | is-a |
| колесо | автомобиль | part-of |
Классификация матриц по уровням языка
| Уровень языка | Матрицы | Пример применения |
|---|---|---|
| Фонетика | Фонетических признаков | Синтез речи, транскрипция |
| Морфология | Морфологических признаков | Лемматизация, машинный перевод |
| Синтаксис | Зависимостей, n-грамм, расстояний | Парсинг предложений |
| Семантика | Совстречаемости, сем.ролей, онтологий | Поиск синонимов, извлечение знаний |
| Дискурс | Дискурсных связей, эмоций | Анализ аргументации, суммаризация |
| Кросс-лингвистика | Кросс-языковых соответствий | Выравнивание параллельных корпусов |
| NLP/Нейросети | Внимания, переходов | BERT, GPT, генерация текста |