Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модель "предсказания" словоформы неформализованной части текста электронного резюме Коряковцев Михаил Андреевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Коряковцев Михаил Андреевич. Модель "предсказания" словоформы неформализованной части текста электронного резюме: диссертация ... кандидата Филологических наук: 10.02.21 / Коряковцев Михаил Андреевич;[Место защиты: ФГАОУ ВО Тюменский государственный университет], 2017.- 145 с.

Содержание к диссертации

Введение

Глава 1 Текст электронного резюме в коммуникативной ситуации «работодатель – сайт трудоустройства – соискатель » 13

1.1 Электронно-поисковая коммуникация как особый вид коммуникации 13

1.2 Функциональная модель коммуникативной ситуации «работодатель – сайт трудоустройства – соискатель»

1.2.1 Модели коммуникативного процесса 20

1.2.2 Элементы функциональной модели электронно-поисковой коммуникации «работодатель – сайт трудоустройства – соискатель» 22

1.3 Электронное резюме как особый вид текста 31

1.3.1 Подходы к изучению содержимого резюме 31

1.3.2 Общие признаки текста 35

1.3.3 Признаки текста электронного резюме 40

Выводы по главе 1 46

Глава 2 Структурно-функциональная модель электронного резюме ... 48

2.1 Принципы отбора сайтов трудоустройства 48

2.2 Содержимое и функции бланков электронного резюме 51

2.3 Фреймовая структура электронного резюме

2.3.1 Фреймовое моделирование 54

2.3.2 Фреймы электронного резюме 60

2.3.3 Качественный и количественный анализ компонентов фреймов электронного резюме

2.4.1 Характеристики текста рубрики «Обязанности, функции, достижения» 68

2.4.2 Анализ синтаксических структур в тексте рубрики «Обязанности, функции, достижения» 70

2.4.3 Комбинаторный частотный машинный словарь синтаксических пар рубрики «Обязанности, функции, достижения» 75

Выводы по главе 2 81

Глава 3. Модель «предсказания» словоформы текстового содержимого рубрики «Обязанности, функции, достижения» 83

3.1. Модели word prediction 83

3.2. Математическая модель предсказания словоформы текстового содержимого рубрики «Обязанности, функции, достижения»

3.2.1 Описание входных и выходных параметров операций предсказания 88

3.2.2 Алгоритмы операций предсказания Suggest и SuggestO

3.3 Сравнение алгоритмов предсказания словоформы 100

3.4 Концепция, структура и задачи программного комплекса оптимизации заполнения электронного резюме

3.4.1 База данных предсказания словоформы 103

3.4.2 Веб-сервис и клиент автодополнения текста 105

3.4.3 Менеджер комбинаторного машинного словаря 107

Выводы по главе 3 ПО

Заключение 112

Библиографический список

Элементы функциональной модели электронно-поисковой коммуникации «работодатель – сайт трудоустройства – соискатель»

Научная модель, в самом широком её понимании, имеет достаточно большое количество определений: «опытный образец или информационно-знаковый аналог того или иного изучаемого объекта, выступающего в качестве оригинала. Некий объект (макет, структура, знаковая система и т. п.) может играть роль модели в том случае, если между ним и другим предметом, называемым оригиналом, существует отношение тождества в заданном интервале абстракции. В этом смысле модель есть изоморфный или гомоморфный образ исследуемого объекта (оригинала)» [Лебедев 2004: 145] «1) образец (эталон, стандарт); 2) в широком смысле — любой образ, аналог (мысленный или условный) какого-либо объекта, процесса или явления» [Савченко Смагин 2006: 99] «Искусственно созданный объект, опытный образец или информационно-знаковый аналог изучаемого объекта, выступающего в качестве оригинала» [Бряник 2007: 145]. «Искусственно созданный объект в виде схем, знаковых форм или формул, который отображает и воспроизводит в более простом и огрубленном виде структуру, свойства, взаимосвязи и отношения между элементами исследуемого объекта» [Серова 2009: 5] «любое сущее по отношению к любому другому сущему, имеющее общую с ним структуру и функции, независимо от различий по составу (содержанию), внешней форме, количеству (например, размеру)» [Сагатовский 2011: 49] В нашей работе используются три вида частных моделей: модель коммуникации, лингвистическая модель и математическая модель. Перечисленные специальные модели предполагают сужение объекта моделирования (исследования): 1) Под моделью коммуникации мы будем понимать «схематизированное, упрощенное отражение реального коммуникативного процесса, необходимое как инструмент, ориентированный в первую очередь на управление моделируемым процессом» [Василик 2003: 126]. 2) Лингвистическая модель представляет собой абстрактные системы в виде набора правил, схем, формул, созданные с целью изучения и описания естественного языка [Мельчук 1999: 14] в виде текста [Апресян 1966: 79]. 3) Под математической моделью понимают: «Приближенное описание с помощью математической символики какого-либо класса явлений внешнего мира» [Савченко Смагин 2006: 94] «Математический объект, установленный в соответствие с реальным объектом и позволяющий получать характеристики реального объекта» [Советов Яковлев 2001: 33] «Эквивалент объекта, отражающий в математической форме важнейшие его свойства – законы, которым он подчиняется, связи, присущие составляющим его частям» [Самарский Михайлов 2001: 7]

В нашем исследовании математическая модель – это алгоритм. Алгоритм мы определяем как «свод конечного числа правил, задающих последовательность выполнения операций при решении той или иной специфической задачи» [Кнут 1976: 30]. Алгоритм имеет пять важных особенностей: конечность (финитность), определённость, ввод, вывод и эффективность. Перейдём непосредственно к модели коммуникативной ситуация «работодатель – сайт трудоустройства – соискатель». Функциональная модель коммуникативной ситуация «работодатель – сайт трудоустройства – соискатель» является «верхушкой» макро-модели электронного резюме. Макро-модель электронного резюме включает в себя ещё 3 микро-модели, каждая из которых определённым образом связана с предыдущей: а) Модель текста электронного резюме, представленная 1) в виде совокупности признаков текста и 2) в виде фрейма. Моделируемый на данном уровне текст электронного резюме в коммуникативной ситуации «работодатель – сайт трудоустройства – соискатель» является сообщением в коммуникативных процессах, возникающих между соискателем и сайтом трудоустройства и работодателем и сайтом трудоустройства. б) Рубрики в тексте электронного резюме моделируются с помощью деревьев зависимостей и систематизируются в комбинаторном частотном машинном словаре. в) Модель предсказания словоформы представляет собой алгоритм, в основу которого положен комбинаторный частотный машинный словарь.

Обратимся к существующим моделям коммуникативного процесса и обозначим их структурные элементы. В учебном пособии М. А. Василика [Василик 2003] подробно описываются семь моделей коммуникативного процесса: 1) модель ИСКП, 2) модели Лассуэлла, 3) модель Шеннона-Уивера, 4) модель М. де Флера, 5) циркулярная модель, 6) двухканальная модель, 7) двухступенчатая модель. Кратко остановимся на каждой из них.

Модель ИСКП была предложена Д. Берло и является базой для построения более подробных моделей коммуникативного процесса. Она включает в себя четыре обязательных элемента коммуникативного процесса: источник, сообщение, канал и получатель. М. А. Василик говорит о двух моделях Лассуэлла. Оригинальная модель, предложенная Г. Лассуэллом в 1948 г., включает в себя следующие элементы коммуникативного процесса: коммуникатор, сообщение, канал, получатель и эффект. Более поздняя модель Лассуэлла включает так же источник, намерения, ситуацию, ресурсы и стратегию коммуникации.

Модель Шеннона-Уивера основана на аналогии с телефонной связью. Она содержит такие элементы как источник, сообщение, передатчик, канал, сигнал, источник шума, приёмник и получатель.

Модель М. де Флера является модификацией линейной модели Шеннона-Уивера. Модификация заключается в реализации обратной связи между источником и получателем. Модель М. де Флера включает в себя следующие элементы: значение, источник, получателя, передатчик, приёмник, канал и шум.

Двухканальная модель речевой коммуникации была предложена отечественным психологом В. П. Морозовым. Данная модель, так же как и модель М. де Флера, учитывает обратную связь. Ключевой особенностью этой модели является наличие двух каналов связи между источником и приёмником. Элементами двухканальной модели речевой коммуникации являются: источник, приёмник, речевой сигнал, шум, вербальный и невербальный каналы, система контроля говорящим процессов образования его собственной речи и система контроля говорящим результатов воздействия его речи на слушателя.

В рамках циклической модели, предложенной У. Шраммом и Ч. Осгудом, отправитель и получатель обмениваются между собой сообщениями, поочередно меняя роли. Циклическая модель включает в себя пять элементов: коммуникатор, кодирование, декодирование, канал и сообщение.

Модель двухступенчатой коммуникации была разработана П. Лазарсфельдом, Б. Берельсоном и Г. Годэ для описания массовой коммуникации. Ключевыми элементами данной модели являются: отправитель, «лидеры мнений», информация, массмедиа, выступающая как канал коммуникации, и целевая аудитория.

Проанализируем перечисленные модели с точки зрения пригодности для описания процесса электронно-поисковой коммуникации. Модель ИСКП не содержит канала обратной связи и, следовательно, не подходит для описания интерактивного общения. Модели Лассуэлла, Шеннона-Уивера, М. де Флера и двухканальная модель являются, наоборот, избыточными, подразумевая более подробное описание канала коммуникации (шума, стратегий коммуникаций). Двухступенчатая модель нацелена на описание коммуникации через массмедия, к которой сайты трудоустройства не имеют отношения.

Таким образом, циркулярная модель является наиболее подходящей для описания интерактивного общения отправителя или получателя с посредником в моделируемой нами коммуникативной ситуации.

Содержимое и функции бланков электронного резюме

Данная форма ввода имеет заголовок «Образование», пять полей для ввода информации с заголовками «Уровень», «Название учебного заведения», «Факультет», «Специальность/специализация», «Год окончания» и одного управляющего элемента «Указать еще одно место обучения». Поля «Уровень» и «Год окончания» заполняются соискателем путем выбора соответствующих значений из выпадающего списка, который появляется при нажатии на поле ввода. Управляющий элемент «Указать еще одно место обучения» при нажатии добавляет в электронный бланк дополнительные четыре поля «Название учебного заведения», «Факультет», «Специальность/специализация», «Год окончания». Таким образом, в данном бланке можно выделить следующие семь рубрик: «Образование», «Уровень», «Место обучения», «Название учебного заведения», «Факультет», «Специальность/специализация» и «Год окончания».

Перечислим рубрики входящие в представленную форму ввода электронного бланка, сгруппировав их по рубрикам-слотам и рубрикам узлам:

1) Рубрики-слоты включают в себя: Уровень, Название учебного заведения, Факультет, Специальность/специализация, Год окончания. Из этих рубрик рубрики Уровень и Год окончания имеют план выражения выбор, а рубрики Факультет, Название учебного заведения и Специальность/специализация имеют план выражения словосочетание.

2) Рубрики-узлы включают в себя рубрики Место обучения и Образования. Рубрика «Место обучения» служит для объединения рубрик Название учебного заведения, Факультет, Специальность/специализация и Год окончания. Рубрика Образования является корневой в рассматриваемой форме ввода и включает в себя рубрики Уровень и Место обучения.

Итоговый фрейм формы ввода «Образование» электронного бланка представлен на следующем рисунке 19. Рисунок 19. Фрейм электронного бланка «Образование»

Таким образом, с помощью представленного подхода нами было получено три фрейма электронных резюме. Каждый из них описывает структуру и ограничения по синтаксической оформленности содержимого логических блоков электронных резюме на отдельном сайте трудоустройства. Фреймы электронных резюме сайтов трудоустройства HeadHunter, SuperJob и Работа.Ru представлены в приложениях А, Б и В соответственно.

Фреймы электронного резюме были использованы для определения неформализованных рубрик и их качественных и количественных характеристик. Неформализованными рубриками электронного резюме мы считаем те рубрики, план выражения которых является текстовым. Целью количественного анализа является определение доли неформализованных рубрик в электронных резюме по количественному показателю и объёму словоупотреблений. Качественный анализ призван установить инвариантность реализованного в содержимом неформализованных рубрик значения.

Количественный анализ показал, что:

1) Общее количество рубрик в электронных резюме на трёх сайтах трудоустройства составляет 228. Из них 84 относятся к рубрикам резюме сайта трудоустройства «HeadHunter», 66 – к рубрикам «SuperJob» и 78 к рубрикам «Работа.Ru»

2) Количество рубрик на втором уровне, т.е. рубрик относящихся к формам ввода, различно для каждого сайта трудоустройства. Сайт HeadHunter включает в себя 12 рубрик второго уровня, SuperJob – пять рубрик, а Работа.Ru – четыре рубрики.

2) Максимальная глубина связей «рубрика-подрубрика» для сайтов трудоустройства HeadHunter и SuperJob – 5, а для сайта трудоустройства Работа.Ru – 6.

3) По количеству неформализованные рубрики составляют 7.46% (17 рубрик) от общего количества рубрик.

В электронных резюме анализируемых сайтов трудоустройства были выявлены следующие неформализованные рубрики:

1) На сайте «HeadHunter» – три рубрики с заголовком Комментарий, являющиеся подрубриками рубрик Мобильный телефон, Домашний телефон и Рабочий телефон; рубрика Обо мне и Обязанности, функции, достижения.

2) На сайте «SuperJob» – рубрики Дополнительные контакты, Рекомендации, Ключевые навыки, Обязанности и достижения, а так же рубрика Дополнительные сведения, относящаяся к рубрике Навыки, умения.

3) На сайте «Работа.Ru» – рубрики Подробное описание навыков; Комментарии к рубрике Рекомендация; Подробное описание качеств, Дополнительно о себе; Комментарий к Контактной информации; Комментарии к Учебному заведению; Обязанности и достижения.

Остановимся подробнее на объёме неформализованных рубрик. Оценим объём рубрики, входящей в электронные бланки всех сайтов трудоустройства – «Обязанности, функции, достижения». Для этого мы составили выборку из 20 текстов электронного резюме с сайта трудоустройства HeadHunter общим объёмом 9475 словоупотреблений. Доля рубрики «Обаязанности, функции, достижения» составила приблизительно 47%, т. е. 4518 словоупотреблений.

Математическая модель предсказания словоформы текстового содержимого рубрики «Обязанности, функции, достижения»

Оптимизация ввода текста, в первую очередь, предназначена для устройств, не обладающих полноразмерными (так называемой QWERTY-клавиатурой) средствами ввода – мобильными телефонами, планшетами и т. д. Основной её задачей является уменьшение количества нажатий при вводе некоторого текста [MacKenzie 2002].

Для оптимизации ввода текста обычно используются четыре вида лингвистических моделей: 1) символов и их частот, 2) словоформ и их частот, 3) N-грамм символов и 4) N-грамм словоформ [MacKenzie 2002, Nandi Jagadish 2007]. Частоты символов, словоформ и N-грамм рассчитываются с использованием корпусов общеупотребительной лексики (Британский Национальный Корпус, Проект «Гутенберг» и т. д.).

Перечисленные лингвистические модели используются для оптимизации набора текста на двух уровнях: на уровне оптимизации раскладки клавиатуры и на уровне word prediction (предсказания слова). Значительное отличие этих двух уровней проявляется в предложенном MacKenzie параметре KSPC (количество нажатий на символ, Keystrokes per Character). Данный параметр рассчитывается как отношение количества нажатий клавиш или стилуса (электронного пера) к количеству символов в набранном тексте. За стандарт принимается ввод с QWERTY-клавиатуры, у которой параметр KSPC равен единице.

Остановимся подробнее на оптимизации клавиатуры. Для методов оптимизации клавиатуры параметр KSPC, согласно работам MacKenzie, превышает единицу. Задача оптимизаций на этом уровне состоит в приближении скорости ввода с keypad (мобильная упрощенная клавиатура) к keyboard (полноразмерная клавиатура). Чем ближе параметр KSPC к единице, тем «лучше» оптимизация. Для оптимизации раскладки клавиатуры разными исследователями были предложены несколько моделей, например FOCL (Fluctuating Optimal Character Layout) [Bellman MacKenzie 1998], LetterWise [MacKenzie 2001], T9 и виртуальные гексагональные клавиатуры, использующие в качестве метода ввода жесты (gesturing) [Williamson Murray–Smith 2005]. Из них FOCL и гексагональная клавиатура были призваны заменить так называемую ALPHA-клавиатуру (фиксированную, алфавитную клавиатуру). В основе этих разработок лежат следующие вероятностные лингвистические модели:

1) В случае FOCL эта модель представляет собой частотный ряд диграмм для каждого символа алфавита и пробельного символа. В качестве частотного ряда диграмм использовалась таблица частот символов и символьных пар для английского языка, предложенная Mayzner и Tresselt [Soukoreff MacKenzie 1995]. При вводе каждого нового символа клавиатура изменялась согласно соответствующему символу ряду.

2) Модель, предложенная Williamson и Murray–Smith, предполагает использование вероятности &(letterpre.ix) для каждого вводимого символа в рамках отдельного слова. Дерево этих вероятностей построено с использованием английских текстов Проекта «Гутенберг».

В связи с появлением в мобильных телефонах полноразмерных клавиатур большее значение приобретает word prediction (предсказание словоформы). Согласно MacKenzie [MacKenzie 2002], параметр KSPC в случае таких оптимизаций меньше единицы. Это связано с тем, что слова могут быть набраны без ввода каждого отдельного символа.

Задача предсказания словоформы ставится следующим образом. Пусть некоторый текстовый документ может быть представлен в виде последовательности словоформ 23,24,25 … 27. Необходимо для имеющейся последовательности словоформ 23,24,25 ... 2t_3 предсказать такую последовательность словоформ 2t, 2i+3, 2i+4 ... 2i+c_3 длиной не менее с, что вероятность её корректности и её длина будет максимальной.

В рамках этой оптимизации были предложены модели word frequency lists (частотные списки словоформ) [Lesher 1999, MacKenzie 2002], Trie (префиксное дерево) [Brass 2008, Briandais 1959], FussyTree [Nandi Jagadish 2007] и многие другие. Рассмотрим перечисленные три модели (частотные списки словоформ, Trie и FussyTree), как образцы математических моделей, основанных на лингвистических моделях разного уровня языка.

Структура данных «Trie» является разновидностью дерева поиска. Она была предложена Rene de la Briandais [Briandais 1959]. Сама по себе эта структура данных может быть применена для решения широкого круга задач - хэш-таблица, поиск подстроки, лексикографическая сортировка, полнотекстовый поиск. В рамках оптимизации набора текста, префиксное дерево обладает двумя характеристиками: 1) Лингвистическая модель префиксного дерева представляет собой набор N-грамм и их частот. 2) Узлы префиксного дерева содержат некоторый символ или последовательность символов и их частоту относительно последовательности символов родительского узла.

Модель на основе частотных списков словоформ описана в работах I. S. MacKenzie [MacKenzie 2002] и G. W. Lesher [Lesher 1999]. В качестве лингвистической модели используются словоформы и их частоты в некотором корпусе текстов. Предсказание слова с помощью частотных списков представляет собой процесс, в котором после каждого введённого символа некоторого слова формируется список слов-кандидатов. При этом начало каждого из слов кандидатов совпадает с уже введённой последовательностью символов, а список отсортирован по частоте употребления слов-кандидатов в корпусе.

FussyTree, предложенная в работе Nandi и Jagadish [Nandi Jagadish 2007], является модификацией префиксного дерева. При этом лингвистическая модель переходит с уровня N-грамм символов к N-граммам словоформ. Формирование дерева происходит путём последовательного добавления предложения и набора его префиксов, состоящего из последовательности слов, в общее дерево.

Оценка методов предсказания ввода оценивается по нескольким критериям: Keystroke Savings (KS, количество сохранённых нажатий), Typing Rate (скорость набора) и perplexity (степень неопределённости вероятностной модели).

Количество сохранённых нажатий (KS) и количество нажатий на символ (KSPC) являются основными характеристиками систем предсказания слов. KS вычисляется по следующей формуле [Trnka 2008]: _ keystrokesnormal - keystrokeswithprediction KS = keystrokesnormal 100% где keystrokesnormai - количество нажатий для ввода некоторого текста; keystrokeswithprediction - количество нажатий для ввода того же самого текста с помощью системы предсказания слов.

Концепция, структура и задачи программного комплекса оптимизации заполнения электронного резюме

Согласно представленному сценарию работы соискателя по публикации электронного резюме, для программного комплекса, реализующего алгоритм предсказания словоформы в тексте электронного резюме, ставится следующие ограничение. Предсказание словоформы должно осуществляться непосредственно во время заполнения соискателем электронного бланка на сайте трудоустройства. Соискатель не должен вводить данные резюме куда-либо ещё, кроме предназначенных для этого полей электронного бланка. Вследствие этого ограничения программный комплекс оптимизации заполнения электронного резюме должен иметь трёхуровневую клиент-серверную архитектуру.

Таким образом, программный комплекс оптимизации заполнения электронного резюме включает в себя четыре компонента: 1) База данных предсказания словоформы. Она выполняет функцию хранилища для синтаксических пар и их частотных характеристик, перечисленных в разделе 2.4.3, и промежуточных результатов построения синтаксических пар. 2) Менеджер комбинаторного частотного машинного словаря – импорт текстов рубрики «Обязанности, функции, достижения», редактирование и разбиение импортированных текстов, построение 103 синтаксических пар, расчёт частотных характеристик, тестирование алгоритмов предсказания словоформы. 3) Веб-сервис автодополнения текста – подбор словоформ по алгоритму, описанному в разделе 3.2.2. 4) Клиент автодополнения текста – редактирование текста рубрики «Обязанности, функции, достижения», обращение к веб-сервису автодополнения текста. Структура программного комплекса оптимизации заполнения электронного резюме представлена на рисунке 28.

Хранение данных программного комплекса оптимизации заполнения электронного резюме осуществляется в базе данных формата Microsoft Access. От базы данных разрабатываемого программного комплекса требуется хранение двух групп данных: 1) данные для синтаксического анализа текстов электронного резюме и 2) частотные словари. Схема базы данных программного комплекса оптимизации заполнения электронного резюме представлена на рисунке 29.

Для хранения данных отдельных этапов синтаксического анализа используются три таблицы: TextData, SentenceData, SurfaceLinkData. Опишем их структуру и связи с отдельными этапами синтаксического анализа: 1) Таблица TextData содержит тексты рубрики «Обязанности, функции, достижения», загруженные с сайта трудоустройства HeadHunter (столбец ThemeText), и адреса веб-страницы, с которых эти тексты были импортированы (столбец URL). 2) Отдельные простые предложения, полученные на втором этапе синтаксического анализа, сохраняются в таблице SentenceData (столбец Sentence). Для каждого предложения в этой таблице дополнительно включается информация о его типе – способ выражения сказуемости (столбец VType), наличие второстепенных членов предложения (столбец ExtType), соотнесённость компонентов мысли (столбец BType) и цель высказывания (столбец SType) – и разметке (столбец MyStemData). 3) В таблице SurfaceLinkData хранятся синтаксические пары каждого отдельного предложения. Левая и правая словоформы синтаксической пары расположены в соответствующих столбцах LeftForm и RightForm.

Частотные словари представлены двумя таблицами – FreqCompDict и SynCompDict. Таблица FreqCompDict представляет собой частотный словарь словоформ. В ней хранятся все возможные словоформы (столбец Form), встречаемые в синтаксических парах и текстах рубрики «Обязанности, функции, достижения», и абсолютная частота их встречаемости в текстах (столбец Freq). Строки таблицы SynCompDict представляют собой словарные статьи комбинаторного частотного машинного словаря. Параметры словарной статьи и столбцы таблицы соотнесены следующим образом: абсолютная частота встречаемости синтаксической пары – Freq, абсолютная частота встречаемости левой и правой словоформы – LeftFreq и RightFreq соответственно, индекс направления левой и правой словоформы – LeftFAI и RightFAI соответственно, доминантность левой словоформы – IsleftTop.

Оставшаяся таблица – SurfaceLinks – содержит записи о поверхностно-синтаксических отношениях, которые применяются при автоматическом построении синтаксических пар словоформ. Для описания поверхностно-синтаксических отношений используются списки граммем (столбцы LeftProps и RightProps), словоформы синтаксической пары (столбцы LeftForm и RightForm) и связь словоформ по числу (столбец SameNum) и падежу (столбец SameCase).