Распознавание эмоционального состояния пользователя на основе анализа клавиатурного почерка

Данная статья посвящена анализу поведенческих паттернов при взаимодействии человека и компьютера. В ходе исследования анализировалась динамика нажатия клавиш, в то время как участники описывали опыт, связанный с переживанием положительных и отрицательных эмоций. Проведена опытно-экспериментальная работа с участием 50 пользователей компьютера. Участникам было предложено вспомнить наиболее негативный и позитивный опыт, связанный с путешествиями и воспоминаниями о чем-либо и написать свое мнение об этом. В момент набора текста осуществлялась регистрация динамических характеристик клавиатурного почерка. Собранные данные подверглись обработке и анализу. Предварительные результаты, описываемые в настоящей статье, позволяют сделать вывод, что можно распознать положительные и отрицательные эмоции по собранным шаблонам нажатий клавиш с точностью, превышающей случайную догадку.

Аннотация статьи
клавиатурный почерк
динамика нажатия клавиш
распознавание эмоций
Ключевые слова

1. Введение

Эта статья посвящена анализу поведенческих паттернов при взаимодействии человека и компьютера. Поведенческие биометрические характеристики используются в системах безопасности или приложениях идентификации наряду с физиологическими характеристиками, такими как изображения лица, ладони, отпечатков пальцев или радужной оболочки глаза.

В статье описывается исследование, в ходе которого мы анализируем закономерности динамики нажатия клавиш при написании текстов, связанных с переживанием определённых эмоций. Участников попросили написать мнения об их худшем и лучшем воспоминании за прошедшее время, а также описать опыт лучшего и худшего путешествия. Во время написания текста осуществлялся сбор данных о динамических характеристиках нажатия клавиш. Объектом исследования при этом служит поведенческая биометрия, а предметом – динамические характеристики клавиатурного почерка.

При подготовке исследования не было обнаружено работ, посвященных такой же теме, что говорит о научной новизне исследования. Динамика нажатия клавиш часто анализировалась с целью аутентификации и идентификации пользователей, выявления мнений, мониторинга действий пользователя в системе. Задача, формулируемая в раках исследования сводится к определению различительного потенциала динамических характеристик клавиатурного почерка человека для целей определения его эмоционального состояния в момент набора текста. Хотя задача определения мнений кажется близким к настоящему исследованию, на самом деле это не совсем так. Тип выражаемого мнения может, но не обязательно должен вызывать определенное эмоциональное состояние, поэтому в рамках данного исследования пользователей просят описать воспоминания, что само по себе менее рационально и подвержено контролю со стороны человека.

2. Исследования со сходной проблематикой

Исследования, которые в наибольшей степени связаны с настоящим, включают работы по количественной оценке динамики нажатия клавиш и их использованию при анализе состояния человека. Все они падают в категорию поведенческой биометрии, основанной на том, как люди выполняют некоторые действия, которые варьируются в зависимости от различных навыков, стилей, предпочтений, знаний или стратегии [1]. Поведенческие биометрические данные, полученные с помощью стандартных устройств ввода, например динамика нажатия клавиш, движения мыши и жесты на сенсорном экране, имеют некоторые преимущества. Они не требуют какого-либо специального оборудования и незаметны для пользователей, поэтому могут быть записаны во время повседневной деятельности пользователей, не мешая им. С другой стороны, следует отметить, что они не являются стабильными во времени, что приводит к более низкой точности систем распознавания, основанных на этих измерениях, чем в случае физиологических параметров.

Подход с динамикой нажатия клавиш также может быть реализован не только на персональных компьютерах, но и на мобильных телефонах, которые, помимо виртуальной клавиатуры, предлагают возможность включения различных других датчиков для считывания данных в момент ввода, например, сенсорного экрана или акселерометра, а также могут интегрироваться с умными часами, регистрирующими различные физиологические характеристики [2,3]. Комбинация параметров динамики нажатия клавиш и физических характеристик человека, таких как пульс, движения, затраты энергии и сон, собранных с помощью умных часов, использовалась для прогнозирования настроения пользователей [4].

3  Методика исследования

В настоящей статье описывается подход к распознаванию эмоционального состояния людей при описании воспоминаний на основе анализа динамических характеристик клавиатурного почерка. В этом разделе приводится описание методов, которые были применены при разработке, выполнении и последующей обработке данных исследования.

3.1. Экспериментальная модель. Для проверки гипотезы исследования был разработан и проведен эксперимент. Полная рандомизация отбора испытуемых была невозможна в имеющихся условиях. Влияние этого факта и его возможные последствия рассматриваются в заключении. Все участники были добровольцами. Был использован единый подход, так как целью эксперимента было выявление различий между двумя состояниями одного и того же человека, а не индивидуальные отличия одного человека от другого.

Общий сценарий работы включал в себя несколько этапов:

  1. Запущена программа для сбора динамических характеристик клавиатурного почерка.
  2. Участнику эксперимента предложено заполнить анкету, включающую метрические данные, мнение о лучшем воспоминании за последний год, мнение о худшем воспоминании за последний год, воспоминание о лучшем путешествии, воспоминание о худшем путешествии.
  3. В перерывах между описанием мнений участники дополнительно заполняли анкеты, связанные с эмоциями.
  4. Затем программное обеспечение для захвата нажатий клавиш отключалось, и собранные данные о нажатиях клавиш сохранялись в файл.

Инструмент, используемый для определения эмоционального состояния участников до и между написанием мнений, представлял собой анкету самооценки [5], построенную на основе 9-балльной шкалу вместе с визуальным представлением испытываемой эмоции. Пример адаптированной анкеты самооценки представлен на рисунке 1.

Рис. 1. Анкета самооценки

Решение об использовании подобной анкеты самооценки было принято на основе цели исследования. Так как главной целью было выявить различия между положительными и отрицательными эмоциями при написании текстовых сообщений, наиболее подходящей шкалой стала трехмерная модель PAD (pleasure, arousal, dominance). Эта психологическая модель предложена А. Меграбианом и Дж. Расселом в 1974 году и служит для описания и измерения эмоциональных состояний человека. Эта модель основана на трех измерениях всех эмоций: удовольствие, возбуждение и беспокойство, а использованная анкета построена в рамках того же подхода.

3.2. Ход эксперимента. Компьютерный стенд для написания мнений был стандартизирован: использовались один и тот же компьютер, клавиатура и мышь. Участникам не платили за участие. В исследовании приняли участие 50 человек (40 мужчин, 10 женщин в возрасте от 25 до 30 лет). Мы хотели, чтобы выборка была как можно более однородной, поскольку мы не хотел анализировать влияние возраста на шаблоны нажатия клавиш, рассматривая его как смешивающую переменную. Различия в динамике нажатия клавиш среди различных возрастных групп были исследованы в ряде работ, посвященных распознаванию возраста на основе динамики нажатия клавиш [6]. После сбора полученные данные были анонимизированы. Данные одного участника были исключены из дальнейшего анализа, поэтому для анализа были использованы данные 49 участников. Причина исключения заключалась в том, что участник вводил случайные буквы вместо мнений, которые у него запрашивались. Пока участники писали мнения, данные о нажатиях клавиш записывались с помощью оригинальной программы. Программа была включена до того, как участник начал писать мнение, и была выключена после завершения ввода последовательности из четырёх описанных выше мнений. Один сеанс написания отзывов был запланирован на 5 минут (средняя продолжительность: 3 мин 22 сек, минимальная: 1 мин 09 сек, максимальная: 5 мин 11 сек). Затем временные ряды необработанных нажатий клавиш были обработаны, как описано в разделе 3.3.

Как описано выше, перед началом эксперимента и после написания каждого из четырех мнений участник заполнял анкету самооценки. Рисунок 2 демонстрирует средние значения удовольствия, возбуждения и беспокойства, рассчитанные на основе пяти анкет от всех участников. Это ярко отражает наличие динамики во времени. В случае с характеристиками удовольствия и возбуждения могут наблюдаться некоторые различия в ходе проведения эксперимента. А вот беспокойство, скорее всего, наиболее стабильно с течением времени. Частью этого исследования является анализ возможной взаимосвязи между этими изменениями значений PAD в зависимости от типа мнения (положительное / негативное).

Рис. 2. Средние значения трех измерений эмоционального переживания по этапам эксперимента

Рисунок 3 представляет распределение значений удовольствия, возбуждения и беспокойства, рассчитанных на основе четырех анкет самооценки от каждого участника, заполненных после написания каждого из четырех мнений. Можно заметить, что значения удовольствия смещаются в сторону положительных значений. В случае возбуждения экстремальное значение девять, указывающее на самый низкий уровень возбуждения, не зарегистрировано ни одним из участников.

а)

б)

в)

Рис. 3. Распределение значений силы переживаний: a) удовольствия, б) возбуждения и в) беспокойства

На рисунке 4 представлены аналогичные гистограммы, но созданные отдельно на основе отчетов, отправленных после положительных и отрицательных отзывов. Некоторые различия в распределении могут наблюдаться в случае удовольствия и возбуждения. Значения удовольствия, регистрируемые для положительных мнений, смещаются в сторону более низких значений (указывающих на большую интенсивность переживания), чем в случае отрицательных мнений, что кажется весьма прогнозируемым. Два распределения беспокойства почти перекрывают друг друга, что может свидетельствовать о том, что значения беспокойства не различаются между при написании положительных и отрицательных отзывов. Для фактического сравнения этих распределений был использован статистический тест. В связи с тем, что анкета самооценки представляет собой упорядоченную 9-балльную шкалу Лайкерта, был применен тест Манна-Уитни. Результаты представлены в таблице 1. Можно заметить, что распределение маркеров, связанных с положительными и отрицательными мнениями, существенно отличается (p-значение < 0,05) при ярких переживаниях удовольствия и возбуждения.

а)

б)

в)

Рис. 4. Распределение значений силы переживаний: a) удовольствия, б) возбуждения и в) беспокойства в зависимости от модальности описываемого воспоминания.

Таблица 1

Сравнение распределения значений PAD для положительных и негативных мнений: средние значения и результаты теста Манна-Уитни

 

Удовольствие

Возбуждение

Беспокойство

Положительное мнение

3,24

4,97

5,67

Негативное мнение

4,14

4,36

5,63

Тест-статистика

3290

3831,5

4796,0

p-значение

0,0001

0,0065

0,4944

Рисунок 5 демонстрирует аналогичные гистограммы, которые отражают результаты заполненных анкет самооценки, собранных после написания мнений о путешествиях и воспоминаниях. В этом случае также существует некоторое расхождение между двумя распределениями удовольствия, где мнениям о путешествиях присваивается больше значений свидетельствующих о высокой интенсивности переживания, чем о воспоминаниях. Результаты, полученные с помощью теста Манна-Уитни для этих распределений, представлены в таблице 2. Распределение маркеров воспоминаний и путешествий существенно отличается (p-значение < 0,05) для интенсивности переживания удовольствия.

а)

б)

в)

Рис. 5. Распределение значений силы переживаний: a) удовольствия, б) возбуждения и в) беспокойства в зависимости от содержания описываемого мнения

Таблица 2

Сравнение распределения значений PAD для описания путешествий и воспоминаний: средние значения и результаты теста Манна-Уитни

 

Удовольствие

Возбуждение

Беспокойство

Описание путешествия

3,43

4,74

5,74

Описание воспоминания

3,96

4,58

5,56

Тест-статистика

4038,5

4546,5

4605,0

p-значение

0,0254

0,2570

0,3067

3.3. Процесс выделения признаков. Для сбора данных, поступающих с клавиатуры, использовалось приложение, работающее в фоновом режиме [7]. Участники сами запустили приложение в начале сессии и отключали в конце. Каждая сессия была организована полностью идентично. Факт, что некоторые данные о нажатиях клавиш захватывались и записывались, никак не влиял на привычное взаимодействие пользователя с персональным компьютером. Все участники были проинформированы о записи данных, однако они не были посвящены в детали исследования, особенно те, которые касаются выдвинутых гипотез. Все участники также знали, что данные о нажатиях клавиш впоследствии будут проанализированы. Такой подход к информированию был необходим для предотвращения преднамеренного изменения поведения при нажатии клавиш.

Первым этапом обработки данных является их сегментация. Из-за того, что пользователь может прерываться для обдумывания текста и переживания эмоций, вся последовательность нажатий клавиш была разделена на серию более коротких последовательностей в зависимости от наличия пауз. Для определения пределов набора последовательностей введен порог ожидания. Если время между нажатием клавиши и нажатием следующей превышало порог ожидания, то в этом месте серия разделялась. Большая величина порога приводит к получению более длинных непрерывных серий. Все временные характеристики, описанные далее, были рассчитаны относительно извлеченных серий. Разделение выполнялось с порогом, равным трем секундам.

После сегментации данных была выполнена процедура извлечения признаков. Ряд параметров был рассчитан на основе необработанных данных. Их можно разделить на следующие группы: функции биграмм, функции триграмм, специальные функции биграмм, частотные функции и скорость набора текста. Общее количество параметров составило 51. Подробный список всех функций представлен в таблице 3.

Функции биграмм и триграмм – это временные характеристики для двухбуквенных и трехбуквенных последовательностей. Все они основаны на параметрах, обычно используемых при анализе динамики нажатия клавиш, то есть времени нажатия клавиши, времени между отпусканием клавиши и нажатием следующей, продолжительности последовательностей клавиш (время между нажатием первой и нажатием последней клавиши в последовательности) и времени между последующими нажатиями клавиш. Кроме того, также было рассчитано количество событий в биграммах и триграммах. Это количество всех событий нажатия и отпускания клавиши в последовательности, поэтому обычно это четыре события в биграммах и шесть в триграммах. Иногда, особенно когда пользователь быстро вводит текст, случается, что пользователь нажимает следующую клавишу, прежде чем отпустить предыдущую. В таких случаях между обычными событиями могут появляться дополнительные события, и тогда значения этих атрибутов могут отличаться от четырех или шести, соответственно. Выборка данных, полученных от каждого пользователя, содержит множество биграмм и триграмм. Характеристики динамики нажатия клавиш были рассчитаны для каждой из них, а затем их средние значения и стандартные отклонения были сохранены как значения признаков в векторе признаков, результирующем соответствующую выборку.

Некоторые биграммы представляют собой последовательные нажатия двух клавиш, но не являются двухбуквенными сочетаниями. Это специальные квази-биграммы, содержащие либо левую, либо правую клавишу Shift в качестве первой, используемые для написания прописных букв. Учитывая высокую частоту появления таких квази-биграмм, они также были включены в анализ наряду с обычными биграммами.

Следующая группа характеристик – это частотные параметры. В отличие от биграмм и триграмм, они не описывают ритм нажатия клавиш. Некоторые такие параметры могут указывать на то, как пользователи вносят исправления (использование пробелов, клавиш удаления), перемещаются по тексту при помощи клавиш PgUp, PgDn, Home, End, Вверх, Вниз, Влево, Вправо) или работают со знаками пунктуации. Частота в этом контексте рассчитывается как отношение количества нажатий конкретной клавиши к общему количеству нажатий клавиш. Другая частотная характеристика была рассчитана иначе – как отношение количества прописных букв к общему количеству букв в набранном тексте. Кроме того, была рассчитана скорость набора текста, которая характеризуется количеством нажатий клавиш в секунду.

Таблица 3

Извлекаемые функции

Функции

Условные обозначения

Среднее значение

Стандартное отклонение

Биграммы

длительность между нажатиями 1-й и 2-й клавиш

Б1н2н_ср

Б1н2н_от

длительность удержания 1-й клавиши

Б1н1о_ср

Б1н1о_от

длительность между отпусканием 1-й клавиши и нажатием 2-й клавиши

Б1о1н_ср

Б1о1н_от

длительность удержания 2-й клавиши

Б2н2о_ср

Б2н2о_от

длительность биграммы: от нажатия 1-й клавиши до отпускания 2-й клавиши

Б1н2о_ср

Б1н2о_от

общее количество событий для биграммы

Бсоб_ср

Бсоб_от

Триграммы

длительность между нажатиями 1-й и 2-й клавиш

Т1н2н_ср

Т1н2н_от

длительность удержания 1-й клавиши

Т1н1о_ср

Т1н1о_от

длительность между отпусканием 1-й клавиши и нажатием 2-й клавиши

Т1о1н_ср

Т1о1н_от

длительность между нажатиями 2-й и 3-й клавиш

Т2н3н_ср

Т2н3н_от

длительность удержания 2-й клавиши

Т2н2о_ср

Т2н2о_от

длительность между отпусканием 2-й клавиши и нажатием 3-й клавиши

Т2о3н_ср

Т2о3н_от

длительность удержания 3-й клавиши

Т3н3о_ср

Т3н3о_от

длительность триграммы: от нажатия 1-й клавиши до отпускания 3-й клавиши

Т1н3о_ср

Т1н3о_от

общее количество событий для триграммы

Тсоб_ср

Тсоб_от

Прописные буквы (квази-биграммы с левой и правой клавишами Shift)

время между нажатием правой клавиши Shift и нажатием клавиши с буквой

Р1н2н_ср

Р1н2н_от

время всей квази-биграммы: от нажатия правой клавиши Shift до отпускания клавиши с буквой или специальным символом

Р1н2о_ср

Р1н2о_от

доля времени пересечения клавиши Shift и клавиши с буквой: время между нажатием клавиши с буквой и отпусканием клавиши Shift

Р1о2н

-

время между нажатием левой клавиши Shift и нажатием клавиши с буквой

Л1н2н_ср

Л1н2н_от

время всей квази-биграммы: от нажатия левой клавиши Shift до отпускания клавиши с буквой или специальным символом

Л1н2о_ср

Л1н2о_от

доля времени пересечения клавиши Shift и клавиши с буквой: время между нажатием клавиши с буквой и отпусканием клавиши Shift

Л1о2н_ср

-

Частотные характеристики

частота использования пробела

Пробел

-

частота использования клавиши Backspace

Назад

-

частота использования клавиши Delete

Удалить

-

частота использования клавиши Вверх

Вверх

-

частота использования клавиши Вниз

Вниз

-

частота использования клавиши Влево

Влево

-

частота использования клавиши Вправо

Вправо

-

частота использования левой клавиши Shift

LShift

-

частота использования правой клавиши Shift

RShift

-

частота использования прописных букв

Проп

-

Скорость набора

среднее количество нажатий клавиш в секунду

Скорость

-

3.4. Предварительная обработка данных. Эксперименты по классификации проводились как для исходных значений признаков, так и для значений, полученных после некоторой нормализации. К извлеченным объектам было применено несколько процедур нормализации. Для каждого пользователя было извлечено пять векторов признаков. Первый вектор, который можно назвать базовым, содержал характеристики, полученные на основе всего текста, набранного пользователем, то есть вся сессия не была разделена на положительную и негативную части, а рассматривалась как единый этап набора текста. Остальные четыре вектора были извлечены на основе двух положительных и двух отрицательных фрагментов текста соответственно. Затем были созданы два типа тренировочных наборов:

  • абсолютный набор данных, содержащий исходные четыре вектора для каждого пользователя;
  • относительный набор данных, содержащий для каждого пользователя четыре вектора после вычитания из них базового вектора пользователя.

Более того, оба набора были нормализованы путем стандартизации их так, чтобы они имели нулевое среднее значение и стандартное отклонение, равное 1.

3.5. Методы анализа. Анализ данных включал два основных этапа. Целью первого этапа была оценка полученных признаков с точки зрения их различительного потенциала. Прежде всего, было проверено, являются ли существенными различия значений собранных шаблонов нажатий клавиш при написании текстов с выражением положительных и негативных эмоций. Дополнительно, для оценки зависимости между признаками и классами при решении задач классификации использовалась функция взаимной информации [8]. Взаимная информация – статистическая функция двух случайных величин, описывающая количество информации, содержащееся в одной случайной величине относительно другой (1).

    (1)

В случае настоящего исследования сила эмоциональных переживаний удовольствия, возбуждения и беспокойства при описании положительных и негативных опытов. Такой подход используется при выборе признаков в качестве меры степени взаимосвязанности между наборами данных [9].

Целью второго этапа является обучение и тестирование классификаторов для этих трех классификационных задач. Было подготовлено и протестировано несколько классификаторов. В случае распознавания уровня удовольствия или возбуждения были применены три различные процедуры маркировки в зависимости от порогового значения. Подробное описание проведенного анализа и полученные результаты представлены далее.

4. Предварительные результаты

4.1. Оценка динамических характеристик клавиатурного набора текста. Собранный набор функций содержит 51 параметр. Большинство из них уже были включены в другие научные исследования [10]. Очевидно, что не все из них могут быть одинаково эффективны в решении поставленных задач и достижении цели настоящего исследовании. Поэтому целесообразно проанализировать важность отдельных параметров.

Цель первого теста состояла в выявлении характеристик, которые существенно различаются при описании положительных и негативных опытов. Для решения этой задачи использовался зависимый t-критерий для парных выборок [11], определяемый как:

    (2)

где  это средняя разница между значениями, полученными для положительных и негативных опытов соответственно, 

Sd – стандартное отклонение, а n – количество степеней свободы. В нашем случае был применен двусторонний критерий, поскольку не было никаких оснований предполагать какое-либо направление наблюдаемых изменений, то есть значения признаков могут как увеличиваться, так и уменьшаться.

Во втором столбце таблицы 4 представлены результаты тестирования для всех функций. t-статистика превысила критическое значение для уровня значимости p = 0,05 для 12 признаков, которые выделены жирным шрифтом. Большинство из них являются временными характеристиками, описывающими биграммы и триграммы. Одна из функций относится к частотным параметрам и описывает частоту использования пробела. В конечном счете оказалось, что скорость набора текста имеет существенные различия при описании положительных и негативных опытов.

Таблица 4

Парные результаты t-критерия для описаний положительных и негативных опытов, p-значения ниже 0,05 выделены жирным, ранги приведены в скобках

Функция

p-значение (ранг)

Все образцы, n = 196

Опыты о путешествиях, n = 98

Опыты о воспоминаниях, n = 98

Б1н2н_ср

0,0110 (5)

0,0862 (5)

0,0636 (5)

Б1н2н_от

0,0272 (7)

0,3060 (22)

0,0406 (2)

Б1н1о_ср

0,9922 (51)

0,3446 (25)

0,3407 (25)

Б1н1о_от

0,6492 (40)

0,9741 (51)

0,5640 (35)

Б1о1н_ср

0,0092 (4)

0,0365 (3)

0,1042 (10)

Б1о1н_от

0,0306 (8)

0,0964 (7)

0,1604 (16)

Б2н2о_ср

0,2982 (26)

0,2786 (21)

0,6908 (39)

Б2н2о_от

0,8872 (47)

0,7062 (36)

0,5439 (34)

Б1н2о_ср

0,0456 (12)

0,2275 (14)

0,1146 (12)

Б1н2о_от

0,2168 (20)

0,3095 (23)

0,4593 (31)

Бсоб_ср

0,4972 (33)

0,2652 (20)

0,9736 (48)

Бсоб_от

0,9639 (48)

0,7703 (40)

0,8601 (44)

Т1н2н_ср

0,0404 (9)

0,2257 (13)

0,1012 (9)

Т1н2н_от

0,0815 (16)

0,5219 (29)

0,0743 (6)

Т1н1о_ср

0,8501 (46)

0,3832 (27)

0,2019 (20)

Т1н1о_от

0,4885 (31)

0,9490 (48)

0,3434 (26)

Т1о1н_ср

0,0425 (10)

0,1224 (8)

0,1821 (18)

Т1о1н_от

0,0679 (15)

0,2338 (16)

0,1717 (17)

Т2н3н_ср

0,0245 (6)

0,0953 (6)

0,1279 (14)

Т2н3н_от

0,0647 (14)

0,3188 (24)

0,1157 (13)

Т2н2о_ср

0,2479 (22)

0,1326 (10)

0,8699 (45)

Т2н2о_от

0,3596 (28)

0,7236 (39)

0,3640 (27)

Т2о3н_ср

0,0085 (3)

0,0297 (2)

0,1092 (11)

Т2о3н_от

0,0448 (11)

0,1235 (9)

0,1894 (19)

Т3н3о_ср

0,2469 (21)

0,2553 (19)

0,6115 (37)

Т3н3о_от

0,8431 (45)

0,6929 (35)

0,4735 (32)

Т1н3о_ср

0,0580 (13)

0,2302 (15)

0,1472 (15)

Т1н3о_от

0,6020 (37)

0,8435 (43)

0,6057 (36)

Тсоб_ср

0,5771 (35)

0,2485 (18)

0,8446 (43)

Тсоб_от

0,9901 (50)

0,6742 (34)

0,7637 (41)

Пробел

0,0007 (1)

0,0052 (1)

0,0556 (4)

Назад

0,1130 (18)

0,1398 (11)

0,4749 (33)

Удалить

0,1119 (17)

0,1755 (12)

0,3223 (24)

Вверх

0,6051 (38)

0,5610 (32)

0,9763 (49)

Вниз

0,2587 (23)

0,2395 (17)

0,9767 (50)

Влево

0,8165 (44)

0,7099 (38)

0,7818 (42)

Вправо

0,3073 (27)

0,7091 (37)

0,0382 (1)

LShift

0,9650 (49)

0,9601 (50)

0,8860 (46)

RShift

0,2980 (25)

0,5586 (31)

0,3935 (28)

Л1н2н_ср

0,2593 (24)

0,7766 (41)

0,0879 (7)

Л1н2н_от

0,5596 (34)

0,6200 (33)

0,2197 (21)

Л1н2о_ср

0,1976 (19)

0,8832 (45)

0,0949 (8)

Л1н2о_от

0,4886 (32)

0,9213 (47)

0,2769 (23)

Л1о2н_ср

0,5827 (36)

0,5179 (28)

0,9156 (47)

Р1н2н_ср

0,4292 (30)

0,7910 (42)

0,4325 (29)

Р1н2н_от

0,4109 (29)

0,8736 (44)

0,2713 (22)

Р1н2о_ср

0,7049 (41)

0,9507 (49)

0,6509 (38)

Р1н2о_от

0,7665 (43)

0,9148 (46)

0,4554 (30)

Р1о2н

0,6406 (39)

0,5234 (30)

0,9910 (51)

Проп

0,7135 (42)

0,3767 (26)

0,7256 (40)

Скорость

0,0068 (2)

0,0738 (4)

0,0439 (3)

5. Заключение

Исследование предоставило некоторые результаты, которые указывают на то, что модели динамики нажатия клавиш могут способствовать исследованию эмоциональных состояний пользователей при написании текста на клавиатуре. Однако, поскольку различия в собранных данных для положительных и негативных мнений еще требуют дополнительного изучения, итоговые результаты будут представлены в дальнейшем. Кроме того, уже на текущем этапе можно заключить, что большой интерес представляют возможные будущие исследования, которые могут включать комбинацию динамических характеристик клавиатурного набора текста с динамическими характеристиками движений мыши или с физиологическими характеристиками пользователей. Среди ключевых проблем, с которыми сталкивается настоящее исследование, целесообразно подчеркнуть проблему измерений. В настоящем исследовании используется постановка предопределенной задачи (описание конкретного положительного и негативного пережитого опыта) и анкета самооценки. Уязвимость такого подхода состоит в том, что, оба инструмента подвержены влиянию различных факторов. В результате они могут не отражать фактическое эмоциональное состояние, а лишь визуализировать субъективное восприятие пользователем собственных эмоций, переживаемых в конкретный момент и более того, не самих эмоций, а воспоминаний о них. В конечном счете, для будущего исследования также потребуется большая и менее однородная группа участников.

Текст статьи
  1. Killourhy, K.S. Comparing anomaly-detection algorithms for keystroke dynamics. / Killourhy, K.S.; Maxion, R.A. In Proceedings of the 2009 IEEE/IFIP International Conference on Dependable Systems & Networks, Lisbon, Portugal, 29 June–2 July 2009. – 2009. С. 125–134.
  2. Lee, H., Choi, Y.S., Lee, S., Park, I.P. Towards unobtrusive emotion recognition for affective social communication. In Proceedings of the 2012 IEEE Consumer Communications and Networking Conference (CCNC), Las Vegas, NV, USA, 14–17 January 2012. – 2012 C. 260–264.
  3. Shapsough, S., A.; Elkhorazaty, Y. Emotion recognition using mobile phones. In Proceedings of the 2016 IEEE 18th International Conference on e-Health Networking, Applications and Services (Healthcom), Munich, Germany, 14–16 September 2016. – 2016. C. 1–6.
  4. Anger, E.  User Authentication Based on Keystroke Dynamics Analysis.  In Computer Recognition Systems 4; Springer: Berlin/Heidelberg, Germany, 2011. – 2011. C. 667–675.
  5. Bradley, M.M., Lang, P.J. Measuring emotion: The self-assessment manikin and the semantic differential. J. Behav. Ther. Exp. Psychiatry 1994, 25. – 1995. C. 49–59.
  6. Pentel, A. Predicting User Age by Keystroke Dynamics. In Artificial Intelligence and Algorithms in Intelligent Systems; Silhavy, R., Ed.; Springer International Publishing: Cham, Switzerland, 2019. – 2019. C. 336–343.
  7. Lee, H., Choi, Y.S., Lee, S., Park, I.P. Towards unobtrusive emotion recognition for affective social communication. In Proceedings of the 2012 IEEE Consumer Communications and Networking Conference (CCNC), Las Vegas, NV, USA, 14–17 January 2012. – 2012. C. 260–264.
  8. Габидулин Э. М., Пилипчук Н. И. Лекции по теории информации – МФТИ, 2007. – 214 с. – ISBN 978-5-7417-0197-3
  9. Ross, B.C. Mutual Information between Discrete and Continuous Data Sets. PLoS ONE 2014, 9, e87357
  10. Epp, C., Lippold, M., Mandryk, R.L. Identifying Emotional States Using Keystroke Dynamics. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Vancouver, BC, Canada, 7–12 May 2011. – 2011. C. 715–724.
  11. Benjamini, Y., Hochberg, Y. Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. J. R. Stat. Society. Ser. B Methodol. 1995. – 1995. C. 289–300.
Список литературы