Как выразился известный классик "велик и могуч русский язык". Широта возможностей выражения мыслей и описания бытия это подарок для поэтов, но боль для учёных, создающих алгоритмы распознавания смыслов в текстовой информации или в разговорных коммуникациях.
Наша цель, как исследователей, создать технологию качественной расшифровки закладываемого во фразу набора слов. Это интересная и многогранная тема. Работая над этой задачей мы обнаружили, что помимо распознавания смыслового содержания мы можем проводить высоко достоверную аналитику психоэмоционального сопровождения автора текста или фраз.
Если попросить тысячу людей прокомментировать ситуацию человека с мороженым под жарким солнцем, то мы получим тысячу разных текстов с разным содержанием. Каждый расскажет о своём, с позиции своего мировозрения, эмоционального состояния, взгляда на жизнь, оптимизма, знаний, интеллектуальных способностей, привычек самовыражения... Однако оказалось, что намного больше информации о человеке можно получить анализируя не что он говорить, а как он это делает. Смысл сказанного рассказывает 20% о человеке, остальные 80% содержатся в том как он это выражает-формулирует.
Все мы говорим на одном языке (в данном случае русском), но делаем это совершенно по-разному. У каждого из нас свой индивидуальный рисунок речи. Это значит, что у нас свои шаблоны построения вопросов, использования слов, формулирования фраз, свой словарный запас, свои активно используемые словечки, своя стилистика выражения мыслей, свои слова паразиты, свой эмоциональный окрас речи, свой жаргон, для кого-то привычность и приемлемость употребления матерных и высоко эмоциональных слов. Выявив в текстовом содержании, эти характеристики, можно создать набор параметров, позволяющий классифицировать человека-автора слов, относя его к той или иной категории или группе людей, по схожести такого набора.
Современные технологии ещё не позволяют проникнуть человеку в мозг и "увидеть" какие мыслительные процессы там происходят. Но, чтобы получить ответы на интересующие вопросы, вовсе не обязательно погружаться внутрь человека, достаточно лишь внимательно понаблюдать за ним. Речевая аналитика это своеобразный способ наблюдения за индивидом с позиции информационного обмена. Если проанализировать всё, что человек говорит и пишет в течении, скажем, дня, можно очень многое узнать о человеке. Намного больше, чем мы все думаем...
Все мы стараемся скрыть свой внутренний мир. Находясь в обществе мы надеваем маску вежливых и приличных людей. В близком кругу - можем быть более "настоящими". На публике человек как правило старается избегать употребления нецензурных слов. В дружеской обстановке знакомых ему людей он менее склонен следовать этой модели поведения и потому менее контролирует свои слова. Но надеваемая маска лишь иллюзия сокрытия истинного психоэмоционального интеллекта человека.
Мы можем говорить расчётливо подбирая слова, но то как мы это будем делать вкупе с тем, что мы будем говорить - какие вопросы задавать, какие комментарии высказывать, как именно формировать фразы, эмоциональность и ясность высказываний очень многое расскажут о нас алгоритмам психоанализа. Частота смены фокуса внимания, последовательность выражения мыслей, способность к длительному удержанию темы, стилистика речи, наличие и частота использования слов-паразитов, выбор слов-синонимов, разнообразие мыслей, смена эмоционального содержания - позитивизм или негатив высказываний, жалобы или советы это всё далеко не полный список параметров формулы психоэмоционального анализа.
Мы не осознаём своих шаблонов и редко способны выявлять их у других людей. Но алгоритмы в отличие от нас способны более детально и скрупулёзно исследовать - анализировать то, о чём и как мы общаемся и какой информационный след оставляем. Проводя аналитику над всем вышеперечисленным можно выявить определённые речевые и психические шаблоны построения фраз и шаблоны периодически повторяющихся тем и смыслов, концепции сознания, на которых сосредоточен человек. Такая аналитика позволяет классифицировать автора слов к тем или иным выделяемым группам.
Давно известны статистические методы оценки текста с целью выявления его авторства. Действительно, шаблоны используемых литературных приёмов создателей текстов хорошо выявляются и позволяют с высокой степенью точности судить о принадлежности произведения перу того или иного писателя. Алгоритмы достаточно легко выявляют такие авторские шаблоны и по ним точно идентифицируют принадлежность текста. Люди не настолько внимательны, чтобы своими способностями проводить такую аналитику. Эти подходы анализа текстов лишь наглядно демонстрируют существование скрытых паттернов от ясного осознавания и восприятия их человеком. Но отсутствие осознавания не отменяет факта их наличия.
Полученные нами результаты в исследовании речевой аналитики в разрезе психо эмоциональных портретов людей позволяют получить много инсайдерской информации о том, что как кажется людям они успешно скрывают... Но на самом деле мы ещё в самом начале пути своего исследования. С увеличением количества исследуемых объёмов точность и скорость определения психологического портрета будет лишь улучшаться и методика будет совершенствоваться.
Психологи такие исследования проводят в индивидуальном порядке с помощью тестов и методик. Алгоритмы же способны получать сходные результаты совершенно другими способами - массово и на основе анализа смысловой и эмоциональной статистики, используя нейронные сети и методы машинного обучения. Такая аналитика способна делаться полностью без участия в анализе человека и потому не подвержена субъективному восприятию и предвзятой оценке.
Применение нашей технологии будет полезно в таких сферах как, например, HR-интервью для выявления более глубокого понимания качеств характера кандидата на должностью. В продажах - для быстрого выявления психотипа клиента и выбора правильной стратегии диалога с ним. Речевая аналитика позволяет лучше понимать своих клиентов. Если у вас как компании есть накопленные записи разговоров с клиентами, вы можете обогатить клиентские профили в CRM-системе большим количеством информации о психологических портретах клиентов. Полезность таких данных будет очевидна в рекомендательных системах, для выявления более глубоких параметров схожести пользователей, нежели используемые сейчас суждения об их похожести лишь на основании поведенческих факторов.
Скажем честно, у нас нет готовых публичных сервисов для проведения такого анализа и вряд ли мы будем их делать. У нас есть набор технических методов, настраиваемых в индивидуальных решениях для конкретных задач выявления необходимых аналитических и вероятностных принадлежностей автора высказываний к тем или иным интересующим группам с определёнными психологическими или социальными характеристиками.
Говоря об этих исследованиях нельзя обойти стороной тему личной конфиденциальности. С одной стороны, использование такой технологии поднимает этические вопросы вмешательства в личную жизнь людей. Но с другой стороны - очевидно, что мы используем только то, что открыто транслируется самим человеком в мир.
Нашими исследованиями руководят противоречивые желания - стремление не преступить грань этичности и желание понять насколько глубоко мы можем познать человеческую суть. Мы не спешим открывать наши разработки миру, понимая, что использовать их можно как для пользы так и для вреда и манипуляций. Можно лишь заметить, что в настоящее время ни в одной стране мира нет запретов на проведение таких исследований.
Живя в обществе людей мы не можем вести себя молчаливыми статуями. Мы существа высоко социальные - общение это наша жизненная потребность. Это и процесс получения информации и эмоций от окружающих так и собственные процессы порождения информации и эмоций. Люди не могут быть вне этого процесса обмена.
До появления методов машинного обучения было сложно анализировать такой обмен. Но даже обладая развитой математикой было далеко не очевидно понять как подступиться к таким исследованиям и от какой базы знаний отталкиваться. Вне сомнений, эта тема заслуживает серьёзных исследований и способна поведать человечеству много о себе самом - неожиданного, неочевидного и скрываемого. Понять истинный состав нашего общества по оценке эмоционального интеллекта и психологическим характеристикам его членов.