Ученые РФ научили компьютер распознавать пол человека по написанному им тексту

Служба новостей Автор статьи

Ученые НИЯУ МИФИ, Национального исследовательского центра «Курчатовский институт» и Воронежского государственного университета разработали метод, который позволяет компьютеру определять пол автора по написанному тексту с точностью до 80 процентов, сообщает «Научная Россия».

Разработка относится к области компьютерной лингвистики. Исследование проводилось при поддержке гранта Российского научного фонда, а его результаты были опубликованы в научном журнале.

Специалисты отмечают, что в письменной речи неизбежно отражаются особенности человека. По тексту можно получить информацию о поле автора, его психологических чертах и уровне образования. Поэтому речь рассматривается как важный инструмент психодиагностики.

Такие методы уже используются кадровыми службами крупных компаний и специалистами по безопасности. Кроме того, анализ текста может помогать в выявлении признаков некоторых заболеваний, включая деменцию и депрессию, а также склонности к суицидальному поведению.

Потребность в определении характеристик автора текста растет и из-за развития общения в интернете. Для компаний важно понимать, каким группам людей интересны их товары и услуги.

Ученые, работающие в этом направлении, среди которых лингвисты, психологи и специалисты по информационным технологиям, создают математические модели на основе числовых параметров текста. Такие модели помогают определять отдельные характеристики личности.

В ходе исследования авторы работы проверили эффективность разных технологий машинного обучения с применением нейронных сетей для анализа письменной речи. Они сравнили несколько подходов к определению пола автора текста.

С одной стороны, специалисты использовали классические алгоритмы машинного обучения, включая метод опорных векторов и градиентное усиление. С другой стороны, они проверили нейросетевые модели глубокого обучения, в том числе сверточные и рекуррентные нейронные сети с долгой краткосрочной памятью.

Доцент НИЯУ МИФИ Александр Сбоев рассказал, что высоких результатов удалось добиться благодаря современным нейросетевым моделям в условиях, когда автор не пытается скрыть свой пол. По его словам, следующая задача ученых — научиться определять пол автора в ситуациях, когда он намеренно его маскирует.

Исследователи привели примеры текстов с сайта знакомств, где авторы специально подписывались именем противоположного пола. Нейросеть смогла выявить несоответствие во всех десяти случаях.

Итоги работы показали, что наиболее эффективным оказался подход с использованием сверточной нейронной сети и методов глубокого обучения. Сейчас группа ученых занимается следующей задачей — распознаванием возраста автора по тексту.

Рекомендуем также:

  1. Никакого майонеза и тяжести после еды: салат «Богатырь» стал любимцем тех, кто хочет вкусно и полезно питаться
  2. Морозы до -36 ему нипочем, а цветение вызывает восторг: новый фаворит дачников уверенно вытесняет сирень
  3. Обычные котлеты теперь кажутся скучными: итальянская полпеттоне покоряет сочностью и готовится без утомительной лепки
  4. Одна ошибка перед камерой — и штраф уже оформлен: за сколько метров комплексы ГАИ начинают «видеть» водителей
  5. Астрологи уверены — начинается их звездный час: какие знаки Зодиака вскоре получат все и сразу

Есть жалобы? Канал для добрых казанцев, которых вывели из себя. Делитеcь тем, что вас разозлило: Злой Казанец