Ученые РФ научили компьютер распознавать пол человека по написанному им тексту
Ученые НИЯУ МИФИ, Национального исследовательского центра «Курчатовский институт» и Воронежского государственного университета разработали метод, который позволяет компьютеру определять пол автора по написанному тексту с точностью до 80 процентов, сообщает «Научная Россия».
Разработка относится к области компьютерной лингвистики. Исследование проводилось при поддержке гранта Российского научного фонда, а его результаты были опубликованы в научном журнале.
Специалисты отмечают, что в письменной речи неизбежно отражаются особенности человека. По тексту можно получить информацию о поле автора, его психологических чертах и уровне образования. Поэтому речь рассматривается как важный инструмент психодиагностики.
Такие методы уже используются кадровыми службами крупных компаний и специалистами по безопасности. Кроме того, анализ текста может помогать в выявлении признаков некоторых заболеваний, включая деменцию и депрессию, а также склонности к суицидальному поведению.
Потребность в определении характеристик автора текста растет и из-за развития общения в интернете. Для компаний важно понимать, каким группам людей интересны их товары и услуги.
Ученые, работающие в этом направлении, среди которых лингвисты, психологи и специалисты по информационным технологиям, создают математические модели на основе числовых параметров текста. Такие модели помогают определять отдельные характеристики личности.
В ходе исследования авторы работы проверили эффективность разных технологий машинного обучения с применением нейронных сетей для анализа письменной речи. Они сравнили несколько подходов к определению пола автора текста.
С одной стороны, специалисты использовали классические алгоритмы машинного обучения, включая метод опорных векторов и градиентное усиление. С другой стороны, они проверили нейросетевые модели глубокого обучения, в том числе сверточные и рекуррентные нейронные сети с долгой краткосрочной памятью.
Доцент НИЯУ МИФИ Александр Сбоев рассказал, что высоких результатов удалось добиться благодаря современным нейросетевым моделям в условиях, когда автор не пытается скрыть свой пол. По его словам, следующая задача ученых — научиться определять пол автора в ситуациях, когда он намеренно его маскирует.
Исследователи привели примеры текстов с сайта знакомств, где авторы специально подписывались именем противоположного пола. Нейросеть смогла выявить несоответствие во всех десяти случаях.
Итоги работы показали, что наиболее эффективным оказался подход с использованием сверточной нейронной сети и методов глубокого обучения. Сейчас группа ученых занимается следующей задачей — распознаванием возраста автора по тексту.
Рекомендуем также:
- Никакого майонеза и тяжести после еды: салат «Богатырь» стал любимцем тех, кто хочет вкусно и полезно питаться
- Морозы до -36 ему нипочем, а цветение вызывает восторг: новый фаворит дачников уверенно вытесняет сирень
- Обычные котлеты теперь кажутся скучными: итальянская полпеттоне покоряет сочностью и готовится без утомительной лепки
- Одна ошибка перед камерой — и штраф уже оформлен: за сколько метров комплексы ГАИ начинают «видеть» водителей
- Астрологи уверены — начинается их звездный час: какие знаки Зодиака вскоре получат все и сразу
Есть жалобы? Канал для добрых казанцев, которых вывели из себя. Делитеcь тем, что вас разозлило: Злой Казанец


