В ВятГУ создали алгоритм поиска речевых сообщений, а сейчас обучают нейронную сеть проверке текстов

Этим занимается молодой ученый Александра Татаринова.

21.02.2020  347

Content-Based Retrieval является динамично развивающейся областью информатики. Среди актуальных проблем - поиск речевых документов по текстовому запросу пользователей. Как найти нужный материал в коллекции аудиофайлов, не прибегая к прослушиванию каждого из них? Реально ли сделать это путем введения обычного текстового запроса?

Оказывается, да. О том, как этого достигнуть, рассказала доцент кафедры прикладной математики и информатики ВятГУ Александра Татаринова:

- Мы исходили из гипотезы, согласно которой поиск должен производиться не конкретно по распознанному тексту, а путем его преобразования в фонемное представление.

Молодому ученому вместе с научным руководителем Дмитрием Прозоровым, профессором кафедры радиоэлектронных средств ВятГУ, удалось добиться поставленной цели: были предложены метод поиска и алгоритм фонемного транскрибирования на основе многосвязных цепей Маркова. Теперь пользователь, имеющий некую коллекцию аудиофайлов, может сделать запрос путем ввода текста, а система переведет его в фонемное представление, обеспечивая максимальную точность поиска.

Проведенное исследование легло в основу диссертационной работы Александры Татариновой, а последние результаты нашли отражение в статье «Comparison Of Grapheme-to-Phoneme Conversions For Spoken Document Retrieval», вошедшей в сборник материалов конференции IEEE EWDTS 2019.

На рисунке: схема системы поиска речевых документов по текстовому запросу

Разработанные ученым ВятГУ метод и алгоритм могут использоваться для создания систем, нацеленных на получение актуальных для коммерческих компаний и государственных учреждений сведений: от жалоб потребителей товаров и услуг до получения данных о разглашении конфиденциальной информации.

Сегодня Александра Татаринова также активно занимается исследованиями в области Grammatical Error Correction. Это, в первую очередь, устранение нарушений грамматической связи между словами в предложениях, для решения которой могут быть использованы глубокие нейронные сети.

- По сути мы должны обучить нейронную сеть находить и исправлять в предложениях несогласованность, возникшую в результате опечаток или слабого владения пользователем русским языком. Это мы делаем на основе нейронной сети с архитектурой Transformer, содержащей механизм self-attention, что позволяет лучше обучить связям между словами внутри предложения, - пояснила А.Г. Татаринова.

Исследования, проводимые молодым ученым, полностью соответствуют мировым трендам. Важно, что эти темы находят отражение на занятиях со студентами, приобщая их к новейшим научным достижениям. Это, в частности, можно сказать о курсах «Математические модели распознавания образов» и «Компьютерное зрение», которые Александра Геннадьевна читает для обучающихся в магистратуре Института математики и информационных систем ВятГУ.

назад


Читайте также:

22.04.2020    Молодой ученый ВятГУ Михаил Туев – автор серии разработок технических устройств медицинского назначения
Запатентованные полезные модели и изобретения основаны на применении вихревого эффекта Ранка-Хилша и могут быть внедрены в различные области медицины.
21.04.2020    Губернатор Игорь Васильев провел онлайн-встречу со студентами
Глава Кировской области в прямом эфире отвечал на вопросы учащихся кировских вузов.
21.04.2020    Иностранным студентам ВятГУ, проживающим в общежитиях, раздали бесплатные продуктовые наборы
Руководство опорного университета Кировской области решило поддержать иностранных студентов, оказавшихся в сложной ситуации в период борьбы с коронавирусом.
МЫ В СОЦСЕТЯХ


Архив номеров

Свежий номер «Бизнес Новости»

Удовольствие от качественной музыки
Удовольствие от качественной музыки

За время часовой беседы Александр Гаврилин, директор Вятской филармонии, успевает раз 10 ответить на телефонные звонки и решить массу дел. На вопрос, как удается справляться с таким валом работы отвечает цитатой из фильма "Москва слезам не верит": "Трудно с тремя людьми, а когда трех научишься организовывать, дальше число уже не имеет значения".

  446

Бюджетные сомнения

Из-за пандемии объем безвозмездных поступлений Кировской области из федерального бюджета увеличится на 6,2 млрд рублей. 

  296

Тормоз для экотранспорта

В эпоху «зеленых трендов» многие ломают головы – как сделать так, чтобы воздух был чище, воды хватило на миллионы лет вперед, а атмосфера не убивала нас нашими же изобретениями. 

  298

Разрушитель слухов

Председатель правительства Кировской области Александр Чурин вновь собрал журналистов на пресс-тайм, чтобы дать темам, блуждающим в информполе, правительственную трактовку.

  344

Случайно не найденные миллионы,

или Как в Кировской области замешанные в мошенничестве с деньгами дольщиков ЖК «Виктория» фигуранты уголовных дел получают в итоге минимальные сроки, затем по решению суда выходят из тюрьмы по условно-досрочному. 

  334

Инвестиционный провал

В текущем году Кировская область – только еще по прогнозам –  получит чуть больше 60 млрд рублей инвестиций. 

  294


Получатели "тревожных извещений" выплатили более 3,7 млн долгов

Остальных нерадивых граждан ждет процедура взыскания задолженности за электроэнергию, определенная законодательством РФ.

  168

Кировчане готовят свои гаджеты к холодам

Tele2 фиксирует рост продаж портативных зарядных устройств.

  114

Школьники из Кирова поучаствовали в акции "Урок цифры"

Занятие в рамках Всероссийской акции было посвящено искусственному интеллекту.

  95