В ноябрьском цикле программы «Уроки настоящего» одну из задач школьникам предложил банк ВТБ. Описание кейса «Уроки настоящего извлечения информации из текста» уже доступно на платформе «Сириус.Курсы».
Ежедневно банк обрабатывает огромное число документов и запросов. Как правило, большинство вопросов типичны, но клиенты пишут их в свободной форме. Из-за этого извлекать суть запроса автоматически становится непросто, но такая обработка очень важна для оперативной и эффективной обработки запросов, тысячи которых может поступить в банк в течение суток.
Область науки, которая занимается работой с текстовыми данными, называется обработкой естественного языка. В последние несколько лет прорыва в решении задач данной области достигли генеративные языковые модели. Школьникам предстоит решить задачу эффективной обработки документов с помощью подобных моделей. Существуют программы, которые помогают искать ключевые термины и слова в текстах. Используя эти программы, можно понять содержание запроса.
Участники проекта научатся выделять именованные сущности – ключевые слова в запросах – с помощью моделей машинного обучения, устанавливать взаимосвязи между ними, а также познакомятся с техниками, позволяющими эффективно работать с большими языковыми моделями.
Материалы второй задачи «Уроки настоящих агробиотехнологий и биоинженерии» от Института почвоведения и агрохимии СО РАН, являющейся второй частью задачи октябрьского цикла, будут опубликованы на платформе по завершении срока загрузки решений первой части.