Коллектив молодых ученых в составе Александра Багрова (Яндекс - Crowd Solutions Architect, студент Факультета вычислительной математики и кибернетики МГУ им. М.В. Ломоносова), Надежды Иванченко (к.филол.н. Школа Востоковедения, Факультет мировой экономики и мировой политики, НИУ ВШЭ, Лаборатория цифровых исследований современного Востока, Институт востоковедения РАН), Александра Костыркина (к.филол.н. Лаборатория цифровых исследований современного Востока, Институт востоковедения РАН), Родиона Кудакаева (м.н.с. Центра политических исследований и прогнозов, Институт Китая и современной Азии РАН; м.н.с. Центра изучения современного Китая, Институт востоковедения РАН), Александра Маркина (студент Факультета компьютерных наук НИУ ВШЭ) и Александра Мокрецкого (с.н.с. Центра «Россия, Китай, мир», Институт Китая и современной Азии РАН) 9 декабря 2025 г. выступил на пленарном заседании 2-й международной конференции «Цифровое востоковедение», прошедшей в Институте Востоковедения РАН (https://lab.ivran.ru/digital-orientalia-conf), на тему «ИИ-ассистент с функцией поиска по китайским новостным текстам».

Спустя 2 дня – 11 декабря 2025 г. – выше названная команда приняла участие в секции 3 «Искусственный интеллект» XIV международной научной конференции ИТ-Стандарт 2025, которая состоялась во Всероссийском институте научной и технической информации Российской академии наук (ВИНИТИ РАН – https://www.cksit-rspp.ru/conferences/3398/). Темой доклада была: «RAG-система для семантического поиска по китайским новостным источникам».
Коллектив молодых исследователей, выступая на двух площадках, стремился объяснить аудитории, что восточные СМИ (и, в частности, китайские) ежедневно генерируют огромные объемы сообщений, описывающих события как внутри стран, так и на региональном и международном уровнях. При этом основной источник сведений — западные новостные агентства или китайские СМИ на английском языке (такие как Global Times). В академических публикациях мало ссылок на китайскую электронную периодику. В связи с этим была поставлена задача: приблизиться к первоисточникам, предоставить доступ не только экспертам, а всем интересующимся Китаем, расширить общую осведомленность. Генеративные модели и машинный перевод представляются своевременным решением для задач такого класса.

Годом ранее – с 31 мая по 16 июня 2024 г. – состоялся 4-й Хакатон (AI Product Hackathon). В рамках конкурса для разработчиков программного обеспечения, программистов, дизайнеров, менеджеров и других IT-специалистов была поставлена задача создать русскоговорящий чат-бот для анализа СМИ на китайском и японском языках – систему с использованием генеративных моделей, в том числе машинного перевода, для анализа новостных сообщений в информационном пространстве стран Восточной Азии, прежде всего КНР и Японии. В состав экспертов помимо технических специалистов от организаторов Хакатона вошли Александр Костыркин, Родион Кудакаев и Александр Мокрецкий (https://www.iccaras.ru/news/sotrudniki-iksa-ran-voshli-v-sostav-ekspertov-konkursa-ai-product-hackathon.html).
Осенью 2024 г. в Yandex Cloud был запущен ряд студенческих проектов, один из которых был организован совместно с ИВ РАН, при участии ВШЭ и ИКСА РАН. Результаты работы были представлены в выпущенном пресс-релизе 12 ноября 2025 г. (https://yandex.cloud/ru/blog/digital-oriental-studies?utm_referrer=about%3Ablank).
Команда молодых ученых планирует продолжить исследования в 2026 г. В число задач входят: создание агрегатора актуальных новостей, динамическое пополнение базы данных, более качественная очистка и дедупликация, автоматическая классификация и последующая фильтрация новостей.
Фото предоставлено пресс-службой ИВ РАН и Медиацентром ВИНИТИ РАН.