Лабораторию теоретических основ моделей ИИ возглавил старший научный сотрудник факультета компьютерных наук Никита Пучкин, за прикладные разработки будет отвечать руководитель проектов Института ИИ и цифровых наук Елизавета Жемчужина. О том, чем будет заниматься лаборатория, как планируется организовать сотрудничество с индустриальными партнерами и какая роль в ее работе отводится студентам Вышки, они рассказали в интервью «Вышке.Главное».
— Что представляют собой модели искусственного интеллекта и почему их необходимо исследовать?
Никита Пучкин:
— Модель искусственного интеллекта — это программа, способная решать поставленную задачу на основе анализа накопленных данных без вмешательства человека. Извлечение полезной информации из массива данных (то есть обучение модели) происходит с помощью различных алгоритмов. Их теоретический анализ позволяет понять принципы работы модели, границы ее применимости, выявить недостатки и найти новые способы ее усовершенствования.
— Новая лаборатория будет заниматься именно этим?
— Да, большое внимание будет уделено математическим аспектам машинного обучения, а также исследованиям в смежных направлениях, таких как теория вероятностей, математическая статистика, оптимизация. За последнее десятилетие методы анализа заметно усложнились, и при изучении алгоритмов используются все более сложные инструменты.
Никита Пучкин
Стоит отметить, что развитие фундаментальных направлений играет важную роль при создании новых подходов. Например, генеративные состязательные сети и диффузионные модели, благодаря которым произошел прорыв в генеративном моделировании, опираются на работы по математической статистике и случайным процессам. Однако мы не ограничимся только фундаментальными исследованиями. Планируется также развитие методов искусственного интеллекта для решения специализированных задач, таких как компьютерное зрение и рекомендательные системы.
Спектр тем достаточно широк, но все они соответствуют общим принципам. Во-первых, это актуальность и интерес со стороны широкой научной аудитории. Во-вторых, деятельность лаборатории органично встраивается в работу Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ. Темы исследований различных лабораторий института дополняют друг друга и создают возможности для тесного сотрудничества на стыках направлений. Помимо этого, лаборатория будет заниматься прикладными разработками.
— В каких направлениях будут осуществляться прикладные разработки?
Елизавета Жемчужина:
— При формировании направлений деятельности команды разработчиков мы в первую очередь опираемся на последние тенденции в области искусственного интеллекта, на потребности бизнеса и на их пересечение с компетенциями основного состава нашей команды. Например, сейчас существует большой запрос на цифровых ассистентов и автоматизацию обработки данных комплексных доменов. Уже зная эту часть рынка, мы готовы предложить решения. В горизонте одного-двух лет планируем сосредоточиться на задачах адаптации больших языковых моделей (БЯМ, LLM), переноса знаний, на создании цифровых ассистентов и агентов на их основе, уменьшении галлюцинаций моделей, ускорении генераций.
© iStockОтдельным поднаправлением являются задачи оптимизации: вопросы эффективного инференса для компаний, развертывающих модели в собственном контуре, сегодня стоят остро. Здесь важно иметь разносторонний взгляд: какие-то задачи можно решать классическими методами, где-то требуется уверенное владение архитектурами трансформеров, гибридных и SSM-моделей, понимание, какая архитектура лучше отвечает специфике данных и вычислительным возможностям заказчика. Все эти задачи стоят на стыке обработки естественных языков (NLP), обучения с подкреплением, методов оптимизации.
— Будут ли у лаборатории индустриальные партнеры?
— Да. В первую очередь мы ориентируемся на высокотехнологичные компании, которые уже активно используют ИИ в своих процессах. Надеемся продолжить сотрудничество с давними партнерами НИУ ВШЭ, с которыми не раз решали интересные и нестандартные задачи, а также наладить взаимодействие с новыми IT- и финтех-компаниями. Сейчас идет активное обсуждение нескольких прикладных проектов.
Елизавета Жемчужина
Таким образом, команда разработчиков и исследователей лаборатории внесет вклад в сотрудничество университета и индустриальных компаний, которое основано в первую очередь на выстраивании полноценного долгосрочного партнерства. Оно не ограничивается выполнением отдельных проектов, а, наоборот, предусматривает комплексное взаимодействие: стратегические сессии, общие образовательные программы, портфели проектов.
Обоюдная выгода от такого подхода очевидна: университет укрепляет репутацию одного из лидеров в области ИИ, а индустриальные партнеры могут быть уверены в том, что предлагаемые нами решения ложатся в их цифровую стратегию.
— Как будет осуществляться взаимодействие с другими лабораториями Института ИИ и цифровых наук?
Никита Пучкин:
— Определенный задел уже имеется, поскольку до создания Лаборатории теоретических основ моделей ИИ мы с профессором Владимиром Григорьевичем Спокойным, согласившимся стать ее научным руководителем, работали в Международной лаборатории стохастических алгоритмов и анализа многомерных данных с момента ее основания в 2018 году.
Установленные за это время связи никуда не исчезнут. Кроме того, будем стараться их всячески расширить и вовлечь во взаимодействие с другими лабораториями и новых сотрудников. Предполагается, что новая лаборатория, как и другие лаборатории института, примет активное участие в выполнении работ по гранту Центра искусственного интеллекта НИУ ВШЭ, если он будет продлен.
— Расскажите немного о себе.
— Я занимаюсь разработкой и анализом алгоритмов машинного обучения с использованием методов многомерной математической статистики и теории вероятностей. Окончил бакалавриат Физтеха, магистратуру Физтеха и Сколтеха, а затем аспирантуру Вышки. В прошлом году защитил кандидатскую диссертацию под руководством Владимира Григорьевича Спокойного — научного руководителя нашей лаборатории.
Думаю, стоит сказать несколько слов о нем. Владимир Григорьевич — ученый мирового уровня в области математической статистики и теории вероятностей. Он в течение долгого времени является профессором в Университете Гумбольдта в Берлине и возглавляет научную группу в Институте Вейерштрасса, а теперь возвращается в Москву и основное внимание будет уделять работе в лаборатории. У него большой опыт преподавания и руководства, а также множество публикаций в ведущих научных изданиях.
Елизавета Жемчужина:
— Я начинала как NLP-исследователь в Лаборатории естественного языка (ЛЕЯ) питерской Вышки. Затем сместила фокус с научных проектов на прикладные. Принимала участие в качестве технического руководителя по разработке NLP-моделей в таких проектах, как адаптация моделей к специфическим доменам, создание цифровых помощников в образовании, автооценка уровня английского языка с помощью LLM.
— Как ваша лаборатория будет связана с образовательным процессом?
Никита Пучкин:
— Вовлечение наиболее подготовленных и мотивированных студентов в научную деятельность — одна из основных задач лаборатории, определяющих ее развитие. Если сотрудники лаборатории создают у студентов благоприятное впечатление в качестве преподавателей, растет интерес и к лаборатории в целом.
С прошлого учебного года я читаю лекции по математической статистике для студентов 2-го курса бакалавриата ФКН, до этого вел семинары по этому предмету, а также по теории вероятностей и статистике в пространствах высокой размерности. Владимир Григорьевич является научным руководителем совместной магистерской программы НИУ ВШЭ и Сколтеха « Математика машинного обучения ». Помимо этого, планируется активное взаимодействие со студентами в рамках курсовых проектов и подготовки выпускных квалификационных работ.
— Когда и как можно будет оценить эффективность работы новой лаборатории?
— Эффективность работы лаборатории будет оцениваться каждый год. Есть несколько целевых показателей, связанных как с количеством публикаций в престижных научных изданиях и ведущих конференциях по машинному обучению и искусственному интеллекту, так и с объемом работ, выполненных в рамках проектов с индустриальными партнерами.