Конференция

Конференция
Data Fusion
Международная конференция по машинному обучению, анализу данных и технологиям ИИ

О конференции

Конференция Data Fuion 2023
Data Fusion 2023 — это точка сближения науки и бизнеса.
Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.

В этом году акцент конференции будет сделан на развитие межотраслевого партнерства в области развития технологий ИИ и работы с данными, поиск новых форм сотрудничества между бизнесом и государством для укрепления технологической независимости и наращивания темпов экономического развития страны.

Выступления

13 апреля
14 апреля
Стрим 1.Управление Data Fusion
Стрим 2. Практика Data fusion
9:30 9:40
9:40 11:00
Пленарная сессия. Технологический суверенитет страны и новые роли лидеров: барьеры на пути и их преодоление
Построение технологического суверенитета в многополярном мире — задача, которая отражает мировые глобальные изменения, и России предстоит решить ее одной из первых. Пленарная секция посвящена развитию межотраслевого партнерства, поиску новых форм сотрудничества для укрепления технологической независимости и наращивания темпов экономического развития страны. Особое внимание участники дискуссии уделят кооперации в области технологий ИИ и работы с данными, в частности затронут такие темы как десакрализация ИИ, выравнивание ИИ-ландшафта, важность развития стека суверенных технологий для работы с данными.
Спикеры:
Заместитель Министра экономического развития РФ
Комаров Андрей
Ростех
Директор по цифровой трансформации
Кулик Вадим
Банк ВТБ
Заместитель президента-председателя правления
Номоконов Василий
Сибур
Член правления, исполнительный директор
Осеевский Михаил
Ростелеком
Президент, председатель правления
Чаркин Евгений
РЖД
Заместитель генерального директора по ИТ
11:05 11:25
Награждение победителей Data Fusion Contest 2023
11:45 12:55
Сессия. Технологии обмена данными: неограниченные возможности vs скрытые угрозы
Безопасный обмен данными между игроками рынка и между бизнесом и государством позволит решить многие актуальные задачи, среди которых — противодействие мошенническим атакам на пользователей, а также проблемы, связанные с наличием цифровых монополий. Участники сессии обсудят подходы к созданию единой межотраслевой платформы безопасного обмена данными, барьеры на этом пути, а также технические и регуляторные решения, которые будут способствовать ее появлению.
Спикеры:
Баранов Денис
Positive Technologies
Генеральный директор, член совета директоров
Ляпунов Игорь
Ростелеком
Старший вице-президент по информационной безопасности
Банк России
Первый заместитель Председателя
Шойтов Александр
Министерство цифрового развития, связи и массовых коммуникаций РФ
Заместитель министра
#Управление и данные
13:00 14:00
Сессия. Диалог бизнеса, государства и разработчиков искусственного интеллекта: как сформировать национальный перечень приоритетных решений в сфере ИИ
Правительство РФ поручило определить и ежегодно обновлять перечень наиболее актуальных и востребованных технологических направлений и решений в сфере ИИ. Какие подходы к его формированию позволят наилучшим образом решить задачи бизнеса? Как сделать этот перечень удобным инструментом формирования стратегии развития для разработчиков ИИ-решений? Эти темы обсудят представители органов власти, бизнеса и компаний-разработчиков.
Спикеры:
Авербах Владимир
Сбербанк
Старший управляющий директор – начальник Управления национального развития AI
Безбогов Сергей
Банк ВТБ
Заместитель руководителя Технологического блока - старший вице-президент
Дырмовский Дмитрий
ГК ЦРТ
Генеральный директор
Крайнов Александр
Яндекс
Директор по развитию технологий искусственного интеллекта
Якимов Антон
Группа Т1
Заместитель генерального директора по технологическому развитию
#Технологический суверенитет
14:00 14:30
Диалог. Международное сотрудничество в сфере развития искусственного интеллекта и экспорта технологического суверенитета
Спикеры:
Zhang Tian
iFlytek
Russia Regional Manager
14:30 15:00
Диалог. Россия и Малайзия: сотрудничество в развитии искусственного интеллекта и технологий для работы с данными
Спикеры:
Ong Karena
International Technology Center
Chief Executive Officer
#Управление и данные
15:00 16:15
Сессия. Практика работы с искусственным интеллектом и данными в ключевых отраслях экономики и социальной сферы
Где сегодня находятся различные отрасли российской экономики в освоении новых технологий анализа данных, машинного обучения и искусственного интеллекта? Что промышленность, сельское хозяйство, транспорт, ритейл, банки и другие сектора экономики могут позаимствовать друг у друга? Как выровнять ИИ-ландшафт?
Спикеры:
Безбогов Сергей
Банк ВТБ
Заместитель руководителя Технологического блока - старший вице-президент
Комаров Андрей
Ростех
Директор по цифровой трансформации
Косогор Сергей
Агрохолдинг «Степь»
Директор R&D центра
Практика применения искусственного интеллекта
- Цифровизация производственных процессов агрохолдинга «СТЕПЬ»;
- Использование БПЛА в полях холдинга, возможности, перспективы;
- Направления использования ИИ в производстве;
- Тренды цифровизации влияющие на производство сельскохозяйственной продукции.
Мещерякова Анна
Платформа Третье Мнение
Генеральный директор
Никитченко Анна
O2Consulting
Управляющий партнер
Саркисов Тигран
X5
Директор по управлению данными
#Десакрализация ИИ
16:20 17:20
Сессия. Переход на доверенные технологии: опыт российских компаний
На протяжении последнего года российские организации решают задачу миграции на доступные на рынке технологии для работы с данными. В ряде случаев переход на российские решения и открытый код позволили расширить функциональность систем и повысить их экономическую эффективность. Лидеры поделятся опытом перехода на новый стек, обсудят оптимальные пути развития экспертизы по новым технологиям работы с данными и сделают прогнозы — как будет развиваться ситуация с учетом опыта других стран с похожими вызовами?
Спикеры:
Клочко Юрий
BSSG
Генеральный директор
Манихин Алексей
Норникель
Директор по ИТ-стратегии и бизнес-приложениям
Непрерывность. Надежность. Санкциинезависимость – опыт компании Норникель
Натрусов Артём
Евраз
Вице-президент по информационным технологиям
Наумов Данила
М.Видео – Эльдорадо
Директор по данным
#Технологический суверенитет
17:25 18:40
Сессия. Доступность дата-сетов для искусственного интеллекта
Дискуссия о доступности данных для анализа с точки зрения технологий, бизнеса, регуляторики, саморегуляции рынка, а также обсуждение вопросов обезличенных данных, работы с синтетическими данными, дата-посредничества, доступа к данным государства.
Спикеры:
Захир Максим
CRO.TEAM
Генеральный директор
Казаков Дмитрий
Platforma
Руководитель направления
Каширин Алексей
Альфа-Банк
Директор Центра продвинутой аналитики
Прунтов Кирилл
Ассоциация больших данных
Корпоративный архитектор
Синтетические данные и места где они обитают в АБД
Почему Ассоциация больших данных начала работать с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
Тахавиев Марат
Ассоциация больших данных
Руководитель GR-проектов
#Управление и данные
19:00
Церемония вручения Data Fusion Awards
#Премия
11:25 12:10
Сессия. Обзор трендов в области искусственного интеллекта и работы с данными
Спикеры:
Арсений Груздев
Технологии доверия
Руководитель практики Data Science
Тренды применения ИИ для решения индустриальных задач
Доклад будет посвящён последним тенденциям и разработкам в области искусственного интеллекта и анализа данных. Я расскажу об инструментах и методах, которые в настоящее время используются в индустрии, а также об их влиянии на бизнес и общество. Вы узнаете о том, как современные технологии помогают оптимизировать бизнес-процессы, улучшить качество жизни и повысить эффективность работы в различных отраслях.
Axenix
Эксперт в области ИИ и продвинутой аналитики
Константин Вишневский
ИСИЭЗ НИУ ВШЭ
Директор Центра исследований цифровой экономики
#Управление и данные
12:15 13:15
Сессия. Опыт применения новых технологий работы с данными в СМБ
Уровень применения технологий искусственного интеллекта в малом и среднем бизнесе существенно ниже, чем в крупном корпоративном сегменте. Могут ли ИИ-решения и дата-сеты стать коммодити для организаций, только вступивших в гонку по использованию передовых аналитических решений? Участники сессии обсудят проблемы сегмента СМБ в аналитике данных и поделятся успешными практиками.
Спикеры:
Дмитрий Ларин
OKKAM
Директор вертикали Трейд-Маркетинг
Максим Ларькин
Первый ОФД
Директор по развитию бизнеса Продажи.рф
Максим Синяков
МТС
Руководитель направления дата стратегии BIG DATA
#Десакрализация ИИ
13:20 14:20
Сессия. Управление данными: стратегия и тактика
Все больше организаций во всех сферах экономики РФ рассматривают управление данными как выделенное направление деятельности, цели которого неотрывно связаны со стратегией компании и сопряжены с задачами цифровой трансформации. Компании, находящиеся на среднем и высоком уровне зрелости процессов управления данными, уже не задаются вопросами «что это?» и «зачем?», а сосредоточены на практической реализации инструментов управления данными и выработке лучших практик в усовершенствовании работы с данными в своей сфере. Спикеры сессии поделятся лучшими практиками по организации бизнес-ориентированного подхода к профилированию данных, опытом применения моделей машинного обучения при идентификации ошибок качества данных, а также кейсом по комплексному управлению компетенциями для устойчивого развития Data Science и Data Governance.
Спикеры:
Александр Юрасов
Ростелеком
Начальник отдела разработки продуктов управления данными
Импортозамещенный стэк инструментов по управлению данными
Алексей Бондаренко
Газпромбанк
Начальник службы управления корпоративными данными
Иван Черницын
ГАЗПРОМ НЕФТЬ
Начальник управления аналитических решений, технологий больших данных и искусственного интеллекта, Дирекция региональных продаж
Data Governance и комплексное управление компетенциями для устойчивого развития Data Science
При создании практики Data Science в организации важно учитывать практический опыт ее дальнейшей эволюции. Это приводит к фокусу на направлениях комплексного управления данными, развития вне оргструктуры Data Science специальных ролей и аналитических компетенций. В докладе будут освещены подходы и результаты Дирекции региональных продаж «Газпром нефти» в этих направлениях.
Сергей Карпович
Банк ВТБ
Начальник Управления анализа источников данных Департамента анализа данных и моделирования
#Управление и данные
14:25 15:25
Сессия. Доверенные решения в сфере искусственного интеллекта и обработки данных
Постоянные вызовы, с которыми сталкиваются российские организации, влияют на подходы в области обработки данных и управления цифровыми моделями, поскольку безопасность и устойчивость к изменениям становятся главными приоритетами. Компании вынуждены пересматривать свои стратегии в части выбора технологий и поставщиков услуг и все чаще склоняются к использованию облачных решений от отечественных бигтех-компаний. Но готовы ли российские поставщики предоставить полный стек ИТ-решений и сервисов? Как облачные провайдеры гарантируют безопасность данных? Есть ли альтернативы облаку?
Спикеры:
Денис Суржко
Банк ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
AutoML как Full Stack решение
Дмитрий Гайворонский
Yandex.Cloud
Аккаунт-директор Группы по работе с промышленными организациями
Дмитрий Попов
Иннотех
Начальник управления
Эволюция анализа данных. Кейсы на графах
В Докладе разберем вопрос о методах получения дополнительной ценности из данных. Почему при анализе связей между лицами, событиями, ресурсами и другими сущностями применение графов для хранения данных, визуализации информации и принятия решений может принести выгоду, значительно сократив время принятия решений одновременно увеличив их качество. Разберем кейсы проведения расследований (в том числе случаев фрода), организации закупок, обеспечения комплаенс и другие
Cloud
Change Lead AI Cloud
Станислав Лазуков
РТК ИТ
Директор по продажам платформ
#Технологический суверенитет#Graph#Графы#антифрод#CMDB
15:30 16:30
Data Fusion Awards. Лучшие практики от финалистов премии Data Fusion
Спикеры:
Андрей Голов
Северсталь Диджитал
Руководитель Центра искусственного интеллекта и машинного обучения
Повышение производительности агрегата непрерывного горячего цинкования №4 ЧерМК с помощью машинного обучения
Андрей Елхов
Альфа-банк
CDO
Голограмма - партнёрство в стиле Data Fusion
Лев Пикулев
ГПМ дата
Менеджер по продуктам на основе Computer vision
Опыт применения технологий машинного зрения в решении производственных задач медиаактивов Газпром-Медиа Холдинга
Михаил Граденко
Группа НЛМК
Head of Data Science
Сергей Холкин
ЦРПТ
Заместитель генерального директора
#Премия
16:35 17:35
Сессия. Кадры для Data Fusion
Что необходимо для качественной подготовки специалистов по ИИ и управлению данными? Как переизбыток junior-разработчиков перевести в разряд дата-саентистов более высокого уровня? ИИ-образование для не дата-саентистов: как бизнесу научиться понимать ценность работы с данными, правильно ставить задачи?
Спикеры:
НИУ ВШЭ
Доцент ФКН НИУ ВШЭ и МАИ, технический руководитель лаборатории Al Lab Факультета креативных индустрий Школы дизайна НИУ ВШЭ
Платформенные облачные инструменты в образовании и исследованиях
Современное образование для специалистов по Data Science сталкивается с рядом сложностей, таких как потребности в вычислительных ресурсах и необходимости обучения будущих специалистов не только теоретическим знаниям в области ML, но и практическим навыкам командной работы, внедрения и сопровождения моделей (MLOps). В докладе мы рассмотрим практику использования облачных платформ машинного обучения, в частности, Yandex DataSphere, в образовательных и исследовательских проектах в российских вузах, и расскажем про новую программу Free Tier, по которой вузы могут получить доступ к сервису
Евгений Благодарный
МФТИ
Зам. директора ФПМИ по стратегии и коммерциализации; заведующий лабораторией Инноватики МФТИ; руководитель обр. направления Центра НТИ МФТИ по ИИ
Свой Кулибин. Кто создает ценность в инновационных компаниях и как воспитывается новаторство
Поговорим про то, как многомодельное мышление, любопытство и культура формируют новые рынки. Как бизнесу сформировать, "прокачать" и удержать свою команду разработчиков. Причем тут школьные олимпиады и картина мира.
Максим Феопентов
Евраз
Директор по развитию цифровых технологий
ИИ-образование для не дата-саентистов: как бизнесу научиться понимать ценность работы с данными, правильно ставить задачи?
Сергей Боловцов
Руководитель лаборатории интеллектуальной аналитики
РАНХиГС
Подготовка специалистов в области ИИ
Университет и бизнес: две точки формирования спроса и предложения на цифровые кадры
Подготовка специалистов в области ИИ и управления данными должен вестись на основе данных рынка труда и отраслевых тенденций.
Юлия Мундриевская
Академия Data-Diving
Генеральный директор
Подготовка кадров на основе данных: миф или реальность
Использование высоких технологий влияет на современный рынок труда:
· формирует новые требования к кадрам;
· происходит изменение пивычных профессий с учетом новых реалий;
· формирует потребность специалистов получать новые навыки и компетенции.
Чтобы не отставать от конкурентов в области технологии искусственного интеллекта, необходимо повышать темпы подготовки кадров и разработки проектов в этой области на наиболее ранних стадиях. Однако в рамках текущей системы высшего образования это представляется весьма непростым процессом: ППС устаревают и становятся менее гибкими, программы ориентированы на ФГОСы, а не реальные запросы и тенденции рынка. Все эти процессы усиливаются на фоне общей нестабильности и неопределенности, и требуют кардинальных изменений в подходе к подготовке
ИТ-кадров.
В рамках доклада будут подняты вопросы качества подготовки специалистов в области анализа данных и ИИ, а также представлена концепция эффективной подготовки кадров. Также будет представлен опыт построения образовательных программ на основе комплексного подхода и совмещения образовательных стандартов и анализа рынка.
#Десакрализация ИИ
17:40 18:40
Сессия. Вопросы этики в работе с данными
По мере того как искусственный интеллект всё глубже проникает в жизнь каждого, актуализируется целый ряд этических вопросов. Есть ли черта, за которой бизнес должен остановиться в стремлении узнать и понять своего клиента? Как найти баланс между законодательными ограничениями и саморегуляцией? Как согласуется с позиции этики необходимость внедрения технологий искусственного интеллекта и инициируемое этими технологиями сокращение рабочих мест? Участники сессии обсудят эти и другие вопросы с позиций бизнеса, государственного регулирования и права.
Спикеры:
Александра Орехович
Фонд развития интернет-инициатив (ФРИИ), Московское отделение Ассоциации юристов России, Moscow Digital School
Директор по правовым инициативам, Член Комиссии по правовому обеспечению цифровой экономики, Преподаватель образовательной платформы
Анна Абрамова
МГИМО
Директор Центра ИИ, заведующая кафедрой цифровой экономики и искусственного интеллекта, научный руководитель магистерской программы «Искусственный интеллект в бизнесе»
Бизнес-этика в условиях все-проникающего искусственного интеллекта – усиление или ослабление нравственности и морали предпринимательского сообщества? (участие бизнеса в работе в рамках кодекса этики в сфере ИИ)
Антон Горелкин
Государственная Дума РФ
Депутат Государственной Думы РФ, зампредседателя Комитета Госдумы по информационной политике, информ. технологиям и связи
Как согласуется с позиции этики необходимость внедрения технологий искусственного интеллекта и инициируемое этими технологиями сокращение рабочих мест?
Вадим Глущенко
АНО «Центр компетенций по глобальной ИТ-кооперации»
Директор
Зарубежный опыт оборота данных и этические аспекты
Крайнов Александр
Яндекс
Директор по развитию технологий искусственного интеллекта
#Управление и данные
Стрим 1. ML +
Стрим 2. AI Classic
Стрим 3. ML Environment
10:00 10:05
Открытие
10:05 10:55
Science Note. Оптимизация на службе анализа данных
Спикеры:
Александр Гасников
МФТИ
Заведующий лабораторией математических методов оптимизации, заведующий кафедрой математических основ управления, доктор физико-математических наук, профессор
Оптимизация на службе анализа данных
Развитие численных методов оптимизации за последние 20 лет сильно сместилось в сторону приложений в анализе данных, в частности, в обучение нейронных сетей. Было предложено много разных полезных приемов, которые позволяют сделать обучение более эффективным. В своем докладе мы сосредоточимся на нескольких таких приемах, которые с одной стороны имеют теоретическое обоснование, а с другой стороны хорошо себя зарекомендовали на практике. Доклад будет носить обзорный характер.
11:00 12:15
Сессия. Новые промышленные технологии
Круг задач, решаемых искусственным интеллектом расширяется и все чаще средства ИИ используют промышленные предприятия. Именно здесь многие видят следующую «точку роста» ИИ-технологий. Сессия посвящена применению искусственного интеллекта на предприятиях реального сектора экономики.
Спикеры:
Алексей Фролов
Axenix
Директор, руководитель направления Industry X
Вызовы применения edge-решений в промышленности
Юзкейс как делать видеаналитику «в полях» на мобильной технике.

1. Основные вызовы и проблемы при работе на открытых участках производства
2. Работа в постоянно меняющихся ракурсах и условиях
3. Работа с узким каналом связи
4. Подходы по сбору датасета в полевых условиях.
Алексей Шпильман
Газпром нефть, Ассоциация Искусственный интеллект в промышленности
Руководитель программ развития технологий и инструментов искусственного интеллекта, ПАО «Газпром нефть»
Научный руководитель, Ассоциация «Искусственный интеллект в промышленности»
Предиктивная аналитика состояния оборудования: кто виноват и что делать?
Если мы говорим о применении искусственного интеллекта в промышленности, то почти всегда первой темой встает предиктивная аналитика состояния оборудования. Действительно, проектов на эту тему огромное множество. Однако успешных кейсов внедрения — единицы, если не меньше. Алексей в своем докладе разберет, почему так получилось, и как должен выглядеть успешный кейс в этой области.
Анатолий Лохач
Фирма ТВЕМА
Начальник департамента информационно-аналитических систем
Управление технической безопасностью и эффективностью эксплуатации железнодорожной инфраструктуры на основе больших данных и машинного обучения
Анна Дубовик
Газпром нефть
Начальник управления продвинутой аналитики и машинного обучения
Иван Афонин
БО-ЭНЕРГО.АСТС
Заместитель генерального директора
Подходы к обработке данных измерений систем мониторинга для обеспечения достоверной автоматизированной диагностики
12:20 13:00
Дискуссия. Когда ждать российский ChatGPT?
ChatGPT сейчас самая «горячая» тема в области искусственного интеллекта. Участники сессии обсудят, что необходимо для того чтобы создать аналог ChatGPT в России, кто сможет это сделать. И что российский ученые могут привнести в «российский ChatGPT» нового, чтобы наше развитие в этой области не было только «догоняющим».
Спикеры:
Александр Панченко
AIRI
Ведущий научный сотрудник, руководитель группы «Вычислительная семантика»
Иван Оселедец
Сколтех
Директор центра Технологий искусственного интеллекта, Профессор
Михаил Степнов
MTS Big Data
AdTech Director
13:00 13:15
Итоги образовательной программы Финтех Хаба Банка России и Банка ВТБ: «Машинное обучение: No-code кластеризация текстов»
Компании работают с огромными потоками текстовой информации. Большая часть которых представляет собой неразмеченные и неструктурированные данные. Для извлечения пользы из подобных данных требуется их систематизация и, следовательно, проведение разведочного анализа.
Бизнес-подразделения, как правило, не умеют работать с ML моделями, а привлечение DS специалиста для проведения анализа требует долгого погружения в контекст бизнес-процессов.
В докладе представят сервис разведочного анализа текстов, цель которого — в удобной и интуитивно понятной форме помочь бизнес-пользователю без привлечения DS самостоятельно провести разведочный анализ текстовой коллекции.
Вы познакомитесь с архитектурой, философией и алгоритмами, лежащими в основе нашего инструмента. Особенностью сервиса является соединение моделей кластеризации и работа над кластерной структурой данных в интерактивном режиме.
Спикеры:
Антон Удалов
СПбПУ, Высшая школа прикладной математики и вычислительной физики
Студент магистратуры Математические методы анализа и визуализации данных
Майя Котыга
РГСУ, Кафедра ИТ, ИИ и общественно-социальных технологий цифрового общества
Студент 3 курса специальности Прикладная математика и информатика: математическое и информационное обеспечение экономической деятельности
Серафим Боярский
СПбПУ, Высшая школа прикладной математики и вычислительной физики
Студент магистратуры Математические методы анализа и визуализации данных
#MLOps#NLP#EXPLORATORY_АNALYSIS#CLUSTERING#BUSINESS#DEEPCLUSTERING#SCCL#SENTENCETRANSFORMER
13:15 13:40
Science Note. Распознавание патологий с использованием нескольких проекций
Спикеры:
Евгений Сидоров
Платформа Третье Мнение
Руководитель отдела исследований
13:40 14:00
Science Note. ИИ-видеоаналитика. Real-time и active learning
Спикеры:
Илья Налетов
Платформа Третье Мнение
Руководитель направления исследований рентгенограмм ОГК и ИИ-Мониторинг
14:00 15:10
Сессия. ML + Physics
Каковы возможности ИИ в описании физических процессов? Какие задачи способны решать системы искусственного интеллекта в реальном секторе? Участники сессии ответят на эти и другие вопросы, а также обсудят, какие компетенции необходимы команде, работающей с данными на производстве.
Спикеры:
Денис Деркач
ВШЭ
Заведующий лабораторией методов анализа больших данных ФКН
Дмитрий Коротеев
Сколтех
Профессор Сколковского института науки и технологий
Семен Буденный
Sber AI Lab, AIRI
Управляющий директор, Научный консультант
Сергей Рыкованов
Сколтех
Профессор Сколковского Института Науки и Технологий
15:15 16:05
Science Note. Как чистая математика находит практическое применение
Выступление будет посвящено тому, как задачи, первоначально рассматривавшиеся как чисто теоретические «игры разума», оказали огромное влияние на практическое развитие высоких технологий.
Спикеры:
Андрей Райгородский
МФТИ
Доктор физико-математических наук, федеральный профессор математики
16:10 17:00
Science Note. Современное положение дел в мультимодальном информационном поиске
В докладе мы рассмотрим общую структуру современного мультимодального информационного поиска, в качестве конкретного примера рассматривая в основном поиск по видео, а также обсудим последние новости в этой области, от CLIP4Clip до Tencent Text-Video Retrieval. Рассматриваемые методы сохраняют общую структуру metric learning, в которой ранжирование ведётся по близости в некотором евклидовом пространстве, а основная часть модели — это отображение текстов и видео в это пространство, но последние работы добавляют в эту схему много интересных модификаций.
Спикеры:
Сергей Николенко
ПОМИ РАН
Старший научный сотрудник
17:05 18:00
Дискуссия. Кооперация и конкуренция в развитии искусственного интеллекта
Сессия посвящена вопросам выбора траектории в области взаимодействия с искусственным интеллектом. В рамках сессии обсудим какие преимущества и недостатки сопутствуют конкуренции и кооперации в этой области, а также какие выгоды могут быть получены при различных формах взаимодействия. Участники сессии представят свой опыт и взгляды, а также обсудят тренды и возможности ИИ, что позволит сформировать полную картину происходящего в области ИИ и его влияния на современное общество.
Спикеры:
Денис Суржко
Банк ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
Крайнов Александр
Яндекс
Директор по развитию технологий искусственного интеллекта
Мещерякова Анна
Платформа Третье Мнение
Генеральный директор
Михаил Бурцев
London Institute for Mathematical Sciences, UK
Landau AI Fellow
Руслан Юсуфов
MINDSMITH
Основатель и управляющий партнер, футуролог
#MLOps#NLP#CV#AI
10:05 11:25
Сессия. NLP
Обработка естественного языка, Natural Language Processing (NLP), стала одним из важнейших направлений для развития бизнеса у компаний во многих сферах экономики. На сессии будет рассмотрены пути эффективного решения задач, связанных с NLP, ускорение разработки NLP-моделей за счет применения AutoML, новые аспекты использования NLP-решений.
Спикеры:
Александр Горный
United Investors
Сооснователь
Александр Мальцев
Ростелеком
Руководитель направления. Департамент развития решений искусственного интеллекта
Чат-бот Ростелеком. Классификация интентов.
Валентин Малых
ИТМО
Доцент
Search By Snippet: an NLP4Code case study
В докладе я расскажу о том, как мы создавали средства поиска для исправления ошибок в коде и что для этого понадобилось сделать с языковыми моделями.
Наталья Лукашевич
МГУ
Ведущий научный сотрудник НИВЦ, профессор филологического факультета, профессор ВМК, доктор технических наук
Автоматические подходы к извлечению таксономий из текстов
В управлении знаниями важно наличие и поддержание в актуальном состоянии различных классификаторов, рубрикаторов, таксономий, описывающих предметную область. Одним из источников порождения и пополнения таксономий традиционно рассматриваются коллекции текстов предметной области. В докладе будут представлены подходы к автоматическому порождению таксономий из текстов, методы их тестирования и достигаемые результаты. В частности, будут рассмотрены самые новые подходы на основе больших языковых моделей.
#NLP
11:30 12:15
Диалог. ChatGPT
Поговорим о проверке фактов контента, сгенерированного Chat GPT. Генеративные языковые модели известны галлюцинациями и выдумыванием фактов. Мы решим эту проблему и исправим такой контент, проверив его в Интернете.
Спикеры:
Борис Галицкий
Знания-трейл
Соучредитель
12:20 13:50
Сессия. Рекомендательные системы
Рекомендательные системы, которые с помощью средств искусственного интеллекта изучают поведение и предпочтения пользователей, стали неотъемлемой частью большинства сервисов. Наиболее часто такие системы применяются в e-commerce и стриминговых сервисах. Однако постепенно накапливается опыт применения рекомендательных систем и в других сферах деятельности.
Спикеры:
Виктор Кантор
МТС
Директор центра Big Data
Евгений Афанасьев
Tarantool
Архитектор решений Presale
Реал-тайм витрины данных для актуальных/персонифицированных рекомендаций
Сколтех
Научный сотрудник, руководитель группы разработки рекомендательных систем
Ускорение обучения в задаче последовательных рекомендаций с использованием тензорной модели внимания
В этом докладе мы обсудим проблему генерации персонализированных рекомендаций при обучении на основе последовательностей действий пользователя. Современные модели решают эту задачу на основе механизма внимания, используемого в трансформерных нейронных сетях. Мы рассмотрим альтернативный подход, основанный на особом тензорном представлении входных данных. Будет показано, как этот подход позволяет создать линейный аналог механизма внимания в рамках обобщения стандартной матричной факторизации для многомерного случая. Полученное решение обеспечивает сравнимое качество рекомендаций, но при этом дает ряд вычислительных преимуществ по сравнению с нейросетевым подходом
Максим Савченко
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Sber AI Lab
Симуляционные среды для задач рекомендаций
13:55 15:25
Сессия. Геоаналитика
Благодаря применению ИИ в геоаналитике, гео-модели помогают принять наиболее эффективное решение в различных отраслях бизнеса, в государственном управлении, экологии, здравоохранении, транспортной системе. Геоаналитика используется для анализа трафика, определения потенциальных клиентов, независимой оценке объектов имущества и для оптимизации распределения ресурсов. В сессии спикеры расскажут про лучшие практики применения в бизнесе анализа геоданных.
Спикеры:
Wang Lei
AI mapping expert
Towards automatic vector mapping from multi-source geospatial data
Vector mapping is widely required by applications such as navigation, smart city and photovoltaic power station planning. Traditionally, vector maps have been manually drawn by mapping experts. Automating this process is a challenging task. We show some of our latest advances in automatic vector mapping technology for navigation map production and large-scale building mapping.
Алексей Глотов
Tele2
Руководитель службы исследования больших данных
Применение ML в туризме
Доклад будет посвящен применению алгоритмов машинного обучения для задач определения точек притяжения (Points of Interest) и целей посещения абонентами отдельных регионов с использованием внутренних источников данных телеком-оператора и открытых данных.
Артём Агафонов
VK Predict
Руководитель команды геоаналитики
Как построить систему геоаналитики с применением ML
Елена Натарова
Терра Тех
Директор по маркетингу
Геоаналитическая платформа PIXEL.AI: 20 МИНУТ НА СЕЛЬХОЗАНАЛИТИКУ
Летом 2022 года компания «ТЕРРА ТЕХ» (дочерняя компания холдинга «Российские космические системы» Госкорпорации «Роскосмос») представила новую геоналитическую платформу Pixel.AI. Она работает на стыке технологий дистанционного зондирования Земли и искусственного интеллекта.

Пакет аналитики по территории пользователь получает почти через 20 минут после заказа. Данные могут использовать банки, страховые компании при принятии решений о кредитовании, субсидировании и страховании предприятий, мониторинге залогов, инвентаризации сельхозугодий и оценке земельных участков. Сейчас сервис запрограммирован на сельхозаналитику. Pixel.AI позволяет на 97% сократить время и ресурсы на определение границ, статуса, расчет индексов и статистики. И снизить на 48% затраты на обработку космических данных.
Рамон Антонио Родригес Залепинос
ВШЭ
Доцент Департамента программной инженерии, Факультет компьютерных наук
Геоаналитика и базы данных для больших многомерных массивов (Array DBMS)
Многомерный массив – естественное представление для многих важных типов данных. Большие многомерные массивы возникают благодаря дистанционному зондированию Земли (ДЗЗ), численному моделированию погоды и климата, биоинформатике, наблюдениям астрономических телескопов и многим другим областям. Стремительно растущие объемы многомерных массивов постоянно требуют новых подходов для их эффективного хранения, управления и обработки. В докладе будет представлен обзор ряда возможностей современных Array DBMS – активно развивающейся области R&D
Юлий Шамаев
Банк ВТБ
Управляющий директор управления перспективных алгоритмов машинного обучения
Geo-AutoML в задаче оценки стоимости объектов недвижимости
Оценка стоимости объектов недвижимости является одной из классических задач, как в области
гео-пространственного анализа, так и в области машинного обучения, однако, универсального
решения, учитывающего все аспекты и специфику рынка недвижимости, не существует до сих пор.
Так, например, цены на недвижимость в России имеют выраженную региональную специфику,
подвержены макроэкономическим колебаниям и сильно варьируются в зависимости от качества и
расположения объекта. Таким образом, в масштабах России для корректного ответа на вопрос о
стоимости объекта недвижимости необходимо решить целый ряд статистических, гео-
аналитических и алгоритмических задач. Совместив современные инструменты гео-аналитики и
машинного обучения и используя уникальный периметр данных доступный банку ВТБ, мы
разработали Geo-AutoML решение, позволяющее в автоматическом режиме строить и
актуализировать модели оценки недвижимости в широкой географии городов России. Данное
решение под капотом не только рассчитывает огромное количество гео-пространственных
факторов, характеризующих транспортную или социальную инфраструктуру в окрестности
объекта, но и с помощью (ai?) алгоритмов машинного обучения отбирает наиболее релевантные
для конкретного города или региона. Техники анализа временных рядов позволяют выделить в
цене такие компоненты как возраст или стадию готовности объекта, учесть влияние процентных
ставок или макроэкономических индикаторов. «Замешав» все эти техники в рамках Geo-AutoML и
концепции Data Fusion мы получили уникальное динамичное решение, эффективно работающее в
изменяющихся условиях рынка.
#Geo
15:30 16:45
Сессия. Адверсальные атаки
По мере совершенствования машинного обучения совершенствуются и средства его обмана, получившие название Adversarial Machine Learning. За словом Adversarial, «состязательные», стоят попытки воздействия на ИИ, которые должны вызвать ошибки в его работе. На сессии «Адверсальные атаки» будут рассмотрены как методы атак, так и способы защиты от них, а также представлены соответствующие кейсы.
Спикеры:
Александра Мурзина
Positive Technologies
Руководитель отдела перспективных технологий
Про подход к тестированию умных сервисов
В докладе рассмотрим тестирование безопасности систем машинного обучения. Обсудим эффективность разных атак, приведя примеры успешных и неуспешных. В заключение докладчик на основе собственного опыта покажет, как успешный подход к тестированию безопасности может привести к успеху, и предоставит полезные ресурсы для дальнейшего изучения темы.
Алексей Зайцев
Сколтех
Старший преподаватель
Как атаковать черный ящик?
В стандартной постановке адверсальная атака производится на модель, к которой у нас есть полный доступ. Например, доступны градиенты модели по входам. Мы рассмотрим более прикладную постановку, в которой модель доступна как черный и серый ящик и разберем, как можно эффективно атаковать такую модель и сколько вызовов целевой функции нам для этого нужно.
Дмитрий Бабаев
Яндекс
Руководитель ML-проектов
Адверсариальные атаки на модели основанные на последовательностях пользовательских данных
В докладе я расскажу про адверсальные атаки на модели, основанные на последовательностях пользовательских данных. В основном, мы будем обсуждать реалистичные атаки на банковские скоринговые модели, использующие транзакции по картам. Поговорим про то, как может быть устроена реалистичная атака и что должно быть доступно атакующему. Разберем некоторые методы атак, которые подходят для адверсариальной модификации последовательностей. Обсудим результаты их применения к модели аналогичной той, которая может применяться в банках для скоринга клиентов из нашей статьи на KDD`21 (https://arxiv.org/abs/2106.08361).
Евгений Ворсин
Банк ВТБ
Data Scientist в Управлении моделировании партнерств и ИТ процессов, команда эмбеддингов
Adversarial ML – подготовка контеста Data Fusion Contest 2023
В докладе расскажу о практическом кейсе применения техник Adversarial ML, которые использовали при проработки соревнования Data Fusion 2023. Речь о атаках и защите при классификации нейронками клиентских транзакций. Какими методами тестировали сетапы соревнования, чтобы отобрать лучшие из возможных сценариев его организации. От чего в итоге отказались и почему.
#adversarial_ml
16:50 17:25
Сессия. Разбор решений финалистов Data Fusion Contest
Data Fusion Contest 2023 – это уникальное соревнование по машинному обучению в новом турнирном формате. В этом году соревнование посвящено теме Adversarial Machine Learning (состязательное машинное обучение).

Впервые тема задач атак и защиты моделей публикуется для реальных бизнес-задач на индустриальных данных, а не академических датасетах. В этой сессии представим лучшие решения победителей соревнования.
Спикеры:
Александр Сенин
Альфа-Банк
Data Scientist

ПЕРВОЕ МЕСТО В ФИНАЛЬНОМ ТУРНИРЕ ЗАДАЧИ «ЗАЩИТА» В СОСТАВЕ КОМАНДЫ «ЛАБОРАТОРИЯ», DATA SCIENTIST, АЛЬФА-БАНК
Как мы заняли 1 место в задаче Защита в Data Fusion Contest 2023
Расскажем, какие идеи позволили занять 1 место в финальном турнире и 2 место в промежуточном. Поделимся инсайдами в данных и в задаче
Дмитрий Куценко
ПОБЕДИТЕЛЬ НОМИНАЦИИ «COMPANION» ФИНАЛЬНОГО ТУРНИРА ЗАДАЧИ «АТАКА»
Бейзлайн атаки банковской модели и способы его улучшения
Рассмотрим бейзлайн атаки соревнования Data Fusion Contest 2023. Расскажу про вариант white-box атаки при помощи перебора, а также улучшение алгоритма для проведения black-box атаки
#adversarial_ml#RNN#defense#distillation
17:30 18:30
Сессия. Синтетические данные
Синтетические данные, сгенерированные специализированными алгоритмами, все чаще используются в тех случаях, когда «естественные» использовать затруднительно или их не хватает. Например, применение искусственных данных в процессах машинного обучения позволяет обойти требования по защите персональной информации. На сессии будут рассмотрены методы создания синтетических данных и кейсы их применения.
Спикеры:
Никита Зелинский
МТС
RnD директор, Центр BigData
Симуляция атак на обученную графовую нейросеть в задаче банковского скоринга
В докладе рассматриваются эффекты воздействия атак разных типов на обученную графовую нейронную сеть, применяющуюся в банковском скоринге. Эффекты рассматриваются как с точки зрения data sceince метрик и смещений распределения ответов модели, так и с точки зрения принятия решений в бизнес-процессе
Прунтов Кирилл
Ассоциация больших данных
Корпоративный архитектор
Синтетические данные и места где они обитают в АБД
Почему Ассоциация больших данных начала работать с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
Сергей Кулиев
МТС
ML разработчик, Центр BigData
Симуляция атак на обученную графовую нейросеть в задаче банковского скоринга
В докладе рассматриваются эффекты воздействия атак разных типов на обученную графовую нейронную сеть, применяющуюся в банковском скоринге. Эффекты рассматриваются как с точки зрения data sceince метрик и смещений распределения ответов модели, так и с точки зрения принятия решений в бизнес-процессе
Степан Лазарев
Банк ВТБ
Senior ML Researcher
Разработка моделей машинного обучения для генерации синтетических платежных транзакций и построение предсказательных моделей на их основе
В докладе будут рассмотрены построенные модели для генерации синтетических платежных транзакций на основе GRU, Transformer, CVAE.
Также будут показаны результаты применения синтетических данных для решения задач предсказания дефолта, возраста и пола клиента
10:05 11:35
Сессия. MLOps
«Концепция «DevOps» — золотой ключик, открывший современные подходы для быстрого, гибкого и непрерывного совершенствования информационных систем и технологий, все шире распространяется и адаптируется к самым разнообразным областям, связанным с информационными технологиями и управлением данными. В частности, она находит применение и в области искусственного интеллекта. На сессии MLOps будут рассмотрены различные аспекты адаптации инструментария DevOps к процессам машинного обучения и непрерывного совершенствования систем ИИ.
Мы рассмотрим как новые тенденции и подходы, позволяющие оптимизировать работу с данными в реальных условиях, так и уже сложившиеся MLОps инструменты и практики — на конкретных примерах.
Спикеры:
Александр Волынский
VK Cloud
Технический менеджер продукта Cloud ML Platform
Вызовы и решения при построении сервисов на основе ML: опыт VK Cloud
Алексей Незнанов
Schlumberger
Senior Data Scientist
Инженерия данных во имя воспроизводимости и интерпретируемости: теория и практика MLOps на стыке DataOps и AIOps.
Денис Рябых
Иннотех
Старший руководитель направления
Платформа Scibox
В данном выступлении я расскажу об основных компонентах MOps платформы SciBox. Какие задачи продуктивизации моделей она закрывает и какие компоненты включает. Также речь пойдет об инструменте разметки датасетов Маркер.
Дмитрий Ермилов
Билайн бизнес
Руководитель департамента машинного обучения и искусственного интеллекта
MLOps процессы для видео/аудио аналитики на SOTA нейронных сетях
Передовые решения на основе нейронных сетей. Для разработки и промышленного использования этих решений требуется эффективная организация процессов по созданию и поддержке ML алгоритмов. Такой подход называется MLOps. В докладе описывается становление MLOps процессов в продуктовых командах beeline. Фокус делается на особенностях MLOps процессов, возникающих при использовании SOTA нейронных сетей в задах обработки аудио, видео и текстовых данных. На практическом примере демонстрируется подход организации процессов от этапа постановки эксперимента и версионирования моделей до этапа промышленной эксплуатации и непрерывного обновления моделей. Подробно рассматриваются применяемые современные открытые решения и поясняется выбор фреймворков и инструментов на основе сравнительного анализа.
Константин Гинзбургский
Банк Открытие
Начальник Отдела интеграционных технологий розничных рисков Департамента анализа розничных рисков
Внедрение Feature store и MLOps в розничных рисках. Снижение TTM и модельного риска
В современном мире у всех специалистов в области технологий обработки данных на слуху слова Data Engineering и MLOps. Команда розничных рисков банка «Открытие» убедилась в том, что это не просто слова, а вполне материальные технологии, приносящие ощутимую пользу бизнесу.
Обобщая опыт нашей команды, можно выделить следующие ключевые факторы успешного применения MLOps:
• Снижение риска расхождения входных данных в обучении и применении ML моделей.
• Построение жизненного цикла ML моделей с четким разделением функций как специалистов, так и систем.
• Стандартизация интеграции ML моделей с системами принятия решений (СПР).
• Использование инструментов автоматизации тестирования и мониторинга.
Основным измеримым результатом, которого удалось добиться, является снижение на 43% Time To Market подключения моделей к СПР.
Но результаты, которые сложнее оценить количественно, еще важнее:
• Data Science специалисты стали счастливее от того, что могут больше заниматься исследованиями, а рутинным тестированием и мониторингом меньше.
• Клиенты «Открытия» стали счастливее от того, что мы сделали наши модели более точными и надежными.
#Data_Engineering#MLOps#ds#dataset#ds_toolkit
11:40 13:00
Сессия. Оптимизационные алгоритмы
Спикеры:
Valentin Leplat
Skoltech
Senior Research Scientist
Recent successes of higher-order methods in machine learning
The recent progress in computer technologies and telecommunications allows collecting very large volumes of information. The data continuously grows year after year and processing such amounts of data becomes a key challenge. In the data sciences community, we are usually interested in identifying the underlying structure of the data and extracting meaningful information; in the last decade the most successful approaches for achieving this goal are based on deep learning (DL) techniques which commonly involves solving large scale optimization problems. The standard methods for solving such problems are based on first-order schemes such as the famous stochastic gradient descent (SGD), and this for many convincing reasons: they are computationally cheap, usually simple to implement and demonstrated a lot of practical successes for the training of numerous DL models. On their side, higher-order methods, including second-order methods, are more rarely considered in DL, although benefiting from many strengths such as faster convergence (per iteration) and frequent explicit regularization step-size. Moreover, many scientific fields have successfully used second-order methods.
This talk briefly presents some recent and successful developments and use of higher-order methods in deep learning and machine learning.
Александр Безносиков
МФТИ
Заведующий лабораторией фундаментальных исследований МФТИ-Яндекс
Оптимизация в федеративном обучении
Федеративное обучение – это популярная ветка распределенного машинного обучения, в основе которой лежит концепция о том, что обучающая выборка распределенно хранится на локальных устройствах пользователей (телефонах, планшетах, персональных компьютерах). Такая постановка задачи рождает массу новых вопросов и проблем от приватности и персонализации до эффективности коммуникаций и локальных вычислений. Но в основе федеративного обучения, как и в основе классического машинного обучения, лежат задачи оптимизации. Поэтому все особенности федеративного обучения в первую очередь отражаются на оптимизационных методах, которые нужно модифицировать под новые требования. О такого рода модификациях, новых подходах и постановках пойдет речь в выступлении
Даниил Тяпкин
НИУ ВШЭ
Научный сотрудник HDI Lab
Задача исследования в обучении с подкреплением
Обучение с подкреплением – это популярная парадигма машинного обучения, с которой связаны недавние успехи в Go, Starcraft, а также в обучении больших языковым моделей (Reinforcement Learning with Human Feedback) и поиск новых алгоритмов быстрого умножения матриц (AlphaTensor). В этой общей задаче наша задача – обучить некоторого агента взаимодействовать со средой, чтобы максимизировать получаемую награду. Поскольку процесс генерации обучающих данных напрямую связан с решениями агента, возникает “exploration-exploitation” дилемма: агенту нужно одновременно исследовать среду, чтобы иметь достаточно разнообразные обучающие данные, и с другой стороны, ему нужно найти алгоритм действий который максимизирует награду, основываясь на текущих данных. В выступлении пойдет речь о практических и теоретических подходах к решению данной важной дилеммы.
Роланд Хильдебранд
Университет Гренобль-Альпы
Научный сотрудник
Усиление релаксаций в бинарном программировании
Многие проблемы, возникающие на практике, требуют принятия решений типа да/нет или сводятся к таким решениям. Например, обрабатывать ли заказ i на станке j, перевозить ли груз i в день j, выдавать ли клиенту i кредит и т.д. При формализации таких проблем возникают оптимизационные задачи с бинарными переменными, которые относятся к классу смешанно-целочисленных программ. Обычно такие задачи решаются методами ограничений и ветвлений. Однако, бинарность переменных делает такие методы в классической реализации менее эффективными. С другой стороны, именно бинарность переменных делает возможными приёмы, в том числе из полиномиальной оптимизации, сильно улучшающие гарантии на качество решения. В этой презентации мы сделаем обзор таких приёмов и продемонстрируем их эффективность на конкретном примере из практики.
13:00 13:35
Science Note. Training ML models without hyper-parameter tuning - adaptive step-size procedures
Многие задачи, возникающие в области искусственного интеллекта, в конечном итоге сводятся к задачам оптимизации. Какие теоретические прорывы были сделаны в области численных методов решения задач оптимизации в последнее время, насколько они ускорили расчеты, снизили нагрузку на каналы передачи данных, увеличили точность предсказаний? Участники сессии обсудят актуальные исследования в области оптимизации алгоритмов, опишут актуальные задачи, которые стоят в этой области.
Спикеры:
Martin Takac
MBZUAI, UAE
Associate Professor in the Machine Learning department
Training ML models without hyper-parameter tuning - adaptive step-size procedures
The training stage, in which a loss is minimized over the training dataset, is one of many steps in the machine learning pipeline, starting with data collection, cleaning, and model selection.
Training modern machine learning models involves finding optimal parameter values through iterative optimization algorithms such as stochastic gradient descent (SGD) or its variants.
One of the key challenges while using such algorithms is determining appropriate step sizes or learning rates, which strike a balance between convergence speed and stability.
In recent years, adaptive step-size algorithms have gained popularity due to their ability to dynamically adjust learning rates based on the gradient magnitudes encountered during training.
This talk explores various adaptive step-size algorithms, such as Adam and Adagrad, and discusses their advantages and limitations for training machine learning models. We will then introduce two new strategies for adaptive step-size based on Polyak step-size and implicit step-size in a variance-reduced method Sarah.
13:35 14:10
Science Note. Artificial Intelligence, Data Sciences and Optimization in Financial Markets
Спикеры:
Panos Pardalos
NRU HSE
Academic advisor of the Laboratory of Algorithms and Technologies for Network Analysis
Artificial Intelligence, Data Sciences and Optimization in Financial Markets
Artificial Intelligence (along with data sciences and optimization) has been a fundamental component of many activities in economics and finance in recent years. In this lecture we first summarize some of the major impacts of AI tools in economics and finance
and discuss future developments and limitations.
In the second part of the talk we present details on neural network embeddings on corporate annual filings for portfolio selection.
14:15 15:25
Сессия. Развитие инструментов Open Source в области искусственного интеллекта
Роль Open Source в развитии технологий искусственного интеллекта трудно переоценить. Достаточно ли открытого ПО или общедоступными должны быть и датасеты, на которых тренируются системы ИИ? Участники сессии обсудят проблемы и возможности открытого кода в нынешних условиях, а также различные аспекты использования Open Source для создания отечественных ИИ-систем.
Спикеры:
Александр Бухановский
ИТМО
Директор мегафакультета трансляционных информационных технологий, профессор факультета цифровых трансформаций, д.т.н.
Открытый код как квинтэссенция компетенций вуза в области ИИ: опыт Университета ИТМО
Андрей Косинцев
Евраз
Team lead Data Scientist
EVRAZ AutoML - импортозамещение с помощью open-source
Покажем, как мы в ЕВРАЗе решили проблему ухода зарубежных вендоров с российского рынка, какой open-source стек использовали и что из этого вышло.
Евгений Ворсин
Банк ВТБ
Data Scientist в Управлении моделировании партнерств и ИТ процессов, команда эмбеддингов
АвтоМЛ от ВТБ и Сколтех
Краткое описание функционала библиотеки, отличительных особенностей, процессе ее разработки. Расскажем о вариантах применения библиотеки в повседневных задачах для специалистов Data Science.
Игорь Удовиченко
Сколтех
Research Engineer
Библиотека для автоматического поиска архитектур моделей для последовательных данных
В докладе мы кратко рассмотрим функционал библиотеки и ее основные области применения в индустриальных задачах
Максим Савченко
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Sber AI Lab
Михаил Граденко
Группа НЛМК
Head of Data Science
#NAS#RNN#Transformer
15:30 16:45
Сессия. Новые технологии передачи данных
Системы искусственного интеллекта обрабатывают огромные объемы данных, причем зачастую это «чувствительные данные» — персональные, медицинские, финансовые. И сами данные и результаты их обработки должны быть надежно защищены на всех стадиях работы с ними. Участники сессии обсудят безопасную передачу данных, их обработку в криптоанклавах, достоинства и недоставки существующих решений, перспективы развития и опыт применения.
Спикеры:
Алексей Фролов
Сколтех
Профессор, Проектный центр беспроводной связи и интернета вещей, Сколковский институт науки и технологий
Федеративное обучение и локальная дифференциальная приватность.
Артём Алексеев
Aggregion
Директор по развитию
Data Fusion в действии: применение технологий защищенных анклавов для совместной конфиденциальной обработки данных
Денис Безруков
Аггрегион
CTO
Константин Маликов
Банк ВТБ
Директор Управления перспективных алгоритмов машинного обучения
Крипто-анклав ВТБ-МФТИ
В докладе рассматривается концепт технологии систематической кооперативной разработки моделей МО на данных широкого круга владельцев данных без прямого доступа к детальным данным. Технология разрабатывается группой специалистов МФТИ-ВТБ и призвана упростить процесс совместного использования данных для разработки.
Сергей Тренин
МФТИ
Зам.руководителя лаборатории Прикладных исследований МФТИ, ведущий инженер, научный сотрудник
ВТБ-МФТИ развитие инициативы «Крипто-Анкалав»: Обогащение наборов данных, накопление знаний них и новая технология машинного обучения
Рассмотрим примеры задач обработки данных, актуальные для целей технологии "Крипто-анклава", а также укажем на основные вызовы и ожидаемые направления развития
#MLOps#DifPrivateTools#AutoML
16:50 18:00
Сессия. Железо. Инфраструктура. Облака
Искусственный интеллект нуждается не только в платформах и датасетах, но и в мощной системной и инфраструктурной основе. С ее доступностью в России могут возникнуть проблемы. Участники сессии обсудят ситуацию с высокопроизводительными системами и продуктами, возможности облачных решений и то, насколько российские производители разработки готовы стать надежным «базисом» для программной «надстройки» ИИ.
Спикеры:
Артём Зорин
Платформа Сфера
Эксперт
Раннее предупреждение сбоев в бизнес-сервисах с использованием инструмента. Сфера.Интеллектуальный анализ событий
С увеличением количества бизнес-сервисов и роста нагрузки особенно актуальным становится ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий. Для решения такой задачи предназначен инструмент Платформы производства Сфера - Интеллектуальный анализ событий. С использованием адаптивных алгоритмов выявления аномалий в метриках работы бизнес-сервисов инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. При этом динамические пороги внимания формируются с учетом трендов, сезонности, производственных календарей, а гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
Владислав Кирпинский
Selectel
Директор направления облачной интеграции
Комплексный подход к организации инфраструктуры при работе с ML и AI
1. Ключевые преимущества реализации гибридной ИТ-инфраструктуры для ML и AI
2. Катастрофоустойчивость в облаке и не только
3. Сервер с 8хGPU - на шаг до суперкомпьютера
Дмитрий Соловьёв
Платформа Сфера
ML Lead
Раннее предупреждение сбоев в бизнес-сервисах с использованием инструмента. Сфера.Интеллектуальный анализ событий
С увеличением количества бизнес-сервисов и роста нагрузки особенно актуальным становится ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий. Для решения такой задачи предназначен инструмент Платформы производства Сфера - Интеллектуальный анализ событий. С использованием адаптивных алгоритмов выявления аномалий в метриках работы бизнес-сервисов инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. При этом динамические пороги внимания формируются с учетом трендов, сезонности, производственных календарей, а гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
Евгений Афанасьев
Tarantool
Архитектор решений Presale
Машинное обучение на краю сети. Будьте ближе к данным
1. Искусственный интеллект - наше будущее и настоящее
2. Что такое ИИ на краевых (edge-) устройствах
3. Оптимизация решения - залог быстрой работы
4. Долговременное хранение (S3)
Николай Шуняев
Cloud
Руководитель Центра бизнес-анализа
Эволюция вычислений: суперкомпьютер as-a-Service
Развитие подходов к работе с данными неразрывно связан с развитием облачных технологий - вычислений и платформ aaS. Кратное увеличение объёмов данных и усложнение задач в области их аналитики требуют принципиально новых подходов к решению вычислительных задач, реализованных в суперкомпьютерах.
Ранее суперкомпьютеры из-за больших объемов капитальных затрат были доступны единичным компаниям, но сегодня мощности суперкомпьютеров начинают предоставляться как услуга - это делает высокопроизводительные вычисления доступными и открывает колоссальный потенциал развития в области анализа больших данных и сложных AI-моделей.
МФТИ
Зам. зав. кафедрой Алгоритмов и технологий программирования ФПМИ
Как мы готовим инфраструктуру для образовательных курсов в IT?
Обучение методам работы с данными предполагает наличие масштабируемой
инфраструктуры с преднастроенными фреймворками. Выступление будет посвящено
тому, как развернуть и использовать такую инфраструктуру в образовании.
#aiops#anomaly_detection#monitoring#forecast#timeseries

Спикеры

Все спикеры

Программный комитет

Все эксперты
Втб

Генеральный Спонсор

Sk
Cnews

Партнеры