Конференция
О конференции
Data Fusion 2023 — это точка сближения науки и бизнеса.
Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.
В этом году акцент конференции будет сделан на развитие межотраслевого партнерства в области развития технологий ИИ и работы с данными, поиск новых форм сотрудничества между бизнесом и государством для укрепления технологической независимости и наращивания темпов экономического развития страны.
Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.
В этом году акцент конференции будет сделан на развитие межотраслевого партнерства в области развития технологий ИИ и работы с данными, поиск новых форм сотрудничества между бизнесом и государством для укрепления технологической независимости и наращивания темпов экономического развития страны.
Выступления
13 апреля
14 апреля
Стрим 1.Управление Data Fusion
Стрим 2. Практика Data fusion
9:30 9:40
Открытие
9:40 11:00
Пленарная сессия. Технологический суверенитет страны и новые роли лидеров: барьеры на пути и их преодоление
Построение технологического суверенитета в многополярном мире — задача, которая отражает мировые глобальные изменения, и России предстоит решить ее одной из первых. Пленарная секция посвящена развитию межотраслевого партнерства, поиску новых форм сотрудничества для укрепления технологической независимости и наращивания темпов экономического развития страны. Особое внимание участники дискуссии уделят кооперации в области технологий ИИ и работы с данными, в частности затронут такие темы как десакрализация ИИ, выравнивание ИИ-ландшафта, важность развития стека суверенных технологий для работы с данными.
Спикеры:
Заместитель Министра экономического развития РФ
11:05 11:25
Награждение победителей Data Fusion Contest 2023
11:45 12:55
Сессия. Технологии обмена данными: неограниченные возможности vs скрытые угрозы
Безопасный обмен данными между игроками рынка и между бизнесом и государством позволит решить многие актуальные задачи, среди которых — противодействие мошенническим атакам на пользователей, а также проблемы, связанные с наличием цифровых монополий. Участники сессии обсудят подходы к созданию единой межотраслевой платформы безопасного обмена данными, барьеры на этом пути, а также технические и регуляторные решения, которые будут способствовать ее появлению.
Спикеры:
Газпромбанк
Министерство цифрового развития, связи и массовых коммуникаций РФ
Заместитель министра
#Управление и данные
13:00 14:00
Сессия. Диалог бизнеса, государства и разработчиков искусственного интеллекта: как сформировать национальный перечень приоритетных решений в сфере ИИ
Модератор:
Борисенко ГригорийЗаместитель министра цифрового развития, связи и массовых коммуникаций РФПравительство РФ поручило определить и ежегодно обновлять перечень наиболее актуальных и востребованных технологических направлений и решений в сфере ИИ. Какие подходы к его формированию позволят наилучшим образом решить задачи бизнеса? Как сделать этот перечень удобным инструментом формирования стратегии развития для разработчиков ИИ-решений? Эти темы обсудят представители органов власти, бизнеса и компаний-разработчиков.
Спикеры:
Сбербанк
Старший управляющий директор – начальник Управления национального развития AI
#Технологический суверенитет
14:00 14:30
Диалог. Международное сотрудничество в сфере развития искусственного интеллекта и экспорта технологического суверенитета
Спикеры:
14:30 15:00
Диалог. Россия и Малайзия: сотрудничество в развитии искусственного интеллекта и технологий для работы с данными
Модератор:
Пономаренко НикитаТорговый представитель Российской Федерации в Малайзии, Минпромторг РоссииСпикеры:
#Управление и данные
15:00 16:15
Сессия. Практика работы с искусственным интеллектом и данными в ключевых отраслях экономики и социальной сферы
Где сегодня находятся различные отрасли российской экономики в освоении новых технологий анализа данных, машинного обучения и искусственного интеллекта? Что промышленность, сельское хозяйство, транспорт, ритейл, банки и другие сектора экономики могут позаимствовать друг у друга? Как выровнять ИИ-ландшафт?
Спикеры:
Агрохолдинг «Степь»
Директор R&D центра
Практика применения искусственного интеллекта
- Цифровизация производственных процессов агрохолдинга «СТЕПЬ»;
- Использование БПЛА в полях холдинга, возможности, перспективы;
- Направления использования ИИ в производстве;
- Тренды цифровизации влияющие на производство сельскохозяйственной продукции.
- Использование БПЛА в полях холдинга, возможности, перспективы;
- Направления использования ИИ в производстве;
- Тренды цифровизации влияющие на производство сельскохозяйственной продукции.
#Десакрализация ИИ
16:20 17:20
Сессия. Переход на доверенные технологии: опыт российских компаний
На протяжении последнего года российские организации решают задачу миграции на доступные на рынке технологии для работы с данными. В ряде случаев переход на российские решения и открытый код позволили расширить функциональность систем и повысить их экономическую эффективность. Лидеры поделятся опытом перехода на новый стек, обсудят оптимальные пути развития экспертизы по новым технологиям работы с данными и сделают прогнозы — как будет развиваться ситуация с учетом опыта других стран с похожими вызовами?
Спикеры:
Норникель
Директор по ИТ-стратегии и бизнес-приложениям
Непрерывность. Надежность. Санкциинезависимость – опыт компании Норникель
#Технологический суверенитет
17:25 18:40
Сессия. Доступность дата-сетов для искусственного интеллекта
Дискуссия о доступности данных для анализа с точки зрения технологий, бизнеса, регуляторики, саморегуляции рынка, а также обсуждение вопросов обезличенных данных, работы с синтетическими данными, дата-посредничества, доступа к данным государства.
Спикеры:
Ассоциация больших данных
Корпоративный архитектор
Синтетические данные и места где они обитают в АБД
Почему Ассоциация больших данных начала работать с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
#Управление и данные
19:00
11:25 12:10
Сессия. Обзор трендов в области искусственного интеллекта и работы с данными
Спикеры:
Технологии доверия
Руководитель практики Data Science
Тренды применения ИИ для решения индустриальных задач
Доклад будет посвящён последним тенденциям и разработкам в области искусственного интеллекта и анализа данных. Я расскажу об инструментах и методах, которые в настоящее время используются в индустрии, а также об их влиянии на бизнес и общество. Вы узнаете о том, как современные технологии помогают оптимизировать бизнес-процессы, улучшить качество жизни и повысить эффективность работы в различных отраслях.
#Управление и данные
12:15 13:15
Сессия. Опыт применения новых технологий работы с данными в СМБ
Уровень применения технологий искусственного интеллекта в малом и среднем бизнесе существенно ниже, чем в крупном корпоративном сегменте. Могут ли ИИ-решения и дата-сеты стать коммодити для организаций, только вступивших в гонку по использованию передовых аналитических решений? Участники сессии обсудят проблемы сегмента СМБ в аналитике данных и поделятся успешными практиками.
Спикеры:
#Десакрализация ИИ
13:20 14:20
Сессия. Управление данными: стратегия и тактика
Все больше организаций во всех сферах экономики РФ рассматривают управление данными как выделенное направление деятельности, цели которого неотрывно связаны со стратегией компании и сопряжены с задачами цифровой трансформации. Компании, находящиеся на среднем и высоком уровне зрелости процессов управления данными, уже не задаются вопросами «что это?» и «зачем?», а сосредоточены на практической реализации инструментов управления данными и выработке лучших практик в усовершенствовании работы с данными в своей сфере. Спикеры сессии поделятся лучшими практиками по организации бизнес-ориентированного подхода к профилированию данных, опытом применения моделей машинного обучения при идентификации ошибок качества данных, а также кейсом по комплексному управлению компетенциями для устойчивого развития Data Science и Data Governance.
Спикеры:
Ростелеком
Начальник отдела разработки продуктов управления данными
Импортозамещенный стэк инструментов по управлению данными
ГАЗПРОМ НЕФТЬ
Начальник управления аналитических решений, технологий больших данных и искусственного интеллекта, Дирекция региональных продаж
Data Governance и комплексное управление компетенциями для устойчивого развития Data Science
При создании практики Data Science в организации важно учитывать практический опыт ее дальнейшей эволюции. Это приводит к фокусу на направлениях комплексного управления данными, развития вне оргструктуры Data Science специальных ролей и аналитических компетенций. В докладе будут освещены подходы и результаты Дирекции региональных продаж «Газпром нефти» в этих направлениях.
Банк ВТБ
Начальник Управления анализа источников данных Департамента анализа данных и моделирования
#Управление и данные
14:25 15:25
Сессия. Доверенные решения в сфере искусственного интеллекта и обработки данных
Модератор:
Клочко ЮрийГенеральный директор, BSSGПостоянные вызовы, с которыми сталкиваются российские организации, влияют на подходы в области обработки данных и управления цифровыми моделями, поскольку безопасность и устойчивость к изменениям становятся главными приоритетами. Компании вынуждены пересматривать свои стратегии в части выбора технологий и поставщиков услуг и все чаще склоняются к использованию облачных решений от отечественных бигтех-компаний. Но готовы ли российские поставщики предоставить полный стек ИТ-решений и сервисов? Как облачные провайдеры гарантируют безопасность данных? Есть ли альтернативы облаку?
Спикеры:
Банк ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
AutoML как Full Stack решение
Иннотех
Начальник управления
Эволюция анализа данных. Кейсы на графах
В Докладе разберем вопрос о методах получения дополнительной ценности из данных. Почему при анализе связей между лицами, событиями, ресурсами и другими сущностями применение графов для хранения данных, визуализации информации и принятия решений может принести выгоду, значительно сократив время принятия решений одновременно увеличив их качество. Разберем кейсы проведения расследований (в том числе случаев фрода), организации закупок, обеспечения комплаенс и другие
#Технологический суверенитет#Graph#Графы#антифрод#CMDB
15:30 16:30
Data Fusion Awards. Лучшие практики от финалистов премии Data Fusion
Спикеры:
Северсталь Диджитал
Руководитель Центра искусственного интеллекта и машинного обучения
Повышение производительности агрегата непрерывного горячего цинкования №4 ЧерМК с помощью машинного обучения
ГПМ дата
Менеджер по продуктам на основе Computer vision
Опыт применения технологий машинного зрения в решении производственных задач медиаактивов Газпром-Медиа Холдинга
#Премия
16:35 17:35
Сессия. Кадры для Data Fusion
Что необходимо для качественной подготовки специалистов по ИИ и управлению данными? Как переизбыток junior-разработчиков перевести в разряд дата-саентистов более высокого уровня? ИИ-образование для не дата-саентистов: как бизнесу научиться понимать ценность работы с данными, правильно ставить задачи?
Спикеры:
НИУ ВШЭ
Доцент ФКН НИУ ВШЭ и МАИ, технический руководитель лаборатории Al Lab Факультета креативных индустрий Школы дизайна НИУ ВШЭ
Платформенные облачные инструменты в образовании и исследованиях
Современное образование для специалистов по Data Science сталкивается с рядом сложностей, таких как потребности в вычислительных ресурсах и необходимости обучения будущих специалистов не только теоретическим знаниям в области ML, но и практическим навыкам командной работы, внедрения и сопровождения моделей (MLOps). В докладе мы рассмотрим практику использования облачных платформ машинного обучения, в частности, Yandex DataSphere, в образовательных и исследовательских проектах в российских вузах, и расскажем про новую программу Free Tier, по которой вузы могут получить доступ к сервису
МФТИ
Зам. директора ФПМИ по стратегии и коммерциализации; заведующий лабораторией Инноватики МФТИ; руководитель обр. направления Центра НТИ МФТИ по ИИ
Свой Кулибин. Кто создает ценность в инновационных компаниях и как воспитывается новаторство
Поговорим про то, как многомодельное мышление, любопытство и культура формируют новые рынки. Как бизнесу сформировать, "прокачать" и удержать свою команду разработчиков. Причем тут школьные олимпиады и картина мира.
Евраз
Директор по развитию цифровых технологий
ИИ-образование для не дата-саентистов: как бизнесу научиться понимать ценность работы с данными, правильно ставить задачи?
Руководитель лаборатории интеллектуальной аналитики
РАНХиГС
Подготовка специалистов в области ИИ
Университет и бизнес: две точки формирования спроса и предложения на цифровые кадры
Подготовка специалистов в области ИИ и управления данными должен вестись на основе данных рынка труда и отраслевых тенденций.
Подготовка специалистов в области ИИ и управления данными должен вестись на основе данных рынка труда и отраслевых тенденций.
Академия Data-Diving
Генеральный директор
Подготовка кадров на основе данных: миф или реальность
Использование высоких технологий влияет на современный рынок труда:
· формирует новые требования к кадрам;
· происходит изменение пивычных профессий с учетом новых реалий;
· формирует потребность специалистов получать новые навыки и компетенции.
Чтобы не отставать от конкурентов в области технологии искусственного интеллекта, необходимо повышать темпы подготовки кадров и разработки проектов в этой области на наиболее ранних стадиях. Однако в рамках текущей системы высшего образования это представляется весьма непростым процессом: ППС устаревают и становятся менее гибкими, программы ориентированы на ФГОСы, а не реальные запросы и тенденции рынка. Все эти процессы усиливаются на фоне общей нестабильности и неопределенности, и требуют кардинальных изменений в подходе к подготовке
ИТ-кадров.
В рамках доклада будут подняты вопросы качества подготовки специалистов в области анализа данных и ИИ, а также представлена концепция эффективной подготовки кадров. Также будет представлен опыт построения образовательных программ на основе комплексного подхода и совмещения образовательных стандартов и анализа рынка.
· формирует новые требования к кадрам;
· происходит изменение пивычных профессий с учетом новых реалий;
· формирует потребность специалистов получать новые навыки и компетенции.
Чтобы не отставать от конкурентов в области технологии искусственного интеллекта, необходимо повышать темпы подготовки кадров и разработки проектов в этой области на наиболее ранних стадиях. Однако в рамках текущей системы высшего образования это представляется весьма непростым процессом: ППС устаревают и становятся менее гибкими, программы ориентированы на ФГОСы, а не реальные запросы и тенденции рынка. Все эти процессы усиливаются на фоне общей нестабильности и неопределенности, и требуют кардинальных изменений в подходе к подготовке
ИТ-кадров.
В рамках доклада будут подняты вопросы качества подготовки специалистов в области анализа данных и ИИ, а также представлена концепция эффективной подготовки кадров. Также будет представлен опыт построения образовательных программ на основе комплексного подхода и совмещения образовательных стандартов и анализа рынка.
#Десакрализация ИИ
17:40 18:40
Сессия. Вопросы этики в работе с данными
По мере того как искусственный интеллект всё глубже проникает в жизнь каждого, актуализируется целый ряд этических вопросов. Есть ли черта, за которой бизнес должен остановиться в стремлении узнать и понять своего клиента? Как найти баланс между законодательными ограничениями и саморегуляцией? Как согласуется с позиции этики необходимость внедрения технологий искусственного интеллекта и инициируемое этими технологиями сокращение рабочих мест? Участники сессии обсудят эти и другие вопросы с позиций бизнеса, государственного регулирования и права.
Спикеры:
Фонд развития интернет-инициатив (ФРИИ), Московское отделение Ассоциации юристов России, Moscow Digital School
Директор по правовым инициативам, Член Комиссии по правовому обеспечению цифровой экономики, Преподаватель образовательной платформы
МГИМО
Директор Центра ИИ, заведующая кафедрой цифровой экономики и искусственного интеллекта, научный руководитель магистерской программы «Искусственный интеллект в бизнесе»
Бизнес-этика в условиях все-проникающего искусственного интеллекта – усиление или ослабление нравственности и морали предпринимательского сообщества? (участие бизнеса в работе в рамках кодекса этики в сфере ИИ)
Государственная Дума РФ
Депутат Государственной Думы РФ, зампредседателя Комитета Госдумы по информационной политике, информ. технологиям и связи
Как согласуется с позиции этики необходимость внедрения технологий искусственного интеллекта и инициируемое этими технологиями сокращение рабочих мест?
АНО «Центр компетенций по глобальной ИТ-кооперации»
Директор
Зарубежный опыт оборота данных и этические аспекты
#Управление и данные
Стрим 1. ML +
Стрим 2. AI Classic
Стрим 3. ML Environment
10:00 10:05
Открытие
10:05 10:55
Science Note. Оптимизация на службе анализа данных
Спикеры:
МФТИ
Заведующий лабораторией математических методов оптимизации, заведующий кафедрой математических основ управления, доктор физико-математических наук, профессор
Оптимизация на службе анализа данных
Развитие численных методов оптимизации за последние 20 лет сильно сместилось в сторону приложений в анализе данных, в частности, в обучение нейронных сетей. Было предложено много разных полезных приемов, которые позволяют сделать обучение более эффективным. В своем докладе мы сосредоточимся на нескольких таких приемах, которые с одной стороны имеют теоретическое обоснование, а с другой стороны хорошо себя зарекомендовали на практике. Доклад будет носить обзорный характер.
11:00 12:15
Сессия. Новые промышленные технологии
Круг задач, решаемых искусственным интеллектом расширяется и все чаще средства ИИ используют промышленные предприятия. Именно здесь многие видят следующую «точку роста» ИИ-технологий. Сессия посвящена применению искусственного интеллекта на предприятиях реального сектора экономики.
Спикеры:
Axenix
Директор, руководитель направления Industry X
Вызовы применения edge-решений в промышленности
Юзкейс как делать видеаналитику «в полях» на мобильной технике.
1. Основные вызовы и проблемы при работе на открытых участках производства
2. Работа в постоянно меняющихся ракурсах и условиях
3. Работа с узким каналом связи
4. Подходы по сбору датасета в полевых условиях.
1. Основные вызовы и проблемы при работе на открытых участках производства
2. Работа в постоянно меняющихся ракурсах и условиях
3. Работа с узким каналом связи
4. Подходы по сбору датасета в полевых условиях.
Газпром нефть, Ассоциация Искусственный интеллект в промышленности
Руководитель программ развития технологий и инструментов искусственного интеллекта, ПАО «Газпром нефть»
Научный руководитель, Ассоциация «Искусственный интеллект в промышленности»
Научный руководитель, Ассоциация «Искусственный интеллект в промышленности»
Предиктивная аналитика состояния оборудования: кто виноват и что делать?
Если мы говорим о применении искусственного интеллекта в промышленности, то почти всегда первой темой встает предиктивная аналитика состояния оборудования. Действительно, проектов на эту тему огромное множество. Однако успешных кейсов внедрения — единицы, если не меньше. Алексей в своем докладе разберет, почему так получилось, и как должен выглядеть успешный кейс в этой области.
Фирма ТВЕМА
Начальник департамента информационно-аналитических систем
Управление технической безопасностью и эффективностью эксплуатации железнодорожной инфраструктуры на основе больших данных и машинного обучения
БО-ЭНЕРГО.АСТС
Заместитель генерального директора
Подходы к обработке данных измерений систем мониторинга для обеспечения достоверной автоматизированной диагностики
12:20 13:00
Дискуссия. Когда ждать российский ChatGPT?
ChatGPT сейчас самая «горячая» тема в области искусственного интеллекта. Участники сессии обсудят, что необходимо для того чтобы создать аналог ChatGPT в России, кто сможет это сделать. И что российский ученые могут привнести в «российский ChatGPT» нового, чтобы наше развитие в этой области не было только «догоняющим».
Спикеры:
13:00 13:15
Итоги образовательной программы Финтех Хаба Банка России и Банка ВТБ: «Машинное обучение: No-code кластеризация текстов»
Компании работают с огромными потоками текстовой информации. Большая часть которых представляет собой неразмеченные и неструктурированные данные. Для извлечения пользы из подобных данных требуется их систематизация и, следовательно, проведение разведочного анализа.
Бизнес-подразделения, как правило, не умеют работать с ML моделями, а привлечение DS специалиста для проведения анализа требует долгого погружения в контекст бизнес-процессов.
В докладе представят сервис разведочного анализа текстов, цель которого — в удобной и интуитивно понятной форме помочь бизнес-пользователю без привлечения DS самостоятельно провести разведочный анализ текстовой коллекции.
Вы познакомитесь с архитектурой, философией и алгоритмами, лежащими в основе нашего инструмента. Особенностью сервиса является соединение моделей кластеризации и работа над кластерной структурой данных в интерактивном режиме.
Бизнес-подразделения, как правило, не умеют работать с ML моделями, а привлечение DS специалиста для проведения анализа требует долгого погружения в контекст бизнес-процессов.
В докладе представят сервис разведочного анализа текстов, цель которого — в удобной и интуитивно понятной форме помочь бизнес-пользователю без привлечения DS самостоятельно провести разведочный анализ текстовой коллекции.
Вы познакомитесь с архитектурой, философией и алгоритмами, лежащими в основе нашего инструмента. Особенностью сервиса является соединение моделей кластеризации и работа над кластерной структурой данных в интерактивном режиме.
Спикеры:
СПбПУ, Высшая школа прикладной математики и вычислительной физики
Студент магистратуры Математические методы анализа и визуализации данных
РГСУ, Кафедра ИТ, ИИ и общественно-социальных технологий цифрового общества
Студент 3 курса специальности Прикладная математика и информатика: математическое и информационное обеспечение экономической деятельности
СПбПУ, Высшая школа прикладной математики и вычислительной физики
Студент магистратуры Математические методы анализа и визуализации данных
#MLOps#NLP#EXPLORATORY_АNALYSIS#CLUSTERING#BUSINESS#DEEPCLUSTERING#SCCL#SENTENCETRANSFORMER
13:15 13:40
Science Note. Распознавание патологий с использованием нескольких проекций
Спикеры:
13:40 14:00
Science Note. ИИ-видеоаналитика. Real-time и active learning
Спикеры:
Платформа Третье Мнение
Руководитель направления исследований рентгенограмм ОГК и ИИ-Мониторинг
14:00 15:10
Сессия. ML + Physics
Каковы возможности ИИ в описании физических процессов? Какие задачи способны решать системы искусственного интеллекта в реальном секторе? Участники сессии ответят на эти и другие вопросы, а также обсудят, какие компетенции необходимы команде, работающей с данными на производстве.
Спикеры:
15:15 16:05
Science Note. Как чистая математика находит практическое применение
Выступление будет посвящено тому, как задачи, первоначально рассматривавшиеся как чисто теоретические «игры разума», оказали огромное влияние на практическое развитие высоких технологий.
Спикеры:
16:10 17:00
Science Note. Современное положение дел в мультимодальном информационном поиске
В докладе мы рассмотрим общую структуру современного мультимодального информационного поиска, в качестве конкретного примера рассматривая в основном поиск по видео, а также обсудим последние новости в этой области, от CLIP4Clip до Tencent Text-Video Retrieval. Рассматриваемые методы сохраняют общую структуру metric learning, в которой ранжирование ведётся по близости в некотором евклидовом пространстве, а основная часть модели — это отображение текстов и видео в это пространство, но последние работы добавляют в эту схему много интересных модификаций.
Спикеры:
17:05 18:00
Дискуссия. Кооперация и конкуренция в развитии искусственного интеллекта
Модератор:
Павел НовиковИсполнительный директор Центра экспертизы и коммерциализации, Фонд «Сколково»Сессия посвящена вопросам выбора траектории в области взаимодействия с искусственным интеллектом. В рамках сессии обсудим какие преимущества и недостатки сопутствуют конкуренции и кооперации в этой области, а также какие выгоды могут быть получены при различных формах взаимодействия. Участники сессии представят свой опыт и взгляды, а также обсудят тренды и возможности ИИ, что позволит сформировать полную картину происходящего в области ИИ и его влияния на современное общество.
Спикеры:
Банк ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
#MLOps#NLP#CV#AI
10:05 11:25
Сессия. NLP
Модератор:
Сергей КузнецовРуководитель Департамента анализа данных и искусственного интеллекта, профессор, ВШЭОбработка естественного языка, Natural Language Processing (NLP), стала одним из важнейших направлений для развития бизнеса у компаний во многих сферах экономики. На сессии будет рассмотрены пути эффективного решения задач, связанных с NLP, ускорение разработки NLP-моделей за счет применения AutoML, новые аспекты использования NLP-решений.
Спикеры:
Ростелеком
Руководитель направления. Департамент развития решений искусственного интеллекта
Чат-бот Ростелеком. Классификация интентов.
ИТМО
Доцент
Search By Snippet: an NLP4Code case study
В докладе я расскажу о том, как мы создавали средства поиска для исправления ошибок в коде и что для этого понадобилось сделать с языковыми моделями.
МГУ
Ведущий научный сотрудник НИВЦ, профессор филологического факультета, профессор ВМК, доктор технических наук
Автоматические подходы к извлечению таксономий из текстов
В управлении знаниями важно наличие и поддержание в актуальном состоянии различных классификаторов, рубрикаторов, таксономий, описывающих предметную область. Одним из источников порождения и пополнения таксономий традиционно рассматриваются коллекции текстов предметной области. В докладе будут представлены подходы к автоматическому порождению таксономий из текстов, методы их тестирования и достигаемые результаты. В частности, будут рассмотрены самые новые подходы на основе больших языковых моделей.
#NLP
11:30 12:15
Диалог. ChatGPT
Модератор:
Сергей КузнецовРуководитель Департамента анализа данных и искусственного интеллекта, профессор, ВШЭПоговорим о проверке фактов контента, сгенерированного Chat GPT. Генеративные языковые модели известны галлюцинациями и выдумыванием фактов. Мы решим эту проблему и исправим такой контент, проверив его в Интернете.
Спикеры:
12:20 13:50
Сессия. Рекомендательные системы
Рекомендательные системы, которые с помощью средств искусственного интеллекта изучают поведение и предпочтения пользователей, стали неотъемлемой частью большинства сервисов. Наиболее часто такие системы применяются в e-commerce и стриминговых сервисах. Однако постепенно накапливается опыт применения рекомендательных систем и в других сферах деятельности.
Спикеры:
Tarantool
Архитектор решений Presale
Реал-тайм витрины данных для актуальных/персонифицированных рекомендаций
Сколтех
Научный сотрудник, руководитель группы разработки рекомендательных систем
Ускорение обучения в задаче последовательных рекомендаций с использованием тензорной модели внимания
В этом докладе мы обсудим проблему генерации персонализированных рекомендаций при обучении на основе последовательностей действий пользователя. Современные модели решают эту задачу на основе механизма внимания, используемого в трансформерных нейронных сетях. Мы рассмотрим альтернативный подход, основанный на особом тензорном представлении входных данных. Будет показано, как этот подход позволяет создать линейный аналог механизма внимания в рамках обобщения стандартной матричной факторизации для многомерного случая. Полученное решение обеспечивает сравнимое качество рекомендаций, но при этом дает ряд вычислительных преимуществ по сравнению с нейросетевым подходом
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Sber AI Lab
Симуляционные среды для задач рекомендаций
13:55 15:25
Сессия. Геоаналитика
Благодаря применению ИИ в геоаналитике, гео-модели помогают принять наиболее эффективное решение в различных отраслях бизнеса, в государственном управлении, экологии, здравоохранении, транспортной системе. Геоаналитика используется для анализа трафика, определения потенциальных клиентов, независимой оценке объектов имущества и для оптимизации распределения ресурсов. В сессии спикеры расскажут про лучшие практики применения в бизнесе анализа геоданных.
Спикеры:
AI mapping expert
Towards automatic vector mapping from multi-source geospatial data
Vector mapping is widely required by applications such as navigation, smart city and photovoltaic power station planning. Traditionally, vector maps have been manually drawn by mapping experts. Automating this process is a challenging task. We show some of our latest advances in automatic vector mapping technology for navigation map production and large-scale building mapping.
Tele2
Руководитель службы исследования больших данных
Применение ML в туризме
Доклад будет посвящен применению алгоритмов машинного обучения для задач определения точек притяжения (Points of Interest) и целей посещения абонентами отдельных регионов с использованием внутренних источников данных телеком-оператора и открытых данных.
VK Predict
Руководитель команды геоаналитики
Как построить систему геоаналитики с применением ML
Терра Тех
Директор по маркетингу
Геоаналитическая платформа PIXEL.AI: 20 МИНУТ НА СЕЛЬХОЗАНАЛИТИКУ
Летом 2022 года компания «ТЕРРА ТЕХ» (дочерняя компания холдинга «Российские космические системы» Госкорпорации «Роскосмос») представила новую геоналитическую платформу Pixel.AI. Она работает на стыке технологий дистанционного зондирования Земли и искусственного интеллекта.
Пакет аналитики по территории пользователь получает почти через 20 минут после заказа. Данные могут использовать банки, страховые компании при принятии решений о кредитовании, субсидировании и страховании предприятий, мониторинге залогов, инвентаризации сельхозугодий и оценке земельных участков. Сейчас сервис запрограммирован на сельхозаналитику. Pixel.AI позволяет на 97% сократить время и ресурсы на определение границ, статуса, расчет индексов и статистики. И снизить на 48% затраты на обработку космических данных.
Пакет аналитики по территории пользователь получает почти через 20 минут после заказа. Данные могут использовать банки, страховые компании при принятии решений о кредитовании, субсидировании и страховании предприятий, мониторинге залогов, инвентаризации сельхозугодий и оценке земельных участков. Сейчас сервис запрограммирован на сельхозаналитику. Pixel.AI позволяет на 97% сократить время и ресурсы на определение границ, статуса, расчет индексов и статистики. И снизить на 48% затраты на обработку космических данных.
ВШЭ
Доцент Департамента программной инженерии, Факультет компьютерных наук
Геоаналитика и базы данных для больших многомерных массивов (Array DBMS)
Многомерный массив – естественное представление для многих важных типов данных. Большие многомерные массивы возникают благодаря дистанционному зондированию Земли (ДЗЗ), численному моделированию погоды и климата, биоинформатике, наблюдениям астрономических телескопов и многим другим областям. Стремительно растущие объемы многомерных массивов постоянно требуют новых подходов для их эффективного хранения, управления и обработки. В докладе будет представлен обзор ряда возможностей современных Array DBMS – активно развивающейся области R&D
Банк ВТБ
Управляющий директор управления перспективных алгоритмов машинного обучения
Geo-AutoML в задаче оценки стоимости объектов недвижимости
Оценка стоимости объектов недвижимости является одной из классических задач, как в области
гео-пространственного анализа, так и в области машинного обучения, однако, универсального
решения, учитывающего все аспекты и специфику рынка недвижимости, не существует до сих пор.
Так, например, цены на недвижимость в России имеют выраженную региональную специфику,
подвержены макроэкономическим колебаниям и сильно варьируются в зависимости от качества и
расположения объекта. Таким образом, в масштабах России для корректного ответа на вопрос о
стоимости объекта недвижимости необходимо решить целый ряд статистических, гео-
аналитических и алгоритмических задач. Совместив современные инструменты гео-аналитики и
машинного обучения и используя уникальный периметр данных доступный банку ВТБ, мы
разработали Geo-AutoML решение, позволяющее в автоматическом режиме строить и
актуализировать модели оценки недвижимости в широкой географии городов России. Данное
решение под капотом не только рассчитывает огромное количество гео-пространственных
факторов, характеризующих транспортную или социальную инфраструктуру в окрестности
объекта, но и с помощью (ai?) алгоритмов машинного обучения отбирает наиболее релевантные
для конкретного города или региона. Техники анализа временных рядов позволяют выделить в
цене такие компоненты как возраст или стадию готовности объекта, учесть влияние процентных
ставок или макроэкономических индикаторов. «Замешав» все эти техники в рамках Geo-AutoML и
концепции Data Fusion мы получили уникальное динамичное решение, эффективно работающее в
изменяющихся условиях рынка.
гео-пространственного анализа, так и в области машинного обучения, однако, универсального
решения, учитывающего все аспекты и специфику рынка недвижимости, не существует до сих пор.
Так, например, цены на недвижимость в России имеют выраженную региональную специфику,
подвержены макроэкономическим колебаниям и сильно варьируются в зависимости от качества и
расположения объекта. Таким образом, в масштабах России для корректного ответа на вопрос о
стоимости объекта недвижимости необходимо решить целый ряд статистических, гео-
аналитических и алгоритмических задач. Совместив современные инструменты гео-аналитики и
машинного обучения и используя уникальный периметр данных доступный банку ВТБ, мы
разработали Geo-AutoML решение, позволяющее в автоматическом режиме строить и
актуализировать модели оценки недвижимости в широкой географии городов России. Данное
решение под капотом не только рассчитывает огромное количество гео-пространственных
факторов, характеризующих транспортную или социальную инфраструктуру в окрестности
объекта, но и с помощью (ai?) алгоритмов машинного обучения отбирает наиболее релевантные
для конкретного города или региона. Техники анализа временных рядов позволяют выделить в
цене такие компоненты как возраст или стадию готовности объекта, учесть влияние процентных
ставок или макроэкономических индикаторов. «Замешав» все эти техники в рамках Geo-AutoML и
концепции Data Fusion мы получили уникальное динамичное решение, эффективно работающее в
изменяющихся условиях рынка.
#Geo
15:30 16:45
Сессия. Адверсальные атаки
По мере совершенствования машинного обучения совершенствуются и средства его обмана, получившие название Adversarial Machine Learning. За словом Adversarial, «состязательные», стоят попытки воздействия на ИИ, которые должны вызвать ошибки в его работе. На сессии «Адверсальные атаки» будут рассмотрены как методы атак, так и способы защиты от них, а также представлены соответствующие кейсы.
Спикеры:
Positive Technologies
Руководитель отдела перспективных технологий
Про подход к тестированию умных сервисов
В докладе рассмотрим тестирование безопасности систем машинного обучения. Обсудим эффективность разных атак, приведя примеры успешных и неуспешных. В заключение докладчик на основе собственного опыта покажет, как успешный подход к тестированию безопасности может привести к успеху, и предоставит полезные ресурсы для дальнейшего изучения темы.
Сколтех
Старший преподаватель
Как атаковать черный ящик?
В стандартной постановке адверсальная атака производится на модель, к которой у нас есть полный доступ. Например, доступны градиенты модели по входам. Мы рассмотрим более прикладную постановку, в которой модель доступна как черный и серый ящик и разберем, как можно эффективно атаковать такую модель и сколько вызовов целевой функции нам для этого нужно.
Яндекс
Руководитель ML-проектов
Адверсариальные атаки на модели основанные на последовательностях пользовательских данных
В докладе я расскажу про адверсальные атаки на модели, основанные на последовательностях пользовательских данных. В основном, мы будем обсуждать реалистичные атаки на банковские скоринговые модели, использующие транзакции по картам. Поговорим про то, как может быть устроена реалистичная атака и что должно быть доступно атакующему. Разберем некоторые методы атак, которые подходят для адверсариальной модификации последовательностей. Обсудим результаты их применения к модели аналогичной той, которая может применяться в банках для скоринга клиентов из нашей статьи на KDD`21 (https://arxiv.org/abs/2106.08361).
Банк ВТБ
Data Scientist в Управлении моделировании партнерств и ИТ процессов, команда эмбеддингов
Adversarial ML – подготовка контеста Data Fusion Contest 2023
В докладе расскажу о практическом кейсе применения техник Adversarial ML, которые использовали при проработки соревнования Data Fusion 2023. Речь о атаках и защите при классификации нейронками клиентских транзакций. Какими методами тестировали сетапы соревнования, чтобы отобрать лучшие из возможных сценариев его организации. От чего в итоге отказались и почему.
#adversarial_ml
16:50 17:25
Сессия. Разбор решений финалистов Data Fusion Contest
Data Fusion Contest 2023 – это уникальное соревнование по машинному обучению в новом турнирном формате. В этом году соревнование посвящено теме Adversarial Machine Learning (состязательное машинное обучение).
Впервые тема задач атак и защиты моделей публикуется для реальных бизнес-задач на индустриальных данных, а не академических датасетах. В этой сессии представим лучшие решения победителей соревнования.
Впервые тема задач атак и защиты моделей публикуется для реальных бизнес-задач на индустриальных данных, а не академических датасетах. В этой сессии представим лучшие решения победителей соревнования.
Спикеры:
Альфа-Банк
Data Scientist
ПЕРВОЕ МЕСТО В ФИНАЛЬНОМ ТУРНИРЕ ЗАДАЧИ «ЗАЩИТА» В СОСТАВЕ КОМАНДЫ «ЛАБОРАТОРИЯ», DATA SCIENTIST, АЛЬФА-БАНК
ПЕРВОЕ МЕСТО В ФИНАЛЬНОМ ТУРНИРЕ ЗАДАЧИ «ЗАЩИТА» В СОСТАВЕ КОМАНДЫ «ЛАБОРАТОРИЯ», DATA SCIENTIST, АЛЬФА-БАНК
Как мы заняли 1 место в задаче Защита в Data Fusion Contest 2023
Расскажем, какие идеи позволили занять 1 место в финальном турнире и 2 место в промежуточном. Поделимся инсайдами в данных и в задаче
ПОБЕДИТЕЛЬ НОМИНАЦИИ «COMPANION» ФИНАЛЬНОГО ТУРНИРА ЗАДАЧИ «АТАКА»
Бейзлайн атаки банковской модели и способы его улучшения
Рассмотрим бейзлайн атаки соревнования Data Fusion Contest 2023. Расскажу про вариант white-box атаки при помощи перебора, а также улучшение алгоритма для проведения black-box атаки
#adversarial_ml#RNN#defense#distillation
17:30 18:30
Сессия. Синтетические данные
Синтетические данные, сгенерированные специализированными алгоритмами, все чаще используются в тех случаях, когда «естественные» использовать затруднительно или их не хватает. Например, применение искусственных данных в процессах машинного обучения позволяет обойти требования по защите персональной информации. На сессии будут рассмотрены методы создания синтетических данных и кейсы их применения.
Спикеры:
МТС
RnD директор, Центр BigData
Симуляция атак на обученную графовую нейросеть в задаче банковского скоринга
В докладе рассматриваются эффекты воздействия атак разных типов на обученную графовую нейронную сеть, применяющуюся в банковском скоринге. Эффекты рассматриваются как с точки зрения data sceince метрик и смещений распределения ответов модели, так и с точки зрения принятия решений в бизнес-процессе
Ассоциация больших данных
Корпоративный архитектор
Синтетические данные и места где они обитают в АБД
Почему Ассоциация больших данных начала работать с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
Какие цели ставит АБД в результате работы с синтетическими данными?
Какие результат Ассоциация получила в результате эксперимента?
Какие существуют особенности реализации исследований?
Как в дальнейшем будут использованы результаты исследований с синтетическими данными?
МТС
ML разработчик, Центр BigData
Симуляция атак на обученную графовую нейросеть в задаче банковского скоринга
В докладе рассматриваются эффекты воздействия атак разных типов на обученную графовую нейронную сеть, применяющуюся в банковском скоринге. Эффекты рассматриваются как с точки зрения data sceince метрик и смещений распределения ответов модели, так и с точки зрения принятия решений в бизнес-процессе
Банк ВТБ
Senior ML Researcher
Разработка моделей машинного обучения для генерации синтетических платежных транзакций и построение предсказательных моделей на их основе
В докладе будут рассмотрены построенные модели для генерации синтетических платежных транзакций на основе GRU, Transformer, CVAE.
Также будут показаны результаты применения синтетических данных для решения задач предсказания дефолта, возраста и пола клиента
Также будут показаны результаты применения синтетических данных для решения задач предсказания дефолта, возраста и пола клиента
10:05 11:35
Сессия. MLOps
«Концепция «DevOps» — золотой ключик, открывший современные подходы для быстрого, гибкого и непрерывного совершенствования информационных систем и технологий, все шире распространяется и адаптируется к самым разнообразным областям, связанным с информационными технологиями и управлением данными. В частности, она находит применение и в области искусственного интеллекта. На сессии MLOps будут рассмотрены различные аспекты адаптации инструментария DevOps к процессам машинного обучения и непрерывного совершенствования систем ИИ.
Мы рассмотрим как новые тенденции и подходы, позволяющие оптимизировать работу с данными в реальных условиях, так и уже сложившиеся MLОps инструменты и практики — на конкретных примерах.
Мы рассмотрим как новые тенденции и подходы, позволяющие оптимизировать работу с данными в реальных условиях, так и уже сложившиеся MLОps инструменты и практики — на конкретных примерах.
Спикеры:
VK Cloud
Технический менеджер продукта Cloud ML Platform
Вызовы и решения при построении сервисов на основе ML: опыт VK Cloud
Schlumberger
Senior Data Scientist
Инженерия данных во имя воспроизводимости и интерпретируемости: теория и практика MLOps на стыке DataOps и AIOps.
Иннотех
Старший руководитель направления
Платформа Scibox
В данном выступлении я расскажу об основных компонентах MOps платформы SciBox. Какие задачи продуктивизации моделей она закрывает и какие компоненты включает. Также речь пойдет об инструменте разметки датасетов Маркер.
Билайн бизнес
Руководитель департамента машинного обучения и искусственного интеллекта
MLOps процессы для видео/аудио аналитики на SOTA нейронных сетях
Передовые решения на основе нейронных сетей. Для разработки и промышленного использования этих решений требуется эффективная организация процессов по созданию и поддержке ML алгоритмов. Такой подход называется MLOps. В докладе описывается становление MLOps процессов в продуктовых командах beeline. Фокус делается на особенностях MLOps процессов, возникающих при использовании SOTA нейронных сетей в задах обработки аудио, видео и текстовых данных. На практическом примере демонстрируется подход организации процессов от этапа постановки эксперимента и версионирования моделей до этапа промышленной эксплуатации и непрерывного обновления моделей. Подробно рассматриваются применяемые современные открытые решения и поясняется выбор фреймворков и инструментов на основе сравнительного анализа.
Банк Открытие
Начальник Отдела интеграционных технологий розничных рисков Департамента анализа розничных рисков
Внедрение Feature store и MLOps в розничных рисках. Снижение TTM и модельного риска
В современном мире у всех специалистов в области технологий обработки данных на слуху слова Data Engineering и MLOps. Команда розничных рисков банка «Открытие» убедилась в том, что это не просто слова, а вполне материальные технологии, приносящие ощутимую пользу бизнесу.
Обобщая опыт нашей команды, можно выделить следующие ключевые факторы успешного применения MLOps:
• Снижение риска расхождения входных данных в обучении и применении ML моделей.
• Построение жизненного цикла ML моделей с четким разделением функций как специалистов, так и систем.
• Стандартизация интеграции ML моделей с системами принятия решений (СПР).
• Использование инструментов автоматизации тестирования и мониторинга.
Основным измеримым результатом, которого удалось добиться, является снижение на 43% Time To Market подключения моделей к СПР.
Но результаты, которые сложнее оценить количественно, еще важнее:
• Data Science специалисты стали счастливее от того, что могут больше заниматься исследованиями, а рутинным тестированием и мониторингом меньше.
• Клиенты «Открытия» стали счастливее от того, что мы сделали наши модели более точными и надежными.
Обобщая опыт нашей команды, можно выделить следующие ключевые факторы успешного применения MLOps:
• Снижение риска расхождения входных данных в обучении и применении ML моделей.
• Построение жизненного цикла ML моделей с четким разделением функций как специалистов, так и систем.
• Стандартизация интеграции ML моделей с системами принятия решений (СПР).
• Использование инструментов автоматизации тестирования и мониторинга.
Основным измеримым результатом, которого удалось добиться, является снижение на 43% Time To Market подключения моделей к СПР.
Но результаты, которые сложнее оценить количественно, еще важнее:
• Data Science специалисты стали счастливее от того, что могут больше заниматься исследованиями, а рутинным тестированием и мониторингом меньше.
• Клиенты «Открытия» стали счастливее от того, что мы сделали наши модели более точными и надежными.
#Data_Engineering#MLOps#ds#dataset#ds_toolkit
11:40 13:00
Сессия. Оптимизационные алгоритмы
Спикеры:
Skoltech
Senior Research Scientist
Recent successes of higher-order methods in machine learning
The recent progress in computer technologies and telecommunications allows collecting very large volumes of information. The data continuously grows year after year and processing such amounts of data becomes a key challenge. In the data sciences community, we are usually interested in identifying the underlying structure of the data and extracting meaningful information; in the last decade the most successful approaches for achieving this goal are based on deep learning (DL) techniques which commonly involves solving large scale optimization problems. The standard methods for solving such problems are based on first-order schemes such as the famous stochastic gradient descent (SGD), and this for many convincing reasons: they are computationally cheap, usually simple to implement and demonstrated a lot of practical successes for the training of numerous DL models. On their side, higher-order methods, including second-order methods, are more rarely considered in DL, although benefiting from many strengths such as faster convergence (per iteration) and frequent explicit regularization step-size. Moreover, many scientific fields have successfully used second-order methods.
This talk briefly presents some recent and successful developments and use of higher-order methods in deep learning and machine learning.
This talk briefly presents some recent and successful developments and use of higher-order methods in deep learning and machine learning.
МФТИ
Заведующий лабораторией фундаментальных исследований МФТИ-Яндекс
Оптимизация в федеративном обучении
Федеративное обучение – это популярная ветка распределенного машинного обучения, в основе которой лежит концепция о том, что обучающая выборка распределенно хранится на локальных устройствах пользователей (телефонах, планшетах, персональных компьютерах). Такая постановка задачи рождает массу новых вопросов и проблем от приватности и персонализации до эффективности коммуникаций и локальных вычислений. Но в основе федеративного обучения, как и в основе классического машинного обучения, лежат задачи оптимизации. Поэтому все особенности федеративного обучения в первую очередь отражаются на оптимизационных методах, которые нужно модифицировать под новые требования. О такого рода модификациях, новых подходах и постановках пойдет речь в выступлении
НИУ ВШЭ
Научный сотрудник HDI Lab
Задача исследования в обучении с подкреплением
Обучение с подкреплением – это популярная парадигма машинного обучения, с которой связаны недавние успехи в Go, Starcraft, а также в обучении больших языковым моделей (Reinforcement Learning with Human Feedback) и поиск новых алгоритмов быстрого умножения матриц (AlphaTensor). В этой общей задаче наша задача – обучить некоторого агента взаимодействовать со средой, чтобы максимизировать получаемую награду. Поскольку процесс генерации обучающих данных напрямую связан с решениями агента, возникает “exploration-exploitation” дилемма: агенту нужно одновременно исследовать среду, чтобы иметь достаточно разнообразные обучающие данные, и с другой стороны, ему нужно найти алгоритм действий который максимизирует награду, основываясь на текущих данных. В выступлении пойдет речь о практических и теоретических подходах к решению данной важной дилеммы.
Университет Гренобль-Альпы
Научный сотрудник
Усиление релаксаций в бинарном программировании
Многие проблемы, возникающие на практике, требуют принятия решений типа да/нет или сводятся к таким решениям. Например, обрабатывать ли заказ i на станке j, перевозить ли груз i в день j, выдавать ли клиенту i кредит и т.д. При формализации таких проблем возникают оптимизационные задачи с бинарными переменными, которые относятся к классу смешанно-целочисленных программ. Обычно такие задачи решаются методами ограничений и ветвлений. Однако, бинарность переменных делает такие методы в классической реализации менее эффективными. С другой стороны, именно бинарность переменных делает возможными приёмы, в том числе из полиномиальной оптимизации, сильно улучшающие гарантии на качество решения. В этой презентации мы сделаем обзор таких приёмов и продемонстрируем их эффективность на конкретном примере из практики.
13:00 13:35
Science Note. Training ML models without hyper-parameter tuning - adaptive step-size procedures
Многие задачи, возникающие в области искусственного интеллекта, в конечном итоге сводятся к задачам оптимизации. Какие теоретические прорывы были сделаны в области численных методов решения задач оптимизации в последнее время, насколько они ускорили расчеты, снизили нагрузку на каналы передачи данных, увеличили точность предсказаний? Участники сессии обсудят актуальные исследования в области оптимизации алгоритмов, опишут актуальные задачи, которые стоят в этой области.
Спикеры:
MBZUAI, UAE
Associate Professor in the Machine Learning department
Training ML models without hyper-parameter tuning - adaptive step-size procedures
The training stage, in which a loss is minimized over the training dataset, is one of many steps in the machine learning pipeline, starting with data collection, cleaning, and model selection.
Training modern machine learning models involves finding optimal parameter values through iterative optimization algorithms such as stochastic gradient descent (SGD) or its variants.
One of the key challenges while using such algorithms is determining appropriate step sizes or learning rates, which strike a balance between convergence speed and stability.
In recent years, adaptive step-size algorithms have gained popularity due to their ability to dynamically adjust learning rates based on the gradient magnitudes encountered during training.
This talk explores various adaptive step-size algorithms, such as Adam and Adagrad, and discusses their advantages and limitations for training machine learning models. We will then introduce two new strategies for adaptive step-size based on Polyak step-size and implicit step-size in a variance-reduced method Sarah.
Training modern machine learning models involves finding optimal parameter values through iterative optimization algorithms such as stochastic gradient descent (SGD) or its variants.
One of the key challenges while using such algorithms is determining appropriate step sizes or learning rates, which strike a balance between convergence speed and stability.
In recent years, adaptive step-size algorithms have gained popularity due to their ability to dynamically adjust learning rates based on the gradient magnitudes encountered during training.
This talk explores various adaptive step-size algorithms, such as Adam and Adagrad, and discusses their advantages and limitations for training machine learning models. We will then introduce two new strategies for adaptive step-size based on Polyak step-size and implicit step-size in a variance-reduced method Sarah.
13:35 14:10
Science Note. Artificial Intelligence, Data Sciences and Optimization in Financial Markets
Спикеры:
NRU HSE
Academic advisor of the Laboratory of Algorithms and Technologies for Network Analysis
Artificial Intelligence, Data Sciences and Optimization in Financial Markets
Artificial Intelligence (along with data sciences and optimization) has been a fundamental component of many activities in economics and finance in recent years. In this lecture we first summarize some of the major impacts of AI tools in economics and finance
and discuss future developments and limitations.
In the second part of the talk we present details on neural network embeddings on corporate annual filings for portfolio selection.
and discuss future developments and limitations.
In the second part of the talk we present details on neural network embeddings on corporate annual filings for portfolio selection.
14:15 15:25
Сессия. Развитие инструментов Open Source в области искусственного интеллекта
Роль Open Source в развитии технологий искусственного интеллекта трудно переоценить. Достаточно ли открытого ПО или общедоступными должны быть и датасеты, на которых тренируются системы ИИ? Участники сессии обсудят проблемы и возможности открытого кода в нынешних условиях, а также различные аспекты использования Open Source для создания отечественных ИИ-систем.
Спикеры:
ИТМО
Директор мегафакультета трансляционных информационных технологий, профессор факультета цифровых трансформаций, д.т.н.
Открытый код как квинтэссенция компетенций вуза в области ИИ: опыт Университета ИТМО
Евраз
Team lead Data Scientist
EVRAZ AutoML - импортозамещение с помощью open-source
Покажем, как мы в ЕВРАЗе решили проблему ухода зарубежных вендоров с российского рынка, какой open-source стек использовали и что из этого вышло.
Банк ВТБ
Data Scientist в Управлении моделировании партнерств и ИТ процессов, команда эмбеддингов
АвтоМЛ от ВТБ и Сколтех
Краткое описание функционала библиотеки, отличительных особенностей, процессе ее разработки. Расскажем о вариантах применения библиотеки в повседневных задачах для специалистов Data Science.
Сколтех
Research Engineer
Библиотека для автоматического поиска архитектур моделей для последовательных данных
В докладе мы кратко рассмотрим функционал библиотеки и ее основные области применения в индустриальных задачах
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Sber AI Lab
#NAS#RNN#Transformer
15:30 16:45
Сессия. Новые технологии передачи данных
Системы искусственного интеллекта обрабатывают огромные объемы данных, причем зачастую это «чувствительные данные» — персональные, медицинские, финансовые. И сами данные и результаты их обработки должны быть надежно защищены на всех стадиях работы с ними. Участники сессии обсудят безопасную передачу данных, их обработку в криптоанклавах, достоинства и недоставки существующих решений, перспективы развития и опыт применения.
Спикеры:
Сколтех
Профессор, Проектный центр беспроводной связи и интернета вещей, Сколковский институт науки и технологий
Федеративное обучение и локальная дифференциальная приватность.
Aggregion
Директор по развитию
Data Fusion в действии: применение технологий защищенных анклавов для совместной конфиденциальной обработки данных
Банк ВТБ
Директор Управления перспективных алгоритмов машинного обучения
Крипто-анклав ВТБ-МФТИ
В докладе рассматривается концепт технологии систематической кооперативной разработки моделей МО на данных широкого круга владельцев данных без прямого доступа к детальным данным. Технология разрабатывается группой специалистов МФТИ-ВТБ и призвана упростить процесс совместного использования данных для разработки.
МФТИ
Зам.руководителя лаборатории Прикладных исследований МФТИ, ведущий инженер, научный сотрудник
ВТБ-МФТИ развитие инициативы «Крипто-Анкалав»: Обогащение наборов данных, накопление знаний них и новая технология машинного обучения
Рассмотрим примеры задач обработки данных, актуальные для целей технологии "Крипто-анклава", а также укажем на основные вызовы и ожидаемые направления развития
#MLOps#DifPrivateTools#AutoML
16:50 18:00
Сессия. Железо. Инфраструктура. Облака
Искусственный интеллект нуждается не только в платформах и датасетах, но и в мощной системной и инфраструктурной основе. С ее доступностью в России могут возникнуть проблемы. Участники сессии обсудят ситуацию с высокопроизводительными системами и продуктами, возможности облачных решений и то, насколько российские производители разработки готовы стать надежным «базисом» для программной «надстройки» ИИ.
Спикеры:
Платформа Сфера
Эксперт
Раннее предупреждение сбоев в бизнес-сервисах с использованием инструмента. Сфера.Интеллектуальный анализ событий
С увеличением количества бизнес-сервисов и роста нагрузки особенно актуальным становится ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий. Для решения такой задачи предназначен инструмент Платформы производства Сфера - Интеллектуальный анализ событий. С использованием адаптивных алгоритмов выявления аномалий в метриках работы бизнес-сервисов инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. При этом динамические пороги внимания формируются с учетом трендов, сезонности, производственных календарей, а гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
Selectel
Директор направления облачной интеграции
Комплексный подход к организации инфраструктуры при работе с ML и AI
1. Ключевые преимущества реализации гибридной ИТ-инфраструктуры для ML и AI
2. Катастрофоустойчивость в облаке и не только
3. Сервер с 8хGPU - на шаг до суперкомпьютера
2. Катастрофоустойчивость в облаке и не только
3. Сервер с 8хGPU - на шаг до суперкомпьютера
Платформа Сфера
ML Lead
Раннее предупреждение сбоев в бизнес-сервисах с использованием инструмента. Сфера.Интеллектуальный анализ событий
С увеличением количества бизнес-сервисов и роста нагрузки особенно актуальным становится ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий. Для решения такой задачи предназначен инструмент Платформы производства Сфера - Интеллектуальный анализ событий. С использованием адаптивных алгоритмов выявления аномалий в метриках работы бизнес-сервисов инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. При этом динамические пороги внимания формируются с учетом трендов, сезонности, производственных календарей, а гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес-сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
Tarantool
Архитектор решений Presale
Машинное обучение на краю сети. Будьте ближе к данным
1. Искусственный интеллект - наше будущее и настоящее
2. Что такое ИИ на краевых (edge-) устройствах
3. Оптимизация решения - залог быстрой работы
4. Долговременное хранение (S3)
2. Что такое ИИ на краевых (edge-) устройствах
3. Оптимизация решения - залог быстрой работы
4. Долговременное хранение (S3)
Cloud
Руководитель Центра бизнес-анализа
Эволюция вычислений: суперкомпьютер as-a-Service
Развитие подходов к работе с данными неразрывно связан с развитием облачных технологий - вычислений и платформ aaS. Кратное увеличение объёмов данных и усложнение задач в области их аналитики требуют принципиально новых подходов к решению вычислительных задач, реализованных в суперкомпьютерах.
Ранее суперкомпьютеры из-за больших объемов капитальных затрат были доступны единичным компаниям, но сегодня мощности суперкомпьютеров начинают предоставляться как услуга - это делает высокопроизводительные вычисления доступными и открывает колоссальный потенциал развития в области анализа больших данных и сложных AI-моделей.
Ранее суперкомпьютеры из-за больших объемов капитальных затрат были доступны единичным компаниям, но сегодня мощности суперкомпьютеров начинают предоставляться как услуга - это делает высокопроизводительные вычисления доступными и открывает колоссальный потенциал развития в области анализа больших данных и сложных AI-моделей.
МФТИ
Зам. зав. кафедрой Алгоритмов и технологий программирования ФПМИ
Как мы готовим инфраструктуру для образовательных курсов в IT?
Обучение методам работы с данными предполагает наличие масштабируемой
инфраструктуры с преднастроенными фреймворками. Выступление будет посвящено
тому, как развернуть и использовать такую инфраструктуру в образовании.
инфраструктуры с преднастроенными фреймворками. Выступление будет посвящено
тому, как развернуть и использовать такую инфраструктуру в образовании.
#aiops#anomaly_detection#monitoring#forecast#timeseries