Data Fusion 2022

Онлайн-конференция, посвященная синергии данных Data Fusion, состоялась 14 – 15 апреля
107
Спикеров
27
Сессий
1 000 000 +
Просмотров

ВЫСТУПЛЕНИЯ DATA FUSION 2022

Business day
Data science day
Сессия. Ставка на Data Fusion
Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах

Модератор:

Александра Кирьянова, главный редактор Cnews

Спикеры:
Сергей
Безбогов
ВТБ
Заместитель руководителя Технологического блока - старший вице-президент
Александр
Абаркин
Инновационный Центр "Безопасный транспорт"
Первый заместитель по ИТ руководителя Инновационного центра «Безопасный транспорт»
Артем Блинов
ГК Самолет
Директор по закупкам
Роман Мизюрин
Альфабанк
Руководитель продвинутой аналитики Рисков и Общекорпоративных функций
Data Fusion Awards. Data Fusion в бизнесе

ПРОРЫВ ГОДА

МОНЕТИЗАЦИЯ ДАННЫХ

ТРЕНДСЕТТЕР

Ведущие:

Александра Кирьянова, главный редактор CNews,

Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Вручает:

Сергей Безбогов, заместитель руководителя Технологического блока - старший вице-президент ПАО «Банк ВТБ»

Сессия. Open source

Всё больше компаний, разворачивающих свою цифровую инфраструктуру или разрабатывающих цифровые сервисы, переходят от проприетарных платформ, которые не всегда в полной мере обеспечивают потребности бизнеса в гибкой настройке к своим собственным решениям. Использование Open Source библиотек позволяет сохранить рентабельность разработки на приемлемом уровне, но, с другой стороны, является источником рисков. Это и риск блокировки доступа к ресурсам с открытыми библиотеками, изменения лицензий использования, безопасность размещенного кода и «закладки» в фундаментальных моделях. Каковы риски коммерческих систем в основе которых лежат Open Source разработки? Есть ли перспективы импортозамещения в этой сфере и когда появится российский GitHub?

Модератор: Сергей Бережной, Директор по взаимодействию с разработчиками, Яндекс

Спикеры:
Борис Емельянов
Ростелеком
Директор департамента управления платформами хранилища данных
Алексей Смирнов
Базальт СПО
Председатель совета директоров
Владислава Васильева
АНО «Цифровая экономика»
Заместитель директора по развитию, направление «Безопасная и открытая инфраструктура»
Алексей Синицин
РеСолют
Генеральный директор
Александр Ермаков
Arenadata
СТО
Сергей Сергиенко
Cоветник Министра цифрового развития, связи и массовых коммуникаций Российской Федерации
Data Fusion Awards. Data Fusion в госсекторе

В МАСШТАБАХ СТРАНЫ

УМНЫЙ РЕГИОН

Ведущие:

Александра Кирьянова, главный редактор CNews

Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Data Fusion. Работа с клиентами

Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах.

Модератор:

Сергей Голицын, вице-президент, заместитель руководителя департамента анализа данных и моделирования, ВТБ

Спикеры:
Денис Суржко
ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
Ксения Ачкасова
Mediascope
Исполнительный директор
Александр Самсонов
Авито
Директор по стратегическим партнерствам
Тигран Саркисов
Х5 Group
Директор по работе с данными
Артем Алексеев
Aggregion
Партнер, директор по стратегии и развитию бизнеса
Евгений Макаров
МТС
Руководитель центра компетенций Data Science
Data Fusion Awards. Гран При ВТБ

БИЗНЕС-ПАРТНЕРСТВО В СТИЛЕ DATA FUSION

ПАРТНЕРСТВО В ОБЛАСТИ НАУКИ И ИССЛЕДОВАНИЙ

Ведущие:

Александра Кирьянова, главный редактор Cnews,

Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Вручает:

Сергей Голицын, вице-президент, заместитель руководителя департамента анализа данных и моделирования, ВТБ

Сессия. Вопросы доверия и этики в ИИ и работе с данными

Сегодня технологии искусственного интеллекта развиваются стремительно и применяются в самых разных сферах. Однако, чем быстрее развиваются технологии, тем меньше доверия они вызывают среди населения, даже несмотря на то, что искусственный интеллект делает жизнь человека намного проще. Человечество учится не только использовать технологии искусственного интеллекта, но и доверять им.

Спикеры рассмотрят кейсы из практики компаний по разрешению этических вопросов при внедрении искусственного интеллекта во взаимодействие с потребителями товаров/услуг, которые будут полезны сообществу ученых, занимающихся исследованиями Data Science.

Кто несет ответственность за последствия применения ИИ и за возмещение потенциального вреда клиентам сервисов, использующих ИИ?

Как использование ИИ может гарантировать справедливость (включая недискриминацию, непредвзятость, равенство) и где проходит грань между защитой участников от дискриминации и свободой слова

Как гарантировать процесс прозрачности использования данных и конфиденциальность информации, используемой ИИ?

Модератор:

Карен Казарян, генеральный директор Института исследований интернета, главный аналитик Ассоциации электронных коммуникаций

Спикеры:
Елена Сурагина
МТС
Руководитель Группы регуляторной поддержки экосистемы
Сергей Морозов
Фонд Сколково
Эксперт
Алексей Нейман
Ассоциация больших данных
Исполнительный директор
Дмитрий Демидов
НОРБИТ
Руководитель лаборатории инноваций
Data Fusion Awards. Data Fusion в образовании

ОБРАЗОВАТЕЛЬНАЯ ИНИЦИАТИВА ГОДА

ИННОВАЦИОННЫЙ ПОДХОД

Ведущие:

Александра Кирьянова, главный редактор Cnews,

Денис Елаховский, , начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Вручает:

Екатерина Трофимова, партнёр Департамента управления рисками и руководитель направления по предоставлению услуг финансовым институтам «Делойт» в СНГ

Круглый стол Data Fusion. Маркетинг, реклама и коммуникации

Привлечение клиентов сегодня и завтра. Большие данные, стабильные идентификаторы, аналитика и новые инструменты взаимодействия с аудиторией.

Готовы ли отечественные компании занять освобождающиеся и новые ниши и получить новый пул клиентов? Как в этом могут помочь большие данные? Какие технологии помогут бизнесу привлекать новых пользователей? Как защитить клиентские данные в период турбулентности? Какие правила хорошего тона существуют для работы с данными?

Модератор:

Алексей Каштанов, генеральный директор, Platforma

Спикеры:
Марина Кормщикова
Ростелеком
Директор направления, Департамент управления данными
Дмитрий Фадеев
AmberData
Руководитель проектов
Евгения Шулипина
QuiteMedia
CEO
Александр Сафонов
Tele2
Руководитель службы развития продуктов больших данных
Алина Садукевич
Билайн
Руководитель департамента развития продуктов больших данных
Data Fusion Awards. Data Fusion Rising Stars спецноминация Фонда «Сколково»

Ведущий/Вручает:

Павел Новиков, директор центра инноваций в финансовом секторе Фонда «Сколково»

Трек 1. Data Fusion for business
Сессия. Decision Maker’s Problem. О чем говорят на конференциях, но не внедряют в жизни

Новейшие технологии проходят долгий путь от момента первого прототипа до принятия решения о масштабном внедрении, и проблема не только в доступности технологии. Во многом успех зависит от готовности функционального заказчика внутри компании, который должен взять на себя роль адвоката создаваемого продукта, и сфера Data Science – не исключение. Какова должна быть мотивация C-level руководителей внутри компании для успешной акселерации проекта на основе Data Fusion? На сколько созрел рынок к внедрению решений Data Fusion, и есть ли необходимая экосистема для запуска проектов, специалисты с соответствующей квалификацией и квалифицированные заказчики? Участники сессии поделятся кейсами внутрикорпоративного взаимодействия по внедрению Data Science решений. Какие барьеры были преодолены для успешного внедрения, и какие неудачные попытки пришлось пережить?

Модератор:

Виталий Мзоков, директор венчурной студии ГК «Иннотех»

Спикеры:
Наталья Дегтярева
Акселератор ВТБ
Директор
Дмитрий Фадеев
AmberData
Руководитель проектов
Антон Мерзляков
Tele2
Директор по аналитике больших данных
Павел Мягких
Лента
Директор по продвинутой аналитике
Case study. Как анализ данных помогает внедрению принципов ESG?

Глобальные климатические изменения вследствие антропогенных факторов требуют реализации четвертого энергоперехода для снижения рисков глобального потепления и выхода на траекторию устойчивого развития (потепление до 1.5 градусов Цельсия к 2100 г. по сравнению с доиндустриальным уровнем). При реализации мер по обеспечению устойчивого развития выделяют ESG-риски, для контроля которых требуются подходы на основе анализа данных, позволяющие надежно оценить вероятность и существенность риска. В рамках данной секции планируется обсудить существующие на данный момент технологии энергоперехода, и то, какие задачи возникают в ходе ESG-трансформации у бизнеса и могут быть решены за счет цифровизации, как моделировать риски устойчивого развития и оценивать их влияние на экономику. Помимо этих глобальных вопросов планируется обсудить вопросы образования для повышения осведомленности о ESG-принципах и оптимизации городской среды.

Модератор:

Евгений Бурнаев, руководитель Центра прикладного ИИ, Сколтех, в.н.с., AIRI

Спикеры:
Михаил Аким
ВШЭ
Профессор практики Высшей школы бизнеса
Андрей Осипцов
Сколтех
Профессор и директор, проектный центр по энергопереходу
Александр Филатов
Департамент информационных технологий города Москвы
Начальник управления данными в распределенных вычислительных сетях
Назар Сотириади
ПАО Сбербанк
Исполнительный директор, Департамент интегрированного риск-менеджмента
Анна Кулашова
ФПМИ МФТИ
Директор Центра обучения проектированию и разработке игр ФПМИ МФТИ
Case Study Data Fusion. Промышленность

По мере развития подходов к цифровизации промышленных производств акценты от отдельных станков и установок смещаются к комплексной автоматизации целых предприятий или промышленных групп, составляющих производственные цепочки. В подобных сложных системах продуманная система анализа мультимодальных данных и принятия решений на их основе способна дать максимальный эффект по оптимизации промышленных процессов, снижению транзакционных издержек и повышению маржинальности производства в целом. Но все ли промышленные компании готовы к подобной Data Science-трансформации? Каков уровень доверия топ-менеджеров к дорогостоящим трансформационным решениям на основе подходов Data Fusion?

Модератор:

Кирилл Железнов, директор по продуктам, Цифровая Индустриальная платформ

Спикеры:
Владимир Вавра
Уралхим
Руководитель отдела инфраструктуры данных
Николай Князев
СофтЛайн
Ведущий архитектор
Case Study Data Fusion. Человеческий капитал

Цифровизация, удаленка и геополитика выбили почву из под ног у HR директоров, а традиционные инструменты работы с командой утратили былую эффективность. Где найти современные рычаги влияния на климат в коллективе? У дата-саентистов есть ответ!

- Как аналитика данных помогает работодателю выстраивать взаимоотношения с сотрудниками в периоды турбулентности и неопределенности?

- Как оцифровать выгорание? Предотвращение выгорания при удаленной работе, когда эмоциональная обратная связь от сотрудника к работодателю ограничена.

- Санкции, паника и стресс? Какие данные необходимо проанализировать и какие выводы сделать, чтобы настроить команду на эффективную работу? Кейсы повышения уровня мотивации.

Модератор:

Анастасия Галчева, эксперт по развитию бизнеса

Спикеры:
Оксана Фетисова
МТС
Директор Департамента Корпоративный университет
Даниэль Саттаров
ДОМ.РФ
И.о. руководителя подразделения «Пользовательские сервисы»
Даниил Терентьев
Conventus
CEO
Марина Буздалина
Сбербанк
Управляющий директор, департамент ИТ блока HR
Сессия. Практическое внедрение управления данными в органах государственной власти

Нынешняя цифровая трансформация госуправления невозможна без скоординированной работы с данными на федеральном и региональном уровнях. Создание единого государственного data lake (озеро данных), запуск маркетплейса дата-сетов, развитие НСУД и СМЭВ4 станут ключевыми в повестке 2022 года. Как в ФИОВ сегодня выстраивается работа с данными в государстве? Каких успехов уже удалось добиться в ФИОВ и РОИВ, и что еще предстоит сделать? Какие изменения грядут на федеральном уровне, и к чему нужно готовиться регионам? Участники сессии озвучат позиции федеральных и региональных ОГВ, представят кейсы по управлению данными и обсудят предстоящие задачи.
В ходе сессии состоится презентация навигатора «Управление данными в госсекторе», который поможет РЦТ РОИВ и их командам глубже погрузиться в процессы по управлению данными, чтобы согласовать свои задачи с федеральной повесткой и скоординировать стратегии цифровой трансформации.

Модератор:

Екатерина Потапова, академический директор Центра CDTO, ВШГУ РАНХиГС

Спикеры:
Дмитрий Разумовский
Министерство Экономического Развития Калужской области
Заместитель Губернатора Калужской области, Руководитель министерства цифрового развития Калужской области
Николай Распопин
Цифровое развитие Красноярского края
Министр цифрового развития Красноярского края
Максим Цыганков
ФГАУ НИИ «Восход»
Руководитель направления «Аналитические сервисы» НСУД, заместитель руководителя Научно-исследовательского департамента управления данными
Дмитрий Шмелев
Заместитель руководителя аппарата Губернатора Ямало-Ненецкого автономного округа
Михаил Петров
Счетная палата РФ
Директор департамента цифровой трансформации Счетной палаты Российской Федерации
Трек 2. Data Fusion in action
Science notes. Федеративые модели
Технология федеративного обучения, которое можно определить как распределенную систему машинного обучения, которая позволяет создавать коллективную модель из данных, которые распределены по владельцам этих данных, сегодня актуальна и быстро развивается. Как можно классифицировать системы федеративного обучения и основных алгоритмов? Какие основные кейсы федеративного обучения для разных типов систем сегодня наиболее репрезентативны? Каковы основные фреймворки федеративного обучения, их особенности? Об этом и некоторых benchmarks алгоритмов и фреймворков федеративного обучения поговорим в рамках science note
Спикеры:
Иван Холод
СПбГЭТУ "ЛЭТИ"
Декан факультета компьютерных технологий и информатики
Science notes. Робастность глубоких нейросетей: геометрический подход
При построении предиктивных моделей важно учитывать геометрическую структуру данных - то, как расположены наблюдения в многомерном пространстве. Обычно расположение наблюдений хорошо описывается многообразием. Очевидно, что его свойства влияют на точность соответствующих предиктивных моделей. Оценив многообразие данных, мы можем выявить области на многообразии, в которых предиктивная модель не робастна, и, тем самым, становится возможным генерировать как эффективные злонамеренные атаки на модель, так и обеспечивать защиту от них. Доклад посвящён вопросам генерации атак и защиты от них с учётом многообразия данных, а также, в целом, вопросам того, как сравнивать многообразие реальных данных и данных, порождённых генеративной моделью, и за счет этого, например, выявлять искусственно сгенерированные (потенциально фейковые) наблюдения.
Спикеры:
Евгений Бурнаев
Сколтех
Руководитель Центра прикладного ИИ, Сколтех, в.н.с., AIRI
Сессия. От научной статьи до MVP

Путь от научной статьи до MVP это путь, который проходит идея в R&D процессе. Часто этот путь занимает годы и не исключена ситуация, когда идея так и не сможет оформиться в конкретный продукт. Как происходит и какой спецификой обладает R&D в стремительно развивающейся сфере DataScience? Дискуссия будет разбита на две части, в первой обсудим актуальные проблемы R&D в области AI и DS в России. Во второй поговорим о конкретных научных работах, направлениях исследований, которые, по мнению наших экспертов, активно развиваются и имеют широкую область приложений.

Модератор:

Александр Мамаев, руководитель отдела машинного обучения и анализа данных, VK

Спикеры:
Илья Макаров
ВК Образование
Программный директор Академии больших данных MADE
Юрий Дорн
Школа анализа данных Яндекс и ФКН ВШЭ, Ст. преподаватель: МФТИ
Руководитель OzonMasters
Александр Панченко
Сколтех
Доцент
Александр Дьяконов
Chief Research Scientist Dasha.ai
Лектор OzonMasters
Максим Савченко
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Лаборатории AI
Science notes. Диффузионные модели с динамически меняющимся размером

За последние два года диффузионные модели задали новую планку качества в генеративном моделировании. Эта красивая концепция объединяет в себе нейродиффуры, моделирование на основе скор-функции, приближенные методы байесовского вывода и стохастические дифференциальные уравнения. Их основным недостатком является большое время генерации объекта. В докладе мы рассмотрим причины успеха диффузионных моделей и пути повышения их эффективности за счет уменьшения работы вхолостую на начальном этапе обратной динамики. Получившаяся модель обобщает стандартные диффузионные модели и иерархические вариационные автокодировщики в рамках более общей парадигмы.

Спикеры:
Дмитрий Ветров
НИУ ВШЭ
к.ф.-м.н., профессор факультета компьютерных наук
Science notes. Вызовы технологий искусственного интеллекта

Методы искусственного интеллекта достигли высоких результатов. Однако, они подвержены различным ошибкам. Как можно "атаковать" модели ИИ, как защищаться от этого и можно ли это делать вообще – это мы обсудим в лекции.

Спикеры:
Иван Оселедец
Сколтех
Профессор, Директор центра технологий ИИ
Сессия. Экономичные нейронные сети

Модератор:

Константин Вячеславович Воронцов, МФТИ, д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ

 

Спикеры:
Илья Жариков
МФТИ
Аспирант
Александр Алексеев
Лаборатория машинного интеллекта (МФТИ)
DL Engineer
Science notes. Граф исследований и исследования графов в Физтех-школе прикладной математики и информатики
Спикеры:
Андрей
Райгородский
МФТИ
Доктор физико-математических наук, федеральный профессор математики, директор ФПМИ
Сессия. ДНК дата-сайентиста

Дата-сайентист без преувеличения одна из самых перспективных профессий. Однако стремительное развитие технологий и все более сложные бизнес-задачи становятся причиной ее постоянной трансформации. Какие запросы к data science формирует сегодня бизнес, какая экспертиза будет востребована в будущем, как меняется образовательный трек специалиста, и какие опыт и знания становятся главным в «ДНК» успешного дата-сайентиста? Анализируем российский и международный опыт.

Модератор:

Константин Вячеславович Воронцов, МФТИ д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ

Спикеры:
Денис Суржко
ВТБ
Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования
Андрей Зима
Ростелеком
Директор департамента анализа данных
Иван Гуз
Авито
Управляющий директор Авито Товары, заместитель генерального директора
Александр Дьяконов
Chief Research Scientist Dasha.ai
Лектор OzonMasters
Максим Савченко
Сбер
Управляющий директор, руководитель Центра инструментов машинного обучения Лаборатории AI
Science notes. Распределенные методы оптимизации

Обзор результатов наиболее актуальных исследований касающихся методов оптимизации в сфере работы с данными и машинном обучении. Какие теоретические прорывы, совершенные в последнее время, способны трансформировать имеющийся набор инструментов работы с данными, сделав расчеты более быстрыми, снизив нагрузку на каналы передачи данных и увеличив точность работы алгоритмов. Какие актуальные задачи из сферы BigDataScience стоят перед учеными?


Доклад 1. Распределенные алгоритмы state-of-the-art.

В докладе будет сделан обзор современного состояния развития области распределенной оптимизации с акцентом на децентрализованные алгоритмы


Доклад 2. Коммуникации — узкое место распределённых алгоритмов. Методы решения этой проблемы

В больших вычислительных системах коммуникационные затраты занимают 60-90% процентов времени работы. В докладе будут освещены основные техники уменьшения числа коммуникаций в распределённых алгоритмах оптимизации: сжатие, локальные шаги, использование похожести данных (data similarity).


Доклад 3. Децентрализованные алгоритмы, устойчивые к нарушению коммуникации.

Технические неполадки, таких как потеря соединения между узлами в распределенной системе, приводят к нарушению коммуникации. Это создает дополнительные трудности для алгоритмов оптимизации. В докладе будут рассмотрены алгоритмы, устойчивые к такого рода неполадкам.

Спикеры:
Александр Безносиков
ФПМИ МФТИ
Младший научный сотрудник
Александр Гасников
ФУПМ ПМИ МФТИ
Заведующий кафедрой Математических основ управления
Александр Рогозин
ФПМИ МФТИ
Аспирант
Евгений Лепшин
ВТБ
Зам. начальника управления перспективных алгоритмов машинного обучения.
Трек 1. Scientific Data Fusion

Рассмотрим практические шаги по реализации технологического основания MLOps: инструменты DevOps конвейера и надстройки для непрерывного релиза моделей ML как ключевой компоненты ИИ. Сессия будет интересна всем, кто интересуется технологическими и организационными вопросами применения DevOps для внедрения систем искусственного интеллекта.

Модератор:

Александр Разгон, Заместитель начальника управления процессов и стандартов моделирования, ВТБ

Спикеры:
Александр Волынский
VK
Технический менеджер продукта ML Platform, VK Cloud Solutions
Ван Хачатрян
Ozon
Руководитель отдела машинного обучения и матчинга
Константин Хримпач
Tele2
Руководитель службы разработки решений машинного обучения
Сессия. Конфиденциальные вычисления

Важность конфиденциальности при работе с данными и моделями сложно переоценить: Обладая существенными набором информации и желая создать получить дополнительную выгоду для себя или общества, владельцы больших данных также несут ответственность за сохранение конфиденциальности, рискуя не только доверием к своему имени, но и подвергая рискам свой бизнес, а также субъектов информации. С ростом популярности вычислений в сторонних и совместных центрах обработки также крайне важно не только сохранять в тайне свои модели и алгоритмы, но и быть уверенными, что в промышленной эксплуатации находится именна та модель и именно тот код, который создавался в процессе разработки. Вопрос конфиденциальных вычислений крайне важен с одной стороны с точки зрения защиты, а с другой стороны критичен с точки зрения возможности безопасного развития совместных решений, построенных на основе анализа данных и моделирования. В этой сессии мы рассмотрим два основных подхода к конфиденциальным вычислениям, дающим новые возможности для использования совместных датасетов в моделях, а также для проведения вычислений в совместных средах: - математико-алгоритмический, представитлять который будет MPC - multi-party computation - программно-аппаратный, представлять который будет Trusted Execution Environment на примере Intel SGX Кроме того, рассмотрим архитектуру Data Mesh, которая позволит собрать и объединить в одном периметре обработки данных сразу оба этих подхода.

Модератор:

Олег Мангутов, ассоциированный партнер, Группа анализа данных и моделирования EY

Спикеры:
Дмитрий Берестнев
Иннотех
Заместитель директора Департамента анализа и моделирования
Пётр Емельянов
Bloomtech LLC
CEO
Андрей Тотмаков
Platforma
Технический директор
Виктор Стрелков
oneFactor
Директор по разработке
Сессия. Повышение эффективности в NLP

Для большинства успешных компаний NLP стало business critical технологией. В этой связи, становится важным поиск максимально операционно эффективных решений NLP задач, в том числе: минимизация затрат на разметку (zero и few-shot learning, active learning и information retrieval), рост скорости разработки и внедрения моделей путем применения AutoML решений, unsupervised подходы. В рамках секции мы обсудим данный тренд и актуальные разработки в области операционно эффективного решения NLP задач.

Модератор:

Денис Суржко, Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования, ВТБ

Спикеры:
Андрей Коцеруба
ВТБ
Директор в управлении перспективных алгоритмов машинного обучения
Валентин Малых
Huawei
Senior Research Scientist at Huawei Noah's Ark lab
Денис Кузнецов
DeepPavlov (MIPT)
Исследователь
Сессия. Matching. Соревнование Data Fusion

С все большим ростом объема накопленных данных, появляются новые актуальные задачи машинного обучения. Ранее, задача вероятностного соотнесения и сопоставления данных (Matching) уже проявлялась как в поисках дубликатов, так и в классических приложениях по восстановления целостности данных, особенно медицинских. Последние несколько лет появились возможности проводить более сложные семантические сопоставления в неструктурированных данных, таких как фото, видео и текст.

Сегодня эти методы Matching подходят к тому уровню, что все накопленные за эти годы наработки в области машинного обучения становится возможным вывести в широкий круг приложений индустрий, включая работу с уже привычными данными банковских транзакций или онлайн магазинов. В этой секции наши слушателю узнают, что из себя представляют Matching задачи сегодня, как к этим задачам можно подходить, а также смогут перенять опыт решения Matching задач в реальных компаниях.

Модератор:

Алексей Натекин, основатель, ODS

Спикеры:
Дмитрий Берестнев
Иннотех
Заместитель директора Департамента анализа и моделирования
Евгений Ворсин
Иннотех
Data Scientist
Анатолий Глушенко
ВТБ
Lead DS
Александр Голубев
Ozon
Senior ML engineer
Сессия. Нейроданные – от структуры к функции при помощи доменно информированных методов ML

На сегодняшний день в распоряжении ученых и врачей находится богатейший арсенал инвазивных и неинвазивных средств для исследования структуры и функции головного мозга. Эффективное извлечение информации из непрерывно растущего объема таких нейроданных представляют серьезную проблему. Объемы получаемых данных делают актуальной разработку самообучающихся алгоритмов, способных выделить структуру данных и эффективно адаптироваться к downstream task на основе минимального объема соответствующим образом размеченных данных. Перспективным представляется подход на основе объединения данных разных модальностей, например, структурной (МРТ, КТ) и функциональной (ФМРТ, ЭЭГ, МЭГ, ПЭТ и т.д.). При использовании, как правило, перепараметризованных алгоритмов машинного обучения необходимо их учитывать “жадность” и склонность к переобучению. Здесь могут оказаться полезными domain-grounded подходы на основании адаптивных архитектур, позволяющих естественную интерпретацию найденных в результате обучения решающих правил. В некоторых случаях, особенно в коммерческих приложениях, не так важна “чистота эксперимента”, заключающаяся в использовании исключительно данных о нейронной активности, сколько обеспечение конкретной потребности массового пользователя. В этой связи представляется актуальной задача выработки сценариев применения, нейротехнологий, предполагающих слияние данных из разных модальностей, в том числе сигналов, отражающих активность периферических органов, для решения задач управления внешними устройствами в быту, поддержания желаемого уровня концентрации и увеличения производительности труда, повышения эффективности обучения и т.д. Поговорим об интерпретации данных как получаемых в ходе сканирования отдельного мозга, так и организма в целом, об оценке эффективности работы алгоритмов машинного обучения и интерпретации решающих правил. Ну и, конечно, же обсудим практическое, в том числе коммерческое применение нейротехнологий – зачем мы изучаем мозг, почему информация о работе наших нейронов может оказаться полезной не только нейроученым и врачам, но и простому обывателю.

Модератор:

Сергей Воинов, Директор по акселерации по направлению цифровая медицина, Кластер биологических и медицинских технологий, Фонд «Сколково»

Спикеры:
Максим Шараев
Сколтех
к.ф.-м.н., Руководитель группы Интеллектуальной обработки сигналов и изображений Центра прикладного ИИ
Алексей Осадчий
Институт когнитивных нейронаук НИУ ВШЭ, в.н.с., Институт искусственного интеллекта, AIRI, Москва
Директор, Центр биоэлектрических интерфейсов
Евгений Шуранов
Huawei
Руководитель RnD лаборатории
Анвар Курмуков
AIRI
PhD, старший научный сотрудник
Сессия. Генеративные модели
Генеративные модели ИИ по версии Gartner входят в топ актуальных технологических трендов. Очевидны их преимущества, к примеру генеративный дизайн позволяет даже без топологической оптимизации создать сразу валидный прототип, с учетом ограничений и требований, свойств материалов, заданных инженером-проектировщиком. Генеративный дизайн при создании айдентики позволяет, например, с помощью языка программирования GLSL или инструментария TouchDesigner, по-новому преподнести ценности компании, сформировать желаемый образ бренда посредством уникальных, создаваемых «с нуля» аудио-визуальных решений. Генеративный подход при наличии качественных синтетических данных позволяет существенно сэкономить время проверки прототипа. Какие на данный момент ключевые практические области применения генеративных моделей? Какими на данный момент качественными дата-сетами располагают программисты? Каковы перспективы использования генеративной модели в дизайне, инжиниринге, проектировании?

Модератор:

Александр Коротин, н.с. Центра ИИ Сколтеха, н.с. Института ИИ

Спикеры:
Арип Асудалев
Университет ИТМО
Исследователь, Университет ИТМО, Институт Искусственного Интеллекта
Сергей Николенко
Neuromation
Директор по науке компании Neuromation
Сессия. Рекомендательные системы

Системы рекомендаций, поддерживаемые машинным обучением, способны сегодня значительно усилить позиции сервиса или приложения на рынке. Изучение преференций и поведения пользователя, способность прогнозировать реакцию на тот или иной контент, и предложить новый, максимально отвечающий предпочтениями пользователя, – все это стало благодатной почвой для применения data science и алгоритмов машинного обучения, создания новых моделей и подходов.

Как сегодня бизнес комбинирует базовые подходы – коллаборативную фильтрацию, контентную фильтрацию, экспертные системы, методы, основанные на матричном разложении и другие с deep learning, другими алгоритмами машинного обучения? Что дает наибольший эффект, ведет к приросту целевого действия пользователя, или позволяет сформировать максимально точную матрицу предпочтений без шума? Обсудим целесообразность создания новых архитектур нейронных сетей и постараемся ответить, всегда ли оправдано кратное увеличение сложности используемых моделей, где бизнес находит для себя баланс между сложностью и эффективностью?

 

Модератор:

Виктор Кантор, директор центра Big Data МТС

Спикеры:
Семен Поляков
VK
Ведущий ML-инженер
Тимофей Смирнов
ВТБ
Data Scientist в команде Обезличенных данных
Петр Ермаков
Школа машинного обучения DataGym
Создатель
Юрий Жидков
ВТБ
Управляющий директор Управления перспективных алгоритмов машинного обучения
Алексей Васильев
Сбер
Тимлид группы рекомендательных систем, Лаборатория по искусственному интеллекту
Сессия. Computer Vision

На сессии будут рассмотрены актуальные направления исследований в компьютерном зрении и представлены доклады о практическом примении этих технолий. Будут рассмотрены практические сценарии разработки моделей сегментации изображений при наличии небольшого количества обучающих данных для решаемого бизнес-кейса. Также будет разобрана подготовка моделей по анализу лиц на мобильных устройствах, которые накладывают значительные ограничения на вычислительную сложность и размер разрабатываемых моделей

Модератор:

Сергей Миляев, руководитель исследовательских проектов в VisionLabs

 

Спикеры:
Дарья Виноградова
Иннотех
Data Scientist
Андрей Савченко
НИУ ВШЭ
Д.т.н., , профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде
Трек 2. Applied Data Fusion
Cмотреть все записи
Data Fusion 2022