Data Fusion 2021

Первая конференция, посвященная синергии данных Data Fusion, состоялась 30 - 31 марта 2021 в Инновационном центре “Сколково”
96
Спикеров
50+
Практических кейсов
25
Сессий
Спикеры
руслан Салахутдинов - фото - 1
Руслан Салахутдинов
константин Воронцов - фото - 1
Константин Воронцов
андрей Райгородский - фото - 1
Андрей Райгородский
дмитрий Ветров - фото - 1
Дмитрий Ветров
светлана Сикуляр - фото - 1
Светлана Сикуляр
евгений Бурнаев - фото - 1
Евгений Бурнаев
михаил Бурцев - фото - 1
Михаил Бурцев
ирина Пионтковская - фото - 1
Ирина Пионтковская
виктор Кантор - фото - 1
Виктор Кантор
родриго Ривера Кастро - фото - 1
Родриго Ривера Кастро
Все спикеры

Выступления DATA fusion 2021

Приветственное слово. Вадим Кулик, Заместитель президента-председателя правления, ВТБ
Сессия «Data Fusion и работа с клиентами» с участием Gartner, Tele2, Мультикарта, ВТБ, Почта России
Дискуссия «Правовые вопросы концепции Data Fusion»
Сессия «Сквозное объединение данных»
Сессия «The future of data science and machine learning: critical trends you can’t ignore»
Дискуссия «Фабрика искусственного интеллекта»
Дискуссия «Искусственный интеллект, данные и государство»
Science notes «Compositional AI: Fusion of AI/ML Services»
Science notes «Перспективы ансамблирования нейронных сетей»
Сессия «Машины видят всё. Компьютерное зрение и Data Fusion»
Science notes «ML-renaissance of time-series forecasting»
Дискуссия «NLP» с участием Skoltech, DeepPavlov, ВТБ, Huawei, Skoltech, Ростелеком
Science notes «Искусственный интеллект против фейков и политики постправды»
Сессия «Системный подход к обучению data science»
Science notes «Двудольный граф науки и индустрии»
Сессия «Классификация данных и рекомендательные системы»
Сессия «Временные ряды в экономике»
Разбор решений финалистов DataFusion
Сессия «ML renaissance of time series forecasting»
Сессия «Графовая аналитика»
Cмотреть все записи Data Fusion 2021

Соревнование Data Fusion 2021

Data Fusion Contest — это data science соревнование с беспрецедентным по объему и структуре набору данных из чеков: для соревнования сформирован уникальный датасет, состоящий из 7 000 000 смоделированных чеков. Участники работали над решением задач, которые помогают оцифровать экономику потребления.
1000 Участников
18 Стран
50 Городов
8 Команд призеров
2 000 000 ₽ Призовой фонд
Номинации и победители
Задача №1
Приз
Победитель
GOODSIFICATION
1 место
500 000 ₽
flow
2 место
250 000 ₽
hype
3 место
150 000 ₽
keks
За лучшее публичное решение
50 000 ₽
exotol
За скорость решения
50 000 ₽
Niw
Задача №2
Приз
Победитель
BRANDEFINE
1 место
500 000 ₽
GIA
2 место
250 000 ₽
Niw
3 место
150 000 ₽
Артем Воронов
За лучшее публичное решение
50 000 ₽
InfusionTeam
За скорость решения
50 000 ₽
Артем Воронов

Задачи

Задача №1
GOODSIFICATION
Классификация данных из чеков
От англ. goods — товары и classification — классификация
Классификация данных из смоделированных чеков, создание алгоритма категоризации товаров на по-настоящему больших данных. Создание уникального классификатора для широкого спектра клиентских сервисов банка, который стал одной из ключевых частей в решении задач по обогащению портрета клиента, персонификации коммуникации с ним, улучшении customer journey.
Метрика
Weighted F1score
Формат решения
Код в docker-контейнере
Задача №2
BRANDEFINE
Определение бренда товара
От англ. brand — марка, бренд и define — определить
Определение бренда товара из названия продукта с помощью актуальных NLP-методов. Обучение модели выделения бренда для улучшения жизни миллионов людей через непрерывное развитие клиентского сервиса и партнерской экосистемы банка. Экономия времени клиентов и предоставление только полезной для них информации
Метрика
Accuracy
Формат решения
Код в docker-контейнере