Модератор:
Александра Кирьянова, главный редактор Cnews
ПРОРЫВ ГОДА
МОНЕТИЗАЦИЯ ДАННЫХ
ТРЕНДСЕТТЕР
Ведущие:
Александра Кирьянова, главный редактор CNews,
Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель
Вручает:
Сергей Безбогов, заместитель руководителя Технологического блока - старший вице-президент ПАО «Банк ВТБ»
Всё больше компаний, разворачивающих свою цифровую инфраструктуру или разрабатывающих цифровые сервисы, переходят от проприетарных платформ, которые не всегда в полной мере обеспечивают потребности бизнеса в гибкой настройке к своим собственным решениям. Использование Open Source библиотек позволяет сохранить рентабельность разработки на приемлемом уровне, но, с другой стороны, является источником рисков. Это и риск блокировки доступа к ресурсам с открытыми библиотеками, изменения лицензий использования, безопасность размещенного кода и «закладки» в фундаментальных моделях. Каковы риски коммерческих систем в основе которых лежат Open Source разработки? Есть ли перспективы импортозамещения в этой сфере и когда появится российский GitHub?
Модератор: Сергей Бережной, Директор по взаимодействию с разработчиками, Яндекс
В МАСШТАБАХ СТРАНЫ
УМНЫЙ РЕГИОН
Ведущие:
Александра Кирьянова, главный редактор CNews
Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель
Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах.
Модератор:
Сергей Голицын, вице-президент, заместитель руководителя департамента анализа данных и моделирования, ВТБ
БИЗНЕС-ПАРТНЕРСТВО В СТИЛЕ DATA FUSION
ПАРТНЕРСТВО В ОБЛАСТИ НАУКИ И ИССЛЕДОВАНИЙ
Ведущие:
Александра Кирьянова, главный редактор Cnews,
Денис Елаховский, начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель
Вручает:
Сергей Голицын, вице-президент, заместитель руководителя департамента анализа данных и моделирования, ВТБ
Сегодня технологии искусственного интеллекта развиваются стремительно и применяются в самых разных сферах. Однако, чем быстрее развиваются технологии, тем меньше доверия они вызывают среди населения, даже несмотря на то, что искусственный интеллект делает жизнь человека намного проще. Человечество учится не только использовать технологии искусственного интеллекта, но и доверять им.
Спикеры рассмотрят кейсы из практики компаний по разрешению этических вопросов при внедрении искусственного интеллекта во взаимодействие с потребителями товаров/услуг, которые будут полезны сообществу ученых, занимающихся исследованиями Data Science.
Кто несет ответственность за последствия применения ИИ и за возмещение потенциального вреда клиентам сервисов, использующих ИИ?
Как использование ИИ может гарантировать справедливость (включая недискриминацию, непредвзятость, равенство) и где проходит грань между защитой участников от дискриминации и свободой слова
Как гарантировать процесс прозрачности использования данных и конфиденциальность информации, используемой ИИ?
Модератор:
Карен Казарян, генеральный директор Института исследований интернета, главный аналитик Ассоциации электронных коммуникаций
ОБРАЗОВАТЕЛЬНАЯ ИНИЦИАТИВА ГОДА
ИННОВАЦИОННЫЙ ПОДХОД
Ведущие:
Александра Кирьянова, главный редактор Cnews,
Денис Елаховский, , начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель
Вручает:
Екатерина Трофимова, партнёр Департамента управления рисками и руководитель направления по предоставлению услуг финансовым институтам «Делойт» в СНГ
Привлечение клиентов сегодня и завтра. Большие данные, стабильные идентификаторы, аналитика и новые инструменты взаимодействия с аудиторией.
Готовы ли отечественные компании занять освобождающиеся и новые ниши и получить новый пул клиентов? Как в этом могут помочь большие данные? Какие технологии помогут бизнесу привлекать новых пользователей? Как защитить клиентские данные в период турбулентности? Какие правила хорошего тона существуют для работы с данными?
Модератор:
Алексей Каштанов, генеральный директор, Platforma
Ведущий/Вручает:
Павел Новиков, директор центра инноваций в финансовом секторе Фонда «Сколково»
Новейшие технологии проходят долгий путь от момента первого прототипа до принятия решения о масштабном внедрении, и проблема не только в доступности технологии. Во многом успех зависит от готовности функционального заказчика внутри компании, который должен взять на себя роль адвоката создаваемого продукта, и сфера Data Science – не исключение. Какова должна быть мотивация C-level руководителей внутри компании для успешной акселерации проекта на основе Data Fusion? На сколько созрел рынок к внедрению решений Data Fusion, и есть ли необходимая экосистема для запуска проектов, специалисты с соответствующей квалификацией и квалифицированные заказчики? Участники сессии поделятся кейсами внутрикорпоративного взаимодействия по внедрению Data Science решений. Какие барьеры были преодолены для успешного внедрения, и какие неудачные попытки пришлось пережить?
Модератор:
Виталий Мзоков, директор венчурной студии ГК «Иннотех»
Глобальные климатические изменения вследствие антропогенных факторов требуют реализации четвертого энергоперехода для снижения рисков глобального потепления и выхода на траекторию устойчивого развития (потепление до 1.5 градусов Цельсия к 2100 г. по сравнению с доиндустриальным уровнем). При реализации мер по обеспечению устойчивого развития выделяют ESG-риски, для контроля которых требуются подходы на основе анализа данных, позволяющие надежно оценить вероятность и существенность риска. В рамках данной секции планируется обсудить существующие на данный момент технологии энергоперехода, и то, какие задачи возникают в ходе ESG-трансформации у бизнеса и могут быть решены за счет цифровизации, как моделировать риски устойчивого развития и оценивать их влияние на экономику. Помимо этих глобальных вопросов планируется обсудить вопросы образования для повышения осведомленности о ESG-принципах и оптимизации городской среды.
Модератор:
Евгений Бурнаев, руководитель Центра прикладного ИИ, Сколтех, в.н.с., AIRI
По мере развития подходов к цифровизации промышленных производств акценты от отдельных станков и установок смещаются к комплексной автоматизации целых предприятий или промышленных групп, составляющих производственные цепочки. В подобных сложных системах продуманная система анализа мультимодальных данных и принятия решений на их основе способна дать максимальный эффект по оптимизации промышленных процессов, снижению транзакционных издержек и повышению маржинальности производства в целом. Но все ли промышленные компании готовы к подобной Data Science-трансформации? Каков уровень доверия топ-менеджеров к дорогостоящим трансформационным решениям на основе подходов Data Fusion?
Модератор:
Кирилл Железнов, директор по продуктам, Цифровая Индустриальная платформ
Цифровизация, удаленка и геополитика выбили почву из под ног у HR директоров, а традиционные инструменты работы с командой утратили былую эффективность. Где найти современные рычаги влияния на климат в коллективе? У дата-саентистов есть ответ!
- Как аналитика данных помогает работодателю выстраивать взаимоотношения с сотрудниками в периоды турбулентности и неопределенности?
- Как оцифровать выгорание? Предотвращение выгорания при удаленной работе, когда эмоциональная обратная связь от сотрудника к работодателю ограничена.
- Санкции, паника и стресс? Какие данные необходимо проанализировать и какие выводы сделать, чтобы настроить команду на эффективную работу? Кейсы повышения уровня мотивации.
Модератор:
Анастасия Галчева, эксперт по развитию бизнеса
Нынешняя цифровая трансформация госуправления невозможна без скоординированной работы с данными на федеральном и региональном уровнях. Создание единого государственного data lake (озеро данных), запуск маркетплейса дата-сетов, развитие НСУД и СМЭВ4 станут ключевыми в повестке 2022 года. Как в ФИОВ сегодня выстраивается работа с данными в государстве? Каких успехов уже удалось добиться в ФИОВ и РОИВ, и что еще предстоит сделать? Какие изменения грядут на федеральном уровне, и к чему нужно готовиться регионам? Участники сессии озвучат позиции федеральных и региональных ОГВ, представят кейсы по управлению данными и обсудят предстоящие задачи.
В ходе сессии состоится презентация навигатора «Управление данными в госсекторе», который поможет РЦТ РОИВ и их командам глубже погрузиться в процессы по управлению данными, чтобы согласовать свои задачи с федеральной повесткой и скоординировать стратегии цифровой трансформации.
Модератор:
Екатерина Потапова, академический директор Центра CDTO, ВШГУ РАНХиГС
Путь от научной статьи до MVP это путь, который проходит идея в R&D процессе. Часто этот путь занимает годы и не исключена ситуация, когда идея так и не сможет оформиться в конкретный продукт. Как происходит и какой спецификой обладает R&D в стремительно развивающейся сфере DataScience? Дискуссия будет разбита на две части, в первой обсудим актуальные проблемы R&D в области AI и DS в России. Во второй поговорим о конкретных научных работах, направлениях исследований, которые, по мнению наших экспертов, активно развиваются и имеют широкую область приложений.
Модератор:
Александр Мамаев, руководитель отдела машинного обучения и анализа данных, VK
За последние два года диффузионные модели задали новую планку качества в генеративном моделировании. Эта красивая концепция объединяет в себе нейродиффуры, моделирование на основе скор-функции, приближенные методы байесовского вывода и стохастические дифференциальные уравнения. Их основным недостатком является большое время генерации объекта. В докладе мы рассмотрим причины успеха диффузионных моделей и пути повышения их эффективности за счет уменьшения работы вхолостую на начальном этапе обратной динамики. Получившаяся модель обобщает стандартные диффузионные модели и иерархические вариационные автокодировщики в рамках более общей парадигмы.
Методы искусственного интеллекта достигли высоких результатов. Однако, они подвержены различным ошибкам. Как можно "атаковать" модели ИИ, как защищаться от этого и можно ли это делать вообще – это мы обсудим в лекции.
Модератор:
Константин Вячеславович Воронцов, МФТИ, д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ
Дата-сайентист без преувеличения одна из самых перспективных профессий. Однако стремительное развитие технологий и все более сложные бизнес-задачи становятся причиной ее постоянной трансформации. Какие запросы к data science формирует сегодня бизнес, какая экспертиза будет востребована в будущем, как меняется образовательный трек специалиста, и какие опыт и знания становятся главным в «ДНК» успешного дата-сайентиста? Анализируем российский и международный опыт.
Модератор:
Константин Вячеславович Воронцов, МФТИ д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ
Обзор результатов наиболее актуальных исследований касающихся методов оптимизации в сфере работы с данными и машинном обучении. Какие теоретические прорывы, совершенные в последнее время, способны трансформировать имеющийся набор инструментов работы с данными, сделав расчеты более быстрыми, снизив нагрузку на каналы передачи данных и увеличив точность работы алгоритмов. Какие актуальные задачи из сферы BigDataScience стоят перед учеными?
Доклад 1. Распределенные алгоритмы state-of-the-art.
В докладе будет сделан обзор современного состояния развития области распределенной оптимизации с акцентом на децентрализованные алгоритмы
Доклад 2. Коммуникации — узкое место распределённых алгоритмов. Методы решения этой проблемы
В больших вычислительных системах коммуникационные затраты занимают 60-90% процентов времени работы. В докладе будут освещены основные техники уменьшения числа коммуникаций в распределённых алгоритмах оптимизации: сжатие, локальные шаги, использование похожести данных (data similarity).
Доклад 3. Децентрализованные алгоритмы, устойчивые к нарушению коммуникации.
Технические неполадки, таких как потеря соединения между узлами в распределенной системе, приводят к нарушению коммуникации. Это создает дополнительные трудности для алгоритмов оптимизации. В докладе будут рассмотрены алгоритмы, устойчивые к такого рода неполадкам.
Рассмотрим практические шаги по реализации технологического основания MLOps: инструменты DevOps конвейера и надстройки для непрерывного релиза моделей ML как ключевой компоненты ИИ. Сессия будет интересна всем, кто интересуется технологическими и организационными вопросами применения DevOps для внедрения систем искусственного интеллекта.
Модератор:
Александр Разгон, Заместитель начальника управления процессов и стандартов моделирования, ВТБ
Важность конфиденциальности при работе с данными и моделями сложно переоценить: Обладая существенными набором информации и желая создать получить дополнительную выгоду для себя или общества, владельцы больших данных также несут ответственность за сохранение конфиденциальности, рискуя не только доверием к своему имени, но и подвергая рискам свой бизнес, а также субъектов информации. С ростом популярности вычислений в сторонних и совместных центрах обработки также крайне важно не только сохранять в тайне свои модели и алгоритмы, но и быть уверенными, что в промышленной эксплуатации находится именна та модель и именно тот код, который создавался в процессе разработки. Вопрос конфиденциальных вычислений крайне важен с одной стороны с точки зрения защиты, а с другой стороны критичен с точки зрения возможности безопасного развития совместных решений, построенных на основе анализа данных и моделирования. В этой сессии мы рассмотрим два основных подхода к конфиденциальным вычислениям, дающим новые возможности для использования совместных датасетов в моделях, а также для проведения вычислений в совместных средах: - математико-алгоритмический, представитлять который будет MPC - multi-party computation - программно-аппаратный, представлять который будет Trusted Execution Environment на примере Intel SGX Кроме того, рассмотрим архитектуру Data Mesh, которая позволит собрать и объединить в одном периметре обработки данных сразу оба этих подхода.
Модератор:
Олег Мангутов, ассоциированный партнер, Группа анализа данных и моделирования EY
Для большинства успешных компаний NLP стало business critical технологией. В этой связи, становится важным поиск максимально операционно эффективных решений NLP задач, в том числе: минимизация затрат на разметку (zero и few-shot learning, active learning и information retrieval), рост скорости разработки и внедрения моделей путем применения AutoML решений, unsupervised подходы. В рамках секции мы обсудим данный тренд и актуальные разработки в области операционно эффективного решения NLP задач.
Модератор:
Денис Суржко, Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования, ВТБ
С все большим ростом объема накопленных данных, появляются новые актуальные задачи машинного обучения. Ранее, задача вероятностного соотнесения и сопоставления данных (Matching) уже проявлялась как в поисках дубликатов, так и в классических приложениях по восстановления целостности данных, особенно медицинских. Последние несколько лет появились возможности проводить более сложные семантические сопоставления в неструктурированных данных, таких как фото, видео и текст.
Сегодня эти методы Matching подходят к тому уровню, что все накопленные за эти годы наработки в области машинного обучения становится возможным вывести в широкий круг приложений индустрий, включая работу с уже привычными данными банковских транзакций или онлайн магазинов. В этой секции наши слушателю узнают, что из себя представляют Matching задачи сегодня, как к этим задачам можно подходить, а также смогут перенять опыт решения Matching задач в реальных компаниях.
Модератор:
Алексей Натекин, основатель, ODS
На сегодняшний день в распоряжении ученых и врачей находится богатейший арсенал инвазивных и неинвазивных средств для исследования структуры и функции головного мозга. Эффективное извлечение информации из непрерывно растущего объема таких нейроданных представляют серьезную проблему. Объемы получаемых данных делают актуальной разработку самообучающихся алгоритмов, способных выделить структуру данных и эффективно адаптироваться к downstream task на основе минимального объема соответствующим образом размеченных данных. Перспективным представляется подход на основе объединения данных разных модальностей, например, структурной (МРТ, КТ) и функциональной (ФМРТ, ЭЭГ, МЭГ, ПЭТ и т.д.). При использовании, как правило, перепараметризованных алгоритмов машинного обучения необходимо их учитывать “жадность” и склонность к переобучению. Здесь могут оказаться полезными domain-grounded подходы на основании адаптивных архитектур, позволяющих естественную интерпретацию найденных в результате обучения решающих правил. В некоторых случаях, особенно в коммерческих приложениях, не так важна “чистота эксперимента”, заключающаяся в использовании исключительно данных о нейронной активности, сколько обеспечение конкретной потребности массового пользователя. В этой связи представляется актуальной задача выработки сценариев применения, нейротехнологий, предполагающих слияние данных из разных модальностей, в том числе сигналов, отражающих активность периферических органов, для решения задач управления внешними устройствами в быту, поддержания желаемого уровня концентрации и увеличения производительности труда, повышения эффективности обучения и т.д. Поговорим об интерпретации данных как получаемых в ходе сканирования отдельного мозга, так и организма в целом, об оценке эффективности работы алгоритмов машинного обучения и интерпретации решающих правил. Ну и, конечно, же обсудим практическое, в том числе коммерческое применение нейротехнологий – зачем мы изучаем мозг, почему информация о работе наших нейронов может оказаться полезной не только нейроученым и врачам, но и простому обывателю.
Модератор:
Сергей Воинов, Директор по акселерации по направлению цифровая медицина, Кластер биологических и медицинских технологий, Фонд «Сколково»
Модератор:
Александр Коротин, н.с. Центра ИИ Сколтеха, н.с. Института ИИ
Системы рекомендаций, поддерживаемые машинным обучением, способны сегодня значительно усилить позиции сервиса или приложения на рынке. Изучение преференций и поведения пользователя, способность прогнозировать реакцию на тот или иной контент, и предложить новый, максимально отвечающий предпочтениями пользователя, – все это стало благодатной почвой для применения data science и алгоритмов машинного обучения, создания новых моделей и подходов.
Как сегодня бизнес комбинирует базовые подходы – коллаборативную фильтрацию, контентную фильтрацию, экспертные системы, методы, основанные на матричном разложении и другие с deep learning, другими алгоритмами машинного обучения? Что дает наибольший эффект, ведет к приросту целевого действия пользователя, или позволяет сформировать максимально точную матрицу предпочтений без шума? Обсудим целесообразность создания новых архитектур нейронных сетей и постараемся ответить, всегда ли оправдано кратное увеличение сложности используемых моделей, где бизнес находит для себя баланс между сложностью и эффективностью?
Модератор:
Виктор Кантор, директор центра Big Data МТС
На сессии будут рассмотрены актуальные направления исследований в компьютерном зрении и представлены доклады о практическом примении этих технолий. Будут рассмотрены практические сценарии разработки моделей сегментации изображений при наличии небольшого количества обучающих данных для решаемого бизнес-кейса. Также будет разобрана подготовка моделей по анализу лиц на мобильных устройствах, которые накладывают значительные ограничения на вычислительную сложность и размер разрабатываемых моделей
Модератор:
Сергей Миляев, руководитель исследовательских проектов в VisionLabs