«Цифровой след оставляют все»

18.10.2021

Слияние данных из разных источников — технология и настоящего, и будущего. Сегодня она дает возможность работать с big data, завтра будет способствовать появлению множества новых продуктов. О том, как технология помогает в достижении бизнес-результатов и о чем будут говорить участники первой международной конференции Data Fusion — в интервью Максима Коновалихина, главы департамента анализа данных и моделирования ВТБ

Инвестиционный портфель соберет робот

— В начале марта 2021 года Министерство цифрового развития заявило о планах ужесточить требования к обороту информации, приравняв обезличенные данные к персональным. Соответственно, использовать такую информацию без согласия человека станет невозможно. Ставку на работу с обезличенными данными ВТБ делает в последние полтора года. Не придется ли что-то менять?

— Не думаю, что инициатива министерства будет реализована именно в таком формате. Если данные обезличены, какой вред они могут нанести? Не говоря о том, что просить согласия гражданина на обработку его обезличенных данных априори невозможно. Вопрос использования персональных данных действительно очень чувствительный: все мы страдаем от навязчивых звонков, предлагающих ненужные сервисы и услуги. Однако подходить к решению следует, не создавая избыточных требований, а встав на сторону и граждан, и бизнеса.

 

Цифровизация — повседневная реальность нашей жизни.

Нужно не игнорировать этот факт, а искать новый путь, который всех устроит.

— Как может выглядеть этот путь для ВТБ, располагающего гигантским объемом данных?

— Чем шире поле данных, тем интереснее будут результаты обработки, детальнее картина знания о клиентах и больше новых граней для партнерства. Соответственно, выше и градус интереса бизнеса. Согласно законодательству, банк не может передавать данные для обработки третьему лицу. Но и, располагая такими гигантскими массивами, не пользоваться ими было бы неправильно. Поэтому наша главная задача — найти решение, устраивающее всех участников. Концепция Data Fusion, предлагающая объединение массивов обезличенных данных и глубокую синергию в процессе машинного обучения моделей, способна решить эту задачу максимально эффективно.

— Подобный же принцип know your customer — знай своего клиента — появился на мировом рынке больше двадцати лет назад, он давно и активно используется глобальными компаниями, например, Amazon. В чем заключаются ключевые отличия технологии Data Fusion?

— Действительно, идея Data Fusion не нова. Однако для перечисленных концепций важен сбор данных и способы регулирования этих процессов, в то время как Data Fusion не ограничивается простым объединением клиентских данных. С этого все только начинается: когда у вас есть все возможные данные, которые сегодня можно получить, «в игру» вступают алгоритмы машинного обучения. Для начала персональные данные преобразуются в обезличенные вектора, которые, что крайне важно, не поддаются расшифровке, и поэтому дальнейшая работа с ними безопасна. Преобразованные данные отлично подходят для формирования моделей. Следующий шаг — обучение моделей при помощи различных технологий, от криптографии до атипичных граф и сложных алгоритмов нейросетей. Модели могут быть помещены в разные массивы данных, не только наши, но и наших партнеров, или могут обучаться на отдельных зашифрованных фрагментах. При этом цифровые следы есть не только у физических, но и у юридических лиц, их тоже можно задействовать в алгоритмах машинного обучения.

На выходе мы получаем фактически новую базу данных, обогащенную множеством дополнительных сведений: ведь что-то свое привнес, например, «Ростелеком», еще что-то — другие партнеры. Такую базу, созданную при помощи технологий Data Fusion, можно использовать в интересах бизнеса, не нарушая при этом законодательство. Это возможно не только в банковском бизнесе, но и в страховом, в медицине, в ритейле и в других отраслях.

— Какие именно преимущества технология способна принести банку?

— Для ВТБ, как и в целом для банковского бизнеса, технология Data Fusion актуальна по понятным причинам: она способствует конкурентоспособности на рынке, удержанию клиентской базы и привлечению новой. Расширение знаний о клиентах позволяет сделать следующий шаг — своевременно формировать наиболее релевантные предложения по банковским продуктам. Цифровой след показывает, что клиент предпочитает контент про путешествия и часто приобретает билеты — самое время подготовить персонализированное предложение и ненавязчиво о нем информировать. Если мы видим тенденцию к расширению бизнеса, можем вовремя предложить соответствующий кредитный продукт. Когда данные процессы работают в больших масштабах, банк получает значимый эффект для увеличения прибыли.

— А что можете предложить клиентам, кроме персонализированных рекомендаций по кредитным продуктам?

— В 2020 году мы запустили новую стратегию «Искуственный интеллект» в роботе-советнике мобильного приложения «ВТБ Мои Инвестиции», созданную командой дата-сайентистов и лучших портфельных управляющих «ВТБ Капитал». В основе технологии — анализ особенностей личности клиента, его потребительского поведения и других факторов. На их базе сначала составляется своего рода «психограмма», затем формируются персональные инвестиционные рекомендации. Индивидуальный для каждого клиента портфель собирается на базе торгующихся на Московской бирже ценных бумаг. Пока эта стратегия формирует портфели только из акций, поэтому новая стратегия доступна лишь клиентам с агрессивным инвестпрофилем. В планах — формирование диверсифицированных портфелей с различными типами бумаг, а также создание алгоритмов для анализа на базе торгующихся на иностранных рынках ценных бумаг. Это хороший пример реализации технологий искусственного интеллекта. В целом робот-советник в мобильном приложении сейчас предлагает портфели для управления по пяти подходящим инвестору инвестпрофилям: ультраконсервативный, консервативный, сбалансированный, агрессивный, ультраагрессивный. Но они формируются с участием команды «ВТБ Капитал Инвестиции».

Большим данным — большая стратегия

— В марте 2020 года был сделан еще один шаг в области технологий Data Fusion — в партнерстве с «Ростелекомом» ВТБ создал «Платформу больших данных». Как выглядит стратегия ее развития?

— В 2021 году компания планирует запустить более 30 пилотных проектов. По итогам 2023 года выручка может составить более чем 4 млрд рублей, прибыль — порядка 1 млрд рублей. Уровня рентабельности «Платформа больших данных» должна достигнуть к 2023 году. А уже к 2025 году — планирует занять более 10% целевого рынка продуктов big data в России. В числе проектов, которые платформа планирует вывести на рынок, — сервисы для дистанционной оценки имущества (в этом сегменте создатели проекта рассчитывают занять более 40% рынка), для прогноза спроса, доступа к облачной инфраструктуре больших данных, платформы обмена big data и другие сервисы.

— Один из проектов уже состоялся — в том же 2020 году ВТБ и «Ростелеком» создали первую в России универсальную геоплатформу, работающую на основе анализа больших данных. Как выглядят результаты ее работы?

— В первую очередь геоплатформа помогла нам рассчитать наиболее оптимальные точки для открытия дополнительных офисов. Геоплатформа — это структура из 170 геослоев множества данных, охватывающих 50 российских городов: от расположения различного рода объектов, инфраструктуры и новостроек до данных того, какие продукты покупают люди, как меняется их поведение, на какие рекламные продукты они реагируют, и другие вводные.

Изначально было понятно, что подобная информация может быть интересна как государственным структурам, так и нашим клиентам из малого, среднего и крупного бизнеса — застройщикам, стрит-ритейлерам и так далее. Круг задач, которые можно решить с помощью геоплатформы, очень широк: определение вероятности оптимального денежного потока, оценка конкурентной ситуации в целом, расчет посещаемости торгового зала в течение дня, количества персонала в зале, вплоть до формирования актуальных продуктовых предложений.

Нашим клиентам интересна агрегация обезличенных данных «в привязке» к определенному профилю, помощь в стратегии размещения объектов для строительства, а также помощь инструментов геоаналитики в подготовке специализированных отчетов, связанных с эффективностью работы малого бизнеса. Примечательно, что, несмотря на широкий спектр возможностей технологий геоаналитики и ее мощный синергетический потенциал, рынок пока свободен от конкуренции — самое время занять на нем свою нишу.

«Дьявол — в деталях, и мы хотим в них разобраться»

— Возможности геоаналитики и других технологий в области искусственного интеллекта 30–31 марта обсудят на первой международной конференции Data Fusion, которую организовал ВТБ при поддержке «Сколково». С какой целью решили собрать вместе представителей науки и бизнеса?

— Технологии Data Fusion давно стали предметом российских и зарубежных научных исследований и публикаций в авторитетных изданиях. ВТБ собирает и анализирует все возможные источники информации, накоплен уже довольно большой массив данных. Можно сказать, что тактика наших действий в области освоения технологий Data Fusion в первую очередь базируется на подобных фундаментальных исследованиях. При этом внутри банка ведутся и собственные разработки в области Data Fusion, реализуется тестирование моделей и проводится глубокая аналитика. Другими словами, что-то мы делаем сами, а что-то — заимствуем.

Кроме того, мы активно общаемся с коллегами по рынку — ведь в чем-то нас могут и опережать. Соответственно, хочется разобраться в достижениях других участников процесса и в нашем возможном сотрудничестве. С другой стороны, кто-то, напротив, пока далек от подобных технологий. В какой-то момент нам стало понятно, что синтез данных Data Fusion и модельные подходы в целом требуют серьезного системного осмысления. Таким образом мы и пришли к идее проведения отдельного мероприятия. Конференция — наиболее подходящая площадка для содержательных коммуникаций. В первую очередь она даст нам возможность пообщаться с игроками других рынков, узнать об их опыте, услышать и зафиксировать реальные потребности бизнеса.

— Какие вопросы наиболее интересны бизнесу?

— Думаю, что большинство участников, прежде всего, интересует все, что связано с реальными кейсами. Например, на сессии, посвященной основным трендам Data Fusion в России и мире, представители Tele2 готовы рассказать нам о своих геоаналитических продуктах для управления пассажиропотоком, рассчитанных на повышение доступности транспорта и увеличение эффективности предприятий. Руководство компании «Мультикарта» поделится актуальной информацией о проектах преобразования существующей бизнес-модели оказания сервисных услуг для эквайрингового оборудования с использованием ИИ, блокчейна и модели уберизации. О роли Data Fusion в трансграничных перевозках расскажет представитель «Почты России».

Одна из самых чувствительных сторон технологий Data Fusion — правовые и этические проблемы, возникающие при реализации бизнес-кейсов использования больших данных, будем обсуждать и их. Проблематика, как видите, очень обширна — от задачи обезличивания данных без потери их выразительности до системного подхода к обучению Data Sсience. Важно, что ВТБ первым в России предложил обсудить самые актуальные вопросы вокруг Data Fusion на таком представительном уровне. Ведь в Data Fusion, как и везде: дьявол — в деталях, в них мы и хотим разобраться.