Пол Брук, Dell EMC: «Бизнес должен полагаться на данные, а не на инстинкт»

" alt="">

Пол Брук (Paul Brook), руководитель направления аналитики данных в ЕМЕА из Dell EMC, был приглашенным докладчиком на конференции Data Science & Artificial Intelligence for Business состоявшейся в uData School. Наша беседа началась с вопроса, что же такое Data Science (DS) и что является предметом ее исследования?

По моему мнению, DS является зонтичным понятием. Мои коллеги, в зависимости от их поля деятельности, определяют DS по-разному. Мой руководитель — математик, считает, что в основе DS лежит чистая математика, а коллега, который является статистиком, говорит, нет, математика, конечно, важна, но статистика лучше подходит для изучения данных. В то же время, программисты говорят, да, математика важна и статистика играет определенную роль, но программирование является основным в исследовании данных. У меня есть коллега, который работает со структурированными данными, с продуктами, такими как SAP, уже около 20 лет. Перед этим он писал программы для традиционных мэйнфреймов. Он говорил, программирование является, конечно, важным, но в действительности более значимым является понимание данных, их форма, организация, чтобы не анализировать фрагменты одних и тех же данных дважды.

Статистик скажет, да, я знаю это, потому что статистика может измениться, если ваши данные неверны, математик скажет, но есть модель, которую вы можете построить, программист — вы можете составить программу, чтобы избежать этого. В результате может оказаться, что все они говорят об одном и том же. В этом и заключается магия науки о данных.

Для тех, кто применяет научную строгость к данным как информации, данные — это основной цифровой формат, потому что если ученый пытается делать свою работу с помощью карандаша и бумаги, читающий в библиотеке, мы называем таких библиотечными учеными, то это является устарелым методом. Ученый в области данных имеет дело прежде всего с электронными данными.

Однако данные изучает обычно не один человек, а группа людей, собирающихся вместе с идеями, как использовать информацию для правительства, для фермера, для врача или для кого-нибудь еще. И ученый в области данных является одним из этих людей.

Может ответ на следующий вопрос уже частично был дан в предыдущем, но все же, какие методы использует наука о данных?

Некоторые из наиболее выдающихся ученых в этой области используют множество различных методов. Наиболее передовые ученые продвигают идеи, для чего мы можем использовать данные и как их использовать то ли в коммерческой деятельности, то ли в области исследований. Другие рассматривают методы изучения данных, это может быть группа ученых, представляющих разные дисциплины. Раньше мир обычно разделялся на отдельные полоски. Ученые в области данных не смотрят на мир таким образом. Они должны все объединять вместе и посмотреть, что общего у «мясника и пекаря», они оба мужчины или женщины, одинакового возраста или нет и т. п., они смотрят на цепочку поставок, на все аспекты. Ученые в области данных используют столько методов, сколько они могут найти. Лучшие из них применяют большое количество методов.

Какие знания и навыки требуются таким ученым?

Я всегда говорю, что нужно хорошее знание математики и постоянную потребность задавать вопросы. Наихудшие из ученых верят данным и не задают себе вопросов. Данные могут ввести в заблуждение и ... не могу вспомнить книгу, которую читал, но я громко смеялся, прочитав фразу, что мы живем в соответствии с образами, которые не существуют. Наш мозг тренируется для восприятия образов. Итак, не верьте, что данные верифицируются. Важным является открытый и пытливый ум. В общем, наука о данных — это командный спорт. Грэхем Хогг (Graham Hogg) написал книгу об этом, которая называется Seeing Around Corners, и он сказал, что большие данные — это командный спорт, и он был абсолютно прав.

Есть ли разница между наукой о данных и аналитикой данных?

Это фантастический вопрос. Если спросить у ученых в области данных, есть ли разница, они ответят «да», если спросить у аналитиков данных, они ответят «да, конечно есть». Если вы спросите у мэра Лондона, он ответит, что это его не заботит, что ему нужно только ясное понимание, о чем данные говорят.

В мире, в котором мы живем, мы обычно разделяем то, что делаем, и то, что будем делать в оставшуюся жизнь. Я верю, что немногие люди смотрят на свою работу как на единственную на протяжение всей жизни. Есть, конечно, некоторые исключения, например, врачи. Я думаю, что и ученые в области данных, и аналитики данных, все они видят и чувствуют изменения в своей работе прямо сегодня. Может быть, изменения эти более быстрые, чем у медиков.

Я думаю, что дать ответ, есть ли разница, почти невозможно. Вопрос в том, что вы собираетесь делать завтра, а не в том, что вы делали вчера.

В каких областях может быть полезна наука о данных?

Во многих областях, очевидно. Я никогда не встречал бизнес-лидера, который скажет вам, знаете, я не хочу никаких данных об этом, никаких фактов, скажите мне, что говорит ваш инстинкт. В Голливуде вы можете услышать фразу «что говорит вам внутренний голос?» Вы можете увидеть сцену, где президент говорит герою фильма, «что говорит вам ваш инстинкт?» Это полностью невозможно в реальном мире. Обычно бизнес-лидеры спрашивают, что говорят числа?

Аналитика данных является весьма старым методом, лидеры и торговцы давно рассматривали числа и думали о них. Как бизнес говорит с собой и как понимает себя, как правительство оценивает свои успехи. Мы представляем многое в цифровой форме, мы любим все измерять числами. Если вы видите две кучи яблок, ваш мозг скажет вам, что одна куча больше, чем другая. Мы можем обмануть себя этой картиной с двумя кучами яблок, которые мы видим. Без чисел наш бизнес, политика, медицина может обмануться.

Итак, аналитика и наука — прежде всего, и ИИ, который будет играть существенную роль в исследовании данных. Данные являются ценным ресурсом и в исследованиях, и в поставках. Числа — это вещь, которую человеческий мозг может осознать, и чем глубже вы проникаете в них, тем лучше понятны вещи, тем более честными они выглядят.

Где готовят специалистов в области науки о данных?

По всему миру есть места, где можно получить превосходное образование. И не является совпадением, что они были такими центрами много лет. Что мы еще видим сегодня, является, в частности, обучение команд. Ученый в области данных не необходимо должен быть один на миллион. В действительности, одним из больших изменений в мире сегодня ... если вы посмотрите на количество программистов, а программирование является одним из навыков, в котором нуждается ученый в области данных, и если посмотрите на количество бесплатных курсов, вы увидите, как много языков программирования на них изучают. Можно увидеть, что Microsoft и Google предоставляют программное обеспечение, чтобы помочь вам разработать что-либо. В действительности, программирование становится распространенным навыком, и это очень хорошо. Чем больше мы можем изучить языков программирования, тем лучшие машины мы будем делать. Нет разницы между инженером-физиком XIX столетия и начала ХХ столетия в понимании того, как металл взаимодействует с теплом — они должны это изучить.

То же справедливо и в отношении ученых в области данных. Вы можете бесплатно обучаться в Интернете, и будет достаточно хорошо начать с установки средств ИИ на ваш домашний компьютер.

Что может дать наука о данных бизнесу, индустрии и науке?

Сегодня наука о данных встраивается всюду. Я был в компании, которая делает продукты микроскопических размеров, требующие высокой точности. Вы можете не увидеть их невооруженным глазом. Их продукция используется во всем мире, от спутников до медицинских устройств, которые имплантируются в ваше тело. Они должны быть точными. Компания знает, что использование аналитики данных и ИИ может улучшить качество их продуктов, и они знают, что компьютеры хорошо подходят для этого, поскольку это простая итерационная задача. Уровень точности может быть запрограммирован с малым шагом. Было очень приятно видеть, что компания понимает, что аналитика может сделать. Чем больше они внедряют аналитику данных, тем больше они могут увеличить ценность своего бизнеса. Их директор по инновациям сказал, что все начало расти, как грибы. И такая ситуация повторяется в каждой компании.

Можете ли вы привести примеры успешного использования науки о данных?

Конечно. В Dell EMC очень хорошо организована цепочка поставок, и это составляет предмет нашей гордости. Мы используем технологию и аналитику все время, у нас фантастическая команда в цепочке поставок. Я помню разговор с одной сотрудницей, которая говорила, если мы сделаем это, это и это, мы сможем получить некоторую прибыль. Проценты были небольшими, но небольшие проценты, получаемы каждую неделю, в течение года дали существенный прирост. Я улыбнулся и сказал, что она зациклена на прибыли, на что получил ответ, что это наилучший комплимент, который она когда-либо слышала. «Мы применяем методы науки о данных к своим показателям и постоянно ищем лучшие способы, чтобы делать лучшие продуты по лучшей цене, обеспечивать лучшую поддержку, чтобы люди могли лучше их использовать», — сказала она. Если взять действительно хороших специалистов, действительно хорошую идею и действительно хорошие данные, то можно сделать нечто новое. И это то, что она делает, то, что наша цепочка поставок пытается делать, и это то, что каждый банк, каждый фермер и вообще каждый должен бы делать.

Может быть у вас есть примеры успешного использования науки о данных в Украине?

Нет, мне трудно ответить на этот вопрос, и это, вероятно, связано с недостаточным количеством компаний, которые используют эти методы. Что я могу сказать, есть много людей в Украине, с которыми я встречался. Они обычно говорят, что Украина отстает. Я так не думаю. Из того, что я вижу, что слышу и чувствую ... Что делает определенные места в мире динамичными и привлекательными? Это стремление к переменам и модернизации. И в Украине оно есть. Еще мне нравится знание традиций. Я думаю, что это превосходное сочетание. У вас отличное географическое положение — вы смотрите на Восток, но достаточно близки к Западу. Что я чувствую в Украине — это современный динамизм. Так что Welcome to Ukraine!

Какое аппаратное и программное обеспечение необходимо для поддержки науки о данных?

Честно говоря, 10–15 лет назад вам необходим был суперкомпьютер, чтобы сделать что-то приличное. Знаете, у меня была дискуссия с одним из заказчиков, это был банк. Во время обсуждения один из директоров что-то писал, потом остановился и спросил: «Что, мне нужен бюджет для суперкомпьютера Cray, чтобы сделать это?» К счастью это не так. Это все работает прямо сейчас на ноутбуке. То, что мы разрабатываем, работает в любой организации. Наилучшей вещью в науке о данных является то, что вы можете начать с карандаша и бумаги и работать с наиболее мощным, энергоэффективным и удивительным суперкомпьютером в мире, который находится в вашей голове.

Есть ли какие-либо планы по сотрудничеству между Dell EMC и украинским бизнесом и индустриями в области науки о данных?

Это действительно трудный вопрос. У нас огромный глобальный бизнес. По моему мнению, мы являемся одной из наиболее открытых к партнерству компаний, которые существует в мире. Сотрудничество осуществляется через нашего представителя в локальном офисе. Мы сотрудничаем с большим количеством компаний и организаций, от Кембриджского университета и Техасского передового компьютерного центра до Университета Пизы. Цель того, что мы делаем в Dell Technologies, заключается в том, чтобы способствовать прогрессу человечества. Если кто-либо приходит к нам с идеей, мы берем эту идею. Если у вас есть хороший план, мы обсуждаем этот план. Мы не собираемся сказать «нет», прежде чем вы начали говорить. Так что приходите и предлагайте.

Материал «Компьютерное обозрение»

Поширити
[mailpoet_form id="2"]