40
DATA SCIENCE / АНАЛИТИКА Исследование рынка в Казахстане

Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

DATA SCIENCE / АНАЛИТИКА

Исследование рынка в Казахстане

Page 2: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Аналитики

ML-инженерыDWH-инженеры

Data Scientists

1000000000100000000010000000001000000000

Респонденты

Портрет профессии

Инструменты и задачи

Зарплата и мотивация

О чем можно узнать

Page 3: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Респонденты Цель исследования

Опрос респондентов начался в ноябре 2019 года и продлился два месяца. Для формирования анонимного

опросника и конфиденциального сбора данных мы использовали сервис Typeform.

В опроснике принимали участие казахстанские аналитики, Data Science-специалисты, ML- и DWH-инженеры.

Изучить рынок аналитики

и Data Science в Казахстане:

Как выглядит актуальный портрет казахстанского аналитика

Сколько зарабатывают аналитики и как оценивают уровень своей зарплаты

Какова структура аналитических отделов и уровень их развития

Какие аналитики решают задачи и какие инструменты используют

Что является мотивацией для представителей профессии

Каких знаний и навыков им не хватает

Page 4: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Мы рассылали опросник по внутренней базе аналитиков и дата-сайентистов,

таргетировали посты в социальных сетях Kolesa Group на узкий круг интересов,

а также распространяли в тематических Telegram-каналах, чатах (DS/ML kz, BI

Community) и медиа (BlueScreen). Опросник заполнили 308 респондентов.

Огромное спасибо вам за помощь!

Для получения более репрезентативных данных мы очищали базу от выбросов

и пропусков (сильно завышенные или заниженные ответы). После, оперировали

частотами ответов, рассчитывали различные метрики центральной тенденции

(среднее, медиана), анализировали разброс показателей (стандартное

отклонение, коэффициент вариации) и квантили различных уровней.

Затем для более глубокого исследования нюансов профессии и проверки наших

выводов и гипотез мы попросили экспертов прокомментировать полученные

результаты с точки зрения их опыта.

Методика сбора данных

Наши эксперты

Думан Уватаев

Chief Data Officer

в Kaspi Bank

Пётр Царенко

Chief Data Officer

в Kolesa Group

Ануар Аймолдин

Руководитель отдела ИИ

в BTS Digital

Айбек Ергожаев

Операционный директор

Frontier KZ

Page 5: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Портрет респондента

Большинство специалистов, работающих в области

аналитики и Data Science, сосредоточены в Алматы

23,4 %Женщины

76,6 %Мужчины

Возраст большинства

респондентов 22-27лет

Более 76% респондентов в возрасте

до 30 лет (включительно)

Другие города

Нур-Султан

75,1 %Алматы

4,3 %

20,6 %

39,9 %21-25 лет

4,3 %18-20 лет

32,6 %26-30 лет

15,6 %31-35 лет

7,6 %36+ лет

Page 6: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Уровень образования

Около половины участников исследования окончили

бакалавриат (53 %) ещё около 40 % — магистратуру

97 %

имеют высшее

образование

3,1 %

53,4 %

40,5 %

1,4 %

4,1 %

Среднее

Бакалавриат

Магистратура

Аспирантура

Докторантура

Page 7: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Учебные заведения

Большая часть аналитиков и специалистов по Data Science —

выпускники казахстанских вузов. В топ-3 входят МУИТ, КазНУ и SDU

АУЭС

КБТУ

Nazarbayev University

МГУ

Satbayev University

8,7 %

8,7 %

5,7 %

5,3 %

5 % 4 %респондентов получили

высшее образование

за пределами СНГ

всего

МУИТ

КазНУ

SDU

14,7 %

10,7 %

9,3 %

Page 8: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Ануар Аймолдин I Руководитель отдела ИИ BTS Digital

– Рынок начал активно развиваться года три назад. За это

время произошел внушительный рост: появляются крупные

продуктовые/инфраструктурные/ресерч-команды и AI-driven-

стартапы, проводятся многочисленные митапы, а наши ребята

успешно выступают на международных конкурсах и пишут

интересные исследовательские проекты.

Радует, что в ряде университетов появились специализированные

программы по изучению наук о данных (магистерская программа

в Назарбаев Университете, КазНУ, КБТУ, Yessenov Data Lab в ALMA

University, Astana IT University). При этом по-прежнему ощущается

некоторый дефицит middle-, senior-специалистов и людей с опытом

руководства DS-компаниями. На ближайшие несколько лет

прогнозирую еще более сильную конкуренцию за кадры в области

анализа данных, особенно в банковской сфере.

Пётр Царенко I Chief Data Officer в Kolesa Group

– Я считаю, что эти вузы дают неплохую базу в области математики

и программирования. И если студент дополнительно пройдет

узкоспециализированные курсы и получит практический опыт,

то сможет стать хорошим специалистом.

Для нашей компании вуз не является определяющим фактором

при приеме на работу.

Data Science в Казахстане является растущим направлением,

о котором лет пять назад почти никто не знал и не говорил.

Большинство респондентов (около 80 %) работают в анализе данных

три года и меньше. Поэтому и программы в вузах по подготовке

специалистов в области анализа данных появились совсем недавно,

а во многих вузах не появились до сих пор.

Думаю, что эта ситуация скоро изменится. Университеты и бизнес

уже начинают работать совместно, чтобы создавать более

качественные программы для студентов. А специализация «Анализ

данных» в ближайшие пару лет станет одной из самых популярных

среди абитуриентов.

– Согласно опросу, наибольшее число респондентов

выпустились из МУИТ, КазНУ и СДУ. Эти вузы

действительно лидеры в подготовке таких специалистов?

Как вы оцениваете уровень развития

рынка труда в DS/ML/аналитике данных

в Казахстане

Page 9: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Специализация

Непрофильные

специализации:

б и о л о г и я

э к о л о г и я

ф и л о л о г и я

п с и х о л о г и я

л и н г в и с т и к а

Среди респондентов преобладают выпускники

факультетов технических и точных наук, гораздо

меньше специалистов с гуманитарным образованием 73 %технические

и точные науки

53,2 %

15,4 %

14,7 %

5,4 %

4,7 %

6,7 %

Информационные

технологии

Экономика

Математика

Менеджмент

Физика

Прочее

Page 10: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Владение языками

66 %Казахский 99 %Русский 82 %Английский

Page 11: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Стаж в анализе данных

Большинство респондентов работают

по найму в офисе

По найму в офисе 78 %

Совмещают 9 %

На себя 8 %

По найму удалённо 4 %

Доля специалистов со стажем менее трёх лет характеризует

зрелость рынка Data Science в разных странах.

В Казахстане доля специалистов с опытом работы до трёх лет

составляет 80 %, в России – 75 %, в Индии – 63 %, в США – 52 %.

47 %1 год

20 %2 года

4+

19 %

14 %3 года 94,3 %

работают

в Казахстане

Page 12: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Индустрии

~ 40 % работают в IT. На втором месте — финансы

и банковское дело (около 25 %)

IT, финансы, телеком и госсектор – это

основные сферы, в которых в принципе есть

данные, а значит, есть и возможность

получать от их обработки выгоду для

бизнеса в виде сокращения расходов,

увеличения доходов или уменьшения рисков.

Могу предположить, что доля специалистов

из финансового сектора будет расти

активней всего в ближайшие несколько лет.

Пётр Царенко

Chief Data Officer в Kolesa Group

Ретейл

IT

39 %

Финансы,

банковское дело

25,3 %

6,3 %

Сотовая связь,

телекоммуникации

10,3 %

Прочие

19,1 %

Page 13: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Количество человек в отделе

Почти 70 % респондентов работают в небольших командах до 8 человек.

При этом 13 % респондентов указали, что являются единственными

сотрудниками по работе с анализом данных в компании

1 человек

от 2 до 3

от 4 до 7

от 8 до 10

от 11 и более

13 %

25 %

30 %

13 %

19 %

Page 14: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Уровень должности

Во многих компаниях еще не сформировалась адекватная система

оценки: senior или teamlead в одной компании может соответствовать

уровню middle в другой.

Это подтверждают и ответы респондентов: junior-специалистов почти

столько же, сколько руководителей и teamlead-специалистов.

Руководитель или тимлид

Ведущий специалист (Senior)

Специалист (Middle)

Младший специалист (Junior)

Стажёр, интерн

21,5 %

24,2 %

26,9 %

22,2 %

5,4 %

Page 15: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

29 %

совмещают несколько

функций

Специализация

Data Scientist — наиболее распространенная должность

среди респондентов (около 36 %). В топ-3 также входят

BI-аналитики (19 %) и DWH-инженеры (около 16 %).

Data Scientists

BI-аналитик

DWH (Data)-engineer

Product-аналитик

ML-engineer

Marketing-аналитик

36 %

19 %

16 %

15 %

14 %

11 %

Page 16: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Откуда приходят в аналитику

Согласно опросу, более половины

респондентов пришли в аналитику

и Data Science из менеджмента, экономики,

продаж, маркетинга и других нетехнических

дисциплин

Бизнес-

аналитик

Управление

проектами

Менеджмент

Маркетинг

Прочие

Экономика

4 %Управление

продуктами

9 %

5 %

13 %

8 % Бэкграунд

25 %

37 %

Page 17: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Зоны ответственности

52 %

45 %

35 %

33 %

Предобработка, чистка и подготовка данных

Базовый статистический анализ

Выгрузка, загрузка и поддержка инфраструктуры данных

Визуализация и построение дашбордов (BI)

Наиболее популярные рабочие функции среди всех респондентов

Page 18: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Функции в зависимости от специализации

Product-аналитик

Data Scientists

Marketing-аналитик

ML-engineer

BI-аналитик

DWH (Data-engineer)

А/В-тесты

Визуализация

Менеджмент

Поиск инсайдов

59 %

50 %

36 %

Стат.анализ

Предобработка

Визуализация

56 %

47 %

41 %

Стат.анализ

Предобработка

32 %

30 %

23 %

Поддержка инфраструктуры данных

А/В-тесты

Менеджмент

28 %

25 %

16 %

Стат.анализ

65 %

57 %

50 %

Предобработка

Визуализация

Поддержка инфраструктуры данных

Менеджмент

А/В-тесты

39 %

19 %

17 %

Разработка ML-моделей

Поддержка инфраструктуры данных

А/В-тесты

Визуализация

45 %

40 %

35 %

Предобработка

Стат.анализ

Предобработка

53 %

50 %

48 %

Разработка Deep Learning-моделей

Разработка ML-моделей

29 %

22 %

21 %

Новые ML-модели под нужды бизнеса

DEV OPS ML-моделей

Стат.анализ

35 %

28 %

23 %

Визуализация

80 %

69 %

33 %

Поддержка инфраструктуры данных

Предобработка

Стат.анализ

Внедрение систем BigData

Менеджмент

27 %

18 %

13 %

Page 19: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Функции в зависимости от должности

Руководитель или тимлид

Визуализация

Поддержка инфраструктуры данных

Стат.анализ

Поиск инсайдов

55 %

38 %

36 %

Менеджмент

Предобработка

34 %

33 %

19 %

Senior

Визуализация

47 %

46 %

39 %

Предобработка

Стат.анализ

Поддержка инфраструктуры данных

Разработка ML-моделей

А/В-тесты

29 %

25 %

18 %

Middle

Поддержка инфраструктуры данных

56 %

45 %

35 %

Предобработка

Стат.анализ

Визуализация

Разработка ML-моделей

А/В-тесты

33 %

18 %

18 %

Junior

Поддержка инфраструктуры данных

Разработка ML-моделей

Визуализация

А/В-тесты

67 %

50 %

42 %

Предобработка

Стат.анализ

27 %

26 %

21 %

Стажёр, интерн

Поддержка инфраструктуры данных

44 %

31 %

25 %

Стат.анализ

Предобработка

Поиск инсайдов

Внедрение систем BigData

Разработка ML-моделей

25 %

19 %

13 %

Page 20: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Источники постановки задачПримечательно, что около трети участников исследования

отметили, что ставят себе задачи самостоятельно. Возможно,

это связано с тем, что не всегда и не везде бизнес точно знает,

чего он ждёт от аналитики и Data Science

Самостоятельно

Маркетинг

Разработка

Топ-менеджмент

13 %

16 %

17 %

37 %39 %

45 %

Продуктовый отдел

Линейный руководитель

Page 21: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Типы анализа данных

Описательная статистика

Кластерный анализ и сегментация

Корреляция и факторы влияния

Задачи классификации

43 %

40 %

40 %

31 %

проверка гипотез, A/B-тестирование, дисперсионный анализ

анализ временных рядов и прогнозирование на их основе

решение регрессионных задач (классический ML)

поиск аномалий в данных, антифрод

задачи классификации (Deep Learning и нейросети)

EDA

понижение размерностей в данных

30 %

28 %

26 %

26 %

19 %

16 %

11 %

Популярными среди респондентов также оказались A/B-тестирование и дисперсионный

анализ. Эти методы всё чаще применяются в казахстанских компаниях для оценки

нововведений. Наиболее инновационные глубокие нейросети упомянули 19 % респондентов

Page 22: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

1. Уровень зрелости компании

На этапе внедрения подхода data-driven нет острой необходимости

использовать сложные методы ML. Как показывает практика, компании,

которые ранее не использовали подобные методы работы с данными,

получают впечатляющие результаты при помощи базовых

ML-алгоритмов. Многие операционные процессы могут быть

оптимизированы при помощи достаточно простых методов

интеллектуального анализа данных.

Внедрение и промышленная эксплуатация сложных классов алгоритмов

машинного обучения может потребовать много времени, высокого

уровня компетенции у задействованных в процессе сотрудников и

титанических усилий. Нет смысла строить космолёты, когда можно

получить первые результаты по принципу quick win, используя

элементарные методы, которые можно внедрить очень быстро.

Думан Уватаев I Chief Data Officer в Kaspi Bank

2. Объем анализируемых данных

Любая компания генерирует данные, но не каждая может похвастаться

большими объемами данных, а даже при наличии большого объема

данных — готовностью их хранить, анализировать и использовать

в работе. Отсутствие необходимой инфраструктуры также может

ограничивать возможности аналитиков во внедрении сложных решений.

3. Уровень компетенции сотрудников по работе с данными.

При отсутствии приемлемого уровня компетенций нет возможности

перейти к использованию более продвинутых методов. Именно поэтому

многие компании поддерживают ранее известные подходы в процессах

принятия решений на основании данных.

— Согласно опросу, наиболее популярные алгоритмы и методики анализа относятся к классическому ML

и анализу данных (описательная статистика — 43 %, кластерный анализ — 40 %, корреляционный анализ

и поиск факторов влияния — 40 %). Почему именно эти типы анализа наиболее популярны? Почему Deep

Learning менее популярен (всего 19 % респондентов)?

4. Отсутствие экспериментальной базы.

Чаще всего аналитики заняты текущими задачами и уровень

загруженности не позволяет им посвятить время собственному обучению

или работе над альтернативными методами решения задач. В результате

все придерживаются практически единого стандарта решений задач.

5. Неготовность руководства компании / низкий приоритет /

конфликт интересов.

Не каждая компания уделяет должное внимание развитию экспертизы

работы с данными, ограничивая роль аналитиков в процессе принятия

управленческих решений. Неготовность или нежелание руководства

может быть ключевым ограничением, которое не позволяет развить

экспертизу и, как следствие, не получить значимых результатов. Следует

отметить, что, помимо ограничения со стороны руководства, речь может

идти о неготовности владельцев бизнес-процессов, деятельность которых

могла бы быть улучшена с применением методов интеллектуального

анализа данных. Всесторонняя оценка бизнес-процессов с выделением

неэффективных действий/решений может быть весьма болезненной для

указанных сотрудников, и именно они могут сопротивляться изменениям.

Page 23: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

1. Уровень зрелости компании

На этапе внедрения подхода data-driven нет острой необходимости

использовать сложные методы ML. Как показывает практика, компании,

которые ранее не использовали подобные методы работы с данными,

получают впечатляющие результаты при помощи базовых

ML-алгоритмов. Многие операционные процессы могут быть

оптимизированы при помощи достаточно простых методов

интеллектуального анализа данных.

Внедрение и промышленная эксплуатация сложных классов алгоритмов

машинного обучения может потребовать много времени, высокого

уровня компетенции у задействованных в процессе сотрудников и

титанических усилий. Нет смысла строить космолёты, когда можно

получить первые результаты по принципу quick win, используя

элементарные методы, которые можно внедрить очень быстро.

2. Объем анализируемых данных

Любая компания генерирует данные, но не каждая может похвастаться

большими объемами данных, а даже при наличии большого объема

данных — готовностью их хранить, анализировать и использовать

в работе. Отсутствие необходимой инфраструктуры также может

ограничивать возможности аналитиков во внедрении сложных решений.

3. Уровень компетенции сотрудников по работе с данными.

При отсутствии приемлемого уровня компетенций нет возможности

перейти к использованию более продвинутых методов. Именно поэтому

многие компании поддерживают ранее известные подходы в процессах

принятия решений на основании данных.

Нет смысла строить

космолёты, когда можно

получить первые

результаты по принципу

quick win, используя

элементарные методы,

которые можно внедрить

очень быстро

4. Отсутствие экспериментальной базы.

Чаще всего аналитики заняты текущими задачами и уровень

загруженности не позволяет им посвятить время собственному обучению

или работе над альтернативными методами решения задач. В результате

все придерживаются практически единого стандарта решений задач.

5. Неготовность руководства компании / низкий приоритет /

конфликт интересов.

Не каждая компания уделяет должное внимание развитию экспертизы

работы с данными, ограничивая роль аналитиков в процессе принятия

управленческих решений. Неготовность или нежелание руководства

может быть ключевым ограничением, которое не позволяет развить

экспертизу и, как следствие, не получить значимых результатов. Следует

отметить, что, помимо ограничения со стороны руководства, речь может

идти о неготовности владельцев бизнес-процессов, деятельность которых

могла бы быть улучшена с применением методов интеллектуального

анализа данных. Всесторонняя оценка бизнес-процессов с выделением

неэффективных действий/решений может быть весьма болезненной для

указанных сотрудников, и именно они могут сопротивляться изменениям.

Page 24: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Думан Уватаев

Chief Data Officer в Kaspi Bank

Языки программирования и инструменты

MATLAB

SPSS

Statistica

Python

SQL

R

C++

Java

Python

Excel/Google-таблицы

R

Python — общедоступный, абсолютно

бесплатный и быстро развивающийся

язык программирования. Он обладает

четким и последовательным синтаксисом,

продуманной модальностью и

масштабируемостью, благодаря чему

исходный код написанных на Python

программ легко читается. Еще одна

особенность Python — наличие большого

количества готовых библиотек для

решения самых разных типов задач.

Python популярен и среди гигантов

по работе с данными: Spotify, Amazon,

Google, Netflix, YouTube и Instagram.

Но Python не панацея. Для создания

полномасштабных промышленных

решений его следует комбинировать

с другими предложениями от крупных

поставщиков.

7 %

7 %

68 %

62 %

55 %

14 %

56 %

13 %

11 %

8 %

3 %

Математические и статистические инструменты

Языки программирования

Page 25: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Инструменты для визуализации

Специализированная программа Power BI от Microsoft почти

в три раза обогнала ближайших конкурентов — Qlik и Tableau

47 %

используют традиционные

Excel или Google-таблицы

Excel/Google-таблицы

Power BI

Tableau

QlikView/Qlik Sense

OLAP

11 %

5 %

47 %

36 %

13 %

Page 26: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Системы веб- и мобильной аналитики

Наибольшей популярностью среди респондентов пользуются системы веб-аналитики

Google Analytics (32 %) и Яндекс.Метрика (19 %). Системы мобильной аналитики

(AppMetrica, AppsFlyer, FireBase) менее популярны, их отметили около 8 % респондентов

Google Analytics

Яндекс.Метрика

Firebase

Mixpanel

Amplitude

AppsFlyer

3 %

2 %

2 %

32 %

19 %

8 %

AppMetrika

8 %

Page 27: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Библиотеки для машинного обучения

Scikit-learn

SciPy

XGBoost

TensorFlow

Random forest

PyTorch

Keras

Наиболее популярными библиотеками оказались Scikit-learn

и SciPy для Python (39 и 31 % ответов соответственно)

39 %

31 %

24 %

24 %

22 %

21 %

19 % 45 %не используют

библиотеки

Page 28: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Наиболее популярной СУБД оказалась MySQL (41 %).

На втором месте — PostgreSQL (34 %). Облачные системы

от Google или Amazon Web Services (AWS) менее популярны

Системы управления базами данных (СУБД)

Наличие Data Warehouse (DWH)

50 %ДаНе знаю

20 %

Нет

30 %

MySQL

PostgreSQL

Hadoop

41 %

34 %

13 %

Google Cloud

AWS (Amazone)

Hive

Oracle

ClickHouse

10 %

9 %

8 %

8 %

7 %

Page 29: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Интересно, что о DWH говорят около половины респондентов,

но при этом около 48 % хранят данные в Excel и других spread-

sheet — таблицах. Возможно, это связано с тем, что во многих

компаниях большая часть данных все-таки представлена

в формате small-data.

Среди тех, кто отметил использование

облачных сервисов, более популярны

решения от Google Cloud

38 %

55 %

17 %

19 %

73 %

48 %

23 %

15 %

14 %

SQL-решения и реляционные

базы данных

Excel и другие spreadsheet таблицы

Облачные сервисы

NoSQL базы данных

Hadoop

Системы хранения данных

Page 30: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Уровень аналитики в вашей компанииПродвинутый уровень. BI-система работает отлично. Есть DWH

и Big Data. Регулярно проводим A/B-тесты. Есть работающие

системы ML и DS в production. Решения принимаются только

по данным. Отдел работы с данными и Data Science – один из

ключевых в компании.

Хороший уровень. Периодически проводим сложные Data Sci-

ence-исследования бизнес-проблем, пробуем внедрять

ML-алгоритмы в бизнес. Иногда проводим A/B-тесты. Внедряем

предиктивную аналитику. Активно внедряем Data-Driven-подход

в управлении.

Средний уровень. Простые регулярные отчеты в BI. Простые

разовые исследования по требованию. Один или несколько

аналитиков.

Базовый уровень. Простые отчеты в Excel. Но хочется большего.

Начальный уровень. Аналитика в зачаточном состоянии.

Оценки в среднем были выше среди BI-аналитиков,

Data Science-специалистов, ML-инженеров и DWH-инженеров.

Возможно, команды, в которых есть такие специалисты, работают

на более высоком уровне и выполняют более сложные задачи

27 %средний

28 %хороший

13 %базовый

17 %начальный

14 %продвинутый

Page 31: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

— 55 % респондентов отметили хороший и средний уровень развития аналитики и Data Science

в своих компаниях. Вы согласны с такой оценкой?

Ануар Аймолдин I Руководитель отдела ИИ в BTS Digital

— Это значит, что больше половины респондентов устраивает

уровень развития Data Science и аналитики в их компаниях,

что не может не радовать. Отмечу, что приведенная

классификация уровней развития аналитики и DS оценивает

по большей части инфраструктуру системы аналитики.

Например, для AI-driven стартапов это совсем нерелевантно,

что также могло слегка пессимизировать результаты опроса.

Айбек Ергожаев I Операционный директор Frontier KZ

— Тяжело не согласиться, когда аудитория респондентов,

скорее всего, состоит из аналитиков компаний, на практике

знакомых с DS. Однако если говорить об уровне развития

рынка, то мы наблюдаем уровень продвинутой аналитики

только в крупных компаниях с традиционно поставленной

экосистемой данных, в частности в банках, телекоме и

международных FMCG.

Page 32: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Есть корреляция между размером отдела аналитики/Data Science и оценкой уровня компании в этой

области. Так, при отделе свыше трёх человек резко увеличивается доля ответов на хорошем уровне.

В отделе из восьми человек и более чаще появляется продвинутый уровень в ответах

1 человек от 2 до 3 от 4 до 7 от 8 до 10 от 11 и более

Начальный уровень

Базовый уровень

Средний уровень

Хороший уровень

Продвинутый уровень

44 %

25 %

22 %

6 %

0 %

23 %

14 %

34 %

17 %

10 %

4 %

13 %

38 %

33 %

11 %

13 %

8 %

21 %

34 %

21 %

6 %

9 %

13 %

45 %

25 %

Уровень аналитики и Data Science в зависимости от величины отдела

Page 33: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Недостающие навыки и знания

Академические знания

Deep Learning-алгоритмы

Языки программирования (Python, R)

Навыки работы с BigData

Написание чистого и оптимизированного кода

Дополнительные языки (C++, Julia, Java и др.)

41 %

31 %

30 %

29 %

28 %

25 %

При ответе на вопрос о недостатках знаний и навыков в основном респонденты говорят

о недостатке технических знаний и скиллов. Наибольший недостаток навыков и знаний

респонденты ощущают в академических знаниях (41 % респондентов). Около трети

респондентов считают, что недостаточно знают алгоритмы Deep Learning. Еще 30 %

респондентов отмечают недостаточное знание языков программирования.

Page 34: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Data Science – молодое развивающееся

направление. Поэтому специалисты со стажем

от трех лет уже считаются опытными

сотрудниками уровня Middle или Senior.

Медианная зарплата молодых специалистов

без опыта почти на 30 % выше,

чем средняя по стране.

Работая в сфере анализа данных,

за первые три года можно увеличить

заработную плату в два с половиной раза

Медианная заработная плата в зависимости от стажа работы

700

600

500

400

300

200

100

0

1 2 3 4

230K

400K

550K575K 600K

 стаж работы (лет)

5 лет и более

• Для графика мы использовали медианную зарплату, так как она

лучше характеризует выборку с большим разбросом и выбросами.

• Специалистов с опытом от 5 лет и более мы объединили в одну

группу из-за небольшого количества респондентов

Page 35: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Ануар Аймолдин I Руководитель отдела ИИ в BTS Digital

– Я думаю, что это больше история не про уровень развития,

а про задачи, которые решают респонденты. Например,

вышеприведенными методами могут решаться весьма

распространенные у нас задачи клиентской аналитики.

— Как Вы считаете, более высокая доля задач,

связанных с описательной статистикой, а также

с корреляционным и кластерным анализом

(43 %, 40 %, 40 % респондентов соответственно),

у респондентов соответствует мировым трендам

и особенностям? Или это больше особенности

казахстанского этапа развития?

Айбек Ергожаев I Операционный директор Frontier KZ

— Если говорить в целом, о DS, ML и BigData, то казахстанский

рынок все еще молод, устойчивый курс на развитие анализа и

экосистемы данных среди крупных компаний заметен лишь

последние три года, и то в определенных сегментах. Банки

активно внедряют продвинутую аналитику,

в частности в скоринге и апсейлах, не отстает и телеком, активно

применяющий технологии анализа больших данных как для

внутренней аналитики, так и для внешней монетизации данных.

Следом можно отметить транснациональные FMCG и нефтяные

компании. Гос- и квазигоссектор начали активно развиваться

последние 1-2 года. Наблюдаем интересные проекты в

строительных компаниях. Если говорить о добывающей

промышленности, логистике, дистрибуции, страховании и других

сферах, то рынок однозначно очень молод.

— Почти 80 % респондентов работают

в анализе данных три года или менее.

Действительно ли наш рынок такой молодой?

Page 36: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Около 69 % респондентов получали повышение в течение года.

50 % респондентам повышали зарплату в последние полгода.

Последнее повышение зарплаты

24 %

22 %

19 %

17 %

11 %

8 %

Не повышали

Полгода

Год

Месяц

Квартал

Более года

Page 37: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Размер заработной платы

Уровень средней зарплаты (в зависимости

от позиции) связан как с требуемыми

компетенциями, так и с количеством

специалистов на рынке. Компании готовы

платить больше редким специалистам,

таким как DWH и ML-инженеры.

Рынок труда Data Science в Казахстане

находится на ранней стадии развития,

поэтому на редкие позиции вроде

ML-инженеров и дата-сайентистов можно

встретить как очень низкие зарплаты, так

и очень высокие.

в зависимости от позиции

250 000

0

DWH

(Data-engineer)

540К

ML-engineer

509К

Data

Scientists

500К

BI-аналитик

480К451К

Product-

аналитик

403КСредняя

500 000

750 000

1 000 000

1 250 000

1 500 000

1 750 000

2 000 000

Marketing-

аналитик

Page 38: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Средняя

Размер заработной платы

С точки зрения уровня должности

самая высокая зарплата у тимлидов и

руководителей, в среднем 692 тыс.

тенге. Самая низкая — у стажёров,

около 150 тыс. тенге.

При этом в каждом из указанных

уровней наблюдаются значительные

отклонения у единичных

специалистов

в зависимости от уровня должности

250K

500K

750K

1 000K

1 250K

0

Младший

специалист (Junior)

288К

Руководитель

или тимлид

692К

Ведущий

специалист (Senior)

484К

Специалист

(Middle)

386К

Стажёр,

интерн

153К

Page 39: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Важные пункты при выборе места работы

Уровень зарплаты и соцпакета

Возможность обучаться

Сильная команда

30 %

29 %

18 %

14 %

14 %

14 %

3 %

Интересный продукт

Бизнес с перспективой роста

Бренд компании

Корпоративная культура

Социальная значимость проекта

Возможность работать дистанционно

Локация

68 %

61 %

48 %

Готовы ли вы сейчас к смене работы

при более выгодном предложении?

Лояльность респондентов невысокая.

Почти 65 % готовы к смене работы

при более выгодном предложении

22 %

Затрудняюсь ответить

65 %Да

13 %Нет

Page 40: Исследование рынка в Казахстане DATA SCIENCE ...зрелость рынка Data Science в разных странах. В Казахстане доля

Данные нашего исследования это подтверждают. Судя по отчету, Data Science –

одно из самых растущих и перспективных направлений.

Информация, собранная в отчете, подтверждается нашим опытом: сотней

проведенных собеседований, информацией от компаний-партнеров и успехами

RnD-отдела Kolesa Group.

Мы приоткрыли занавес и теперь знаем о рынке специалистов данных намного

больше. Этими знаниями мы с радостью делимся с вами!

Data Scientist – самая сексуальная профессия XXI века(с) Harvard Business Review