Оглавление
- Введение в веб-аналитику
- Обучение на Big Data Analyst
- Важные личные качества
- Что учить
- Этап 6
- Личные качества
- Что должен знать и уметь аналитик данных
- Зарплата аналитика
- Карьерный рост
- Профессиональные знания
- Известные аналитики
- Немного истории
- Где учат на аналитиков
- Кто такой системный аналитик
- Кто такой аналитик
- Где получить знания в области обработки данных
- Обязанности аналитика данных
- Рынок Big data в России
- Кто такой аналитик данных
- Принципы эффективного обучения
- Для менеджеров и руководителей:
- [править] Сотрудничество с вузами
- Инструменты
- Выбор между колледжем ВУЗом магистратурой
- Чем занимается игровой аналитик
Введение в веб-аналитику
Что такое веб-аналитика и зачем она вам нужна?Подробное руководство по аналитике веб-трафикаКакие бывают источники трафикаКакие ошибки возникают при работе с Google Analytics и как с ними боротьсяКак настраивать представления в Google Analytics — подробное руководство18 метрик и KPI интернет-маркетинга, которые вы должны знатьОсновные термины в веб-аналитике Что такое UTM-метки и как их применятьГлоссарий: базовые понятия веб-аналитикиЧто такое ROI и какие нюансы следует учитывать при его расчетеМодели атрибуции — подробный обзор и сравнениеМодели атрибуции от GoogleЧто такое A/A тестирование, и как его провести6 советов начинающему веб-аналитику
Обучение на Big Data Analyst
Аналитику больших данных нужна подготовка в вузах, без высшего образования устроиться на работу практически невозможно
Стоит обратить внимание на следующие направления подготовки:
- «Математика и компьютерные науки» (код: 02.03.01);
- «Прикладная информатика» (код: 09.03.03);
- «Информатика и вычислительная техника» (код: 09.03.01);
- «Программная инженерия» (код: 09.03.04);
- «Механика и математическое моделирование» (код 01.03.03);
- другие направления подготовки, связанные с ИТ, математикой и компьютерными науками, информатикой, вычислительной техникой, управлением в технических системах.
Пока ни один, даже самый крупный российский университет, не выдает дипломы, в которых записано, что выпускник может работать аналитиком больших данных. Но любая из программ, связанных с подготовкой программистов или ИТ-специалистов, станет хорошей базой для того, чтобы после окончания вуза (или параллельно с учебой) пройти курсы и получить профессию именно Big Data Analyst.
И обязательно надо уделить внимание изучению технического английского языка
Важные личные качества
Big Data Analyst работает с огромными массивами информации, что накладывает отпечаток на его характер. Чтобы справляться с обязанностями, аналитику больших данных надо:
быть дисциплинированным, усидчивым, терпеливым и методичным;
уметь долго концентрировать внимание;
быть способным работать в режиме многозадачности;
обладать развитым техническим и аналитическим мышлением;
уметь работать в команде.
Кроме того, аналитик больших данных должен быть достаточно прагматичным, уверенным в своих силах, ведь от его умения делать выводы на основании полученной информации во многом зависит успех бизнеса и принятие стратегически важных решений.
Что учить
Если вы решили, что готовы «грызть гранит науки», то в образовании специалиста data science есть два кита:
Непосредственные методы Data science, которые стоят на трёх математических черепахах: теории вероятностей и статистике, линейной алгебре и основах мат.анализа (только основах, там требуется минимум сверх школьного курса «алегбра и начало анализа»). Кстати, вся эта математика далеко не так сложна. Проблема в том, что её плохо и неинтересно объясняют во многих вузах. Позже поделюсь советами, как её можно легче освоить.
Программирование на Python (+SQL и подобные), которое позволит применить все изученные методы с помощью логичных и простых в своей сути библиотек готовых функций.
Каждый data scientist немного программист. При этом именно python является стандартом де-факто для нашей сферы. Вероятно, этот язык занял своё положение благодаря тому, что он очень простой и логичный. Если вы программировали на чём угодно, и слова «цикл» или «if-then-else» вас не пугают, то вам не будет очень сложно освоить Пайтон. Если вы никогда не программировали, но считаете, что структурное и математическое мышление — ваш конёк, с программированием у вас не будет проблем
Даже если вы «конченный гуманитарий», освоить Python значительно легче, чем выучить многие иностранные языки (но, внимание! для людей без предыдущего опыта программирования обучаться ему эффективнее по-другому, не так, как для тех, кто уже имеет опыт программирования)
Даже примерный учебный план для изучения методов Data science требует отдельного поста. Ниже напишу чуть подробнее про Python и SQL
Английский необходим!
Как минимум, технический английский, на уровне чтения документации и профессиональных книг, — абсолютная необходимость. В этой сфере особенно: всё слишком быстро меняется. На русский язык все важные книги просто не будут успевать переводить, а многие критически важные библиотеки — даже и не будут пытаться. Поэтому, пока вы не способны читать упомянутые книги в оригинале, у вас вряд ли получится эффективно изучать data science. Хорошая новость: техническая терминология намного уже нормального разговорного языка и слэнга. Поэтому выучить английский на необходимом уровне не так уж и сложно. К тому же, знания языка могут пригодиться во многих других сферах, и даже в отпуске.
Этап 6
Углубление и развитие технических навыков
Если предыдущие этапы давали вам навыки, без которых работать ну вообще нельзя, то навыки этого этапа призваны повысить вашу продуктивность или повысить качество решаемых задач, повысить самостоятельность при запуске разработанных моделей машинного обучения в продакшн.
-
Python на хорошем уровне: декораторы, уверенное знание классов и наследования, изучение базовых классов, dunderscore __методы__ .
-
Уверенное пользование bash, понимание основ linux
-
Полезно изучить основы docker
Все эти вещи можно было бы учить и раньше. Но, как правило, раньше их знать просто не нужно. Т.к. вы больше будете страдать от нехватки других навыков, приведенных в предыдущих этапах.
Другие области машинного обучения
В какой-то момент вам может потребоваться выйти из сферы подготовки прогнозных моделей или изучения и объяснения данных (кластеризация, EDA и визуализация). Это может быть связано как с вашими интересами, так и с проектами на работе. Например, это могут быть рекомендательные системы. Наверное, базовые рекомендательные алгоритмы можно изучать и одновременно с основами машинного обучения, т.к. знание одного не является обязательным для знания другого. Но логичнее переходить к ним, когда вы уже разобрались с основными алгоритмами обучения прогнозирования и кластеризации: скорее всего, этого от вас будут ожидать любые коллеги до тех пор, как вы включитесь в работу над рекомендательными системами.
Нейронные сети
Начиная с этого этапа имеет смысл изучать нейронные сети как следует с тем, чтобы применять их на пратике. Неэффективно изучать их раньше, т.к. многие задачи эффективно можно решить другими методами. И пока ваши данные и прогнозы изначально числовые, обычно «классическими» методами их решать эффективнее.
Подробнее в этапы изучениях нейронных сетей вдаваться не стану: эта тема требует отдельной статьи. И потратить на них можно от 50, чтобы решать самые простейшие задачи, до сотен часов, чтобы решать задачи связанные с обработкой неструктурированных данных или с обучением сложных моделей.
Личные качества
Хороший аналитик данных — это не только метрики и отчеты. Вне зависимости от профиля, классный специалист должен обладать гибкими навыками, которые нужны для продуктивной работы:
Системное мышление и логика
Важно уметь анализировать, синтезировать, сравнивать и делать выводы из порой неочевидных закономерностей
Аналитик должен понимать, из каких предпосылок он исходит в своих суждениях, и проверять их корректность.
Внимание к деталям, методичность и рациональный скептицизм. Все результаты анализа должны быть проверены, перепроверены и обоснованы
Лучше уточнить непонятные детали и усомниться даже в самом авторитетном мнении, чем запустить ненужный продукт.
Вежливость, навыки общения и повествования
Аналитики общаются со специалистами из разных направлений: бизнес, ИТ, бухгалтерия и безопасность. Важно сохранять конструктивный и вежливый подход, не поддаваться на провокации и лоббировать интересы своего отдела.
Терпение. Пригодится при очередном письме «концепция изменилась, давайте посчитаем заново».
Прагматизм и деловой подход. Важно концентрироваться на тех вопросах, которые позволят улучшить показатели работы компании: увеличить доходы, сократить затраты, оптимизировать процессы.
Стремление учиться. Хороший аналитик любит узнавать новое и расширять свой кругозор.
Что должен знать и уметь аналитик данных
Такой специалист формулирует гипотезы, проводит статистические тесты на существующих данных для решения текущих вопросов, на которые нет ответа.
Минимальный набор скиллов начинающего аналитика:
- Работать в Google-таблицах, группировать, фильтровать данные — на ходу, без перекладывания из таблички в табличку.
- Уметь писать SQL-запросы.
- Изучить минимум один язык программирования: Python или R.
- Делать выводы и представлять результаты в виде интерактивных дашбордов (Tableau, Power BI).
- Разбираться в бизнес-процессах и понимать ключевые метрики анализа эффективности.
Инструменты, которые используют аналитики
Основные навыки аналитика данных:
- Сбор и анализ требований заказчиков к отчетности.
- Получение данных с помощью языка запросов SQL.
- Применение в работе ключевых математических методов и основ статистики.
- Очистка и трансформация данных с помощью Python.
- Прогнозирование событий на основе данных.
- Анализ результатов кампаний, исследований и тестирования продуктовых гипотез.
- Способность создавать аналитические решения и представлять их бизнесу
А еще хорошие аналитики данных умеют работать с Big Data, проверять гипотезы с помощью подходов А/Б-тестирования и быть настоящими исследователями.
Большинство работодателей просят посчитать определенные метрики, например, какие товары чаще всего возвращают покупатели. Иногда нужно рассчитать инвестиционный потенциал и скорректировать бизнес-модель.
Зарплата аналитика
Финансовые, инвестиционные аналитики, аналитики компьютерных систем, как правило, могут похвастаться достаточно высоким уровнем заработка. Несколько меньше получают спортивные аналитики. Хотя в целом зарплата такого специалиста зависит от того, в какой организации он трудится, и какими финансовыми потоками она оперирует.
Карьерный рост
Аналитик может возглавить проект, получить управляющую должность и дойти до высших уровней менеджера организации – если ему это нужно. Либо он может повышать профессионализм в своей работе и, соответственно, уровень зарплатных ожиданий и требований.
Профессиональные знания
- Микроэкономика, макроэкономика, международная экономика.
- Бухгалтерский анализ и учет, налоговый учет.
- Эконометрика.
- Макроэкономическое планирование и прогнозирование.
- Социологические теории.
- Правила проведения маркетинговых исследований.
- Социология управления.
- Социология прогнозирования.
- Высшая математика.
- Правила использования современного программного обеспечения для проведения исследований.
Известные аналитики
- Роберт Спингэрн, специалист из швейцарского финансового конгломерата «Credit Suisse», работающий преимущественно с рынком вооружений и аэрокосмическим рынком.
- Роберт Сэмпл, также сотрудник «Credit Suisse», посоветовавший приобрести акции Apple за два с половиной года до роста их стоимости на 450%.
- Джеймс Макилри, один из ведущих аналитиков Уолл-Стрит.
Немного истории
Понятие системного анализа появилось в 20 веке. Первым термин стали употреблять в 1948 году в американской компании Rand, а в 1956 году опубликовали книгу, в которой разъяснялся и сам термин, и специфика. Через три года после выхода книги, американцами Роем Наттом и Флетчером Джонсом была основана компания Computer Sciences Corporation. В разработке ПО начали использовать принципы системного анализа.
IT-технологии развивались. Системным анализом заинтересовались представители бизнеса. В 1976 году появилась Waterfall для оптимизации разработки ПО.
В Советском Союзе первые ЭВМ появились спустя четыре года, а развитие информационных технологий – еще спустя десятилетие. Персональные компьютеры в России начали использовать в 90-х годах. Тогда и возникла нужда в специалистах, но кадров не было. Первые системные аналитики в пост-советском государстве появились только в 2000-х – гении-самоучки, «штучный товар». Только с 2015 года в России внятно обозначили такую профессию, которая оказалась крайне востребованной в период бурного развития IT-системы. Специалисты такого профиля необходимы для поддержания конкурентоспособности компаний.
Где учат на аналитиков
Профессию аналитика получают на направлениях, связанных с информатикой, математикой, программированием. Эти направления есть практически во всех ведущих вузах страны.
Список вузов от редакции: МГУ им. М.В. Ломоносова — факультет вычислительной математики и кибернетики, направление «Прикладная математика и информатика».
СПБГУ — направления «Математика и компьютерные науки», «Математика, алгоритмы и анализ данных», «Прикладная математика и информатика», «Прикладная математика, фундаментальная информатика и программирование», «Программирование и информационные технологии», «Системный анализ и прикладные компьютерные технологии».
НИУ ВШЭ — направления «Экономика и статистика», «Бизнес-информатика», «Прикладная математика и информатика».
Национальный исследовательский университет МЭИ — Институт автоматики и вычислительной техники, направление «Прикладная математика и информатика».
Национальный исследовательский технологический университет МИСиС — факультет «Информатика и вычислительная техника».
Московский политехнический университет — факультет информационных технологий, направление «Прикладная информатика (большие и открытые данные)», «Прикладная математика и информатика», «Бизнес-информатика (IT-менеджмент)».
Московский технический университет связи и информатики (МТУСИ) — факультет экономики и управления (ФЭУ), направление «Прикладная информатика».
Финансовая академия при правительстве России — направления «Прикладная математика и информатика», «Бизнес-информатика», «Прикладная информатика».
Кто такой системный аналитик
Специалист занимается разработкой IT-системы для ведения бизнес-процессов.
В обязанности работника входят:
- сбор и анализ требований, предъявляемых заказчиком;
- согласование и управление изменениями, с учетом данных мониторинга;
- подготовка проекта и составление документации – технической и пользовательской;
- отсеивание ненужной информации;
- презентация для заказчика;
- качественная связь между командой исполнителей и заказчиком.
Специалист владеет базовыми компьютерными знаниями, умеет выделять подсистемы и функции, проводит анализ, находит решения с учетом требований и использует навыки моделирования.
Системный аналитик постоянно в информационном море, из которого берет требуемые данные по аналитике рынка и других важных сфер для успешного ведения бизнеса. Поэтому специалист не может обойтись без soft skills.
Soft skills – это комплекс неспециализированных качеств, существенно влияющих на профессиональную деятельность.
К умениям soft skills относят:
- коммуникативные навыки;
- способность слушать и слышать собеседника;
- отстаивание собственной позиции;
- организаторские и лидерские способности, позволяющие подобрать команду, поставить четкие задачи и грамотно распределить обязанности;
- четкое планирование с осознанием пошагового процесса достижения цели.
Овладение soft skills позволяет добиться оптимизации рабочего процесса, повышения производительности.
Кто такой аналитик
Аналитик — специалист, который занимается обработкой данных и составлением на их основе прогнозов, стратегий, планов и рекомендаций клиентам.
Существует несколько профессий, в названии которых также есть слово «аналитик» — финансовые аналитики, программные аналитики, системные аналитики. Все они занимаются анализом той или иной информации, но не обязательно используют в своей деятельности математику, статистику и языки программирования. Их нужно отличать от отдельной профессии «аналитик данных».
Аналитик данных должен хорошо разбираться в математике, статистике, информатике, компьютерных науках, бизнесе и экономике.
Данные, которые обрабатывает аналитик, зависят от сферы деятельности, которой он занимается. Например, аналитик в области рекламы определяет целевую аудиторию для рекламных кампаний: составляет алгоритм, с помощью которого ищет в базах данных информацию о потенциальных клиентах, анализирует рекламные стратегии с точки зрения отклика, оценивает показатели эффективности кампаний.
Где получить знания в области обработки данных
Вузы
К сожалению, пока что в вузах очень мало обучают анализу данных. Есть несколько исключений:
- Факультет компьютерных наук в Высшей Школе Экономики
- Факультет инноваций и высоких технологий в МФТИ
- Магистерская программа «Большие Данные» на факультете ВМиК МГУ
- Магистерская программа по большим данным в СПБГУ
Конечно, и в других учебных программах также освещаются те или иные аспекты работы с данными. Но вузовские программы, которые готовят специалистов комплексно, на этом фактически исчерпываются. Неудивительно: отрасль совершенно новая, специалистов и преподавателей нет. Вузы, где все-таки вводятся программы по обработке данных, обычно делают это в сотрудничестве с крупными компаниями (например, «Яндексом»).
Некоммерческие курсы дополнительного образования
Так как на рынке наблюдается острый дефицит кадров – некоторые компании создают собственные учебные центры. Здесь может учиться любой желающий – нужно только сдать экзамены.
В этой категории можно смотреть на следующие курсы:
- Школа Анализа Данных «Яндекса» – самый старый и самый известный центр подготовки кадров в области анализа данных. Занятия ведут сотрудники «Яндекса», а также преподаватели лучших вузов страны. Программа рассчитана на 2 года.
- Техносфера Mail.Ru и факультета ВМиК МГУ – во многом аналогичная программа от второго интернет-гиганта, Mail.Ru. Также рассчитаная на 2 года.
- Технопарк Mail.Ru и МГТУ им. Баумана – в отличие от «Техносферы», эти курсы больше рассчитаны на подготовку системных инженеров, однако курсу по анализу данных там тоже нашлось место. Срок обучения – 2 года.
- Центр компьютерных наук – совместный проект Школы Анализа Данных «Яндекса», компании Jet Brains и школы №239 в Санкт-Петербурге. Срок обучения – также 2 года.
- Петербургская школа данных– цикл лекций, посвященный большим данным, в Петербурге. Проект компании E-Contenta.
Коммерческие курсы
Есть несколько коммерческих программ, позволяющих расширить свой кругозор в области анализа данных. Их отличительные черты – короткий срок обучения и большая направленность на прикладное применение технологий.
Тут можно вспомнить следующие проекты:
- Курс Специалист по большим данным» от «Лаборатории Новых Профессий». Длится 3 месяца, состоит из 2 модулей, первый из которых посвящен технологиям больших данных и машинному обучению, а второй –рекомендательным системам. Стоимость курса – 180 тысяч рублей, предусмотрены различные скидки и рассрочки.
- Школа данных Билайна» – курс, в первую очередь, посвящен Machine Learning Продолжительность обучения – 9 недель, стоимость – 100 тысяч рублей.
Онлайн-образование
В последнее время отрасль онлайн-образования переживает настоящий бум, и на ресурсах вроде Coursera, Edx, Stepic и Udacity можно найти огромное число курсов по обработке данных. Большинство – англоязычные (кстати, знание английского языка очень полезно в нашей области), но есть и несколько русскоязычных:
- Специализация «Машинное обучение и анализ данных» на Coursera;
- «Введение в машинное обучение» на Coursera;
- «Анализ данных в R» на Stepic.
Обязанности аналитика данных
Рабочие задачи Data Analyst находятся на стыке математики, программирования и продакт-менеджмента. В результате его работы компания может получать больше прибыли и делать пользователей счастливее. Обязанности аналитика данных могут различаться в зависимости от места работы и уровня квалификации.
Как правило, такой специалист проводит статистические тесты и решает бизнес-проблемы, на которые пока ответа нет. Затем составляет прогнозы, стратегии, планы и рекомендации.
Чем обычно занимается аналитик данных:
- Общается с представителями бизнеса и выявляет проблемные места компании.
- Собирает информацию.
- Составляет гипотезы для улучшения определенных показателей.
- Готовит данные к проведению анализа: сортирует, фильтрует и делает выборку.
- Находит закономерности.
- Визуализирует данные: переводит статистику и Big Data в понятные выводы и наглядные графики.
- Предлагает решения, которые используются для развития проекта или бизнеса.
На основе данных, предоставленных Data Analyst, компания может принимать любые бизнес-решения.
Кто ты в анализе данных? Десять ролей в команде дата-аналитиков
Рынок Big data в России
В 2017 году мировой доход на рынке big data должен достигнуть $150,8 млрд, что на 12,4% больше, чем в прошлом году. В мировом масштабе российский рынок услуг и технологий big data ещё очень мал. В 2014 году американская компания IDC оценивала его в $340 млн. В России технологию используют в банковской сфере, энергетике, логистике, государственном секторе, телекоме и промышленности.
Что касается рынка данных, он в России только зарождается. Внутри экосистемы RTB поставщиками данных выступают владельцы программатик-платформ управления данными (DMP) и бирж данных (data exchange). Телеком-операторы в пилотном режиме делятся с банками потребительской информацией о потенциальных заёмщиках.
15 сентября в Москве состоится конференция по большим данным Big Data Conference. В программе — бизнес-кейсы, технические решения и научные достижения лучших специалистов в этой области. Приглашаем всех, кто заинтересован в работе с большими данными и хочет их применять в реальном бизнесе. |
Обычно большие данные поступают из трёх источников:
- Интернет (соцсети, форумы, блоги, СМИ и другие сайты);
- Корпоративные архивы документов;
- Показания датчиков, приборов и других устройств.
Кто такой аналитик данных
Неверные решения при разработке нового продукта или функции сервиса могут стоить компании репутации и денег. Чтобы этого не произошло, компании обращаются к аналитику данных. Он собирает, обрабатывает, изучает и интерпретирует данные: проводит А/B-тесты, строит модели и проверяет, как пользователи и клиенты реагируют на нововведения. Это стоит дешевле и снижает риски бизнеса.
Такие специалисты особенно востребованы в data-driven компаниях — то есть тех, которые ориентируются в решениях на big data и аналитику данных.
Например, специалисты по данным Netflix вычислили популярность сериала «Карточный домик» с помощью аналитики: зрителям оригинального британского «Карточного домика» также нравились фильмы Финчера и (или) картины, где играл Спейси. Netflix объединили Дэвида Финчера (один из режиссеров House of Cards), политические интриги и Спейси в одном проекте. Видеосервис заключил контракт со Спейси и Финчером без съемок пилотной версии. Рейтинг сериала на IMDb и «Кинопоиске» составляет 8,7 и 8,3 соответственно.
Принципы эффективного обучения
Эффективный учебный план. Хороший план позволяет вам учить вещи в таком порядке, чтобы каждая новая вещь базировалась на уже полученных знаниях. И, в идеале, он идёт по спирали, постепенно углубляя знания во всех аспектах. Потому что учить теоретически математику, без интересных примеров применения — неэффективно. Именно это является одной из проблем плохого усваивания материалов в школе и институте.
Учебный план — это именно та вещь, которую без опыта составить труднее всего. И именно с этим я стараюсь помочь.
Следует концентрироваться на понимании главных принципов — это легче, чем запоминать отдельные детали (они часто оказываются не нужны)
Особенно важно это становится, когда вы учите язык программирования, тем более свой первый: не стоит зубрить правильное написание команд («синтаксис») или заучивать API библиотек.
Это вторая вещь, с которой я хочу помочь — разобраться, что важно, а на что не следует тратить много времени.
Для менеджеров и руководителей:
1. A crash course in Data Science на Coursera
Для кого этот курс: этот курс — первый из пяти курсов группы Executive Data Science («Большие данные для руководителей»), разработанный в университете Джона Хопкинса. Он предназначен для тех, кто хочет быстро разобраться в том, что такое большие данные и где можно их применять.
Слушатели изучат основные термины и инструменты, которые используют дата-аналитики, и способы оценки успешности data science-проектов. Для этого у них будут видеолекции и материалы для самостоятельного изучения. Курс идет на английском, но есть субтитры на русском языке.
Продолжительность: 1 неделя, 4-6 часов.
Даты: курс стартовал 20 августа, но на него еще можно записаться.
Стоимость: первый курс — бесплатно. Для обучения на следующем курсе придется заплатить 2468 рублей за месяц. Этого хватит на все оставшиеся четыре курса — каждый из них длится неделю.
2. Курс Business Analytics в Udacity
Для кого этот курс: для новичков. Здесь они смогут получить навыки анализа больших данных и изучить инструменты, которые помогут в любой области: будь то инженерное дело, продажи, маркетинг или что-то еще. В рамках программы они изучат Excel, SQL и Tableau, и научатся анализировать данные для того, чтобы принимать лучшие стратегические решения.
Программа является подготовительной для двух других курсов Udacity — Data Analyst и Business Analyst Nanodegree programs. Студентам доступны видеолекции, текстовые инструкции и консультации менторов. Обучение ведется на английском.
Продолжительность: 3 месяца, 10 часов в неделю. После окончания программы студентам дается еще около 4 недель (130 часов) на завершение всех проектов.
Даты: запись открывается 21 августа.
Стоимость: 599 долларов (около 40 тысяч рублей).
Школы анализа данных
Для кого этот курс: для тех, кто хочет научиться применять инструменты Big Data в зависимости от индустрии и конкретной бизнес-задачи. Среди основных тем: как повысить продажи, управлять лояльностью, рисками, предсказывать эффективность кандидата для HR-менеджеров, делать банковский скоринг и т. д.
Продолжительность: 5 недель, 10 занятий.
Даты: 28 августа.
Стоимость: 100 тысяч рублей.
на «Нетологии»
Для кого этот курс: для коммерческих директоров, директоров по маркетингу, а также руководителей и владельцев бизнеса. В рамках курса они должны научиться исследовать рынок и выявлять тренды, прогнозировать продажи, проводить сегментацию клиентов, а также набирать команду для проектов с использованием больших данных и ставить задачи для разработчиков.
Программа состоит из нескольких блоков: BI аналитика в Tableu (построение дашбордов и интерактивных отчетов), data-driven менеджмент (разработка стратегии улучшения бизнес-процессов на основе этих отчетов), продуктовая аналитика, машинное обучение для бизнеса и др. Лекцию в рамках программы читает директор по маркетингу сервисов компании «Яндекс» Андрей Себрант.
Для дипломной работы потребуется спроектировать аналитическую структуру для своей компании или отдельного продукта/проекта, а также настроить дашборды в BI Tableau Software по ключевым метрикам. После окончания программы обещают помощь в трудоустройстве.
Продолжительность: 8 недель. Занятия проходят офлайн в кампусе Нетологии дважды в неделю по три часа. Видеозапись и материалы после каждого занятия добавляются в личный кабинет участника.
Даты: 23 августа — 14 октября.
Стоимость: 100 тысяч рублей.
Продолжительность: 5 недель, 10 занятий.
Даты: с 28 августа.
Стоимость: 100 тысяч рублей.
5. Курс «Специалист по большим данным 9.0» от «Лаборатории Новых Профессий»
Для кого этот курс: Для разработчиков, аналитиков и продакт-менеджеров. Курс состоит из двух модулей, первый из которых посвящен технологиям больших данных и машинному обучению, а второй – рекомендательным системам для e-commerce, медиа, соцсетей, банкинга и рекламы.
Продолжительность: три месяца. Курс достаточно интенсивный: лекции и мастер-классы проходят три раза в неделю по три часа, для решения лабораторных работ надо еще минимум 5-7 часов в неделю. При желании можно заниматься онлайн.
Даты: 20 сентября — 11 декабря.
Стоимость: 200 тысяч рублей, при оплате в августе — 170 тысяч рублей.
[править] Сотрудничество с вузами
В 2007 году при поддержке ШАД на базе МФТИ была создана кафедра анализа данных. Для студентов Физтеха обучение начинается на 3-4 курсах бакалавриата, магистерская программа доступна всем желающим.
Весной 2014 года Высшая школа экономики и Яндекс открыли факультет компьютерных наук. Преподаватели ШАД и сотрудники компании участвуют в создании учебного плана, ведут занятия для студентов.
С сентября 2011 года ШАД сотрудничает с факультетом прикладной математики и информатики Белорусского государственного университета. В 2014 году на ФПМИ БГУ стартовала магистерская программа по направлению «Алгоритмы и системы обработки больших данных».
Программа Школы анализа данных и магистратуры механико-математического факультета МГУ действует с 2012 года. Для обучения по ней требуется одновременно поступить в ШАД и в магистратуру университета по специальности «Компьютерная алгебра».
УРФУ
С сентября 2017 года в рамках направления «Компьютерные науки» открыта совместная магистратура ШАДа и Уральского федерального университета в Институте естественных наук и математики по траектории «Анализ данных».
ННГУ
Ряд дисциплин института информационных технологий, математики и механики Нижегородского государственного университета преподаётся с использованием материалов ШАД. В 2018 году в ННГУ запущена магистерская программа «Когнитивные системы», учебный план и материалы которой подготовлены при участии преподавателей Школы анализа данных Яндекса.
РЭШ
В 2019 году ШАД и Российская экономическая школа создали программу подготовки специалистов, обладающих одновременно навыками экономического моделирования и анализа данных. При прогнозировании в дополнение к классическим моделям машинного обучения они смогут учитывать экономические факторы, поведение людей, строение сложных экосистем.
ИТМО
Магистерская программа «Аналитика данных» открылась в Университете ИТМО в 2020 году при содействии Яндекса. Студентов учат создавать, адаптировать и применять методы анализа данных к разным предметным областям, используя машинное обучение, анализ временных рядов, компьютерное зрение, интеллектуальный анализ изображений, звуков и текстов на естественном языке.
ЕУ СПб
Осенью 2020 года Европейский университет в Санкт-Петербурге и Яндекс запустили программу профессионального образования «Пандан» (Прикладной анализ данных). В рамках образовательного цикла выпускники гуманитарных и общественных специальностей узнают больше о количественном повороте в своих и смежных областях, а выпускники технических направлений получат представление о проблемах в общественных науках.
СПбГУ
При участии Яндекса и СS-центра в Санкт-Петербургском государственном университете был создан факультет математики и компьютерных наук.
ЦЕРН
ШАД — участник совместных экспериментов с LHCb и ЦЕРН по применению возможностей машинного обучения и анализа данных в задачах физики высоких энергий.
Инструменты
SQL. Язык программирования, используемый для создания и управления данными в реляционной базе данных
MongoDB. Документоориентированная система управления базами данных
Hadoop. Программа для хранения и обработки массивов информации
Python. Один из наиболее распространенных языков программирования
Pandas. Библиотека для обработки и анализа данных
NumPy. Библиотека с открытым исходным кодом для Python
MapReduce. Модель распределенных вычислений
Optimizely. Платформа для проведения A/B-тестирований
Чарльз Делекторских
Fullstack-разработчик
Новичку проще всего трудоустроиться в небольшие компании, которые более лояльно относятся к отсутствию опыта. С течением времени можно будет пробоваться на более выгодные вакансии и расти профессионально.
Крупные работодатели также нередко приглашают в команду новичков, но сперва на позиции стажеров.
Если аналитик данных живет в регионе, он может попытаться подать резюме в столичную компанию – благо, специальность позволяет при необходимости работать дистанционно.
— Чарльз Делекторских Fullstack-разработчик
Выбор между колледжем ВУЗом магистратурой
Несправедливо утверждение, что бакалавры априори имеют больше шансов устроиться в аналитический отдел, чем колледжисты. А магистраты «обречены» на должность старшего специалиста, пока держатели бакалаврского диплома осваивают должность младшего сотрудника. Но практика трудоустройства наших выпускников демонстрирует более выгодное положение специалистов с высшим образованием.
Колледж станет отличным полем для быстрого старта: не придется пропускать год из-за высокого конкурса на экономические специальности. Бакалавриат — оптимальный путь для тех, кто окончательно определился с предпочтением финансового анализа. Магистратуру стоит выбрать носителям экономической профессии, не связанной с валютным/денежным рынком. Такой подход значительно расширит перспективное поле работы студента.
Чем занимается игровой аналитик
Придумать иерархию метрик — создать общую концепцию процесса аналитики
Нужно понимать, что отслеживать в первую очередь, буквально в режиме онлайн, а на что обращать внимание уже в сессии анализа. Понимать, какие метрики в зависимости от жанра игры и вида монетизации важны, а какие только отнимают время.
Контролировать целостность данных
Находить аномалии, разбираться, почему они появились. Понимать, когда небольшие погрешности происходят из-за особенностей инструментария, а когда нужно пересобирать процесс получения данных.
Участвовать в построении воронки событий в игре. Раскладывать все события на этапы, отслеживать, какие из них и как влияют на эмоции игрока, как это сказывается на монетизации проекта.
На основе данных создавать гипотезы — как изменить игровой процесс, экономику, баланс, механику игры, чтобы это затягивало игроков лучше, вызывало у них нужные эмоции и в итоге приносило больше денег.
Проверять эти гипотезы с помощью A/B-тестирования.
Формировать отчёты для геймдизайнеров, маркетологов, продюсеров, делать это визуально грамотно, структурировано и понятно.