Roadmap продуктового аналитика с нуля: план подготовки

Общий план

Как распределить время

Ориентировочные фазы для человека, который учится параллельно с работой или другими занятиями (~2–3 часа в день).

Месяц 1–2

SQL: от базового до оконных функций
Python: основы + pandas
Описательная статистика

Месяц 3–4

Теория вероятностей
Инференциальная статистика
A/B тесты: теория и расчёты

Месяц 5–6

Продуктовые метрики
Продуктовое мышление
BI: Tableau / Superset

Месяц 7–9

Первый pet-проект
Разбор кейсов
Подготовка к интервью

Блок 01

SQL

Фундамент №1. Без уверенного SQL нельзя пройти даже скрининг в любой IT-компании. На практике 80% работы аналитика — это SQL.

🔍

1.1

Основы: SELECT, фильтрация, агрегация

Базовые конструкции, без которых не написать ни одного запроса

Обязательно Неделя 1–2

SQL — декларативный язык: вы описываете что хотите получить, а не как это вычислить. Вся работа строится вокруг таблиц. Начните с одной таблицы, потом переходите к связям между ними.

Что изучить

SELECT, FROM, WHERE — фундамент любого запроса

ORDER BY, LIMIT — сортировка и ограничение

GROUP BY + HAVING — агрегация с условиями

COUNT, SUM, AVG, MIN, MAX — агрегатные функции

DISTINCT — уникальные значения

IN, BETWEEN, LIKE, IS NULL — операторы фильтрации

CASE WHEN — условная логика прямо в запросе

Типы данных — INT, VARCHAR, DATE, BOOLEAN, FLOAT

// На что обратить внимание

Порядок выполнения SQL: FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY → LIMIT. Это не порядок написания! Понимание этого спасёт от многих ошибок. Особенно важно: WHERE фильтрует ДО агрегации, HAVING — ПОСЛЕ.

🎤 Вопросы на собеседовании

Напишите запрос: найдите топ-5 категорий товаров по сумме выручки за последние 30 дней.
В чём разница между WHERE и HAVING? Приведите пример, когда нужен именно HAVING.
Как посчитать долю пользователей, совершивших более одной покупки, от всех пользователей?
Найдите дни, в которые количество заказов было выше среднего по всему периоду.

📚 Материалы и практика на new-lvl.pro

ТренажёрSQL-тренажёр: 20 бесплатных задач в браузере→ Статья10 SQL-задач уровня собеса в Яндекс и Авито→

Критически важно · Спрашивают всегда

🔗

1.2

JOIN'ы, подзапросы и CTE

Работа с несколькими таблицами — основа реальных задач

Обязательно Неделя 3–4

В реальных задачах данные всегда распределены по нескольким таблицам: пользователи, заказы, события, товары. JOIN — инструмент, который их связывает. Без глубокого понимания JOIN'ов вы не сможете решать практические аналитические задачи.

Что изучить

INNER JOIN — только совпадения с обеих сторон

LEFT / RIGHT JOIN — все строки из одной таблицы + совпадения

FULL OUTER JOIN — все строки из обеих таблиц

SELF JOIN — таблица джойнится сама с собой

Подзапросы в WHERE, FROM, SELECT

CTE (WITH ... AS) — именованные подзапросы

UNION и UNION ALL — объединение результатов

Декартово произведение — когда JOIN без условия это плохо

// Главная ловушка

При LEFT JOIN NULL в колонке правой таблицы означает «нет совпадения». Это самая частая ошибка: люди фильтруют по колонке правой таблицы в WHERE — и случайно превращают LEFT JOIN в INNER JOIN. Правило: условия на правую таблицу LEFT JOIN пишутся в ON, не в WHERE.

🎤 Вопросы на собеседовании

Найдите пользователей, которые зарегистрировались, но ни разу не совершили покупку.
В чём разница между INNER JOIN и LEFT JOIN? Когда какой использовать?
Посчитайте конверсию из просмотра карточки товара в покупку по каждой категории. Данные в разных таблицах.
Когда лучше использовать CTE вместо подзапроса? Есть ли разница в производительности?
Найдите пары пользователей, которые купили одинаковые товары (SELF JOIN).

📚 Материалы и практика на new-lvl.pro

Статья8 SQL-задач с собеса в BigTech→ ТренажёрSQL-тренажёр: JOIN, подзапросы, CTE на практике→

Критически важно · Задача на JOIN — стандарт любого SQL-интервью

🪟

1.3

Оконные функции (Window Functions)

То, что отличает джуна от мидла в SQL

Обязательно для middle Неделя 5–6

Оконные функции выполняют вычисления по набору строк, связанных с текущей строкой, без схлопывания таблицы. В отличие от GROUP BY, строки в результате сохраняются. Это главный инструмент для когортного анализа, расчёта накопительных метрик, ранжирования.

Синтаксис

функция() OVER ( PARTITION BY колонка -- аналог GROUP BY внутри окна ORDER BY колонка -- порядок строк внутри раздела ROWS BETWEEN ... -- размер фрейма (опционально) )

Что изучить

ROW_NUMBER() — уникальный порядковый номер

RANK() / DENSE_RANK() — ранг с пропусками и без

LAG() / LEAD() — значение из предыдущей / следующей строки

SUM/AVG OVER PARTITION — накопительные и скользящие итоги

FIRST_VALUE() / LAST_VALUE()

NTILE(n) — разбивка на квантили (децили)

ROWS BETWEEN / RANGE BETWEEN — фреймы окна

Разница RANK vs DENSE_RANK vs ROW_NUMBER

// Самые частые задачи с оконными функциями

Найти первую/последнюю покупку пользователя (ROW_NUMBER + PARTITION BY user_id ORDER BY date). Посчитать скользящее среднее за 7 дней. Найти разницу между текущим и предыдущим значением (LAG). Определить, какой % пользователей сделал повторную покупку в течение 30 дней после первой.

🎤 Вопросы на собеседовании

Для каждого пользователя найдите время между первой и второй покупкой.
Посчитайте скользящее среднее выручки за предыдущие 7 дней для каждого дня.
Пронумеруйте заказы каждого пользователя в хронологическом порядке. Найдите всех, у кого более 3 заказов.
Разбейте пользователей по децилям по сумме их покупок. Какой процент выручки даёт топ-10%?
В чём разница между PARTITION BY и GROUP BY?

📚 Материалы и практика на new-lvl.pro

СтатьяОконные функции: ROW_NUMBER, RANK, LAG, LEAD→ КарточкиШпаргалка по оконным функциям SQL→ СтатьяКогортный анализ: SQL-запрос и интерпретация→ ТренажёрSQL-тренажёр: задачи на оконные функции→

Критически важно · Оконные функции — стандарт middle-уровня

⚡

1.4

Продвинутый SQL: оптимизация и аналитические паттерны

DATE-функции, работа с NULL, аналитические паттерны и основы оптимизации

Важно Неделя 7–8

В реальных задачах постоянно работаешь с датами (когортный анализ, retention), пропущенными значениями и нужно уметь строить сложные аналитические паттерны: воронки, когорты, сессии.

Что изучить

DATE_TRUNC, DATE_DIFF, EXTRACT — работа с датами

COALESCE, NULLIF, IFNULL — обработка NULL

STRING_AGG, ARRAY_AGG — агрегация в строку/массив

Когортный анализ через SQL — GROUP BY cohort_month

Сессии через LAG + условие — sessionization

EXPLAIN ANALYZE — план выполнения запроса

Индексы — зачем нужны и как влияют на скорость

ClickHouse vs PostgreSQL — ключевые отличия синтаксиса

🎤 Вопросы на собеседовании

Постройте когортный анализ: для каждой когорты (месяц регистрации) посчитайте retention на 1-й, 2-й, 3-й месяц после регистрации.
Ваш запрос работает 10 минут на 100 млн строк. Что вы будете делать?
Как определить сессию пользователя, если сессия — это последовательность событий с перерывами менее 30 минут?
Чем ClickHouse отличается от PostgreSQL и в каких задачах лучше использовать каждый?

📚 Материалы и практика на new-lvl.pro

СтатьяRFM-сегментация в SQL за 30 минут→ СтатьяВоронка продукта: drop-off и SQL-запросы→ СтатьяRetention: виды, SQL-запрос, интерпретация→ Статья8 SQL-задач с собеса в BigTech→ ТренажёрSQL-тренажёр: продвинутые задачи (Premium)→

Важно · Спрашивают на middle-позиции

Блок 02

Python для анализа данных

Второй ключевой инструмент. Python нужен для анализа, статистических тестов, автоматизации и работы с большими объёмами данных, которые не уместить в SQL.

🐍

2.1

Основы Python и pandas

Базовый синтаксис и главная библиотека для работы с табличными данными

Обязательно Недели 3–6

Pandas — Excel на стероидах. DataFrame позволяет делать всё то же, что и SQL, но с большей гибкостью и возможностью автоматизации. Главное: не учить pandas в отрыве от реальных задач — сразу практикуйте на датасетах.

Основы языка

Типы данных — list, dict, set, tuple, str, int, float

Управляющие конструкции — if/elif/else, for, while, list comprehensions

Функции — def, lambda, *args, **kwargs

Работа с файлами — open(), CSV, JSON

pandas: ключевые операции

.loc / .iloc — индексация по метке и позиции

groupby() + agg() — агрегация по группам

merge() / join() — аналог SQL JOIN'ов

pivot_table() — сводные таблицы

fillna() / dropna() — работа с пропусками

apply() + lambda — применение функции к колонке

pd.to_datetime() + .dt — работа с датами

value_counts(), nunique() — быстрый анализ

🎤 Вопросы на собеседовании

В чём разница между .loc и .iloc? Когда каждый использовать?
Как посчитать retention в pandas без SQL? Опишите подход через groupby и merge.
У вас DataFrame с 10 млн строк. groupby работает медленно. Как ускорить?
Как объединить два DataFrame: один с покупками, другой с пользователями? Что делать с дубликатами?

📚 Материалы и практика на new-lvl.pro

СтатьяPython для аналитика: pandas за 30 минут→ ТренажёрPandas-тренажёр: задачи прямо в браузере→

Критически важно

📊

2.2

Визуализация и статистические библиотеки

matplotlib, seaborn, scipy, statsmodels — для анализа и тестов

Важно

Визуализация — не просто «красивые графики». Это инструмент понимания данных и коммуникации результатов. Первый шаг любого анализа — смотреть на данные, а не сразу считать цифры.

Что изучить

matplotlib — базовые графики, настройка осей

seaborn — histogram, boxplot, heatmap, pairplot

plotly — интерактивные графики для презентаций

scipy.stats — t-тест, z-тест, chi-square, Mann-Whitney

statsmodels — линейная регрессия, временные ряды

numpy — массивы, векторизация, random

# Быстрый разведочный анализ — стартовый шаблон import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df.describe() # базовая статистика df.info() # типы данных, пропуски df.isnull().sum() # считаем пропуски # Гистограмма распределения sns.histplot(df['revenue'], bins=50, kde=True) # Boxplot для сравнения групп sns.boxplot(x='segment', y='revenue', data=df)

📚 Материалы и практика на new-lvl.pro

СтатьяПрогноз продаж: ARIMA vs Prophet vs LightGBM→ ГайдГайд: прогнозирование временных рядов→ ТренажёрPandas-тренажёр: numpy / scipy / визуализация→

Важно · Нужно уметь строить и интерпретировать основные типы графиков

Блок 03

Теория вероятностей и статистика

Математическая основа A/B-тестирования и любого вывода по данным. Без этого невозможно корректно интерпретировать результаты экспериментов.

🎲

3.1

Теория вероятностей

Вероятностные модели, распределения, центральная предельная теорема

Обязательно

Теория вероятностей — язык неопределённости. Понимание распределений и ЦПТ критически важно для понимания того, почему статистические тесты работают именно так.

Что изучить

Условная вероятность, формула Байеса

Дискретные распределения — Бернулли, Биномиальное, Пуассона

Непрерывные распределения — Нормальное, Экспоненциальное, Равномерное

t-распределение, chi-square, F-распределение

Математическое ожидание, дисперсия, СКО

Ковариация и корреляция

ЦПТ (Центральная предельная теорема) — почему большие выборки нормальные

Закон больших чисел

// Особое внимание

ЦПТ — это фундамент всего A/B-тестирования. Поймите её физический смысл: при достаточно большой выборке среднее выборки стремится к нормальному распределению, независимо от исходного распределения данных. Именно поэтому мы можем применять z-тест к конверсиям, даже если исходные данные — это 0 и 1.

🎤 Вопросы на собеседовании

Что такое ЦПТ и почему она важна для A/B-тестирования?
Монету подбросили 100 раз, выпал орёл 60 раз. Можно ли утверждать, что монета нечестная?
Чем отличаются дисперсия и стандартное отклонение? Почему нас чаще интересует СКО?
Что такое распределение Пуассона и где оно применяется в продуктовой аналитике?

📚 Материалы и практика на new-lvl.pro

КарточкиКарточки: статистика для A/B-тестов→ Статьяp-value простыми словами→

Критически важно · Основа для A/B-тестирования

📐

3.2

Инференциальная статистика и статтесты

Доверительные интервалы, гипотезы, p-value, ошибки I и II рода

Обязательно

Это раздел статистики о том, как делать выводы о генеральной совокупности на основе выборки. Именно здесь живут все ключевые концепции A/B-тестирования: p-value, доверительные интервалы, ошибки.

Что изучить

Нулевая и альтернативная гипотезы — H₀ и H₁

p-value — правильная интерпретация (и почему её путают)

Ошибки I рода (α) и II рода (β)

Мощность теста — что такое power и как её считать

Доверительные интервалы — построение и интерпретация

t-тест — одновыборочный, двухвыборочный, парный

Z-тест для пропорций — конверсии и CTR

Mann-Whitney U-тест — непараметрический аналог t-теста

Chi-square тест — категориальные данные

Поправка Бонферрони — множественные сравнения

🎤 Вопросы на собеседовании

Что такое p-value? Что означает p=0.03 для вашего A/B-теста?
Объясните ошибки I и II рода на бизнесовом примере. Какая из них хуже?
Что такое доверительный интервал? Как интерпретировать 95% ДИ [0.02, 0.08]?
Когда использовать t-тест, а когда Mann-Whitney?
У вас 10 метрик в тесте. Как скорректировать порог значимости?

📚 Материалы и практика на new-lvl.pro

Статьяp-value: интерпретация и частые ошибки→ КарточкиМатрица: когда какой стат-тест выбрать→ КарточкиКарточки: статистика для A/B-тестов→

Критически важно · Спрашивают на каждом интервью в BigTech

Блок 04

A/B тестирование

Центральная компетенция продуктового аналитика в IT. На собесах в BigTech этот блок занимает 40–60% технических вопросов.

🧪

4.1

Дизайн и проведение эксперимента

Как правильно спланировать тест до его запуска

Обязательно

80% ошибок в A/B-тестах — это ошибки дизайна, а не анализа. Плохо сформулированная гипотеза, неправильно выбранная метрика или неверно рассчитанная выборка — и весь тест бессмысленен.

Что изучить

Формулировка гипотезы — с механизмом действия

Primary / Secondary / Guardrail метрики

MDE (Minimum Detectable Effect)

Расчёт размера выборки — формула и инструменты

Уровень значимости α и мощность (power)

Рандомизация — хеш user_id, бакеты

AA-тест — проверка рандомизации

SRM (Sample Ratio Mismatch)

Длительность теста — сезонность и полные недели

Peeking problem — почему нельзя останавливать рано

🎤 Вопросы на собеседовании

Как вы рассчитаете размер выборки для теста? Какие параметры нужны?
Что такое MDE? Как выбрать его значение для конкретного теста?
Что такое AA-тест? Зачем он нужен и когда его нужно проводить?
Тест запустили, через 3 дня видим p=0.03. Можно ли останавливать? Почему?
Как выбрать длительность теста? Почему нельзя останавливать в пятницу?
Что такое SRM и что делать, если вы его обнаружили?

📚 Материалы и практика на new-lvl.pro

ГайдГайд: A/B-тесты от гипотезы до решения→ КарточкиЧек-лист запуска A/B-теста: 12 пунктов→ ИнструментКалькулятор размера выборки для A/B→ СтатьяA/A-тесты: зачем нужны и что проверяют→ КвизКвиз: 15 ловушек A/B-тестов→

Критически важно · Главная тема любого интервью в продуктовую аналитику

🚀

4.2

Продвинутые методы: CUPED, Bootstrap, стратификация

Как повысить чувствительность теста и сократить время до результата

Важно для middle

В крупных компаниях (Яндекс, Авито, Ozon) эти методы используются регулярно. Знание CUPED — сильный дифференциатор на собесе. Это показывает, что вы думаете об эффективности экспериментальной платформы.

Что изучить

CUPED — предэкспериментальные данные для снижения дисперсии

Стратификация — балансировка групп по сегментам

Bootstrap — непараметрическое тестирование

Delta-метод — для ratio-метрик (ARPU, CTR)

Sequential testing (mSPRT) — always-valid p-values

Novelty effect — как обнаружить и учесть

Network effects — когда SUTVA нарушен

Switchback experiments — для двусторонних рынков

🎤 Вопросы на собеседовании

Что такое CUPED? Объясните идею своими словами и когда его стоит применять.
Почему для метрики ARPU нельзя просто применить t-тест? Что такое delta-метод?
Как бы вы провели A/B тест для фичи в маркетплейсе, где продавцы и покупатели влияют друг на друга?
Что такое novelty effect? Как вы его обнаружите в данных?
Тест показал рост конверсии +5%, но retention упал на 2%. Что делать?

📚 Материалы и практика на new-lvl.pro

СтатьяCUPED: как ускорить A/B-тест в 1.5–2 раза→ СтатьяDiD: когда A/B нельзя — разность разностей→ СтатьяA/B на маркетплейсе: network effects, SUTVA→ СтатьяКейс: каннибализация в A/B→

Важно · Дифференциатор кандидата уровня middle

Блок 05

Продуктовые метрики

Знание метрик — это то, что позволяет аналитику говорить на одном языке с продуктом и бизнесом. Без этого невозможно ставить правильные вопросы и интерпретировать результаты.

📈

5.1

Engagement, Retention, Воронки

Ключевые метрики здоровья продукта

Обязательно

Это базовый словарь продуктового аналитика. Вас будут спрашивать «как посчитать retention» или «что такое DAU/MAU ratio» на каждом интервью. Знать формулы недостаточно — нужно понимать что они говорят о продукте.

Что изучить

DAU / WAU / MAU — активные пользователи

DAU/MAU ratio (Stickiness) — «прилипчивость» продукта

Retention: Day-1, Day-7, Day-30 — удержание пользователей

Classic vs Rolling Retention — разные способы считать

Churn Rate — отток и его причины

Session length, Frequency, Depth

Воронки: построение и анализ drop-off

Когортный анализ — поведение по времени регистрации

// Типичный кейс на интервью

«DAU вырос на 10%, но retention упал. Что происходит?» — ответ: скорее всего привлекли много новых пользователей (рост DAU), но они не задерживаются (падение retention). Нужно смотреть на когорты: старые пользователи ведут себя так же или хуже?

🎤 Вопросы на собеседовании

Как посчитать Day-7 Retention? Напишите SQL-запрос.
В чём разница между Classic Retention и Rolling Retention? Когда что использовать?
DAU упал на 15%. Как вы будете разбираться в причинах?
Что такое DAU/MAU ratio и что значит значение 20%? А 60%?
Постройте воронку регистрации → активация → первая покупка. Как найти узкое место?

📚 Материалы и практика на new-lvl.pro

СтатьяRetention: как считать, виды, SQL→ СтатьяВоронка продукта: построение и анализ drop-off→ СтатьяКогортный анализ: SQL и визуализация→ КарточкиВоронка AARRR на одной странице→ КарточкиHEART: UX-метрики и продуктовые→

Критически важно

💰

5.2

Юнит-экономика: LTV, CAC, ARPU, Payback

Язык денег — как продуктовые решения влияют на бизнес-модель

Обязательно

Продуктовый аналитик должен понимать, как изменение метрики продукта влияет на деньги. Это требование BigTech — аналитик не просто считает, а понимает бизнес.

Что изучить

LTV (Lifetime Value) — формулы, когортный расчёт

CAC (Customer Acquisition Cost)

LTV/CAC ratio — когда привлечение окупается

ARPU / ARPPU / ARPDAU — средние доходы

Payback Period — срок окупаемости

GMV vs Net Revenue vs Take Rate

Contribution Margin — маржинальность единицы

NPS и CSAT — метрики удовлетворённости

🎤 Вопросы на собеседовании

Как рассчитать LTV? Какие данные нужны и какой горизонт брать?
LTV/CAC = 1.5. Что это говорит о бизнесе? Хорошо это или плохо?
Чем ARPU отличается от ARPPU? Когда важно смотреть именно на ARPPU?
Мы улучшили retention на 5%. Как это влияет на LTV? Посчитайте.

📚 Материалы и практика на new-lvl.pro

СтатьяLTV: формулы, расчёт, SQL и связь с CAC→ СтатьяЮнит-экономика: 5 формул, которые надо знать→ СтатьяМетрики маркетплейса: GMV, take rate→ ИнструментКалькулятор unit-экономики: LTV, CAC, Payback→

Критически важно · Без этого нельзя говорить на языке бизнеса

⭐

5.3

North Star Metric, AARRR, OKR

Фреймворки для выстраивания системы метрик

Важно

Отдельные метрики — это детали. Система метрик — это понимание того, как продукт создаёт ценность. Аналитик должен уметь выстраивать иерархию метрик и объяснять связь между ними.

Что изучить

North Star Metric (NSM) — метрика ценности продукта

AARRR (Pirate Metrics) — Acquisition, Activation, Retention, Revenue, Referral

Leading vs Lagging метрики — опережающие и запаздывающие

Counter-метрики — guardrails против оптимизации узких показателей

OKR — как метрики связаны со стратегией

Дерево метрик — декомпозиция NSM на драйверы

🎤 Вопросы на собеседовании

Как бы вы выбрали North Star Metric для маркетплейса? Для стримингового сервиса?
Что такое leading и lagging метрики? Приведите пример для e-commerce.
Декомпозируйте выручку маркетплейса на драйверы. Как выглядит дерево метрик?
Конверсия в покупку выросла, но NPS упал. Как это возможно и что делать?

📚 Материалы и практика на new-lvl.pro

СтатьяNorth Star Metric: как не выбрать ложную→ СтатьяДерево метрик: от NSM до рычагов команды→ СтатьяКак декомпозировать метрику: фреймворк→ КарточкиВоронка AARRR на одной странице→

Важно · Системное мышление о метриках

Блок 06

Продуктовое мышление и бизнес-логика

Технические навыки — необходимое условие. Но BigTech нанимает аналитиков, которые думают о продукте, а не просто пишут запросы.

🧠

6.1

Продуктовые кейсы и root cause analysis

Как мыслить структурно при работе с продуктовыми проблемами

Обязательно

Продуктовый кейс — это задача вида «метрика упала, разберись почему» или «как бы ты оценил эффект этой фичи». Здесь проверяют структуру мышления, а не знание конкретных формул.

Что изучить

Root Cause Analysis — системный поиск причин аномалий

Декомпозиция метрики — разложить на составляющие

Сегментация — найти где именно проблема

Гипотезы и их приоритизация

Понимание продуктовой воронки

MECE-принцип — взаимоисключающие, исчерпывающие категории

Data-driven решения — от данных к рекомендации

// Структура ответа на кейс «метрика упала»

1. Уточнить: когда упала, насколько, какие метрики ещё изменились. 2. Декомпозировать: метрика = A × B × C — что из них изменилось? 3. Сегментировать: по платформе, гео, когорте, типу пользователя — где локализована проблема? 4. Гипотезы: технические (баг, изменение в трекинге) → продуктовые (изменение фичи) → внешние (конкурент, сезонность). 5. Рекомендация: что проверить в первую очередь и как.

🎤 Вопросы на собеседовании

Выручка упала на 20% вчера вечером. Ваши действия? Какие данные посмотрите в первую очередь?
Конверсия из корзины в заказ упала с 60% до 45%. Как найти причину?
Retention нового онбординга вырос на 3%, но GMV упал на 2%. Запускать или нет?
Как вы оцените влияние нового поискового алгоритма на маркетплейс? Что и как меряете?
Пользователей в приложении стало на 30% больше, но выручка не выросла. Почему?

📚 Материалы и практика на new-lvl.pro

ТренажёрAI-Собеседник: продуктовый кейс в диалоге→ СтатьяФреймворк декомпозиции метрики для кейсов→ СтатьяКейс: выручка упала на 20% — разбор→ СтатьяКейс: DAU вырос, а retention упал→ СтатьяКейс: MAU +22%, revenue плоский→ СтатьяКейс: 0.4% в платное — чиним онбординг→ ИнструментШаблон постановки аналитической задачи→ КвизКвиз: «Метрика упала на 20% — твои действия?»→

Критически важно · Кейсовые вопросы есть на каждом финальном интервью

🏗️

6.2

Понимание продуктовых моделей и бизнес-контекста

Маркетплейсы, подписки, рекламные платформы — как работают разные бизнес-модели

Важно

Разные продукты — разная логика. Маркетплейс заботится о балансе спроса и предложения. Подписочный сервис живёт за счёт retention. Рекламная платформа оптимизирует relevance и монетизацию одновременно. Знание этой специфики критично на кейсах.

Что изучить

Маркетплейсы — двусторонние рынки, ликвидность, GMV vs NMV

Подписочные сервисы — MRR, ARR, churn, expansion revenue

Рекламные платформы — CTR, RPM, аукционные механизмы

E-commerce — конверсионная воронка, корзина, checkout

Fintech — риск, fraud-метрики, TPV

Понятие network effects — почему социальные продукты особенные

🎤 Вопросы на собеседовании

Как устроена экономика маркетплейса? Что такое take rate и как его оптимизировать?
Какие метрики наиболее важны для подписочного сервиса? Как связаны retention и MRR?
Авито запускает платное размещение объявлений. Какие метрики нужно отслеживать и как оценить эффект?

📚 Материалы и практика на new-lvl.pro

СтатьяМетрики маркетплейса: GMV, NMV, ликвидность→ КарточкиКарточки: продуктовые фреймворки→ КарточкиICE vs RICE: приоритизация + калькулятор→ СтатьяКогнитивные искажения в аналитике→

Важно · Особенно важно для кейсов по конкретной компании

Блок 07

BI-системы и визуализация данных

Аналитик должен уметь не только считать, но и доносить результаты. Дашборды и визуализации — основной инструмент коммуникации с командой и руководством.

📉

7.1

Принципы визуализации и дашборд-дизайн

Как правильно представлять данные, чтобы они принимались и понимались

Важно

Плохая визуализация — это когда данные есть, а вывода нет. Хорошая визуализация отвечает на конкретный вопрос и не требует объяснений. Изучите принципы до того, как начнёте строить дашборды.

Что изучить

Выбор типа графика — bar, line, scatter, heatmap, pie (и когда не pie)

Принципы Тафти — data-ink ratio, chartjunk

Цветовые палитры — sequential vs diverging vs qualitative

Иерархия дашборда — что главное, что детали

Когортные тепловые карты — retention heatmap

Воронки в BI

📚 Материалы и практика на new-lvl.pro

СтатьяКак построить дашборд, который реально используют→

Важно

🛠️

7.2

Инструменты: Tableau, Superset, Power BI, Grafana

Практические BI-системы, которые используются в компаниях

Нужно знать хотя бы один

Конкретный инструмент зависит от компании. В большинстве российских IT-компаний используют Apache Superset или собственные решения. Tableau популярен в западных компаниях. Power BI — в корпоративном секторе.

Что изучить

Apache Superset — open-source, SQL-based, популярен в РФ

Tableau — LOD expressions, calculated fields, публикация

Power BI — DAX, Power Query, data model

Grafana — мониторинг метрик в реальном времени

Amplitude / Mixpanel — product analytics платформы

DataLens — BI от Яндекса, часто используется в экосистеме

🎤 Вопросы на собеседовании

Расскажите о дашборде, который вы создали. Для кого он был? Какие решения по нему принимались?
Как вы проектируете дашборд мониторинга здоровья продукта? Какие метрики включите?
Как выбираете между bar chart и line chart? Между heatmap и таблицей?

Важно · Выберите один инструмент и изучите его хорошо

Блок 08

Soft skills и коммуникация

В BigTech проверяют не только техническую грамотность. Умение формулировать выводы, работать с командой и общаться с бизнесом — часть профиля продуктового аналитика.

💬

8.1

Коммуникация данных и работа со стейкхолдерами

Как переводить данные в бизнес-решения и работать с неопределённостью

Важно

Главная задача аналитика — не посчитать, а помочь принять решение. Это требует умения формулировать вывод понятно для нетехнической аудитории, задавать правильные вопросы и работать с неполными данными.

Что развивать

Структура вывода — Situation → Insight → Recommendation

«Пирамида Минто» — вывод сначала, потом аргументы

Работа с размытым ТЗ — уточнить бизнес-проблему до анализа

Работа с неполными данными — proxy-метрики, допущения

Презентация результатов — для PM, CPO, CEO

Фрейм STAR — для рассказа о кейсах на интервью

🎤 Вопросы на собеседовании (поведенческие)

Расскажите о случае, когда данные не дали однозначного ответа. Как вы приняли решение?
Как вы объясняете сложные статистические концепции (например, p-value) нетехническому руководителю?
PM настаивает на запуске фичи, но ваш анализ показывает риск. Как вы действуете?
Расскажите об анализе, которым вы гордитесь. Какое решение он помог принять?
Как вы расставляете приоритеты, когда к вам одновременно приходят три запроса от разных команд?

📚 Материалы и практика на new-lvl.pro

СтатьяКак объяснить продакту, что A/B не сработал→ СтатьяФрейм STAR: как рассказывать о кейсах→ ИнструментГенератор STAR-ответов для интервью→

Важно · Поведенческие вопросы есть на каждом финальном интервью

Блок 09

Практика и портфолио

Теория без практики — мёртвый груз. Работодатели хотят видеть, что вы умеете работать с реальными данными и решать реальные задачи.

🏆

9.1

Pet-проект и GitHub-портфолио

Как сделать проект, который говорит о вас как о продуктовом аналитике

Обязательно

Pet-проект — это ваш разговор с интервьюером: «вот как я думаю и решаю задачи». Он не должен быть сложным. Он должен быть продуктовым: взять реальный датасет, поставить бизнес-вопросы и ответить на них данными.

Идеи для проектов

Анализ e-commerce датасета — воронка, retention, LTV, сегментация

Симуляция A/B теста — расчёт выборки, тест, интерпретация

Когортный анализ — retention heatmap на реальных данных

RFM-сегментация пользователей

Анализ воронки регистрации — SQL + визуализация

Дашборд мониторинга продукта — в Tableau/Superset

// Открытые датасеты для практики

Kaggle: Olist (бразильский e-commerce, 100k заказов), Instacart (продуктовый ритейл), Google Analytics Sample. GitHub: datasets от Airbnb, NYC Taxi. Для SQL-практики: LeetCode SQL 50, sql-ex.ru, Karpov.Courses SQL тренажёр.

Что должно быть в проекте

Бизнес-контекст — какую проблему решаем

Данные и методология — что и как считали

Выводы с рекомендациями — что делать с этим

Код на GitHub — Jupyter Notebook с комментариями

📚 Материалы и практика на new-lvl.pro

ТренажёрSQL-тренажёр: практика на реальном датасете→ ТренажёрPandas-тренажёр: notebook-режим→ СтатьяРезюме аналитика: пройти ATS среди 800 откликов→ СтатьяФормула XYZ: как писать резюме→ ИнструментГенератор пунктов резюме по формуле XYZ→

Критически важно · Без проекта резюме выглядит пустым

🎯

9.2

Подготовка к интервью: структура и разбор кейсов

Как проходит интервью в BigTech и как к нему готовиться

Обязательно

Интервью в BigTech состоит из нескольких этапов. Знать материал — необходимо, но не достаточно. Нужно уметь думать вслух, структурировать ответ и не теряться при сложных вопросах.

Типичная структура интервью (Яндекс, Авито, Ozon)

HR-скрининг — мотивация, опыт, зарплатные ожидания

Техническое SQL — живое написание запросов (30–60 мин)

A/B тесты и статистика — теория + кейс (45–60 мин)

Продуктовый кейс — разбор метрик, root cause (45–60 мин)

Поведенческое интервью — кейсы из опыта по STAR (30–45 мин)

Как готовиться

Решать SQL задачи каждый день — LeetCode, Karpov

Разбирать кейсы вслух — с таймером, как на интервью

Подготовить 5 STAR-историй — из реального или учебного опыта

Mock-интервью — с другом или в сообществах

Изучить продукт компании — метрики, бизнес-модель

🎤 Топ универсальных вопросов для финального интервью

Как бы вы оценили здоровье нашего продукта? Какие 5 метрик вы посмотрите первым делом?
Придумайте A/B тест для фичи [X]. Что тестируете, как считаете, как интерпретируете.
Чем продуктовый аналитик отличается от data analyst или бизнес-аналитика?
Расскажите о самом сложном анализе, который вы делали. Что было сложно и как решили?
Если бы вы могли добавить одну метрику в мониторинг нашего продукта — что это было бы и почему?

📚 Материалы и практика на new-lvl.pro

ГайдЧеклист подготовки к собесу: 4 недели до оффера→ ТренажёрAI-Собеседник: тренировка кейс-интервью→ КвизКвиз: проверь себя перед собесом в BigTech→ СтатьяФрейм STAR для рассказа о кейсах→ ИнструментГенератор STAR-ответов→

Критически важно · Практика кейсов важнее повторного чтения теории

FAQ

Частые вопросы: продуктовая аналитика с нуля

Короткие ответы на то, что чаще всего спрашивают перед стартом по этой дорожной карте.

С чего начать изучать продуктовую аналитику с нуля?

Начните с блоков 1–3: SQL, Python (pandas) и базовая статистика. SQL — фундамент, без него не пройти ни один скрининг. Не учите теорию впрок: сразу решайте задачи в SQL-тренажёре — так навык закрепляется быстрее. Освоив выборки, JOIN и оконные функции, переходите к A/B-тестам и метрикам.

Сколько времени занимает подготовка с нуля?

В среднем 6–9 месяцев при 8–12 часах в неделю. Блоки 1–5 (SQL, Python, статистика, A/B, метрики) — минимум для прохождения скрининга, на них уходит большая часть времени. Блоки 6–9 развиваются параллельно с практикой кейсов, а не последовательно.

Нужен ли Python продуктовому аналитику?

Да, но на базовом уровне. Достаточно pandas для загрузки, очистки и агрегации данных — глубокое программирование не требуется. На старте SQL важнее Python: почти любая аналитическая задача начинается с запроса к базе.

Можно ли стать продуктовым аналитиком без технического образования и опыта в IT?

Да. Нетехнический бэкграунд — не препятствие: важны логика, умение работать с данными и продуктовое мышление. Отсутствие коммерческого опыта компенсируют pet-проекты в портфолио (блок 9) — на них можно показать реальный анализ на открытых датасетах.

Чем продуктовый аналитик отличается от дата-аналитика?

Продуктовый аналитик ближе к продукту: формулирует и проверяет гипотезы, считает продуктовые метрики, проектирует A/B-тесты и влияет на решения команды. Дата-аналитик чаще закрывает запросы на отчётность и работу с данными в широком смысле. Подробнее — в разборе видов аналитиков.

Этот roadmap бесплатный?

Да. Вся дорожная карта и большинство материалов на new-lvl.pro бесплатны: статьи, гайды, квизы и 20 задач в SQL-тренажёре. Платный только premium-доступ к расширенному банку из 80+ задач — он опционален и нужен скорее для интенсивной практики перед собесом.

Главное правило этого плана

Не пытайтесь пройти все блоки последовательно до конца, прежде чем начать практику. SQL + базовая статистика → первый pet-проект → A/B тест → метрики → практика кейсов. Итеративно, не линейно.

Блоки 1–5 — это минимум для прохождения скрининга. Блоки 6–9 — то, что поможет пройти финал и выглядеть сильным кандидатом. Soft skills и продуктовое мышление нельзя «выучить» — они развиваются через практику разбора кейсов.

Ресурсы: Stepik (SQL, статистика), Karpov.Courses SQL тренажёр, LeetCode SQL 50, Khan Academy (статистика), книга «Trustworthy Online Controlled Experiments» (A/B тесты), блог Lenny's Newsletter (продуктовые метрики), Kaggle (датасеты для практики).

Roadmapпродуктовогоаналитика

Как распределить время

SQL

Что изучить

Что изучить

Что изучить

Что изучить

Python для анализа данных

Основы языка

pandas: ключевые операции

Что изучить

Теория вероятностей и статистика

Что изучить

Что изучить

A/B тестирование

Что изучить

Что изучить

Продуктовые метрики

Что изучить

Что изучить

Что изучить

Продуктовое мышление и бизнес-логика

Что изучить

Что изучить

BI-системы и визуализация данных

Что изучить

Что изучить

Soft skills и коммуникация

Что развивать

Практика и портфолио

Идеи для проектов

Что должно быть в проекте

Типичная структура интервью (Яндекс, Авито, Ozon)

Как готовиться

Частые вопросы: продуктовая аналитика с нуля

Главное правило этого плана

Roadmap
продуктового
аналитика