// Продуктовый аналитик · Junior → Middle · BigTech

Roadmap
продуктового
аналитика

Детальный план подготовки с теорией, темами для изучения, акцентами и вопросами на собеседование. От основ до уровня, необходимого в Яндексе, Авито, Ozon и VK.

9
блоков знаний
80+
тем для изучения
120+
вопросов с собесов
6–9
месяцев пути
1
SQL
Основы
2
Python
Анализ
3
Статистика
Теорвер
4
A/B тесты
Эксперименты
5
Продуктовые
метрики
6
Продуктовое
мышление
7
BI &
визуализация
8
Soft skills
Коммуникация
9
Практика
Портфолио

Как распределить время

Ориентировочные фазы для человека, который учится параллельно с работой или другими занятиями (~2–3 часа в день).

01
Месяц 1–2
  • SQL: от базового до оконных функций
  • Python: основы + pandas
  • Описательная статистика
02
Месяц 3–4
  • Теория вероятностей
  • Инференциальная статистика
  • A/B тесты: теория и расчёты
03
Месяц 5–6
  • Продуктовые метрики
  • Продуктовое мышление
  • BI: Tableau / Superset
04
Месяц 7–9
  • Первый pet-проект
  • Разбор кейсов
  • Подготовка к интервью

SQL

Фундамент №1. Без уверенного SQL нельзя пройти даже скрининг в любой IT-компании. На практике 80% работы аналитика — это SQL.

🔍
1.1
Основы: SELECT, фильтрация, агрегация
Базовые конструкции, без которых не написать ни одного запроса
Обязательно Неделя 1–2

SQL — декларативный язык: вы описываете что хотите получить, а не как это вычислить. Вся работа строится вокруг таблиц. Начните с одной таблицы, потом переходите к связям между ними.

Что изучить

SELECT, FROM, WHERE — фундамент любого запроса
ORDER BY, LIMIT — сортировка и ограничение
GROUP BY + HAVING — агрегация с условиями
COUNT, SUM, AVG, MIN, MAX — агрегатные функции
DISTINCT — уникальные значения
IN, BETWEEN, LIKE, IS NULL — операторы фильтрации
CASE WHEN — условная логика прямо в запросе
Типы данных — INT, VARCHAR, DATE, BOOLEAN, FLOAT
// На что обратить внимание
Порядок выполнения SQL: FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY → LIMIT. Это не порядок написания! Понимание этого спасёт от многих ошибок. Особенно важно: WHERE фильтрует ДО агрегации, HAVING — ПОСЛЕ.
🎤 Вопросы на собеседовании
  • Напишите запрос: найдите топ-5 категорий товаров по сумме выручки за последние 30 дней.
  • В чём разница между WHERE и HAVING? Приведите пример, когда нужен именно HAVING.
  • Как посчитать долю пользователей, совершивших более одной покупки, от всех пользователей?
  • Найдите дни, в которые количество заказов было выше среднего по всему периоду.
Критически важно · Спрашивают всегда
🔗
1.2
JOIN'ы, подзапросы и CTE
Работа с несколькими таблицами — основа реальных задач
Обязательно Неделя 3–4

В реальных задачах данные всегда распределены по нескольким таблицам: пользователи, заказы, события, товары. JOIN — инструмент, который их связывает. Без глубокого понимания JOIN'ов вы не сможете решать практические аналитические задачи.

Что изучить

INNER JOIN — только совпадения с обеих сторон
LEFT / RIGHT JOIN — все строки из одной таблицы + совпадения
FULL OUTER JOIN — все строки из обеих таблиц
SELF JOIN — таблица джойнится сама с собой
Подзапросы в WHERE, FROM, SELECT
CTE (WITH ... AS) — именованные подзапросы
UNION и UNION ALL — объединение результатов
Декартово произведение — когда JOIN без условия это плохо
// Главная ловушка
При LEFT JOIN NULL в колонке правой таблицы означает «нет совпадения». Это самая частая ошибка: люди фильтруют по колонке правой таблицы в WHERE — и случайно превращают LEFT JOIN в INNER JOIN. Правило: условия на правую таблицу LEFT JOIN пишутся в ON, не в WHERE.
🎤 Вопросы на собеседовании
  • Найдите пользователей, которые зарегистрировались, но ни разу не совершили покупку.
  • В чём разница между INNER JOIN и LEFT JOIN? Когда какой использовать?
  • Посчитайте конверсию из просмотра карточки товара в покупку по каждой категории. Данные в разных таблицах.
  • Когда лучше использовать CTE вместо подзапроса? Есть ли разница в производительности?
  • Найдите пары пользователей, которые купили одинаковые товары (SELF JOIN).
Критически важно · Задача на JOIN — стандарт любого SQL-интервью
🪟
1.3
Оконные функции (Window Functions)
То, что отличает джуна от мидла в SQL
Обязательно для middle Неделя 5–6

Оконные функции выполняют вычисления по набору строк, связанных с текущей строкой, без схлопывания таблицы. В отличие от GROUP BY, строки в результате сохраняются. Это главный инструмент для когортного анализа, расчёта накопительных метрик, ранжирования.

Синтаксис
функция() OVER ( PARTITION BY колонка -- аналог GROUP BY внутри окна ORDER BY колонка -- порядок строк внутри раздела ROWS BETWEEN ... -- размер фрейма (опционально) )

Что изучить

ROW_NUMBER() — уникальный порядковый номер
RANK() / DENSE_RANK() — ранг с пропусками и без
LAG() / LEAD() — значение из предыдущей / следующей строки
SUM/AVG OVER PARTITION — накопительные и скользящие итоги
FIRST_VALUE() / LAST_VALUE()
NTILE(n) — разбивка на квантили (децили)
ROWS BETWEEN / RANGE BETWEEN — фреймы окна
Разница RANK vs DENSE_RANK vs ROW_NUMBER
// Самые частые задачи с оконными функциями
Найти первую/последнюю покупку пользователя (ROW_NUMBER + PARTITION BY user_id ORDER BY date). Посчитать скользящее среднее за 7 дней. Найти разницу между текущим и предыдущим значением (LAG). Определить, какой % пользователей сделал повторную покупку в течение 30 дней после первой.
🎤 Вопросы на собеседовании
  • Для каждого пользователя найдите время между первой и второй покупкой.
  • Посчитайте скользящее среднее выручки за предыдущие 7 дней для каждого дня.
  • Пронумеруйте заказы каждого пользователя в хронологическом порядке. Найдите всех, у кого более 3 заказов.
  • Разбейте пользователей по децилям по сумме их покупок. Какой процент выручки даёт топ-10%?
  • В чём разница между PARTITION BY и GROUP BY?
Критически важно · Оконные функции — стандарт middle-уровня
1.4
Продвинутый SQL: оптимизация и аналитические паттерны
DATE-функции, работа с NULL, аналитические паттерны и основы оптимизации
Важно Неделя 7–8

В реальных задачах постоянно работаешь с датами (когортный анализ, retention), пропущенными значениями и нужно уметь строить сложные аналитические паттерны: воронки, когорты, сессии.

Что изучить

DATE_TRUNC, DATE_DIFF, EXTRACT — работа с датами
COALESCE, NULLIF, IFNULL — обработка NULL
STRING_AGG, ARRAY_AGG — агрегация в строку/массив
Когортный анализ через SQL — GROUP BY cohort_month
Сессии через LAG + условие — sessionization
EXPLAIN ANALYZE — план выполнения запроса
Индексы — зачем нужны и как влияют на скорость
ClickHouse vs PostgreSQL — ключевые отличия синтаксиса
🎤 Вопросы на собеседовании
  • Постройте когортный анализ: для каждой когорты (месяц регистрации) посчитайте retention на 1-й, 2-й, 3-й месяц после регистрации.
  • Ваш запрос работает 10 минут на 100 млн строк. Что вы будете делать?
  • Как определить сессию пользователя, если сессия — это последовательность событий с перерывами менее 30 минут?
  • Чем ClickHouse отличается от PostgreSQL и в каких задачах лучше использовать каждый?
Важно · Спрашивают на middle-позиции

Python для анализа данных

Второй ключевой инструмент. Python нужен для анализа, статистических тестов, автоматизации и работы с большими объёмами данных, которые не уместить в SQL.

🐍
2.1
Основы Python и pandas
Базовый синтаксис и главная библиотека для работы с табличными данными
Обязательно Недели 3–6

Pandas — Excel на стероидах. DataFrame позволяет делать всё то же, что и SQL, но с большей гибкостью и возможностью автоматизации. Главное: не учить pandas в отрыве от реальных задач — сразу практикуйте на датасетах.

Основы языка

Типы данных — list, dict, set, tuple, str, int, float
Управляющие конструкции — if/elif/else, for, while, list comprehensions
Функции — def, lambda, *args, **kwargs
Работа с файлами — open(), CSV, JSON

pandas: ключевые операции

.loc / .iloc — индексация по метке и позиции
groupby() + agg() — агрегация по группам
merge() / join() — аналог SQL JOIN'ов
pivot_table() — сводные таблицы
fillna() / dropna() — работа с пропусками
apply() + lambda — применение функции к колонке
pd.to_datetime() + .dt — работа с датами
value_counts(), nunique() — быстрый анализ
🎤 Вопросы на собеседовании
  • В чём разница между .loc и .iloc? Когда каждый использовать?
  • Как посчитать retention в pandas без SQL? Опишите подход через groupby и merge.
  • У вас DataFrame с 10 млн строк. groupby работает медленно. Как ускорить?
  • Как объединить два DataFrame: один с покупками, другой с пользователями? Что делать с дубликатами?
Критически важно
📊
2.2
Визуализация и статистические библиотеки
matplotlib, seaborn, scipy, statsmodels — для анализа и тестов
Важно

Визуализация — не просто «красивые графики». Это инструмент понимания данных и коммуникации результатов. Первый шаг любого анализа — смотреть на данные, а не сразу считать цифры.

Что изучить

matplotlib — базовые графики, настройка осей
seaborn — histogram, boxplot, heatmap, pairplot
plotly — интерактивные графики для презентаций
scipy.stats — t-тест, z-тест, chi-square, Mann-Whitney
statsmodels — линейная регрессия, временные ряды
numpy — массивы, векторизация, random
# Быстрый разведочный анализ — стартовый шаблон import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df.describe() # базовая статистика df.info() # типы данных, пропуски df.isnull().sum() # считаем пропуски # Гистограмма распределения sns.histplot(df['revenue'], bins=50, kde=True) # Boxplot для сравнения групп sns.boxplot(x='segment', y='revenue', data=df)
Важно · Нужно уметь строить и интерпретировать основные типы графиков

Теория вероятностей и статистика

Математическая основа A/B-тестирования и любого вывода по данным. Без этого невозможно корректно интерпретировать результаты экспериментов.

🎲
3.1
Теория вероятностей
Вероятностные модели, распределения, центральная предельная теорема
Обязательно

Теория вероятностей — язык неопределённости. Понимание распределений и ЦПТ критически важно для понимания того, почему статистические тесты работают именно так.

Что изучить

Условная вероятность, формула Байеса
Дискретные распределения — Бернулли, Биномиальное, Пуассона
Непрерывные распределения — Нормальное, Экспоненциальное, Равномерное
t-распределение, chi-square, F-распределение
Математическое ожидание, дисперсия, СКО
Ковариация и корреляция
ЦПТ (Центральная предельная теорема) — почему большие выборки нормальные
Закон больших чисел
// Особое внимание
ЦПТ — это фундамент всего A/B-тестирования. Поймите её физический смысл: при достаточно большой выборке среднее выборки стремится к нормальному распределению, независимо от исходного распределения данных. Именно поэтому мы можем применять z-тест к конверсиям, даже если исходные данные — это 0 и 1.
🎤 Вопросы на собеседовании
  • Что такое ЦПТ и почему она важна для A/B-тестирования?
  • Монету подбросили 100 раз, выпал орёл 60 раз. Можно ли утверждать, что монета нечестная?
  • Чем отличаются дисперсия и стандартное отклонение? Почему нас чаще интересует СКО?
  • Что такое распределение Пуассона и где оно применяется в продуктовой аналитике?
Критически важно · Основа для A/B-тестирования
📐
3.2
Инференциальная статистика и статтесты
Доверительные интервалы, гипотезы, p-value, ошибки I и II рода
Обязательно

Это раздел статистики о том, как делать выводы о генеральной совокупности на основе выборки. Именно здесь живут все ключевые концепции A/B-тестирования: p-value, доверительные интервалы, ошибки.

Что изучить

Нулевая и альтернативная гипотезы — H₀ и H₁
p-value — правильная интерпретация (и почему её путают)
Ошибки I рода (α) и II рода (β)
Мощность теста — что такое power и как её считать
Доверительные интервалы — построение и интерпретация
t-тест — одновыборочный, двухвыборочный, парный
Z-тест для пропорций — конверсии и CTR
Mann-Whitney U-тест — непараметрический аналог t-теста
Chi-square тест — категориальные данные
Поправка Бонферрони — множественные сравнения
🎤 Вопросы на собеседовании
  • Что такое p-value? Что означает p=0.03 для вашего A/B-теста?
  • Объясните ошибки I и II рода на бизнесовом примере. Какая из них хуже?
  • Что такое доверительный интервал? Как интерпретировать 95% ДИ [0.02, 0.08]?
  • Когда использовать t-тест, а когда Mann-Whitney?
  • У вас 10 метрик в тесте. Как скорректировать порог значимости?
Критически важно · Спрашивают на каждом интервью в BigTech

A/B тестирование

Центральная компетенция продуктового аналитика в IT. На собесах в BigTech этот блок занимает 40–60% технических вопросов.

🧪
4.1
Дизайн и проведение эксперимента
Как правильно спланировать тест до его запуска
Обязательно

80% ошибок в A/B-тестах — это ошибки дизайна, а не анализа. Плохо сформулированная гипотеза, неправильно выбранная метрика или неверно рассчитанная выборка — и весь тест бессмысленен.

Что изучить

Формулировка гипотезы — с механизмом действия
Primary / Secondary / Guardrail метрики
MDE (Minimum Detectable Effect)
Расчёт размера выборки — формула и инструменты
Уровень значимости α и мощность (power)
Рандомизация — хеш user_id, бакеты
AA-тест — проверка рандомизации
SRM (Sample Ratio Mismatch)
Длительность теста — сезонность и полные недели
Peeking problem — почему нельзя останавливать рано
🎤 Вопросы на собеседовании
  • Как вы рассчитаете размер выборки для теста? Какие параметры нужны?
  • Что такое MDE? Как выбрать его значение для конкретного теста?
  • Что такое AA-тест? Зачем он нужен и когда его нужно проводить?
  • Тест запустили, через 3 дня видим p=0.03. Можно ли останавливать? Почему?
  • Как выбрать длительность теста? Почему нельзя останавливать в пятницу?
  • Что такое SRM и что делать, если вы его обнаружили?
Критически важно · Главная тема любого интервью в продуктовую аналитику
🚀
4.2
Продвинутые методы: CUPED, Bootstrap, стратификация
Как повысить чувствительность теста и сократить время до результата
Важно для middle

В крупных компаниях (Яндекс, Авито, Ozon) эти методы используются регулярно. Знание CUPED — сильный дифференциатор на собесе. Это показывает, что вы думаете об эффективности экспериментальной платформы.

Что изучить

CUPED — предэкспериментальные данные для снижения дисперсии
Стратификация — балансировка групп по сегментам
Bootstrap — непараметрическое тестирование
Delta-метод — для ratio-метрик (ARPU, CTR)
Sequential testing (mSPRT) — always-valid p-values
Novelty effect — как обнаружить и учесть
Network effects — когда SUTVA нарушен
Switchback experiments — для двусторонних рынков
🎤 Вопросы на собеседовании
  • Что такое CUPED? Объясните идею своими словами и когда его стоит применять.
  • Почему для метрики ARPU нельзя просто применить t-тест? Что такое delta-метод?
  • Как бы вы провели A/B тест для фичи в маркетплейсе, где продавцы и покупатели влияют друг на друга?
  • Что такое novelty effect? Как вы его обнаружите в данных?
  • Тест показал рост конверсии +5%, но retention упал на 2%. Что делать?
Важно · Дифференциатор кандидата уровня middle

Продуктовые метрики

Знание метрик — это то, что позволяет аналитику говорить на одном языке с продуктом и бизнесом. Без этого невозможно ставить правильные вопросы и интерпретировать результаты.

📈
5.1
Engagement, Retention, Воронки
Ключевые метрики здоровья продукта
Обязательно

Это базовый словарь продуктового аналитика. Вас будут спрашивать «как посчитать retention» или «что такое DAU/MAU ratio» на каждом интервью. Знать формулы недостаточно — нужно понимать что они говорят о продукте.

Что изучить

DAU / WAU / MAU — активные пользователи
DAU/MAU ratio (Stickiness) — «прилипчивость» продукта
Retention: Day-1, Day-7, Day-30 — удержание пользователей
Classic vs Rolling Retention — разные способы считать
Churn Rate — отток и его причины
Session length, Frequency, Depth
Воронки: построение и анализ drop-off
Когортный анализ — поведение по времени регистрации
// Типичный кейс на интервью
«DAU вырос на 10%, но retention упал. Что происходит?» — ответ: скорее всего привлекли много новых пользователей (рост DAU), но они не задерживаются (падение retention). Нужно смотреть на когорты: старые пользователи ведут себя так же или хуже?
🎤 Вопросы на собеседовании
  • Как посчитать Day-7 Retention? Напишите SQL-запрос.
  • В чём разница между Classic Retention и Rolling Retention? Когда что использовать?
  • DAU упал на 15%. Как вы будете разбираться в причинах?
  • Что такое DAU/MAU ratio и что значит значение 20%? А 60%?
  • Постройте воронку регистрации → активация → первая покупка. Как найти узкое место?
Критически важно
💰
5.2
Юнит-экономика: LTV, CAC, ARPU, Payback
Язык денег — как продуктовые решения влияют на бизнес-модель
Обязательно

Продуктовый аналитик должен понимать, как изменение метрики продукта влияет на деньги. Это требование BigTech — аналитик не просто считает, а понимает бизнес.

Что изучить

LTV (Lifetime Value) — формулы, когортный расчёт
CAC (Customer Acquisition Cost)
LTV/CAC ratio — когда привлечение окупается
ARPU / ARPPU / ARPDAU — средние доходы
Payback Period — срок окупаемости
GMV vs Net Revenue vs Take Rate
Contribution Margin — маржинальность единицы
NPS и CSAT — метрики удовлетворённости
🎤 Вопросы на собеседовании
  • Как рассчитать LTV? Какие данные нужны и какой горизонт брать?
  • LTV/CAC = 1.5. Что это говорит о бизнесе? Хорошо это или плохо?
  • Чем ARPU отличается от ARPPU? Когда важно смотреть именно на ARPPU?
  • Мы улучшили retention на 5%. Как это влияет на LTV? Посчитайте.
Критически важно · Без этого нельзя говорить на языке бизнеса
5.3
North Star Metric, AARRR, OKR
Фреймворки для выстраивания системы метрик
Важно

Отдельные метрики — это детали. Система метрик — это понимание того, как продукт создаёт ценность. Аналитик должен уметь выстраивать иерархию метрик и объяснять связь между ними.

Что изучить

North Star Metric (NSM) — метрика ценности продукта
AARRR (Pirate Metrics) — Acquisition, Activation, Retention, Revenue, Referral
Leading vs Lagging метрики — опережающие и запаздывающие
Counter-метрики — guardrails против оптимизации узких показателей
OKR — как метрики связаны со стратегией
Дерево метрик — декомпозиция NSM на драйверы
🎤 Вопросы на собеседовании
  • Как бы вы выбрали North Star Metric для маркетплейса? Для стримингового сервиса?
  • Что такое leading и lagging метрики? Приведите пример для e-commerce.
  • Декомпозируйте выручку маркетплейса на драйверы. Как выглядит дерево метрик?
  • Конверсия в покупку выросла, но NPS упал. Как это возможно и что делать?
Важно · Системное мышление о метриках

Продуктовое мышление и бизнес-логика

Технические навыки — необходимое условие. Но BigTech нанимает аналитиков, которые думают о продукте, а не просто пишут запросы.

🧠
6.1
Продуктовые кейсы и root cause analysis
Как мыслить структурно при работе с продуктовыми проблемами
Обязательно

Продуктовый кейс — это задача вида «метрика упала, разберись почему» или «как бы ты оценил эффект этой фичи». Здесь проверяют структуру мышления, а не знание конкретных формул.

Что изучить

Root Cause Analysis — системный поиск причин аномалий
Декомпозиция метрики — разложить на составляющие
Сегментация — найти где именно проблема
Гипотезы и их приоритизация
Понимание продуктовой воронки
MECE-принцип — взаимоисключающие, исчерпывающие категории
Data-driven решения — от данных к рекомендации
// Структура ответа на кейс «метрика упала»
1. Уточнить: когда упала, насколько, какие метрики ещё изменились. 2. Декомпозировать: метрика = A × B × C — что из них изменилось? 3. Сегментировать: по платформе, гео, когорте, типу пользователя — где локализована проблема? 4. Гипотезы: технические (баг, изменение в трекинге) → продуктовые (изменение фичи) → внешние (конкурент, сезонность). 5. Рекомендация: что проверить в первую очередь и как.
🎤 Вопросы на собеседовании
  • Выручка упала на 20% вчера вечером. Ваши действия? Какие данные посмотрите в первую очередь?
  • Конверсия из корзины в заказ упала с 60% до 45%. Как найти причину?
  • Retention нового онбординга вырос на 3%, но GMV упал на 2%. Запускать или нет?
  • Как вы оцените влияние нового поискового алгоритма на маркетплейс? Что и как меряете?
  • Пользователей в приложении стало на 30% больше, но выручка не выросла. Почему?
Критически важно · Кейсовые вопросы есть на каждом финальном интервью
🏗️
6.2
Понимание продуктовых моделей и бизнес-контекста
Маркетплейсы, подписки, рекламные платформы — как работают разные бизнес-модели
Важно

Разные продукты — разная логика. Маркетплейс заботится о балансе спроса и предложения. Подписочный сервис живёт за счёт retention. Рекламная платформа оптимизирует relevance и монетизацию одновременно. Знание этой специфики критично на кейсах.

Что изучить

Маркетплейсы — двусторонние рынки, ликвидность, GMV vs NMV
Подписочные сервисы — MRR, ARR, churn, expansion revenue
Рекламные платформы — CTR, RPM, аукционные механизмы
E-commerce — конверсионная воронка, корзина, checkout
Fintech — риск, fraud-метрики, TPV
Понятие network effects — почему социальные продукты особенные
🎤 Вопросы на собеседовании
  • Как устроена экономика маркетплейса? Что такое take rate и как его оптимизировать?
  • Какие метрики наиболее важны для подписочного сервиса? Как связаны retention и MRR?
  • Авито запускает платное размещение объявлений. Какие метрики нужно отслеживать и как оценить эффект?
Важно · Особенно важно для кейсов по конкретной компании

BI-системы и визуализация данных

Аналитик должен уметь не только считать, но и доносить результаты. Дашборды и визуализации — основной инструмент коммуникации с командой и руководством.

📉
7.1
Принципы визуализации и дашборд-дизайн
Как правильно представлять данные, чтобы они принимались и понимались
Важно

Плохая визуализация — это когда данные есть, а вывода нет. Хорошая визуализация отвечает на конкретный вопрос и не требует объяснений. Изучите принципы до того, как начнёте строить дашборды.

Что изучить

Выбор типа графика — bar, line, scatter, heatmap, pie (и когда не pie)
Принципы Тафти — data-ink ratio, chartjunk
Цветовые палитры — sequential vs diverging vs qualitative
Иерархия дашборда — что главное, что детали
Когортные тепловые карты — retention heatmap
Воронки в BI
Важно
🛠️
7.2
Инструменты: Tableau, Superset, Power BI, Grafana
Практические BI-системы, которые используются в компаниях
Нужно знать хотя бы один

Конкретный инструмент зависит от компании. В большинстве российских IT-компаний используют Apache Superset или собственные решения. Tableau популярен в западных компаниях. Power BI — в корпоративном секторе.

Что изучить

Apache Superset — open-source, SQL-based, популярен в РФ
Tableau — LOD expressions, calculated fields, публикация
Power BI — DAX, Power Query, data model
Grafana — мониторинг метрик в реальном времени
Amplitude / Mixpanel — product analytics платформы
DataLens — BI от Яндекса, часто используется в экосистеме
🎤 Вопросы на собеседовании
  • Расскажите о дашборде, который вы создали. Для кого он был? Какие решения по нему принимались?
  • Как вы проектируете дашборд мониторинга здоровья продукта? Какие метрики включите?
  • Как выбираете между bar chart и line chart? Между heatmap и таблицей?
Важно · Выберите один инструмент и изучите его хорошо

Soft skills и коммуникация

В BigTech проверяют не только техническую грамотность. Умение формулировать выводы, работать с командой и общаться с бизнесом — часть профиля продуктового аналитика.

💬
8.1
Коммуникация данных и работа со стейкхолдерами
Как переводить данные в бизнес-решения и работать с неопределённостью
Важно

Главная задача аналитика — не посчитать, а помочь принять решение. Это требует умения формулировать вывод понятно для нетехнической аудитории, задавать правильные вопросы и работать с неполными данными.

Что развивать

Структура вывода — Situation → Insight → Recommendation
«Пирамида Минто» — вывод сначала, потом аргументы
Работа с размытым ТЗ — уточнить бизнес-проблему до анализа
Работа с неполными данными — proxy-метрики, допущения
Презентация результатов — для PM, CPO, CEO
Фрейм STAR — для рассказа о кейсах на интервью
🎤 Вопросы на собеседовании (поведенческие)
  • Расскажите о случае, когда данные не дали однозначного ответа. Как вы приняли решение?
  • Как вы объясняете сложные статистические концепции (например, p-value) нетехническому руководителю?
  • PM настаивает на запуске фичи, но ваш анализ показывает риск. Как вы действуете?
  • Расскажите об анализе, которым вы гордитесь. Какое решение он помог принять?
  • Как вы расставляете приоритеты, когда к вам одновременно приходят три запроса от разных команд?
Важно · Поведенческие вопросы есть на каждом финальном интервью

Практика и портфолио

Теория без практики — мёртвый груз. Работодатели хотят видеть, что вы умеете работать с реальными данными и решать реальные задачи.

🏆
9.1
Pet-проект и GitHub-портфолио
Как сделать проект, который говорит о вас как о продуктовом аналитике
Обязательно

Pet-проект — это ваш разговор с интервьюером: «вот как я думаю и решаю задачи». Он не должен быть сложным. Он должен быть продуктовым: взять реальный датасет, поставить бизнес-вопросы и ответить на них данными.

Идеи для проектов

Анализ e-commerce датасета — воронка, retention, LTV, сегментация
Симуляция A/B теста — расчёт выборки, тест, интерпретация
Когортный анализ — retention heatmap на реальных данных
RFM-сегментация пользователей
Анализ воронки регистрации — SQL + визуализация
Дашборд мониторинга продукта — в Tableau/Superset
// Открытые датасеты для практики
Kaggle: Olist (бразильский e-commerce, 100k заказов), Instacart (продуктовый ритейл), Google Analytics Sample. GitHub: datasets от Airbnb, NYC Taxi. Для SQL-практики: LeetCode SQL 50, sql-ex.ru, Karpov.Courses SQL тренажёр.

Что должно быть в проекте

Бизнес-контекст — какую проблему решаем
Данные и методология — что и как считали
Выводы с рекомендациями — что делать с этим
Код на GitHub — Jupyter Notebook с комментариями
Критически важно · Без проекта резюме выглядит пустым
🎯
9.2
Подготовка к интервью: структура и разбор кейсов
Как проходит интервью в BigTech и как к нему готовиться
Обязательно

Интервью в BigTech состоит из нескольких этапов. Знать материал — необходимо, но не достаточно. Нужно уметь думать вслух, структурировать ответ и не теряться при сложных вопросах.

Типичная структура интервью (Яндекс, Авито, Ozon)

HR-скрининг — мотивация, опыт, зарплатные ожидания
Техническое SQL — живое написание запросов (30–60 мин)
A/B тесты и статистика — теория + кейс (45–60 мин)
Продуктовый кейс — разбор метрик, root cause (45–60 мин)
Поведенческое интервью — кейсы из опыта по STAR (30–45 мин)

Как готовиться

Решать SQL задачи каждый день — LeetCode, Karpov
Разбирать кейсы вслух — с таймером, как на интервью
Подготовить 5 STAR-историй — из реального или учебного опыта
Mock-интервью — с другом или в сообществах
Изучить продукт компании — метрики, бизнес-модель
🎤 Топ универсальных вопросов для финального интервью
  • Как бы вы оценили здоровье нашего продукта? Какие 5 метрик вы посмотрите первым делом?
  • Придумайте A/B тест для фичи [X]. Что тестируете, как считаете, как интерпретируете.
  • Чем продуктовый аналитик отличается от data analyst или бизнес-аналитика?
  • Расскажите о самом сложном анализе, который вы делали. Что было сложно и как решили?
  • Если бы вы могли добавить одну метрику в мониторинг нашего продукта — что это было бы и почему?
Критически важно · Практика кейсов важнее повторного чтения теории

Главное правило этого плана

Не пытайтесь пройти все блоки последовательно до конца, прежде чем начать практику. SQL + базовая статистика → первый pet-проект → A/B тест → метрики → практика кейсов. Итеративно, не линейно.

Блоки 1–5 — это минимум для прохождения скрининга. Блоки 6–9 — то, что поможет пройти финал и выглядеть сильным кандидатом. Soft skills и продуктовое мышление нельзя «выучить» — они развиваются через практику разбора кейсов.

Ресурсы: Stepik (SQL, статистика), Karpov.Courses SQL тренажёр, LeetCode SQL 50, Khan Academy (статистика), книга «Trustworthy Online Controlled Experiments» (A/B тесты), блог Lenny's Newsletter (продуктовые метрики), Kaggle (датасеты для практики).