Common Data

Все вопросы

Полная база вопросов с собеседований для Data-аналитиков и Data Scientist’ов.

WB
SQLЛегкийвопрос

Опиши правильный порядок, по которому движок БД обрабатывает SQL-запрос.

Опиши правильный порядок, по которому движок БД обрабатывает SQL-запрос.

WB
SQLСреднийзадача

Посчитать скользящее среднее по доле сервиса 'rec' в общей выручке всех серви…

Посчитать скользящее среднее по доле сервиса 'rec' в общей выручке всех сервисов в феврале 2023 года, в динамике по дням.

WB
PythonСреднийзадача

Необходимо произвести фильтрацию вложенного массива и извлечь элементы 1-го и…

Необходимо произвести фильтрацию вложенного массива и извлечь элементы 1-го индекса.

WB
PythonСреднийзадача

Напиши метод, который в качестве параметра принимает строку и возвращает слов…

Напиши метод, который в качестве параметра принимает строку и возвращает словарь с количеством символов. Пример: вход 'abcabb' → выход: {'a': 2, 'b': 3, 'c': 1}.

WB
PythonСреднийзадача

Напиши функцию, которая принимает на вход словарь вида d = {"Wildberries": 20…

Напиши функцию, которая принимает на вход словарь вида d = {"Wildberries": 20, "Ozon": 13, ...} (key — название маркетплейса, value — вес) и возвращает случайно сгенерированное название маркетплейса. Вероятность «выпадения» прямо пропорциональна весу. С какой сложностью работает алгоритм? Можно ли ускорить, если функцию нужно вызвать 10^6 раз?

WB
КейсыСложныйкейс

По итогам первого квартала продакт пришёл с ad-hoc задачей: «Нужно обосновани…

По итогам первого квартала продакт пришёл с ad-hoc задачей: «Нужно обоснование на данных, почему средний чек в сервисе rec ниже, чем у других сервисов?» Есть выгрузки orders (заказы) и events (просмотры и добавления в корзину). Как подойти к анализу?

WB
SQLСреднийзадача

Дана таблица сотрудников (employee_id, name, skill, salary). Бюджет на зарпла…

Дана таблица сотрудников (employee_id, name, skill, salary). Бюджет на зарплаты 500 тыс. руб. Напишите запрос, который выводит имена операторов для группы, если в приоритете операторы с наибольшим скилом.

WB
SQLСреднийзадача

Посчитайте медианную зарплату выбранных сотрудников (из задачи с бюджетом 500…

Посчитайте медианную зарплату выбранных сотрудников (из задачи с бюджетом 500 тыс.), не используя встроенную функцию медианы.

WB
PythonСреднийзадача

Дана строка (возможно пустая) из букв A-Z, например AAAABBBCCXYZDDDDEEEFFFAAA…

Дана строка (возможно пустая) из букв A-Z, например AAAABBBCCXYZDDDDEEEFFFAAAAAABBBB…C. Нужно написать функцию RLE (Run-Length Encoding), которая вернёт строку вида A4B3C2XYZD4E3F3A6B28. Если символ один раз — без числа, если больше — с числом повторений. Выдать ошибку при недопустимой строке.

WB
КейсыСложныйкейс

Открыли новую поддержку в Грузии. ПВЗ работают 2 месяца, заказы растут. Подде…

Открыли новую поддержку в Грузии. ПВЗ работают 2 месяца, заказы растут. Поддержка запущена месяц назад. Напиши список метрик, которые отражали бы эффективность работы поддержки.

Магнит
A/B тестыСреднийзадача

Ты аналитик в сервисе доставки продуктов. Команда тестирует блок с историей з…

Ты аналитик в сервисе доставки продуктов. Команда тестирует блок с историей заказов на главной странице приложения (группа B видит блок, группа A — нет). Даны таблицы df_ab_groups (user_id, ab_group) и df_financial (date, user_id, revenue). Задача 1: найти количество пользователей, попавших более чем в одну группу эксперимента.

Магнит
A/B тестыСреднийзадача

Посчитай суммарную выручку на клиента за период эксперимента и определи его г…

Посчитай суммарную выручку на клиента за период эксперимента и определи его группу. Данные: df_ab_groups (user_id, ab_group), df_financial (date, user_id, revenue).

Магнит
A/B тестыСреднийзадача

Напиши функцию, которая возвращает бокс-плот по выручке в разрезе A/B групп и…

Напиши функцию, которая возвращает бокс-плот по выручке в разрезе A/B групп и выводит итоги эксперимента: Uplift = X, p_value = Y, аудитория = N. Добавь параметр управления выбросами (перцентиль для порогового значения).

Магнит
SQLСреднийзадача

Таблица watch_content (user_id, video_id, date). Вывести список пользователей…

Таблица watch_content (user_id, video_id, date). Вывести список пользователей, смотревших video_id 1 и 3 (оба видео), но не смотревших video_id 2.

Магнит
SQLСреднийзадача

Таблица raw.orders (user_id, transaction_datetime, item_id, order_id) и dicts…

Таблица raw.orders (user_id, transaction_datetime, item_id, order_id) и dicts.items (item_id, brand, name, price). Для каждого пользователя вывести наименование и цену самого дорогого товара в его первой транзакции.

Магнит
SQLСреднийзадача

На основе таблицы raw.orders (user_id, transaction_datetime, item_id, order_i…

На основе таблицы raw.orders (user_id, transaction_datetime, item_id, order_id) вывести: 1) размер когорт по месяцам, 2) ретеншен 2-го месяца. Когорта — множество пользователей, объединённых месяцем первой покупки.

Магнит
A/B тестыСложныйкейс

Магнит запускает категорию кэшбэка совместно с банком-партнёром. Группа A (10…

Магнит запускает категорию кэшбэка совместно с банком-партнёром. Группа A (1000 чел.) — не видят кэшбэк, группа B (1100 чел.) — видят кэшбэк, из них 300 воспользовались впервые. Тест прокрасился в зелёный — доля покупателей в B выше. Как оценить экономический эффект?

Вкусвилл
SQLСреднийзадача

Дана таблица visits (Department, FIO, Date, Status). Status может быть: на ра…

Дана таблица visits (Department, FIO, Date, Status). Status может быть: на работе / на больничном / в отпуске (оплачиваемом) / в отпуске (за свой счет). Нужно вывести интервалы непрерывного нахождения сотрудника в определённом статусе (DateFrom, DateTo, Status).

Вкусвилл
PythonСреднийзадача

Написать функцию, которая будет выводить товары, не прошедшие минимальный пор…

Написать функцию, которая будет выводить товары, не прошедшие минимальный порог по продажам за месяц. На вход: минимальный порог выручки и массив продаж вида [[{"product_id": 1, "quantity": 2, "price": 100}], ...].

Вкусвилл
СтатистикаСреднийзадача

Мы промоутируем товары наших брендов в поисковой выдаче. Опция 1 — показывать…

Мы промоутируем товары наших брендов в поисковой выдаче. Опция 1 — показывать один товар на каждые 25 выданных. Опция 2 — заменить товар с шансом 4%. Сколько показов мы сделаем на 100 товаров? Каков шанс показать только 1 товар на 100 выданных при второй стратегии?

Вкусвилл
КейсыСложныйкейс

На корзине есть блок с товарами Зелёного Ценника (40% скидки на товары с подх…

На корзине есть блок с товарами Зелёного Ценника (40% скидки на товары с подходящим сроком годности). Планируем сделать фичу, подсвечивающую эти ценники. Какие риски оценивать и как с ними бороться?

Вкусвилл
КейсыСложныйкейс

Мы внедрили баннер «рецепты» в поиске приложения. Пользователи кликают, но ср…

Мы внедрили баннер «рецепты» в поиске приложения. Пользователи кликают, но средний чек и выручка не растут. Какие рекомендации?

Вкусвилл
КейсыСложныйкейс

Разработали новую логику построения маршрута в 2гис. Как понять, что она рабо…

Разработали новую логику построения маршрута в 2гис. Как понять, что она работает лучше?

Вкусвилл
КейсыСложныйкейс

SaaS-продукт по подписке. Бесплатный период — 1 месяц. Пользователи жалуются,…

SaaS-продукт по подписке. Бесплатный период — 1 месяц. Пользователи жалуются, что не успевают всё настроить за месяц. Стоит ли продлевать бесплатный период до 3 месяцев?

Вкусвилл
A/B тестыСложныйкейс

A/B тест серый — увеличилась только одна прокси-метрика (не основная). Какие …

A/B тест серый — увеличилась только одна прокси-метрика (не основная). Какие будут рекомендации?

Т-Банк
СтатистикаСреднийзадача

Кубик бросают три раза. Какова вероятность, что выпадет хотя бы 2 одинаковых …

Кубик бросают три раза. Какова вероятность, что выпадет хотя бы 2 одинаковых числа?

Т-Банк
СтатистикаЛегкийвопрос

Куда скошено распределение, если известно, что медиана выше среднего

Куда скошено распределение, если известно, что медиана выше среднего?

Т-Банк
A/B тестыЛегкийвопрос

Как изменится длительность A/B теста, если трафик увеличится

Как изменится длительность A/B теста, если трафик увеличится?

Т-Банк
SQLЛегкийвопрос

Какая операция в SQL соединяет две таблицы и удаляет дубликаты

Какая операция в SQL соединяет две таблицы и удаляет дубликаты?

Т-Банк
СтатистикаСреднийзадача

В мае было 100к пользователей, в июне из них зашло 20к, в июле — 30к. Какой м…

В мае было 100к пользователей, в июне из них зашло 20к, в июле — 30к. Какой минимальный и максимальный Rolling Retention?

Т-Банк
СтатистикаЛегкийвопрос

Можно ли считать отличия в A/B тесте статистически значимыми, если p_value = …

Можно ли считать отличия в A/B тесте статистически значимыми, если p_value = 0.07 при уровне значимости alpha = 0.05?

ММосБилет
SQLСреднийзадача

Посчитать количество визитов разработчиков в репозиторий n8n-io/n8n за сентяб…

Посчитать количество визитов разработчиков в репозиторий n8n-io/n8n за сентябрь 2025. Таблица github.events (created_at, actor_login, repo_name). Визит — последовательность событий одного пользователя, где перерыв между событиями не больше 30 минут.

СберЗдоровье
PythonСреднийзадача

Дан датафрейм продаж (event_dt, store, item, amount, price, customer). Провес…

Дан датафрейм продаж (event_dt, store, item, amount, price, customer). Провести агрегированный анализ: для каждого магазина вывести общую сумму продаж, среднюю цену товара, количество уникальных товаров.

СберЗдоровье
PythonСреднийзадача

Рассчитать средний чек для каждого клиента и вывести топ-5 клиентов с наиболь…

Рассчитать средний чек для каждого клиента и вывести топ-5 клиентов с наибольшим средним чеком.

СберЗдоровье
SQLСреднийзадача

Таблицы country (country_name, city) и sales (date, city, income). Вывести ра…

Таблицы country (country_name, city) и sales (date, city, income). Вывести разницу income в % по каждой стране YoY, сравнивая октябрь 2022 с октябрём 2023.

СберЗдоровье
SQLСреднийзадача

Таблица event_log (event_uuid, ts, user_id, event_name). Подготовить запрос д…

Таблица event_log (event_uuid, ts, user_id, event_name). Подготовить запрос для retention анализа: неделя первой установки (Install), количество недель до Consultation, размер когорты, количество уников с Consultation.

СберЗдоровье
КейсыСложныйкейс

DAU вырос, а выручка упала. Что может быть причиной

DAU вырос, а выручка упала. Что может быть причиной?

СберЗдоровье
A/B тестыСложныйкейс

A/B тест: на выдаче врачей в тестовой группе половине врачей повесили шильдик…

A/B тест: на выдаче врачей в тестовой группе половине врачей повесили шильдик «лучший врач». Конверсия в запись на выдаче к любому врачу упала. Предположи, почему.

HH.ru
SQLСреднийзадача

Нужно отправить рассылку всем работодателям hh, у которых не более 5 активных…

Нужно отправить рассылку всем работодателям hh, у которых не более 5 активных вакансий. Таблицы: employer (employer_id, name) и vacancy (vacancy_id, active, employer_id). Вывести имена таких работодателей.

HH.ru
SQLСреднийзадача

Таблицы: search (user_id, search_number, vacancy_id, vacancy_position) и clic…

Таблицы: search (user_id, search_number, vacancy_id, vacancy_position) и clicks (ts, user_id, search_number, vacancy_id). Подсчитать среднюю позицию первых трёх кликов пользователей в каждом поиске. Если кликов < 3, поиск не учитывать.

HH.ru
PythonСреднийзадача

Написать функцию, которая считает факториал от целого неотрицательного числа.…

Написать функцию, которая считает факториал от целого неотрицательного числа. n! = 1 × ... × n, 0! = 1.

HH.ru
PythonЛегкийвопрос

a = [3, 1, 2]. Чем отличается b = a[::-1] от a.reverse()

a = [3, 1, 2]. Чем отличается b = a[::-1] от a.reverse()?

HH.ru
PythonЛегкийвопрос

В чём разница между list, tuple и set в Python

В чём разница между list, tuple и set в Python?

HH.ru
КейсыСложныйкейс

Метрика: среднее от «Отклики» на вакансию. Что с ней может быть не так, как е…

Метрика: среднее от «Отклики» на вакансию. Что с ней может быть не так, как её можно улучшить, что можно предложить вместо неё?

HH.ru
СтатистикаЛегкийвопрос

X распределена по N(0, 1). Чему равна P(X = 0)

X распределена по N(0, 1). Чему равна P(X = 0)?

Детский мир
КейсыЛегкийвопрос

Расскажи про стек аналитика в крупном e-commerce: какие инструменты и платфор…

Расскажи про стек аналитика в крупном e-commerce: какие инструменты и платформы используются?

ВсеИнструменты
КейсыСложныйкейс

Как посчитать долю риелторов от рынка риелторов России на площадке объявлений

Как посчитать долю риелторов от рынка риелторов России на площадке объявлений? Данные: внутренние объявления + данные конкурентов (Циан, Суточно и др.).

ВсеИнструменты
A/B тестыСложныйкейс

Акция в Казани для B2C: промо на первую покупку 30%. A/B теста нет — на 100%.…

Акция в Казани для B2C: промо на первую покупку 30%. A/B теста нет — на 100%. Начало акции совпало с индексацией цен. CR упал в Казани на 5%, в других городах — на 10%. Как оценить эффект акции?

ВсеИнструменты
A/B тестыСложныйкейс

Маркетплейс запускает программу лояльности для продавцов (уровни на основе ме…

Маркетплейс запускает программу лояльности для продавцов (уровни на основе метрик, плюшки: скидка на аналитику, продвижение, вес в ранжировании). Нужно оценить эффект через A/B. Как спроектировать?

ВсеИнструменты
A/B тестыСреднийзадача

Спроектируй дизайн A/B теста для новой модели ранжирования товаров: какие мет…

Спроектируй дизайн A/B теста для новой модели ранжирования товаров: какие метрики, где проводить, как определить длительность.

ВсеИнструменты
SQLСреднийзадача

Таблица employee (id, skill, salary). Написать запрос, который выберет сотруд…

Таблица employee (id, skill, salary). Написать запрос, который выберет сотрудников для бюджета в 500 тыс. руб. с приоритетом на их навыки (чем выше skill, тем приоритетнее).

ВсеИнструменты
SQLСреднийзадача

Таблица employee (id, skill, salary). Написать запрос, который выведет медиан…

Таблица employee (id, skill, salary). Написать запрос, который выведет медиану зарплаты без использования встроенной функции медианы.

ВсеИнструменты
PythonСреднийзадача

Таблица items (item_id, name, price, update_date) — история изменений товаров…

Таблица items (item_id, name, price, update_date) — история изменений товаров. Написать код, который выведет актуальное состояние товаров на дату 01-06-2025.

ННе определено
SQLСреднийзадача

Объясни разницу между ROW_NUMBER(), RANK() и DENSE_RANK(). Напиши запрос, дем…

Объясни разницу между ROW_NUMBER(), RANK() и DENSE_RANK(). Напиши запрос, демонстрирующий отличие на примере таблицы с дубликатами.

ННе определено
SQLСреднийзадача

Напиши SQL-запрос для вычисления медианы через PERCENTILE_CONT. В чём отличие…

Напиши SQL-запрос для вычисления медианы через PERCENTILE_CONT. В чём отличие от PERCENTILE_DISC?

ННе определено
SQLСреднийзадача

Что такое задача Gaps & Islands

Что такое задача Gaps & Islands? Напиши запрос, который находит непрерывные интервалы дат активности пользователя (если пользователь заходил подряд несколько дней — это один «остров»).

ННе определено
SQLЛегкийвопрос

Что такое SCD Type 2 (Slowly Changing Dimension)

Что такое SCD Type 2 (Slowly Changing Dimension)? Как реализовать запрос актуального состояния из таблицы с версионностью?

ННе определено
SQLСреднийзадача

Напиши запрос с использованием LATERAL JOIN (или CROSS APPLY). Когда он полез…

Напиши запрос с использованием LATERAL JOIN (или CROSS APPLY). Когда он полезен и чем отличается от обычного JOIN?

ННе определено
SQLСреднийзадача

Напиши рекурсивный CTE: построй последовательность дат (date spine) за январь…

Напиши рекурсивный CTE: построй последовательность дат (date spine) за январь 2025 года.

ННе определено
SQLСреднийзадача

Напиши запрос для Pivot (строки в столбцы): таблица sales (month, product, re…

Напиши запрос для Pivot (строки в столбцы): таблица sales (month, product, revenue) → вывести продукты как столбцы с выручкой по месяцам.

ННе определено
SQLСреднийзадача

Напиши запрос с условной агрегацией через CASE WHEN и через FILTER (WHERE). В…

Напиши запрос с условной агрегацией через CASE WHEN и через FILTER (WHERE). В чём разница?

ННе определено
SQLЛегкийвопрос

В чём разница между EXISTS и IN в SQL

В чём разница между EXISTS и IN в SQL? Когда что использовать и как это влияет на производительность?

ННе определено
SQLСреднийзадача

Напиши запрос для генерации date spine (календарной таблицы) и используй его …

Напиши запрос для генерации date spine (календарной таблицы) и используй его для заполнения пропусков в данных — покажи дни с нулевыми продажами.

ННе определено
PythonЛегкийвопрос

Объясни типы merge в Pandas: left, right, outer, inner, cross. Когда какой ис…

Объясни типы merge в Pandas: left, right, outer, inner, cross. Когда какой использовать?

ННе определено
PythonЛегкийвопрос

В чём разница между groupby().transform() и groupby().apply() в Pandas

В чём разница между groupby().transform() и groupby().apply() в Pandas? Когда что использовать?

ННе определено
PythonСреднийзадача

Что такое декоратор в Python

Что такое декоратор в Python? Напиши декоратор с аргументами, который повторяет вызов функции N раз и возвращает список результатов.

ННе определено
PythonСреднийзадача

Напиши примеры list comprehension с условиями: фильтрация, вложенные циклы, у…

Напиши примеры list comprehension с условиями: фильтрация, вложенные циклы, условное выражение (тернарный оператор).

ННе определено
PythonСреднийзадача

Как работать с datetime и timedelta в Python

Как работать с datetime и timedelta в Python? Покажи: парсинг строки, разница между датами, добавление интервала.

ННе определено
PythonСреднийзадача

Как читать большие CSV-файлы в Pandas, если они не помещаются в память

Как читать большие CSV-файлы в Pandas, если они не помещаются в память? Покажи подход с chunksize.

ННе определено
PythonЛегкийвопрос

В чём разница между pivot_table и crosstab в Pandas

В чём разница между pivot_table и crosstab в Pandas? Когда что удобнее?

ННе определено
PythonСреднийзадача

Какие стратегии обработки пропусков (NaN) существуют в Pandas

Какие стратегии обработки пропусков (NaN) существуют в Pandas? Покажи fillna с разными подходами.

ННе определено
PythonЛегкийвопрос

Объясни lambda-функции и встроенные map, filter, reduce. Чем они отличаются о…

Объясни lambda-функции и встроенные map, filter, reduce. Чем они отличаются от list comprehension?

ННе определено
PythonСреднийзадача

Покажи возможности f-строк в Python: базовое форматирование, выравнивание, чи…

Покажи возможности f-строк в Python: базовое форматирование, выравнивание, числа с разделителями, отладочный вывод.

ННе определено
СтатистикаЛегкийвопрос

Сформулируй центральную предельную теорему (ЦПТ). Почему она важна для аналитика

Сформулируй центральную предельную теорему (ЦПТ). Почему она важна для аналитика?

ННе определено
СтатистикаЛегкийвопрос

Как правильно интерпретировать доверительный интервал

Как правильно интерпретировать доверительный интервал? Какие распространённые ошибки в интерпретации?

ННе определено
СтатистикаЛегкийвопрос

Что такое p-value

Что такое p-value? Что оно НЕ означает? Назови три распространённых заблуждения.

ННе определено
СтатистикаЛегкийвопрос

Объясни ошибки I и II рода. Приведи примеры из A/B тестирования.

Объясни ошибки I и II рода. Приведи примеры из A/B тестирования.

ННе определено
СтатистикаЛегкийвопрос

Сформулируй закон больших чисел. Чем он отличается от ЦПТ

Сформулируй закон больших чисел. Чем он отличается от ЦПТ?

ННе определено
СтатистикаЛегкийвопрос

Байесовский vs. частотный подход к статистике — в чём разница

Байесовский vs. частотный подход к статистике — в чём разница? Когда какой применяется?

ННе определено
СтатистикаЛегкийвопрос

«Корреляция не означает причинность». Приведи 3 примера ложных корреляций и о…

«Корреляция не означает причинность». Приведи 3 примера ложных корреляций и объясни, почему они возникают.

ННе определено
СтатистикаЛегкийвопрос

Назови ключевые свойства нормального распределения. Что такое правило 68-95-99.7

Назови ключевые свойства нормального распределения. Что такое правило 68-95-99.7?

ННе определено
СтатистикаСреднийзадача

Какие методы обнаружения выбросов существуют

Какие методы обнаружения выбросов существуют? Покажи IQR-метод и z-score на примере.

ННе определено
СтатистикаЛегкийвопрос

Что такое bootstrap

Что такое bootstrap? Когда и зачем его используют?

ННе определено
A/B тестыЛегкийвопрос

Что такое CUPED

Что такое CUPED? Зачем он нужен в A/B тестировании?

ННе определено
A/B тестыЛегкийвопрос

Что такое bucket-тест (AA-тест)

Что такое bucket-тест (AA-тест)? Зачем его проводят перед A/B?

ННе определено
A/B тестыЛегкийвопрос

Что такое SRM (Sample Ratio Mismatch)

Что такое SRM (Sample Ratio Mismatch)? Как его диагностировать и что делать?

ННе определено
A/B тестыСреднийзадача

Как рассчитать MDE (Minimum Detectable Effect) и необходимый размер выборки д…

Как рассчитать MDE (Minimum Detectable Effect) и необходимый размер выборки для A/B теста?

ННе определено
A/B тестыЛегкийвопрос

Что такое проблема множественного тестирования

Что такое проблема множественного тестирования? Как с ней бороться (поправка Бонферрони и другие методы)?

ННе определено
A/B тестыСреднийзадача

Как определить необходимую длительность A/B теста

Как определить необходимую длительность A/B теста? Какие факторы учитывать?

ННе определено
A/B тестыЛегкийвопрос

Что такое метрики-гвардрейлы (guardrail metrics)

Что такое метрики-гвардрейлы (guardrail metrics)? Приведи примеры для e-commerce.

ННе определено
A/B тестыЛегкийвопрос

Что такое стратификация в A/B тестах

Что такое стратификация в A/B тестах? Когда она полезна?

ННе определено
A/B тестыЛегкийвопрос

Что такое novelty effect и primacy effect в A/B тестах

Что такое novelty effect и primacy effect в A/B тестах? Как с ними бороться?

ННе определено
A/B тестыЛегкийвопрос

Зачем проводят AA-тест перед запуском A/B

Зачем проводят AA-тест перед запуском A/B? Какие проверки он включает?

ННе определено
КейсыСложныйкейс

DAU упал на 15% за неделю. Опиши фреймворк анализа: какие шаги предпримешь

DAU упал на 15% за неделю. Опиши фреймворк анализа: какие шаги предпримешь?

ННе определено
КейсыСложныйкейс

Тебе нужно спроектировать систему метрик для новой фичи — рекомендации товаро…

Тебе нужно спроектировать систему метрик для новой фичи — рекомендации товаров на главной странице. Какие метрики выберешь?

ННе определено
КейсыСложныйкейс

Что такое North Star Metric

Что такое North Star Metric? Как выбрать правильную NSM для продукта?

ННе определено
КейсыСложныйкейс

Конверсия воронки покупки упала. Как найти проблемный шаг

Конверсия воронки покупки упала. Как найти проблемный шаг? Опиши подход к анализу воронки.

ННе определено
КейсыСложныйкейс

Как построить retention analysis

Как построить retention analysis? Какие виды retention существуют?

ННе определено
КейсыСложныйкейс

Как рассчитать unit-экономику продукта

Как рассчитать unit-экономику продукта? Когда продукт становится прибыльным?

ННе определено
КейсыСложныйкейс

Как отличить каннибализацию от реального роста при запуске новой фичи

Как отличить каннибализацию от реального роста при запуске новой фичи? Пример: добавили раздел «Популярное» на главную.

ННе определено
КейсыСложныйкейс

Как применять RICE-фреймворк для приоритизации фич

Как применять RICE-фреймворк для приоритизации фич? Приведи пример расчёта.

ННе определено
КейсыСложныйкейс

Данные показывают рост метрики. Как понять — это сезонность или устойчивый тренд

Данные показывают рост метрики. Как понять — это сезонность или устойчивый тренд? Какие методы использовать?

ННе определено
КейсыСложныйкейс

Нужно принять Go/No-Go решение по данным A/B теста. Основная метрика выросла,…

Нужно принять Go/No-Go решение по данным A/B теста. Основная метрика выросла, но одна защитная упала. Как действовать?

ННе определено
SQLЛегкийвопрос

Что такое Data Lineage

Что такое Data Lineage? Зачем аналитику знать происхождение данных?

ННе определено
SQLЛегкийвопрос

Что такое витрина данных (data mart)

Что такое витрина данных (data mart)? Чем отличается от хранилища данных (data warehouse)?

ННе определено
КейсыЛегкийвопрос

Какие продуктовые метрики используются в e-commerce

Какие продуктовые метрики используются в e-commerce? Опиши ключевые группы.

ННе определено
ПоведенческиеЛегкийвопрос

Какие soft-skills важны для аналитика данных

Какие soft-skills важны для аналитика данных? Как эффективно коммуницировать результаты анализа?

ННе определено
SQLЛегкийвопрос

В чём разница между ETL и ELT

В чём разница между ETL и ELT? Когда какой подход предпочтительнее?

ННе определено
SQLЛегкийвопрос

Какие проверки качества данных (data quality checks) нужно внедрять в пайплайн

Какие проверки качества данных (data quality checks) нужно внедрять в пайплайн?

ННе определено
КейсыЛегкийвопрос

Какие принципы хорошего дашборда

Какие принципы хорошего дашборда? Что делает дашборд полезным vs. бесполезным?

ННе определено
ПоведенческиеЛегкийвопрос

Как работать со стейкхолдерами: PM, разработчиками, руководством

Как работать со стейкхолдерами: PM, разработчиками, руководством? Какие типичные ошибки?

ННе определено
SQLЛегкийвопрос

Что такое технический долг в данных (data tech debt)

Что такое технический долг в данных (data tech debt)? Приведи примеры и способы борьбы.

ННе определено
SQLЛегкийвопрос

Зачем и как документировать аналитические пайплайны

Зачем и как документировать аналитические пайплайны? Какие инструменты помогают?

Avito
КейсыСложныйкейс

Дизайн A/B теста для рекомендательной системы

Продакт просит запустить A/B тест для нового алгоритма рекомендаций. Как ты спроектируешь эксперимент? Опиши метрики, контрольную/тестовую группы, длительность теста и критерии остановки.

Avito
КейсыСложныйкейс

Диагностика падения ключевой метрики

Ты замечаешь, что DAU упал на 15% за последние 3 дня. Опиши, как диагностируешь проблему: с чего начнёшь, какие гипотезы проверишь и в каком порядке.

Avito
КейсыСложныйкейс

Метрики качества поиска на маркетплейсе

Ты аналитик на маркетплейсе. Задача: оценить качество алгоритма поиска. Предложи набор метрик и поясни, как бы ты их собирал.

Avito
КейсыСложныйкейс

Влияние промокодов на LTV клиента

Маркетинг хочет понять, влияют ли промокоды положительно на LTV или просто переключают уже лояльных пользователей на скидку. Как подойдёшь к анализу?

Avito
КейсыСложныйкейс

Приоритизация продуктовых фич на основе данных

У команды 10 идей для улучшения приложения, но спринт только на 3 фичи. Продакт просит тебя помочь приоритизировать на основе данных. Какой подход предложишь?

ППридумано ИИ
SQLЛегкийзадача

Пользователи без покупок

Есть таблицы `users(id, name)` и `orders(id, user_id, amount)`. Напиши запрос, который вернёт всех пользователей, у которых ещё не было ни одного заказа.

ППридумано ИИ
SQLЛегкийзадача

Процент от общей суммы

Есть таблица `sales(category, revenue)`. Выведи каждую категорию, её выручку и долю от общей выручки (в процентах, округлённую до 2 знаков).

ППридумано ИИ
SQLСреднийзадача

Топ-3 товара в каждой категории

Таблица `products(id, category, name, revenue)`. Выведи топ-3 товара по выручке в каждой категории. При одинаковой выручке порядок произвольный.

ППридумано ИИ
SQLСреднийзадача

Нарастающий итог по дням

Таблица `daily_sales(sale_date DATE, amount NUMERIC)`. Выведи для каждого дня нарастающий итог выручки (с начала периода). Дни отсортированы по возрастанию.

ППридумано ИИ
SQLСреднийзадача

Разница между текущей и предыдущей строкой (LAG)

Таблица `metrics(dt DATE, value INT)` содержит ежедневные значения метрики. Выведи дату, значение и изменение по сравнению с предыдущим днём (NULL, если предыдущей строки нет).

ППридумано ИИ
SQLСреднийзадача

Сотрудники с зарплатой выше менеджера

Таблица `employees(id, name, salary, manager_id)`. `manager_id` ссылается на `id` в той же таблице. Найди всех сотрудников, чья зарплата выше зарплаты их непосредственного менеджера.

ППридумано ИИ
SQLСреднийзадача

Дубликаты в таблице

Таблица `emails(id, email)`. Найди все email-адреса, которые встречаются более одного раза, и покажи, сколько раз каждый встречается.

ППридумано ИИ
SQLСложныйзадача

Медиана без функции MEDIAN

Таблица `salaries(id, amount)`. Найди медианную зарплату, не используя встроенную функцию MEDIAN (она есть не во всех СУБД).

ППридумано ИИ
SQLСложныйзадача

Последовательные дни активности

Таблица `logins(user_id INT, login_date DATE)`. Найди пользователей, которые заходили 7 и более дней подряд. Верни `user_id` и максимальную длину непрерывной серии.

ППридумано ИИ
SQLСложныйзадача

Вторая по величине зарплата

Таблица `employees(id, salary)`. Напиши запрос, который вернёт вторую по величине уникальную зарплату. Если такой нет — верни NULL.

ППридумано ИИ
PythonЛегкийзадача

FizzBuzz

Напиши функцию `fizzbuzz(n: int) -> list[str]`, которая возвращает список строк от 1 до n: - "Fizz" если число делится на 3 - "Buzz" если делится на 5 - "FizzBuzz" если делится на 15 - иначе строку с самим числом

ППридумано ИИ
PythonЛегкийзадача

Анаграммы

Напиши функцию `are_anagrams(s1: str, s2: str) -> bool`, которая возвращает True, если строки являются анаграммами (игнорируя регистр и пробелы).

ППридумано ИИ
PythonЛегкийзадача

Генератор Фибоначчи

Напиши генератор `fib()`, который бесконечно генерирует числа Фибоначчи: 0, 1, 1, 2, 3, 5, 8, …

ППридумано ИИ
PythonСреднийзадача

Two Sum

Напиши функцию `two_sum(nums: list[int], target: int) -> tuple[int, int]`, которая возвращает индексы двух чисел из списка, дающих в сумме `target`. Гарантируется, что ровно одно решение существует.

ППридумано ИИ
PythonСреднийзадача

Flatten вложенного списка

Напиши функцию `flatten(lst)`, которая рекурсивно разворачивает произвольно вложенный список в плоский. Например: `flatten([1, [2, [3, 4]], 5])` → `[1, 2, 3, 4, 5]`.

ППридумано ИИ
PythonСреднийзадача

Подстрока без повторяющихся символов

Напиши функцию `length_of_longest_substring(s: str) -> int`, возвращающую длину самой длинной подстроки без повторяющихся символов.

ППридумано ИИ
PythonСреднийзадача

Декоратор для кэширования (memoize)

Напиши декоратор `memoize`, который кэширует результаты вызова функции по её аргументам.

ППридумано ИИ
PythonСреднийзадача

Подсчёт вхождений в вложенной структуре

Напиши функцию `count_occurrences(data, target)`, которая считает, сколько раз значение `target` встречается в произвольно вложенной структуре из списков и словарей.

ППридумано ИИ
PythonСложныйзадача

LRU Cache

Реализуй класс `LRUCache(capacity: int)` с методами: - `get(key) -> int` — вернуть значение или -1 - `put(key, value)` — добавить; при превышении `capacity` удалить наименее недавно использованный элемент.

ППридумано ИИ
PythonСложныйзадача

Группировка анаграмм

Напиши функцию `group_anagrams(words: list[str]) -> list[list[str]]`, которая группирует слова-анаграммы вместе.

ППридумано ИИ
СтатистикаЛегкийвопрос

Что такое p-value

Объясни, что такое p-value. Как правильно его интерпретировать, и что является распространённой ошибкой при интерпретации?

ППридумано ИИ
СтатистикаЛегкийвопрос

Среднее vs. медиана: когда что использовать

В каких случаях медиана предпочтительнее среднего, а в каких — наоборот? Приведи практические примеры из аналитики.

ППридумано ИИ
СтатистикаЛегкийвопрос

Ошибки I и II рода

Что такое ошибки первого и второго рода в статистике? Объясни на примере A/B теста.

ППридумано ИИ
СтатистикаСреднийвопрос

Центральная предельная теорема (ЦПТ)

Сформулируй центральную предельную теорему. Почему она важна для A/B тестирования и анализа данных?

ППридумано ИИ
СтатистикаСреднийвопрос

Теорема Байеса и условная вероятность

Объясни теорему Байеса. Задача: тест на болезнь даёт ложноположительный результат в 5% случаев и ложноотрицательный в 1%. Болеет 0.1% населения. Какова вероятность болезни при положительном тесте?

ППридумано ИИ
СтатистикаСреднийвопрос

Bootstrap-метод

Что такое bootstrap-метод? Когда его применяют и в чём его ключевое преимущество перед параметрическими методами?

ППридумано ИИ
СтатистикаСреднийвопрос

Множественное тестирование

Что такое проблема множественного тестирования? Назови два способа корректировки и объясни разницу между ними.

ППридумано ИИ
СтатистикаСреднийвопрос

Проверка нормальности распределения

Как проверить, нормально ли распределены данные? Назови минимум два теста и один визуальный метод.

ППридумано ИИ
СтатистикаСложныйвопрос

ANOVA: дисперсионный анализ

Что такое ANOVA (дисперсионный анализ) и когда её применяют? Чем однофакторная ANOVA отличается от t-теста?

ППридумано ИИ
СтатистикаСложныйвопрос

Доверительный интервал: что он означает

Объясни, что означает 95% доверительный интервал. Какая интерпретация корректна, а какая — ошибочна?

ППридумано ИИ
A/B тестыЛегкийвопрос

Что такое MDE (минимальный детектируемый эффект)

Что такое MDE в A/B тестировании? Как его задают и от чего он зависит?

ППридумано ИИ
A/B тестыЛегкийвопрос

Единица рандомизации в A/B тесте

Что такое единица рандомизации в A/B тесте? Какие варианты бывают и как выбрать правильный?

ППридумано ИИ
A/B тестыСреднийвопрос

Peeking problem в A/B тестах

Что такое peeking problem (проблема «подглядывания») в A/B тестировании? К каким последствиям приводит?

ППридумано ИИ
A/B тестыСреднийвопрос

SRM (Sample Ratio Mismatch)

Что такое SRM в A/B тесте? Как его обнаружить и каковы основные причины?

ППридумано ИИ
A/B тестыСреднийвопрос

Эффект новизны в A/B тестах

Что такое эффект новизны (novelty effect) в A/B тестировании? Как с ним бороться?

ППридумано ИИ
A/B тестыСреднийвопрос

Guardrail-метрики

Что такое guardrail-метрики в A/B тестировании? Приведи примеры и объясни зачем они нужны.

ППридумано ИИ
A/B тестыСреднийвопрос

Байесовский vs. частотный подход в A/B

В чём разница между байесовским и частотным (frequentist) подходами к A/B тестированию? Назови плюсы и минусы каждого.

ППридумано ИИ
A/B тестыСложныйвопрос

CUPED: снижение дисперсии в A/B тестах

Что такое CUPED (Controlled-experiment Using Pre-Experiment Data) и как он повышает мощность A/B теста?

ППридумано ИИ
A/B тестыСложныйвопрос

Сетевые эффекты в A/B тестах

Почему стандартный A/B тест ненадёжен при наличии сетевых эффектов? Как адаптировать дизайн эксперимента?

ППридумано ИИ
A/B тестыСложныйвопрос

Тестирование редких событий

Первичная метрика — конверсия в покупку (0.5%). Как провести A/B тест при таком низком baseline? Какие альтернативные подходы существуют?

ППридумано ИИ
КейсыЛегкийкейс

Рост отказов на шаге оплаты

Конверсия со страницы оплаты упала на 10% за последние 3 дня. Как будешь диагностировать проблему?

ППридумано ИИ
КейсыСреднийкейс

Падение retention у новых пользователей

7-дневный Retention новых пользователей упал с 35% до 28% за последний месяц. При этом DAU стабилен. Как подойдёшь к анализу?

ППридумано ИИ
КейсыСреднийкейс

Выбор North Star метрики

Ты аналитик в стриминговом сервисе. Продакт просит помочь выбрать North Star метрику. Предложи кандидатов и обоснуй выбор.

ППридумано ИИ
КейсыСреднийкейс

Оценка экономического эффекта фичи

Фича «Быстрая повторная покупка» была запущена по результатам A/B теста: +3% конверсии в повторную покупку. Как перевести это в денежный эффект?

ППридумано ИИ
КейсыСреднийкейс

Метрики жалуются пользователи, но данные в норме

В поддержку поступают жалобы на медленную загрузку приложения. Но средняя скорость в мониторинге в норме — 1.2 сек. Как объяснишь расхождение и что проверишь?

ППридумано ИИ
КейсыСреднийкейс

Аномальный рост одной когорты

Одна когорта пользователей показывает в 2 раза выше Retention, чем остальные. Как это объяснить и что делать?

ППридумано ИИ
КейсыСложныйкейс

Каннибализация: новая фича ест старую

Новый блок рекомендаций «Для вас» показал в A/B тесте +5% к общему CTR. Но команда контента заметила, что просмотры из каталога упали на 7%. Что произошло и как принять решение?

ППридумано ИИ
КейсыСложныйкейс

Построение модели предсказания оттока

Тебе нужно построить модель предсказания оттока пользователей. Опиши процесс: от постановки задачи до внедрения.

ППридумано ИИ
КейсыСложныйкейс

Долгосрочный эффект A/B теста на LTV

A/B тест показал нейтральный результат за 2 недели. Но команда подозревает, что эффект фичи проявляется в долгосрочной перспективе. Как оценить долгосрочный эффект?

ППридумано ИИ
КейсыСложныйкейс

Система рекомендаций: с чего начать

Стартап просит тебя с нуля построить систему рекомендаций для маркетплейса. Опиши архитектуру и как двигаться итерационно.

ППридумано ИИ
SQLЛегкийвопрос

Data Warehouse vs. Data Lake

В чём разница между Data Warehouse и Data Lake? Когда что использовать?

ППридумано ИИ
SQLЛегкийвопрос

ETL vs. ELT: в чём разница

Объясни разницу между ETL и ELT-подходами. Когда применяется каждый?

ППридумано ИИ
SQLЛегкийвопрос

Нормализация баз данных

Что такое нормализация базы данных? Объясни 1NF, 2NF, 3NF на простых примерах.

ППридумано ИИ
СтатистикаСреднийвопрос

Precision и Recall

Объясни precision и recall. Когда важнее одно, а когда другое? Приведи примеры из data-аналитики.

ППридумано ИИ
PythonСреднийвопрос

Обработка пропущенных значений

Какие есть подходы к обработке пропущенных значений? Как выбрать правильный?

ППридумано ИИ
КейсыСреднийвопрос

Метрики для оценки рекомендательной системы

Какие метрики используют для оценки качества рекомендательных систем? Объясни разницу между offline и online оценкой.

ППридумано ИИ
КейсыСреднийвопрос

Как строить дашборд для стейкхолдеров

Продакт просит тебя сделать дашборд для еженедельного совещания. Как подойдёшь к его построению?

ППридумано ИИ
СтатистикаСреднийвопрос

Supervised vs. Unsupervised Learning

В чём разница между supervised и unsupervised learning? Приведи по 2–3 примера задач из аналитики.

ППридумано ИИ
СтатистикаСложныйвопрос

Overfitting: что такое и как бороться

Что такое переобучение (overfitting)? Как его обнаружить и какие методы борьбы существуют?

ППридумано ИИ
СтатистикаСложныйвопрос

Оценка классификации на несбалансированных данных

Датасет: 97% нормальных транзакций, 3% мошеннических. Accuracy = 97%. Насколько хороша модель? Какие метрики использовать?

ППридумано ИИ
ПоведенческиеЛегкийвопрос

Расскажи о себе

Расскажи о себе. (Классический открывающий вопрос HR-скрининга)

ППридумано ИИ
ПоведенческиеЛегкийвопрос

Почему аналитика данных

Почему ты выбрал профессию аналитика данных? Что тебя в ней привлекает?

ППридумано ИИ
ПоведенческиеЛегкийвопрос

Где видишь себя через 3 года

Где вы видите себя через 3 года?

ППридумано ИИ
ПоведенческиеСреднийвопрос

Как работаешь с неопределёнными задачами

Расскажи, как ты работаешь, когда задача сформулирована нечётко или данных недостаточно?

ППридумано ИИ
ПоведенческиеСреднийвопрос

Конфликт с коллегой

Расскажи о случае, когда у тебя возник конфликт с коллегой или членом команды. Как ты его разрешил?

ППридумано ИИ
ПоведенческиеСреднийвопрос

Задача, где данные не дали ответа

Приведи пример задачи, где данных было недостаточно, чтобы дать однозначный ответ. Что ты сделал?

ППридумано ИИ
ПоведенческиеСреднийвопрос

Самый сложный аналитический проект

Расскажи о самом сложном проекте в твоей карьере. Что делало его сложным и как ты с этим справился?

ППридумано ИИ
ПоведенческиеСреднийвопрос

Расстановка приоритетов

Как ты расставляешь приоритеты, когда у тебя несколько задач с одинаково высоким приоритетом?

ППридумано ИИ
ПоведенческиеСложныйвопрос

Убеждение команды через данные

Опиши момент, когда тебе пришлось убеждать команду или менеджера принять решение на основе данных, несмотря на сопротивление.

ППридумано ИИ
ПоведенческиеСложныйвопрос

Провальный проект: чему научил

Расскажи о проекте, который пошёл не по плану или провалился. Что ты из него вынес?