Skip to content

Latest commit

 

History

History
81 lines (41 loc) · 7.7 KB

File metadata and controls

81 lines (41 loc) · 7.7 KB

1/ Вивести з/п спеціалістів ML Engineer в 2023 році

2/ Назвати країну (comp_location), в якій зафіксована найменша з/п спеціаліста в сфері Data Scientist в 2023 році

3/ Вивести з/п українців (код країни UA), додати сортування за зростанням з/п

4/ Вивести топ 5 з/п серед усіх спеціалістів, які працюють повністю віддалено (remote_ratio = 100)

5/ Згенерувати .csv файл з таблицею даних всіх спеціалістів, які в 2023 році мали з/п більшу за $100,000 і працювали в компаніях середнього розміру (comp_size = 'M')

6/ Вивести кількість унікальних значень для кожної колонки, що містить текстові значення.

7/ Вивести унікальні значення для кожної колонки, що містить текстові значення. (SELECT DISTINCT column_name FROM salaries)

8/ Вивести середню, мінімальну та максимальну з/п (salary_in_usd) для кожного року (окремими запитами, в кожному з яких впроваджено фільтр відповідного року)

9/ Вивести середню з/п (salary_in_usd) для 2023 року по кожному рівню досвіду працівників (окремими запитами, в кожному з яких впроваджено фільтр року та досвіду).

10/ Вивести 5 найвищих заробітних плат в 2023 році для представників спеціальності ML Engineer. Заробітні плати перевести в гривні

11/ Вивести Унікальні значення колонки remote_ratio, формат даних має бути дробовим з двома знаками після коми, приклад: значення 50 має відображатись в форматі 0.50

12/ Вивести дані таблиці, додавши колонку 'exp_level_full' з повною назвою рівнів досвіду працівників відповідно до колонки exp_level. Визначення: Entry-level (EN), Mid-level (MI), Senior-level (SE), Executive-level (EX)

13 Додатки колонку "salary_category', яка буде відображати різні категорії заробітних плат відповідно до їх значення в колонці 'salary_in_usd'. Визначення: з/п менша за 20 000 - Категорія 1, з/п менша за 50 000 - Категорія 2, з/п менша за 100 000 - Категорія 3, з/п більша за 100 000 - Категорія 4

14/ Дослідити всі колонки на наявність відсутніх значень, порівнявши кількість рядків таблиці з кількістю значень відповідної колонки

15/ Порахувати кількість працівників в таблиці, які в 2023 році працюють на компанії розміру "М" і отримують з/п вищу за $100 000

16/ Вивести всіх співробітників, які в 2023 отримували з/п більшу за $300тис

17/ Вивести всіх співробітників, які в 2023 отримували з/п більшу за $300тис. та не працювали в великих компаніях

18/ Чи є співробітники, які працювали на Українську компанію повністю віддалено?

19/ Вивести всіх співробітників, які в 2023 році працюючи в Німеччині (comp_location = 'DE') отримували з/п більшу за $100тис

20/ Доопрацювати попередній запит: Вивести з результатів тільки ТОП 5 співробітників за рівнем з/п

21/ Додати в попередню таблицю окрім спеціалістів з Німеччини спеціалістів з Канади (CA)

22/ Надати перелік країн, в яких в 2021 році спеціалісти "ML Engineer" та "Data Scientist" отримувати з/п в діапазоні між $50тис і $100тис

23/ Порахувати кількість спеціалістів, які працюючи в середніх компаніях (comp_size = M) та в великих компаніях (comp_size = L) працювали віддалено (remote_ratio=100 або remote_ratio=50)

24/ Вивести кількість країн, які починаються на "С"

25/ Вивести професії, назва яких не складається з трьох слів

26/ Для кожного року навести дані щодо середньої заробітної плати та кількості спеціалістів. Результат експортувати в .csv файл, імпортувати файл в Power BI і побудувати доречну візуалізацію отриманих даних

27/ Для кожного року навести дані щодо середньої заробітної плати та кількості спеціалістів. Результат експортувати в .csv файл, імпортувати файл в Power BI і побудувати доречну візуалізацію отриманих даних

Додаткові задачі для практики (датасет продажу музичних треків):

28/ Порівняти всіх музичних виконавчів за кількістю проданих музичних треків та загальною сумою продажу

29/ Сформувати топ-3 співробітника за рівнем продажів для кожного року

30/ Сформувати топ-3 співробітника за рівнем продажів для кожного року

31/ Надати інформацію про клієнтів, які придбали музичні треки в межах 4 різних жанрів

32/ Сформувати перелік клієнтів, які станом на останній місяць продажів не придбали нічого протягом 1 місяця, 2 місяців, 3 місяців

33/ Сформувати найбільш популярний жанр з числа перших покуплк клієнтів

34/ Сформувати найбільш популярний жанр з числа перших покупок клієнтів

35/ Вивести динаміку продажів музичних треків за останні 3 роки

36/ Дослідити кумулятивну суму продажів для кожного замовника

37/ Розрахувати середній чек

38/ Розрахувати середню загальну суму продажу в перерахунку на одного замовника

39/ Розрахувати середню загальну суму продажу в перерахунку на одного замовника

40/ Розрахувати середню тривалість періоду між першою покупкою і другою