- Jupyter Notebook 98.9%
- Python 1.1%
| Project_11_base_connect_07082022.py | ||
| Project_11_dash_10082022.py | ||
| Project_11_dash_10082022_ver_Ubuntu.py | ||
| Project_11_data_research_10082022.ipynb | ||
| Project_11_global_link.txt | ||
| Project_11_presentation_v2.pdf | ||
| README.md | ||
| readme.txt | ||
YaP_Project_11_DA
Дашборд для Яндeкc.Дзeн
Описание проекта
Мы работаем аналитиком в Яндекс.Дзене. Почти всё наше время занимает анализ пользовательского взаимодействия с карточками статей. Каждую карточку определяют её тема и источник (у него тоже есть тема). Примеры тем: «Красота и здоровье», «Россия», «Путешествия». Пользователей системы характеризует возрастная категория. Скажем, «26-30» или «45+».
Есть три способа взаимодействия пользователей с системой:
- Карточка отображена для пользователя (show);
- Пользователь кликнул на карточку (click);
- Пользователь просмотрел статью карточки (view).
Каждую неделю начинающие менеджеры Денис и Валерия задают вам одни и те же вопросы:
- Сколько взаимодействий пользователей с карточками происходит в системе с разбивкой по темам карточек?
- Как много карточек генерируют источники с разными темами?
- Как соотносятся темы карточек и темы источников?
На шестую неделю работы мы решаем, что процесс пора автоматизировать и нужно сделать дашборд. Дашборд будет основываться на пайплайне, который будет брать данные из таблицы, в которых хранятся сырые данные, трансформировать данные и укладывать их в агрегирующую таблицу. Пайплайн будет разработан для нас дата-инженерами.