Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37
Warning: file_put_contents(aCache/aDaily/post/smart_data_channel/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50 Smart Data@smart_data_channel P.23
Всем привет. Продолжаю писать про hard-skills, которыми должны обладать специалисты по данным. В прошлых постах я описал навыки для специалистов вне зависимости от позиции, для web-аналитика и инженера данных. Сегодня я опишу навыки для BI-разработчика, аналитика данных, продуктового аналитика и data scientist.
Итак,
BI Engineer: 1) Углублённые знания хотя бы одного BI-инструмента (как правило, Power BI, Tableau) 2) Базовые знания баз данных 3) Знание SQL 4) Навыки установки и администрирования BI-сервера: Power BI Report Server, Tableau Server или др. 5) Понимание параметров и показателей предметной области (маркетинг, продажи, финансы и т.д.) 6) Навыки анализа данных (сегментирование, контекст)
Data Analyst: 1) Знание предметной области. Если вы не понимаете основные концепции предмета вашего анализа, вы просто не сможете строить разумные гипотезы и предоставлять рекомендации бизнесу. Т.е. если вы работаете аналитиком данных в маркетинге, вы должны понимать базовые концепции маркетинга: что есть рынок продавцов и рынок покупателей, есть различные каналы привлечения трафика на сайт, есть такие метрики, как CPC, CPA, CPL, AOV, CAC, ROAS, LTV и т.д. 2) Знания Excel/Google Spreadsheets. Многие думают, что Excel - прошлый век, и кричат что-то типа "Вы что, Excel используете, вы серьёзно???" Но скажу по своему опыту: обычный Excel меня не раз спасал, когда мне нужно было быстро сделать какой-то ad-hoc отчёт или нужно было собрать статистику с разных аккаунтов Google Analytics, при этом применяя различные фильтры. Я понимал, что на автоматизацию может уйти больше времени, чем я просто вручную внесу цифры в таблички и построю базовые графики. Так что, не нужно категорично относиться только потому, что у него нет модных слов "databricks", "data platform" и т.д. Я во многих вакансиях встречал Excel как обязательное требование для всех аналитиков. 2) SQL - преимущественно DML 3) Python или R. Про R знаю плохо. Если собираетесь использовать Python, то нужно знать базовый синтаксис, уметь работать с различными типами файлов (CSV, Excel, JSON, XML), уметь подключаться к базе данных и импортировать данные себе в среду, владеть библиотеками Pandas и Numpy, владеть библиотеками для визуализации данных (Matplotlib, Plotly, Seaborn) 4) Знание статистики: описательные статистики, математическая статистика, тестирование гипотез, регрессия 5) Базовые знания Machine Learning: feature engineering, линейная и логистическая регрессия, k-means, matrix factorization, ARMA, ARIMA (для продвинутых специалистов)
Product Analyst: 1) Понимать основные метрики продукта: ARPU, ARPC, Retention Rate, Churn Rate, LTV и т.д. 2) Владеть основными фреймворками для продуктовой аналитики: когортный анализ, RFM-анализ и др. 3) Иметь навыки работы с Google Analytics и Google Tag Manager 4) Иметь навыки работы с сервисами аналитики для мобильных приложений: Flurry, Mixpanel и др. 5) Уметь проводить А/Б-тестирования и владеть инструментами для их проведения (Google Optimize, Arise и др.) 6) Знание SQL 7) Python или R 8) Знание статистики - преимущественно тестирование гипотез (p-value и всё такое)
Data Scientist: 1) Знание баз данных и SQL 2) Знание Python (базовый синтаксис, библиотеки Pandas, Numpy, Matplotlib, Plotly) 3) Знание основ Linux 4) Знание алгоритмов и структур данных 5) Углублённые знания статистики 6) Знания линейной алгебры 7) Знание основных алгоритмов машинного обучения (линейная и логистическая регрессия, k-means, matrix factorization, дерево решений, нейронные сети) 8) Знание Deep Learning
P.S. В некоторых специализациях разбираюсь не очень хорошо, так что подправьте меня, если чего-то не упомянул
Всем привет. Продолжаю писать про hard-skills, которыми должны обладать специалисты по данным. В прошлых постах я описал навыки для специалистов вне зависимости от позиции, для web-аналитика и инженера данных. Сегодня я опишу навыки для BI-разработчика, аналитика данных, продуктового аналитика и data scientist.
Итак,
BI Engineer: 1) Углублённые знания хотя бы одного BI-инструмента (как правило, Power BI, Tableau) 2) Базовые знания баз данных 3) Знание SQL 4) Навыки установки и администрирования BI-сервера: Power BI Report Server, Tableau Server или др. 5) Понимание параметров и показателей предметной области (маркетинг, продажи, финансы и т.д.) 6) Навыки анализа данных (сегментирование, контекст)
Data Analyst: 1) Знание предметной области. Если вы не понимаете основные концепции предмета вашего анализа, вы просто не сможете строить разумные гипотезы и предоставлять рекомендации бизнесу. Т.е. если вы работаете аналитиком данных в маркетинге, вы должны понимать базовые концепции маркетинга: что есть рынок продавцов и рынок покупателей, есть различные каналы привлечения трафика на сайт, есть такие метрики, как CPC, CPA, CPL, AOV, CAC, ROAS, LTV и т.д. 2) Знания Excel/Google Spreadsheets. Многие думают, что Excel - прошлый век, и кричат что-то типа "Вы что, Excel используете, вы серьёзно???" Но скажу по своему опыту: обычный Excel меня не раз спасал, когда мне нужно было быстро сделать какой-то ad-hoc отчёт или нужно было собрать статистику с разных аккаунтов Google Analytics, при этом применяя различные фильтры. Я понимал, что на автоматизацию может уйти больше времени, чем я просто вручную внесу цифры в таблички и построю базовые графики. Так что, не нужно категорично относиться только потому, что у него нет модных слов "databricks", "data platform" и т.д. Я во многих вакансиях встречал Excel как обязательное требование для всех аналитиков. 2) SQL - преимущественно DML 3) Python или R. Про R знаю плохо. Если собираетесь использовать Python, то нужно знать базовый синтаксис, уметь работать с различными типами файлов (CSV, Excel, JSON, XML), уметь подключаться к базе данных и импортировать данные себе в среду, владеть библиотеками Pandas и Numpy, владеть библиотеками для визуализации данных (Matplotlib, Plotly, Seaborn) 4) Знание статистики: описательные статистики, математическая статистика, тестирование гипотез, регрессия 5) Базовые знания Machine Learning: feature engineering, линейная и логистическая регрессия, k-means, matrix factorization, ARMA, ARIMA (для продвинутых специалистов)
Product Analyst: 1) Понимать основные метрики продукта: ARPU, ARPC, Retention Rate, Churn Rate, LTV и т.д. 2) Владеть основными фреймворками для продуктовой аналитики: когортный анализ, RFM-анализ и др. 3) Иметь навыки работы с Google Analytics и Google Tag Manager 4) Иметь навыки работы с сервисами аналитики для мобильных приложений: Flurry, Mixpanel и др. 5) Уметь проводить А/Б-тестирования и владеть инструментами для их проведения (Google Optimize, Arise и др.) 6) Знание SQL 7) Python или R 8) Знание статистики - преимущественно тестирование гипотез (p-value и всё такое)
Data Scientist: 1) Знание баз данных и SQL 2) Знание Python (базовый синтаксис, библиотеки Pandas, Numpy, Matplotlib, Plotly) 3) Знание основ Linux 4) Знание алгоритмов и структур данных 5) Углублённые знания статистики 6) Знания линейной алгебры 7) Знание основных алгоритмов машинного обучения (линейная и логистическая регрессия, k-means, matrix factorization, дерево решений, нейронные сети) 8) Знание Deep Learning
P.S. В некоторых специализациях разбираюсь не очень хорошо, так что подправьте меня, если чего-то не упомянул
As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. Earlier, crypto enthusiasts had created a self-described “meme app” dubbed “gm” app wherein users would greet each other with “gm” or “good morning” messages. However, in September 2021, the gm app was down after a hacker reportedly gained access to the user data. Telegram channels fall into two types: Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. Matt Hussey, editorial director of NEAR Protocol (and former editor-in-chief of Decrypt) responded to the news of the Telegram group with “#meIRL.”
from us