Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/smart_data_channel/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50
Smart Data@smart_data_channel P.23
SMART_DATA_CHANNEL Telegram 23
#easy

Всем привет. Продолжаю писать про hard-skills, которыми должны обладать специалисты по данным. В прошлых постах я описал навыки для специалистов вне зависимости от позиции, для web-аналитика и инженера данных. Сегодня я опишу навыки для BI-разработчика, аналитика данных, продуктового аналитика и data scientist.

Итак,

BI Engineer:
1) Углублённые знания хотя бы одного BI-инструмента (как правило, Power BI, Tableau)
2) Базовые знания баз данных
3) Знание SQL
4) Навыки установки и администрирования BI-сервера: Power BI Report Server, Tableau Server или др.
5) Понимание параметров и показателей предметной области (маркетинг, продажи, финансы и т.д.)
6) Навыки анализа данных (сегментирование, контекст)

Data Analyst:
1) Знание предметной области. Если вы не понимаете основные концепции предмета вашего анализа, вы просто не сможете строить разумные гипотезы и предоставлять рекомендации бизнесу. Т.е. если вы работаете аналитиком данных в маркетинге, вы должны понимать базовые концепции маркетинга: что есть рынок продавцов и рынок покупателей, есть различные каналы привлечения трафика на сайт, есть такие метрики, как CPC, CPA, CPL, AOV, CAC, ROAS, LTV и т.д.
2) Знания Excel/Google Spreadsheets. Многие думают, что Excel - прошлый век, и кричат что-то типа "Вы что, Excel используете, вы серьёзно???" Но скажу по своему опыту: обычный Excel меня не раз спасал, когда мне нужно было быстро сделать какой-то ad-hoc отчёт или нужно было собрать статистику с разных аккаунтов Google Analytics, при этом применяя различные фильтры. Я понимал, что на автоматизацию может уйти больше времени, чем я просто вручную внесу цифры в таблички и построю базовые графики. Так что, не нужно категорично относиться только потому, что у него нет модных слов "databricks", "data platform" и т.д. Я во многих вакансиях встречал Excel как обязательное требование для всех аналитиков.
2) SQL - преимущественно DML
3) Python или R. Про R знаю плохо. Если собираетесь использовать Python, то нужно знать базовый синтаксис, уметь работать с различными типами файлов (CSV, Excel, JSON, XML), уметь подключаться к базе данных и импортировать данные себе в среду, владеть библиотеками Pandas и Numpy, владеть библиотеками для визуализации данных (Matplotlib, Plotly, Seaborn)
4) Знание статистики: описательные статистики, математическая статистика, тестирование гипотез, регрессия
5) Базовые знания Machine Learning: feature engineering, линейная и логистическая регрессия, k-means, matrix factorization, ARMA, ARIMA (для продвинутых специалистов)

Product Analyst:
1) Понимать основные метрики продукта: ARPU, ARPC, Retention Rate, Churn Rate, LTV и т.д.
2) Владеть основными фреймворками для продуктовой аналитики: когортный анализ, RFM-анализ и др.
3) Иметь навыки работы с Google Analytics и Google Tag Manager
4) Иметь навыки работы с сервисами аналитики для мобильных приложений: Flurry, Mixpanel и др.
5) Уметь проводить А/Б-тестирования и владеть инструментами для их проведения (Google Optimize, Arise и др.)
6) Знание SQL
7) Python или R
8) Знание статистики - преимущественно тестирование гипотез (p-value и всё такое)

Data Scientist:
1) Знание баз данных и SQL
2) Знание Python (базовый синтаксис, библиотеки Pandas, Numpy, Matplotlib, Plotly)
3) Знание основ Linux
4) Знание алгоритмов и структур данных
5) Углублённые знания статистики
6) Знания линейной алгебры
7) Знание основных алгоритмов машинного обучения (линейная и логистическая регрессия, k-means, matrix factorization, дерево решений, нейронные сети)
8) Знание Deep Learning

P.S. В некоторых специализациях разбираюсь не очень хорошо, так что подправьте меня, если чего-то не упомянул



tgoop.com/smart_data_channel/23
Create:
Last Update:

#easy

Всем привет. Продолжаю писать про hard-skills, которыми должны обладать специалисты по данным. В прошлых постах я описал навыки для специалистов вне зависимости от позиции, для web-аналитика и инженера данных. Сегодня я опишу навыки для BI-разработчика, аналитика данных, продуктового аналитика и data scientist.

Итак,

BI Engineer:
1) Углублённые знания хотя бы одного BI-инструмента (как правило, Power BI, Tableau)
2) Базовые знания баз данных
3) Знание SQL
4) Навыки установки и администрирования BI-сервера: Power BI Report Server, Tableau Server или др.
5) Понимание параметров и показателей предметной области (маркетинг, продажи, финансы и т.д.)
6) Навыки анализа данных (сегментирование, контекст)

Data Analyst:
1) Знание предметной области. Если вы не понимаете основные концепции предмета вашего анализа, вы просто не сможете строить разумные гипотезы и предоставлять рекомендации бизнесу. Т.е. если вы работаете аналитиком данных в маркетинге, вы должны понимать базовые концепции маркетинга: что есть рынок продавцов и рынок покупателей, есть различные каналы привлечения трафика на сайт, есть такие метрики, как CPC, CPA, CPL, AOV, CAC, ROAS, LTV и т.д.
2) Знания Excel/Google Spreadsheets. Многие думают, что Excel - прошлый век, и кричат что-то типа "Вы что, Excel используете, вы серьёзно???" Но скажу по своему опыту: обычный Excel меня не раз спасал, когда мне нужно было быстро сделать какой-то ad-hoc отчёт или нужно было собрать статистику с разных аккаунтов Google Analytics, при этом применяя различные фильтры. Я понимал, что на автоматизацию может уйти больше времени, чем я просто вручную внесу цифры в таблички и построю базовые графики. Так что, не нужно категорично относиться только потому, что у него нет модных слов "databricks", "data platform" и т.д. Я во многих вакансиях встречал Excel как обязательное требование для всех аналитиков.
2) SQL - преимущественно DML
3) Python или R. Про R знаю плохо. Если собираетесь использовать Python, то нужно знать базовый синтаксис, уметь работать с различными типами файлов (CSV, Excel, JSON, XML), уметь подключаться к базе данных и импортировать данные себе в среду, владеть библиотеками Pandas и Numpy, владеть библиотеками для визуализации данных (Matplotlib, Plotly, Seaborn)
4) Знание статистики: описательные статистики, математическая статистика, тестирование гипотез, регрессия
5) Базовые знания Machine Learning: feature engineering, линейная и логистическая регрессия, k-means, matrix factorization, ARMA, ARIMA (для продвинутых специалистов)

Product Analyst:
1) Понимать основные метрики продукта: ARPU, ARPC, Retention Rate, Churn Rate, LTV и т.д.
2) Владеть основными фреймворками для продуктовой аналитики: когортный анализ, RFM-анализ и др.
3) Иметь навыки работы с Google Analytics и Google Tag Manager
4) Иметь навыки работы с сервисами аналитики для мобильных приложений: Flurry, Mixpanel и др.
5) Уметь проводить А/Б-тестирования и владеть инструментами для их проведения (Google Optimize, Arise и др.)
6) Знание SQL
7) Python или R
8) Знание статистики - преимущественно тестирование гипотез (p-value и всё такое)

Data Scientist:
1) Знание баз данных и SQL
2) Знание Python (базовый синтаксис, библиотеки Pandas, Numpy, Matplotlib, Plotly)
3) Знание основ Linux
4) Знание алгоритмов и структур данных
5) Углублённые знания статистики
6) Знания линейной алгебры
7) Знание основных алгоритмов машинного обучения (линейная и логистическая регрессия, k-means, matrix factorization, дерево решений, нейронные сети)
8) Знание Deep Learning

P.S. В некоторых специализациях разбираюсь не очень хорошо, так что подправьте меня, если чего-то не упомянул

BY Smart Data


Share with your friend now:
tgoop.com/smart_data_channel/23

View MORE
Open in Telegram


Telegram News

Date: |

As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. Earlier, crypto enthusiasts had created a self-described “meme app” dubbed “gm” app wherein users would greet each other with “gm” or “good morning” messages. However, in September 2021, the gm app was down after a hacker reportedly gained access to the user data. Telegram channels fall into two types: Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. Matt Hussey, editorial director of NEAR Protocol (and former editor-in-chief of Decrypt) responded to the news of the Telegram group with “#meIRL.”
from us


Telegram Smart Data
FROM American