Если бы вы нанимали Chief Data Officer'а в большую компанию, что бы вы ожидали от него и что спрашивали на входе?
😁19❤4👍1
А теперь представьте, что вы выбираете, в какую компанию пойти работать как Chief Data Officer. На что вы бы обращали внимание? (Помимо зарплаты и в каком городе офис))
😁9😈2👍1
Продолжая тему соревнований: МТС в своем канале пишет, что на их True Tech Champ можно будет как порешать задачки на алгоритмы, так и поучаствовать в битве роботов. Выглядит как довольно неплохой способ развлечься :)
По своему опыту с МТС True Tech проектами могу сказать, что коллеги очень круто вкладываются в проведение True Tech Champ и True Tech Conf, так что должно быть классно.
По своему опыту с МТС True Tech проектами могу сказать, что коллеги очень круто вкладываются в проведение True Tech Champ и True Tech Conf, так что должно быть классно.
❤10🤔5👍1👎1
Forwarded from МТС True Tech Champ
МТС True Tech Champ 2025: измерение технологий
Запускаем третий сезон ИТ-чемпионата по программированию! В этом году он станет еще масштабнее, а задания — сложнее. Листай карточки, чтобы узнать подробности. Рассказали о треках, формате соревнований, призовом фонде и программе офлайн-мероприятия.
Успей зарегистрироваться до 20 октября, если планируешь участвовать 😉
Запускаем третий сезон ИТ-чемпионата по программированию! В этом году он станет еще масштабнее, а задания — сложнее. Листай карточки, чтобы узнать подробности. Рассказали о треках, формате соревнований, призовом фонде и программе офлайн-мероприятия.
Успей зарегистрироваться до 20 октября, если планируешь участвовать 😉
❤14👍2🔥1
Визуализация, которой пользуются: правила для составления дашбордов
Красивый дашборд, все кивают, а решение принимают интуитивно. Видели? Я видел десятки раз. Проблема не в данных, а в том, что экран не отвечает на управленческий вопрос.
Как это починить:
1️⃣ Сначала вопрос, потом график. Что именно хотим решить: перераспределить бюджет, снять риск, ускорить воронку. Если вопроса нет, втыкание в дашборд в 90% случаев только ест время.
2️⃣ Один экран — один тезис. Если тезисов два, это два экрана. Концентрация конечна.
3️⃣ Единицы и масштабы без сюрпризов. Подписи в явных единицах, проценты форматированы, шкала с нуля, если это не разрушает смысл.
4️⃣ Сравнение обязательно. Вчера, план, соседний кластер. Без контекста цифра - это просто красивая цифра.
5️⃣ Действие в зависимости от данных. Внизу экрана if-else: если метрика падает - что делаем завтра, если растет - что усиливаем.
Практические проверки, которые реально помогают:
⚠️ Если смысл не считывается за 5 секунд, меняем визуал или выносим тезис в заголовок.
⚠️ Если по информации на экране нельзя принять решение, убираем декоративный шум и добавляем то, чего не хватает для принятия решения :)
⚠️ Если спорите о цифрах, а не о действиях, значит нет понятной операционализации метрики.
К сожалению, на совещаниях и комитетах, где уже нужно принять 5-10 решений за час-два, уже некогда копать. Если из вашего дашборда непонятно, что делать дальше, на этих встречах будут смотреть не на него, а на экспрессивность каждого оратора за столом и заботливо подготовленные и положенные на слайды графики, а значит решение станет еще дальше от реальных данных и появится лишний простор для манипуляций. Дашборды работают, когда вся организация использует как источник информации именно одни и те же дашборды, а не десяток различных картинок из десятка различных презентаций десятка заинтересованных лиц.
Красивый дашборд, все кивают, а решение принимают интуитивно. Видели? Я видел десятки раз. Проблема не в данных, а в том, что экран не отвечает на управленческий вопрос.
Как это починить:
1️⃣ Сначала вопрос, потом график. Что именно хотим решить: перераспределить бюджет, снять риск, ускорить воронку. Если вопроса нет, втыкание в дашборд в 90% случаев только ест время.
2️⃣ Один экран — один тезис. Если тезисов два, это два экрана. Концентрация конечна.
3️⃣ Единицы и масштабы без сюрпризов. Подписи в явных единицах, проценты форматированы, шкала с нуля, если это не разрушает смысл.
4️⃣ Сравнение обязательно. Вчера, план, соседний кластер. Без контекста цифра - это просто красивая цифра.
5️⃣ Действие в зависимости от данных. Внизу экрана if-else: если метрика падает - что делаем завтра, если растет - что усиливаем.
Практические проверки, которые реально помогают:
⚠️ Если смысл не считывается за 5 секунд, меняем визуал или выносим тезис в заголовок.
⚠️ Если по информации на экране нельзя принять решение, убираем декоративный шум и добавляем то, чего не хватает для принятия решения :)
⚠️ Если спорите о цифрах, а не о действиях, значит нет понятной операционализации метрики.
К сожалению, на совещаниях и комитетах, где уже нужно принять 5-10 решений за час-два, уже некогда копать. Если из вашего дашборда непонятно, что делать дальше, на этих встречах будут смотреть не на него, а на экспрессивность каждого оратора за столом и заботливо подготовленные и положенные на слайды графики, а значит решение станет еще дальше от реальных данных и появится лишний простор для манипуляций. Дашборды работают, когда вся организация использует как источник информации именно одни и те же дашборды, а не десяток различных картинок из десятка различных презентаций десятка заинтересованных лиц.
1💯32👍12🔥9❤5
Как считать эффект от AI без магии
"Модель повысит прибыль на X процентов". Звучит бодро, но что именно считать и как не самообмануться? 🤔
Много раз наблюдал у DSов кейс: команда принесла красивый AUC и демо. Далее звучат вопросы руководителя: где деньги, какие риски и срок окупаемости? И тут все резко усложняется.
Если коротко, рабочая схема такая:
🎯 Сформулируйте бизнес-единицу эффекта: деньги / время / риск. Пример: плюс рубли к выручке, минус часы операции, минус вероятность дефекта.
🔗 Привяжите модель к решению: какое действие изменится? (раньше звонили всем - теперь звоним топ 20 процентов скоринга)
🧮 Посчитайте дельту: uplift к текущему подходу.
🧱 Оцените инфраструктурные издержки: железо, лицензии, люди, поддержка, деградация качества и дальнейшая поддержка.
🧪 Сделайте контрольный A/B-эксперимент, длительность не меньше одного бизнес цикла и достаточная для статзначимости допустимого для бизнеса прироста (как минимум покрывающего затраты, но обычно - дающего хороший ROI).
📊 Финал: P&L табличка на 12 месяцев: эффект - затраты = маржа. Сценарии: базовый, оптимистичный, пессимистичный.
Чудес не бывает: крутая модель без внедрения в процессы = просто презентация с красивыми картинками, а даже простая эвристика, встроенная в бизнес-процесс может давать реальный прирост денег 💸 Выбор, что делать (и что не делать) в основном диктуется в коммерческой компании экономикой.
Как вы сейчас считаете экономику своих ML внедрений? Что чаще всего стреляет в ногу - доступность и качество данных, точность моделей, процессы или ожидания?
"Модель повысит прибыль на X процентов". Звучит бодро, но что именно считать и как не самообмануться? 🤔
Много раз наблюдал у DSов кейс: команда принесла красивый AUC и демо. Далее звучат вопросы руководителя: где деньги, какие риски и срок окупаемости? И тут все резко усложняется.
Если коротко, рабочая схема такая:
🎯 Сформулируйте бизнес-единицу эффекта: деньги / время / риск. Пример: плюс рубли к выручке, минус часы операции, минус вероятность дефекта.
🔗 Привяжите модель к решению: какое действие изменится? (раньше звонили всем - теперь звоним топ 20 процентов скоринга)
🧮 Посчитайте дельту: uplift к текущему подходу.
🧱 Оцените инфраструктурные издержки: железо, лицензии, люди, поддержка, деградация качества и дальнейшая поддержка.
🧪 Сделайте контрольный A/B-эксперимент, длительность не меньше одного бизнес цикла и достаточная для статзначимости допустимого для бизнеса прироста (как минимум покрывающего затраты, но обычно - дающего хороший ROI).
📊 Финал: P&L табличка на 12 месяцев: эффект - затраты = маржа. Сценарии: базовый, оптимистичный, пессимистичный.
Чудес не бывает: крутая модель без внедрения в процессы = просто презентация с красивыми картинками, а даже простая эвристика, встроенная в бизнес-процесс может давать реальный прирост денег 💸 Выбор, что делать (и что не делать) в основном диктуется в коммерческой компании экономикой.
Как вы сейчас считаете экономику своих ML внедрений? Что чаще всего стреляет в ногу - доступность и качество данных, точность моделей, процессы или ожидания?
❤25👍11🫡8
Истории успеха - это часто истории выживших, уверовавших в себя после подмены причин и следствий 🤔
Читаешь или слушаешь: человек «поверил в себя», сделал «смелый шаг» - и вот она, карьера/экзит/прорыв. Красиво. Но за кадром остаются десятки тех, кто сделал то же самое и не взлетел. Мы читаем не правило, а исключение, у которого всё совпало: контекст, тайминг, люди рядом, удача.
Пара наблюдений из практики:
- Сверяйте урок с распределением, а не с яркой биографией. Если тезис не выдерживает «а что с теми, кто делал так же, но…», перед вами байка, а не принцип.
- Ищите контр-примеры. «Уровень менеджера измеряется стоимостью его ошибки» - звучит броско, пока не вспомнишь авиадиспетчера, оператора на АЭС, хирурга. Там ставка ошибки запредельна, но это не «самые большие менеджеры». Значит, метрика - мимо.
- Проверяйте переносимость правил. Лозунг «рискуй» в венчуре и в операционке критической инфраструктуры - разные виды спорта.
- Отделяйте агентность от везения. Да, усилия важны. Но одинаковые усилия в разных контекстах дают разный результат.
Ещё один неприятный угол: легче рассуждать о «силе воли» и «правильных решениях», когда тебя не прижимало жизнью. Кто не попадал жёстко, часто недооценивает роль случайности, здоровья, семейных обстоятельств, войны, регуляторики - всего, что сильнее любого «майндсета».
Это не повод перестать вдохновляться примерами. Просто держим в голове фильтр: история ≠ инструкция, яркая судьба ≠ доказательство правила. И главное - если вы сделали всё, что могли, а не получилось, это не автоматически «ваша вина». В игре всегда много факторов, часть из них вне нашего контроля.
А какие «красивые правила» вам приходилось пересматривать после столкновения с реальностью?
Читаешь или слушаешь: человек «поверил в себя», сделал «смелый шаг» - и вот она, карьера/экзит/прорыв. Красиво. Но за кадром остаются десятки тех, кто сделал то же самое и не взлетел. Мы читаем не правило, а исключение, у которого всё совпало: контекст, тайминг, люди рядом, удача.
Пара наблюдений из практики:
- Сверяйте урок с распределением, а не с яркой биографией. Если тезис не выдерживает «а что с теми, кто делал так же, но…», перед вами байка, а не принцип.
- Ищите контр-примеры. «Уровень менеджера измеряется стоимостью его ошибки» - звучит броско, пока не вспомнишь авиадиспетчера, оператора на АЭС, хирурга. Там ставка ошибки запредельна, но это не «самые большие менеджеры». Значит, метрика - мимо.
- Проверяйте переносимость правил. Лозунг «рискуй» в венчуре и в операционке критической инфраструктуры - разные виды спорта.
- Отделяйте агентность от везения. Да, усилия важны. Но одинаковые усилия в разных контекстах дают разный результат.
Ещё один неприятный угол: легче рассуждать о «силе воли» и «правильных решениях», когда тебя не прижимало жизнью. Кто не попадал жёстко, часто недооценивает роль случайности, здоровья, семейных обстоятельств, войны, регуляторики - всего, что сильнее любого «майндсета».
Это не повод перестать вдохновляться примерами. Просто держим в голове фильтр: история ≠ инструкция, яркая судьба ≠ доказательство правила. И главное - если вы сделали всё, что могли, а не получилось, это не автоматически «ваша вина». В игре всегда много факторов, часть из них вне нашего контроля.
А какие «красивые правила» вам приходилось пересматривать после столкновения с реальностью?
👍71💯35🔥29❤16
В этом году меня позвали в экспертный совет премии RuCode и я сразу согласился, во многом из интереса к тому, какие будут заявки, кто будет подаваться и с какими проектами :)
Оказалось, у премии аж 11 номинаций за популяризацию и использование ИИ. Так что возможностей проявить себя у участников много.
Поучаствовать могут:
образовательные и научные организации
преподаватели школ, СПО и вузов
школьники и студенты
разработчики и исследователи
популяризаторы науки и блогеры
На тему пробовать/не пробовать участвовать: раньше я довольно сдержанно относился ко всякого рода премиям, пока одна из них не дала мне классную карьерную возможность. Также может получиться и у вас: генеральный партнер премии - компания MWS (отвечающая за IT в экосистеме МТС), также в партнерах есть Сбер и Астра, так что есть возможность не только потешить эго и испытать соревновательный азарт, но и засветиться на HR-радарах крупных компаний
Заявку можно заполнить на сайте до 20 октября ⚡️
Оказалось, у премии аж 11 номинаций за популяризацию и использование ИИ. Так что возможностей проявить себя у участников много.
Поучаствовать могут:
образовательные и научные организации
преподаватели школ, СПО и вузов
школьники и студенты
разработчики и исследователи
популяризаторы науки и блогеры
На тему пробовать/не пробовать участвовать: раньше я довольно сдержанно относился ко всякого рода премиям, пока одна из них не дала мне классную карьерную возможность. Также может получиться и у вас: генеральный партнер премии - компания MWS (отвечающая за IT в экосистеме МТС), также в партнерах есть Сбер и Астра, так что есть возможность не только потешить эго и испытать соревновательный азарт, но и засветиться на HR-радарах крупных компаний
Заявку можно заполнить на сайте до 20 октября ⚡️
❤18🔥8🤯5👍4🤔2
Возвращаюсь сейчас с data driven top 100 из Черногории (очень необычная конфа для топов аналитики и CDO без заготовленных докладов с максимумом нетворка и обсуждения реально интересных для руководителя тем). Вспомнил, насколько ж это круто три дня подряд плотно пообщаться с умными людьми из твоей сферы и с похожим бэкграундом.
Как отрефлексирую, напишу подробнее, но главное - решил еще больше времени уделять общению с коллегами по цеху, т.к. три дня конфы показали, насколько это дает и много ценных идей, и хорошую такую моральную поддержку :)
Как отрефлексирую, напишу подробнее, но главное - решил еще больше времени уделять общению с коллегами по цеху, т.к. три дня конфы показали, насколько это дает и много ценных идей, и хорошую такую моральную поддержку :)
🔥60❤20👍8
Как поступить в ШАД: часть 1
Все знают, что в Школу Анализа Данных Яндекса очень непросто поступить, но многие все равно туда очень хотят. Проблема в чем: желающих так много, что просто поговорить с ними недостаточно, приходится делать вступительные, которые за долгое время стали многоступенчатыми. Вопрос в том, что спрашивать на таких вступительных. Коллеги из Яндекса, когда много лет назад вводили экзамен, поступили просто: начали давать задачки на высшмат и алгоритмы, потому что это вроде как неплохо знать до обучения, и потому что понятно как проверять и дает относительно честный способ для ранжирования.
Отдельный момент, что человек, который разложит функцию в степенной ряд без ошибок, и человек, который где-то налажает в арифметике, не факт что имеют разный потенциал в изучении анализа данных и ML в частности. Но тут логика в другом: поступающих так много, что просто нужна какая-то процедура ранжирования, которая будет более-менее стабильна и к ней можно будет подготовиться.
Раньше подготовка (рассказываю на примере однокурсника с Физтеха) была устроена так: смотришь темы экзамена, обкладываешься учебниками по матану, линалу, теорверу и алгоритмам, и вспоминаешь изученное на Физтехе или в МГУ (сюрприз, после появления письменного экзамена просто того что ты там учился и все расшарил могло не хватить, надо было готовиться). И даже тогда были "залетные" ребята из других вузов, но их было мало и часто готовились они по принципу "иду к преподу с мехмата и прошу подсказать, что читать и что разбирать, чтобы такое решить". Надо заметить, что если препода с условного мехмата такое спрашивал кто-то из, например, РУДН или МИСиС, препод обычно не отказывал в помощи (в тех историях, которые знаю). Потому что это настолько редкая и уникальная ситуация, что человек тянется к настолько дополнительным знаниям, что помочь такому человеку очень хочется.
Продолжение следует
Все знают, что в Школу Анализа Данных Яндекса очень непросто поступить, но многие все равно туда очень хотят. Проблема в чем: желающих так много, что просто поговорить с ними недостаточно, приходится делать вступительные, которые за долгое время стали многоступенчатыми. Вопрос в том, что спрашивать на таких вступительных. Коллеги из Яндекса, когда много лет назад вводили экзамен, поступили просто: начали давать задачки на высшмат и алгоритмы, потому что это вроде как неплохо знать до обучения, и потому что понятно как проверять и дает относительно честный способ для ранжирования.
Отдельный момент, что человек, который разложит функцию в степенной ряд без ошибок, и человек, который где-то налажает в арифметике, не факт что имеют разный потенциал в изучении анализа данных и ML в частности. Но тут логика в другом: поступающих так много, что просто нужна какая-то процедура ранжирования, которая будет более-менее стабильна и к ней можно будет подготовиться.
Раньше подготовка (рассказываю на примере однокурсника с Физтеха) была устроена так: смотришь темы экзамена, обкладываешься учебниками по матану, линалу, теорверу и алгоритмам, и вспоминаешь изученное на Физтехе или в МГУ (сюрприз, после появления письменного экзамена просто того что ты там учился и все расшарил могло не хватить, надо было готовиться). И даже тогда были "залетные" ребята из других вузов, но их было мало и часто готовились они по принципу "иду к преподу с мехмата и прошу подсказать, что читать и что разбирать, чтобы такое решить". Надо заметить, что если препода с условного мехмата такое спрашивал кто-то из, например, РУДН или МИСиС, препод обычно не отказывал в помощи (в тех историях, которые знаю). Потому что это настолько редкая и уникальная ситуация, что человек тянется к настолько дополнительным знаниям, что помочь такому человеку очень хочется.
Продолжение следует
🔥35❤25
Как поступить в ШАД часть 2
С тех пор много воды утекло, и теперь есть много всяких материалов в открытом доступе. Это и задания ШАД прошлых лет и инструкции, что нужно ботать и зачем. Так то теперь у гораздо большего числа людей есть возможность поступить, но надо будет ботать и тщательно выбирать, где.
Важная ремарка: понятно, что как и везде в жизни на экзаменах вы можете найти кого-то, кто поможет вам сжульничать. Я призываю вас ни в коем случае так не делать, потому что иначе вы во-первых будете чужим в дружной семье ШАДа, и это будет культурная трещина, которая с годами расползется дальше и вырастет до пропасти, а во-вторых это просто самообман.
Ну и, наконец, в репосте ниже есть несколько ссылок на материалы для подготовки к ШАД в открытом доступе от нашего лектора по математике в MLinside Сергея Жесткова. Кроме того, если вам прям хочется поработать с преподом и поучиться в группе с другими людьми, планирующими поступать в ШАД - у Сергея есть собственный проект где сейчас начинается новый поток.
Продолжение все еще следует, часть 3 будет чуть позже и там поделюсь своими любимыми задачками со вступительных ШАД
С тех пор много воды утекло, и теперь есть много всяких материалов в открытом доступе. Это и задания ШАД прошлых лет и инструкции, что нужно ботать и зачем. Так то теперь у гораздо большего числа людей есть возможность поступить, но надо будет ботать и тщательно выбирать, где.
Важная ремарка: понятно, что как и везде в жизни на экзаменах вы можете найти кого-то, кто поможет вам сжульничать. Я призываю вас ни в коем случае так не делать, потому что иначе вы во-первых будете чужим в дружной семье ШАДа, и это будет культурная трещина, которая с годами расползется дальше и вырастет до пропасти, а во-вторых это просто самообман.
Ну и, наконец, в репосте ниже есть несколько ссылок на материалы для подготовки к ШАД в открытом доступе от нашего лектора по математике в MLinside Сергея Жесткова. Кроме того, если вам прям хочется поработать с преподом и поучиться в группе с другими людьми, планирующими поступать в ШАД - у Сергея есть собственный проект где сейчас начинается новый поток.
Продолжение все еще следует, часть 3 будет чуть позже и там поделюсь своими любимыми задачками со вступительных ШАД
❤4🤡4🔥2👎1
Forwarded from Математика для всех ZhU
Готовимся к поступлению в ШАД 🟡🔴⚫️, AI Masters и магистратуры!
🔝 Три шага на пути к победе 🔝
1️⃣ Большой обзор курсов и литературы в моей статье на Habr ⚡️
2️⃣ Задачник, в котором я собрал 300 задач со студеннческих олимпиад и вступительных в ШАД/Сколтех/РЭШ (доступен бесплатно по ссылке) 🧠
3️⃣ Мой авторский курс по подготовке к поступлению в ШАД и магистратуры! 75 лекций по высшей математике в записи, домашнее задание на 80 задач с индивидуальной проверкой и подробный разбор более 130 задач из вариантов вступительных в ШАД прошлых лет и студенческих олимпиад. Это уже восьмой поток, курс прошло более 200 человек. Все подробности и отзывы на сайте, а еще про структуру и особенности курса рассказываю вот в этом ролике. Запуск нового потока уже совсем скоро: 15 октября (присоединиться можно до 10 ноября)
🔝 Три шага на пути к победе 🔝
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥9🤡6❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Генерируйте видео с Kandinsky 5.0 Video Lite в удобном интерфейсе
Как? Сейчас расскажем.
Kandinsky 5.0 Video Lite — новая open source модель для генерации коротких видео, которая по качеству обгоняет большинство открытых решений.
С помощью гайда от Cloud․ru можно настроить модель в удобном интерфейсе ComfyUI в сервисе Evolution Notebooks на GPU Nvidia V100 и использовать для реальных бизнес-задач.
Так дизайнеры и маркетинговые команды могут быстро создавать видео для презентаций, рекламных кампаний и прототипов, а модель будет всегда готова к работе.
Подробный гайд уже тут
Как? Сейчас расскажем.
Kandinsky 5.0 Video Lite — новая open source модель для генерации коротких видео, которая по качеству обгоняет большинство открытых решений.
С помощью гайда от Cloud․ru можно настроить модель в удобном интерфейсе ComfyUI в сервисе Evolution Notebooks на GPU Nvidia V100 и использовать для реальных бизнес-задач.
Так дизайнеры и маркетинговые команды могут быстро создавать видео для презентаций, рекламных кампаний и прототипов, а модель будет всегда готова к работе.
Подробный гайд уже тут
👎25🔥15👍8👏4🎉2
Про конформизм и машинное обучение
Давным-давно я уже будучи преподом делал с командой студентов сервис для автоматического аннотирования текстов. Трансформеров и LLM тогда и в проекте не было, задача аннотирования сводилась к тому, чтобы выделять ключевые предложения, чтения которых достаточно для понимания смысла текста, а лучшими известными подходами были TextRank и LexRank - эдакие аналоги PageRank, но не на сайтах, а на предложениях.
Так вот именно тогда мы усвоили один важный урок: как получить желаемый результат сравнения алгоритмов, если в оценке задействованы асессоры. Для разметки валидационной выборки мы сделали веб-страничку, где асессор должен был сам выбирать ключевые предложения из текста. Задача показалась нам непростой для решения «с чистого листа», поэтому в качестве варианта по умолчанию мы подсвечивали те предложения, которые выбрала бы наша реализация TextRank. Надо ли говорить, какой алгоритм победил в сравнении на этой выборке с большим отрывом?
К сожалению или к счастью, люди обычно довольно легко соглашаются на предложенный им вариант или меняют его не слишком сильно. В частности, поэтому полезнее самому говорить, что вы от них хотите, чем играть с людьми в угадайку и надеяться получить предложение мечты: на работе, в отношениях или договариваясь, как провести время с друзьями. Ну а если вам надо просто собрать выборку для оценки качества - постарайтесь ни к чему не подталкивать ваших асессоров :)
Давным-давно я уже будучи преподом делал с командой студентов сервис для автоматического аннотирования текстов. Трансформеров и LLM тогда и в проекте не было, задача аннотирования сводилась к тому, чтобы выделять ключевые предложения, чтения которых достаточно для понимания смысла текста, а лучшими известными подходами были TextRank и LexRank - эдакие аналоги PageRank, но не на сайтах, а на предложениях.
Так вот именно тогда мы усвоили один важный урок: как получить желаемый результат сравнения алгоритмов, если в оценке задействованы асессоры. Для разметки валидационной выборки мы сделали веб-страничку, где асессор должен был сам выбирать ключевые предложения из текста. Задача показалась нам непростой для решения «с чистого листа», поэтому в качестве варианта по умолчанию мы подсвечивали те предложения, которые выбрала бы наша реализация TextRank. Надо ли говорить, какой алгоритм победил в сравнении на этой выборке с большим отрывом?
К сожалению или к счастью, люди обычно довольно легко соглашаются на предложенный им вариант или меняют его не слишком сильно. В частности, поэтому полезнее самому говорить, что вы от них хотите, чем играть с людьми в угадайку и надеяться получить предложение мечты: на работе, в отношениях или договариваясь, как провести время с друзьями. Ну а если вам надо просто собрать выборку для оценки качества - постарайтесь ни к чему не подталкивать ваших асессоров :)
1😁36👍10❤6🔥3
Сегодня с утра порекомендовали посмотреть 4 серию 10 сезона Футурамы. Причина рекомендации прояснилась довольно быстро: один из персонажей там Георг Кантор, тот самый математик, создатель теории множеств, про которого еще Давид Гильберт говорил: «Никто не изгонит нас из рая, который основал Кантор».
Меня периодически спрашивают, родственники мы или нет, на что я честно отвечаю: «не знаю», хотя на кафедре высшей математики МФТИ меня учили в ответ на такой вопрос картинно посмущаться и застенчиво сказать: «ну какое это имеет значение?».
Фамилия не всегда работала в плюс: например, на пересдаче по матану в первом семестре, когда над феноменом Кантора на пересдаче по матану ржала раздающая билеты преп, было не очень приятно. С другой стороны, никогда не забуду лицо своей семинаристки по матану, когда на сдаче задания я сказал ей, что решил задачу со звездочкой в предположении верности континуум-гипотезы (попытки доказательства которой согласно легенде привели Георга Кантора в сумасшедший дом, хотя там конечно было много других факторов)
Меня периодически спрашивают, родственники мы или нет, на что я честно отвечаю: «не знаю», хотя на кафедре высшей математики МФТИ меня учили в ответ на такой вопрос картинно посмущаться и застенчиво сказать: «ну какое это имеет значение?».
Фамилия не всегда работала в плюс: например, на пересдаче по матану в первом семестре, когда над феноменом Кантора на пересдаче по матану ржала раздающая билеты преп, было не очень приятно. С другой стороны, никогда не забуду лицо своей семинаристки по матану, когда на сдаче задания я сказал ей, что решил задачу со звездочкой в предположении верности континуум-гипотезы (попытки доказательства которой согласно легенде привели Георга Кантора в сумасшедший дом, хотя там конечно было много других факторов)
😁80❤9👏2