Warning: file_put_contents(aCache/aDaily/post/polylog_expertise/-3271-3272-3273-3274-3275-3276-3271-): Failed to open stream: No space left on device in /var/www/tgoop/post.php on line 50
Полилог. Экспертиза@polylog_expertise P.3275
POLYLOG_EXPERTISE Telegram 3275
❤️ Эксперты в Telegram: тематический анализ, лексическая сложность и тональность

«Полилог. Экспертиза» продолжает серию мини-исследований, посвящённых телеграм-каналам публичных экспертов. Ранее мы расположили каналы на политических координатах при помощи ChatGPT 4o и провели количественное исследование, посчитав аудиторию, средние просмотры, репосты и объём контента авторов. На этот раз с помощью методов ML и NLP мы оценили темы, тональность и лексическую сложность публикаций.

Методология

Из 40 каналов публичных экспертов мы спарсили публикации за 3 года (июнь 2022 — июнь 2025) и для повышения качества моделей отфильтровали тексты в 100 и более слов (51 тысяча*). Репосты были исключены — при подсчетах рассматривались только посты, написанные от лица канала. Основные результаты представлены на карточках, подробную информацию по каждому из каналов можно найти в общей таблице (бонус — средняя токсичность постов).

🎯 Форматы и эмодзи. Эксперты предпочитают текстовые сообщения и публикации с фото. Видео-контент занимает менее 10%, а голосовые сообщения и кружки — менее 0,1%. Эмодзи, как правило, используются для оформления контента — лидерами по частоте их использования стали «Полилог. Экспертиза» и Михаил Фаленков.

🎯 Сложность. Средняя сложность коммуникации оценивалась по адаптированному для русского языка индексу туманности Ганнинга. Значение индекса можно интерпретировать как количество лет обучения, которые необходимы для понимания текста. Важный момент: оцениваются лексика и синтаксис, но не поднимаемые темы. Навык донесения сложной информации простым языком лучше всего развит у Сергея Маркова — тексты на его канале могут понять даже шестиклассники.

🎯 Тональность. Для оценки тональности мы воспользовались моделью RuBERT-tiny2, дообученной для классификации коротких русскоязычных текстов: «позитивные», «негативные» и «нейтральные». Средняя «эмоциональность» рассчитывалась как сумма долей «позитивных» и «негативных» текстов. Лидером позитивной коммуникации стала Дарья Кислицына (49% публикаций), негативной — Сергей Марков (49%). Наиболее нейтральный стиль — у Романа Моложона (79%) и Павла Склянчука (77%).

🎯 Темы. Для оценки тематики публикаций мы разбили выборку на три части (по ключевым словам) и обучили LDA-модели с 20 скрытыми темами. Каждая из 60 скрытых тем интерпретировалась вручную, пополняя две категории: «Теория, история, исследования» и «Актуальная повестка». Лидерами в первой категории стали Political Animals (65% публикаций) и Павел Пряников (44%). Наиболее актуальный контент публикует Максим Жаров (98,3% текстов).

🎯 Кластерный анализ. Категория «Актуальная повестка» включает шесть направлений, представленных на тематическом гексагоне. Мы воспользовались методом k-средних и выделили пять групп экспертов. Авторы из Кластера I пишут о выборах и внутренней политике в зарубежных странах. Кластер II фокусируется на партийной повестке в России. Кластер III — на внутренней политике в РФ. Кластер V — на геополитике и украинском конфликте. А эксперты из Кластера IV в равной мере обращаются ко всем темам.

Кластер I: Ян Веселов, Павел Дубравский, Мирильяс Агаев.

Кластер II: Михаил Фаленков, «Процедуры и ритуалы», Павел Склянчук, Татьяна Косачёва, Андрей Цепелев, Роман Моложон.

Кластер III: «Трезвый политолог», Александр Семёнов, Дмитрий Еловский, Сергей Старовойтов, Станислав Корякин, Илья Гращенков, Наталия Елисеева, Мария Сергеева, Никита Сетов, Анна Федорова, Дарья Кислицына, Макар Вихлянцев, Алексей Чадаев, Павел Пряников.

Кластер IV: «Полилог. Экспертиза», Евгений Минченко, Глеб Кузнецов, Анна Богачёва, Ярослав Игнатовский, Михаил Виноградов, Валерий Прохоров, Political Animals, Марат Баширов, Алексей Ярошенко, Михаил Карягин.

Кластер V: Алексей Мартынов, Алексей Чеснаков, Павел Данилин, Игорь Димитриев, Максим Жаров, Сергей Марков.

*Для оценки форматов публикаций, эмодзи и сложности текстов использовалась полная выборка за 1 год (44 тысячи текстов).

Полилог. Экспертиза | Наши слоны
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2315👍9👎1



tgoop.com/polylog_expertise/3275
Create:
Last Update:

❤️ Эксперты в Telegram: тематический анализ, лексическая сложность и тональность

«Полилог. Экспертиза» продолжает серию мини-исследований, посвящённых телеграм-каналам публичных экспертов. Ранее мы расположили каналы на политических координатах при помощи ChatGPT 4o и провели количественное исследование, посчитав аудиторию, средние просмотры, репосты и объём контента авторов. На этот раз с помощью методов ML и NLP мы оценили темы, тональность и лексическую сложность публикаций.

Методология

Из 40 каналов публичных экспертов мы спарсили публикации за 3 года (июнь 2022 — июнь 2025) и для повышения качества моделей отфильтровали тексты в 100 и более слов (51 тысяча*). Репосты были исключены — при подсчетах рассматривались только посты, написанные от лица канала. Основные результаты представлены на карточках, подробную информацию по каждому из каналов можно найти в общей таблице (бонус — средняя токсичность постов).

🎯 Форматы и эмодзи. Эксперты предпочитают текстовые сообщения и публикации с фото. Видео-контент занимает менее 10%, а голосовые сообщения и кружки — менее 0,1%. Эмодзи, как правило, используются для оформления контента — лидерами по частоте их использования стали «Полилог. Экспертиза» и Михаил Фаленков.

🎯 Сложность. Средняя сложность коммуникации оценивалась по адаптированному для русского языка индексу туманности Ганнинга. Значение индекса можно интерпретировать как количество лет обучения, которые необходимы для понимания текста. Важный момент: оцениваются лексика и синтаксис, но не поднимаемые темы. Навык донесения сложной информации простым языком лучше всего развит у Сергея Маркова — тексты на его канале могут понять даже шестиклассники.

🎯 Тональность. Для оценки тональности мы воспользовались моделью RuBERT-tiny2, дообученной для классификации коротких русскоязычных текстов: «позитивные», «негативные» и «нейтральные». Средняя «эмоциональность» рассчитывалась как сумма долей «позитивных» и «негативных» текстов. Лидером позитивной коммуникации стала Дарья Кислицына (49% публикаций), негативной — Сергей Марков (49%). Наиболее нейтральный стиль — у Романа Моложона (79%) и Павла Склянчука (77%).

🎯 Темы. Для оценки тематики публикаций мы разбили выборку на три части (по ключевым словам) и обучили LDA-модели с 20 скрытыми темами. Каждая из 60 скрытых тем интерпретировалась вручную, пополняя две категории: «Теория, история, исследования» и «Актуальная повестка». Лидерами в первой категории стали Political Animals (65% публикаций) и Павел Пряников (44%). Наиболее актуальный контент публикует Максим Жаров (98,3% текстов).

🎯 Кластерный анализ. Категория «Актуальная повестка» включает шесть направлений, представленных на тематическом гексагоне. Мы воспользовались методом k-средних и выделили пять групп экспертов. Авторы из Кластера I пишут о выборах и внутренней политике в зарубежных странах. Кластер II фокусируется на партийной повестке в России. Кластер III — на внутренней политике в РФ. Кластер V — на геополитике и украинском конфликте. А эксперты из Кластера IV в равной мере обращаются ко всем темам.

Кластер I: Ян Веселов, Павел Дубравский, Мирильяс Агаев.

Кластер II: Михаил Фаленков, «Процедуры и ритуалы», Павел Склянчук, Татьяна Косачёва, Андрей Цепелев, Роман Моложон.

Кластер III: «Трезвый политолог», Александр Семёнов, Дмитрий Еловский, Сергей Старовойтов, Станислав Корякин, Илья Гращенков, Наталия Елисеева, Мария Сергеева, Никита Сетов, Анна Федорова, Дарья Кислицына, Макар Вихлянцев, Алексей Чадаев, Павел Пряников.

Кластер IV: «Полилог. Экспертиза», Евгений Минченко, Глеб Кузнецов, Анна Богачёва, Ярослав Игнатовский, Михаил Виноградов, Валерий Прохоров, Political Animals, Марат Баширов, Алексей Ярошенко, Михаил Карягин.

Кластер V: Алексей Мартынов, Алексей Чеснаков, Павел Данилин, Игорь Димитриев, Максим Жаров, Сергей Марков.

*Для оценки форматов публикаций, эмодзи и сложности текстов использовалась полная выборка за 1 год (44 тысячи текстов).

Полилог. Экспертиза | Наши слоны

BY Полилог. Экспертиза









Share with your friend now:
tgoop.com/polylog_expertise/3275

View MORE
Open in Telegram


Telegram News

Date: |

Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation. Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. Activate up to 20 bots The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. A vandalised bank during the 2019 protest. File photo: May James/HKFP.
from us


Telegram Полилог. Экспертиза
FROM American