Warning: file_put_contents(aCache/aDaily/post/ClassActionLab/-367-368-): Failed to open stream: No space left on device in /var/www/tgoop/post.php on line 50
Class Action Lab@ClassActionLab P.368
CLASSACTIONLAB Telegram 368
Артем Сабиров, член команды Class Action Lab, презентовал на конференции "Сороку".

Сорока – алгоритм, основанный на математике и статистике, который позволяет анализировать новостной поток с целью выявить массовое однородное нарушение.

Для этой цели мы в течение длительного времени собирали и затем вручную разметили датасет с новостями, где разделили их на:
– те, которые отражают событие, которое может лечь в основу группового иска,
– другие новости.

Далее, с использованием уже имеющихся библиотек для обработки естественного языка мы привели данные к "машиночитаемому" виду.

На имеющемся датасете обучили несколько моделей и выбрали лучшую. После этого осталась техническая часть: настройка сбора новостей, размещение всех модулей на сервере и проч.

Для создания, поддержания и развития Сороки требуются три "специальности": юриспруденция, IT (включая математику) и лингвистика. Без этого пропадет важный компонент, сказывающийся на работе всей программы.

Как и любой алгоритм, основанный на математике и статистике, при работе с естественным языком Сорока дает и ложные прогнозы. Однако мы еще не опробовали массу инструментов и не протестировали ряд гипотез, которые могут увеличить метрики качества Сороки. Пока же она приносит на хвосте свои новости, а мы их изучаем и постоянно подкручиваем алгоритм.

#обзор
🔥13



tgoop.com/ClassActionLab/368
Create:
Last Update:

Артем Сабиров, член команды Class Action Lab, презентовал на конференции "Сороку".

Сорока – алгоритм, основанный на математике и статистике, который позволяет анализировать новостной поток с целью выявить массовое однородное нарушение.

Для этой цели мы в течение длительного времени собирали и затем вручную разметили датасет с новостями, где разделили их на:
– те, которые отражают событие, которое может лечь в основу группового иска,
– другие новости.

Далее, с использованием уже имеющихся библиотек для обработки естественного языка мы привели данные к "машиночитаемому" виду.

На имеющемся датасете обучили несколько моделей и выбрали лучшую. После этого осталась техническая часть: настройка сбора новостей, размещение всех модулей на сервере и проч.

Для создания, поддержания и развития Сороки требуются три "специальности": юриспруденция, IT (включая математику) и лингвистика. Без этого пропадет важный компонент, сказывающийся на работе всей программы.

Как и любой алгоритм, основанный на математике и статистике, при работе с естественным языком Сорока дает и ложные прогнозы. Однако мы еще не опробовали массу инструментов и не протестировали ряд гипотез, которые могут увеличить метрики качества Сороки. Пока же она приносит на хвосте свои новости, а мы их изучаем и постоянно подкручиваем алгоритм.

#обзор

BY Class Action Lab





Share with your friend now:
tgoop.com/ClassActionLab/368

View MORE
Open in Telegram


Telegram News

Date: |

Click “Save” ; How to build a private or public channel on Telegram? SUCK Channel Telegram Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. bank east asia october 20 kowloon
from us


Telegram Class Action Lab
FROM American