DATA_ANALYSIS_ML Telegram 3627
🧠 DataTune — простой способ оптимизировать датасеты для ИИ

Это инструмент с открытым исходным кодом, который помогает улучшать качество датасетов для обучения LLM и других моделей.

Что делает DataTune:
Автоматически находит и удаляет дубликаты
Фильтрует нерелевантные, шумные и некачественные примеры
Сортирует данные по «ценности» — оставляя то, что реально важно
Работает с любыми текстовыми коллекциями (JSONL, TXT, HuggingFace Datasets)

🛠 Основан на embedding-моделях — сравнивает смысловую близость и уникальность примеров. Подходит для:
• Fine-tuning LLM
• Подготовки eval-наборов
• Фильтрации перед RAG

📦 Установка:

pip install datatune


https://github.com/vitalops/datatune

@data_analysis_ml



tgoop.com/data_analysis_ml/3627
Create:
Last Update:

🧠 DataTune — простой способ оптимизировать датасеты для ИИ

Это инструмент с открытым исходным кодом, который помогает улучшать качество датасетов для обучения LLM и других моделей.

Что делает DataTune:
Автоматически находит и удаляет дубликаты
Фильтрует нерелевантные, шумные и некачественные примеры
Сортирует данные по «ценности» — оставляя то, что реально важно
Работает с любыми текстовыми коллекциями (JSONL, TXT, HuggingFace Datasets)

🛠 Основан на embedding-моделях — сравнивает смысловую близость и уникальность примеров. Подходит для:
• Fine-tuning LLM
• Подготовки eval-наборов
• Фильтрации перед RAG

📦 Установка:


pip install datatune


https://github.com/vitalops/datatune

@data_analysis_ml

BY Анализ данных (Data analysis)




Share with your friend now:
tgoop.com/data_analysis_ml/3627

View MORE
Open in Telegram


Telegram News

Date: |

With the administration mulling over limiting access to doxxing groups, a prominent Telegram doxxing group apparently went on a "revenge spree." Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. 5Telegram Channel avatar size/dimensions
from us


Telegram Анализ данных (Data analysis)
FROM American