Notice: file_put_contents(): Write of 11668 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 8192 of 19860 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение@dsproglib P.5866
DSPROGLIB Telegram 5866
🔗 DataChain — фреймворк для управления данными

Ключевые особенности фреймворка:

📂 Мультимодальная версионность данных
🔘Версионирование неструктурированных данных без перемещения или копирования, с поддержкой ссылок на хранилища S3, GCP, Azure и локальные файловые системы.
🔘Поддержка мультимодальных данных: изображения, видео, текст, PDF, JSON, CSV, Parquet и др.
🔘Объединение файлов и метаданных в постоянные, версионные наборы данных.

🐍 Python-friendly
🔘Работа с объектами Python и их полями: числовые значения, строки, матрицы, ответы LLM.
🔘Обработка больших наборов данных (до терабайтов) с встроенной параллелизацией и экономным использованием памяти — без необходимости SQL или Spark.

🧠 Обработка данных
🔘Генерация метаданных с использованием локальных AI-моделей и LLM API.
🔘Фильтрация, объединение и группировка наборов данных по метаданным. Поиск по векторным эмбеддингам.
🔘Высокопроизводительные векторизированные операции на Python-объектах: суммирование, подсчёт, вычисление среднего и др.
🔘Передача наборов данных в Pytorch и Tensorflow или экспорт обратно в хранилище.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1



tgoop.com/dsproglib/5866
Create:
Last Update:

🔗 DataChain — фреймворк для управления данными

Ключевые особенности фреймворка:

📂 Мультимодальная версионность данных
🔘Версионирование неструктурированных данных без перемещения или копирования, с поддержкой ссылок на хранилища S3, GCP, Azure и локальные файловые системы.
🔘Поддержка мультимодальных данных: изображения, видео, текст, PDF, JSON, CSV, Parquet и др.
🔘Объединение файлов и метаданных в постоянные, версионные наборы данных.

🐍 Python-friendly
🔘Работа с объектами Python и их полями: числовые значения, строки, матрицы, ответы LLM.
🔘Обработка больших наборов данных (до терабайтов) с встроенной параллелизацией и экономным использованием памяти — без необходимости SQL или Spark.

🧠 Обработка данных
🔘Генерация метаданных с использованием локальных AI-моделей и LLM API.
🔘Фильтрация, объединение и группировка наборов данных по метаданным. Поиск по векторным эмбеддингам.
🔘Высокопроизводительные векторизированные операции на Python-объектах: суммирование, подсчёт, вычисление среднего и др.
🔘Передача наборов данных в Pytorch и Tensorflow или экспорт обратно в хранилище.

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение




Share with your friend now:
tgoop.com/dsproglib/5866

View MORE
Open in Telegram


Telegram News

Date: |

Telegram Channels requirements & features But a Telegram statement also said: "Any requests related to political censorship or limiting human rights such as the rights to free speech or assembly are not and will not be considered." Each account can create up to 10 public channels With Bitcoin down 30% in the past week, some crypto traders have taken to Telegram to “voice” their feelings. In 2018, Telegram’s audience reached 200 million people, with 500,000 new users joining the messenger every day. It was launched for iOS on 14 August 2013 and Android on 20 October 2013.
from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM American