Анализ данных (Data analysis)@data_analysis

Анализ данных (Data analysis)

🚀 Представлен Apache Spark 4.0 — крупнейший релиз с момента запуска Spark 2.0

Databricks анонсировали Spark 4.0 с множеством фундаментальных улучшений производительности и архитектуры.

Новый релиз фокусируется на ускорении обработки, поддержке GenAI-нагрузок и расширенной масштабируемости.

🔥 Что нового:

• 💡 Project Tungsten++, Catalyst++ — переработка движка исполнения и оптимизации запросов
• 🧠 Поддержка генеративных AI-запросов — Spark теперь эффективнее работает с LLM-нагрузками
• ⚙️ Новый Execution Engine — более 2× ускорение в среднем, до 10× в некоторых кейсах
• 📦 Модульная архитектура — теперь ядро Spark отделено от MLlib, GraphX и др.
• 🌐 Поддержка нового Shuffle-движка и улучшенное распределение по кластерам
• 🧪 Обратная несовместимость — Spark 4.0 требует миграции, особенно для UDF и кастомных оптимизаций

📌 Подробности и тесты:
https://www.databricks.com/blog/introducing-apache-spark-40

@data_analysis_ml

www.tgoop.com/data_analysis_ml/3610

14.4K viewsMay 29 at 10:00

tgoop.com/data_analysis_ml/3610

Create: 2025-05-29
Last Update: 2025-05-31 05:34:02

BY Анализ данных (Data analysis)

Share with your friend now:
tgoop.com/data_analysis_ml/3610

Telegram News

🚀 Представлен Apache Spark 4.0 — крупнейший релиз с момента запуска Spark 2.0