tgoop.com/bigdata_ir/276
Last Update:
یکی از پروژههای بنیاد آپاچی که امروزه به تدریج در اخبار و مقالات حوزه داده در حال دیدهشدن است، Apache XTable است. این پروژه تنها یک هدف دارد و آن هم امکان تبدیل سه فرمت رایج ساخت Lakehouse یعنی
- Deltalake
- Apache Iceberge
- Apache Hudi
است که در شکل الصاقشده هم به تصویر کشیده شده است . در این شکل تیم B از طریق XTable, دادههای تیم A که به فرمت Hudi ذخیره شده است را به Iceberge تبدیل کرده و در کنار سایر دادههای خود، آنها را با Dremio پردازش میکند.
پ.ن. امروزه به نظر میرسد که Apache Iceberge در حال جذب کاربران بیشتری است و اگر قصد طراحی یک Lakehouse را دارید، از ابتدا این فرمت را انتخاب کنید.
Lakehouse
چیست؟
ترکیب دریاچه داده (که دادهها را به صورت خام و معمولا به صورت Parquet و مانند آن نگهداری میکند) و انباره داده است که اجازه میدهد بتوانیم دادههای خام را با ذخیرهکردن متادیتا، به نوعی دیتابیس تبدیل کنیم که مستقیما قابل کوئری گرفتن و استفاده در ابزارهای تحلیلی و گزارش سازی باشد
مقاله اصلی : https://www.onehouse.ai/blog/dremio-lakehouse-analytics-with-hudi-and-iceberg-using-xtable
BY مهندسی داده
Share with your friend now:
tgoop.com/bigdata_ir/276