tgoop.com/bigdata_ir/394
Last Update:
شرکت DoorDash چگونه پلتفرم پردازش بلادرنگ خود را با Iceberg متحول کرد؟
شرکت DoorDash برای پردازش رویدادهای بلادرنگ خودش، یک پلتفرم استریم داخلی توسعه داده که امکان تصمیمگیری سریع و هوشمند را برای تیمهای تجاری فراهم میکند.
در ساعات اوج فعالیت، این پلتفرم با حجم بالایی از داده روبهرو میشود — بیش از ۳۰ میلیون پیام در هر ثانیه، معادل حدود ۵ گیگابایت داده در ثانیه که از سمت مشتریان، رانندگان (Dashers)، فروشندگان و اپلیکیشنهای داخلی DoorDash ارسال میشود.
ساختار اولیه به این صورت بود:
🧱دریافت و بافر دادهها با Kafka
🧱پردازش با Apache Flink
🧱ذخیره در Amazon S3
🧱 در نهایت، انتقال دادهها به Snowflake از طریق یک پایپلاین به نام Snowpie
اما این معماری در عمل با چند مشکل جدی مواجه شد:
⛔️هزینههای بالای Snowflake
⛔️دوبار نوشتن دادهها (هم در S3 و هم در Snowflake)
⛔️وابستگی به یک فروشنده خاص ( Snowflake)
برای حل این چالشها، DoorDash تصمیم گرفت به سراغ Apache Iceberg برود تا زیرساخت دادهای بلادرنگ خود را بازطراحی کند؛ راهحلی متنباز، مقیاسپذیر و مستقل از فروشنده.
خلاصه آنرا در PDF الصاق شده مشاهده کنید👆
BY مهندسی داده
Share with your friend now:
tgoop.com/bigdata_ir/394