اخیرا که درگیر انتقال دادهها از پستگرس به YugaByteDB (یک نسخه مقیاسپذیر و منطبق بر پستگرس) بودیم، ابزار ساده اما بسیار مفیدی را پیدا کردم با نام pgsync که برای جابجایی جداول بین این دو دیتابیس کمک زیادی به ما کرد.
هر چند جای بهبود زیادی دارد -مثلا روابط و وابستگی بین جداول را تشخیص نمیدهد و اینکار را باید خودمان به صورت دستی در فایل تنظیمات آن وارد کنیم- اما کار با آن ساده و نتیجه کار کاملا رضایت بخش است .
هم می تواند اسکیما را بررسی کرده و جداول مقصد را بسازد و هم امکان انتقال داده ها در دسته های ده هزارتایی را دارد و هم میتوان جداولی که باید ابتدا منتقل شوند را گروهبندی کرده و در فایل تنظیمات آن یعنی .pgsync.yml وارد کرد و به صورت گروه به گروه، عملیات انتقال را انجام داد.
https://github.com/ankane/pgsync
#postgres #postgresql #yugabytedb #db_migration
هر چند جای بهبود زیادی دارد -مثلا روابط و وابستگی بین جداول را تشخیص نمیدهد و اینکار را باید خودمان به صورت دستی در فایل تنظیمات آن وارد کنیم- اما کار با آن ساده و نتیجه کار کاملا رضایت بخش است .
هم می تواند اسکیما را بررسی کرده و جداول مقصد را بسازد و هم امکان انتقال داده ها در دسته های ده هزارتایی را دارد و هم میتوان جداولی که باید ابتدا منتقل شوند را گروهبندی کرده و در فایل تنظیمات آن یعنی .pgsync.yml وارد کرد و به صورت گروه به گروه، عملیات انتقال را انجام داد.
https://github.com/ankane/pgsync
#postgres #postgresql #yugabytedb #db_migration
یکی دیگر از نرم افزارهایی که در کارهای روزمره کمک زیادی به ما میکند، BudiBase است.
به دلیل تراکم کارها و تعجیل در رساندن فیچرها به برنامه زمانبندی ریلیز و ... خیلی از داشبوردهای داخلی ما بر زمین مانده بود. مثلا نیاز داشتیم داشبوردی برای تایید برخی درخواستهای رسیده یا پیجهای کراول شده ایجاد کنیم . برای اینکار هم نیاز به طراحی و پیاده سازی API داشتیم و هم نیاز به پیاده سازی داشبورد.
در جستجوی ابزاری که بتواند به مانگو/پستگرس/ردیس/الستیک سرچ متصل شده، اجازه نوشتن کوئری لازم برای لود دادهها و طراحی فرمها و یا جداولی برای نمایش و ویرایش و حتی ایجاد یک Workflow به ما بدهد به BudiBase رسیدیم که تا اینجا برای ما مشکل گشا بوده است.
https://budibase.com
نسخه رایگان آن تا بیست نفر کاربر را پشتیبانی میکند که به راحتی نسخه تحت وب آن را می توانید بالا آورده، آنرا به دیتابیس های خود متصل کرده و به صورت بصری، به طراحی داشبورد و فرم های مورد نیاز خود بپردازید.
به دلیل تراکم کارها و تعجیل در رساندن فیچرها به برنامه زمانبندی ریلیز و ... خیلی از داشبوردهای داخلی ما بر زمین مانده بود. مثلا نیاز داشتیم داشبوردی برای تایید برخی درخواستهای رسیده یا پیجهای کراول شده ایجاد کنیم . برای اینکار هم نیاز به طراحی و پیاده سازی API داشتیم و هم نیاز به پیاده سازی داشبورد.
در جستجوی ابزاری که بتواند به مانگو/پستگرس/ردیس/الستیک سرچ متصل شده، اجازه نوشتن کوئری لازم برای لود دادهها و طراحی فرمها و یا جداولی برای نمایش و ویرایش و حتی ایجاد یک Workflow به ما بدهد به BudiBase رسیدیم که تا اینجا برای ما مشکل گشا بوده است.
https://budibase.com
نسخه رایگان آن تا بیست نفر کاربر را پشتیبانی میکند که به راحتی نسخه تحت وب آن را می توانید بالا آورده، آنرا به دیتابیس های خود متصل کرده و به صورت بصری، به طراحی داشبورد و فرم های مورد نیاز خود بپردازید.
اگر مباحث تخصصی مهندسی داده را به صورت جدی دنبال میکنید این لیست مخازن مفید این حوزه را از دست ندهید .
yun.ir/fv7165
yun.ir/fv7165
مهندسی داده
۱۵ مخزن گیتهاب ضروری برای مهندسی(ن) داده - مهندسی داده
اگر به دنبال تقویت مهارتهای مهندسی داده خود هستید، بررسی و مرور مخازن کد مرتبط با مهندسی داده و پروژههای عملی این حوزه می تواند دید مناسبی به شما در این حوزه بدهد.
در چند ماه گذشته از کافکا کلا سوئیچ کرده ام به ردپاندا بابت مسایلی مثل بهینهتر بودن مصرف منابع و طراحی مدرنتر یک سامانه پیام رسان مبتنی بر پروتکل کافکا با امکانات کامل و یکپارچه.
حتی قصد داشتم خلاصه ای از مشاهدات آقای Wu را در کنفرانس ۲۰۲۴ کافکا و داده های جریانی در اینجا به اشتراک بگذارم با این محوریت که کافکا به نقطه حساسی رسیده است و اگر نتواند تغییرات مورد انتظار بازار را برآورده کند، بازار را به رقبا واگذار خواهد کرد و خریدن شرکتهایی مثل WarpStream توسط کانفلوئنت که هزینه نگهداری یک کلاستر کافکا را بسیار کاهش میدهد، باز هم به تنهایی به کافکا کمک نخواهد کرد :
https://medium.com/@yingjunwu/kafka-has-reached-a-turning-point-649bd18b967f
اگر در حوزه مهندسی داده فعالیت میکنید توصیه میکنم مقاله فوق را با دقت مطالعه کنید. .
اما مهمتر ازین مسائل پایه در انتخاب یک ابزار مانند مصرف منابع و سادگی کار با آن و یکپارچه بودن ابزار و اکوسیستم، دید و ویژن شرکت ردپاندا برایم جذاب بود .
دیدی که باعث شد چند ماه پیش، پروژه Benthos را خریده و به RedPanda Connect اضافه کند. یک پروژه عالی، سبک و حرفه ای برای کارهای ETL .
اخیرا هم دیدم ردپاندا، نوع جدیدی از تاپیکها برای کار مستقیم با Apache Iceberg ایجاد کند، به این ویژن و توجه به نیازهای نوین بازار، باور بیشتری دارم.
توصیه میکنم اگر با کافکا کار میکنید، ردپاندا را هم حتما تست کنید (نیاز به تغییر خاصی در کدها ندارید و دقیقا از دید برنامه و ابزار،مثل یک کلاستر کافکا عمل میکند).
مقاله زیر را هم که راجع به افزوده شدن این نوع جدید از تاپیک ها و ذخیره مستقیم پیامها در آپاچی آیسبرگ است را هم حتما نگاهی بیندازید ....
Read “Apache Iceberg Topics: Stream directly into your data lake“ by Redpanda Data on Medium: https://redpanda-data.medium.com/apache-iceberg-topics-stream-directly-into-your-data-lake-0250a8dfdd76
#مهندسی_داده #redpanda #kafka
حتی قصد داشتم خلاصه ای از مشاهدات آقای Wu را در کنفرانس ۲۰۲۴ کافکا و داده های جریانی در اینجا به اشتراک بگذارم با این محوریت که کافکا به نقطه حساسی رسیده است و اگر نتواند تغییرات مورد انتظار بازار را برآورده کند، بازار را به رقبا واگذار خواهد کرد و خریدن شرکتهایی مثل WarpStream توسط کانفلوئنت که هزینه نگهداری یک کلاستر کافکا را بسیار کاهش میدهد، باز هم به تنهایی به کافکا کمک نخواهد کرد :
https://medium.com/@yingjunwu/kafka-has-reached-a-turning-point-649bd18b967f
اگر در حوزه مهندسی داده فعالیت میکنید توصیه میکنم مقاله فوق را با دقت مطالعه کنید. .
اما مهمتر ازین مسائل پایه در انتخاب یک ابزار مانند مصرف منابع و سادگی کار با آن و یکپارچه بودن ابزار و اکوسیستم، دید و ویژن شرکت ردپاندا برایم جذاب بود .
دیدی که باعث شد چند ماه پیش، پروژه Benthos را خریده و به RedPanda Connect اضافه کند. یک پروژه عالی، سبک و حرفه ای برای کارهای ETL .
اخیرا هم دیدم ردپاندا، نوع جدیدی از تاپیکها برای کار مستقیم با Apache Iceberg ایجاد کند، به این ویژن و توجه به نیازهای نوین بازار، باور بیشتری دارم.
توصیه میکنم اگر با کافکا کار میکنید، ردپاندا را هم حتما تست کنید (نیاز به تغییر خاصی در کدها ندارید و دقیقا از دید برنامه و ابزار،مثل یک کلاستر کافکا عمل میکند).
مقاله زیر را هم که راجع به افزوده شدن این نوع جدید از تاپیک ها و ذخیره مستقیم پیامها در آپاچی آیسبرگ است را هم حتما نگاهی بیندازید ....
Read “Apache Iceberg Topics: Stream directly into your data lake“ by Redpanda Data on Medium: https://redpanda-data.medium.com/apache-iceberg-topics-stream-directly-into-your-data-lake-0250a8dfdd76
#مهندسی_داده #redpanda #kafka
Medium
Kafka Has Reached a Turning Point
Is Kafka still relevant in today’s evolving tech landscape? And where is Kafka headed in the future?
Forwarded from عکس نگار
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from عکس نگار
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from عکس نگار
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
نتایج مقایسه کلیکهوس با الستیک سرچ، مانگودیبی و پستگرس - در ارتباط با پست فوق
Media is too big
VIEW IN TELEGRAM
Warp
یک ترمینال مدرن و پیشرفته است که به نظر می رسد به طور خاص برای توسعهدهندگان و مهندسین داده طراحی شده است. این ترمینال با ویژگیهای منحصر به فردی مانند:
✅ رابط کاربری مدرن و زیبا
✅ قابلیت تکمیل خودکار هوشمند (AI-powered)
✅ امکان اشتراکگذاری دستورات و نتایج
✅ امکان ساخت نوتبوک و ورکفلو برای مستند کردن دستورات پیچیده و راحت تر کردن انجام کارهای تکراری
✅ پشتیبانی از کار گروهی و همکاری تیمی
✅ قابلیت جستجوی سریع در تاریخچه دستورات
✅ بلوکهای دستور که امکان اجرای مجدد آسان را فراهم میکند
تجربه کار با خط فرمان رو کاملاً متحول کرده است.
Warp
در اصل برای سیستمعامل macOS توسعه داده شد و بعداً پشتیبانی از لینوکس را نیز اضافه کرد. مدتها بود که منتظر نهایی شدن نسخه ویندوز این ترمینال بودم که چند ساعت پیش ایمیل دانلود این نسخه برایم آمد و حیفم آمد تجربه خوبی که از کار با این ترمینال به دست آوردم را با علاقه مندان به دنیای مهندسی داده و خط فرمان به اشتراک نگذارم.
امیدوارم این فیلم کوتاه برای این دوستان مفید باشد.
#Warp #Terminal #DeveloperTools #Productivity #TechTips
یک ترمینال مدرن و پیشرفته است که به نظر می رسد به طور خاص برای توسعهدهندگان و مهندسین داده طراحی شده است. این ترمینال با ویژگیهای منحصر به فردی مانند:
✅ رابط کاربری مدرن و زیبا
✅ قابلیت تکمیل خودکار هوشمند (AI-powered)
✅ امکان اشتراکگذاری دستورات و نتایج
✅ امکان ساخت نوتبوک و ورکفلو برای مستند کردن دستورات پیچیده و راحت تر کردن انجام کارهای تکراری
✅ پشتیبانی از کار گروهی و همکاری تیمی
✅ قابلیت جستجوی سریع در تاریخچه دستورات
✅ بلوکهای دستور که امکان اجرای مجدد آسان را فراهم میکند
تجربه کار با خط فرمان رو کاملاً متحول کرده است.
Warp
در اصل برای سیستمعامل macOS توسعه داده شد و بعداً پشتیبانی از لینوکس را نیز اضافه کرد. مدتها بود که منتظر نهایی شدن نسخه ویندوز این ترمینال بودم که چند ساعت پیش ایمیل دانلود این نسخه برایم آمد و حیفم آمد تجربه خوبی که از کار با این ترمینال به دست آوردم را با علاقه مندان به دنیای مهندسی داده و خط فرمان به اشتراک نگذارم.
امیدوارم این فیلم کوتاه برای این دوستان مفید باشد.
#Warp #Terminal #DeveloperTools #Productivity #TechTips
This media is not supported in your browser
VIEW IN TELEGRAM
اگر پایپ لاین های مبتنی بر داده خود را با ایرفلو طراحی کردهاید اما وسوسه شدهاید که از امکانات حرفهای دگستر برای اجرای خودکار فرآیندهای متوالی پردازش داده(پایپ لاین) استفاده کنید، Airlift دقیقا این لیفت! را برای شما انجام میدهد.
https://www.linkedin.com/posts/dagsterlabs_airlift-is-a-powerful-new-tookit-that-makes-activity-7305287043285200897-Ze_f
https://www.linkedin.com/posts/dagsterlabs_airlift-is-a-powerful-new-tookit-that-makes-activity-7305287043285200897-Ze_f
نگاهی به خرید HyperDX توسط کلیکهوس
🔍 Observability
دیگر یک انتخاب نیست، بلکه یک ضرورت است!
امروزه شرکتها بخصوص تیمهای مهندسی داده و دوستان دواپس نیاز مبرمی به یک پلتفرم یکپارچه نظارت (Observability) دارند که لاگها، تریسها، خطاها و متریکها را در یک محیط مجتمع گرد هم بیاورد. اما چیزی که امروزه علاوه بر این نیازمندیها میتواند برای ما جذاب باشد، یک استک جدید و بهینه است که علاوه بر سرعت بالای جستجو و مصرف کم منابع، امکانات پیشرفتهای مثل بازاجرای خطاها (Session Replay) را نیز فراهم کند.
خرید HyperDX توسط ClickHouse دقیقاً در همین راستاست!
با استفاده از قدرت پردازشی ClickHouse در بکاند، حالا میتوان یک پلتفرم نظارت متنباز، سریع و بهینه برای مهندسان داده و دواپس داشت که نهتنها هزینهها را کاهش میدهد، بلکه تجربه توسعهدهندگان را نیز بهبود میبخشد.
https://clickhouse.com/blog/clickhouse-acquires-hyperdx-the-future-of-open-source-observability
#Observability #ClickHouse #HyperDX #DataEngineering
🔍 Observability
دیگر یک انتخاب نیست، بلکه یک ضرورت است!
امروزه شرکتها بخصوص تیمهای مهندسی داده و دوستان دواپس نیاز مبرمی به یک پلتفرم یکپارچه نظارت (Observability) دارند که لاگها، تریسها، خطاها و متریکها را در یک محیط مجتمع گرد هم بیاورد. اما چیزی که امروزه علاوه بر این نیازمندیها میتواند برای ما جذاب باشد، یک استک جدید و بهینه است که علاوه بر سرعت بالای جستجو و مصرف کم منابع، امکانات پیشرفتهای مثل بازاجرای خطاها (Session Replay) را نیز فراهم کند.
خرید HyperDX توسط ClickHouse دقیقاً در همین راستاست!
با استفاده از قدرت پردازشی ClickHouse در بکاند، حالا میتوان یک پلتفرم نظارت متنباز، سریع و بهینه برای مهندسان داده و دواپس داشت که نهتنها هزینهها را کاهش میدهد، بلکه تجربه توسعهدهندگان را نیز بهبود میبخشد.
https://clickhouse.com/blog/clickhouse-acquires-hyperdx-the-future-of-open-source-observability
#Observability #ClickHouse #HyperDX #DataEngineering
ClickHouse
ClickHouse acquires HyperDX: The future of open-source observability
ClickHouse acquires HyperDX to deliver the fastest, most cost-effective open-source observability with session replay, blazing-fast queries, and seamless OpenTelemetry support.