tgoop.com/pythonlearnme/291
Last Update:
12 نکته مهم در مورد «علم داده» که در هیچ دورهای به شما یاد نمی دهند!
مشاغل زیادی در زمینه علم داده وجود دارد، (تحلیلگر داده، مهندس یادگیری ماشین، دانشمند داده و...) اما متقاضیان زیادی نیز وجود دارند و فرآیند مصاحبه و استخدام در مشاغل علوم داده یک بازی با اطلاعات نامتقارن عظیم است. صبور باشید، فرصتها پیش خواهند آمد، اما بیشتر از آن چه که فکر می کنید گاهی طول میکشد.
اگر کنجکاو و عاشق یادگیری هستید، باید بدانید که هرگز هر چیزی را که دوست دارید در مورد Data Science بدانید، نخواهید دانست. علم داده یک زمینه بسیار گسترده است و زمان و دانش شما هم اندک. پس از این که همه چیز را نمیدانید ناامید نشوید.
هر دانشمند داده داستان خود را دارد، پس خود را با دیگران مقایسه نکنید. اگر همکار شما در مورد سریهای زمانی - یا هر موضوع دیگری، بیشتر از شما میداند، نیاز نیست خود را با او مقایسه کنید. زیرا او همیشه با این ابزار کار کرده است، مطالعاتش در این زمینه بوده و تجربه بیشتری دارد. پس اگر دقیقتر نگاه کنید، میبینید که در موضوعات دیگر از او بهتر هستید (شاید برنامهنویس بهتری باشید یا دانش آماری و ریاضیات بیشتری داشته باشید).
درباره محصول/ محصولات کسب و کاری که فرآیند آنالیز داده را برای آن انجام میدهید، اطلاعات کسب کنید. هیچ مدیر سطح A واقعاً به الگوریتمها، مقادیر p، دقت، AUC یا امتیاز f1 اهمیت نمیدهد. آنها می خواهند بدانند که کدام مشکل در حال حل شدن است و درآمد (یا پس اندازی) که از انجام پروژه شرکت توسط شما بدست میآورند چقدر است. پس بهترین مدل، مدلی است که مشکل پروژه را حل کند؛ مدیران این را میخواهند.
مدل های یادگیری ماشین تنها بخش بسیار کوچکی از وظایف روزانه یک دانشمند داده را شامل میشوند. شما بیشتر زمان خود را در پروژههایتان صرف پاکسازی دادهها و جمع آوری اطلاعات میکنید.
برخی از تکنیکهای علوم داده در آموزشهای تئوری و دورههایی که میگذرانید به خوبی کار می کنند، اما در دادههای دنیایِ واقعی تقریباً بی فایده هستند. من دوست دارم از SMOTE به عنوان مثال استفاده کنم. در Medium، این تکنیک بی عیب و نقص به نظر میرسد، در حالی که در دنیای واقعی ممکن است کاملاً ناکار آمد باشد (البته نه به طور کامل).
احتمالاً برخی از مفاهیم مثل نشت دادهها و اعتبار سنجی را در طول تحصیل یاد نگرفتهاید. این به این معنی است که شما تنها زمانی که برخی از مدلها در حال تولید هستند، از کار افتادن آنها را تجربه خواهید کرد. یعنی کاربرد بعضی از مفاهیم علوم داده را تنها در زمان کار بر روی پروژه یاد خواهید گرفت. پس مطمئن شوید که برای جلوگیری از یک حادثه بزرگ، برای نظارت بر مدلهای خود زمان صرف میکنید و یادگیری را ادامه میدهید!
همه شرکتها دوست دارند بگویند که دادهمحور هستند، اما تعداد بسیار کمی از آنها واقعاً از این فرهنگ استقبال میکنند. بدتر از آن، این است که شما همیشه رهبران را در کنار خود در این مبارزه نخواهید داشت!!!
تفاوت بین استنتاج و پیش بینی را بدانید. یک الگوریتم ممکن است بسته به موقعیت، مفروضات و خطرات متفاوتی داشته باشد.
ابزارهای Tensorflow، Pycaret، Catboost و دیگر کتابخانهها ذهن شما را متحیر خواهند کرد. میدانم، من هم از آنها استفاده کردهام. اما هرگز قدرت Numpy، Pandas و Scikit-Learn را دست کم نگیرید. با استفاده از این سه کتابخانه، راه حلهای باورنکردنی خواهید ساخت.
افتضاح است که ساعت ها (یا حتی روزها) را برای مطالعه صرف کنید و بعداً متوجه شوید که در مورد دادهها سوء تفاهم وجود دارد یا اشتباهی وجود دارد که متوجه نشده اید. این تجربه وحشتناک است، اما برای همه اتفاق می افتد. خودتان را سرزنش نکنید و صبوری خود را در مواجهه با همکارانتان از دست ندهید. آنچه را که باید یاد بگیرید، بیاموزید و همیشه به جلو حرکت کنید!
همیشه شرکتها به هر کسی که موفق میشد نوعی از pd.merge() یا هر چیزی را با پایتون اجرا کند، هزینه زیادی پرداخت میکردند. اما الان این فاکتور تغییر کرده است. علم داده در حال تکامل است و امروزه تقاضاها بیشتر شده است. فضای ابری، دانش مهندسی داده، اینترنت اشیا، علیت و مهارت های دیگر برخی از پیش نیازهایی هستند که ممکن است امروزه در موقعیت های شغلی جدید با آنها روبرو شوید.
BY 🧑💻PythonDev🧑💻
Share with your friend now:
tgoop.com/pythonlearnme/291