tgoop.com/IDS_Math/211
Last Update:
توزیع نرمال که با نام توزیع گاوسی نیز شناخته میشود، یکی از پرکاربردترین توزیعهای احتمال در یادگیری ماشینی است. با منحنی زنگولهای مشخص میشود که حول میانگین متقارن است و دارای یک انحراف استاندارد است که گستردگی دادهها را اندازهگیری میکند. توزیع نرمال اغلب برای مدلسازی متغیرهای پیوسته استفاده میشود که تمایل طبیعی به خوشهبندی حول یک مقدار مرکزی دارند. همچنین برای انجام تستهای آماری مانند آزمون t یا آزمون z که میانگینهای دو نمونه را با هم مقایسه میکنند مفید است.
توزیع دو جملهای یک توزیع احتمال گسسته است که تعداد موفقیتها را در تعداد ثابتی از آزمایشهای مستقل مدل میکند که هر کدام با احتمال موفقیت ثابتی همراه هستند. برای مثال، اگر یک سکه را 10 بار پرتاب کنید، در هر پرتاب 50 درصد احتمال شیر آمدن را داشته باشد، توزیع دوجملهای میتواند احتمال بدست آوردن تعداد معینی از شیرها را به شما بگوید. توزیع دوجملهای اغلب برای مدلسازی نتایج دوتایی، مانند بله/خیر، پیروزی/شکست یا برد/باخت استفاده میشود. همچنین برای انجام آزمونهای فرضیه مانند آزمون کای دو یا آزمون دقیق فیشر که نسبتهای دو گروه را با هم مقایسه میکنند، مفید است.
توزیع پواسون یکی دیگر از توزیعهای احتمال گسسته است که تعداد رویدادهایی را که در یک بازه زمانی یا مکانی ثابت رخ میدهند، با توجه به میانگین نرخ وقوع ثابت مدل میکند. به عنوان مثال، اگر تعداد مشتریانی را که در یک ساعت وارد یک فروشگاه میشوند مشاهده کنید و میانگین نرخ آن 10 مشتری در ساعت باشد، توزیع پواسون میتواند احتمال مشاهده تعداد معینی از مشتریان را به شما بگوید. توزیع پواسون اغلب برای مدلسازی رویدادهای نادر مانند تصادفات، نقصها یا خرابیها استفاده میشود. همچنین برای انجام تجزیه و تحلیل رگرسیون، مانند رگرسیون پواسون یا رگرسیون دو جملهای منفی، که تعداد یک متغیر نتیجه را پیشبینی میکند، مفید است.
توزیع یکنواخت یک توزیع احتمال پیوسته است که احتمال مساوی را به همه مقادیر در یک محدوده معین اختصاص میدهد. برای مثال، اگر یک قالب منصفانه بچرخانید، توزیع یکنواخت میتواند احتمال بدست آوردن هر عددی از 1 تا 6 را به شما بگوید. توزیع یکنواخت اغلب برای مدلسازی متغیرهایی استفاده میشود که برای هیچ مقداری ترجیح یا تعصب ندارند، مانند اعداد تصادفی، رنگها یا زوایا. همچنین برای اجرای تکنیکهای نمونهگیری، مانند روش راهاندازی یا مونت کارلو، که نمونههای تصادفی از یک جامعه تولید میکنند، مفید است.
توزیع نمایی یک توزیع احتمال پیوسته است که زمان یا فاصله بین دو رویداد متوالی را که با نرخ میانگین ثابت رخ میدهند، مدل میکند. به عنوان مثال، اگر زمان بین دو تماس تلفنی را مشاهده کنید و میانگین نرخ آن 5 تماس در ساعت باشد، توزیع نمایی میتواند احتمال انتظار مدت زمان مشخصی برای تماس بعدی را به شما بگوید. توزیع نمایی اغلب برای مدلسازی دادههای بقا یا قابلیت اطمینان، مانند طول عمر یک محصول، مدت یک سرویس یا میزان خرابی یک جزء استفاده میشود. همچنین برای انجام تجزیه و تحلیل بقا، مانند برآوردگر Kaplan-Meier یا مدل خطرات متناسب کاکس، که تابع بقا یا تابع خطر یک جمعیت را تخمین میزند، مفید است.