نرمالسازی (به انگلیسی: normalization) در آمار معانی متفاوتی دارد که سادهترین کاربرد آن نرمالسازی دادهها یا نرمالسازی متغیرها است و عبارت است از روشی که دادهها را در زمانی که در یک دامنه نیستند را در دامنه مشابه قرار میدهد. به بیان دیگر ممکن است یک دادهکاو با موقعیتهایی مواجه گردد که ویژگیهای در داده شامل مقادیری باشند که در محدوده یا دامنه متفاوتی قرار داشته باشند. این ویژگیهای با مقادیر بزرگ ممکن است اثر بسیار زیادتری در تابع هزینه نسبت به ویژگیهای با مقادیر کم داشته باشند. این مشکل با نرمالیزه نمودن ویژگیها طوری که مقادیرشان در دامنههای مشابه قرار گیرند برطرف خواهد شد.[۱]
نرمالسازی در ساخت مدل
در ساخت مدل دادهها (به انگلیسی: meta model) از روی دادهها پیش از شروع آموزش مدلها، دادهها را به بزرگترین مقدار متناظرشان تقسیم میکنند تا به مقدارهای بین صفر و یک مقیاس (نرمالیزه) شوند این کار باعث میشود که اثر مقیاس واقعی (به انگلیسی: Absolute Scale) کمینه شود و همه ورودیها تقریباً در یک دامنه باشند.[۲]
مثال
در زیر چند روش نرمالسازی دادهها ارائه میگردد.
نام |
فرمول |
استفاده
|
Standard score |
|
نرمالسازی خطاها در زمانی که پارامترهای جمعیت شناختهشده باشند.
|
Student's t-statistic |
|
نرمالسازی residuals زمانی که پارامترهای جمعیت ناشناخته باشند (تخمین)
|
Studentized residual |
|
نرمالسازی در زمانی که متغیرها تخمین زده میشوند به خصوص در زمان تحلیل رگرسیون.
|
Standardized moment |
|
نرمالسازی لحظهای به کمک انحراف معیار به عنوان ابزار اندازهگیری مقیاس
|
ضریب تغییرات |
|
نرمالسازی پراکندگی به کمک استفاده از میانگین به عنوان ابزار اندازهگیری مقیاس توزیع نمایی و توزیع پواسون.
|
منابع
- ↑ «پیشپردازش داده» (PDF). بایگانیشده از اصلی (PDF) در ۲۸ فوریه ۲۰۱۳. دریافتشده در ۲۷ نوامبر ۲۰۱۲.
- ↑ پیشبنی ظرفیت باربری شمعهای تحت اثر بار محوری به کمک ماشین بردار پشتیبان، علیرضا کردجزی، فریدون پویانژاد