در هنگام تعیین تقریبی میانگین نمونههای برداشته شده از یک متغیر تصادفی، توزیع تی-استودنت (به انگلیسی: Student's t-distribution) مطرح میشود. این توزیع، اساس آزمونی به نام «تست تی» است که مقدار اطمینان از تفاوت دو متغیر تصادفی را از روی نمونههایشان اعلام میکند.
آزمون تی-استیودنت (به انگلیسی: T student) برای ارزیابی میزان همقوارگی یا یکسان بودن و نبودن میانگین نمونهای با میانگین جامعه در حالتی به کار میرود که انحراف معیار جامعه مجهول باشد چون توزیع t در مورد نمونههای کوچک با استفاده از درجات آزادی تعدیل میشود، میتوان از این آزمون برای نمونههای بسیار کوچک استفاده نمود.
یک متغیر تصادفی نرمال با میانگین صفر و واریانس ۱ است.
حال به جای متغیر Z فوق ، متغیر T را به صورت زیر تعریف میکنیم.
μ پارامتر غیر مرکزیت میباشد .
فرق این متغیر با Z، در این است که به جای (مقدار واقعی واریانس) از مقدار تخمینی آن . استفاده شدهاست. میتوان نشان داد که متغیر T تابع توزیع احتمالی به فرم زیر دارد.
همانطور که دیده میشود، تابع توزیع نسبت به μ یا σ مستقل است.
ممانهای این تابع توزیع به صورت زیر هستند.
اگر 0 <k <ν و k زوج باشد، با توجه به خواص تابع گاما، ممانها به صورت زیر ساده میشوند:
تست تی
برای بررسی این نکته که میانگین نمونههای برداشته شده از یک متغیر تصادفی تا چه حد به میزان «واقعی» (که آزمایشگر نمیداند) نزدیک است از تست تی-استیودنت استفاده میشود.
مثال: میانگین طول عمر ۱۵ بیمار سرطانی که داروی الف را مصرف کردند ۱۱۰ روز است با واریانس ۱۵. میانگین طول عمر ۱۵ بیمار دیگر که داروی مورد آزمایش را مصرف نکردند، ۱۰۰ روز گشتهاست با واریانس ۱۲. سؤال: آیا بهبود در میانگین طول عمر بیمارانی که از داروی جدید استفاده کردند ناشی از عملکرد دارو است یا خطای میانگینگیری ناشی از تعداد محدود نمونهها؟
جواب:
فرض صفر این مسئله را این قرار میدهیم که دارو اثری نداشتهاست. یا به عبارت دیگر میشود این طور فرض کرد که نمونههای برداشته شده از هر دو گروه، در واقع نمونهگیری از یک متغیر تصادفی است. در این مسئله، ما فرض صفر خود را هنگامی نقض میکنیم، که به احتمال ۹۵ درصد مطمئن شویم که غلط است. (این عدد اختیاری است)
این یک مسئله با ۱۴ درجه آزادی و دوطرفه است. پس، از جدول مقادیر توزیع t، مقداری را که از تقاطع ۰٫۹۷۵ درصد (مقادیر جدول از احتمال یک طرفه حاصل شدهاند) و ۱۴ درجه آزادی حاصل میشود را مییابیم: ۲٫۱۴۵. این مقدار را اگر در واریانس اختلاف نمونهها ضرب کنیم (در محاسبه این واریانس فرض مستقل بودن را نیز کردهایم) و بر ریشه ۱۵ تقسیم کنیم عدد ۱۰٫۵۸ حاصل میگردد.
پس به احتمال ۹۵ درصد، اگر دارو اثری نداشته باشد، باید اختلاف میانگین دو نمونه بین مثبت و منفی ۱۰٫۵۸ باشد. که در این مثال هست. پس با قطعیت نمیتوان از اثر مثبت دارو صحبت کرد.
آزمون تی هتلینگ
آزمون T هتلینگ تعمیم یافته t استیودنت است. در آزمون t یک نمونهای، میانگین یک صفت از یک نمونه، با یک عدد فرضی که میانگین آن صفت از جامعه فرض میشد، مورد مقایسه قرار میگرفت، اما در T هتلینگ K متغیر (صفت) از آن جامعه (نمونههای جامعه) با k عدد فرضی، مورد مقایسه قرار میگیرند.
در واقع این آزمون از نوع آزمونهای چند متغیرهاست که همقوارگی (Goodness of fit) را بین صفتهای مختلف از جامعه بدست میدهد. در T هتلینگ دو نمونهای نیز همچون T استیودنت دو نمونهای، مقایسه دو نمونهاست اما در این آزمون K صفت از یک جامعه (نمونه) با K صفت از جامعه دیگر (نمونه دیگر) مورد مقایسه قرار میگیرد.
جدول مقادیر توزیع t
توجه کنید که مقادیر این جدول از احتمال یک طرفه به دست آمدهاند. برای استفاده از آن در مسائل دوطرفه باید ابتدا مقدار احتمال را به یک طرفه تبدیل کنید. مثالا در ۹۰ درصد در احتمال دوطرفه، میشود ۹۵ درصد یک طرفه.