La distribución chi-cuadrado se utiliza principalmente en las pruebas de hipótesis, y en menor medida para los intervalos de confianza para la varianza de la población cuando la distribución subyacente es normal. A diferencia de otras distribuciones más conocidas como la distribución normal y la distribución exponencial, la distribución chi-cuadrado no se aplica tan a menudo en la modelización directa de fenómenos naturales. Surge en las siguientes pruebas de hipótesis, entre otras:
También es un componente de la definición de la t-distribution y la F-distribution utilizadas en pruebas t, análisis de varianza y análisis de regresión.
La razón principal por la que la distribución chi-cuadrado se utiliza ampliamente en las pruebas de hipótesis es su relación con la distribución normal. Muchas pruebas de hipótesis utilizan un estadístico de prueba, como el t-estadístico en una prueba t. Para estas pruebas de hipótesis, a medida que aumenta el tamaño de la muestra, n, la distribución muestral del estadístico de prueba se aproxima a la distribución normal (teorema del límite central). Dado que el estadístico de prueba (como t) se distribuye asintóticamente con normalidad, siempre que el tamaño de la muestra sea suficientemente grande, la distribución utilizada para el contraste de hipótesis puede aproximarse mediante una distribución normal. La comprobación de hipótesis utilizando una distribución normal se entiende bien y es relativamente fácil. La distribución chi-cuadrado más sencilla es el cuadrado de una distribución normal estándar. Por lo tanto, siempre que se pueda utilizar una distribución normal para una prueba de hipótesis, se puede utilizar una distribución chi-cuadrado.
Supongamos que es una variable aleatoria muestreada de la distribución normal estándar, donde la media es y la varianza es : . Consideremos ahora la variable aleatoria . La distribución de la variable aleatoria es un ejemplo de distribución chi-cuadrado: . El subíndice 1 indica que esta distribución chi-cuadrado particular se construye a partir de sólo 1 distribución normal estándar. Se dice que una distribución chi-cuadrado construida elevando al cuadrado una única distribución normal estándar tiene 1 grado de libertad. Por lo tanto, a medida que aumenta el tamaño de la muestra para una prueba de hipótesis, la distribución de la estadística de la prueba se aproxima a una distribución normal. Al igual que los valores extremos de la distribución normal tienen baja probabilidad (y dan valores p pequeños), los valores extremos de la distribución chi-cuadrado tienen baja probabilidad.
Una razón adicional por la que la distribución chi-cuadrado se utiliza ampliamente es que aparece como la distribución de muestras grandes de la pruebas de razón de verosimilitud generalizada (LRT).[1] Las LRT tienen varias propiedades deseables; en particular, las LRT simples suelen proporcionar la mayor potencia para rechazar la hipótesis nula (lema de Neyman-Pearson) y esto conduce también a propiedades de optimalidad de las LRT generalizadas. Sin embargo, las aproximaciones normal y chi-cuadrado sólo son válidas asintóticamente. Por este motivo, es preferible utilizar la distribución t en lugar de la aproximación normal o la aproximación chi-cuadrado para un tamaño de muestra pequeño. Del mismo modo, en los análisis de tablas de contingencia, la aproximación chi-cuadrado será pobre para un tamaño de muestra pequeño, y es preferible utilizar la prueba exacta de Fisher. Ramsey demuestra que la prueba binomial exacta es siempre más potente que la aproximación normal.[2]
Lancaster muestra las conexiones entre las distribuciones binomial, normal y chi-cuadrado, como sigue.[3]
De Moivre y Laplace establecieron que una distribución binomial podía ser aproximada por una distribución normal. Específicamente demostraron la normalidad asintótica de la variable aleatoria
donde es el número observado de éxitos en ensayos, donde la probabilidad de éxito es , y .
Elevando al cuadrado ambos lados de la ecuación se obtiene
Utilizando , , y , esta ecuación puede reescribirse como
La expresión de la derecha es de la forma que Karl Pearson generalizaría a la forma
donde
= estadístico de prueba acumulativo de Pearson, que se aproxima asintóticamente a una distribución ;
= el número de observaciones de tipo ;
= la frecuencia esperada (teórica) del tipo , afirmada por la hipótesis nula de que la fracción del tipo en la población es ; y
= el número de celdas de la tabla.
En el caso de un resultado binomial (lanzar una moneda al aire), la distribución binomial puede aproximarse mediante una distribución normal (para suficientemente grande). Dado que el cuadrado de una distribución normal estándar es la distribución chi-cuadrado con un grado de libertad, la probabilidad de un resultado como 1 cara en 10 intentos puede aproximarse utilizando directamente la distribución normal o la distribución chi-cuadrado para la diferencia normalizada al cuadrado entre el valor observado y el esperado. Sin embargo, muchos problemas implican más de los dos resultados posibles de una binomial y, en su lugar, requieren 3 o más categorías, lo que da lugar a la distribución multinomial. Al igual que de Moivre y Laplace buscaron y encontraron la aproximación normal a la binomial, Pearson buscó y encontró una aproximación normal multivariante degenerada a la distribución multinomial (los números de cada categoría suman el tamaño total de la muestra, que se considera fijo). Pearson demostró que la distribución chi-cuadrado surgía de dicha aproximación normal multivariante a la distribución multinomial, teniendo muy en cuenta la dependencia estadística (correlaciones negativas) entre los números de observaciones en diferentes categorías.[3]
Definición
Como la suma de normales estándar
Sean variables aleatorias independientes tales que para entonces la variable aleatoria definida por
tiene una distribución chi cuadrada con grados de libertad.
Notación
Si la variable aleatoria continua tiene una distribución Chi Cuadrada con grados de libertad entonces escribiremos o .
Extensión a un número no natural de grados de libertad
La función del párrafo anterior está bien definida y es una función de densidad para cualquier : en efecto, fijado cualquier número real , tenemos que y . Una variable aleatoria con esta función de densidad se dice que tiene distribución con grados de libertad . Obviamente, cuando no es un número natural, la interpretación del término grados de libertad como el número de sumandos de variables independientes normales estándar al cuadrado se pierde, pero se continua usando esa expresión [4].
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es la denominada prueba χ², utilizada como prueba de independencia y como prueba de buen ajuste y en la estimación de varianzas. Pero también está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución χ².
El valor p es la probabilidad de observar un estadístico de prueba "al menos" tan grande como en una distribución de ji-cuadrado. Por lo tanto, dado que la función de distribución acumulativa (CDF) para los grados de libertad apropiados (df, del inglés degree of freedom) da la probabilidad de haber obtenido un valor menos extremo que este punto, restando el valor de CDF de 1 da el valor p. Un valor p bajo, por debajo del nivel de significación elegido, indica significación estadística, es decir, evidencia suficiente para rechazar la hipótesis nula. Un nivel de significancia de 0.05 se usa a menudo como el punto de corte entre resultados significativos y no significativos.
La siguiente tabla da un número de valores p que coinciden con para los primeros 10 grados de libertad.
Estos valores se pueden calcular evaluando la función cuantil (también conocida como "FDC inversa" o "ICDF") de la distribución ji-cuadrado;[6] por ejemplo, el χ2 ICDF de p = 0.05 y df = 7 rinde 2.1673 ≈ 2.17 como en la tabla anterior, observando que 1 – p es el valor p de la tabla.
Historia
Esta distribución fue descrita por primera vez por el geodésico y estadístico alemán Friedrich Robert Helmert en artículos de 1875–6,[7][8] donde calculó la distribución muestral de la varianza muestral de una población normal. Así, en alemán, esto se conocía tradicionalmente como Helmert'sche ("Helmertiano") o "distribución de Helmert".
La distribución fue redescubierta de forma independiente por el matemático inglés Karl Pearson en el contexto de la bondad de ajuste, para lo cual desarrolló su prueba de ji-cuadrado de Pearson, publicada en 1900, con una tabla calculada de valores publicados en (Elderton, 1902), recogida en (Pearson, 1914, Table XII).
El nombre "ji-cuadrado" deriva en última instancia de la abreviatura de Pearson para el exponente en una distribución normal multivariada con la letra griega ji, escribiendo −½χ2 por lo que aparecería en la notación moderna como −½xTΣ−1x (Σ siendo la matriz de covarianza).[9] Sin embargo, la idea de una familia de "distribuciones de ji-cuadrado" no se debe a Pearson, sino que surgió como un desarrollo posterior debido a Fisher en la década de 1920.[7]
↑Westfall, Peter H. (2013). Understanding Advanced Statistical Methods. Boca Raton, FL: CRC Press. ISBN978-1-4665-1210-8.
↑Ramsey, PH (1988). «Evaluación de la aproximación normal a la prueba binomial». Journal of Educational Statistics13 (2): 173-82. JSTOR1164752.
↑ abLancaster, H.O. (1969), La distribución chi-cuadrado, Wiley.
↑Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1994). Continuous univariate distributions. 1 (2. ed., 3. [print.] - 1994 edición). Wiley. p. pp. 416-417. ISBN978-0-471-58495-7.|fechaacceso= requiere |url= (ayuda)
↑Chi-Squared TestArchivado el 18 de noviembre de 2013 en Wayback Machine. Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
Pearson, Karl (1914). «On the probability that two independent distributions of frequency are really samples of the same population, with special reference to recent work on the identity of Trypanosome strains». Biometrika10: 85-154. doi:10.1093/biomet/10.1.85.
Alto Santa MariaGeografiaPaís BrasilUnidade federativa Espírito SantoFuncionamentoEstatuto distrito municipal do Brasileditar - editar código-fonte - editar Wikidata Alto Santa Maria é um distrito do município de Santa Teresa, no Espírito Santo [1]. O distrito possui cerca de 3 800 habitantes e está situado na região noroeste do município [2]. Referências ↑ Instituto Brasileiro de Geografia e Estatística. «O histórico de Santa Teresa» (PDF). Consultado em 19 de fevereiro...
Gaso o alconafta es la mezcla de gasolina y alcohol en distintas proporciones, para uso como combustible en motores de explosión diseñados para quemar derivados del petróleo. Se puede realizar la mezcla del gasohol con alcohol etílico (etanol) o con alcohol metílico (metanol), aunque el etanol es el tipo de alcohol que más se ha utilizado comercialmente. El metanol se ha utilizado en forma más limitada debido a que es tóxico. El uso más común del término gasohol se refiere a la mez...
Der Titel dieses Artikels ist mehrdeutig. Für die Branche siehe Maschinenbau (Branche). Anlage zum Abfüllen und Dosieren, Beispiel für eine moderne Maschine Nähmaschine, etwa 1900; die Funktion der Maschine ist bis heute prinzipiell gleich geblieben Der Maschinenbau (auch als Maschinenwesen bezeichnet) ist eine klassische Ingenieurwissenschaft und erstreckt sich auf Entwicklung, Konstruktion und Produktion von Maschinen und Anlagen. Dazu zählen u. a.: Maschinen und Anlagen für tech...
Coventry-class Royal Navy frigate For other ships with the same name, see HMS Active. Active (right) engaging the Spanish frigate Hermione (centre) in 1762: sketch by Richard Wright History Great Britain NameHMS Active Ordered6 May 1757 BuilderThomas Stanton, Rotherhithe Laid down13 June 1757 Launched11 January 1758 Completed2 March 1758 at Deptford Dockyard CommissionedJanuary 1758 FateTaken by the French off San Domingo 1 September 1778 France NameActive Acquired1778 by capture FateBroken u...
2013 studio album by Various ArtistsThérèse – Vivre d'amourStudio album by Various ArtistsReleased22 April 2013Recorded2013GenrePopLabelTwin Music Thérèse – Vivre d'amour is a concept album of poems by St. Thérèse of Lisieux, with music composed by French musician Grégoire.[1] The album features performances by Natasha St-Pier, Anggun, Sonia Lacen, Elisa Tovati, Les Stentors, Les Petits Chanteurs à la Croix de Bois, and Michael Lonsdale. It was released on 22 April...
This article is about the area of Glasgow, Scotland. For the locality in Alberta, Canada, see Northern Sunrise County. Inner-city district in ScotlandSpringburnScottish Gaelic: Allt an FhuarainInner-city districtView of Springburn from aircraft looking east (2017)SpringburnLocation within GlasgowPopulation12,064 (2012)OS grid referenceNS607678• Edinburgh65 km• London557 kmCouncil areaGlasgow City CouncilLieutenancy areaGlasgowCountryScotlandSov...
OrsayBalai Kota Lambang kebesaranLokasi (warna merah) antara dalam dan luar kota ParisKoordinat: 48°41′57″N 2°11′15″E / 48.6993°N 2.1875°E / 48.6993; 2.1875NegaraPrancisRegionÎle-de-FranceDepartemenEssonneArondisemenPalaiseauKantonOrsayAntarkomuneCommunauté d'agglomération du Plateau de SaclayPemerintahan • Wali kota (2008–2014) David RosLuas • Land17,97 km2 (308 sq mi) • Populasi216.638 • ...
Chevron B36 The Chevron B36 was a Group 6 (later modified into Group C) prototype sports car, designed, developed, and built by British manufacturer Chevron Cars Ltd in 1976 and used in sports car racing until 1987. Over that time period, it won a total of 14 races, and achieved 43 podium finishes.[1][2] Development In Chevron's nomenclature, the B36 succeeded the B35. However, this was not a sports car, but a Formula 2 vehicle that was also available as a slightly modified Fo...
Yang MuliaAntonius Subianto BunjaminO.S.C.Uskup BandungMgr. Antonius Subianto Bunjamin, O.S.C. pada 2014GerejaKatolik RomaProvinsi gerejawiJakartaKeuskupanBandungPenunjukan3 Juni 2014 (9 tahun, 187 hari)PendahuluJohannes PujasumartaJabatan lainKetua Konferensi Waligereja IndonesiaImamatTahbisan imam26 Juni 1996 (27 tahun, 164 hari)oleh Alexander Soetandio DjajasiswajaTahbisan uskup25 Agustus 2014 (9 tahun, 104 hari)oleh Ignatius SuharyoInformasi pribadi...
Small nucleolar RNA snR61/Z1/Z11Predicted secondary structure and sequence conservation of snosnR61IdentifiersSymbolsnosnR61RfamRF00476Other dataRNA typeGene; snRNA; snoRNA; CD-boxDomain(s)EukaryotaGOGO:0006396 GO:0005730SOSO:0000593PDB structuresPDBe In molecular biology, Small nucleolar RNA snR61/Z1/Z11 refers to a group of related non-coding RNA (ncRNA) molecules which function in the biogenesis of other small nuclear RNAs (snRNAs). These small nucleolar RNAs (snoRNAs) are modifying RNAs a...
Music festival in Tampere, Finland Sauna Open AirGenreHeavy metalDatesJuneLocation(s)Tampere, FinlandYears active2004–20132019[1]–2022Websitewww.saunaopenair.fi Sauna Open Air Metal Festival, shortly Sauna Open Air or just Sauna, was one of the largest music festivals dedicated only to heavy metal and related styles of rock music in the Nordic countries. It was first arranged in 2004 and takes place in the Ratinanniemi park in Tampere, Finland. From 8 June to 10 June 2006, over 20...
For the football team, see Europa Point F.C. Europa Point as seen from the Strait of Gibraltar. Europa Point (Spanish and Llanito: Punta de Europa or Punta Europa), is the southernmost point of Gibraltar (the southernmost point of the Iberian Peninsula being Punta de Tarifa 25 km southwest of Gibraltar). At the end of the Rock of Gibraltar, the area is flat and occupied by such features as a playing field and a few buildings. On a clear day, views of North Africa can be seen across the S...
George Lopez Serie de televisión Género SitcomComediaHumor negroComedia de situaciónCreado por Bruce HelfordGeorge LopezRobert BordenProtagonistas George LopezConstance MarieValente RodriguezMasliela LushaLuis Armand GarciaBelita MorenoEmiliano DíezAimee GarciaTema principal Low Rider(compuesto por Thomas Allen, Harold Ray Brown, Morris Dickerson, Gerald Goldstein, Lonnie Jordan, Lee Levitin, Charles Miller y Howard E. Scott)Tema de cierre Low Rider (instrumental)Compositor(es) W.G. Snuff...
Title in the Peerage of Great Britain Marquessate of LansdowneArms: 1st and 4th, Ermine, on a Bend Azure, a Magnetic Needle, pointing to the Polar Star Or (Petty); 2nd and 3rd, Argent, a Saltire Gules, and a Chief, Ermine (FitzMaurice). Crests: 1st, A Beehive beset with Bees volant proper (Petty). 2nd, A Centaur drawing a Bow and Arrow proper, the part below the waist Argent (FitzMaurice). Supporters: On either side, Pegasus Ermine, bridled crined winged and unguled Or, each charged on the sh...
Jorge Martínez Busch Presidente de la Junta Militar de Gobierno de Chile 8 de marzo de 1990-11 de marzo de 1990Presidente Augusto PinochetPredecesor José Toribio MerinoSucesor Desaparecida con la instalación del Congreso NacionalConforme a la Constitución de 1980 Comandante en Jefe de la Armada de Chile 8 de marzo de 1990-14 de noviembre de 1997Presidente Augusto Pinochet (1990)Patricio Aylwin (1990 - 1994)Eduardo Frei Ruiz-Tagle (1994 - 1997)Predecesor José Toribio MerinoSucesor Jorge A...
2007 video game This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Disney Friends – news · newspapers · books · scholar · JSTOR (August 2011) (Learn how and when to remove this template message) 2007 video gameDisney FriendsEuropean cover artDeveloper(s)Amaze EntertainmentPublisher(s)Disney Interactive StudiosP...