Testarea ipotezelor ipotezel or statistice stati stice Concepte
Ipoteză statistică = ipoteza care se
face cu privire la parametrul parametrul unei repa re part rtiiţii ssa au la la leg legea ea de de re repart partiiţie pe pe care ca re o urm urmea eazză anum anumit ite e var varia iabi bile le aleatoare.
Ipoteză nulă (H0) = constă
întotdeauna întotdeauna în admiterea caracterului caracterului întâmpl întâmplător al deosebirilor, adică în presupunerea că nu ex există deosebiri esenţiale.
Ipoteză alternativă (H1) = o teorie care ca re con contr traz azic ice e ipot ipotez eza a nul nulă. Ea va fi acceptată doar câ când ex există suficiente dovezi dovezi,, evide eviden nţe, pent pentru ru a se sta stabil bilii că este adevărată.
Dacă ipoteza nulă constă în afirmaţia că parametrul θ al unei distribuţii este egal cu o anumită valoare θ0:
ipoteza alternativă simplă: θ = θ1 θ ∈{θ 1 , θ 2 ,...,θ k }
ipoteza alternativă compusă:
Testul statistic este utilizat drept
criteriu de acceptare sau de respingere a ipotezei nule.
Regiunea critică, Rc = valorile
numerice ale testului statistic pentru care ipoteza nulă va fi respinsă.
este astfel aleasă încât probabilitatea ca ea să conţină testul statistic, când ipoteza nul ă este adevărată, să fie α, cu α mic (α=0.01 etc.). dacă punctul definit de vectorul de sondaj x1,x2,…,xn cade în regiunea critică Rc, ipoteza H0 este respinsă, iar dacă punctul cade în afara
regiunii critice Rc, ipoteza H0 est acceptată.
regiunea critică este delimitată de valoarea critic ă, C – punctul de tăietură în stabilirea acesteia.
Eroare de genul întâi = eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată. Riscul de genul întâi (α) =
probabilitatea comiterii unei erori de genul întâi.
se numeşte nivel sau prag de semnificaţie.
Nivelul de încredere a unui test statistic este (1- α) iar, în expresie procentuală, (1-α)100 reprezintă
probabilitatea de garantare a rezultatelor.
Eroare de genul al doilea = eroarea pe care o facem acceptând o ipoteză nulă, deşi este falsă.
Probabilitatea (riscul) comiterii unei erori de genul al doilea este β.
Puterea testului statistic este (1-β).
Erorile în testarea ipotezelor statistice Decizia de
Ipoteza adevărată
accept are
H0
H1
H0
Decizie corectă
Eroare de genul II
(probabilita te 1-α)
(risc β)
Eroare de genul I
Decizie
H1
(risc α)
corectă (probabilita te 1-β)
α= P(respingere H0 H0 este corectă)=P(eroare de gen I) β= P(acceptare H0 H0 este falsă)=P(eroare de gen II)
Legătura dintre probabilităţile α şi β s x
=
s x
n
Cum, , odată cu creşterea volumului n al eşantionului, abaterile medii pătratice ale distribuţiilor pentru H0
şi H1 devin mai mici şi, evident, atât α, cât şi β, descresc.
α şi β când volumul eşantionului n' > n
Se fac presupuneri privind populaţia sau populaţiile ce sunt eşantionate (normalitate etc.). Se calculează apoi testul statistic şi se determină valoarea sa numerică pe baza datelor din eşantion. Se desprind concluziile : ipoteza nulă este fie acceptată, fie respinsă, astfel:
dacă valoarea numerică a testului statistic cade în regiunea critic ă (Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă este adevărată. Această decizie este incorectă doar în 100 α % din cazuri;
dacă valoarea numerică a testului nu cade în regiunea critic ă (Rc), se acceptă ipoteza nulă H0.
Ipoteza alternativă poate avea una dintre următoarele trei forme (pe care le vom exemplifica pentru testarea egalităţii parametrului „media colectivităţii generale“, μ, cu valoarea μ0)
test bilateral :
H0: μ = μ0 H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
test unilateral dreapta:
H0: μ = μ0 H1: μ > μ0
test unilateral stânga :
H0: μ = μ0 H1: μ < μ0
μ μ
μ
a) b)
c)
Regiunea critică pentru a) test bilateral; b) test unilateral stânga; c) test unilateral dreapta Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare
Utilizarea eşantioanelor de volum mare (n > 30) face posibilă aplicarea teoremei limită centrală. În cazul testului bilateral, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0) H1: μ ≠ μ0 (μ - μ0≠0) (adică μ < μ0 sau µ μ > σ μ µ 0);σ µ z =
x −
0
=
x −
0
n
x
x
≈
x −
0
s x
n
Rc: z< - z α/2 sau
z> z α/2
Regula de decizie este, deci: µ x −
σ x
0
n
< − z α / 2
Respingem H0 dacă sau
x − µ 0
σ x
n
> z α / 2
Exemplu : Presupunem că un fabricant de materiale de construcţii comercializează ciment în pungi care
trebuie să conţină 12 kg/pungă. Pentru a detecta eventuale abateri în ambele sensuri de la această cantitate, se selectează 100 de pungi, pentru care se calculează , sx= 0,5 kg. Pentru un prag de semnificatie α = 0,01 (probabilitatea de garantare a rezultatelor: (1- α)100=99%) să se determine dacă se acceptă ipoteza nulă, respectiv aceea că greutatea pungilor este, în medie, de 12 kg. H0: μ = 12; H1: μ ≠ 12 ( μ < 12 sau μ > 12) . z α/2=z0,005=2,576 z =
x − 12
σ x
=
x − 12
σ
n
≈
x − 12 s
n
=
11,85 − 12 0,5 10
3,0
= −
Regiunea critică: z< - z α/2 sau
z> z α/2
Cum z = - 3,0 < - 2,576 se respinge ipoteza nulă H0 şi se acceptă ipoteza
alternativă, aceea că greutatea pungilor diferă, în medie, de 12 kg. α
Test Test Test bilateral unilateral unilateral stânga dreapta
0,1 z < - 1,28 z > 1,28 0
z < - 1,645 sau z > 1,645
0,0 z < - 1,645 z > 1,645 5
z < - 1,96 sau z > 1,96
0,0 z < - 2,33 z > 2,33 1
z < - 2,576 sau z > 2,576
Pentru testul unilateral stânga, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0); H1: μ < μ0 (μ - μ µ 0<0). µ z =
x −
σ x
0
=
x −
σ
0
n
≈
x − µ 0 s
n
Testul statistic calculat este: Regiunea critică este dată de: Rc: z < –zα Regula de decizie este: µ x −
0
< − z α
Respingem ipoteza H0 dacă σ
n