logo

Izpratne par hipotēžu testēšanu

Hipotēžu pārbaude ietver pieņēmumu formulēšanu par populācijas parametriem, pamatojoties uz izlases statistiku, un šo pieņēmumu stingru novērtēšanu, salīdzinot ar empīriskiem pierādījumiem. Šajā rakstā ir izskaidrota hipotēžu pārbaudes nozīme un procesā iesaistītie kritiskie soļi.

Kas ir hipotēžu pārbaude?

Hipotēžu pārbaude ir statistikas metode, ko izmanto, lai pieņemtu statistisku lēmumu, izmantojot eksperimentālos datus. Hipotēžu pārbaude būtībā ir pieņēmums, ko mēs izdarām par populācijas parametru. Tas novērtē divus savstarpēji izslēdzošus apgalvojumus par kopu, lai noteiktu, kurš apgalvojums vislabāk atbilst izlases datiem.



Piemērs: Jūs sakāt, ka vidējais augums klasē ir 30 vai zēns ir garāks par meiteni. Tas viss ir pieņēmums, ko mēs pieņemam, un mums ir nepieciešams kāds statistisks veids, kā to pierādīt. Mums ir vajadzīgs matemātisks secinājums neatkarīgi no tā, ko mēs pieņemam, ka tas ir patiess.

Hipotēžu definēšana

  • Nulles hipotēze (H 0 ): Statistikā nulles hipotēze ir vispārīgs apgalvojums vai noklusējuma pozīcija, ka nav attiecības starp diviem izmērītiem gadījumiem vai nav attiecības starp grupām. Citiem vārdiem sakot, tas ir pamata pieņēmums vai izdarīts, pamatojoties uz zināšanām par problēmu.
    Piemērs : Uzņēmuma vidējā produkcija ir 50 vienības/dienā H0: mu= 50.
  • Alternatīvā hipotēze (H 1 ): Alternatīvā hipotēze ir hipotēzes pārbaudē izmantotā hipotēze, kas ir pretrunā nulles hipotēzei.
    Piemērs: uzņēmuma produkcija nav vienāda ar 50 vienībām dienā, t.i., H1: mu 
piecdesmit.

Galvenie hipotēžu pārbaudes nosacījumi

  • Nozīmes līmenis : tas attiecas uz nozīmīguma pakāpi, kādā mēs pieņemam vai noraidām nulles hipotēzi. 100% precizitāte nav iespējama hipotēzes pieņemšanai, tāpēc mēs izvēlamies nozīmīguma līmeni, kas parasti ir 5%. To parasti apzīmē ar alphaun parasti tas ir 0,05 vai 5%, kas nozīmē, ka jūsu izvadei jābūt 95% pārliecinātai, lai katrā paraugā iegūtu līdzīgu rezultātu.
  • P vērtība: The P vērtība , jeb aprēķinātā varbūtība, ir iespējamība atrast novērotos/ekstrēmos rezultātus, ja pētījuma dotās problēmas nulles hipotēze (H0) ir patiesa. Ja jūsu P vērtība ir mazāka par izvēlēto nozīmīguma līmeni, jūs noraidāt nulles hipotēzi, t.i., pieņemat, ka jūsu paraugs apgalvo, ka atbalsta alternatīvo hipotēzi.
  • Pārbaudes statistika: Testa statistika ir skaitliska vērtība, kas aprēķināta no parauga datiem hipotēzes pārbaudes laikā un ko izmanto, lai noteiktu, vai noraidīt nulles hipotēzi. To salīdzina ar kritisko vērtību vai p-vērtību, lai pieņemtu lēmumus par novēroto rezultātu statistisko nozīmīgumu.
  • Kritiskā vērtība : kritiskā vērtība statistikā ir slieksnis vai robežpunkts, ko izmanto, lai noteiktu, vai hipotēzes pārbaudē noraidīt nulles hipotēzi.
  • Brīvības pakāpes: Brīvības pakāpes ir saistītas ar mainīgumu vai brīvību, kāda ir parametra novērtēšanā. Brīvības pakāpes ir saistītas ar izlases lielumu un nosaka formu.

Kāpēc mēs izmantojam hipotēžu testēšanu?

Hipotēžu pārbaude ir svarīga statistikas procedūra. Hipotēžu pārbaude novērtē divus savstarpēji izslēdzošus populācijas apgalvojumus, lai noteiktu, kurš apgalvojums ir visvairāk atbalstīts ar izlases datiem. Kad mēs sakām, ka konstatējumi ir statistiski nozīmīgi, pateicoties hipotēžu pārbaudei.

Vienas un divu astes tests

Viens tests fokusējas uz vienu virzienu, kas ir lielāks vai mazāks par norādīto vērtību. Mēs izmantojam vienpusīgu testu, ja ir skaidra virzība, pamatojoties uz iepriekšējām zināšanām vai teoriju. Kritiskais apgabals atrodas tikai vienā sadalījuma līknes pusē. Ja paraugs ietilpst šajā kritiskajā apgabalā, nulles hipotēze tiek noraidīta par labu alternatīvajai hipotēzei.



Vienas astes pārbaude

Ir divu veidu vienpusējie testi:

  • Kreisās puses (kreisās puses) tests: Alternatīvā hipotēze apgalvo, ka patiesā parametra vērtība ir mazāka nekā nulles hipotēze. Piemērs: H0: mu geq 50un H1:
  • un H1: mu>50

Divpusējs tests

Divpusējā pārbaudē tiek ņemti vērā abi virzieni — tie ir lielāki un mazāki par norādīto vērtību. Mēs izmantojam divpusējo testu, ja nav noteikta virziena un vēlamies atklāt jebkādu būtisku atšķirību.

Piemērs: H0: in =50 un H1: mu 
eq 50



Kas ir 1. un 2. tipa kļūdas hipotēžu pārbaudē?

Hipotēžu pārbaudē, I un II tipa kļūdas ir divas iespējamās kļūdas, ko pētnieki var pieļaut, izdarot secinājumus par populāciju, pamatojoties uz datu paraugu. Šīs kļūdas ir saistītas ar lēmumiem, kas pieņemti attiecībā uz nulles hipotēzi un alternatīvo hipotēzi.

  • I tipa kļūda: Kad mēs noraidām nulles hipotēzi, lai gan šī hipotēze bija patiesa. I tipa kļūdu apzīmē ar alfa( alpha).
  • II tipa kļūdas: Kad mēs pieņemam nulles hipotēzi, bet tā ir nepatiesa. II tipa kļūdas ir apzīmētas ar beta( eta).


Nulles hipotēze ir patiesa

Nulles hipotēze ir nepatiesa

Nulles hipotēze ir patiesa (pieņemt)

Pareizs lēmums

II veida kļūda (viltus negatīvs)

Alternatīva hipotēze ir patiesa (noraidīt)

I tipa kļūda (viltus pozitīva)

vilks pret lapsu

Pareizs lēmums

Kā darbojas hipotēžu pārbaude?

1. darbība: definējiet nulles un alternatīvo hipotēzi

Nosakiet nulles hipotēzi ( H_0), kas nav ietekmes, un alternatīvā hipotēze ( H_1​), kas liecina par efektu vai atšķirību.

Vispirms mēs identificējam problēmu, par kuru mēs vēlamies izdarīt pieņēmumu, paturot prātā, ka mūsu pieņēmumiem ir jābūt pretrunīgiem vienam ar otru, pieņemot, ka Parasti izplatīti dati.

2. darbība – izvēlieties nozīmīguma līmeni

Izvēlieties nozīmīguma līmeni ( alpha), parasti 0,05, lai noteiktu nulles hipotēzes noraidīšanas slieksni. Tas nodrošina mūsu hipotēžu pārbaudes pamatotību, nodrošinot, ka mums ir pietiekami daudz datu, lai pamatotu mūsu apgalvojumus. Parasti mēs nosakām savu nozīmīguma līmeni pirms testa. The p-vērtība ir kritērijs, ko izmanto, lai aprēķinātu mūsu nozīmīguma vērtību.

3. darbība Apkopojiet un analizējiet datus.

Novērojot vai eksperimentējot, apkopojiet attiecīgos datus. Analizējiet datus, izmantojot piemērotas statistikas metodes, lai iegūtu testa statistiku.

4. darbība. Aprēķiniet testa statistiku

Pārbaužu dati tiek novērtēti, šajā solī mēs meklējam dažādus punktus, pamatojoties uz datu īpašībām. Testa statistikas izvēle ir atkarīga no veicamās hipotēzes pārbaudes veida.

Ir dažādi hipotēžu testi, katrs ir piemērots dažādiem mērķiem, lai aprēķinātu mūsu testu. Tas varētu būt a Z-tests , Chi kvadrāts , T-tests , un tā tālāk.

  1. Z-tests : Ja ir zināmi populācijas vidējie rādītāji un standartnovirzes. Parasti tiek izmantota Z-statistika.
  2. t-tests : Ja populācijas standartnovirzes nav zināmas. un izlases lielums ir mazāks nekā t-testa statistika ir piemērotāka.
  3. Hī kvadrāta tests : Hī kvadrāta tests tiek izmantots kategoriskiem datiem vai neatkarības pārbaudei nejaušības tabulās
  4. F-tests : F-testu bieži izmanto dispersijas analīzē (ANOVA), lai salīdzinātu dispersijas vai pārbaudītu vidējo vienādību vairākās grupās.

Mums ir mazāka datu kopa, tāpēc T-tests ir piemērotāks mūsu hipotēzes pārbaudei.

T-statistika ir divu grupu vidējo atšķirību mērs attiecībā pret mainīgumu katrā grupā. To aprēķina kā starpību starp izlases vidējo vērtību, kas dalīta ar starpības standartkļūdu. To sauc arī par t-vērtību vai t-score.

5. darbība — testa statistikas salīdzināšana:

Šajā posmā mēs izlemjam, kur mums vajadzētu pieņemt nulles hipotēzi vai noraidīt nulles hipotēzi. Ir divi veidi, kā izlemt, kur pieņemt vai noraidīt nulles hipotēzi.

A metode: kritisko vērtību izmantošana

Salīdzinot mūsu iegūto testa statistiku un tabulēto kritisko vērtību,

  • Ja pārbaudes statistika > kritiskā vērtība: noraidiet nulles hipotēzi.
  • Ja testa statistika ≤ kritiskā vērtība: neizdodas noraidīt nulles hipotēzi.

Piezīme: Kritiskās vērtības ir iepriekš noteiktas sliekšņa vērtības, ko izmanto, lai pieņemtu lēmumu hipotēžu pārbaudē. Lai noteiktu kritiskās vērtības hipotēžu pārbaudei mēs parasti atsaucamies uz statistikas sadalījuma tabulu , piemēram, normālā sadalījuma vai t sadalījuma tabulām, kuru pamatā ir.

B metode: P vērtību izmantošana

Mēs varam arī nonākt pie secinājuma, izmantojot p-vērtību,

  • Ja p vērtība ir mazāka vai vienāda ar nozīmīguma līmeni, t.i. ( pleqalpha), jūs noraidāt nulles hipotēzi. Tas norāda, ka novērotie rezultāti, visticamāk, nav radušies nejauši, sniedzot pierādījumus par labu alternatīvajai hipotēzei.
  • Ja p vērtība ir lielāka par nozīmīguma līmeni, t.i. ( pgeq alpha), jums neizdodas noraidīt nulles hipotēzi. Tas liek domāt, ka novērotie rezultāti atbilst nulles hipotēzes sagaidāmajam.

Piezīme : p-vērtība ir varbūtība iegūt testa statistiku, kas ir tikpat ekstrēma kā izlasē novērotā vai ekstrēmāka par to, pieņemot, ka nulles hipotēze ir patiesa. Lai noteiktu p-vērtība hipotēžu pārbaudei mēs parasti atsaucamies uz statistikas sadalījuma tabulu , piemēram, normālā sadalījuma vai t sadalījuma tabulām, kuru pamatā ir.

7. darbība. Interpretējiet rezultātus

Beidzot mēs varam pabeigt eksperimentu, izmantojot A vai B metodi.

Pārbaudes statistikas aprēķināšana

Lai apstiprinātu mūsu hipotēzi par populācijas parametru, ko mēs izmantojam statistikas funkcijas . Mēs izmantojam z rezultātu, p vērtību un nozīmīguma līmeni (alfa), lai pierādītu mūsu hipotēzi par normāli izplatīti dati .

1. Z statistika:

Kad ir zināmi populācijas vidējie rādītāji un standartnovirzes.

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

kur,

  • ar{x}ir izlases vidējais rādītājs,
  • μ ir iedzīvotāju vidējais rādītājs,
  • σ ir standarta novirze
  • un n ir izlases lielums.

2. T-Statistika

T testu izmanto, ja n <30,

t-statistikas aprēķinu sniedz:

t=frac{x̄-Μ}{s/sqrt{n}}

kur,

  • t = t rezultāts,
  • x̄ = izlases vidējais rādītājs
  • μ = iedzīvotāju vidējais rādītājs,
  • s = parauga standartnovirze,
  • n = izlases lielums

3. Chi-Square tests

Hī kvadrāta tests neatkarības kategoriskiem datiem (neparasti izplatīti), izmantojot:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

kur,

myflixer
  • O_{ij}ir novērotā frekvence šūnā {ij}
  • i, j ir attiecīgi rindu un kolonnu indekss.
  • E_{ij}ir paredzamā frekvence šūnā {ij}, aprēķina šādi:
    frac{{	ext{{Rinda kopā}} 	imes 	ext{{Kolonna kopā}}}}{{	ext{{Kopā novērojumi}}}}

Reālās dzīves hipotēzes pārbaudes piemērs

Apskatīsim hipotēžu pārbaudi, izmantojot divas reālas dzīves situācijas,

A gadījums: D vai jaunas zāles ietekmē asinsspiedienu?

Iedomājieties, ka farmācijas uzņēmums ir izstrādājis jaunu medikamentu, kas, viņuprāt, var efektīvi pazemināt asinsspiedienu pacientiem ar hipertensiju. Pirms zāļu laišanas tirgū viņiem ir jāveic pētījums, lai novērtētu to ietekmi uz asinsspiedienu.

Dati:

  • Pirms ārstēšanas: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Pēc apstrādes: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

1. darbība : definējiet hipotēzi

  • Nulles hipotēze : (H0)Jaunās zāles neietekmē asinsspiedienu.
  • Alternatīvā hipotēze : (H1)Jaunās zāles iedarbojas uz asinsspiedienu.

2. darbība: Definējiet nozīmīguma līmeni

Apskatīsim nozīmīguma līmeni 0,05, kas norāda uz nulles hipotēzes noraidīšanu.

Ja pierādījumi liecina par mazāk nekā 5% iespējamību novērot rezultātus nejaušas variācijas dēļ.

3. darbība : aprēķina testa statistiku

Izmantojot pāra T-tests analizē datus, lai iegūtu testa statistiku un p-vērtību.

Testa statistika (piemēram, T-statistika) tiek aprēķināta, pamatojoties uz atšķirībām starp asinsspiediena mērījumiem pirms un pēc ārstēšanas.

t = m/(s/√n)

Kur:

  • m = starpības vidējais, t.i X pēc, X pirms tam
  • s = starpības standartnovirze (d), t.i d i = X pēc, i X pirms,
  • n = parauga lielums,

tad m = -3,9, s = 1,8 un n = 10

mēs aprēķinām , T-statistiku = -9, pamatojoties uz pāra t testa formulu

4. darbība: atrodiet p vērtību

Aprēķinātā t-statistika ir -9 un brīvības pakāpes df = 9, jūs varat atrast p vērtību, izmantojot statistikas programmatūru vai t sadalījuma tabulu.

tādējādi p-vērtība = 8,538051223166285e-06

5. darbība: rezultāts

  • Ja p vērtība ir mazāka vai vienāda ar 0,05, pētnieki noraida nulles hipotēzi.
  • Ja p vērtība ir lielāka par 0,05, viņi nevar noraidīt nulles hipotēzi.

Secinājums: Tā kā p vērtība (8.538051223166285e-06) ir mazāka par nozīmīguma līmeni (0.05), pētnieki noraida nulles hipotēzi. Ir statistiski nozīmīgi pierādījumi, ka vidējais asinsspiediens pirms un pēc ārstēšanas ar jauno medikamentu ir atšķirīgs.

Python hipotēžu pārbaudes īstenošana

Izveidosim hipotēžu testēšanu ar pitonu, kurā pārbaudām, vai jaunas zāles ietekmē asinsspiedienu. Šajā piemērā mēs izmantosim pāra T-testu. Mēs izmantosim scipy.stats> bibliotēka T-testam.

Mēs īstenosim savu pirmo reālās dzīves problēmu, izmantojot python,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Izvade:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

Iepriekš minētajā piemērā, ņemot vērā T-statistiku aptuveni -9 un ārkārtīgi mazu p-vērtību, rezultāti liecina par pārliecinošu gadījumu, lai noraidītu nulles hipotēzi pie nozīmīguma līmeņa 0,05.

  • Rezultāti liecina, ka jaunām zālēm, ārstēšanai vai iejaukšanās ir būtiska ietekme uz asinsspiediena pazemināšanos.
  • Negatīvā T-statistika norāda, ka vidējais asinsspiediens pēc ārstēšanas ir ievērojami zemāks nekā pieņemtais populācijas vidējais rādītājs pirms ārstēšanas.

Lieta B : Holesterīna līmenis populācijā

Dati: Tiek ņemts 25 indivīdu paraugs, un tiek mērīts holesterīna līmenis.

Holesterīna līmenis (mg/dl): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 200, 205, 198, 20, 20, 5, 5, 20 205, 210, 192, 205.

Populāciju vidējais skaits = 200

Populācijas standarta novirze (σ): 5 mg/dL (norādīta šai problēmai)

1. darbība: Definējiet hipotēzi

  • Nulles hipotēze (H 0 ): Vidējais holesterīna līmenis populācijā ir 200 mg/dl.
  • Alternatīva hipotēze (H 1 ): Vidējais holesterīna līmenis populācijā atšķiras no 200 mg/dl.

2. darbība: Definējiet nozīmīguma līmeni

Tā kā novirzes virziens nav norādīts, mēs pieņemam divu virzienu testu, un, pamatojoties uz normālā sadalījuma tabulu, kritiskās vērtības nozīmīguma līmenim 0,05 (divu virzienu) var aprēķināt, izmantojot z-tabula un ir aptuveni -1,96 un 1,96.

3. darbība : aprēķina testa statistiku

Testa statistiku aprēķina, izmantojot z formulu AR = (203,8–200) / (5 div sqrt{25})un mēs attiecīgi saņemam, AR =2,039999999999992.

4. darbība: rezultāts

Tā kā testa statistikas absolūtā vērtība (2,04) ir lielāka par kritisko vērtību (1,96), mēs noraidām nulles hipotēzi. Un seciniet, ka ir statistiski nozīmīgi pierādījumi, ka vidējais holesterīna līmenis populācijā atšķiras no 200 mg/dl

Python hipotēžu pārbaudes īstenošana

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Izvade:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Hipotēžu pārbaudes ierobežojumi

  • Lai gan hipotēžu pārbaude ir noderīga metode, tā nesniedz visaptverošu izpratni par pētāmo tēmu. Pilnībā neatspoguļojot parādību sarežģītību vai visu kontekstu, tā koncentrējas uz noteiktām hipotēzēm un statistisko nozīmīgumu.
  • Hipotēžu pārbaudes rezultātu precizitāte ir atkarīga no pieejamo datu kvalitātes un izmantoto statistikas metožu atbilstības. Neprecīzi dati vai slikti formulētas hipotēzes var novest pie nepareiziem secinājumiem.
  • Paļaujoties tikai uz hipotēžu pārbaudi, analītiķi var ignorēt nozīmīgus datu modeļus vai sakarības, kas nav ietvertas konkrētajās pārbaudāmajās hipotēzēs. Šis ierobežojums uzsver, cik svarīgi ir papildināt hipotēžu pārbaudi ar citām analītiskām pieejām.

Secinājums

Hipotēžu pārbaude ir statistiskās analīzes stūrakmens, kas ļauj datu zinātniekiem orientēties neskaidrībās un izdarīt ticamus secinājumus no izlases datiem. Sistemātiski definējot nulles un alternatīvas hipotēzes, izvēloties nozīmīguma līmeņus un izmantojot statistiskos testus, pētnieki var novērtēt savu pieņēmumu pamatotību. Rakstā ir arī izskaidrota kritiskā atšķirība starp I un II tipa kļūdām, sniedzot visaptverošu izpratni par niansēto lēmumu pieņemšanas procesu, kas raksturīgs hipotēžu pārbaudei. Dzīves piemērs, kā pārbaudīt jaunu zāļu ietekmi uz asinsspiedienu, izmantojot pāra T-testu, parāda šo principu praktisko pielietojumu, uzsverot statistikas stingrības nozīmi uz datiem balstītu lēmumu pieņemšanā.

Bieži uzdotie jautājumi (FAQ)

1. Kādi ir 3 hipotēžu pārbaudes veidi?

Ir trīs veidu hipotēžu testi: labās puses, kreisās puses un divpusēji. Labās puses testi novērtē, vai parametrs ir lielāks, vai kreisais, ja tas ir mazāks. Divpusējie testi pārbauda lielākas vai mazākas nevirziena atšķirības.

2.Kādi ir 4 hipotēžu pārbaudes komponenti?

Nulles hipotēze ( H_o): Nav efekta vai atšķirības.

Alternatīvā hipotēze ( H_1): Pastāv efekts vai atšķirība.

Nozīmīguma līmenis ( alpha): Nulles hipotēzes noraidīšanas risks, ja tā ir patiesa (I tipa kļūda).

Testa statistika: skaitliskā vērtība, kas atspoguļo novēroto pierādījumu pret nulles hipotēzi.

3. Kas ir hipotēžu pārbaude ML?

Statistikas metode mašīnmācīšanās modeļu veiktspējas un derīguma novērtēšanai. Pārbauda konkrētas hipotēzes par modeļa uzvedību, piemēram, vai funkcijas ietekmē prognozes vai modelis labi vispārina neredzamus datus.

4.Kāda ir atšķirība starp Pytest un hipotēzi Python?

Pytest paredzēta Python koda vispārējai testēšanas sistēmai, savukārt hipotēze ir uz īpašumiem balstīta Python testēšanas sistēma, koncentrējoties uz testa gadījumu ģenerēšanu, pamatojoties uz norādītajām koda īpašībām.