Null at alternatibong hypotheses. Null Hypothesis Testing

Sa iba't ibang yugto ng istatistikal na pananaliksik at pagmomolde mayroong pangangailangan na bumalangkas at pang-eksperimentong pagpapatunay ilang mga pagpapalagay (hypotheses) tungkol sa kalikasan at laki ng hindi kilalang mga parameter ng nasuri na pangkalahatang populasyon (populasyon). Halimbawa, ang isang mananaliksik ay gumagawa ng palagay: "ang sample ay nakuha mula sa isang normal na populasyon" o "ang pangkalahatang mean ng nasuri na populasyon ay lima." Ang ganitong mga pagpapalagay ay tinatawag istatistikal na hypotheses.

Ang isang paghahambing ng nakasaad na hypothesis tungkol sa pangkalahatang populasyon na may magagamit na sample na data, na sinamahan ng isang quantitative assessment ng antas ng pagiging maaasahan ng resultang konklusyon, ay isinasagawa gamit ang isa o isa pang istatistikal na pamantayan at tinatawag na pagsubok ng mga istatistikal na hypotheses .

Ang hypothesis na iniharap ay tinatawag zero (pangunahin) . Nakaugalian na itong tukuyin H 0.

Kaugnay ng nakasaad (pangunahing) hypothesis, ang isa ay maaaring palaging bumalangkas alternatibo (kumpetensya) , sumasalungat dito. Ang isang alternatibong (kumpetensyang) hypothesis ay karaniwang tinutukoy bilang H 1.

Layunin ng statistical hypothesis testing ay ang magpasya sa bisa ng pangunahing hypothesis batay sa sample na data H 0.

Kung ang hypothesis na inilalagay ay bumaba sa pahayag na ang halaga ng ilang hindi kilalang parameter ng populasyon eksaktong katumbas ibinigay na halaga, kung gayon ang hypothesis na ito ay tinatawag simple lang, halimbawa: "ang average per capita kabuuang kita ng populasyon ng Russia ay 650 rubles bawat buwan"; "Ang rate ng kawalan ng trabaho (ang bahagi ng mga walang trabaho sa aktibong populasyon sa ekonomiya) sa Russia ay 9%." Sa ibang mga kaso ang hypothesis ay tinatawag kumplikado.

Bilang null hypothesis H 0 nakaugalian na ang magnominate simpleng hypothesis, dahil Karaniwang mas maginhawang suriin ang isang mas malakas na pahayag.

Hypotheses tungkol sa uri ng distribution law ng pinag-aralan random variable;

Mga hypotheses tungkol sa mga numerical na halaga ng mga parameter ng populasyon na pinag-aaralan;

Mga hypotheses tungkol sa homogeneity ng dalawa o higit pang sample o ilang partikular na katangian ng mga nasuri na populasyon;

Mga hypotheses tungkol sa pangkalahatang anyo ng modelo na naglalarawan sa pag-asa sa istatistika sa pagitan ng mga katangian, atbp.

Dahil ang pagsubok ng statistical hypotheses ay isinasagawa batay sa sample na data, i.e. limitadong serye ng mga obserbasyon, mga desisyon tungkol sa null hypothesis H 0 ay probabilistic sa kalikasan. Sa madaling salita, ang gayong desisyon ay hindi maaaring hindi sinamahan ng ilan, bagaman marahil ay napakaliit, posibilidad ng isang maling konklusyon sa alinmang direksyon.



Kaya, sa ilang maliit na bahagi ng mga kaso α null hypothesis H 0 maaaring tanggihan, habang sa katotohanan ito ay patas sa pangkalahatang populasyon. Ang error na ito ay tinatawag pagkakamali ng unang uri . At ang posibilidad nito ay karaniwang tinatawag antas ng kahalagahan at italaga α .

Sa kabaligtaran, sa ilang maliit na bahagi ng mga kaso β null hypothesis H 0 ay tinatanggap, habang sa katunayan sa pangkalahatang populasyon ito ay mali at ang alternatibong hypothesis ay totoo H 1. Ang error na ito ay tinatawag error ng pangalawang uri . Ang posibilidad ng isang type II error ay karaniwang tinutukoy β . Probability 1 - β tinawag kapangyarihan ng pamantayan .

Sa isang nakapirming laki ng sample, maaari mong piliin sa iyong paghuhusga ang posibilidad ng isa lamang sa mga error α o β . Ang pagtaas sa posibilidad ng isa sa kanila ay humahantong sa pagbaba sa isa pa. Nakaugalian na itakda ang posibilidad ng isang uri ng error α - lebel ng kahalagahan. Bilang isang tuntunin, ginagamit ang ilang karaniwang antas ng kahalagahan α : 0.1; 0.05; 0.025; 0.01; 0.005; 0.001. Pagkatapos, malinaw naman, mula sa dalawang pamantayan na nailalarawan ng parehong posibilidad α tanggihan ang isang hypothesis na talagang tama H 0, dapat mong tanggapin ang isa na may kasamang mas maliit na error ng pangalawang uri β , ibig sabihin. higit na kapangyarihan. Pagbabawas ng posibilidad ng parehong mga pagkakamali α At β maaaring makamit sa pamamagitan ng pagtaas ng laki ng sample.

Tamang desisyon tungkol sa null hypothesis H 0 maaari ding may dalawang uri:

Ang null hypothesis ay tatanggapin H 0, samantalang sa katunayan sa pangkalahatang populasyon ang null hypothesis ay totoo H 0; ang posibilidad ng naturang desisyon 1 - α;

Null hypothesis H 0 ay tatanggihan pabor sa isang alternatibo N 1, samantalang sa katunayan sa populasyon ang null hypothesis H 0 tinanggihan sa pabor ng isang alternatibo H 1; ang posibilidad ng naturang desisyon 1 - β - kapangyarihan ng criterion.

Ang mga resulta ng paglutas ng null hypothesis ay maaaring ilarawan gamit ang Talahanayan 8.1.

Talahanayan 8.1

Sinusuri ang mga istatistikal na hypotheses gamit ang istatistikal na pamantayan(tawagin natin ito sa mga pangkalahatang termino SA), na isang function ng mga resulta ng pagmamasid.

Ang istatistikal na pamantayan ay isang panuntunan (pormula) kung saan natutukoy ang sukat ng pagkakaiba sa pagitan ng mga resulta ng isang sample na obserbasyon at ang nakasaad na hypothesis H 0.

Ang istatistikal na pamantayan, tulad ng anumang pag-andar ng mga resulta ng pagmamasid, ay isang random na variable at sa ilalim ng pagpapalagay na ang null hypothesis ay totoo H 0 ay napapailalim sa ilang pinag-aralan na mabuti (at na-tabulate) na teoretikal na batas sa pamamahagi na may density ng pamamahagi f(k).

Ang pagpili ng criterion para sa pagsubok ng mga istatistikal na hypotheses ay maaaring isagawa batay sa iba't ibang mga prinsipyo. Kadalasan ginagamit nila ito para dito prinsipyo ng ratio ng posibilidad, na nagbibigay-daan sa iyong bumuo ng pinakamakapangyarihang pamantayan sa lahat ng posibleng pamantayan. Ang kakanyahan nito ay bumababa sa pagpili ng naturang pamantayan SA may kilalang density function f(k) sa kondisyon na ang hypothesis H 0 ay wasto, upang para sa isang naibigay na antas ng kahalagahan α magiging posible na mahanap ang kritikal na punto K cr.distribusyon f(k), na maghahati sa hanay ng mga halaga ng pamantayan sa dalawang bahagi: ang hanay ng mga katanggap-tanggap na halaga, kung saan ang mga resulta ng sample na obserbasyon ay mukhang pinaka-kapani-paniwala, at ang kritikal na rehiyon, kung saan ang mga resulta ng sample na pagmamasid ay mukhang mas mababa. makatwiran na may paggalang sa null hypothesis H 0.

Kung ganoong pamantayan SA pinili, at ang density ng pamamahagi nito ay kilala, kung gayon ang gawain ng pagsubok sa istatistikal na hypothesis ay bumababa sa katotohanan na para sa isang naibigay na antas ng kahalagahan α kalkulahin ang naobserbahang halaga ng pamantayan mula sa sample na data Sa pagmamasid at tukuyin kung ito ay pinaka o hindi gaanong kapani-paniwala patungkol sa null hypothesis H 0.

Ang bawat uri ng istatistikal na hypothesis ay sinusubok gamit ang kaukulang pamantayan, na siyang pinakamakapangyarihan sa bawat partikular na kaso. Halimbawa, ang pagsubok ng hypothesis tungkol sa anyo ng batas ng pamamahagi ng isang random na variable ay maaaring isagawa gamit ang Pearson goodness-of-fit test χ 2; pagsubok sa hypothesis tungkol sa pagkakapantay-pantay ng mga hindi kilalang halaga ng mga pagkakaiba-iba ng dalawang pangkalahatang populasyon - gamit ang isang criterion F- Fischer; ang isang bilang ng mga hypotheses tungkol sa hindi kilalang mga halaga ng mga parameter ng pangkalahatang populasyon ay nasubok gamit ang criterion Z- normal distributed random variable at criterion T- Pagsusulit ng mag-aaral, atbp.

Ang halaga ng pamantayan na kinakalkula ayon sa mga espesyal na panuntunan batay sa sample na data ay tinatawag naobserbahang halaga ng pamantayan (Sa pagmamasid).

Mga halaga ng pamantayan na naghahati sa hanay ng mga halaga ng pamantayan sa hanay ng mga katanggap-tanggap na halaga(pinaka makatwiran tungkol sa null hypothesis H 0) At kritikal na rehiyon(lugar ng mga halaga na hindi gaanong kapani-paniwala na may kaugnayan sa mga random na variable na talahanayan ng pamamahagi SA, na pinili bilang criterion, ay tinatawag kritikal na puntos (K cr.).

Lugar ng mga katanggap-tanggap na halaga (lugar ng pagtanggap ng null hypothesis H 0) SA H 0 hindi lumilihis.

Kritikal na lugar tumawag ng isang hanay ng mga halaga ng pamantayan SA , kung saan ang null hypothesis H 0 tinanggihan pabor sa isang nakikipagkumpitensya H 1 .

Makilala isang panig(kanan- o kaliwang kamay) at dalawang-daan na kritikal na lugar.

Kung right-sided ang nakikipagkumpitensyang hypothesis, hal. H 1: a > a 0, kung gayon ang kritikal na rehiyon ay kanang kamay(Larawan 1). Sa ilalim ng isang right-sided competing hypothesis, ang kritikal na punto (Kanang bahagi) tumatagal ng mga positibong halaga.

Kung kaliwete ang nakikipagkumpitensyang hypothesis, hal. H 1: a< а 0 , kung gayon ang kritikal na rehiyon ay kaliwete(Figure 2). Sa ilalim ng isang kaliwang panig na nakikipagkumpitensyang hypothesis, ang kritikal na punto ay kumukuha ng mga negatibong halaga (K gilid kaliwang kamay).

Kung two-sided ang nakikipagkumpitensyang hypothesis, hal. H 1: a¹ a 0, kung gayon ang kritikal na rehiyon ay bilateral(Larawan 3). Sa pamamagitan ng dalawang panig na nakikipagkumpitensyang hypothesis, dalawang kritikal na punto ang natukoy (K gilid kaliwang kamay At Papunta sa cr. kanang kamay).


Katanggap-tanggap na hanay Kritikal

hanay ng mga halaga

Batay sa mga datos na nakolekta sa mga pag-aaral sa istatistika, pagkatapos ng pagproseso, ang mga konklusyon ay iginuhit tungkol sa mga phenomena na pinag-aaralan. Ang mga konklusyong ito ay ginawa sa pamamagitan ng pagbuo at pagsubok ng mga istatistikal na hypotheses.

Istatistikong hypothesis ay anumang pahayag tungkol sa uri o katangian ng distribusyon ng mga random na variable na naobserbahan sa isang eksperimento. Sinusuri ang mga statistic hypotheses paraang istatistikal.

Ang hypothesis na sinusubok ay tinatawag pangunahing (zero) at itinalaga N 0 . Bilang karagdagan sa zero one, umaabot din ito alternatibong (kumpetensyang) hypothesis H 1, pagtanggi sa pangunahing isa . Kaya, bilang resulta ng pagsubok, isa at isa lamang sa mga hypotheses ang tatanggapin , at ang pangalawa ay tatanggihan.

Mga uri ng pagkakamali. Ang hypothesis na iniharap ay nasubok batay sa isang pag-aaral ng isang sample na nakuha mula sa pangkalahatang populasyon. Dahil sa randomness ng sample, hindi palaging naaabot ng pagsubok ang tamang konklusyon. Maaaring lumitaw ang mga sumusunod na sitwasyon:
1. Tama ang pangunahing hypothesis at tinatanggap ito.
2. Ang pangunahing hypothesis ay tama, ngunit ito ay tinanggihan.
3. Ang pangunahing hypothesis ay hindi tama at ito ay tinanggihan.
4. Ang pangunahing hypothesis ay hindi totoo, ngunit ito ay tinatanggap.
Kaso 2 ang pag-uusapan natin type I error, sa huling kaso na pinag-uusapan natin error ng pangalawang uri.
Kaya, mula sa isang sample ito ay tinatanggap tamang solusyon, at ayon sa iba - hindi tama. Ang desisyon ay ginawa batay sa halaga ng ilang sampling function na tinatawag istatistikal na katangian, istatistikal na pamantayan o simple lang mga istatistika. Ang hanay ng mga halaga para sa istatistikang ito ay maaaring hatiin sa dalawang magkahiwalay na subset:

  • N 0 ay tinatanggap (hindi tinanggihan), tinatawag lugar ng pagtanggap ng hypothesis (tinatanggap na lugar);
  • subset ng mga halaga ng istatistika kung saan ang hypothesis N 0 ay tinanggihan (rejected) at ang hypothesis ay tinatanggap N 1, tinawag kritikal na lugar.

Mga konklusyon:

  1. pamantayan ay tinatawag na random variable K, na nagpapahintulot sa iyo na tanggapin o tanggihan ang null hypothesis H0.
  2. Kapag sinusuri ang mga hypotheses, dalawang uri ng mga pagkakamali ang maaaring gawin.
    Error sa unang uri ay ang hypothesis ay tatanggihan H 0 kung totoo ("nawawalang target"). Ang posibilidad ng paggawa ng isang uri ng error ay tinutukoy ng α at tinatawag antas ng kahalagahan. Kadalasan sa pagsasanay ay ipinapalagay na α = 0.05 o α = 0.01.
    Error ng pangalawang uri ay ang hypothesis na H0 ay tinatanggap kung ito ay mali (isang "false positive"). Ang posibilidad ng ganitong uri ng error ay tinutukoy ng β.

Pag-uuri ng mga hypotheses

Pangunahing hypothesis N 0 tungkol sa halaga ng hindi kilalang parameter q ng pamamahagi ay karaniwang ganito:
H 0: q = q 0.
Nagkumpitensyang hypothesis N 1 ay maaaring may sumusunod na anyo:
N 1: q < q 0 , N 1:q> q 0 o N 1: qq 0 .
Alinsunod dito lumalabas kaliwa, kanang kamay o bilateral kritikal na mga lugar. Mga hangganan ng mga kritikal na lugar ( kritikal na puntos) ay tinutukoy mula sa mga talahanayan ng pamamahagi ng mga kaukulang istatistika.

Kapag sinusubukan ang isang hypothesis, matalinong bawasan ang posibilidad na makagawa ng mga maling desisyon. Katanggap-tanggap na posibilidad ng type I error karaniwang itinalaga a at tinatawag antas ng kahalagahan. Karaniwang maliit ang halaga nito ( 0,1, 0,05, 0,01, 0,001 ...). Ngunit ang pagbaba sa posibilidad ng isang uri ng error ay humahantong sa isang pagtaas sa posibilidad ng isang pangalawang uri ng error ( b), ibig sabihin. ang pagnanais na tanggapin lamang ang mga tamang hypotheses ay nagdudulot ng pagtaas sa bilang ng mga tinanggihang tamang hypotheses. Samakatuwid, ang pagpili ng antas ng kahalagahan ay tinutukoy ng kahalagahan ng problemang ibinabanta at ang kalubhaan ng mga kahihinatnan ng isang maling desisyon.
Ang pagsubok sa isang istatistikal na hypothesis ay binubuo ng mga sumusunod na hakbang:
1) kahulugan ng mga hypotheses N 0 at N 1 ;
2) pagpili ng mga istatistika at pagtatakda ng antas ng kahalagahan;
3) pagpapasiya ng mga kritikal na puntos K cr at kritikal na lugar;
4) pagkalkula ng istatistikal na halaga batay sa sample K ex;
5) paghahambing ng halaga ng istatistika sa kritikal na rehiyon ( K cr At K ex);
6) paggawa ng desisyon: kung ang istatistikal na halaga ay wala sa kritikal na lugar, kung gayon ang hypothesis ay tinatanggap N 0 at ang hypothesis ay tinanggihan H 1, at kung ito ay pumasok sa kritikal na rehiyon, ang hypothesis ay tinanggihan N 0 at tinanggap ang hypothesis N 1 . Kasabay nito, ang mga resulta ng pagsubok sa isang istatistikal na hypothesis ay dapat bigyang-kahulugan bilang mga sumusunod: kung ang hypothesis ay tinanggap N 1 , pagkatapos ay maaari nating isaalang-alang ito na napatunayan, at kung tatanggapin natin ang hypothesis N 0 , pagkatapos ay nakilala nila na hindi ito sumasalungat sa mga resulta ng mga obserbasyon. Gayunpaman, ang ari-arian na ito, kasama ng N Ang ibang mga hypotheses ay maaari ding magkaroon ng 0.

Pag-uuri ng mga pagsubok sa hypothesis

Susunod na isaalang-alang natin ang ilang magkakaibang mga istatistikal na hypotheses at mekanismo para sa pagsubok sa kanila.
ako) Hypothesis tungkol sa pangkalahatang mean ng isang normal na distribusyon na may hindi kilalang pagkakaiba. Ipinapalagay namin na ang populasyon ay may normal na distribusyon, ang ibig sabihin at pagkakaiba nito ay hindi alam, ngunit may dahilan upang maniwala na ang pangkalahatang mean ay katumbas ng a. Sa antas ng kahalagahan α, kailangang masuri ang hypothesis N 0: x =a. Bilang kahalili, maaaring gamitin ang isa sa tatlong hypotheses na tinalakay sa itaas. Sa kasong ito, ang istatistika ay isang random na variable na mayroong distribusyon ng Mag-aaral na may n– 1 antas ng kalayaan. Tinutukoy ang katumbas na pang-eksperimentong (naobserbahan) na halaga t ex t cr N 1: x >a ito ay matatagpuan ayon sa antas ng kahalagahan α at ang bilang ng mga antas ng kalayaan n– 1. Kung t ex < t cr N 1: x ≠a ang kritikal na halaga ay matatagpuan sa antas ng kahalagahan α / 2 at sa parehong bilang ng mga antas ng kalayaan. Ang null hypothesis ay tinatanggap kung | t dating | II) Ang hypothesis tungkol sa pagkakapantay-pantay ng dalawang average na halaga ng mga random na ibinahagi na populasyon (malaking independiyenteng mga sample). Sa antas ng kahalagahan α, kailangang masuri ang hypothesis N 0: x ≠y . Kung malaki ang volume ng parehong sample, maaari nating ipagpalagay na ang ibig sabihin ng sample ay may normal na distribusyon at alam ang kanilang mga pagkakaiba. Sa kasong ito, maaaring gamitin ang isang random na variable bilang mga istatistika
,
pagkakaroon ng normal na distribusyon, at M(Z) = 0, D(Z) = 1. Natutukoy ang katumbas na pang-eksperimentong halaga z ex. Mula sa Laplace function table ang kritikal na halaga ay matatagpuan z cr. Sa ilalim ng alternatibong hypothesis N 1: x >y ito ay matatagpuan mula sa kundisyon F(z cr) = 0,5 – a. Kung z ex< z кр , pagkatapos ay ang null hypothesis ay tinatanggap, kung hindi, ito ay tinanggihan. Sa ilalim ng alternatibong hypothesis N 1: x ≠y ang kritikal na halaga ay matatagpuan mula sa kundisyon F(z cr) = 0.5×(1 – a). Ang null hypothesis ay tinatanggap kung | z dating |< z кр .

III) Hypothesis tungkol sa pagkakapantay-pantay ng dalawang average na halaga ng mga normal na ipinamamahagi na populasyon, ang mga pagkakaiba-iba kung saan ay hindi alam at magkapareho (maliit na independiyenteng mga sample). Sa antas ng kahalagahan α, kailangang masuri ang pangunahing hypothesis N 0: x =y . Gumagamit kami ng isang random na variable bilang mga istatistika
,
pagkakaroon ng pamamahagi ng Mag-aaral na may ( n x + n y– 2) antas ng kalayaan. Natutukoy ang katumbas na pang-eksperimentong halaga t ex. Mula sa talahanayan ng mga kritikal na punto ng distribusyon ng Mag-aaral, matatagpuan ang kritikal na halaga t cr. Ang lahat ay nalulutas katulad ng hypothesis (I).

IV) Hypothesis tungkol sa pagkakapantay-pantay ng dalawang variance ng mga normal na distributed na populasyon. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis N 0: D(X) = D(Y). Ang istatistika ay isang random na variable na mayroong Fisher–Snedecor distribution na may f 1 = n b– 1 at f 2 = n m– 1 degree ng kalayaan (S 2 b – malaking dispersion, dami ng sample nito n b). Tinutukoy ang katumbas na pang-eksperimentong (naobserbahan) na halaga F ex. Kritikal na halaga F cr sa ilalim ng alternatibong hypothesis N 1: D(X) > D(Y) ay matatagpuan mula sa talahanayan ng mga kritikal na punto ng pamamahagi ng Fisher–Snedecor ayon sa antas ng kahalagahan a at ang bilang ng mga antas ng kalayaan f 1 at f 2. Ang null hypothesis ay tinatanggap kung F ex < F cr.

Mga tagubilin. Upang kalkulahin, dapat mong tukuyin ang dimensyon ng source data.

V) Ang hypothesis tungkol sa pagkakapantay-pantay ng ilang pagkakaiba-iba ng mga normal na distributed na populasyon sa mga sample na may parehong laki. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis N 0: D(X 1) = D(X 2) = …= D(X l). Ang mga istatistika ay isang random na variable , pagkakaroon ng pamamahagi ng Cochran na may mga antas ng kalayaan f = n– 1 at l (n – dami ng bawat sample, l- bilang ng mga sample). Ang hypothesis na ito ay nasubok sa parehong paraan tulad ng nauna. Ang talahanayan ng mga kritikal na punto ng pamamahagi ng Cochran ay ginagamit.

VI) Hypothesis tungkol sa kahalagahan ng ugnayang ugnayan. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis N 0: r= 0. (Kung ang koepisyent ng ugnayan ay zero, kung gayon ang mga katumbas na dami ay hindi nauugnay sa isa't isa). Ang mga istatistika sa kasong ito ay isang random na variable
,
pagkakaroon ng Student distribution na may f = n– 2 antas ng kalayaan. Ang pagsubok ng hypothesis na ito ay isinasagawa katulad ng pagsubok ng hypothesis (I).

Mga tagubilin. Tukuyin ang dami ng input data.

VII) Isang hypothesis tungkol sa halaga ng posibilidad na mangyari ang isang kaganapan. Medyo malaking bilang ng n mga independiyenteng pagsubok kung saan ang kaganapan A nangyari m minsan. May dahilan upang maniwala na ang posibilidad ng isang naibigay na kaganapan na nagaganap sa isang pagsubok ay katumbas ng p 0. Kinakailangan sa antas ng kahalagahan a subukan ang hypothesis na ang posibilidad ng isang kaganapan A katumbas ng hypothetical probability p 0. (Dahil ang probabilidad ay tinasa sa pamamagitan ng relatibong dalas, ang hypothesis na sinusuri ay maaaring bumalangkas sa ibang paraan: kung ang naobserbahang kamag-anak na dalas at ang hypothetical na probabilidad ay malaki ang pagkakaiba o hindi).
Ang bilang ng mga pagsubok ay medyo malaki, kaya ang relatibong dalas ng kaganapan A ipinamahagi ayon sa normal na batas. Kung ang null hypothesis ay totoo, kung gayon ito inaasahang halaga katumbas p 0, at pagpapakalat. Alinsunod dito, pumili kami ng isang random na variable bilang mga istatistika
,
na ibinahagi nang humigit-kumulang ayon sa normal na batas na may zero mathematical expectation at unit variance. Ang hypothesis na ito ay nasubok sa eksaktong parehong paraan tulad ng sa kaso (I).

Mga tagubilin. Upang makalkula, dapat mong punan ang paunang data.

5. Ang mga pangunahing problema ng inilapat na istatistika - paglalarawan ng data, pagtatantya at pagsubok ng mga hypotheses

Mga pangunahing konsepto na ginamit sa pagsusuri ng hypothesis

Ang istatistikal na hypothesis ay anumang pagpapalagay tungkol sa hindi kilalang distribusyon ng mga random na variable (mga elemento). Narito ang mga pormulasyon ng ilang statistical hypotheses:

1. Ang mga resulta ng pagmamasid ay may normal na distribusyon na may zero na inaasahan sa matematika.
2. Ang mga resulta ng pagmamasid ay may function ng pamamahagi N(0,1).
3. Ang mga resulta ng pagmamasid ay may normal na distribusyon.
4. Ang mga resulta ng mga obserbasyon sa dalawang independiyenteng sample ay may parehong normal na distribusyon.
5. Ang mga resulta ng mga obserbasyon sa dalawang independyenteng mga sample ay may parehong distribusyon.

May mga null at alternatibong hypotheses. Ang null hypothesis ay ang hypothesis na susuriin. Ang alternatibong hypothesis ay ang bawat wastong hypothesis maliban sa null hypothesis. Ang null hypothesis ay tinutukoy ng H 0, alternatibo - H 1(mula sa Hypothesis - "hypothesis" (Ingles)).

Ang pagpili ng ilang null o alternatibong hypotheses ay tinutukoy ng mga inilapat na gawain na kinakaharap ng isang manager, ekonomista, engineer, o researcher. Tingnan natin ang mga halimbawa.

Halimbawa 11. Hayaang ang null hypothesis ay hypothesis 2 mula sa listahan sa itaas, at ang alternatibong hypothesis 1. Nangangahulugan ito na ang totoong sitwasyon ay inilalarawan ng isang probabilistikong modelo, ayon sa kung saan ang mga resulta ng obserbasyon ay itinuturing bilang mga pagsasakatuparan ng mga independiyenteng magkaparehong distributed na random variable na may distribusyon. function N(0,σ), kung saan ang parameter na σ ay hindi alam ng statistician. Sa loob ng modelong ito, ang null hypothesis ay nakasulat bilang mga sumusunod:

N 0: σ = 1,

at isang alternatibo tulad nito:

N 1: σ ≠ 1.

Halimbawa 12. Hayaang ang null hypothesis ay hypothesis 2 pa rin mula sa listahan sa itaas, at ang alternatibong hypothesis ay hypothesis 3 mula sa parehong listahan. Pagkatapos, sa isang probabilistikong modelo ng isang sitwasyon sa pamamahala, pang-ekonomiya o produksyon, ipinapalagay na ang mga resulta ng pagmamasid ay bumubuo ng isang sample mula sa isang normal na distribusyon. N(m, σ) para sa ilang mga halaga m at σ. Ang mga hypotheses ay nakasulat tulad nito:

N 0: m= 0, σ = 1

(ang parehong mga parameter ay kumukuha ng mga nakapirming halaga);

N 1: m≠ 0 at/o σ ≠ 1

(i.e. alinman m≠ 0, o σ ≠ 1, o m≠ 0, at σ ≠ 1).

Halimbawa 13. Hayaan N 0 – hypothesis 1 mula sa listahan sa itaas, at N 1 – hypothesis 3 mula sa parehong listahan. Kung gayon ang probabilistikong modelo ay pareho sa halimbawa 12,

N 0: m= 0, σ ay arbitrary;

N 1: m≠ 0, σ ay arbitrary.

Halimbawa 14. Hayaan N 0 – hypothesis 2 mula sa listahan sa itaas, at ayon sa N 1 resulta ng pagmamasid ay may function ng pamamahagi F(x), hindi coinciding sa karaniwang normal distribution function F(x). Pagkatapos

N 0: F(x) = Ф(x) sa harap ng lahat X(isinulat bilang F(x) ≡ Ф(x));

N 1: F(x 0) ≠ Ф(x 0) sa ilang mga x 0(i.e. hindi totoo yan F(x) ≡ Ф(x)).

Tandaan. Narito ang ≡ ay ang tanda ng magkatulad na pagkakataon ng mga pag-andar (i.e. coincidence para sa lahat ng posibleng halaga ng argumento X).

Halimbawa 15. Hayaan N 0 – hypothesis 3 mula sa listahan sa itaas, at ayon sa N 1 resulta ng pagmamasid ay may function ng pamamahagi F(x), hindi pagiging normal. Pagkatapos

Para sa ilang m, σ;

N 1: para sa alinman m, σ ay matatagpuan x 0 = x 0(m, σ) tulad na .

Halimbawa 16. Hayaan N 0 – hypothesis 4 mula sa listahan sa itaas, ayon sa probability model, dalawang sample ang kinukuha mula sa mga populasyon na may mga function ng pamamahagi F(x) At G(x), pagiging normal sa mga parameter m 1 , σ 1 at m 2 , σ 2 ayon sa pagkakabanggit, at N 1 – pagtanggi N 0 . Pagkatapos

N 0: m 1 = m 2, σ 1 = σ 2, at m 1 at σ 1 ay arbitrary;

N 1: m 1 ≠ m 2 at/o σ 1 ≠ σ 2 .

Halimbawa 17. Ipaalam din sa amin sa ilalim ng mga kondisyon ng Halimbawa 16 na σ 1 = σ 2 . Pagkatapos

N 0: m 1 = m 2 , σ > 0, at m 1 at σ ay arbitrary;

N 1: m 1 ≠ m 2, σ > 0.

Halimbawa 18. Hayaan N 0 – hypothesis 5 mula sa listahan sa itaas, ayon sa probability model, dalawang sample ang kinukuha mula sa mga populasyon na may mga function ng pamamahagi F(x) At G(x) ayon dito, at N 1 – pagtanggi N 0 . Pagkatapos

N 0: F(x) G(x) , Saan F(x)

N 1: F(x) At G(x) - arbitrary na mga function ng pamamahagi, at

F(x) G(x) kasama ang ilan X.

Halimbawa 19. Hayaan, sa ilalim ng mga kondisyon ng Halimbawa 17, ipagpalagay din na gumagana ang pamamahagi F(x) At G(x) naiiba lamang sa shift, i.e. G(x) = F(x- A) sa ilang mga A. Pagkatapos

N 0: F(x) G(x) ,

saan F(x) – di-makatwirang pagpapaandar ng pamamahagi;

N 1: G(x) = F(x- a), isang ≠ 0,

saan F(x) – di-makatwirang pagpapaandar ng pamamahagi.

Halimbawa 20. Ipaalam din sa amin sa ilalim ng mga kondisyon ng Halimbawa 14 na, ayon sa probabilistikong modelo ng sitwasyon F(x) - normal na distribution function na may unit variance, i.e. parang N(m, 1). Pagkatapos

N 0: m = 0 (mga. F(x) = Ф(x)

sa harap ng lahat X);(isinulat bilang F(x) ≡ Ф(x));

N 1: m 0

(i.e. hindi totoo yan F(x) ≡ Ф(x)).

Halimbawa 21. Kapag kinokontrol ayon sa istatistika ang teknolohikal, pang-ekonomiya, pamamahala o iba pang mga proseso, isang sample na kinuha mula sa isang populasyon na may normal na pamamahagi at kilalang pagkakaiba, at hypothesis

N 0: m = m 0 ,

N 1: m= m 1 ,

nasaan ang halaga ng parameter m = m 0 tumutugma sa itinatag na kurso ng proseso, at ang paglipat sa m= m 1 nagpapahiwatig ng karamdaman.

Halimbawa 22. Sa statistical acceptance control, ang bilang ng mga may sira na unit ng produkto sa sample ay napapailalim sa isang hypergeometric distribution; ang hindi alam na parameter ay p = D/ N– antas ng mga depekto, kung saan N– dami ng batch ng produkto, D– ang kabuuang bilang ng mga may sira na unit ng produkto sa batch. Ang mga control plan na ginagamit sa regulasyon, teknikal at komersyal na dokumentasyon (mga pamantayan, mga kontrata ng supply, atbp.) ay kadalasang naglalayong subukan ang isang hypothesis

N 0: p < AQL

N 1: p > L.Q.,

saan AQL - antas ng pagtanggap ng mga depekto, L.Q. – antas ng pagtanggi ng mga depekto (malinaw naman AQL < L.Q.).

Halimbawa 23. Bilang mga tagapagpahiwatig ng katatagan ng isang teknolohikal, pang-ekonomiya, pamamahala o iba pang proseso, ang isang bilang ng mga katangian ng mga pamamahagi ng mga kinokontrol na tagapagpahiwatig ay ginagamit, sa partikular, ang koepisyent ng pagkakaiba-iba. v = σ/ M(X). Kailangan nating subukan ang null hypothesis

N 0: v < v 0

sa ilalim ng alternatibong hypothesis

N 1: v > v 0 ,

saan v 0 – ilang paunang natukoy na halaga ng hangganan.

Halimbawa 24. Hayaang ang probabilistikong modelo ng dalawang sample ay pareho sa halimbawa 18, tinutukoy namin ang mga inaasahan sa matematika ng mga resulta ng obserbasyon sa una at pangalawang sample M(X) At M(U) ayon sa pagkakabanggit. Sa ilang mga sitwasyon, ang null hypothesis ay nasubok

N 0: M(X) = M(Y)

laban sa alternatibong hypothesis

N 1: M(X) ≠ M(Y).

Halimbawa 25. Ito ay nabanggit sa itaas pinakamahalaga V mga istatistika ng matematika mga function ng pamamahagi simetriko tungkol sa 0, Kapag sinusuri ang mahusay na proporsyon

N 0: F(- x) = 1 – F(x) sa harap ng lahat x, kung hindi F arbitraryo;

N 1: F(- x 0 ) ≠ 1 – F(x 0 ) sa ilang mga x 0 , kung hindi F arbitraryo.

Sa probabilistic-statistical na pamamaraan ng paggawa ng desisyon, maraming iba pang mga pormulasyon ng mga problema para sa pagsubok ng mga istatistikal na hypotheses ang ginagamit. Ang ilan sa mga ito ay tinalakay sa ibaba.

Ang tiyak na gawain ng istatistikal na pagsusuri ng hypothesis ay ganap na inilarawan kapag ang mga null at alternatibong hypotheses ay ibinigay. Ang pagpili ng paraan para sa pagsubok ng istatistikal na hypothesis, ang mga katangian at katangian ng mga pamamaraan ay tinutukoy ng parehong null at alternatibong hypothesis. Upang subukan ang parehong null hypothesis sa ilalim ng iba't ibang alternatibong hypothesis, sa pangkalahatan, iba't ibang mga pamamaraan ang dapat gamitin. Kaya, sa mga halimbawa 14 at 20, ang null hypothesis ay pareho, ngunit ang mga alternatibo ay iba. Samakatuwid, sa mga kondisyon ng halimbawa 14, ang mga pamamaraan batay sa pamantayan ng kasunduan sa isang parametric na pamilya (uri ng Kolmogorov o uri ng omega-square) ay dapat gamitin, at sa mga kondisyon ng halimbawa 20, mga pamamaraan batay sa pamantayan ng Estudyante o ang Cramer- Welch criterion. Kung sa mga kondisyon ng halimbawa 14 ginagamit natin ang pamantayan ng Estudyante, hindi nito malulutas ang mga problema. Kung, sa ilalim ng mga kundisyon ng halimbawa 20, gumamit kami ng Kolmogorov-type goodness-of-fit criterion, kung gayon, sa kabaligtaran, malulutas nito ang mga problemang ibinabanta, bagaman marahil ay mas masahol pa kaysa sa t-test ng Estudyante, na espesyal na inangkop para sa kasong ito. .

Kapag nagpoproseso ng totoong data, ang tamang pagpili ng mga hypotheses ay napakahalaga. N 0 at N 1 . Ang mga pagpapalagay na ginawa, halimbawa, ang normalidad ng pamamahagi, ay dapat na maingat na bigyang-katwiran, sa partikular, sa pamamagitan ng mga pamamaraang istatistika. Tandaan na sa karamihan ng mga partikular na inilapat na setting, ang distribusyon ng mga resulta ng pagmamasid ay iba sa normal.

Ang isang sitwasyon ay madalas na lumitaw kapag ang uri ng null hypothesis ay sumusunod mula sa pagbabalangkas ng inilapat na problema, ngunit ang uri ng alternatibong hypothesis ay hindi malinaw. Sa ganitong mga kaso, ang alternatibong hypothesis ay dapat isaalang-alang ang karamihan pangkalahatang pananaw at gumamit ng mga pamamaraan na lutasin ang problema sa ilalim ng lahat ng posible N 1 . Sa partikular, kapag sinusubukan ang hypothesis 2 (mula sa listahan sa itaas) bilang null, dapat mong gamitin N 1 mula sa halimbawa 14, at hindi mula sa halimbawa 20, maliban kung mayroong espesyal na katwiran para sa normalidad ng distribusyon ng mga resulta ng pagmamasid sa ilalim ng alternatibong hypothesis.

Nakaraang

Ang sample na data na nakuha sa pananaliksik ay palaging limitado at higit sa lahat ay random. Iyon ang dahilan kung bakit ginagamit ang mga istatistika ng matematika upang pag-aralan ang naturang data, na ginagawang posible na gawing pangkalahatan ang mga pattern na nakuha mula sa sample at i-extend ang mga ito sa buong populasyon.

Muli nating bigyang-diin na ang data na nakuha bilang resulta ng isang eksperimento sa anumang sample ay nagsisilbing batayan para sa paggawa ng mga paghatol tungkol sa pangkalahatang populasyon. Gayunpaman, dahil sa mga random na probabilistic na dahilan, ang pagtatantya ng mga parameter ng isang populasyon na ginawa batay sa pang-eksperimentong (sample) na data ay palaging may kasamang error, at samakatuwid ang mga naturang pagtatantya ay dapat ituring bilang haka-haka, at hindi bilang mga tiyak na pahayag.

Gaya ng itinuturo ni G.V. Sukhodolsky: "Ang isang istatistikal na hypothesis ay karaniwang nauunawaan bilang isang pormal na pagpapalagay na ang pagkakapareho (o pagkakaiba) ng ilang mga parametric o functional na katangian ay random o, sa kabaligtaran, hindi random." Katulad Ang mga pagpapalagay tungkol sa mga katangian at parameter ng pangkalahatang populasyon, mga pagkakaiba sa mga sample, o mga dependency sa pagitan ng mga katangian ay tinatawag na statistical hypotheses.

Ang kakanyahan ng pagsubok sa isang istatistikal na hypothesis ay upang matukoy kung ang pang-eksperimentong data at ang hypothesis na iniharap ay pare-pareho; pinahihintulutan bang iugnay ang pagkakaiba sa pagitan ng hypothesis at ang resulta ng istatistikal na pagsusuri ng pang-eksperimentong data sa mga random na dahilan? Kaya, ang istatistikal na hypothesis ay isang siyentipikong hypothesis na nagpapahintulot sa istatistikal na pagsubok, at ang matematikal na istatistika ay isang siyentipikong disiplina na ang gawain ay ang siyentipikong batay sa pagsubok ng mga istatistikal na hypotheses.

Kapag sinusuri ang mga istatistikal na hypotheses, dalawang konsepto ang ginagamit: ang tinatawag na null (designation H 0) at alternatibong hypothesis (simbolo H 1).

Kapag naghahambing ng mga pamamahagi, karaniwang tinatanggap iyon null hypothesis Ang H 0 ay isang hypothesis tungkol sa pagkakatulad, at alternatibo H 1 - pagkakaiba ng hypothesis. Kaya, ang pagtanggap sa null hypothesis H 0 ay nagpapahiwatig ng kawalan ng mga pagkakaiba, at ang pagtanggap sa null hypothesis H 1 ay nagpapahiwatig ng pagkakaroon ng mga pagkakaiba.

Halimbawa, dalawang sample ang kinukuha mula sa normal na distributed na populasyon at tayo ay nahaharap sa gawain ng paghahambing ng mga sample na ito. Ang isang sample ay may mga parameter at σ 1 , at ang iba pang mga parameter at σ 2. Null hypothesis H 0 nanggagaling sa pagpapalagay na = uσ 1 = σ 2, iyon ay, ang pagkakaiba sa pagitan ng dalawang average =0 at ang pagkakaiba ng dalawang standard deviations σ 1 σ 2 ,=0 (kaya ang pangalan ng hypothesis - null).

Pagtanggap ng alternatibong hypothesis H 1 ay nagpapahiwatig ng pagkakaroon ng mga pagkakaiba at nagpapatuloy mula sa pagpapalagay na ≠0 at σ 1 σ 2 ,≠0.


Kadalasan ang alternatibong hypothesis ay tinatawag pang-eksperimentong hypothesis, kung ang pag-aaral ay naglalayong patunayan ang pagkakaroon ng mga pagkakaiba sa pagitan ng mga sample. Kung nais patunayan ng mananaliksik na tiyak ang kawalan ng mga pagkakaiba, kung gayon ang pang-eksperimentong hypothesis ay ang null hypothesis.

Kapag naghahambing ng mga sample, ang mga alternatibong istatistikal na hypotheses ay maaaring itinuro o hindi itinuro.

Kung napansin namin na sa isang sample ang mga indibidwal na halaga ng mga paksa para sa ilang mga katangian ay mas mataas, at sa isa pa - mas mababa, pagkatapos ay upang suriin ang mga pagkakaiba sa pagitan ng mga sample na aming binabalangkas direksyong hypothesis . Kung gusto nating patunayan na ang mas malinaw na mga pagbabago ay naganap sa isang grupo sa ilalim ng impluwensya ng ilang mga pang-eksperimentong impluwensya, kinakailangan ding bumalangkas ng isang direksyong hypothesis. Pormal itong nakasulat sa ganito H 1: Lumampas ang x 1 sa x 2. Ang null hypothesis ay ganito ang hitsura: H 0: x 1 ay hindi lalampas sa x 2.

Kung gusto nating patunayan na ang mga paraan ng pamamahagi ay naiiba, pagkatapos ay bumalangkas tayo non-directional hypotheses . Pormal na nakasulat ang mga ito nang ganito H 1: Iba ang x 1 sa x 2. Null hypothesis H 0: Ang x 1 ay hindi naiiba sa x 2.

Sa pangkalahatan, kapag tinatanggap o tinatanggihan ang mga hypotheses, iba't ibang mga opsyon ang posible.

Kapag sinusubukan ang isang hypothesis, ang pang-eksperimentong data ay maaaring sumalungat sa hypothesis H 0, pagkatapos ay tinanggihan ang hypothesis na ito. Kung hindi, i.e. kung ang pang-eksperimentong data ay pare-pareho sa hypothesis H 0, hindi ito tinatanggihan. Kadalasan sa ganitong mga kaso sinasabi nila na ang hypothesis H 0 ay tinatanggap (bagaman ang pagbabalangkas na ito ay hindi ganap na tumpak, ngunit ito ay laganap). Ipinapakita nito na ang istatistikal na pagsubok ng mga hypotheses batay sa eksperimental, sample na data ay hindi maiiwasang nauugnay sa panganib (probability) ng paggawa ng maling desisyon. Sa kasong ito, posible ang mga error ng dalawang uri. Error sa unang uri ay magaganap kapag ang isang desisyon ay ginawa upang tanggihan ang hypothesis H 0, bagaman sa katotohanan ito ay lumalabas na totoo. Error ng pangalawang uri ay magaganap kapag ang isang desisyon ay ginawa na huwag tanggihan ang hypothesis H 0, bagaman sa katotohanan ito ay magiging mali. Malinaw na ang tamang mga konklusyon ay maaari ding gamitin sa dalawang kaso. Ang nasa itaas ay maaaring ipakita sa anyo ng talahanayan 25.

Bilang resulta ng pag-aaral ng kabanatang ito, ang mag-aaral ay dapat:

alam

  • ano ang istatistikal na hypothesis;
  • ang ugnayan sa pagitan ng teoretikal, eksperimental at istatistikal na hypotheses;
  • pagkakaiba sa pagitan ng null at alternatibong hypotheses;
  • ang lohika ng pagsusuri, pagtanggap at pagtanggi sa mga istatistikal na hypotheses;
  • mga konsepto ng pagkakamali ng una at pangalawang uri, istatistikal na kahalagahan (kaasahan);
  • mga pagkakaiba sa pagitan ng parametric at nonparametric na istatistika, kakayahan at limitasyon ng dalawang uri ng istatistikal na pagsusulit;

magagawang

  • subukan ang mga simpleng hypotheses tungkol sa mean gamit t -T-test ng mag-aaral para sa mga nakapares (konektado) at hindi nakapares (independyente) na mga sample;
  • suriin ang dalawang sample para sa homogeneity gamit t -Pagsusulit ng mag-aaral at F -Fisher test;
  • magtayo mga agwat ng kumpiyansa para sa tinantyang mga parameter;

sariling

  • methodological apparatus at mga pangunahing kasanayan sa paglalagay at pagsubok ng mga istatistikal na hypotheses;
  • mga kasanayan sa pagtatasa ng mga istatistikal na hypotheses at pagbuo ng mga pagitan ng kumpiyansa.

Pangkalahatang diskarte

Alam mo na na sa pagsusuri ng istatistika ay karaniwan na makilala sa pagitan ng mga konsepto ng "parameter" at "mga istatistika". Ang mga pagkakaibang ito ay tinalakay nang detalyado sa Chap. 1; sa mesa 2.1 nagbubuod ng talakayan.

Tandaan natin na ang anumang pamamahagi ay maaaring mailalarawan ng ilang mga teoretikal na parameter. Ang inaasahan, dispersion, skewness, kurtosis ay mga halimbawa ng naturang mga parameter ng pamamahagi ng isang random na variable sa isang populasyon. Lahat ng mga ito, pansinin nating muli ang mahalagang katotohanang ito, ay mga teoretikal na dami na halos hindi alam sa pagsasanay. Sa mga praktikal na aktibidad ng isang mananaliksik, maaari lamang silang masuri na may iba't ibang antas ng katumpakan sa pamamagitan ng pagkalkula ng iba't ibang mga istatistikal na halaga, na hindi palaging katumbas ng mga teoretikal na halaga ng mga parameter, pati na rin sa bawat isa, tulad ng mayroon na tayo. makikita sa talata 1.4, isinasaalang-alang praktikal na mga halimbawa pagtatasa ng iba't ibang mga parameter ng pamamahagi ng naturang mga katangian ng pagkatao bilang pagkababae - pagkalalaki.

Talahanayan 2.1

Relasyon sa pagitan ng mga parameter at istatistika

At ito ay hindi nakakagulat: pagkatapos ng lahat, ang mga istatistika ay sumasalamin sa pag-uugali ng mga random na variable lamang sa isang sample na nabuo ng eksperimento, at hindi sa pangkalahatang populasyon mismo. Samakatuwid, maaaring may tanong ang eksperimento tungkol sa kung paano nauugnay ang mga kalkuladong istatistika sa mga teoretikal na parameter ng pamamahagi. Sa madaling salita, maaaring interesado ang eksperimento sa kung ang sample na data sa kanyang pagtatapon ay talagang nakuha mula sa isang populasyon na nailalarawan ng mga parameter ng pamamahagi na ipinapalagay sa teorya. Upang masagot ang tanong na ito, ang eksperimento ay gumagawa at sumusubok ng mga istatistikal na hypotheses.

Mga statistic hypotheses tumawag ng mga pagpapalagay tungkol sa mga posibleng halaga ng mga parameter ng pamamahagi ng isang random na variable sa populasyon. Ang pagsubok at pagsusuri ng mga istatistikal na hypotheses ay isinasagawa bilang resulta ng pagkolekta at pagbuo ng mga istatistika. Ang kasangkapan sa gawaing ito ay mga pagsusulit sa istatistika, o pamantayan, bawat isa ay kumakatawan sa isang tiyak na hanay ng mga pamantayang tuntunin. Batay sa mga panuntunang ito, ang isang desisyon ay ginawa tungkol sa katotohanan o kamalian ng isang istatistikal na hypothesis.

Tingnan natin muli ang halimbawa ng coin toss. Maaari naming ipagpalagay na ang posibilidad na makakuha ng mga ulo kapag naghagis ng isang normal, hindi peke at hindi nasirang barya ay 50%. Nangangahulugan ito na ang pag-asa sa matematika ng naturang kaganapan kapag naghagis ng barya ng 100 beses ay magiging katumbas ng 50. Ang pagsubok sa hypothesis na ito ay binubuo ng pagsasagawa ng katulad na pagsubok, na tinatantya ang parameter ng interes sa amin bilang resulta nito sa pamamagitan ng pagkalkula ng naaangkop na mga istatistika , at gamit ang mga istatistikang ito upang suriin ang pagiging maaasahan na iniharap sa hypothesis. Halimbawa, pagkatapos ng pagsubok sa isang coin ng 100 beses, maaari naming i-verify na ang bawat panig ay aktwal na lumabas ng 50 beses. Gayunpaman, malamang na ang resulta ng naturang pagsusulit ay mag-iiba pa rin ng kaunti sa inaasahan sa teorya. Sa madaling salita, kahit na ang mga ulo ay lumitaw nang kaunti o higit pa sa 50 beses, malamang na hindi tayo magkaroon ng dahilan upang maniwala na ang barya ay peke. Ang sitwasyon ay magiging kahina-hinala kapag ang naturang paglihis mula sa theoretically assumed values ​​ay umabot sa mas malaking halaga, halimbawa, kapag ang "heads" ay hindi nahuhulog kahit isang beses pagkatapos ng 100 trials ng coin. Ang sitwasyong ito ay tila hindi malamang, sa kondisyon na ang lahat ay maayos sa barya.

Kaya, ito ay malinaw na kung sa kurso ng paghahagis ng isang barya ng 100 beses, ang "mga ulo" ay lalabas nang eksaktong 50 beses, walang mali sa barya. Kung ang "mga ulo" ay hindi kailanman lumalabas, may dahilan upang ipagpalagay na may mali sa barya. Ngunit nasaan ang linya na naghihiwalay sa mga positibo at negatibong konklusyon? Ang tanong na ito ay may kinalaman sa kriterya ng desisyon na pinipili. Tiyak na ang mga pamantayang ito ay ang mga istatistikal na pagsusulit na binuo sa mga istatistika ng matematika upang subukan ang mga istatistikal na hypotheses, na kung saan ay madalas na tinatawag na pamantayang istatistika.

Kaya, ang pagsubok ng mga istatistikal na hypotheses ay isinasagawa bilang isang resulta ng pagtatasa ng posibilidad ng isang random na kaganapan, na itinuturing na isang istatistikal na halaga. Kung ang posibilidad na ito ay lumabas na napakaliit, sa kondisyon na ang hypothesis na iniharap ay totoo, ang istatistikal na hypothesis na sinusuri ay tinanggihan, kung hindi, ang hypothesis ay tinatanggap.

Ang kahirapan ng pamamaraang ito, gayunpaman, ay maaaring nakasalalay sa katotohanan na maaaring hindi natin alam nang maaga ang tiyak na halaga ng parameter ng pamamahagi ng random na variable na sinusuri. Halimbawa, sa kaso ng isang barya, maaari nating ipagpalagay na ang barya ay peke, at, samakatuwid, ang posibilidad na makakuha ng mga ulo ay higit pa o mas mababa sa 50%. Sa kasong ito, pagkatapos magsagawa ng isang serye ng mga pagsubok, hindi namin magagawang masuri ang antas kung saan ang nakuha na mga istatistika, na nagpapakilala sa halaga ng inaasahan sa matematika ng nasuri na kaganapan, ay naiiba sa aktwal na halaga nito. At pagkatapos ay ang pagsubok sa isang istatistikal na hypothesis ay maaaring mukhang imposible. Ang paraan sa labas ng sitwasyong ito, gayunpaman, ay maaaring tantiyahin ang posibilidad ng hypothesis na kabaligtaran sa isa na iniharap. Sa madaling salita, sa kasong ito posible, halimbawa, na maglagay ng hypothesis tungkol sa pagkakapantay-pantay ng teoretikal na posibilidad na 50%. Kung ang hypothesis na ito ay lumabas na hindi tama, ang alternatibong hypothesis ay tinatanggap.

Sa katunayan, kapag sinusuri ang mga istatistikal na hypotheses, ang mananaliksik ay palaging tumatalakay sa hindi isa, ngunit dalawang hypotheses, na tinutukoy bilang N 0 at N 1. Ang isa sa mga hypotheses na ito ay tinatawag na null, ang isa ay tinatawag na alternatibo, i.e. pinabulaanan ang zero.

Null hypothesis H 0 ay palaging tiyak. Palagi nitong iginigiit ang ilang partikular na halaga ng parameter ng pamamahagi. Halimbawa, ang isang hypothesis tungkol sa mathematical expectation ay maaaring buuin tulad ng sumusunod: μ = A, saan A ay isang tiyak na tiyak na halaga ng μ, at ang hypothesis tungkol sa pagkakapantay-pantay ng dalawang magnitude ng dispersion ay σ1 = σ2.

Alternatibong hypothesis H 1 ay palaging nakabalangkas nang hindi gaanong partikular, halimbawa: μ > A ; * σ2, atbp. Ngunit, bilang isang panuntunan, lumalabas na ang eksperimento ay hindi interesado sa isang tiyak na null hypothesis N 0, ngunit isang hindi gaanong tiyak na alternatibong hypothesis N 1, dahil tiyak na ito ang mas naaayon sa siyentipikong hypothesis na sinusubok niya sa eksperimento.

Nagsasagawa ng isang empirical na pagtatasa ng isang teoretikal na parameter, tinutukoy ng eksperimento ang istatistikal na kahalagahan ng resulta na nakuha, na ginagawang batayan ang pagpapalagay ng katotohanan N 0. Ang kahalagahan ng istatistika ay ang posibilidad na sa isang walang katapusang bilang ng mga eksperimento na ganap na nagpaparami ng mga kondisyon ng eksperimento, makakakuha tayo ng pareho o mas malaking halaga ng mga itinayong istatistika. Kung ang posibilidad na makuha ito at kahit na higit pang mga istatistikal na halaga sa isang walang katapusang bilang ng mga eksperimento na may parehong mga kundisyon, na ibinigay na ang null hypothesis ay totoo, ay lumabas na maliit, ang eksperimento ay abandunahin ang null hypothesis pabor sa kahalili.

Ang malinaw na inilarawan na lohika ay ipinapakita sa Fig. 2.1. Tulad ng malinaw, dalawang alternatibong hypotheses ang inilalagay dito. Ang isa sa mga ito ay tiyak at ipinapalagay na ang inaasahan sa matematika ay katumbas ng zero. Ang hypothesis na ito ay itinalaga bilang N 0. Inilalarawan ng kaukulang kurba ang distribusyon ng random variable Z na hinulaang ng hypothesis na ito. Ang pangalawang hypothesis, na tinukoy bilang N 1, hindi gaanong tiyak. Sinasabi lamang nito na ang halaga ng inaasahan sa matematika ay dapat lumampas sa zero. Sa prinsipyo, mayroong isang walang katapusang bilang ng mga kurba na naglalarawan ng mga distribusyon na naaayon sa hypothesis na ito. Ang ibinigay na curve ay kumakatawan sa isa sa mga posible. Magnitude Ζ Inilarawan ng exp ang halaga ng mga istatistika na sinusuri ang teoretikal na parameter μ sa isang eksperimento. Ito ang mayroon ang eksperimento sa kanyang pagtatapon, kung ano ang kanyang nakuha sa pamamagitan ng pagkolekta ng empirical data. Halimbawa, maaaring ito ang arithmetic mean ng sample. Kung gayon ang pagsubok ng mga iniharap na istatistikal na hypothesis ay dapat na binubuo ng pagsubok na tantyahin kung gaano kalamang sa isa pang katulad na eksperimento upang makuha ang parehong halaga ng Zexp o mas malaki pa, sa kondisyon na ang null hypothesis ay totoo. Malinaw, ang posibilidad na ito ay katumbas ng lugar sa ilalim ng curve ng pamamahagi na ipinapalagay ng hypothesis na ito. Ang lugar na ito sa kaliwa ay limitado ng mga kalkuladong istatistika, sa kanan ay hindi ito limitado. Ang nasabing lugar, gaya ng naaalala natin (tingnan ang talata 1.2), ay tinatawag na quantile ng pamamahagi. Maaari itong tukuyin tulad ng sumusunod:

kanin. 2.1.

Ang dami ng halaga na kinakailangan upang tanggapin o tanggihan ang isang hypothesis R sa equation na ito ay kumakatawan sa tinatawag na lebel ng kahalagahan mga kalkuladong istatistika Zexp. Kung mas malaki ang halagang ito, mas malamang na ang data na nakuha sa eksperimento ay inilalarawan ng pamamahagi f Ho( Z ), ibig sabihin. distribusyon na hinulaan ng hypothesis N 0. Kabaligtaran ng mas kaunting halaga R, mas maliit ang posibilidad na ang empirikal na data ay aktuwal na akma sa pamamahagi f H0(Z), at mas malamang na inilalarawan sila ng isang distribusyon na ipinapalagay ang mas mataas na halaga ng μ. Kaya, tinatantya ang halaga R, ang isa ay maaaring magpasya na pabor sa isa sa dalawang hypotheses na iniharap.

Hypothesis N 0 ay maaaring tanggapin kung ang halaga ng quantile na tumutukoy sa statistical significance ng empirical value X, medyo malaki pala. Alternatibong hypothesis N 1 ay tinatanggap kung ang halaga ng quantile, na tumutukoy sa istatistikal na kahalagahan ng resulta na nakuha sa eksperimento, ay lumalabas na hindi gaanong maliit. Ang problema, gayunpaman, ay kung aling quantile value, na tumutukoy sa statistical significance, ay itinuturing na sapat na malaki, at kung saan ay hindi gaanong maliit. Upang malutas ang problemang ito, isaalang-alang natin nang mas detalyado kung anong mga pagkakataon ang mayroon ang isang eksperimento kapag sinusuri ang mga istatistikal na hypotheses (Talahanayan 2.2).

Malinaw na ang mga istatistikal na hypotheses na iniharap ay maaaring tama o mali. Dahil hypotheses N 0 at N 1 ay alternatibo, i.e. ibinubukod nila ang isa't isa, mayroon lamang dalawang hypothetical na kaso na nagpapakilala sa katotohanan o kamalian ng mga hypotheses na isinasaalang-alang: alinman N 0 ay magiging tama, at N 1 ay katumbas na mali, o vice versa. Dahil hindi alam ng eksperimento na sinusuri ang mga hypothesis kung aling hypothesis ang totoo, ang desisyon ay tanggapin o tanggihan ang hypothesis N 0 ay walang kinalaman sa katotohanan o kasinungalingan nito - pagkatapos ng lahat, iyon ang sinusubukan niyang itatag. Kaya, kapag sinusubok ang mga istatistikal na hypotheses, apat na resulta ang posible, kung saan dalawa lamang ang maaaring ituring na paborable para sa eksperimento, anuman ang hypothesis na gustong patunayan ng mananaliksik.

Talahanayan 2.2

Outcome matrix sa pagsusuri ng statistical hypotheses

Kung ang hypothesis N 0 ay tama at ito ay tinatanggap bilang resulta ng statistical analysis, ang experimenter ay hindi nagkakamali. At ito ay isang kanais-nais na resulta para sa mananaliksik, kahit na gusto niyang tanggapin ang alternatibong hypothesis. Gayundin, hindi nagkakamali ang eksperimento kapag tinanggihan niya ang isang hypothesis N 0, na talagang hindi tama. Gayunpaman, maaaring mangyari na ang null hypothesis ay talagang totoo, ngunit tinatanggihan pa rin ito ng eksperimento. Sa kasong ito, nagkakamali siya, na karaniwang tinatawag pagkakamali ng unang uri o α( alpha )-pagkakamali. Ang pangalawang uri ng pagkakamali, o β( beta )- pagkakamali, ay isang kinalabasan kung saan tinatanggap ng eksperimento ang isang null hypothesis na talagang lumalabas na mali.

Malinaw na mas malaki ang probabilidad na tumutukoy sa istatistikal na kahalagahan ng resulta na nakuha sa eksperimento, kung saan ang eksperimento ay handa na iwanan ang null hypothesis pabor sa alternatibo, mas malaki ang posibilidad ng isang error ng unang uri at mas mababa ang posibilidad ng isang error ng pangalawang uri (Larawan 2.2). Sa kabaligtaran, sa pamamagitan ng pagbabawas ng halaga ng probabilidad kung saan tinatanggihan ng eksperimento ang null hypothesis, sa gayon ay nanganganib siyang makagawa ng Type II na error na may mas malaking posibilidad, ngunit sa gayon ay pinoprotektahan ang kanyang sarili sa mas malaking lawak mula sa isang Type I error. Kaya, ang tanong sa kung anong antas ng kahalagahan ang hypothesis N 0 ay maaaring tanggihan o tanggapin, ay aktwal na konektado sa kung alin sa dalawang posibleng mga error ang hindi gaanong mahalaga para sa eksperimento. Sa pamamagitan ng paggamit ng mas konserbatibong diskarte para sa pagsubok ng istatistikal na hypothesis, napapabayaan ng eksperimento ang panganib ng isang uri ng error sa II. Sa pamamagitan ng paggamit ng mas radikal na bersyon ng aksyon, tila nakakalimutan ng eksperimento ang tungkol sa error ng unang uri.

kanin. 2.2.

Kung ang pagtanggap ng isang istatistikal na hypothesis ay nagpapahiwatig ng anumang mahalagang panlipunang kahihinatnan, isang mas konserbatibong diskarte para sa pagtantya nito ay maaaring gamitin. Kung ang malalang kahihinatnan ay maaaring magresulta mula sa pagtanggi sa isang istatistikal na hypothesis, maaari kang kumilos nang hindi gaanong konserbatibo.

Halimbawa, hayaang isaalang-alang ang tanong ng pagtukoy sa mental retardation ng isang partikular na bata. Ang isang sikolohikal na pagsusuri ay nagsiwalat na ang kanyang IQ ay mas mababa sa average para sa populasyon ng mga paksang ito. Kaya, lumitaw ang isang palagay tungkol sa hindi sapat na intelektwal na pag-unlad ng batang ito at, samakatuwid, ang pangangailangan na ipadala siya sa isang espesyal na boarding school para sa mga may kapansanan sa pag-iisip. Upang subukan ang hypothesis na ito, dalawang alternatibong istatistikal na hypothesis ang nabuo, na ang isa ay ipinapalagay na ang data na nakuha sa panahon ng survey ay nagpapakilala sa karaniwang distribusyon ng populasyon na may inaasahan sa matematika na katumbas ng hangganan na tumutukoy sa mental retardation, halimbawa, 75 puntos (hypothesis N 0), at ipinapalagay ng pangalawa ang isang mas mababang halaga ng inaasahan sa matematika, i.e. ang pag-asa sa matematika ay mas mababa sa ibinigay na limitasyon (hypothesis N 1). Ipagpalagay pa natin na sa kurso ng pagtatasa ng istatistikal na kahalagahan ng isang empirikal na tagapagpahiwatig ng intelektwal na pag-unlad ng isang bata, lumabas na ang posibilidad na makakuha ng parehong resulta o kahit na mas mababa sa isa pang random na pagsubok ay hindi hihigit sa isang pagkakataon sa 20. Ang tanong ay lumitaw: posible bang maghusga batay sa resultang ito? hindi sapat na empirikal na bisa ng null hypothesis at, samakatuwid, abandunahin ito pabor sa alternatibong hypothesis N 1? Maliwanag, ang sagot sa tanong na ito ay nakasalalay sa malaking lawak sa kung anong uri ng mga maling aksyon ang maaaring ituring na mas katanggap-tanggap. Kung kumbinsido tayo na ang isang normal na bata, kahit na may mababang kakayahan sa pag-iisip, ang pananatili sa isang boarding school para sa mga may kapansanan sa pag-iisip ay mas mahusay kaysa sa pagtuturo ng isang batang may kapansanan sa pag-iisip sa isang normal na paaralan, maaari tayong gumawa ng isang desisyon tungkol sa pagtatatag ng mga hangganan para sa antas ng kahalagahan, kung iba ang paniniwala natin, kailangang gumawa ng isa pang desisyon.

Sa kabutihang palad, ang mananaliksik ay kadalasang hindi nahihirapan sa paglutas ng ganitong uri ng problema. Ang katotohanan ay imposible sa istatistika na patunayan ang pinakamainam na antas ng kahalagahan na maaaring kunin bilang isang sanggunian kapag pumipili ng mga istatistikal na hypotheses. Kasabay nito, may ilang quasi-statistical na kasunduan na tinatanggap bilang default (Talahanayan 2.3). Ang empirical na resulta ay isinasaalang-alang makabuluhang istatistika upang tanggihan ang null hypothesis kung ang posibilidad na makakuha ng pareho o mas malaki (mas maliit) na resulta sa isa pang random na pagsubok ay mas mababa sa isang pagkakataon sa 20, i.e. kapag ang halaga R lumalabas na mas mababa sa 0.05. Kung ang halaga R lumalabas na mas mababa sa 0.01, pagkatapos ay isinasaalang-alang ang resulta na nakuha lubhang makabuluhan upang tanggihan ang null hypothesis. Kung sakaling ang halaga R lumampas sa 0.10, itinuturing na ang eksperimento ay hindi nagtatag ng mga makabuluhang pagkakaiba sa istatistika mula sa teoretikal na parameter na ipinapalagay ng null hypothesis. Kung ang natanggap na halaga R ay nasa pagitan ng 0.10 at 0.05, ang resulta ay itinuturing na hindi tiyak. Sinasabing ito ay nasa hangganan ng mga antas ng kahalagahan. Ang resultang ito ay kung hindi man ay tinatawag bahagyang makabuluhan.

Talahanayan 2.3

Mga karaniwang halaga ng dami na tumutukoy sa paggawa ng desisyon sa istatistika

Ang inilarawan na diskarte para sa pagsubok at pagtanggap ng mga hypotheses ay pangkalahatan at pinakakaraniwan. Ang isang mas konserbatibong diskarte ay maaaring kunin ang mga halaga ng posibilidad na 0.01 at 0.001, ayon sa pagkakabanggit, bilang maaasahan at lubos na maaasahang mga antas, at itakda ang halaga ng posibilidad sa 0.05 para sa isang hindi mapagkakatiwalaang antas (O. Yu. Ermolaev, ). Kung gayon ang kaunting makabuluhang resulta ay ang nasa hanay mula 0.01 hanggang 0.05. Gayunpaman, tulad ng isang diskarte sikolohikal na pananaliksik ay bihira pa ring gamitin.

Sa anumang kaso, dapat tandaan na ang mga resulta ng pagsusuri ng mga istatistikal na hypotheses ay hindi maituturing na sapat para sa pagsusuri ng mga eksperimentong hypotheses kung sila ay kinuha sa kanilang sarili, nang walang koneksyon sa buong eksperimentong sitwasyon.

Ang mga istatistikal na hypotheses ay hindi dapat malito sa mga eksperimental at teoretikal na hypotheses. Ang mga teoretikal na hypotheses ay sumasalamin sa likas na katangian ng mga koneksyon at pattern ng mga phenomena na pinag-aaralan. Ang mga pang-eksperimentong hypotheses ay inilalagay batay sa pag-aaral ng naturang teoretikal na kaalaman sa isang partikular na larangan at sa gayon ay tinukoy ang mga teoretikal na hypotheses mismo. Tulad ng mga istatistikal na hypotheses, kinasasangkutan ng mga ito ang sabay-sabay na pagbabalangkas ng mga nakikipagkumpitensyang hypotheses bilang mga pagtanggi sa pagkakaroon ng pinaghihinalaang ugnayang sanhi. Dahil sa katotohanang ito, ang empirical pattern sa ilalim ng pag-aaral ay maaaring magbigay-daan para sa iba't ibang sanhi ng interpretasyon, na tinatawag na nakikipagkumpitensyang mga hypotheses.

Hindi tulad ng mga pang-eksperimento, ang mga istatistikal na hypotheses ay isang tool lamang para sa pagtatasa ng data na nakolekta sa panahon ng isang eksperimento at hindi sa simula ay ipinapalagay ang anumang empirical pattern. Ang resulta ng kanilang pagsubok ay likas na istatistika lamang at samakatuwid ay hindi nagpapahiwatig ng awtomatikong pagtanggap o pagtanggi sa parehong eksperimental at, lalo na, mga teoretikal na hypotheses.

pataas