Kasama sa mga katangian ng scattering. Pagpapasiya ng mga katangian ng scattering phenomenon. Pagtatantya ng mga parameter ng pangkalahatang populasyon. Pagtatantya ng punto at pagitan. Agwat ng kumpiyansa. Lebel ng kahalagahan

Kasama ang pinaka-malamang na halaga ng panganib, ang pagkalat ng mga posibleng halaga ng panganib na nauugnay sa gitnang halaga nito ay mahalaga. Ang accounting para sa pagkalat ng mga tagapagpahiwatig ay kinakailangan din kapag nilutas ang mga problema ng panlipunan at kalinisan na pagsubaybay.

Ang pinakakaraniwang katangian ng pagkalat random variable ay ang variance at standard deviation.

Ang pagkakaiba-iba ng isang random na variable ξ, na tinutukoy bilang D(ξ) (ginagamit din namin ang notasyon V(ξ) at σ2(ξ)), nailalarawan ang pinaka-malamang na halaga ng squared deviation ng isang random variable mula sa inaasahan ng matematika nito.

Para sa isang discrete random variable na kumukuha ng mga value x i may probabilidad p ako, ang pagkakaiba ay tinukoy bilang ang timbang na kabuuan ng mga paglihis ng nitrate x i mula sa mathematical expectation ξ na may weight coefficients na katumbas ng kaukulang probabilities:

D(ξ) =

Para sa isang tuluy-tuloy na random variable ξ, ang pagkakaiba nito ay tinutukoy ng formula:

D(ξ) =

Ang dispersion ay may mga sumusunod na praktikal na mahahalagang katangian:

1. Ang dispersion ng anumang random na variable ay hindi negatibo:

D(ξ) ≥ 0

2. Ang dispersion ng isang pare-parehong halaga ay 0:

D(C) = 0

saan Ang C ay isang pare-pareho.

3. Ang pagkakaiba ng random variable ξ ay katumbas ng pagkakaiba sa pagitan ng mathematical expectation ng square ng random variable na ito at ng square ng mathematical expectation ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Ang pagdaragdag ng isang pare-pareho sa isang random na variable ay hindi nagbabago ng pagkakaiba; ang pag-multiply ng random variable sa isang constant a ay humahantong sa pagpaparami ng variance sa pamamagitan ng a 2 :

D(aξ + b) = isang 2 D(ξ),

saan a at b- mga pare-pareho.

5. Ang pagkakaiba ng kabuuan ng mga independiyenteng random na variable ay katumbas ng kabuuan ng kanilang mga pagkakaiba:

kung saan ang ξ at η ay mga independent random variable.

Ang standard deviation ng isang random variable ξ (ang terminong "standard deviation" ay ginagamit din) ay ang numero σ (ξ) katumbas ng parisukat na ugat mula sa pagkakaiba-iba ξ:

Sinusukat ng standard deviation ang deviation ng random variable mula sa mathematical expectation nito sa parehong dami kung saan sinusukat ang random variable mismo (sa kaibahan sa variance, ang dimensyon nito ay katumbas ng square ng dimensyon ng orihinal na random variable. ). Para sa normal na pamamahagi ang standard deviation ay katumbas ng parameter σ. Kaya, ang mathematical expectation at standard deviation ay kumakatawan sa isang kumpletong hanay ng mga katangian ng isang normal na distribution at natatanging tinutukoy ang uri ng distribution density. Para sa mga distribusyon na naiiba sa normal, ang pares na ito ng mga tagapagpahiwatig ay hindi pantay na epektibong katangian ng pamamahagi.


Ang koepisyent ng pagkakaiba-iba ay ginagamit din bilang isang katangian ng scattering ng isang random variable. Ang koepisyent ng variation ng isang random variable ξ na may hindi zero na inaasahan sa matematika ay ang bilang V(ξ) katumbas ng ratio ng standard deviation ξ sa inaasahan nitong matematika:

Ang koepisyent ng pagkakaiba-iba ay sumusukat sa pagpapakalat ng isang random na variable sa mga praksyon ng kanyang inaasahan sa matematika at kadalasang ipinahayag bilang isang porsyento ng huli. Ang katangiang ito ay hindi dapat gamitin kung ang mathematical expectation ay malapit sa 0 o makabuluhang mas mababa kaysa sa standard deviation (sa kasong ito, ang maliliit na error sa pagtukoy ng mathematical expectation ay humahantong sa isang mataas na error para sa coefficient of variation), at gayundin kung ang uri ng density ng pamamahagi ay makabuluhang naiiba sa Gaussian.

Asymmetry coefficient ( Bilang) tinutukoy ang ika-3 antas ng paglihis ng isang random na variable mula sa inaasahan sa matematika at tinutukoy ng formula:

Sa pagsasagawa, ang tagapagpahiwatig na ito ay ginagamit bilang isang pagtatantya ng simetrya ng pamamahagi. Para sa anumang simetriko na pamamahagi, ito ay katumbas ng 0. Kung ang density ng pamamahagi ay hindi simetriko (na kadalasang nangyayari kapag tinatasa ang panganib ng kamatayan at ang mga panganib na nauugnay sa polusyon sa tubig at hangin), kung gayon ang isang positibong skewness ay tumutugma sa kaso kapag ang kaliwang balikat ng density curve ay mas matarik kaysa sa kanan, at negatibo - ang kaso kapag ang kanang balikat ay mas matarik kaysa sa kaliwa (Figure 4.17).

Para sa mga skewed distribution, ang standard deviation ay hindi isang magandang sukatan ng spread ng isang random variable. Sa kasong ito, maaaring gamitin ang mga indicator tulad ng quartiles, quantiles, at percentiles upang ilarawan ang scattering.

Ang unang quartile ng random variable ξ na may distribution function na F(x) ay ang numero Q1 na isang solusyon sa equation

F(Q 1) = 1/4

i.e., isang numero kung saan ang posibilidad na ang ξ ay kumukuha ng mga halaga ay mas mababa sa Q1, ay katumbas ng 1/4, ang posibilidad na kumuha ito ng mga halaga na mas malaki kaysa Q1 katumbas ng 3/4.

pangalawang quartile ( Q2) ng isang random na variable ay tinatawag na median nito, at ang pangatlo ( Q 3) - solusyon ng equation

F(Q 3) = 3/4

Hinahati ng mga quartile ang x-axis sa 4 na pagitan: [-∞, Q1], [Q 1 , Q 2], [Q2, Q3] at [ Q 3, + ∞] sa bawat isa kung saan bumabagsak ang random variable na may pantay na posibilidad, at ang figure na nililimitahan ng x-axis at ang graph ng density ng pamamahagi - sa 4 na rehiyon na may parehong lugar. At ang pagitan sa pagitan ng una at ikatlong quartile ay naglalaman ng 50% ng pamamahagi ng random variable. Para sa simetriko na distribusyon, ang una at pangatlong kuwarts ay pantay na malayo sa median.

Ang dami ng order R random variable ξ na may distribution function F(x) ay tinatawag na numero X, na isang solusyon sa equation

Kaya, ang mga kuwartil ay mga dami ng pagkakasunud-sunod ng 0.25, 0.5, at 0.75. Kung ang pagkakasunud-sunod ng p quantile ay ipinahayag bilang isang porsyento, kung gayon ang mga kaukulang halaga X tinatawag na percentiles, o R-porsiyento na mga punto ng pamamahagi.

Sa fig. Ang 4.18 ay nagpapakita, kasama ang mga quantile, 2.5 at 97.5 porsyento na mga punto ng pamamahagi. Sa pagitan ng mga puntong ito, 95% ng pamamahagi ng isang random na variable ay puro, samakatuwid ang agwat sa pagitan ng mga ito ay tinatawag na 95% na agwat ng kumpiyansa ng mean (sa partikular, sa pagtatasa ng panganib, ang 95% na agwat ng kumpiyansa ng panganib).

Gawain 2. Alin sa mga sumusunod na impormasyon tungkol sa random variable ξ ang nagpapahintulot sa amin na tanggihan ang pagpapalagay na ito ay ipinamamahagi ayon sa normal na batas:

a) ξ ay isang discrete random variable;

b) ang mathematical expectation ξ ay negatibo;

c) ang pamamahagi ξ ay unimodal;

d) ang mathematical expectation na ξ ay hindi katumbas ng median nito;

e) ang asymmetry coefficient ξ ay negatibo;

f) ang standard deviation ξ ay mas malaki kaysa sa inaasahan nitong matematika;

g) ξ ay nagpapakilala sa pamamahagi ng tagal ng mga talamak na sakit sa paghinga sa lugar ng pag-aaral;

h) Ang ξ ay nagpapakilala sa distribusyon ng pag-asa sa buhay sa lugar ng pag-aaral;

i) ang median ξ ay hindi tumutugma sa gitna ng pagitan sa pagitan ng una at ikatlong kuwarts.

Sagot: Ang palagay tungkol sa normal na batas ng pamamahagi ng isang random na variable ay hindi tugma sa mga pahayag a), d), e), h), i).

kanin. 4.17. Sign dependency Fig.4.18. Mga Quartile at Percentile:

skewness at shape illustration gamit ang function

mga function ng density ng pamamahagi

Upang pangunahing istatistikal na katangian serye ng mga sukat (variation series) ay mga katangian ng posisyon (karaniwang katangian, o sentral na kalakaran ng sample); mga katangian ng scattering (pagkakaiba-iba o pagbabagu-bago) at X katangian ng hugis pamamahagi.

Upang mga katangian ng posisyon magkaugnay ibig sabihin ng aritmetika (ibig sabihin), fashion at panggitna.

Upang mga katangian ng scattering (pagkakaiba-iba o pagbabagu-bago) kaugnay: saklaw ng pagkakaiba-iba, pagpapakalat, root ibig sabihin ng square (pamantayan) paglihis, arithmetic mean error (ibig sabihin ng pagkakamali), ang koepisyent ng pagkakaiba-iba at iba pa.

Sa mga katangian ng anyo magkaugnay asymmetry coefficient, sukat ng skewness at kurtosis.

Mga Katangian ng Posisyon

Ang ibig sabihin ng aritmetika ay isa sa mga pangunahing katangian ng sample.

Ito, tulad ng iba pang mga numerical na katangian ng sample, ay maaaring kalkulahin pareho mula sa raw pangunahing data at mula sa mga resulta ng pagpapangkat ng data na ito.

Ang katumpakan ng pagkalkula sa raw data ay mas mataas, ngunit ang proseso ng pagkalkula ay lumalabas na nakakaubos ng oras na may malaking sukat ng sample.

Para sa ungrouped data, ang arithmetic mean ay tinutukoy ng formula:

saan n- laki ng sample, X 1 , X 2 , ... X n - mga resulta ng pagsukat.

Para sa nakagrupong data:

saan n- laki ng sample, k ay ang bilang ng mga pagitan ng pagpapangkat, n i- dalas ng mga agwat, x i ay ang mga median na halaga ng mga pagitan.

Fashion

Kahulugan 1. Fashion ay ang pinakamadalas na nagaganap na halaga sa sample na data. Tinutukoy Mo at tinutukoy ng formula:

kung saan ang mas mababang limitasyon ng modal interval, ay ang lapad ng pagpapangkat ng pagitan, ay ang dalas ng modal interval, ay ang dalas ng agwat na nauuna sa modal, ay ang dalas ng agwat kasunod ng modal.

Kahulugan 2. Fashion Mo discrete random variable ang pinakamalamang na halaga nito ay tinatawag.

Sa geometriko, ang mode ay maaaring bigyang-kahulugan bilang abscissa ng pinakamataas na punto ng curve ng pamamahagi. meron bimodal at multimodal pamamahagi. May mga distribusyon na may minimum ngunit walang maximum. Ang ganitong mga pamamahagi ay tinatawag antimodal .

Kahulugan. Modal pagitan tinatawag na pangkatang pagitan na may pinakamataas na dalas.

Median

Kahulugan. Median - ang resulta ng pagsukat, na nasa gitna ng ranggo na serye, sa madaling salita, ang median ay ang halaga ng tampok X, kapag ang kalahati ng mga halaga ng pang-eksperimentong data ay mas mababa dito, at ang pangalawang kalahati ay higit pa, ay tinutukoy Ako.

Kapag ang laki ng sample n- isang even na numero, ibig sabihin, mayroong pantay na bilang ng mga resulta ng pagsukat, pagkatapos ay upang matukoy ang median, kinakalkula ang average na halaga ng dalawang sample indicator na matatagpuan sa gitna ng ranggo na serye.

Para sa data na nakapangkat sa mga pagitan, ang median ay tinutukoy ng formula:

,

kung saan ang mas mababang limitasyon ng median na pagitan; lapad ng pagitan ng pagpapangkat, 0.5 n- kalahati ng laki ng sample, - dalas ng median na pagitan, - pinagsama-samang dalas ng pagitan bago ang median.

Kahulugan. median na pagitan tinatawag na interval kung saan ang naipon na dalas sa unang pagkakataon ay higit sa kalahati ng laki ng sample ( n/ 2) o ang naipon na dalas ay mas malaki sa 0.5.

Mga numerong halaga ang ibig sabihin, ang mga mode at median ay iba kapag may di-simetrikong hugis ng empirical distribution.

Mga katangian ng scatter ng pagsukat

Para sa mathematical-statistical analysis ng mga resulta ng sample, hindi sapat na malaman lamang ang mga katangian ng posisyon. Ang parehong ibig sabihin ng halaga ay maaaring makilala ang ganap na magkakaibang mga sample.

Samakatuwid, bilang karagdagan sa kanila, isinasaalang-alang din ng mga istatistika mga katangian ng scattering (mga pagkakaiba-iba, o pagkasumpungin ) resulta.

Pagbabago ng span

Kahulugan. sa malaking paraan ang pagkakaiba-iba ay ang pagkakaiba sa pagitan ng pinakamalaki at pinakamaliit na resulta ng sample, na tinutukoy R at determinado

R=X max- X min.

Ang nilalaman ng impormasyon ng tagapagpahiwatig na ito ay hindi mataas, bagama't sa maliliit na laki ng sample ay madaling tantiyahin ang pagkakaiba sa pagitan ng pinakamahusay at pinakamasamang resulta ng mga atleta.

Pagpapakalat

Kahulugan. pagpapakalat ay tinatawag na mean square ng paglihis ng mga halaga ng katangian mula sa arithmetic mean.

Para sa hindi nakagrupong data, ang pagkakaiba ay tinutukoy ng formula

s2 = , (1)

saan Х i- ang halaga ng tampok, - ang arithmetic mean.

Para sa data na nakapangkat sa mga pagitan, ang pagkakaiba ay tinutukoy ng formula

,

saan x i- ibig sabihin i pagitan ng pagpapangkat, n i- mga frequency ng pagitan.

Upang pasimplehin ang mga kalkulasyon at upang maiwasan ang mga error sa pagkalkula kapag bini-round ang mga resulta (lalo na kapag pinapataas ang laki ng sample), ginagamit din ang iba pang mga formula upang matukoy ang pagkakaiba. Kung ang arithmetic mean ay nakalkula na, ang sumusunod na formula ay ginagamit para sa hindi nakagrupong data:

para sa nakagrupong data:

.

Ang mga formula na ito ay nakuha mula sa mga nauna sa pamamagitan ng pagpapalawak ng parisukat ng pagkakaiba sa ilalim ng sum sign.

Ang isa sa mga dahilan para sa pagsasagawa ng statistical analysis ay ang pangangailangan na isaalang-alang ang impluwensya ng mga random na kadahilanan (perturbations) sa indicator sa ilalim ng pag-aaral, na humahantong sa scatter (scattering) ng data. Ang paglutas ng mga problema kung saan mayroong pagkalat ng data ay nauugnay sa panganib, dahil kahit na ginagamit ang lahat ng magagamit na impormasyon, imposibleng eksakto hulaan kung ano ang mangyayari sa hinaharap. Upang gumana nang sapat sa ganitong mga sitwasyon, ipinapayong maunawaan ang likas na katangian ng panganib at matukoy ang antas ng pagpapakalat ng set ng data. May tatlong numerical na katangian na naglalarawan sa sukat ng dispersion: standard deviation, range, at coefficient of variation (variability). Hindi tulad ng mga tipikal na tagapagpahiwatig (mean, median, mode) na nagpapakilala sa sentro, nagpapakita ang mga katangian ng scattering gaano kalapit sa gitnang ito ay ang mga indibidwal na halaga ng set ng data
Kahulugan ng Standard Deviation Karaniwang lihis(standard deviation) ay isang sukatan ng random deviations ng mga halaga ng data mula sa mean. AT totoong buhay karamihan sa data ay nailalarawan sa pamamagitan ng scatter, i.e. ang mga indibidwal na halaga ay nasa ilang distansya mula sa average.
Imposibleng gamitin ang standard deviation bilang pangkalahatang katangian ng scattering sa pamamagitan lamang ng pag-a-average ng mga deviation ng data, dahil ang ilan sa mga deviation ay magiging positibo at ang iba pang bahagi ay magiging negatibo, at, bilang resulta, ang average ang resulta ay maaaring maging zero. Upang mapupuksa ang negatibong palatandaan, ginagamit ang isang karaniwang trick: unang kalkulahin pagpapakalat bilang ang kabuuan ng mga squared deviations na hinati ng ( n–1), at pagkatapos ay ang square root ay kinuha mula sa resultang halaga. Ang pormula para sa pagkalkula ng karaniwang paglihis ay ang mga sumusunod: Tandaan 1. Ang pagkakaiba ay hindi nagdadala ng anumang karagdagang impormasyon kumpara sa karaniwang paglihis, ngunit ito ay mas mahirap bigyang-kahulugan, dahil ito ay ipinahayag sa "mga yunit na squared", habang ang karaniwang paglihis ay ipinahayag sa mga yunit na pamilyar sa amin (halimbawa, sa dolyar). Tandaan 2. Ang formula sa itaas ay para sa pagkalkula ng standard deviation ng isang sample at mas tumpak na tinatawag sample na standard deviation. Kapag kinakalkula ang karaniwang paglihis populasyon(tinutukoy ng simbolong s) hatiin ng n. Ang halaga ng sample na standard deviation ay medyo mas malaki (dahil hinati ito ng n–1), na nagbibigay ng pagwawasto para sa randomness ng sample mismo. Sa kaso kapag ang data set ay may normal na distribusyon, ang standard deviation ay magkakaroon ng espesyal na kahulugan. Sa figure sa ibaba, ang mga marka ay inilalagay sa magkabilang panig ng mean sa layo na isa, dalawa at tatlong standard deviations, ayon sa pagkakabanggit. Ipinapakita ng figure na humigit-kumulang 66.7% (dalawang-katlo) ng lahat ng mga halaga ay nasa loob ng isang karaniwang paglihis sa magkabilang panig ng mean, 95% ng mga halaga ay nasa loob ng dalawang karaniwang paglihis ng mean, at halos lahat ng ang data (99.7%) ay nasa loob ng tatlong standard deviations ng mean.
66,7%


Ang property na ito ng standard deviation para sa normal na distributed na data ay tinatawag na "two-thirds rule".

Sa ilang sitwasyon, gaya ng pagsusuri sa kontrol sa kalidad ng produkto, ang mga limitasyon ay kadalasang itinatakda upang ang mga obserbasyon na iyon (0.3%) na higit sa tatlong karaniwang paglihis mula sa mean ay itinuturing na karapat-dapat na pansinin.

Sa kasamaang palad, kung ang data ay hindi karaniwang ipinamamahagi, hindi mailalapat ang panuntunang inilarawan sa itaas.

Kasalukuyang may hadlang na tinatawag na panuntunan ni Chebyshev na maaaring ilapat sa mga skewed (skewed) distribution.

Bumuo ng paunang data

Ipinapakita ng Talahanayan 1 ang dinamika ng mga pagbabago sa pang-araw-araw na kita sa stock exchange, na naitala sa mga araw ng trabaho para sa panahon mula Hulyo 31 hanggang Oktubre 9, 1987.

Talahanayan 1. Dynamics ng mga pagbabago sa araw-araw na kita sa stock exchange

Ang petsa Araw-araw na Kita Ang petsa Araw-araw na Kita Ang petsa Araw-araw na Kita
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Ilunsad ang Excel
Lumikha ng file I-click ang button na I-save sa Standard toolbar. buksan ang folder ng Statistics sa dialog box na lalabas at pangalanan ang Scattering Characteristics.xls file.
Itakda ang Label 6. Sa Sheet1, sa cell A1, ilagay ang label na Daily profit, 7. at sa hanay na A2:A49, ilagay ang data mula sa Talahanayan 1.
Itakda ang function na AVERAGE 8. Sa cell D1, ilagay ang label na Average. Sa cell D2, kalkulahin ang average gamit ang AVERAGE statistical function.
Itakda ang STDEV function Sa cell D4, ilagay ang label na Standard Deviation. Sa cell D5, kalkulahin ang standard deviation gamit ang statistical function na STDEV
Bawasan ang haba ng salita ng resulta sa ikaapat na decimal place.
Interpretasyon ng mga resulta tanggihan ang pang-araw-araw na kita ay may average na 0.04% (ang halaga ng average na pang-araw-araw na kita ay naging -0.0004). Nangangahulugan ito na ang average na pang-araw-araw na kita para sa isinasaalang-alang na tagal ng panahon ay humigit-kumulang katumbas ng zero, i.e. ang merkado ay nasa average na rate. Ang karaniwang paglihis ay naging 0.0118. Nangangahulugan ito na ang isang dolyar ($1) na namuhunan sa stock market bawat araw ay nagbago sa average ng $0.0118, ibig sabihin. ang kanyang pamumuhunan ay maaaring magresulta sa kita o pagkawala ng $0.0118.
Suriin natin kung ang mga halaga ng pang-araw-araw na kita na ibinigay sa Talahanayan 1 ay tumutugma sa mga patakaran ng normal na pamamahagi 1. Kalkulahin ang pagitan na tumutugma sa isang karaniwang paglihis sa magkabilang panig ng mean. 2. Sa mga cell D7, D8 at F8, itakda ang mga label ayon sa pagkakabanggit: Isang standard deviation, Lower limit, Upper limit. 3. Sa cell D9, ilagay ang formula = -0.0004 - 0.0118, at sa cell F9, ilagay ang formula = -0.0004 + 0.0118. 4. Kunin ang resulta hanggang sa apat na decimal na lugar.

5. Tukuyin ang bilang ng mga pang-araw-araw na kita na nasa loob ng isang standard deviation. Una, i-filter ang data, na iniiwan ang mga pang-araw-araw na halaga ng kita sa pagitan [-0.0121, 0.0114]. Upang gawin ito, pumili ng anumang cell sa column A na may mga pang-araw-araw na halaga ng kita at patakbuhin ang command:

Data®Filter®AutoFilter

Buksan ang menu sa pamamagitan ng pag-click sa arrow sa header Araw-araw na Kita, at piliin ang (Kondisyon...). Sa dialog box ng Custom na AutoFilter, itakda ang mga opsyon tulad ng ipinapakita sa ibaba. I-click ang OK button.

Upang mabilang ang bilang ng na-filter na data, piliin ang hanay ng mga pang-araw-araw na halaga ng kita, i-right click sa isang walang laman na espasyo sa status bar, at piliin ang utos ng Bilang ng mga halaga mula sa menu ng konteksto. Basahin ang resulta. Ipakita ngayon ang lahat ng orihinal na data sa pamamagitan ng pagpapatakbo ng command: Data®Filter®Show All at i-off ang autofilter gamit ang command: Data®Filter®AutoFilter.

6. Kalkulahin ang porsyento ng mga pang-araw-araw na kita na nasa loob ng isang standard deviation ng average. Upang gawin ito, ilagay ang label sa cell H8 Porsiyento, at sa cell H9, i-program ang formula para sa pagkalkula ng porsyento at makuha ang resulta na may katumpakan ng isang decimal place.

7. Kalkulahin ang hanay ng mga pang-araw-araw na kita sa loob ng dalawang karaniwang paglihis mula sa mean. Sa mga cell D11, D12 at F12, itakda ang mga label nang naaayon: Dalawang karaniwang paglihis, Bottom line, Upper bound. Sa mga cell D13 at F13, ilagay ang mga formula ng pagkalkula at makuha ang resulta nang tumpak sa ikaapat na decimal place.

8. Tukuyin ang bilang ng mga pang-araw-araw na kita na nasa loob ng dalawang karaniwang paglihis sa pamamagitan ng unang pag-filter ng data.

9. Kalkulahin ang porsyento ng mga pang-araw-araw na kita na dalawang standard deviations ang layo mula sa average. Upang gawin ito, ilagay ang label sa cell H12 Porsiyento, at sa cell H13, i-program ang formula para sa pagkalkula ng porsyento at makuha ang resulta na may katumpakan ng isang decimal place.

10. Kalkulahin ang hanay ng mga pang-araw-araw na kita sa loob ng tatlong karaniwang paglihis mula sa mean. Sa mga cell D15, D16 at F16, itakda ang mga label nang naaayon: Tatlong karaniwang paglihis, Bottom line, Upper bound. Sa mga cell D17 at F17, ilagay ang mga formula ng pagkalkula at makuha ang resulta nang tumpak sa ikaapat na decimal place.

11. Tukuyin ang bilang ng mga pang-araw-araw na kita na nasa loob ng tatlong karaniwang paglihis sa pamamagitan ng unang pagsala sa data. Kalkulahin ang porsyento ng mga pang-araw-araw na halaga ng kita. Upang gawin ito, ilagay ang label sa cell H16 Porsiyento, at sa cell H17, i-program ang formula para sa pagkalkula ng porsyento at makuha ang resulta na may katumpakan ng isang decimal place.

13. Mag-plot ng histogram ng pang-araw-araw na kita ng stock sa stock exchange at ilagay ito kasama ng frequency distribution table sa lugar J1:S20. Ipakita sa histogram ang tinatayang mean at mga pagitan na tumutugma sa isa, dalawa, at tatlong karaniwang paglihis mula sa mean, ayon sa pagkakabanggit.

Serye ng pagkakaiba-iba

Sa pangkalahatang populasyon, ang isang tiyak na quantitative na katangian ay sinisiyasat. Ang isang sample ng volume ay random na kinuha mula dito n, ibig sabihin, ang bilang ng mga elemento sa sample ay n. Sa unang yugto ng pagproseso ng istatistika, sumasaklaw mga sample, i.e. pag-order ng numero x1, x2, …, xn Paakyat. Ang bawat naobserbahang halaga xi tinawag opsyon. Dalas mi ay ang bilang ng mga obserbasyon ng halaga xi sa sample. Relatibong dalas (dalas) wi ay ang frequency ratio mi sa laki ng sample n: wi=mi/n.

Kapag nag-aaral ng variational series, ginagamit din ang mga konsepto ng cumulative frequency at cumulative frequency. Hayaan x ilang numero. Pagkatapos ang bilang ng mga pagpipilian , na ang mga halaga ay mas mababa x, ay tinatawag na cumulative frequency: minak=mi para sa xi ay tinatawag na pinagsama-samang dalas: winak=miak/n.

Ang isang katangian ay tinatawag na discretely variable kung ang mga indibidwal na halaga nito (mga variant) ay naiiba sa isa't isa sa ilang tiyak na halaga (karaniwan ay isang integer). Ang isang variational series ng naturang feature ay tinatawag na discrete variational series.

Mga de-numerong katangian ng serye ng variation

Ang mga numerical na katangian ng variational series ay kinakalkula mula sa data na nakuha bilang resulta ng mga obserbasyon (statistical data), kung kaya't ang mga ito ay tinatawag ding mga statistical na katangian o mga pagtatantya. Sa pagsasagawa, kadalasan ay sapat na upang malaman ang mga katangian ng buod ng serye ng pagkakaiba-iba: mga katangian ng average o posisyon (sentral na ugali); scattering katangian o pagkakaiba-iba (variability); mga katangian ng hugis (asymmetry at steepness ng distribution).

Ang arithmetic mean ay nagpapakilala sa mga halaga ng tampok sa paligid kung saan ang mga obserbasyon ay puro, i.e. trend ng sentral na pamamahagi.

dangal median bilang isang sukatan ng sentral na tendensya ay nakasalalay sa katotohanan na hindi ito apektado ng pagbabago sa matinding mga miyembro ng serye ng variation, kung alinman sa mga ito, mas mababa sa median, ay nananatiling mas mababa dito, at alinman, mas malaki kaysa sa median , patuloy na mas malaki kaysa rito. Mas mainam ang median kaysa sa arithmetic mean para sa isang serye kung saan ang mga extreme variant kung ihahambing sa iba ay naging sobrang malaki o maliit. Katangi-tangi fashion bilang isang sukatan ng sentral na tendensya ay nakasalalay sa katotohanan na hindi rin ito nagbabago kapag nagbago ang mga matinding miyembro ng serye, i.e. ay may tiyak

Mga katangian ng polo

Arithmetic mean (sample mean)

xv=i=1nmixin

Fashion

Mo = xj, kung mj=mmax

Ako = xk+1, kung n = 2k+1;

Ako = (xk + xk+1)/2, kung n = 2k

Mga katangian ng scattering

Sample na pagkakaiba

Dv=i=1nmixixv2n

Sample na standard deviation

σv=Dv

Nawastong pagkakaiba

S2=nn1Dv

Nawastong standard deviation

Ang koepisyent ng pagkakaiba-iba

V=σinxin∙100%

ibig sabihin ay ganap

paglihis

θ= i=1nmixixвn

Saklaw ng pagkakaiba-iba

R = xmaxxmin

Quartile range

Rkv \u003d Qv - Qn

Mga katangian ng anyo

Asymmetry coefficient

Bilang= i=1nmixixin3nσin3

Koepisyent ng kurtosis

Ek=i=1nmixixin4nσin43

paglaban sa pagkakaiba-iba ng katangian. Ngunit ang pinaka-interesante ay ang mga sukat ng variation (scattering) ng mga obserbasyon sa paligid ng mga mean na halaga, sa partikular, sa paligid ng arithmetic mean. Kasama sa mga pagtatantya na ito sample na pagkakaiba-iba at karaniwang lihis. Ang sample na pagkakaiba-iba ay may isang makabuluhang disbentaha: kung ang ibig sabihin ng aritmetika ay ipinahayag sa parehong mga yunit bilang ang mga halaga ng isang random na variable, kung gayon, ayon sa kahulugan, ang pagkakaiba ay ipinahayag na sa mga square unit. Ang pagkukulang na ito ay maiiwasan kung ang karaniwang paglihis ay gagamitin bilang sukatan ng pagkakaiba-iba ng isang tampok. Para sa maliliit na laki ng sample, ang pagkakaiba ay isang bias na pagtatantya, kaya para sa mga laki ng sample n30 gamitin naitama ang pagkakaiba-iba at naitama ang standard deviation. Ang isa pang madalas na ginagamit na katangian ng feature dispersion measure ay ang koepisyent ng pagkakaiba-iba. Ang bentahe ng koepisyent ng pagkakaiba-iba ay na ito ay isang walang sukat na katangian na nagbibigay-daan sa iyo upang ihambing ang pagkakaiba-iba ng hindi matutumbasan

mga linya ng pagkakaiba-iba. Bilang karagdagan, mas mababa ang halaga ng koepisyent ng pagkakaiba-iba, mas homogenous ang populasyon ayon sa katangiang pinag-aaralan at mas tipikal ang average. Mga populasyon na may koepisyent ng pagkakaiba-iba V> 3035% ay itinuturing na heterogenous.

Kasama ng dispersion, ginagamit din ng isa ibig sabihin ay ganap na paglihis. Ang bentahe ng average na linear deviation ay ang sukat nito, dahil ipinahayag sa parehong mga yunit bilang ang mga halaga ng random variable. Ang isang karagdagang at simpleng tagapagpahiwatig ng pagpapakalat ng mga halaga ng tampok ay hanay ng quartile. Kasama sa hanay ng quartile ang median at 50% ng mga obserbasyon na sumasalamin sa pangunahing trend ng katangian, hindi kasama ang pinakamaliit at pinakamataas na halaga.

Kasama sa mga katangian ng form ang koepisyent ng kawalaan ng simetrya at kurtosis. Kung ang kadahilanan ng kawalaan ng simetrya katumbas ng zero, kung gayon ang distribusyon ay simetriko. Kung ang distribusyon ay walang simetriko, ang isa sa mga sanga ng frequency polygon ay may mas banayad na slope kaysa sa isa. Kung ang kawalaan ng simetrya ay nasa kanang bahagi, kung gayon ang hindi pagkakapantay-pantay ay totoo: xv>Ako>Mo, na nangangahulugang ang nangingibabaw na hitsura sa pamamahagi ng mas mataas na mga halaga ng tampok . Kung ang kawalaan ng simetrya ay nasa kaliwang bahagi, kung gayon ang hindi pagkakapantay-pantay ay matutupad:xv , ibig sabihin na sa pamamahagi, mas karaniwan ang mga mas mababang halaga. Kung mas malaki ang halaga ng koepisyent ng asymmetry, mas walang simetrya ang distribusyon (hanggang 0.25, ang kawalaan ng simetrya ay hindi gaanong mahalaga; mula 0.25 hanggang 0.5, katamtaman; higit sa 0.5, makabuluhan).

Sobra ay isang indicator ng steepness (pointedness) ng variational series kumpara sa normal distribution. Kung ang kurtosis ay positibo, kung gayon ang polygon ng variational series ay may mas matarik na tuktok. Ipinapahiwatig nito ang akumulasyon ng mga halaga ng katangian sa gitnang zone ng serye ng pamamahagi, i.e. tungkol sa nangingibabaw na hitsura sa data ng mga halaga na malapit sa average na halaga. Kung negatibo ang kurtosis, kung gayon ang polygon ay may mas patag na tuktok kumpara sa normal na kurba. Nangangahulugan ito na ang mga halaga ng katangian ay hindi puro sa gitnang bahagi ng serye, ngunit pantay na nakakalat sa buong hanay mula sa pinakamababa hanggang sa pinakamataas na halaga. Kung mas malaki ang ganap na halaga ng kurtosis, mas makabuluhang naiiba ang pamamahagi mula sa normal.

Mayroon kaming pinakamalaking base ng impormasyon sa RuNet, kaya palagi kang makakahanap ng mga katulad na query

Ang paksang ito ay kabilang sa:

Surface plastic deformation (SPD)

Mga cheat sheet para sa pagsusulit. Mga bahagi ng makina, mga paraan ng surface plastic deformation (SPD). Mga sagot

Kasama sa materyal na ito ang mga seksyon:

Mga kababalaghan na nagaganap sa ibabaw na layer ng isang bahagi sa panahon ng pagproseso ng SPD, mekanismo ng hardening

Ang kalidad ng ibabaw ay nakuha sa pamamagitan ng pag-roll gamit ang roller tool. Scheme ng proseso, halaga ng presyon, multiplicity ng application ng deforming force, teknolohikal na kagamitan sa mga proseso ng rolling gamit ang ball tool.

Ang kalidad ng ibabaw ay nakuha sa pamamagitan ng pag-roll gamit ang isang ball tool. Scheme ng proseso, halaga ng presyon, multiplicity ng application ng deforming force, teknolohikal na kagamitan sa mga proseso ng rolling gamit ang ball tool.

Pang-ibabaw na paghubog ng microprofile sa panahon ng sliding indenter na paggamot, layunin nito, tooling sa mga proseso ng pagpapatigas ng vibration, saklaw.

Ang paghubog ng microprofile sa ibabaw sa panahon ng pagproseso na may umiikot na indenter, ang layunin nito, teknolohikal na kagamitan sa mga proseso ng pagproseso ng vibration hardening, saklaw.

Ano ang epekto ng grid angle ng mga nakasasakit na butil ng bar sa pagiging produktibo ng proseso at ang kalidad ng machined surface sa panahon ng superfinishing? Paano ayusin ang teknolohikal na kagamitan upang makakuha ng isang tiyak na anggulo ng grid ng mga notches?

Paano matiyak ang pagkuha ng isang sistema ng mga parallel na channel at ang tamang grid ng mga channel kapag nagpoproseso gamit ang isang sliding indenter sa mga proseso ng PPD? Ang mga paghahambing na katangian ng mga grids ng channel na ito at ang kanilang impluwensya sa mga katangian ng pagpapatakbo ng mga ibabaw ng mga bahagi ng makina.

Anong mga teknolohikal na pamamaraan ang tinitiyak ang kalidad ng ibabaw na layer ng bahagi sa pagtatapos ng yugto ng pagproseso? Bigyan sila ng isang paghahambing na paglalarawan. Pamantayan para sa pagpili ng isang tiyak na paraan para sa paglutas ng isang tiyak na teknikal na problema.

Vibro-impact processing, kakanyahan ng proseso, saklaw, teknolohikal na kagamitan.

Superfinishing, kakanyahan ng proseso, saklaw. Pagpili ng mga sukat, paraan ng pag-aayos ng mga bar at ang kanilang pag-edit sa mga proseso ng superfinishing.

Pag-uuri ng mga pamamaraan ng surface plastic deformation (SPD), mga comparative na katangian at mga tampok ng kanilang aplikasyon. Teknolohikal na kagamitan ng mga proseso ng PPD.

Ipaliwanag ang mga termino: reference haba ng profile, reference curve ng surface profile, magbigay ng mga halimbawa ng microgeometry ng mga surface na nakuha ng iba't ibang teknolohikal na pamamaraan at ang pamamaraan para sa pagtatasa ng kanilang kapasidad ng tindig.

Matibay at nababanat na kontak sa mga proseso ng PPD, at ang teknolohikal na suporta nito. Impluwensya ng uri ng contact sa kalidad ng ibabaw na layer.

Bakit ginagamit ang vibration plastic deformation upang mapabuti ang mga parameter ng pagpapatakbo ng mga bahagi? Ikumpara ito sa tradisyunal na rolling at smoothing na walang vibrations. Mga katangian ng teknolohikal na kagamitan ng mga inihambing na pamamaraan

Ang mga phenomena na nagaganap sa ibabaw na layer ng isang bahagi sa panahon ng pagproseso ng SPD, ang mekanismo ng natitirang stress formation.

Surface at volume burnishing ng mga butas, kakanyahan ng proseso, saklaw, teknolohikal na suporta ng burnishing.

Mga paghahambing na katangian ng mga pamamaraan ng paggiling: mataas na bilis; kapangyarihan; pinagsama; integral; pagpapalakas.

Ang konsepto ng eksperimento. Mga error sa pagsukat: mga miss, sistematiko, random. Kaugnay na Nilalaman:

Mga tampok ng pag-aaral ng paksang "Algorithm" sa elementarya sa paggamit ng mga programa sa pagsasanay sa computer

Direksyon ng coursework ng paghahanda Pedagogical education. Ang layunin ng gawaing ito ay kilalanin at patunayan ang pangangailangan at pagiging epektibo ng pag-aaral ng algorithmization sa elementarya gamit ang mga programa sa pagsasanay sa kompyuter.

Topographic na mapa ng unibersal na pagkilala

Abstract. Topographic na mga larawan ng mga lugar ng lupa at tubig. Mga dayuhang topographic na mapa

Aesthetics (Aristotle at Plato)

Aristotle, mga teorya ng mimesis, ang prinsipyo ng proporsyonalidad sa pagitan ng tao at kagandahan. Musical aesthetics, Pythagorean aesthetics, Musical at mathematical harmony. Ang Idealistic Aesthetics ni Plato

Sistema ng paglalagay ng pataba sa pag-ikot ng pananim

Proyekto ng kurso ng Faculty of Agronomi. Kagawaran ng Agrochemistry at Agham ng Lupa

Enerhiya na kahusayan sa konstruksiyon. Pagpapatuyo ng init

Bahagi ng proyekto ng kurso. Thermal na kahusayan ng mga pag-install ng pagpapatayo. Mga kurtina sa hangin.

Gaano man kahalaga ang mga average na katangian, ngunit hindi gaanong mahalaga na katangian ng array ng numerical data ay ang pag-uugali ng natitirang mga miyembro ng array na may kaugnayan sa average, gaano sila naiiba mula sa average, kung gaano karaming mga miyembro ng array ang naiiba makabuluhang mula sa average. Sa pagsasanay sa pagbaril, pinag-uusapan nila ang katumpakan ng mga resulta, sa mga istatistika ay pinag-aaralan nila ang mga katangian ng scattering (scatter).

Ang pagkakaiba ng anumang halaga ng x mula sa average na halaga ng x ay tinatawag paglihis at kinakalkula bilang ang pagkakaiba x, - x. Sa kasong ito, ang paglihis ay maaaring tumagal ng parehong mga positibong halaga kung ang numero ay mas malaki kaysa sa average, at mga negatibong halaga kung ang numero ay mas mababa kaysa sa average. Gayunpaman, sa mga istatistika ay madalas na mahalaga na makapagpatakbo gamit ang isang numero na nagpapakilala sa "katumpakan" ng lahat ng mga numerical na elemento ng array ng data. Anumang pagsasama-sama ng lahat ng mga paglihis ng mga miyembro ng array ay magreresulta sa zero, dahil ang mga positibo at negatibong mga paglihis ay magkakansela sa isa't isa. Upang maiwasan ang nulling, ang mga squared differences ay ginagamit upang makilala ang scattering, mas tiyak, ang arithmetic mean ng squared deviations. Ang ganitong katangian ng scattering ay tinatawag sample na pagkakaiba-iba.

Kung mas malaki ang pagkakaiba, mas malaki ang pagpapakalat ng mga halaga ng random variable. Upang kalkulahin ang pagkakaiba, isang tinatayang halaga ng sample na mean x ay ginagamit na may margin na isang digit na nauugnay sa lahat ng miyembro ng array ng data. Kung hindi, kapag nagsusuma ng malaking bilang ng mga tinatayang halaga, isang malaking error ang maiipon. Kaugnay ng dimensyon ng mga numerical value, ang isang disbentaha ng naturang scattering index bilang sample variance ay dapat tandaan: ang unit ng pagsukat ng variance D ay ang parisukat ng yunit ng mga halaga X, na ang katangian ay dispersion. Upang mapupuksa ang pagkukulang na ito, ipinakilala ng mga istatistika ang isang nakakalat na katangian bilang sample na standard deviation , na tinutukoy ng simbolo a (basahin ang "sigma") at kinakalkula ng formula

Karaniwan, higit sa kalahati ng mga miyembro ng array ng data ay naiiba sa average ng mas mababa kaysa sa halaga ng standard deviation, i.e. nabibilang sa segment [X - a; x + a]. Kung hindi, sinasabi nila: ang average na tagapagpahiwatig, na isinasaalang-alang ang pagkalat ng data, ay x ± a.

Ang pagpapakilala ng isa pang katangian ng scattering ay nauugnay sa dimensyon ng mga miyembro ng array ng data. Ang lahat ng mga numerical na katangian sa mga istatistika ay ipinakilala upang maihambing ang mga resulta ng pag-aaral ng iba't ibang mga numerical array na nagpapakilala sa iba't ibang mga random na variable. Gayunpaman, hindi mahalaga na ihambing ang mga karaniwang paglihis mula sa iba't ibang mga average na halaga ng iba't ibang mga array ng data, lalo na kung ang mga sukat ng mga halagang ito ay magkakaiba din. Halimbawa, kung ihahambing ang haba at bigat ng anumang bagay o pagkakalat sa paggawa ng mga micro- at macro-product. Kaugnay ng mga pagsasaalang-alang sa itaas, ang isang katangian ng kamag-anak na pagkakalat ay ipinakilala, na tinatawag na koepisyent ng pagkakaiba-iba at kinakalkula ng formula

Upang kalkulahin ang mga numerical na katangian ng pagpapakalat ng mga halaga ng isang random na variable, maginhawang gamitin ang talahanayan (Talahanayan 6.9).

Talahanayan 6.9

Pagkalkula ng mga numerical na katangian ng scattering ng mga halaga ng isang random na variable

Xj- X

(Xj-X) 2 /

Sa proseso ng pagpuno sa talahanayang ito ay ang sample mean X, na gagamitin mamaya sa dalawang anyo. Bilang panghuling average na katangian (halimbawa, sa ikatlong hanay ng talahanayan) ang ibig sabihin ng sample X dapat bilugan sa pinakamalapit na digit na tumutugma sa pinakamaliit na digit ng sinumang miyembro ng numeric data array x r Gayunpaman, ang tagapagpahiwatig na ito ay ginagamit sa talahanayan para sa karagdagang mga kalkulasyon, at sa sitwasyong ito, lalo na, kapag kinakalkula sa ikaapat na hanay ng talahanayan, ang ibig sabihin ng sample X dapat na bilugan ng isang digit mula sa pinakamaliit na digit ng sinumang miyembro ng numeric data array X ( .

Ang resulta ng mga kalkulasyon gamit ang isang talahanayan tulad ng tab. 6.9 ay makakatanggap ng halaga ng sample na pagkakaiba, at upang maitala ang sagot, kinakailangan upang kalkulahin ang halaga ng karaniwang paglihis a batay sa halaga ng sample na pagkakaiba.

Ang sagot ay nagpapahiwatig: a) ang average na resulta, isinasaalang-alang ang scatter ng data sa form x±o; b) katangian ng katatagan ng data v. Dapat suriin ng sagot ang kalidad ng koepisyent ng pagkakaiba-iba: mabuti o masama.

Ang isang katanggap-tanggap na koepisyent ng pagkakaiba-iba bilang isang tagapagpahiwatig ng homogeneity o katatagan ng mga resulta sa pananaliksik sa palakasan ay 10-15%. Ang koepisyent ng pagkakaiba-iba V= 20% sa anumang pag-aaral ay itinuturing na isang napakalaking tagapagpahiwatig. Kung ang laki ng sample P> 25, pagkatapos V> Ang 32% ay isang napakasamang tagapagpahiwatig.

Halimbawa, para sa isang discrete variational series 1; 5; apat; apat; 5; 3; 3; isa; isa; isa; isa; isa; isa; 3; 3; 5; 3; 5; apat; apat; 3; 3; 3; 3; 3 tab. 6.9 ay pupunan bilang mga sumusunod (Talahanayan 6.10).

Talahanayan 6.10

Isang halimbawa ng pagkalkula ng mga numerical na katangian ng pagpapakalat ng mga halaga

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Sagot: a) ang average na katangian, na isinasaalang-alang ang scatter ng data, ay X± a = = 3 ± 1.4; b) ang katatagan ng mga nakuhang sukat ay nasa mababang antas, dahil ang koepisyent ng pagkakaiba-iba V = 48% > 32%.

Analogue ng talahanayan. Magagamit din ang 6.9 upang kalkulahin ang mga katangian ng scattering ng isang serye ng pagkakaiba-iba ng pagitan. Kasabay nito, ang mga pagpipilian x r ay papalitan ng mga kinatawan ng gaps xv at opsyon na absolute frequency f(- sa ganap na dalas ng mga gaps fv

Batay sa itaas, ang mga sumusunod ay maaaring gawin mga konklusyon.

mga konklusyon mga istatistika ng matematika ay kapani-paniwala kung ang impormasyon tungkol sa mass phenomena ay pinoproseso.

Karaniwan, ang isang sample ay pinag-aaralan mula sa pangkalahatang populasyon ng mga bagay, na dapat ay kinatawan.

Ang pang-eksperimentong data na nakuha bilang resulta ng pag-aaral ng anumang pag-aari ng mga sample na bagay ay ang halaga ng isang random na variable, dahil hindi mahuhulaan ng mananaliksik nang maaga kung aling numero ang tumutugma sa isang partikular na bagay.

Upang pumili ng isa o ibang algorithm para sa paglalarawan at pangunahing pagproseso ng pang-eksperimentong data, mahalagang matukoy ang uri ng random na variable: discrete, tuloy-tuloy, o halo-halong.

Ang mga discrete random variable ay inilalarawan ng isang discrete variational series at ang graphical na anyo nito - isang frequency polygon.

Ang magkakahalo at tuluy-tuloy na mga random na variable ay inilalarawan ng isang serye ng pagkakaiba-iba ng pagitan at ang graphical na anyo nito - isang histogram.

Kapag naghahambing ng ilang mga sample ayon sa antas ng nabuong ™ ng isang partikular na ari-arian, ang average na numerical na katangian at numerical na katangian ng dispersion ng isang random na variable na may paggalang sa average ay ginagamit.

Kapag nagkalkula karaniwang katangian mahalagang piliin ang tamang uri ng average na katangian, sapat sa lugar ng aplikasyon nito. Ang structural mean values ​​mode at median ay nagpapakilala sa istruktura ng lokasyon ng variant sa isang ordered array ng experimental data. Ginagawang posible ng quantitative mean na hatulan ang average na laki ng isang variant (sample mean).

Upang kalkulahin ang mga numerical na katangian ng scattering - sample variance, standard deviation at coefficient of variation - ang tabular method ay epektibo.

pataas