Statistikas pamatparametri. Mērījumu sērijas galvenie statistiskie raksturlielumi

Laboratorijas ziņojums

par tēmu "Statistisko datu apstrādes metodes un līdzekļi"

Pabeidza: Gaļimova A.R., gr. 4195

Pārbaudījis: Mokšins V.V.

Kazaņa, 2013

1. Individuāls uzdevums. 3

2. Eksperimentu plānošana. četri

2.1. Stratēģiskā plānošana. četri

2.1.1. D - optimālie plāni.. 5

3. ISD galvenie statistiskie raksturlielumi. astoņi

4. ISD normalitātes novērtējums. 9

5. Laika prognozēšana. 13

6. Korelācijas analīze. piecpadsmit

7. Klasteru analīze. 16

8. Faktoranalīze. 22

9. Regresijas analīze. 27

10. Dispersijas analīze. 35

11. Faktoru vērtību un darbības rādītāju optimizācija. 35

Secinājumi.. 36

Pieteikums. 37

Individuāls uzdevums

BUF1 - 3 vietām;

BUF2 - neierobežots sēdvietu skaits;

GOT - eksponenciālais likums, vidēji 20000 laika vienības;

VOSST - spec. grāfs.likums, vidēji vienā fāzē 25 vienības. laiks, numurs 3. fāze;

GT – vienots likums, 225±25 laika vienības;

RK1 - eksponenciālais likums, vidēji Х1=100 vienības. laiks;

RK2 − normāls likums, vidējais Х2=90, art. izslēgts 8 vienības vr.;

KAN1-KANМ – vienots likums, 75±15 laika vienības;

Х3=М – kanālu skaits.

KANal atlase pārsūtīšanai pēc vismazākā uzdevumu skaita, par kuriem tiek pārsūtīta informācija. Nepieejamības režīms tiek uzklāts un noņemts pa kanāliem neatkarīgi viens no otra.

Beidziet simulāciju pēc 300 uzdevumu atteikšanās (atrisināti plus kļūmes).

Optimizētie faktori: Х1 – vidējais risinājuma laiks uz PC1, Х2 – vidējais risinājuma laiks uz PC2, Х3 – kanālu skaits. X1 un X2 mainās par ± 20% no norādītajām vidējām vērtībām; X3 no 2 līdz 6.

Būvēsim modeli Arēnas sistēmā

1. att. - Arena simulācijas sistēmā iebūvēts simulācijas modelis

Eksperimentu dizains

Plānošanas mērķis ir iegūt rezultātus ar noteiktu uzticamību ar viszemākajām izmaksām. Atšķirt stratēģisko un taktisko plānošanu.

Stratēģiskā plānošana

Stratēģiskajai plānošanai izmantosim “melnās kastes” jēdzienu, kura būtība ir abstrakcija no simulētajā sistēmā notiekošo procesu fiziskās būtības un secinājumu izdošana par tās funkcionēšanu, tikai pamatojoties uz ievades un izvades mainīgajiem. Ievades, neatkarīgos mainīgos sauc par faktoriem. Izvade - atbildes, to vērtība ir atkarīga no OI faktoru un parametru vērtībām.

Faktori mūsu gadījumā ir rādītāji (parametri), kurus mēs optimizēsim; atbildes ir efektīvi simulētās sistēmas darbības efektivitātes rādītāji. Melnās kastes blokshēma ir parādīta 1. attēlā.

1. att. Melnās kastes koncepcijas blokshēma

Otrās kārtas plāni ļauj veidot atbildes funkciju kā pilnu kvadrātpolinomu, kas satur vairāk terminu nekā nepilnīgs kvadrātiskais polinoms, kas veidots no pirmās kārtas plāniem, un tāpēc ir nepieciešams veikt lielāku skaitu eksperimentu. Pilnam kvadrātiskajam polinomam m=3 ir šāda forma:

D - optimālie plāni

AT D-optimālos plānos faktoru vērtības nepārsniedz noteiktās to izmaiņu diapazonu robežas. Turklāt tiem ir vēl viena būtiska priekšrocība, nodrošinot minimālu kļūdu visā pieņemtajā faktoru izmaiņu diapazonā. Praksē visbiežāk tiek izmantoti Kono plāni un Kīfera plāni.

Rīsi. 2 Kīfera trīsfaktoru plāna ģeometriskā interpretācija uz kuba

Stratēģiskais plāns nosaka modelējamo sistēmas opciju skaitu un faktoru vērtības katrā variantā. 3 optimizētajiem faktoriem tiek piedāvāts D-optimālais plāns saskaņā ar Kīfera algoritmu, kas sastāv no 26 opcijām un ir parādīts 1. tabulā.

1. tabula - Kīfera plāns 3 faktoru eksperimentam

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

Šeit: ; ;

Mēs aprēķinām X 1 , X 2 , X 3 vērtības atbilstoši individuālajam uzdevumam. Atbilstoši individuālā uzdevuma nosacījumam optimizējamie faktori ir: Х1 – vidējais risinājuma laiks uz PC1, Х2 – vidējais risinājuma laiks uz PC2, Х3 – kanālu skaits. X1 un X2 mainās par ± 20% no norādītajām vidējām vērtībām; X3 no 2 līdz 6.

Uz PK1, eksponenciālā likuma nosacījuma, vidējais ir 100 laika vienības, tāpēc vērtība ir 0 - 100, 1-120, -1 -80 (kā mainām par ± 20% no noteiktās vidējās vērtības.

RK2 ievēro parasto likumu saskaņā ar piešķiršanas nosacījumu, un vidējā vērtība ir 90 vienības. laiks un modifikators ±20 laika vienības, tātad 0-90, 1 - 108, -1-72. Visi dati tiek ievadīti 2. tabulā.

1. tabula — dati par faktoriem X 1 , X 2 , X 3

-1
x1
x2
x3

Y 1 – PC1 izmantošanas koeficients (0÷1)*100%;

Y 2 - PK2 izmantošanas koeficients (0÷1)*100%;

Y 3 — vidējais kopējais uzdevumu izpildes laiks.

D-optimālais plāns pēc Kīfera algoritma individuālam uzdevumam un atbildes Y 1 ,Y 2 ,Y 3 uz individuālā uzdevuma faktoriem ir parādītas 3. tabulā.

2. tabula - D-optimālais plāns saskaņā ar Kīfera algoritmu (atsevišķiem uzdevumiem)

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6

4. tabula — atbildes Y 1 , Y 2 ,Y 3

Y 1 Y2 Y 3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

ISD pamatstatistikas raksturlielumi.

Galvenās statistikas pazīmes ir:

1. Derīgs N - izlases lielums;

2. Mean - vidējais aritmētiskais. Gadījuma lieluma vidējā vērtība ir tā tipiskākā, visticamākā vērtība, sava veida centrs, ap kuru ir izkaisītas visas atribūta vērtības.

3. Mediāna - mediāna. Mediāna ir nejauša mainīgā lieluma vērtība, kas visus izlases gadījumus sadala divās vienādās daļās.

4. StandardDeviation - standarta novirze. Standarta novirze (vai standarta novirze) ir pazīmes mainīguma (variācijas) mērs. Tas parāda, cik daudz gadījumu vidēji atšķiras no atribūta vidējās vērtības.

5. Variance - dispersija. Izkliede ir mainīguma, iezīmes variācijas mērs un ir gadījumu noviržu vidējais kvadrāts no pazīmes vidējās vērtības. Atšķirībā no citiem variācijas rādītājiem, dispersiju var sadalīt to veidojošajās daļās, kas ļauj novērtēt dažādu faktoru ietekmi uz pazīmes variāciju.

6. Vidējās vērtības standartkļūda Vidējās vērtības standartkļūda ir lielums, par kādu izlases vidējais atšķiras no populācijas vidējā, ja sadalījums ir tuvu normālam.

7. 95% uzticamības robežas vidējam — 95% ticamības intervāls vidējam. Intervāls, kurā iekrīt vispārējās populācijas pazīmes vidējā vērtība ar varbūtību 0,95.

8. Minimālās, maksimālās - minimālās un maksimālās vērtības.

9. Šķibums-asimetrija. Asimetrija raksturo variāciju rindas nobīdes pakāpi attiecībā pret vidējo lieluma un virziena vērtību.

10. Skewness standartkļūda – asimetrijas standartkļūda.

11. Kurtoze - pārmērība. Kurtoze raksturo gadījumu koncentrācijas pakāpi ap vidējo vērtību un ir sava veida līknes stāvuma mērs.

12. Kurtozes standartkļūda

5. tabula. Aprakstošās statistikas rezultāti


ISD normalitātes novērtējums.

Visbiežāk tiek izmantots parastais likums. To izmanto, lai attēlotu dažādus nejaušus procesus, piemēram, cilvēku dzīves ilgumu, ekonomisko un tehnisko rādītāju izmaiņas.

Izvirzīsim hipotēzi, ka sākotnējie statistikas dati ir pakļauti normālajam likumam, un par normālā likuma parametriem ņemsim pēc formulām aprēķinātās matemātiskās cerības un standartnovirzes aprēķinus.

Parastā likuma blīvuma funkcijai ir šāda forma:

; .

Ja ticamības koeficients P empīriskā sadalījuma normalitātes pieņēmumā, kas atrodams no statistikas tabulām, nav mazāks par 0,20, tad normalitātes pieņēmums netiek noraidīts. Ja P līdz<0,20, то предположение о нормальности рекомендуется отвергнуть.

Empīriskā un hipotētiskā sadalījuma atbilstību var vizuāli izsekot no grafikiem. Izmantojot Kolmogorova atbilstības kritēriju, vēlams izmantot sadalījuma funkcijas. Šādi grafiki ir veidoti un izdoti īpašās PPP Statistica 6.0 un Excel 2007 programmatūras procedūrās, uz kurām tiek orientēti aprēķini atbilstoši norādītajam matemātiskajam aparātam. Iedomāsimies mainīgo lielumu sadalījumu uz histogrammām (3.-8. att.).

Normālā sadalījuma blīvums tiek uzlikts uz histogrammām, lai pārbaudītu sadalījuma tuvumu normālajai formai, izmantojot Kolmogorova-Smirnova kritēriju.


Līdzīga informācija.


MASKAVAS PILSĒTAS IZGLĪTĪBAS DEPARTAMENTS

VALSTS BUDŽETA PROFESIONĀLĀS IZGLĪTĪBAS IESTĀDE

KOMUNIKĀCIJAS KOLEDŽA № 54, nosaukta P.M. vārdā. VOSTRUKHINA

Statistiskie raksturlielumi.

Pamācība nodarbības 1. daļai.

Izstrādātājs:

Matemātikas skolotājs

T.N. Rudziņa


- tas ir matemātiskie jēdzieni , kas apraksta datu kopas atšķirīgās iezīmes un īpašības iegūti novērojumos vai kādā citā veidā. Raksturlielumu nozīme slēpjas arī tajā, ka tās "pamudināt" , no kādām pozīcijām ir lietderīgi analizēt pieejamo datu kopumu .

Statistiskās pazīmes ietver:

vidēji , darbības jomu , mode , mediāna .

Apsveriet piemēru:

Pētot skolēnu mācību slodzi, tika izcelta 12 septītklasnieku grupa. Viņiem tika lūgts noteiktā dienā reģistrēt laiku (minūtēs), ko viņi pavadīja, pildot algebras mājasdarbus. Mēs saņēmām šādus datus:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Izmantojot šo datu sēriju, var noteikt b, cik minūtes vidēji skolēni tērēja mājasdarbiem algebrā.

Lai to izdarītu, šie skaitļi ir jāsaskaita un summa jādala ar 12:


Numurs 27 iegūto sauc vidējais aritmētiskais uzskatīta skaitļu sērija.

Definīcija :

vidējais aritmētiskais skaitļu sēriju sauc par šo skaitļu summas dalījumu ar vārdu skaitu.

Parasti vidējo aritmētisko nosaka, kad vēlas noteikt vidējo vērtību noteiktai datu virknei: kviešu vidējā raža no 1 hektāra platībā, vidējais diennakts izslaukums no vienas govs saimniecībā, vidējā alga vienai govs. brigādes strādnieks maiņā utt. Ņemiet vērā, ka vidējais aritmētiskais tiek atrasts tikai viendabīgām vērtībām. Nav jēgas, piemēram, izmantot graudu un meloņu kultūru vidējo ražu kā vispārīgu rādītāju. Turklāt pat viendabīgām vērtībām vidējā aritmētiskā aprēķins dažkārt ir bezjēdzīgs, piemēram, konstatējot vidējo pacientu temperatūru slimnīcā, vidējo apavu izmēru ...


Aplūkotajā piemērā mēs atklājām, ka vidēji skolēni algebrā mājasdarbu pildīšanai pavadīja 27 minūtes. Taču, analizējot iepriekš minēto datu sēriju, redzams, ka dažu skolēnu pavadītais laiks būtiski atšķiras no 27 minūtēm, t.i. no vidējā aritmētiskā. Lielākais patēriņš ir 37 minūtes, bet mazākais - 18 minūtes. Atšķirība starp lielāko un mazāko laika patēriņu ir 19 minūtes. Šajā gadījumā viņi tā saka darbības jomu rinda ir 19.

Definīcija :

lielā veidā rinda skaitļus sauc par starpību starp lielāko un mazāko no šiem skaitļiem.

Diapazons tiek atrasts, kad viņi vēlas noteikt, cik liela ir datu izplatība sērijā.


Analizējot informāciju par laiku, ko septītās klases skolēni pavada, pildot mājasdarbus algebrā, mūs varētu interesēt ne tikai vidēji un darbības jomu iegūtās datu rindas, bet arī citus rādītājus. Interesanti, piemēram, uzzināt, kāds laika patēriņš ir raksturīgs izvēlētai skolēnu grupai, t.i. kāds ir biežākais skaitlis datu rindā. Ir viegli redzēt, ka skaitlis 25 ir tāds skaitlis. Saka, ka skaitlis 25 ir mode apskatāmā sērija.

Definīcija :

Mode skaitļu sērija ir skaitlis, kas šajā sērijā parādās visbiežāk .

Ciparu sērijai var būt vairāk nekā viens mode vai nav mode pavisam.

Piemēram, skaitļu virknē 47, 46, 50, 52, 47, 52, 49, 45, 43, 53, divi mode ir skaitļi 47 un 52 , jo katrs no šiem cipariem ir sastopams divas reizes, bet pārējie skaitļi parādās virknē mazāk nekā divas reizes, un skaitļu sērijās 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 - mode Nē.


Apskatīsim citu statistiku.

Sāksim ar piemēru. Tabulā parādīts deviņu dzīvokļu iedzīvotāju elektroenerģijas patēriņš janvārī

Izveidosim sakārtotu sēriju no tabulā norādītajiem datiem:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

Rezultātā sakārtotajā sērijā ir deviņi skaitļi. Nav grūti pamanīt, ka cipars 78 atrodas rindas vidū: pa kreisi no tā ir rakstīti četri skaitļi, bet pa labi. Viņi saka, ka numurs 78 ir vidējais skaitlis vai, citādi, mediāna, aplūkojamā sakārtotā skaitļu sērija (no latīņu vārda mediana kas nozīmē "vidēji"). Šis skaitlis arī tiek ņemts vērā mediāna sākotnējā datu sērija.


Tagad ņemsim citu piemēru. Pieņemsim, ka, apkopojot datus par elektroenerģijas patēriņu, norādītajiem deviņiem dzīvokļiem tika pieskaitīta desmitā daļa. Mēs saņēmām šādu tabulu:

Tāpat kā pirmajā gadījumā, mēs uzrādam saņemtos datus kā sakārtotu skaitļu sēriju:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

Šai skaitļu sērijai ir pāra dalībnieku skaits, un sērijas vidū ir divi skaitļi: 78 un 82 .

Numurs 80 , nebūdams sērijas dalībnieks, sadala šo sēriju divās vienāda lieluma grupās: pa kreisi no tās ir pieci sērijas dalībnieki un pa labi ir arī pieci sērijas dalībnieki:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Viņi saka, ka šajā gadījumā apskatāmo sakārtoto sēriju mediāna, kā arī tabulā ierakstītās sākotnējās datu sērijas ir skaitlis 80 .

Definīcija :

mediāna sakārtots skaitļu virkni ar nepāra dalībnieku skaitu sauc par numuru, kas ierakstīts vidū, un mediāna sakārtotu skaitļu virkni ar nepāra locekļu skaitu sauc par divu vidū ierakstītu skaitļu vidējo aritmētisko.

mediāna patvaļīgi skaitļu sēriju sauc par atbilstošās sakārtotās sērijas mediānu.


Ja pasūtītā numuru sērija satur 2 n -1 dalībnieki, tad sērijas mediāna ir n biedrs, kopš n – 1 locekļi piestājas n biedrs un n – 1 biedri - pēc n biedrs.

Ja pasūtītā sērija satur 2 n locekļi, tad mediāna ir to dalībnieku vidējais aritmētiskais rādītājs, uz kura stāv n-m un n + 1 -tās vietas.

Katrā no iepriekš minētajiem piemēriem, definējot mediāna, varam norādīt dzīvokļa numuru, kuram iedzīvotāju elektroenerģijas patēriņš pārsniedz mediānu, t.i. mediāna .

Apskatīsim vēl vienu piemēru.

Zināms, ka 34 nodaļas darbinieki iegādājās noteiktas akciju sabiedrības akcijas. Dati par darbinieku iegādāto akciju skaitu tiek parādīti šādā secībā:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Atradīsim mediānašī rinda. Tā kā sērijā ir 34 skaitļi, tad mediāna ir vienāds ar 17. un 18. termina vidējo aritmētisko, t.i. ir vienāds ar (3 + 4) : 2 = 3,5

Datortehnika vidēji no šīs sērijas mēs atklājam, ka tas ir aptuveni vienāds ar 6,2, t.i. vidēji departamenta darbinieki iegādājās aptuveni 6 akcijas katrs. Mēs to redzam šajā gadījumā mediāna labāk atspoguļo reālo situāciju, jo visi darbinieki, izņemot vienu, iegādājās ne vairāk kā 4 akcijas.

Rādītāji, piemēram, vidēji , mode un mediānas a, dažādos veidos raksturo novērojumu rezultātā iegūtos datus. Tāpēc praksē, analizējot datus, atkarībā no konkrētās situācijas tiek izmantoti vai nu visi trīs rādītāji, vai daži no tiem.

Ja, piemēram, analizē datus par vairāku tūrisma firmu gada ienākumiem pilsētā, tad ērti izmantot visus trīs rādītājus. Vidēji parādīs uzņēmumu vidējos gada ienākumus, mode raksturos tipisku gada ienākumu rādītāju, mediāna identificēs tūrisma kompānijas, kuru gada ienākumi ir zem vidējā.

Ja pētāt datus par noteiktā dienā universālveikalā pārdoto vīriešu apavu izmēru, tad ir ērti izmantot tādu rādītāju kā mode, kas raksturo izmēru, kas ir vispieprasītākais. Atrastšajā gadījumā vidēji vai mediāna nav jēgas .

Analizējot dalībnieku uzrādītos rezultātus peldējumā 100 distancē, vispieņemamākais raksturlielums ir mediāna. Zināšanas mediānasļaus atvēlēt dalībai sacensībās sportistu grupu, kas uzrādījuši rezultātus virs vidējā.

Statistiskie raksturlielumi : vidēji , Maud a, mediāna sauca vidējie mērījumu rezultāti .

Klase: 7

Prezentācija nodarbībai

















Atpakaļ uz priekšu

Uzmanību! Slaida priekšskatījums ir paredzēts tikai informatīviem nolūkiem, un tas var neatspoguļot visu prezentācijas apjomu. Ja jūs interesē šis darbs, lūdzu, lejupielādējiet pilno versiju.

Mērķi:

  • iepazīstināt ar galvenajiem statistiskajiem raksturlielumiem (vidējais aritmētiskais, diapazons, rindas režīms);
  • iemācīties atrast rindas vidējo aritmētisko, diapazonu, režīmu;
  • veicināt skolēnu uzmanības, loģiskās domāšanas, novērošanas attīstību;
  • veicināt ekonomiski apzinātas attieksmes veidošanos pret apkārtējo pasauli.

Materiāls atbalsts:
multimediju projektors, kartes patstāvīgam darbam.
NODARBĪBU LAIKĀ
1. Mājas darbs: 9, Nr. 168, 172, 178 (mācību grāmata "Algebra. 7. klase" S. A. Teljakovska redakcijā, Maskavas "Prosveščenie", 2009)

2. Nodarbības tēmas vēstījums.

2.1. Krustvārdu mīklas atrisināšana:

  1. Papildināšanas darbības rezultāts (summa).
  2. Vienādība ir patiesa jebkurai mainīgā vērtībai (identitāte).
  3. Punkta koordināte gar x asi (abscisa).
  4. Pierādījuma paziņojums (teorēma).
  5. Jāatrod nezināms elements (obligāti).
  6. Pievienojiet darbības komponentu (jēdziens).
  7. Vienkāršākā ģeometriskā figūra (punkts).
  8. Dators ir rīks glabāšanai, apstrādei un pārsūtīšanai... (informācija).
  9. Kuboīds ar vienādiem izmēriem (kubs).
  10. Noteikta procedūra (algoritms).

2.2. Izlasiet vārdu, ko veido uzminēto vārdu pirmie burti. (Statistika)

Ko jūs domājat par statistiku?
Statistika ir zinātne, kas nodarbojas ar kvantitatīvu datu iegūšanu, apstrādi un analīzi par dažādām dabā un sabiedrībā notiekošām parādībām. (2. slaids)
ekonomikas statistika pēta cenu izmaiņas, preču piedāvājumu un pieprasījumu, prognozē pieprasījumu un ražošanas un patēriņa samazināšanos.
medicīniskā statistika pēta dažādu medikamentu un ārstēšanas līdzekļu efektivitāti, noteiktas slimības iespējamību atkarībā no vecuma, dzimuma, iedzimtības, dzīves apstākļiem, kaitīgiem ieradumiem, prognozē epidēmiju izplatību.
Demogrāfisks statistika pēta dzimstību, iedzīvotāju skaitu, tās sastāvu (vecums, valsts, profesionālais).
Un tad ir finanšu, nodokļu, bioloģiskā, meteoroloģiskā utt statistika.
Ir noteiktas metodes informācijas apstrādei. (3. slaids)
Matemātikas sadaļu, kas veltīta statistikas datu apstrādes un analīzes metodēm un noteikumiem, sauc par matemātisko statistiku. (4. slaids)

2.3. Nodarbības tēma.

- Šodien mēs iepazīsimies ar dažiem statistiskajiem raksturlielumiem, mācīsimies tos noteikt. (5. slaids).

3. Jauna materiāla apgūšana.

3.1. – Apsveriet datus par kviešu ražošanu Krievijā no 1995. līdz 2001. gadam. (6. slaids)

1995. gads - 30,1 milj.t;
1996. gads - 34,9 milj.t;
1997. gads - 44,3 milj.t;
1998. gads - 27 milj.t;
1999. gads - 31 milj.t;
2000 - 34,5 milj.t;
2001. gads - 47 milj.t.

– Kā redzat, kviešu produkcija gadu no gada atšķiras. Kāpēc tu domā?
– Jā, tas ir atkarīgs no laika apstākļiem, stādīšanas platības, sēklu kvalitātes un citiem apstākļiem. Līdz ar to kviešu produkcija 1 gadā nesniedz pilnīgu priekšstatu par kviešu ražošanas līmeni valstī. Šim nolūkam labāk ir izmantot vidējo vērtību vairāku gadu garumā. Pēc tabulas varam aprēķināt vidējo kviešu produkciju 7 gadiem. Kā es to varu izdarīt?
(30,1 + 34,9 + 44,3 + 27 + 31 + 34,5 + 47) : 7 = 35,5 (7. slaids)
– Ko mēs atradām? (vidēji)
- Vidējais aritmētiskais ir viens no skaitļu sērijas statistiskajiem raksturlielumiem. Ierakstiet šī jēdziena definīciju savā piezīmju grāmatiņā. (8. slaids)
Ciparu sērijas vidējais aritmētiskais ir šo skaitļu summas dalījums ar to skaitu.
– Kurā gadā kviešu produkcija bija vistuvāk vidējam rādītājam? (1996. gadā)

3.2. Pabeigt uzdevumus (9. slaids):

1) Aprēķiniet skaitļu 6, 10, 16 un 20 vidējo aritmētisko. (6 + 10 + 16 + 20) : 4 = 52 : 4 = 13
2) Visi skaitļi ir vienādi viens ar otru. Kāpēc viņu vidējais aritmētiskais ir agrs? (Uz šo numuru.)
3) Vai vidējais aritmētiskais var nesakrist ar kādu no skaitļiem dotajā rindā? (Jā)
4) Padomājiet par trim skaitļiem, kuru vidējais aritmētiskais ir tāds pats kā otrajam lielākajam skaitlim.

3.3. Vienā no septītajām klasēm zēniem tika mērīts augums. Mēs saņēmām šādus datus:
155 cm, 167 cm, 159 cm, 168 cm, 161 cm, 170 cm, 162 cm, 153 cm, 165 cm. (10. slaids) Atrodiet šīs skaitļu sērijas vidējo aritmētisko.
(155 + 167 + 159 + 168 + 161 + 170 + 162 + 153 + 165) : 9 = 1460: 9 = 162,(2) = 162
Cik garš ir garākais zēns šajā klasē? (170 cm)
- Īsākais zēns? (153 cm)
- Atrodi puišu auguma atšķirību?
170–153 = 17 (cm)
Atšķirību starp datu sērijas lielāko un mazāko vērtību sauc par sērijas diapazonu, un tā ir arī viens no statistikas raksturlielumiem. (11. slaids)
- Ierakstiet definīciju savā piezīmju grāmatiņā.

3.4. Petja un Vasja strīdējās, kurš ir labāks tāllēkšanā stāvus. Lai izvairītos no nejaušības, viņi nolēma, ka viņi pārmaiņus lēks 5 reizes. (12. slaids) Viņi ierakstīja savu lēcienu rezultātus tabulā. (13. slaids):

lēciena numurs

- Kāds katras rindas statistiskais raksturojums jānosaka, lai noskaidrotu, kurš no puišiem lec tālāk? (vidēji)
- Uzzini.

Pēteris: (190 + 205 + 195 + 210 + 210) : 5 = (190 + 400 + 420) : 5 = 1010: 5 = 202 (cm)
Vasja: (185 + 200 + 215 + 190 + 190): 5 = (600 + 380): 5 = 980: 5 = 196 (cm)

Secinājums: Petja lec tālāk par Vasju.
- Izmantojiet šo tabulu, lai atrastu atšķirību starp katra zēna labākajiem un sliktākajiem rezultātiem (sērijas diapazons).
Pēteris: 210 - 190 = 20 (cm); Vasja: 215–185 = 30 (cm)
– Vai var teikt, ka Petja lec stabilāk? (Jā)

3.5. Kādā no septītajām klasēm viņi nolēma noskaidrot, kāda izmēra apavus valkā šīs klases meitenes. (14. slaids) Mēs saņēmām šādus rezultātus:

35, 39, 37, 36, 38, 37, 38, 36, 37, 37, 38, 37, 37.

Kāds ir visizplatītākais apavu izmērs? (37)
Rindas numuru, kas attiecīgajā rindā parādās visbiežāk, sauc par rindas režīmu.. (15. slaids)
- Ierakstiet šo definīciju savā piezīmju grāmatiņā.

3.6. (16. slaids)

1) Vai kādai skaitļu sērijai ir režīms? (Nav)
2) Vai skaitļu sērijai var būt vairāk nekā viens režīms? (Jā)
3) Vai skaitļu sērijas režīms var nesakrist ar kādu no šiem skaitļiem? (Nav)

3.7. (17. slaids)

Dota skaitļu rinda: 7, 8, 9, 7, 7, 6, 7, 6, 9, 7. Atrodiet šīs rindas vidējo aritmētisko, režīmu un diapazonu.
Vidējais aritmētiskais: (7 + 8 + 9 + 7 + 7 + 6 + 7 + 6 + 9 + 7): 10 = 73: 10 = 7,3.
Mode: 7.
Diapazons: 9–6 = 3.

4. Patstāvīgais darbs

1. iespēja.

  1. Atrodiet skaitļu sērijas vidējo aritmētisko vērtību: 18, 11, 20, 19, 2, 10.
  2. Nosakiet skaitļu sērijas režīmu: 12, 13, 13, 15, 19, 13, 12, 14, 12, 14, 13.
  3. Aprēķiniet skaitļu sērijas diapazonu: 31, 14, 25, 18, 29, 11, 16.
  4. Atrodiet skaitļu sērijas vidējo aritmētisko, diapazonu un režīmu: 21, 21, 21, 21, 21, 21, 21.
  5. Ceturkšņa laikā Ļena algebrā saņēma šādas atzīmes: trīs divniekus, divus trijniekus, četrus četriniekus un vienu piecinieku. Kādam statistiskajam raksturlielumam Lena dotu priekšroku, sniedzot ceturkšņa novērtējumu: vidējais aritmētiskais, diapazons vai rindas režīms?

2. iespēja.

  1. Atrodiet skaitļu sērijas vidējo aritmētisko vērtību: 21, 5, 18, 19, 15, 12.
  2. Nosakiet skaitļu sērijas režīmu: 18, 17, 17, 15, 11, 17, 18, 16, 18, 16, 17.
  3. Aprēķiniet skaitļu sērijas diapazonu: 29, 16, 25, 12, 19, 11, 14.
  4. Atrodiet skaitļu sērijas vidējo aritmētisko, diapazonu un režīmu: 15, 15, 15, 15, 15, 15, 15.
  5. Ceturkšņa laikā Ļena algebrā saņēma šādas atzīmes: divus divniekus, trīs trīsniekus, sešus četriniekus un divus pieciniekus. Kādam statistiskajam raksturlielumam Lena dotu priekšroku, sniedzot ceturkšņa novērtējumu: vidējais aritmētiskais, diapazons vai rindas režīms?

5. Nodarbības rezumēšana. (18. slaids)

1) Kādus statistiskos raksturlielumus mēs satikām nodarbībā?
2) Kā atrast skaitļu sērijas vidējo aritmētisko?
3) Kā tiek atrasts skaitļu sērijas diapazons?
4) Ko parāda skaitļu sērijas režīms?

Atsauces:

  1. Mācību grāmata "Algebra. 7. klase, S. A. Teljakovska redakcija, Maskava, Apgaismība, 2009;
  2. Ju. N. Tjurins, A. A. Makarovs, I. R. Visockis, I. V. Jaščenko"Varbūtību teorija un statistika", MTSNMO AS "Maskavas mācību grāmatas", Maskava, 2004;
  3. G. N. Ivanova, www.openclass.ru ;
  4. "Matemātikas statistika"; kl10sch55.narod.ru;
  5. s21.my1.ru/metodi/tema uroka stat kharak 7 klase.doc

Mērķis: iemācīties apstrādāt statistikas datus izklājlapās, izmantojot iebūvētās funkcijas; Izpētiet analīzes pakotnes funkcijasJAUNKUNDZE Excel2010 un daži no tā rīkiem: nejaušo skaitļu ģenerēšana, histogramma, aprakstošā statistika.

Teorētiskā daļa

Ļoti bieži, lai apstrādātu datus, kas iegūti, pārbaudot lielu skaitu objektu vai parādību ( statistikas dati), tiek izmantotas matemātiskās statistikas metodes.

Mūsdienu matemātiskā statistika ir sadalīta divās plašās jomās: aprakstošs un analītiskā statistika. Aprakstošā statistika aptver metodes statistikas datu aprakstīšanai, to uzrādīšanai tabulu, sadalījumu utt.

Analītisko statistiku sauc arī par statistisko secinājumu teoriju. Tās priekšmets ir eksperimenta laikā iegūto datu apstrāde un secinājumu formulēšana, kas ir lietišķi svarīgi dažādām cilvēka darbības jomām.

Aptaujas rezultātā iegūto skaitļu kopu sauc statistikas apkopojums.

paraugu ņemšanas komplekts(vai paraugu ņemšana) ir nejauši atlasītu objektu kopa. Vispārējā populācija ir objektu kopa, no kuras izgatavots paraugs. Apjoms kopa (vispārīga vai paraugs) ir objektu skaits šajā kopā.

Statistiskai apstrādei objektu izpētes rezultāti tiek uzrādīti skaitļu veidā x 1 ,x 2 ,…, x k. Ja vērtība x 1 novērots n 1 reizi, vērtība x 2 novērotas n 2 reizes utt., tad novērotās vērtības x i sauca iespējas un to atkārtojumu skaitu n i sauca frekvences. Frekvenču skaitīšanas procedūru sauc par datu grupēšanu.

Parauga lielums n ir vienāds ar visu frekvenču summu n i :

Relatīvais biežums vērtības x i sauc par šīs vērtības frekvences attiecību n i uz parauga lielumu n:

. (2)

Statistiskais biežuma sadalījums(vai vienkārši frekvenču sadalījums) sauc par opciju sarakstu un to atbilstošo biežumu, kas uzrakstīts tabulas veidā:

Relatīvais frekvenču sadalījums sauc par opciju sarakstu un to attiecīgajām relatīvajām frekvencēm.

1. Galvenie statistiskie raksturlielumi.

Mūsdienu izklājlapām ir milzīgs rīku komplekts statistikas datu analīzei. Visbiežāk lietotās statistikas funkcijas ir iebūvētas programmas galvenajā kodolā, tas ir, šīs funkcijas ir pieejamas no programmas palaišanas brīža. Citas specializētākas funkcijas ir iekļautas papildu rutīnās. Konkrēti, programmā Excel šādu rutīnu sauc par analīzes rīkkopu. Analīzes pakotnes komandas un funkcijas sauc par analīzes rīkiem. Mēs aprobežosimies ar dažām pamata iebūvētajām statistikas funkcijām un visnoderīgākajiem analīzes rīkiem no Excel izklājlapas analīzes komplekta.

Vidēji.

Funkcija AVERAGE aprēķina izlases (vai vispārīgo) vidējo, tas ir, izlases (vai vispārējās) kopas pazīmes vidējo aritmētisko. Funkcijas AVERAGE arguments ir skaitļu kopa, kas parasti tiek norādīta kā šūnu diapazons, piemēram, = VIDĒJAIS(A3:A201).

Dispersija un standartnovirze.

Lai novērtētu datu izkliedi, tiek izmantoti statistikas raksturlielumi, piemēram, dispersija D un vidējā kvadrātiskā (vai standarta) novirze . Standarta novirze ir dispersijas kvadrātsakne:
. Liela standarta novirze norāda, ka mērījumu vērtības ir plaši izkliedētas ap vidējo, savukārt neliela standarta novirze norāda, ka vērtības ir grupētas ap vidējo.

AT Excel ir funkcijas, kas atsevišķi aprēķina izlases dispersiju D iekšā un standarta novirze iekšā un vispārējā dispersija D r un standarta novirze d) Tāpēc pirms dispersijas un standarta novirzes aprēķināšanas jums skaidri jānosaka, vai jūsu dati ir kopa vai izlase. Atkarībā no tā, jums ir jāizmanto aprēķinam D d un G, D iekšā un iekšā .

Lai aprēķinātu izlases dispersiju D iekšā un parauga standartnovirze iekšā VARI) un STDEV funkcijas ir pieejamas. Šo funkciju arguments ir skaitļu kopa, ko parasti norāda šūnu diapazons, piemēram, =VAR(B1:B48).

Lai aprēķinātu vispārējo dispersiju D r un vispārējā standartnovirze d ir attiecīgi funkcijas VARP un STDEV.

Šo funkciju argumenti ir tādi paši kā izlases dispersijai.

Iedzīvotāju skaits.

Izlases vai vispārējās kopas apjoms ir elementu skaits populācijā. Funkcija COUNT nosaka šūnu skaitu noteiktā diapazonā, kas satur skaitliskus datus. Funkcija COUNT ignorē tukšas šūnas vai šūnas, kas satur tekstu. Funkcijas COUNT arguments ir šūnu intervāls, piemēram: = COUNT (С2:С16).

Lai noteiktu netukšo šūnu skaitu neatkarīgi no to satura, tiek izmantota funkcija COUNT3. Tās arguments ir šūnu diapazons.

Režīms un mediāna.

Režīms ir objekta vērtība, kas datu kopā parādās biežāk nekā citi. To aprēķina, izmantojot funkciju MODE. Tās arguments ir šūnu intervāls ar datiem.

Mediāna ir objekta vērtība, kas sadala populāciju divās daļās, kas vienādas ar elementu skaitu. To aprēķina, izmantojot funkciju MEDIAN. Tās arguments ir šūnu diapazons.

Variāciju diapazons. Lielākās un mazākās vērtības.

Variāciju diapazons R ir atšķirība starp lielāko x populācijas zīmes max un mazākās x min vērtības (vispārīgi vai izlases): R=x max- x min. Lai atrastu augstāko vērtību x max ir MAX (vai MAX) funkcija, un mazākajam x min ir MIN (vai MIN) funkcija. Viņu arguments ir šūnu intervāls. Lai aprēķinātu datu variācijas diapazonu šūnu intervālā, piemēram, no A1 līdz A100, ievadiet formulu: =MAX (A1:A100)-MIN (A1:A100).

Nejaušā sadalījuma novirze no normālās.

Praksē plaši tiek izmantoti normāli sadalīti gadījuma lielumi, piemēram, jebkura fiziska lieluma mērījumu rezultāti pakļaujas normālā sadalījuma likumam. Normāls ir nepārtraukta gadījuma lieluma varbūtības sadalījums, ko raksturo blīvums

,

kur
dispersija, - nejauša lieluma vidējā vērtība .

Lai novērtētu eksperimentālo datu sadalījuma novirzi no normālā sadalījuma, tiek izmantoti tādi raksturlielumi kā asimetrija BET un kurtosis E. Normālam sadalījumam BET=0 un E=0.

Šķibums parāda, cik ļoti datu sadalījums ir asimetrisks attiecībā pret normālo sadalījumu: ja BET>0, tad lielākajai daļai datu ir vērtības, kas pārsniedz vidējo ; ja BET<0, то большая часть данных имеет значения, меньшие среднего . Asimetriju aprēķina, izmantojot RMSK funkciju. Tās arguments ir šūnu diapazons ar datiem, piemēram, =SKOS(A1:A100).

Kurtosis vērtē "vēsumu", t.i. eksperimentālo datu sadalījuma maksimuma lielāka vai mazāka pieauguma vērtība salīdzinājumā ar normālā sadalījuma maksimumu. Ja E>0, tad eksperimentālā sadalījuma maksimums ir lielāks par normālo; ja E<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

1. vingrinājums.Statistisko funkciju pielietojums

Tas pats voltmetrs izmērīja 25 reizes lielāku spriegumu ķēdes sadaļā. Eksperimentu rezultātā tika iegūtas šādas sprieguma vērtības voltos: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. Atrodiet izlases vidējo vērtību, dispersiju, standartnovirzi, diapazonu, režīmu, mediānu. Pārbaudiet novirzi no normālā sadalījuma, aprēķinot šķībumu un kurtozi.

    Ierakstiet eksperimenta rezultātus kolonnā A.

    Šūnā B1 ierakstiet "Vidējā", B2 - "izlases dispersija", B3 - "standarta novirze", B4 - "Maksimums", B5 - "Minimums", B6 - "Variācijas diapazons", B7. - " Mode", B8 - "Mediāna", B9 - "Asimetrija", B10 - "Kurtosis". Pamatojiet šīs kolonnas platumu ar Automātiskā atbilstība platums.

    Atlasiet šūnu C1 un formulas joslā noklikšķiniet uz zīmes "=". Izmantojot Funkciju vedņi kategorijā Statistikas atrodiet funkciju AVERAGE, pēc tam atlasiet šūnu diapazonu ar datiem un nospiediet Ievadiet.

    Atlasiet šūnu C2 un formulas joslā noklikšķiniet uz zīmes "=". Ar palīdzību Funkciju vedņi kategorijā Statistikas atrodiet funkciju VARP, pēc tam iezīmējiet šūnu intervālu ar datiem un nospiediet Ievadiet.

    Dariet to pašu, lai aprēķinātu standarta novirzi, maksimālo, minimālo, režīmu, vidējo, šķībumu un kurtozi.

    Lai aprēķinātu variāciju diapazonu šūnā C6, ievadiet formulu: \u003d MAX (A1: A25) -MIN (A1: A25).

Galvenie statistiskie raksturlielumi ir sadalīti divās galvenajās grupās: centrālās tendences mēri un variācijas raksturlielumi.

Izlases centrālā tendenceļauj novērtēt tādus statistiskos raksturlielumus kā vidējais aritmētiskais, režīms, mediāna.

Visvieglāk iegūstamais centrālās tendences mērs ir režīms. Mode (Mo) ir vērtība novērojumu kopā, kas notiek visbiežāk. Vērtību kopā (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) režīms ir 9, jo tas notiek biežāk nekā jebkura cita vērtība. Gadījumā, ja visas vērtības grupā sastopamas vienlīdz bieži, tiek uzskatīts, ka šai grupai nav režīma.

Ja divām blakus esošām vērtībām ranžētā sērijā ir vienāda frekvence un tās ir lielākas par jebkuras citas vērtības biežumu, režīms ir abu vērtību vidējā vērtība.

Ja grupā divām vērtībām, kas nav blakus esošajām, ir vienādas frekvences un tās ir lielākas par jebkuras vērtības frekvencēm, tad ir divi režīmi (piemēram, vērtību kopā 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 režīmi ir 11 un četrpadsmit); šādā gadījumā mērījumu vai aplēšu grupa ir bimodāls.

Lielākais režīms grupā ir vienīgā vērtība, kas atbilst režīma definīcijai. Tomēr visā grupā var būt vairāki mazāki režīmi. Šie mazākie režīmi atspoguļo frekvences sadalījuma lokālos maksimumus.

Mediāna (es) ir mērījumu rezultātu diapazona sērijas vidusdaļa. Ja datos ir pāra skaits atšķirīgu vērtību, tad mediāna ir punkts, kas atrodas pa vidu starp abām centrālajām vērtībām, kad tās ir sakārtotas.

Vidējais aritmētiskais nesakārtotai mērījumu sērijai aprēķina pēc formulas:

kur . Piemēram, datiem 4.1; 4,4; 4,5; 4,7; 4.8 Aprēķiniet:

.

Katrs no iepriekš aprēķinātajiem centra mēriem ir vispiemērotākais lietošanai noteiktos apstākļos.

Režīms tiek aprēķināts visvienkāršāk - to var noteikt ar aci. Turklāt ļoti lielām datu grupām tas ir diezgan stabils izplatīšanas centra mērs.

Mediāna ieņem starpposmu starp režīmu un vidējo tā aprēķināšanas ziņā. Šis rādītājs ir īpaši viegli iegūstams ranžētu datu gadījumā.

Vidējais datu kopums galvenokārt ietver aritmētiskas darbības.

Vidējo vērtību ietekmē visu rezultātu vērtības. Mediānai un režīmam nav jādefinē visas vērtības. Apskatīsim, kas notiek ar vidējo, vidējo un režīmu, kad maksimālā vērtība dubultojas šādā kopā:

1. komplekts: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

2. komplekts: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

Vidējās vērtības lielumu īpaši ietekmē rezultāti, kurus sauc par “ārpusējiem”, t.i. dati, kas atrodas tālu no aplēšu grupas centra.

Režīma, mediānas vai vidējā aprēķināšana ir tīri tehniska procedūra. Tomēr šo trīs pasākumu izvēle un to interpretācija bieži vien prasa pārdomāt. Atlases procesā ir jāiestata:

– mazās grupās mode var būt pilnīgi nestabila. Piemēram, grupas režīms: 1, 1, 1, 3, 5, 7, 7, 8 ir 1; bet, ja viens no tiem pārvēršas par nulli, bet otrs par diviem, tad režīms būs vienāds ar 7;

– mediānu neietekmē “lielo” un “mazo” vērtības. Piemēram, 50 vērtību grupā mediāna nemainīsies, ja lielākā vērtība trīskāršojas;

– katra vērtība ietekmē vidējo vērtību. Ja kāda vērtība mainās par c vienībām, mainīsies tajā pašā virzienā par c/n vienībām;

– Dažām datu kopām nav centrālās tendences, kas bieži vien ir maldinoša, aprēķinot tikai vienu centrālās tendences mērījumu. Tas jo īpaši attiecas uz grupām ar vairāk nekā vienu režīmu;

– ja datu grupa tiek uzskatīta par izlasi no lielas simetriskas grupas, izlases vidējais lielums, visticamāk, būs tuvāk lielās grupas centram nekā mediāna un režīms.

Visi vidējie raksturlielumi sniedz vispārīgu raksturlielumu vairākiem mērījumu rezultātiem. Praksē mūs bieži interesē, cik tālu katrs rezultāts atšķiras no vidējā. Tomēr ir viegli iedomāties, ka divām mērījumu rezultātu grupām ir vienādas vidējās, bet atšķirīgas mērījumu vērtības. Piemēram, sērijai 3, 6, 3 - vidējā vērtība = 4; 5., 2., 5. sērijai arī vidējā vērtība = 4, neskatoties uz būtisku atšķirību starp šīm sērijām.

Tāpēc vidējie raksturlielumi vienmēr jāpapildina ar variācijas jeb nepastāvības rādītājiem.

Uz īpašībām variācijas, vai nepastāvība, mērījumu rezultāti ietver variācijas diapazonu, dispersiju, standartnovirzi, variācijas koeficientu, vidējā aritmētiskā standarta kļūdu.

Vienkāršākā variācijas īpašība ir variāciju diapazons. To definē kā starpību starp lielāko un mazāko mērījumu rezultātu. Tomēr tas fiksē tikai ārkārtējas novirzes, bet neatspoguļo visu rezultātu novirzes.

Lai sniegtu vispārinātu raksturlielumu, varat aprēķināt novirzes no vidējā rezultāta. Piemēram, 3., 6., 3. rindai vērtības būs šādas: 3 - 4 = - 1; 6 - 4 = 2; 3 - 4 = - 1. Šo noviržu summa (- 1) + 2 + (- 1) vienmēr ir 0. Lai no tā izvairītos, katras novirzes vērtības ir kvadrātā: (- 1) 2 + 2 2 + (-1) 2 = 6.

Vērtība padara novirzes no vidējās izteiktākas: mazas novirzes kļūst vēl mazākas (0,5 2 = 0,25), un lielas novirzes kļūst vēl lielākas (5 2 = 25). Iegūto summu sauc noviržu kvadrātā summa. Šo summu dalot ar mērījumu skaitu, iegūst vidējo noviržu kvadrātu vai dispersija. To apzīmē ar s 2 un aprēķina pēc formulas:

.

Ja mērījumu skaits nav lielāks par 30, t.i. n ≤ 30, tiek izmantota formula:

.

Tiek izsaukta vērtība n - 1 = k brīvības pakāpju skaits, kas nozīmē brīvi mainīgo iedzīvotāju skaitu. Konstatēts, ka, aprēķinot variācijas rādītājus, vienam empīriskās populācijas dalībniekam vienmēr nav noteiktas brīvības pakāpes.

Šīs formulas piemēro, ja rezultātus attēlo nesakārtots (parasts) paraugs.

No svārstību raksturlielumiem visbiežāk izmanto standarta novirze, kas ir definēta kā dispersijas vērtības kvadrātsaknes pozitīvā vērtība, t.i.:

.

Standarta novirze vai standarta novirze raksturo rezultātu novirzes pakāpi no vidējās vērtības absolūtās vienībās un ir vienādas ar mērījumu rezultātiem.

Tomēr šis raksturlielums nav piemērots, lai salīdzinātu divu vai vairāku populāciju svārstības ar dažādām mērvienībām.

Variācijas koeficients ir definēta kā standartnovirzes attiecība pret vidējo aritmētisko, kas izteikta procentos. To aprēķina pēc formulas:

.

Sporta praksē mērījumu rezultātu mainība atkarībā no variācijas koeficienta vērtības tiek uzskatīta par nelielu.
(0 - 10%), vidējs (11 - 20%) un liels (V > 20%).

Variācijas koeficientam ir liela nozīme mērījumu rezultātu statistiskajā apstrādē, jo, būdams relatīvs lielums (mērīts procentos), tas ļauj salīdzināt mērījumu rezultātu svārstības ar dažādām mērvienībām. Variācijas koeficientu var izmantot tikai tad, ja mērījumus veic attiecību skalā.

2.4.2. Statistikas datu analīze programmā MS Excel. Analīzes rīki: aprakstošā statistika, korelācija.

Microsoft Excel izklājlapu sastāvā ietilpst tā sauktā analīzes pakotne - rīku komplekts, kas paredzēts sarežģītu statistikas problēmu risināšanai. Šī pakotne analizē statistikas datus, izmantojot makro funkcijas, un ļauj veikt vienu darbību, lai iegūtu lielu skaitu rezultātu. Programmā Excel pieejamajā analīzes pakotnē ir iekļautas aprakstošās statistikas un korelācijas sadaļas, kā arī citi analīzes rīki.

Aprakstošās statistikas rīks ļauj iegūt nozīmīgu aprēķināto statistisko raksturlielumu sarakstu lielam skaitam skaitlisko rindu. Izmantojot rīku "Korelācija", mēs iegūstam korelācijas matricu, kas satur visus iespējamos pāru korelācijas koeficientus. K rindām tiks iegūti k (k – 1)/2 korelācijas koeficienti.

Analīzes pakotne tiek izsaukta, izmantojot izvēlnes vienumu Rīki – Datu analīze… Ja šī izvēlnes elementa nav, tas nozīmē, ka analīzes pakotne nav instalēta. Lai to instalētu, jāizsauc izvēlnes vienums Pakalpojums - Papildinājumi ... un jāiespējo papildinājums "Analīzes pakotne", Labi (skatiet 1. attēlu).

1. attēls. Dialoglodziņš, lai iespējotu/atspējotu pievienojumprogrammas

Pēc pievienojumprogrammas “Analīzes pakotne” iespējošanas izvēlnes vienums Service – Data Analysis… Kad tas ir atlasīts, tiek parādīts šāds dialoglodziņš (2. attēls).

2. attēls. Dialoglodziņš datu analīzes rīka izvēlei

Pēc rīka Aprakstošā statistika atlasīšanas un noklikšķināšanas uz Labi, parādīsies cits dialoglodziņš (3. attēls), kurā būs nepieciešami ievades dati un vieta, kur parādīt rezultātus. Šeit pietiek ar to, lai laukā "Ievades intervāls" ievadītu šūnu diapazonu, kurā ir avota dati. Varat norādīt diapazonu ar kolonnu virsrakstiem, un tādā gadījumā jums būs jāatspējo izvēles rūtiņa "Etiķetes pirmajā rindā". Lai norādītu izvades intervālu, pietiek norādīt tikai diapazona augšējo kreiso šūnu. Aprēķinu rezultāti automātiski aizņems nepieciešamo rindu un kolonnu skaitu tabulā.

3. attēls. Aprakstošās statistikas rīka dialoglodziņš

Apsveriet analīzes rīka "Aprakstošā statistika" darbu pie šāda piemēra. Pārbaudot skolēnu grupu (n = 21), tika mērīti šādi rādītāji: augums, ķermeņa svars, labās un kreisās rokas dinamometrija, plaušu kapacitāte, Stendža tests un Genči tests. Rezultāti tika ievadīti tabulā (4. attēls).

Lai iegūtu statistiskos raksturlielumus, mēs izmantosim analīzes pakotni, aprakstošās statistikas rīku. Laukā "Ievades intervāls" ievadiet šūnu diapazonu B1:H22. Tā kā atlasītajā ievades intervālā ir sleju virsraksti, iespējojiet izvēles rūtiņu "Iezīmes pirmajā rindā". Darba ērtībai kā rezultāta izvades vietu atlasiet “Jauna darblapa”. Kā izvaddatus mēs atzīmējam izvēles rūtiņas "Galīgā statistika" un "Drošības līmenis: 95%. Pēdējā izvēles rūtiņa ļaus parādīt ticamības intervāla parametrus ar ticamības līmeni 0,95. Rezultāts pēc nelielas formatēšanas izskatīsies kā parādīts 5. attēlā.

4. attēls. Skolēnu grupas aptaujas rezultāti

5. attēls. Rīka "Aprakstošā statistika" rezultāts

Pēc rīka "Korelācija" atlasīšanas un noklikšķināšanas uz OK dialoglodziņā "Datu analīze" (2., 6. attēls), parādīsies cits dialoglodziņš (7. attēls), kurā būs nepieciešami ievades dati un vieta, kur parādīt rezultātus. Šeit pietiek ar to, lai laukā "Ievades intervāls" ievadītu šūnu diapazonu, kurā ir avota dati. Varat norādīt diapazonu ar kolonnu virsrakstiem, un tādā gadījumā jums būs jāatspējo izvēles rūtiņa "Etiķetes pirmajā rindā". Lai norādītu izvades intervālu, pietiek norādīt tikai diapazona augšējo kreiso šūnu. Aprēķinu rezultāti automātiski aizņems nepieciešamo rindu un kolonnu skaitu tabulā.

6. attēls. Dialoglodziņš datu analīzes rīka izvēlei

7. attēls Korelācijas rīka dialoglodziņš

Apsveriet "Korelācijas" analīzes rīka darbu, izmantojot piemēru, kas parādīts 4. attēlā.

Lai iegūtu korelācijas matricu, mēs izmantosim analīzes pakotni, rīku "Korelācija". Laukā "Ievades intervāls" ievadiet šūnu diapazonu B1:H22. Tā kā atlasītajā ievades intervālā ir sleju virsraksti, iespējojiet izvēles rūtiņu "Iezīmes pirmajā rindā". Darba ērtībai kā rezultāta izvades vietu atlasiet “Jauna darblapa”. Rezultāts pēc nelielas formatēšanas izskatīsies kā parādīts 8. attēlā.

8. attēls. Korelācijas matrica

Tādējādi, veicot vienkāršas darbības, mēs iegūstam lielu skaitu aprēķinu rezultātu. Jāpiebilst, ka, lai gan informācijas tehnoloģijas pētniekam paver iespējas iegūt milzīgu informācijas apjomu analīzei, informatīvāko rezultātu atlase, galīgā interpretācija un secinājumu formulēšana ir paša pētnieka darbs.

Eksperimentālo datu korelācijas analīzes pamatjēdzieni. Korelācijas koeficienta novērtējums no eksperimentālajiem datiem.

Sporta pētījumos nereti tiek atrastas attiecības starp pētītajiem rādītājiem. Tās izskats ir atšķirīgs. Piemēram, paātrinājuma noteikšana pēc zināmiem ātruma datiem, Ņūtona otrā likuma un citi raksturo t.s. funkcionāls atkarība jeb sakarība, kurā katra viena rādītāja vērtība atbilst cita strikti noteiktai vērtībai.

Cits attiecību veids ietver, piemēram, svara atkarību no ķermeņa garuma. Viena ķermeņa garuma vērtība var atbilst vairākām svara vērtībām un otrādi. Šādos gadījumos, kad viena rādītāja viena vērtība atbilst vairākām cita rādītāja vērtībām, tiek izsaukta sakarība statistikas.

Liela uzmanība sporta pētījumos tiek pievērsta dažādu rādītāju statistiskās sakarības izpētei, jo tas ļauj atklāt dažus modeļus un pēc tam tos aprakstīt gan verbāli, gan matemātiski, lai praktiskajā darbā izmantotu treneri un skolotāju.

Starp statistiskajām attiecībām vissvarīgākā korelācija. Korelācija ir statistiska atkarība starp gadījuma mainīgajiem, kurā izmaiņas vienā no nejaušajiem mainīgajiem izraisa otra matemātiskās cerības (vidējās vērtības) izmaiņas. Piemēram, lodes grūšana 3 kg un 5 kg. Uzlabojot 3 kg lodes grūšanu, uzlabojas (vidēji) 5 kg lodes grūšana.

Tiek saukta statistikas metode, kas tiek izmantota attiecību izpētei korelācijas analīze. Tās galvenais uzdevums ir formas, hermētiskuma un virziena noteikšana pētāmo rādītāju attiecības. Korelācijas analīze ļauj izpētīt tikai statistiskās attiecības. To plaši izmanto testu teorijā, lai novērtētu to ticamību un informatīvumu. Dažādām mērījumu skalām ir nepieciešama dažāda veida korelācijas analīze.

Attiecību koeficienta vērtību aprēķina, ņemot vērā mērījumiem izmantoto skalu.

Sakarības novērtēšanai, kad mērījumi tiek veikti uz attiecību vai intervālu skalas un sakarības forma ir lineāra, tiek izmantots Bravai-Pīrsona korelācijas koeficients (citu mērījumu skalu korelācijas koeficienti šajā rokasgrāmatā nav aplūkoti). To apzīmē ar latīņu burtu - r. R vērtības aprēķinu visbiežāk veic pēc formulas:

,

kur un ir x un y vidējās aritmētiskās vērtības un ir standartnovirzes, n– mērījumu (priekšmetu) skaits.

Dažos gadījumos attiecību ciešumu nosaka, pamatojoties uz koeficientu apņēmības D, ko aprēķina pēc formulas:

.

Šis koeficients nosaka viena rādītāja kopējās variācijas daļu, kas izskaidrojama ar cita rādītāja svārstībām. Piemēram, korelācijas koeficients r = -0,677 (starp rezultātiem 30 m skriešanas un stāvus trīssoļlēkšanā). Determinācijas koeficients ir vienāds ar:

Līdz ar to 45,8% no sportiskā rezultāta izkliedes trīssoļlēkšanā ir izskaidrojami ar rezultātu izmaiņām 30 metru skrējienā, citiem vārdiem sakot, abas pētītās pazīmes ietekmē kopīgi faktori, kas izraisa šo pazīmju variāciju. un kopējo faktoru īpatsvars ir 45,8%. Atlikušie 100% - 45,8% = 54,2% attiecas uz to faktoru īpatsvaru, kas selektīvi iedarbojas uz pētītajām īpašībām.

Novērtēt korelācijas koeficienta statistisko nozīmīgumu nozīmē noteikt, vai pastāv lineāra korelācija starp vispārējām populācijām, vai, kas ir vienāda, noteikt, vai korelācijas koeficients starp paraugiem būtiski vai nenozīmīgi atšķiras no nulles. Šo problēmu var atrisināt, izmantojot korelācijas koeficienta sadalījuma kritisko punktu tabulas šādā secībā:

1. Izvirzītas statistiskās hipotēzes. Hipotēze H 0 pieņem, ka starp pētītajiem rādītājiem nav statistiski nozīmīgas attiecības ( r gēns=0). Hipotēze H 1 liecina, ka pastāv statistiski nozīmīga sakarība starp rādītājiem ( r gēns>0).

2. Tiek aprēķināta korelācijas koeficienta novērotā vērtība r obs.

3. Korelācijas koeficienta kritiskā vērtība atrodama tabulā r krit atkarībā no izlases lieluma n, nozīmīguma līmenis a un kritiskā reģiona veids (vienpusējs vai divpusējs).

3. Salīdzināts r obs un r krit.

Ja r obs < r krit– statistiski neuzticams (nenozīmīgs). Hipotēze H ir pieņemta 0 Ja r obsr krit, korelācijas koeficients tiek uzskatīts par statistiski nozīmīgu (nozīmīgu). Hipotēze H 1 ir pieņemta.