Alapvető statisztikai paraméterek. Egy méréssorozat főbb statisztikai jellemzői

Laborjelentés

"A statisztikai adatfeldolgozás módszerei és eszközei" témakörben

Befejezte: Galimova A.R., gr. 4195

Ellenőrizte: Mokshin V.V.

Kazan, 2013

1. Egyéni feladat. 3

2. Kísérletek tervezése. négy

2.1. Stratégiai tervezés. négy

2.1.1. D - optimális tervek.. 5

3. Az ISD főbb statisztikai jellemzői. nyolc

4. Az ISD normálisságának értékelése. 9

5. Időbeli előrejelzés. 13

6. Korrelációelemzés. tizenöt

7. Klaszterelemzés. 16

8. Faktorelemzés. 22

9. Regresszióanalízis. 27

10. Diszperzióanalízis. 35

11. Tényezőértékek és teljesítménymutatók optimalizálása. 35

Következtetések.. 36

Alkalmazás. 37

Egyéni feladat

BUF1 - 3 helyre;

BUF2 - korlátlan számú ülés;

GOT - exponenciális törvény, átlagosan 20000 időegység;

VOSST - spec. earl.jog, átlagosan egy fázisban 25 egység. idő, szám 3. fázis;

GT − egységes törvény, 225±25 időegység;

RK1 - exponenciális törvény, átlag Х1=100 egység. idő;

RK2 − normál törvény, átlag Х2=90, art. ki 8 egység vr.;

KAN1-KANМ – egységes törvény, 75±15 időegység;

Х3=М – csatornák száma.

Egy KANal kiválasztása átvitelre a legkevesebb olyan feladat alapján, amelyre vonatkozóan információt továbbítanak. A hozzáférhetetlenségi mód egymásra épül és eltávolítható csatornákon keresztül, egymástól függetlenül.

300 feladat (megoldott plusz hibák) kijelentkezése után fejezze be a szimulációt.

Optimalizált tényezők: Х1 – átlagos megoldási idő PC1-en, Х2 – átlagos megoldási idő PC2-n, Х3 – csatornák száma. X1 és X2 a jelzett átlagértékek ± 20%-ával változik; X3 2-től 6-ig.

Építsünk modellt az Aréna rendszerben

1. ábra - Az Arena szimulációs rendszerbe épített szimulációs modell

Kísérletek tervezése

A tervezés célja adott megbízhatóságú eredmények elérése a legalacsonyabb költséggel. Tegyen különbséget a stratégiai és a taktikai tervezés között.

Stratégiai tervezés

A stratégiai tervezéshez a „fekete doboz” koncepciót alkalmazzuk, melynek lényege a szimulált rendszerben lezajló folyamatok fizikai lényegétől való elvonatkoztatás, és annak működésére vonatkozó következtetések levonása csak a bemeneti és kimeneti változók alapján. A bemeneti, független változókat faktoroknak nevezzük. Kimenet - válaszok, értékük az OI tényezőinek és paramétereinek értékétől függ.

Esetünkben a tényezők olyan mutatók (paraméterek), amelyeket optimalizálni fogunk; a válaszok hatékony mutatói a szimulált rendszer működésének eredményességének. A fekete doboz blokkvázlata az 1. ábrán látható.

1. ábra A fekete doboz koncepció blokkvázlata

A másodrendű tervek lehetővé teszik a válaszfüggvény teljes másodfokú polinomként történő kialakítását, amely több tagot tartalmaz, mint az elsőrendű tervekből képzett hiányos másodfokú polinom, ezért nagyobb számú kísérlet elvégzését igényli. Az m=3 teljes másodfokú polinomja a következő:

D - optimális tervek

NÁL NÉL D- az optimális tervekben a tényezők értékei nem lépik túl a változási tartományok meghatározott határait. Ezen kívül van még egy jelentős előnyük, minimális hibát biztosítanak a faktorváltozások teljes elfogadott tartományában. A gyakorlatban leggyakrabban Kono és Kiefer terveit használják.

Rizs. 2 Kiefer háromtényezős tervének geometriai értelmezése kockán

A stratégiai terv meghatározza a modellezendő rendszerlehetőségek számát és az egyes opciókban szereplő tényezők értékét. 3 optimalizált tényezőre egy D-optimális tervet javasolunk a Kiefer-algoritmus szerint, amely 26 opcióból áll, és az 1. táblázatban látható.

1. táblázat - Kiefer terve egy 3 faktoros kísérlethez

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

Itt: ; ;

X 1 , X 2 , X 3 értékeket egyéni feladat szerint számítjuk ki. Az egyedi feladat feltétele szerint az optimalizálandó tényezők: Х1 – átlagos megoldási idő PC1-en, Х2 – átlagos megoldási idő PC2-n, Х3 – csatornák száma. X1 és X2 a jelzett átlagértékek ± 20%-ával változik; X3 2-től 6-ig.

A PK1-en, az exponenciális törvény feltételén az átlag 100 időegység, ezért az érték 0 - 100, 1-120, -1 -80 (mivel a megadott átlagérték ± 20%-át változtatjuk).

Az RK2 a hozzárendelési feltétel szerint betartja a normál törvényt, és az átlagérték 90 egység. idő és módosító ±20 időegység, tehát 0-90, 1 - 108, -1-72. Az összes adatot a 2. táblázat tartalmazza.

1. táblázat - X 1, X 2, X 3 tényezők adatai

-1
x1
x2
x3

Y 1 – PC1 kihasználtsági tényező (0÷1)*100%;

Y 2 - PK2 felhasználási tényező (0÷1)*100%;

Y 3 – A feladatok elvégzéséhez szükséges átlagos teljes idő.

Az egyedi feladat Kiefer algoritmusa szerinti D-optimális tervet és az egyedi feladat tényezőire adott Y 1 ,Y 2 ,Y 3 válaszokat a 3. táblázat tartalmazza.

2. táblázat - D-optimális terv a Kiefer-algoritmus szerint (egyedi feladatokhoz)

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6

4. táblázat – Válaszok Y 1 , Y 2 ,Y 3

I 1 Y2 I 3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

Az ISD alapvető statisztikai jellemzői.

A fő statisztikai jellemzők a következők:

1. Érvényes N - mintanagyság;

2. Mean - számtani átlag. Egy valószínűségi változó átlagos értéke a legtipikusabb, legvalószínűbb értéke, egyfajta középpont, amely körül az attribútum összes értéke szétszórva van.

3. Medián – medián. A medián egy valószínűségi változó értéke, amely a mintában szereplő összes esetet két egyenlő részre osztja.

4. StandardDeviation - szórás. A szórás (vagy szórás) egy tulajdonság variabilitásának (variációjának) mértéke. Megmutatja, hogy átlagosan mennyi eset tér el az attribútum átlagos értékétől.

5. Variancia - diszperzió. A diszperzió egy tulajdonság variabilitásának, variációjának mérőszáma, és az esetek egy tulajdonság átlagértékétől való eltéréseinek átlagos négyzete. Más variációs mutatókkal ellentétben a variancia alkotórészekre bontható, ami lehetővé teszi, hogy értékeljük a különböző tényezők hatását egy tulajdonság variációjára.

6. Az átlag hibája Az átlag standard hibája az a mérték, amennyivel a minta átlaga eltér a sokaság átlagától, feltéve, hogy az eloszlás közel áll a normálhoz.

7. Az átlag 95%-os konfidenciahatárai – az átlag 95%-os konfidencia intervalluma. Az az intervallum, amelybe az általános sokaság jellemzőjének átlagértéke esik 0,95 valószínűséggel.

8. Minimum, maximum - minimum és maximum értékek.

9. Ferdeség-aszimmetria. Az aszimmetria jellemzi a variációs sorozat eltolódásának mértékét az átlagos nagyság- és irányértékhez viszonyítva.

10. Skewness standard error – standard asszimetria hiba.

11. Kurtosis - többlet. A Kurtosis az esetek középérték körüli koncentrációjának mértékét jellemzi, és egyfajta mérőszáma a görbe meredekségének.

12. Kurtosis standard hibája

5. táblázat – A leíró statisztikák eredményei


Az ISD normalitás értékelése.

A normál törvény a leggyakrabban használt. A véletlenszerű folyamatok széles skálájának ábrázolására szolgál, mint például az emberek várható élettartama, a gazdasági és műszaki mutatók változása.

Tegyük fel, hogy a kiinduló statisztikai adatok a normáltörvény hatálya alá tartoznak, és a normáltörvény paramétereiként a képletekkel számított matematikai elvárás és szórás becsléseit vesszük.

A normáltörvény sűrűségfüggvénye a következőképpen alakul:

; .

Ha a statisztikai táblázatokból megállapítható empirikus eloszlás normalitásfeltevésében a P konfidencia együtthatója nem kisebb, mint 0,20, akkor a normalitás feltevését nem utasítjuk el. Ha P to<0,20, то предположение о нормальности рекомендуется отвергнуть.

Az empirikus és a hipotetikus eloszlások közötti megfelelés vizuálisan nyomon követhető a grafikonokból. A Kolmogorov-illesztési kritérium használatakor célszerű eloszlásfüggvényeket használni. Az ilyen grafikonokat a PPP Statistica 6.0 és Excel 2007 speciális szoftvereljárásaiban építik fel és adják ki, amelyekre a számítások a megadott matematikai apparátusnak megfelelően orientálódnak. Képzeljük el a változók eloszlását a hisztogramokon (3.-8. ábra).

A normál eloszlás sűrűségét ráhelyezzük a hisztogramokra, hogy a Kolmogorov-Smirnov-kritérium segítségével ellenőrizzük az eloszlás normális alakhoz való közelségét.


Hasonló információk.


MOSZKVA VÁROS OKTATÁSI OSZTÁLYA

ÁLLAMKÖLTSÉGVETÉSI SZAKOKTATÁSI INTÉZMÉNY

54. számú KOMMUNIKÁCIÓS KOLLÉGIUM P.M. VOSTRUKHINA

Statisztikai jellemzők.

Oktatóanyag a lecke 1. részéhez.

Fejlesztő:

Matematika tanár

T.N. Rudzina


- ez matematikai fogalmak , amelyek az adathalmaz megkülönböztető jegyeit és tulajdonságait írják le megfigyeléssel vagy más módon nyerjük. A jellemzők jelentősége abban is rejlik, hogy azok "gyors" , milyen pozíciókból célszerű elemezni a rendelkezésre álló adatsort .

A statisztikai jellemzők a következők:

átlagos , hatálya , divat , középső .

Vegyünk egy példát:

A tanulók tanítási terhelésének vizsgálatakor egy 12 hetedikes csoportot emeltek ki. Arra kérték őket, hogy egy adott napon jegyezzék fel azt az időt (percben), amit az algebrai házi feladat elvégzésével töltöttek. A következő adatokat kaptuk:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Ezzel az adatsorral meg tudja határozni b, átlagosan hány percet a tanulók algebrai házi feladatra költöttek.

Ehhez ezeket a számokat össze kell adni, és az összeget el kell osztani 12-vel:


Szám 27 az eredményt nevezzük számtani átlaga tekintett számsorok.

Meghatározás :

számtani átlaga egy számsorozatot e számok összegének a tagok számával való osztásának hányadosának nevezzük.

A számtani átlagot általában akkor találják meg, ha egy bizonyos adatsor átlagértékét akarják meghatározni: a terület 1 hektáronkénti átlagos búzatermése, egy tehén átlagos napi tejhozama a gazdaságban, egy tehén átlagkeresete. brigádmunkás műszakonként stb. Ne feledje, hogy a számtani átlag csak homogén értékek esetén található. Nincs értelme például a gabona- és dinnyetermés átlagát általános mutatóként használni. Sőt, még homogén értékek esetén is néha értelmetlen a számtani átlag számítása, például a kórházi betegek átlaghőmérsékletének, az átlagos cipőméretnek...


A vizsgált példában azt találtuk, hogy a tanulók átlagosan 27 percet töltöttek a házi feladatuk elkészítésével algebrában. A fenti adatsorok elemzése azonban azt mutatja, hogy egyes tanulók által eltöltött idő jelentősen eltér a 27 perctől, i.e. a számtani átlagtól. A legmagasabb fogyasztás 37 perc, a legkisebb - 18 perc. A legnagyobb és a legkisebb időfelhasználás közötti különbség 19 perc. Ebben az esetben azt mondják hatálya sor a 19.

Meghatározás :

nagyban sor számokat a legnagyobb és a legkisebb szám különbségének nevezzük.

A tartományt akkor találják meg, amikor meg akarják határozni, hogy egy sorozatban mekkora az adatok terjedése.


Amikor elemezzük a hetedikesek által az algebrai házi feladat elvégzésével töltött idejére vonatkozó információkat, nem csak arra lehetünk kíváncsiak, átlagosés hatálya kapott adatsorokat, hanem más mutatókat is. Érdekes például, hogy egy kiválasztott tanulócsoportra milyen időfelhasználás jellemző, pl. mi a leggyakoribb szám az adatsorban. Könnyen belátható, hogy a 25-ös szám egy ilyen szám, azt mondják, hogy a 25 divat a vizsgált sorozat.

Meghatározás :

Divat egy számsor az a szám, amely ebben a sorozatban a leggyakrabban előfordul .

Egy számsorozatnak több is lehet divat vagy nincs divat egyáltalán.

Például a 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 számok sorozatában kettő divat számok 47 és 52 , mivel ezek a számok mindegyike kétszer fordul elő, a többi szám pedig kevesebb mint kétszer fordul elő a sorozatban, valamint a 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 számok sorozatában - divat nem.


Nézzünk egy másik statisztikát.

Kezdjük egy példával. A táblázat kilenc lakás lakóinak januári áramfogyasztását mutatja

A táblázatban megadott adatokból készítsünk egy rendezett sorozatot:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

Az eredményül kapott rendezett sorozatban kilenc szám található. Nem nehéz észrevenni, hogy a 78-as szám a sor közepén található: négy szám van írva tőle balra, négy szám pedig jobbra. Azt mondják, hogy a szám 78 a középső szám, vagy egyébként középső, a vizsgált számok rendezett sorozata (a latin szóból mediana ami "átlagot" jelent). Ezt a számot is figyelembe veszik középső eredeti adatsor.


Vegyünk most egy másik példát. Tegyük fel, hogy a villamosenergia-fogyasztásra vonatkozó adatok gyűjtése során a jelzett kilenc lakáshoz hozzáadták a tizedet. Ezt a táblázatot kaptuk:

Az első esethez hasonlóan a kapott adatokat rendezett számsorként mutatjuk be:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

Ennek a számsorozatnak páros számú tagja van, és két szám található a sorozat közepén: 78 és 82 .

Szám 80 , mivel nem tagja a sorozatnak, ezt a sorozatot két egyenlő méretű csoportra osztja: tőle balra öt, jobbra pedig szintén öt tagja van:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Azt mondják, hogy ebben az esetben a vizsgált rendezett sorozatok mediánja, valamint a táblázatban rögzített eredeti adatsorok száma 80 .

Meghatározás :

középső szabályos páratlan számú tagú számsort a közepére írt számnak nevezzük, és középső a páratlan számú tagú, rendezett számsort két közepére írt szám számtani középértékének nevezzük.

középső tetszőleges számsort a megfelelő rendezett sorozat mediánjának nevezzük.


Ha a megrendelt számsorozat tartalmazza 2 n -1 tagok, akkor a sorozat mediánja az n th tag, mivel n – 1 tagjai kiállnak n th tag és n – 1 tagok – után n th tagja.

Ha a megrendelt sorozat tartalmazza 2 n tagok, akkor a medián a rajta álló tagok számtani átlaga n-m és n + 1 -edik helyek.

A fenti példák mindegyikében meghatározva középső, meg tudjuk jelölni annak a lakásnak a számát, amelynél a lakók áramfogyasztása meghaladja a medián értéket, i.e. középső .

Nézzünk még egy példát.

Ismeretes, hogy az osztály 34 alkalmazottja vásárolt egy bizonyos részvénytársaság részvényeit. Az alkalmazottak által vásárolt részvények számának adatait a következő sorrendben mutatjuk be:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Találjuk ki középső ezt a sort. Mivel 34 szám van a sorozatban, akkor középső egyenlő a 17. és 18. tag számtani átlagával, azaz. egyenlő (3 + 4) : 2 = 3,5

Számítástechnika átlagos ebből a sorozatból azt találjuk, hogy megközelítőleg egyenlő 6,2-vel, azaz. az osztály dolgozói átlagosan körülbelül 6 darab részvényt vásároltak. Ebben az esetben ezt látjuk középső jobban tükrözi a valós helyzetet, mivel egy alkalmazott kivételével mindenki legfeljebb 4 részvényt vásárolt.

A mutatók, mint pl átlagos , divatés mediánok a, különböző módon jellemezze a megfigyelések eredményeként kapott adatokat. Ezért a gyakorlatban az adatok elemzésekor az adott helyzettől függően vagy mindhárom mutatót, vagy azok egy részét alkalmazzák.

Ha például a városban több utazási társaság éves bevételére vonatkozó adatokat elemezzük, akkor célszerű mindhárom mutatót használni. Átlagos megmutatja a cégek átlagos éves jövedelmét, divat az éves jövedelem tipikus mutatója lesz, középső olyan utazási társaságokat azonosít, amelyek éves bevétele az átlag alatt van.

Ha egy áruházban egy bizonyos napon eladott férfi cipők méretére vonatkozó adatokat tanulmányozza, akkor célszerű olyan mutatót használni, mint pl. divat, ami a legnagyobb keresletnek örvendő méretet jellemzi. megtalálja ebben az esetben átlagos vagy középső nincs értelme .

Az úszás résztvevőinek 100-as távon mutatott eredményeit elemezve a legelfogadhatóbb jellemző a középső. Tudás mediánok lehetővé teszi a versenyeken való részvételre az átlag feletti eredményeket felmutató sportolók csoportját.

Statisztikai jellemzők : átlagos , Csíkos útitakaró a, középső hívott átlagos mérési eredmények .

Osztály: 7

Előadás a leckéhez

















Vissza előre

Figyelem! A dia előnézete csak tájékoztató jellegű, és nem feltétlenül képviseli a bemutató teljes terjedelmét. Ha érdekli ez a munka, töltse le a teljes verziót.

Célok:

  • mutassa be a főbb statisztikai jellemzőket (számtani átlag, tartomány, sorozatmód);
  • megtanulják megtalálni a sorozat számtani középértékét, tartományát, módját;
  • elősegíteni a tanulók figyelmének, logikus gondolkodásának, megfigyelésének fejlődését;
  • hozzájárulnak a körülvevő világhoz való gazdaságilag tudatos hozzáállás kialakításához.

Anyagi támogatás:
multimédiás projektor, kártyák önálló munkához.
AZ ÓRÁK ALATT
1. Házi feladat: 9, No. 168, 172, 178 ("Algebra. 7. osztály" tankönyv, S. A. Telyakovsky, Moszkva "Prosveshchenie", 2009)

2. Az óra témájának üzenete.

2.1. A keresztrejtvény megfejtése:

  1. Az összeadási művelet eredménye (összeg).
  2. Az egyenlőség a változó bármely értékére igaz (identitás).
  3. Pont koordinátája az x tengely mentén (abszcissza).
  4. Bizonyító nyilatkozat (tétel).
  5. Ismeretlen elem található (kívánt).
  6. Adjon hozzá műveleti összetevőt (kifejezés).
  7. A legegyszerűbb geometriai alakzat (pont).
  8. A számítógép egy olyan eszköz, amely tárolja, feldolgozza és továbbítja... (információ).
  9. Egy téglatest, amelynek minden mérete egyenlő (kocka).
  10. Kialakult eljárás (algoritmus).

2.2. Olvassa el a kitalált szavak első betűiből alkotott szót. (Statisztika)

Mi a véleményed a statisztikákról?
Statisztika egy olyan tudomány, amely a természetben és a társadalomban előforduló különféle jelenségekre vonatkozó mennyiségi adatok megszerzésével, feldolgozásával és elemzésével foglalkozik. (2. dia)
gazdasági statisztikák tanulmányozza az árak, az árukínálat és -kereslet változásait, előrejelzi a keresletet és a termelés és fogyasztás csökkenését.
orvosi statisztikák vizsgálja a különböző gyógyszerek és kezelések hatékonyságát, egy bizonyos betegség valószínűségét életkortól, nemtől, öröklődéstől, életkörülményektől, rossz szokásoktól függően, előrevetíti a járványok terjedését.
Demográfiai statisztika vizsgálja a születési arányt, a népesség nagyságát, összetételét (életkor, országos, szakmai).
És akkor még pénzügyi, adózási, biológiai, meteorológiai stb.
Vannak bizonyos módszerek az információ feldolgozására. (3. dia)
A matematika azon részét, amely a statisztikai adatok feldolgozásának és elemzésének módszereivel és szabályaival foglalkozik, matematikai statisztikának nevezzük. (4. dia)

2.3. Az óra témája.

- Ma megismerkedünk néhány statisztikai jellemzővel, megtanuljuk meghatározni azokat. (5. dia).

3. Új anyag elsajátítása.

3.1. – Tekintsük az oroszországi búzatermelés adatait 1995 és 2001 között. (6. dia)

1995 - 30,1 millió tonna;
1996 - 34,9 millió tonna;
1997 - 44,3 millió tonna;
1998 - 27 millió tonna;
1999 - 31 millió tonna;
2000 - 34,5 millió tonna;
2001 - 47 millió tonna.

– Mint látható, a búzatermelés évről évre változik. Miért gondolod?
– Igen, ez függ az időjárási viszonyoktól, az ültetési területtől, a vetőmag minőségétől és egyéb körülményektől. Ezért az 1 éves búzatermesztés nem ad teljes képet az ország búzatermelésének szintjéről. Erre a célra jobb, ha több év átlagát használja. A táblázat alapján 7 év átlagos búzatermését tudjuk számolni. Hogyan tudom ezt megtenni?
(30,1 + 34,9 + 44,3 + 27 + 31 + 34,5 + 47) : 7 = 35,5 (7. dia)
- Mit találtunk? (Átlagos)
- A számtani átlag a számsorok egyik statisztikai jellemzője. Írd le a füzetedbe ennek a fogalomnak a definícióját! (8. dia)
Egy számsorozat számtani közepe e számok összegének a számukkal való elosztásának hányadosa.
– Melyik évben volt a búzatermelés a legközelebb az átlaghoz? (1996-ban)

3.2. Végezze el a feladatokat (9. dia):

1) Számítsa ki a 6, 10, 16 és 20 számok számtani átlagát! (6 + 10 + 16 + 20) : 4 = 52 : 4 = 13
2) Minden szám egyenlő egymással. Miért korai a számtani átlaguk? (Maga ehhez a számhoz.)
3) A számtani közép nem eshet egybe az adott sorozat egyik számával sem? (Igen)
4) Gondolj három olyan számra, amelyek számtani átlaga megegyezik a második legnagyobb számmal.

3.3. Az egyik hetedik osztályban megmérték a fiúk magasságát. A következő adatokat kaptuk:
155 cm, 167 cm, 159 cm, 168 cm, 161 cm, 170 cm, 162 cm, 153 cm, 165 cm. (10. dia) Keresse meg ennek a számsornak a számtani középértékét!
(155 + 167 + 159 + 168 + 161 + 170 + 162 + 153 + 165) : 9 = 1460: 9 = 162,(2) = 162
Milyen magas a legmagasabb fiú ebben az osztályban? (170 cm)
- A legalacsonyabb fiú? (153 cm)
- Megtalálja a különbséget a srácok magasságában?
170-153 = 17 (cm)
Az adatsorok legnagyobb és legkisebb értéke közötti különbséget a sorozat tartományának nevezzük, és egyben a statisztikai jellemzők közé tartozik. (11. dia)
- Írd le a definíciót a füzetedbe!

3.4. Petya és Vasya azon vitatkoztak, hogy ki a jobb álló távolugrásban. A véletlenszerűség elkerülése érdekében úgy döntöttek, hogy felváltva ugranak 5-ször. (12. dia) Ugrásaik eredményét táblázatba rögzítették. (13. dia):

ugrásszám

- Az egyes sorok milyen statisztikai jellemzőit kell meghatározni, hogy kiderüljön, melyik srác ugrik tovább? (Átlagos)
- Találd ki.

Péter: (190 + 205 + 195 + 210 + 210) : 5 = (190 + 400 + 420) : 5 = 1010: 5 = 202 (cm)
Vasja: (185 + 200 + 215 + 190 + 190): 5 = (600 + 380): 5 = 980: 5 = 196 (cm)

Következtetés: Petya tovább ugrik, mint Vasya.
- Használja ezt a táblázatot, hogy megtalálja az egyes fiúk legjobb és legrosszabb eredményei közötti különbséget (sorozattartomány).
Péter: 210 - 190 = 20 (cm); Vasja: 215-185 = 30 (cm)
– Azt lehet mondani, hogy Petya stabilabban ugrik? (Igen)

3.5. Az egyik hetedik osztályban úgy döntöttek, hogy kiderítik, milyen méretű cipőt hordanak az osztályba járó lányok. (14. dia) A következő eredményeket kaptuk:

35, 39, 37, 36, 38, 37, 38, 36, 37, 37, 38, 37, 37.

Mi a leggyakoribb cipőméret? (37)
Az adott sorban leggyakrabban előforduló sor számát a sor módozatának nevezzük.. (15. dia)
- Írd le ezt a meghatározást a füzetedbe.

3.6. (16. dia)

1) Van-e bármilyen számsorozatnak módusa? (Nem)
2) Lehet-e egy számsorozatnak egynél több üzemmódja? (Igen)
3) Nem eshet egybe egy számsorozat módusa ezen számok egyikével sem? (Nem)

3.7. (17. dia)

Adott egy számsor: 7, 8, 9, 7, 7, 6, 7, 6, 9, 7. Határozza meg ennek a sorozatnak a számtani középértékét, móduszát és tartományát!
Számtani átlag: (7 + 8 + 9 + 7 + 7 + 6 + 7 + 6 + 9 + 7): 10 = 73: 10 = 7,3.
Divat: 7.
Tartomány: 9-6 = 3.

4. Önálló munkavégzés

1.opció.

  1. Határozzuk meg egy számsorozat számtani középértékét: 18, 11, 20, 19, 2, 10!
  2. Határozza meg egy számsor módusát: 12, 13, 13, 15, 19, 13, 12, 14, 12, 14, 13.
  3. Számítsd ki egy számsor tartományát: 31, 14, 25, 18, 29, 11, 16.
  4. Határozzuk meg a 21, 21, 21, 21, 21, 21, 21 számsorozat számtani átlagát, tartományát és módusát!
  5. A negyedév során Lena a következő pontokat kapott algebrából: három kettes, két hármas, négy négyes és egy ötös. Melyik statisztikai jellemzőt részesíti előnyben Lena a negyedéves értékelés során: a sorozat számtani átlagát, tartományát vagy módozatát?

2. lehetőség.

  1. Határozzuk meg egy számsorozat számtani átlagát: 21, 5, 18, 19, 15, 12!
  2. Határozza meg egy számsor módusát: 18, 17, 17, 15, 11, 17, 18, 16, 18, 16, 17.
  3. Számítsd ki egy számsor tartományát: 29, 16, 25, 12, 19, 11, 14.
  4. Határozzuk meg a 15, 15, 15, 15, 15, 15, 15 számsorozat számtani átlagát, tartományát és módusát!
  5. A negyed során Lena a következő pontokat kapott algebrából: két kettes, három hármas, hat négyes és két ötös. Melyik statisztikai jellemzőt részesíti előnyben Lena a negyedéves értékelés során: a sorozat számtani átlagát, tartományát vagy módozatát?

5. A lecke összegzése. (18. dia)

1) Milyen statisztikai jellemzőkkel találkoztunk az órán?
2) Hogyan találjuk meg egy számsorozat számtani középértékét?
3) Hogyan található egy számsorozat tartománya?
4) Mit mutat egy számsor módusa?

Referenciák:

  1. Tankönyv "Algebra. 7. évfolyam, szerkesztette: S. A. Telyakovsky, Moszkva, Enlightenment, 2009;
  2. Yu. N. Tyurin, A. A. Makarov, I. R. Viszockij, I. V. Jascsenko"Valószínűségelmélet és statisztika", MTSNMO JSC "Moszkva tankönyvek", Moszkva, 2004;
  3. G. N. Ivanova, www.openclass.ru ;
  4. "Matek statisztika"; kl10sch55.narod.ru;
  5. s21.my1.ru/metodi/tema uroka stat kharak 7 class.doc

Célkitűzés: megtanulják, hogyan kell statisztikai adatokat feldolgozni táblázatokban a beépített függvények segítségével; Fedezze fel az Analysis Pack funkcióitKISASSZONY excel2010 és néhány eszköze: Véletlenszám-generálás, Hisztogram, Leíró statisztika.

Elméleti rész

Nagyon gyakran nagyszámú tárgy vagy jelenség vizsgálata eredményeként kapott adatok feldolgozásához ( statisztikai adat), matematikai statisztikai módszereket alkalmaznak.

A modern matematikai statisztika két nagy területre oszlik: leíróés elemző statisztikák. A leíró statisztika magában foglalja a statisztikai adatok leírásának, táblázatok, eloszlások stb.

Az analitikus statisztikát a statisztikai következtetés elméletének is nevezik. Tárgya a kísérlet során nyert adatok feldolgozása, az emberi tevékenység különböző területein alkalmazott következtetések megfogalmazása.

A felmérés eredményeként kapott számhalmazt ún statisztikai aggregátum.

mintavevő készlet(vagy mintavétel) véletlenszerűen kiválasztott objektumok halmaza. Általános népesség az objektumok halmaza, amelyekből a minta készül. Hangerő halmaz (általános vagy minta) az ebben a halmazban lévő objektumok száma.

A statisztikai feldolgozáshoz az objektumok vizsgálatának eredményeit számok formájában mutatjuk be x 1 ,x 2 ,…, x k. Ha az érték x 1 megfigyelt n 1 alkalom, érték x 2 megfigyelt n 2-szer stb., akkor a megfigyelt értékek x én hívott lehetőségek, és az ismétléseik száma n én hívott frekvenciák. A gyakoriságok számlálásának eljárását adatcsoportosításnak nevezzük.

Minta nagysága n egyenlő az összes frekvencia összegével n én :

Relatív gyakoriságértékeket x én ennek az értéknek a frekvenciaarányának nevezzük n én a minta méretéhez n:

. (2)

Statisztikai gyakorisági eloszlás(vagy egyszerűen gyakorisági eloszlását) az opciók és a hozzájuk tartozó gyakoriságok listája, táblázat formájában írva:

Relatív gyakorisági eloszlás opciók listájának és a hozzájuk tartozó relatív gyakoriságuknak nevezzük.

1. Főbb statisztikai jellemzők.

A modern táblázatok hatalmas eszköztárral rendelkeznek a statisztikai adatok elemzésére. A leggyakrabban használt statisztikai függvények a program fő magjába vannak beépítve, vagyis ezek a funkciók a program indításától kezdve elérhetőek. További speciális funkciókat a kiegészítő rutinok tartalmaznak. Az Excelben egy ilyen rutint elemzési eszközcsomagnak neveznek. Az elemzőcsomag parancsait és funkcióit elemzőeszközöknek nevezzük. Néhány alapvető beépített statisztikai funkcióra és a leghasznosabb elemzési eszközökre szorítkozunk az Excel táblázatban található elemzési csomagból.

Átlagos.

Az AVERAGE függvény a minta (vagy általános) átlagát, azaz a minta (vagy általános) sokaság jellemzőjének számtani átlagát számítja ki. Az AVERAGE függvény argumentuma egy számkészlet, amelyet általában cellatartományként adnak meg, például =ÁTLAG(A3:A201).

Diszperzió és szórás.

Az adatok szórásának becsléséhez statisztikai jellemzőket, például szórást használnak Dés az átlagos négyzet (vagy szórás). . A szórás az eltérés négyzetgyöke:
. A nagy szórás azt jelzi, hogy a mérési értékek széles körben szóródnak az átlag körül, míg a kis szórás azt jelzi, hogy az értékek az átlag körül csoportosulnak.

NÁL NÉL excel vannak függvények, amelyek külön számítják ki a mintavarianciát D ban ben és szórás ban benés általános variancia D r és szórása d) Ezért a variancia és a szórás kiszámítása előtt egyértelműen meg kell határoznia, hogy az adatok sokaság vagy minta. Ettől függően kell használni a számításhoz D d és G, D ban benés ban ben .

A minta variancia kiszámításához D ban benés minta szórása ban ben VARI) és STDEV funkciók állnak rendelkezésre. Ezeknek a függvényeknek az argumentuma egy számkészlet, amelyet általában egy cellatartomány ad meg, például =VAR(B1:B48).

Az általános variancia kiszámításához D r és az általános szórás d van VARP és STDEV függvény.

Ezeknek a függvényeknek az argumentumai ugyanazok, mint a minta variancia esetében.

A lakosság mennyisége.

A minta vagy általános sokaság térfogata a sokaság elemeinek száma. A COUNT függvény határozza meg, hogy egy adott tartományban hány cella tartalmaz numerikus adatokat. Az üres cellákat vagy a szöveget tartalmazó cellákat a COUNT függvény figyelmen kívül hagyja. A COUNT függvény argumentuma cellákból álló intervallum, például: = COUNT (С2:С16).

A nem üres cellák számának meghatározásához, függetlenül azok tartalmától, a COUNT3 függvényt használjuk. Az érve a cellák tartománya.

Mód és medián.

A mód egy olyan jellemző értéke, amely gyakrabban fordul elő, mint az adathalmaz többi része. A MODE függvény számítja ki. Az argumentuma az adatokat tartalmazó cellák intervalluma.

A medián annak a jellemzőnek az értéke, amely a sokaságot két egyenlő számú elemre osztja. Kiszámítása a MEDIAN függvény segítségével történik. Az érve a cellák tartománya.

Variációs tartomány. A legnagyobb és legkisebb értékek.

Variációs tartomány R a különbség a legnagyobbak között x a sokaság (általános vagy minta) előjelének max és legkisebb x min értékei: R=x max- x min. A legmagasabb érték megtalálásához x max van egy MAX (vagy MAX) függvény, és a legkisebbhez x min a MIN (vagy MIN) függvény. Érvük a cellák intervalluma. A cellák közötti adatváltozási tartomány kiszámításához, például A1-től A100-ig, írja be a következő képletet: =MAX (A1:A100)-MIN (A1:A100).

A véletlenszerű eloszlás eltérése a normálistól.

A normális eloszlású valószínűségi változókat széles körben használják a gyakorlatban, például bármely fizikai mennyiség mérésének eredménye megfelel a normál eloszlási törvénynek. A normál egy folytonos valószínűségi változó valószínűségi eloszlása, amelyet a sűrűség ír le

,

ahol
diszperzió, - egy valószínűségi változó átlagértéke .

A kísérleti adatok eloszlása ​​normális eloszlástól való eltérésének felmérésére olyan jellemzőket használunk, mint az aszimmetria DEés kurtosis E. Normál eloszláshoz DE=0 és E=0.

A ferdeség megmutatja, hogy az adatok eloszlása ​​mennyire aszimmetrikus a normál eloszláshoz képest: ha DE>0, akkor a legtöbb adat átlag feletti értékkel rendelkezik ; ha DE<0, то большая часть данных имеет значения, меньшие среднего . Az aszimmetriát az RMSK függvény számítja ki. Az argumentuma az adatokat tartalmazó cellák tartománya, például =SKOS(A1:A100).

Kurtosis a "hűvösséget" értékeli, azaz. a kísérleti adatok eloszlása ​​maximumának kisebb-nagyobb növekedésének értéke a normál eloszlás maximumához képest. Ha egy E>0, akkor a kísérleti eloszlás maximuma nagyobb, mint a normál; ha E<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

1. Feladat.Statisztikai függvények alkalmazása

Ugyanez a voltmérő az áramköri szakasz feszültségének 25-szörösét mérte. A kísérletek eredményeként a következő volt feszültségértékeket kaptuk: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. Határozza meg a minta átlagát, szórását, szórását, tartományát, módusát, mediánját! Ellenőrizze a normál eloszlástól való eltérést a ferdeség és a görbület kiszámításával.

    Írja be a kísérlet eredményeit az A oszlopba.

    A B1 cellába írja be: "Átlag", a B2-be - "minta variancia", a B3-ba - "szórás", a B4-be - "Maximum", a B5-be - "Minimum", a B6-ba - "Variációs tartomány", a B7-be - " Divat", a B8-ban - "Medián", a B9-ben - "Aszimmetria", a B10-ben - "Kurtosis". Igazolja ennek az oszlopnak a szélességét a következővel: Automatikus egyezés szélesség.

    Jelölje ki a C1 cellát, és kattintson a "=" jelre a képletsorban. Használva Funkcióvarázslók kategóriában Statisztikai keresse meg az AVERAGE függvényt, majd válassza ki az adatokkal rendelkező cellák tartományát, és nyomja meg a gombot Belép.

    Válassza ki a C2 cellát, és kattintson a "=" jelre a képletsorban. Segítséggel Funkcióvarázslók kategóriában Statisztikai keresse meg a VARP függvényt, majd jelölje ki az adatokat tartalmazó cellák intervallumát, és nyomja meg a gombot Belép.

    Tegye meg ugyanezt a szórás, maximum, minimum, módus, medián, ferdeség és görbület kiszámításához.

    A C6 cellában a változási tartomány kiszámításához írja be a következő képletet: \u003d MAX (A1: A25) -MIN (A1: A25).

A fő statisztikai jellemzők két fő csoportra oszthatók: a központi tendencia mérőszámaira és a variációs jellemzőkre.

A minta központi trendje lehetővé teszi olyan statisztikai jellemzők értékelését, mint pl számtani átlag, módus, medián.

A központi tendencia legkönnyebben elérhető mérőszáma a módusz. Divat (hétfő) a megfigyelések halmazának leggyakrabban előforduló értéke. Az értékkészletben (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) a mód 9, mert gyakrabban fordul elő, mint bármely más érték. Abban az esetben, ha egy csoportban minden érték egyformán gyakran fordul elő, akkor ennek a csoportnak nincs módja.

Ha egy rangsorolt ​​sorozat két szomszédos értékének gyakorisága azonos, és nagyobb, mint bármely más érték gyakorisága, a mód a két érték átlaga.

Ha egy csoportban két nem szomszédos érték azonos gyakorisággal rendelkezik, és nagyobbak bármely érték gyakoriságánál, akkor két mód van (például a 10, 11, 11, 11 értékkészletben, 12, 13, 14, 14, 14, 17 mód: 11 és tizennégy); ilyen esetben a mérések vagy becslések csoportja az bimodális.

Egy csoportban a legnagyobb mód az egyetlen érték, amely megfelel a mód definíciójának. Az egész csoportban azonban több kisebb mód is lehet. Ezek a kisebb módusok a frekvenciaeloszlás lokális csúcsait jelentik.

Medián (én) a mérési eredmények tartományos sorozatának közepe. Ha az adatok páros számú különálló értéket tartalmaznak, akkor a medián az a pont, amely a két központi érték között félúton van, amikor azok sorrendbe kerülnek.

Számtani átlaga rendezetlen méréssorozat esetén a következő képlettel számítjuk ki:

ahol . Például a 4.1-es adatokhoz; 4,4; 4,5; 4,7; 4.8 Számítsd ki:

.

A központ fent kiszámított mértékeinek mindegyike a legalkalmasabb bizonyos körülmények között.

Az üzemmódot a legegyszerűbben számítják ki - szemmel határozható meg. Ráadásul nagyon nagy adatcsoportok esetén ez az eloszlási középpont meglehetősen stabil mértéke.

A medián a módusz és az átlag között köztes helyet foglal el számítása szempontjából. Ez a mérték különösen könnyen elérhető rangsorolt ​​adatok esetén.

Az átlagos adathalmaz főként aritmetikai műveleteket tartalmaz.

Az átlag értékét az összes eredmény értéke befolyásolja. A medián és a mód nem igényli az összes érték meghatározását. Nézzük meg, mi történik az átlaggal, a mediánnal és a móddal, ha a maximális érték megduplázódik a következő halmazban:

1. készlet: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

2. készlet: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

Az átlag értékét különösen befolyásolják az eredmények, amelyeket „outliernek” nevezünk, azaz. olyan adatok, amelyek messze vannak egy becsléscsoport középpontjától.

A módusz, medián vagy átlag kiszámítása tisztán technikai eljárás. E három mérték kiválasztása és értelmezése azonban gyakran némi átgondolást igényel. A kiválasztási folyamat során a következőket kell beállítani:

– kis csoportokban a divat teljesen instabil lehet. Például csoportos mód: 1, 1, 1, 3, 5, 7, 7, 8 az 1; de ha az egyik nullává válik, a másik kettővé, akkor a mód 7 lesz;

– a mediánt nem befolyásolják a „nagy” és „kis” értékek. Például egy 50 értékből álló csoportban a medián nem változik, ha a legnagyobb érték megháromszorozódik;

– minden érték befolyásolja az átlag értékét. Ha bármelyik érték c egységgel változik, akkor c/n egységgel ugyanabba az irányba változik;

– Egyes adatkészleteknek nincs központi trendje, ami gyakran félrevezető, ha a központi trendnek csak egy mérőszámát számítjuk ki. Ez különösen igaz az egynél több móddal rendelkező csoportokra;

– ha egy adatcsoportot egy nagy szimmetrikus csoport mintájának tekintünk, a minta átlaga valószínűleg közelebb van a nagy csoport középpontjához, mint a medián és a módusz.

Minden átlagos jellemző számos mérési eredmény általános jellemzőjét ad. A gyakorlatban gyakran arra vagyunk kíváncsiak, hogy az egyes eredmények mennyire térnek el az átlagtól. Könnyen elképzelhető azonban, hogy a mérési eredmények két csoportja azonos átlaggal, de eltérő mérési értékkel rendelkezik. Például a 3., 6., 3. sorozatnál - átlagérték = 4; az 5., 2., 5. sorozatok esetében is az átlagérték = 4, a szignifikáns különbség ellenére.

Ezért az átlagos jellemzőket mindig ki kell egészíteni a változási, vagy volatilitási mutatókkal.

A jellemzőkre variációk, vagy volatilitás, a mérési eredmények között szerepel a szórás tartománya, szórása, szórása, variációs együtthatója, a számtani átlag standard hibája.

A variáció legegyszerűbb jellemzője az variációs tartomány. Ez a legnagyobb és a legkisebb mérési eredmények közötti különbség. Azonban csak a szélsőséges eltéréseket rögzíti, de nem tükrözi az összes eredmény eltérését.

Az általánosított jellemző megadásához kiszámíthatja az átlagos eredménytől való eltéréseket. Például a 3., 6., 3. sorban az értékek a következők lesznek: 3 - 4 = - 1; 6-4 = 2; 3 - 4 = - 1. Ezen eltérések összege (- 1) + 2 + (- 1) mindig 0. Ennek elkerülése érdekében az egyes eltérések értékeit négyzetre emeljük: (- 1) 2 + 2 2 + (-1) 2 = 6.

Az érték kifejezettebbé teszi az átlagtól való eltéréseket: a kis eltérések még kisebbek (0,5 2 = 0,25), a nagyok pedig még nagyobbak (5 2 = 25). Az így kapott összeget ún az eltérések négyzetes összege. Ezt az összeget elosztva a mérések számával megkapjuk az eltérések átlagos négyzetét, ill diszperzió. Ezt s 2-vel jelöljük, és a következő képlettel számítjuk ki:

.

Ha a mérések száma nem több 30-nál, pl. n ≤ 30, a következő képletet kell használni:

.

Az n - 1 = k értéket nevezzük szabadsági fokok száma, ami a lakosság szabadon változó tagjainak számát jelenti. Megállapítást nyert, hogy a variációs mutatók számításakor az empirikus sokaság egy-egy tagja mindig nem rendelkezik bizonyos szabadságfokkal.

Ezek a képletek akkor érvényesek, ha az eredményeket egy rendezetlen (szabályos) minta képviseli.

Az oszcillációs jellemzők közül a leggyakrabban használt szórás, amelyet a diszperziós érték négyzetgyökének pozitív értékeként definiálunk, azaz:

.

Szórás vagy szórás az eredmények átlagos értéktől való eltérésének mértékét jellemzi abszolút mértékegységben, és a mérési eredményekkel megegyező egységeket tartalmaz.

Ez a jellemző azonban nem alkalmas két vagy több populáció ingadozásának összehasonlítására különböző mértékegységekkel.

A variációs együttható a szórás és a számtani átlag aránya, százalékban kifejezve. Kiszámítása a következő képlettel történik:

.

A sportgyakorlatban a mérési eredmények változékonysága a szórási együttható értékétől függően kicsinek tekinthető.
(0 - 10%), közepes (11 - 20%) és nagy (V > 20%).

A variációs együtthatónak van nagyon fontos a mérési eredmények statisztikai feldolgozásában, mert relatív érték lévén (százalékban mérve), lehetővé teszi a mérési eredmények ingadozásának összehasonlítását különböző mértékegységekkel. A variációs együttható csak akkor használható, ha a méréseket arányskálán végezzük.

2.4.2. Statisztikai adatok elemzése MS Excelben. Elemző eszközök: leíró statisztika, korreláció.

A Microsoft Excel táblázatok összetétele magában foglalja az úgynevezett elemzési csomagot - olyan eszközkészletet, amelyet összetett statisztikai problémák megoldására terveztek. Ez a csomag makrófüggvények segítségével elemzi a statisztikai adatokat, és lehetővé teszi egyetlen művelet végrehajtását nagyszámú eredmény eléréséhez. Az Excelben elérhető elemzőcsomag többek között a Leíró statisztika és a Korreláció szakaszokat is tartalmazza.

A Leíró statisztika eszköz lehetővé teszi számunkra, hogy számottevő listát kapjunk a számított statisztikai jellemzőkről nagyszámú numerikus sorozatra. A "Korreláció" eszköz segítségével egy korrelációs mátrixot kapunk, amely tartalmazza az összes lehetséges páros korrelációs együtthatót. K sor esetén k (k – 1)/2 korrelációs együtthatót kapunk.

Az elemzőcsomag meghívása az Eszközök – Adatelemzés… menüpont segítségével történik. Ha ez a menüpont hiányzik, az azt jelenti, hogy az elemzőcsomag nincs telepítve. A telepítéshez meg kell hívni a Service - Add-ons... menüpontot, és engedélyezni kell az "Analysis Package" kiegészítőt, OK (lásd 1. ábra).

1. ábra: A bővítmények engedélyezésére/letiltására szolgáló párbeszédpanel

Az „Analysis Package” bővítmény engedélyezése után a Szolgáltatás – Adatelemzés… menüpontot választva a következő párbeszédablak jelenik meg (2. ábra).

2. ábra: Az adatelemzési eszköz kiválasztására szolgáló párbeszédpanel

A Leíró statisztika eszköz kiválasztása és az OK gombra kattintás után egy másik párbeszédpanel jelenik meg (3. ábra), amelyhez bemeneti adatokra és az eredmények megjelenítési helyére van szükség. Itt elég beírni a forrásadatokat tartalmazó cellák körét a "Beviteli intervallum" mezőbe. Megadhat egy tartományt oszlopfejlécekkel, ebben az esetben be kell kapcsolnia a "Címkék az első sorban" jelölőnégyzetet. A kimeneti intervallum megadásához elegendő csak a tartomány bal felső celláját megadni. A számítási eredmények automatikusan elfoglalják a táblázat szükséges sorait és oszlopait.

3. ábra: Leíró statisztikai eszköz párbeszédpanel

Tekintsük a „Leíró statisztikák” elemző eszköz munkáját a következő példán. Egy iskolás csoport (n = 21) vizsgálata során a következő mutatókat mérték: magasság, testsúly, jobb és bal kéz dinamometriája, tüdőkapacitás, Stange-teszt és Genchi-teszt. Az eredményeket táblázatba foglaltuk (4. ábra).

A statisztikai jellemzők megszerzéséhez az elemző csomagot, a Leíró statisztika eszközt fogjuk használni. A "Beviteli intervallum" mezőben adja meg a B1:H22 cellatartományt. Mivel a kiválasztott beviteli intervallum oszlopfejléceket tartalmaz, engedélyezze a "Címkék az első sorban" jelölőnégyzetet. A munka kényelme érdekében válassza az „Új munkalap” lehetőséget az eredmény kimeneti helyeként. Kimeneti adatként bejelöljük a "Végső statisztika" és a "Megbízhatósági szint: 95%" jelölőnégyzeteket. Az utolsó jelölőnégyzet lehetővé teszi, hogy a konfidenciaintervallum paramétereit 0,95-ös megbízhatósági szinttel jelenítse meg. Az eredmény egy kis formázás után az 5. ábrán láthatóhoz fog hasonlítani.

4. ábra Egy iskolás csoport felmérésének eredményei

5. ábra: A "Leíró statisztika" eszköz eredménye

A "Korreláció" eszköz kiválasztása és az "Adatelemzés" párbeszédpanelen az OK gombra kattintás után (2., 6. ábra) egy másik párbeszédpanel jelenik meg (7. ábra), amelyhez bemeneti adatokra és az eredmények megjelenítési helyére van szükség. Itt elég beírni a forrásadatokat tartalmazó cellák körét a "Beviteli intervallum" mezőbe. Megadhat egy tartományt oszlopfejlécekkel, ebben az esetben be kell kapcsolnia a "Címkék az első sorban" jelölőnégyzetet. A kimeneti intervallum megadásához elegendő csak a tartomány bal felső celláját megadni. A számítási eredmények automatikusan elfoglalják a táblázat szükséges sorait és oszlopait.

6. ábra: Az adatelemzési eszköz kiválasztására szolgáló párbeszédpanel

7. ábra Korrelációs eszköz párbeszédpanel

Tekintsük a „Korreláció” elemző eszköz munkáját a 4. ábrán látható példa segítségével.

A korrelációs mátrix megszerzéséhez az elemző csomagot, a "Korreláció" eszközt fogjuk használni. A "Beviteli intervallum" mezőben adja meg a B1:H22 cellatartományt. Mivel a kiválasztott beviteli intervallum oszlopfejléceket tartalmaz, engedélyezze a "Címkék az első sorban" jelölőnégyzetet. A munka kényelme érdekében válassza az „Új munkalap” lehetőséget az eredmény kimeneti helyeként. Az eredmény egy kis formázás után a 8. ábrán láthatóhoz fog hasonlítani.

8. ábra Korrelációs mátrix

Így egyszerű műveletek elvégzésével nagyszámú számítási eredményt kapunk. Megjegyzendő, hogy bár az információtechnológia lehetőségeket nyit meg a kutató számára, hogy az elemzéshez hatalmas mennyiségű információhoz jusson, a leginformatívabb eredmények kiválasztása, a végső értelmezés és a következtetések megfogalmazása a kutató saját feladata.

Kísérleti adatok korrelációs elemzésének alapfogalmai. A korrelációs együttható becslése kísérleti adatokból.

A sportkutatásban gyakran találnak összefüggéseket a vizsgált mutatók között. A megjelenése más. Például az ismert sebességadatokból a gyorsulás meghatározása, Newton második törvénye és egyebek jellemzik az ún. funkcionális függőség vagy kapcsolat, amelyben az egyik mutató minden értéke egy másik szigorúan meghatározott értékének felel meg.

A kapcsolat egy másik típusa például a súlynak a testhossztól való függése. Egy testhossz érték több súlyértéknek is megfelelhet, és fordítva. Ilyen esetekben, amikor az egyik mutató egyik értéke egy másik több értékének felel meg, a kapcsolatot hívják statisztikai.

A sportkutatásban nagy figyelmet fordítanak a különböző mutatók közötti statisztikai összefüggések vizsgálatára, hiszen ez lehetővé teszi bizonyos minták feltárását, majd azok szóbeli és matematikai leírását annak érdekében, hogy az edzőt és a tanárt a gyakorlati munkában felhasználhassuk.

A statisztikai összefüggések közül a legfontosabb korreláció. A korreláció a valószínűségi változók közötti statisztikai függés, amelyben az egyik valószínűségi változó változása a másik matematikai várakozásának (átlagértékének) változásához vezet. Például súlylökés 3 kg és 5 kg. A 3 kg-os súlylökés javulása (átlagosan) az 5 kg-os súlylökés javulását eredményezi.

Az összefüggések vizsgálatára használt statisztikai módszert ún korrelációs elemzés. Fő feladata az alak, tömítettség és irány meghatározása a vizsgált mutatók kapcsolatát. A korrelációs elemzés csak a statisztikai összefüggés feltárását teszi lehetővé. A tesztelméletben széles körben használják megbízhatóságuk és informatívságuk felmérésére. A különböző mérési skálák különböző típusú korrelációelemzést igényelnek.

A kapcsolati együttható értékét a mérésekhez használt skála figyelembevételével számítjuk ki.

Az összefüggés értékeléséhez, ha a méréseket arányok vagy intervallumok skáláján végzik, és a kapcsolat formája lineáris, a Bravais-Pearson korrelációs együtthatót használjuk (a többi mérési skálához tartozó korrelációs együtthatókat ebben a kézikönyvben nem veszik figyelembe). A latin - r betűvel van jelölve. Az r értékének kiszámítása leggyakrabban a következő képlet szerint történik:

,

ahol és az x és y számtani középértékei, valamint a szórások, n– mérések száma (tárgyak).

Egyes esetekben a kapcsolat szorosságát az együttható alapján határozzák meg elhatározások D, amelyet a következő képlettel számítanak ki:

.

Ez az együttható meghatározza az egyik mutató teljes változásának azt a részét, amelyet egy másik mutató változása magyaráz. Például a korrelációs együttható r = -0,677 (a 30 m-es futás és az álló hármasugrás eredményei között). A determinációs együttható egyenlő:

Ebből következően a hármasugrás sporteredményeinek szóródásának 45,8%-a a 30 méteres futás eredményeinek változásával magyarázható, vagyis mindkét vizsgált tulajdonságot olyan közös tényezők befolyásolják, amelyek ezeknek a jellemzőknek az eltérését okozzák. a közös tényezők aránya pedig 45,8%. A fennmaradó 100% - 45,8% = 54,2% a vizsgált jellemzőkre szelektíven ható tényezők arányára esik.

A korrelációs együttható statisztikai szignifikanciájának felmérése azt jelenti, hogy megállapítható, hogy van-e lineáris korreláció az általános sokaságok között, vagy ami megegyezik, annak megállapítása, hogy a minták közötti korrelációs együttható szignifikánsan vagy jelentéktelen mértékben eltér-e a nullától. Ez a probléma megoldható a korrelációs együttható eloszlásának kritikus pontjainak táblázataival a következő sorrendben:

1. Statisztikai hipotéziseket állítunk fel. A H 0 hipotézis azt feltételezi, hogy a vizsgált mutatók között nincs statisztikailag szignifikáns kapcsolat ( r gén=0). A H 1 hipotézis azt sugallja, hogy statisztikailag szignifikáns kapcsolat van a mutatók között ( r gén>0).

2. Kiszámítjuk a korrelációs együttható megfigyelt értékét r obs.

3. A korrelációs együttható kritikus értéke a táblázatban található r crit a minta méretétől függően n, a szignifikancia szint és a kritikus régió típusa (egyoldali vagy kétoldalas).

3. Összehasonlítva r obsés r crit.

Ha egy r obs < r crit– statisztikailag megbízhatatlan (jelentéktelen). A H hipotézist elfogadjuk 0 Ha r obsr crit, a korrelációs együttható statisztikailag szignifikánsnak (szignifikánsnak) tekinthető. A H 1 hipotézist elfogadjuk.