Tələbələr və məktəblilər - dərslərində köməklik. V

Satırlar tikildi kəmiyyətə görə, adlanır variasiyalı.

Dağıtım seriyası ibarətdir seçimlər(xarakteristik dəyərlər) və tezliklər(qrupların sayı). Nisbi qiymətlərlə ifadə olunan tezliklər (kesrlər, faizlər) adlanır tezliklər. Bütün tezliklərin cəminə paylama seriyasının həcmi deyilir.

Növlərinə görə paylama seriyaları bölünür diskret(xarakteristikanın fasiləsiz dəyərləri əsasında qurulur) və interval(xarakteristikanın davamlı dəyərlərinə əsaslanır).

Variasiya seriyası iki sütunu (və ya sətirləri) təmsil edir; bunlardan biri variant adlanan və X ilə işarələnən dəyişən xarakteristikanın fərdi dəyərlərini təmin edir; digərində - hər variantın neçə dəfə (nə qədər tez-tez) baş verdiyini göstərən mütləq rəqəmlər. İkinci sütundakı göstəricilər tezliklər adlanır və şərti olaraq f ilə işarələnir. Bir daha qeyd edək ki, ikinci sütunda tezliklərin ümumi cəmində ayrı-ayrı variantların tezliyinin payını xarakterizə edən nisbi göstəricilərdən istifadə etmək olar. Bu nisbi göstəricilər tezliklər adlanır və şərti olaraq ω ilə işarələnir. Bu halda bütün tezliklərin cəmi birə bərabərdir. Bununla belə, tezliklər də faizlə ifadə edilə bilər və sonra bütün tezliklərin cəmi 100% verir.

Variasiya sıralarının variantları formada ifadə olunarsa diskret kəmiyyətlər, onda belə bir variasiya seriyası adlanır diskret.

Davamlı xüsusiyyətlər üçün variasiya sıraları aşağıdakı kimi qurulur interval, yəni onlarda atributun dəyərləri “...dən...ə qədər” ifadə edilir. Bu halda, belə bir intervalda xarakteristikanın minimum qiymətləri intervalın aşağı həddi, maksimum isə yuxarı həddi adlanır.

İnterval variasiya seriyaları da geniş diapazonda dəyişən diskret xüsusiyyətlər üçün qurulur. İnterval seriyası ilə ola bilər bərabərdirqeyri-bərabər fasilələrlə.

Bərabər intervalların qiymətinin necə təyin olunduğunu nəzərdən keçirək. Aşağıdakı qeydi təqdim edək:

i- interval ölçüsü;

- əhali vahidləri üçün xarakteristikanın maksimum qiyməti;

– əhali vahidləri üçün xarakteristikanın minimum dəyəri;

n – ayrılmış qrupların sayı.

, əgər n məlumdursa.

Əgər fərqləndiriləcək qrupların sayını əvvəlcədən müəyyən etmək çətindirsə, onda kifayət qədər populyasiya ölçüsü ilə intervalın optimal dəyərini hesablamaq üçün 1926-cı ildə Sturgess tərəfindən təklif olunan düstur tövsiyə edilə bilər:

n = 1+ 3.322 log N, burada N məcmu vahidlərin sayıdır.

Qeyri-bərabər intervalların ölçüsü hər bir fərdi halda öyrənilən obyektin xüsusiyyətləri nəzərə alınmaqla müəyyən edilir.

Statistik nümunə paylanması seçimlərin siyahısını və onlara uyğun tezlikləri (və ya nisbi tezlikləri) çağırın.

Statistik bölgü nümunələr cədvəl şəklində göstərilə bilər, birinci sütunda seçimlər, ikincisində isə bu variantlara uyğun tezliklər göstərilir. ni, və ya nisbi tezliklər Pi .

Nümunənin statistik paylanması

İnterval seriyalar, onların formalaşmasının əsasını təşkil edən xüsusiyyətlərin qiymətlərinin müəyyən hədlərdə (intervallar) ifadə edildiyi variasiya seriyalarıdır. Bu vəziyyətdə tezliklər atributun fərdi dəyərlərinə deyil, bütün intervala aiddir.

İnterval paylama sıraları davamlı kəmiyyət xarakteristikalarına, eləcə də əhəmiyyətli hədlər daxilində dəyişən diskret xüsusiyyətlərə əsasən qurulur.

İnterval seriyası intervalları və onların müvafiq tezliklərini göstərən nümunənin statistik paylanması ilə təmsil oluna bilər. Bu zaman intervalın tezliyi kimi bu intervala düşən variantların tezliklərinin cəmi qəbul edilir.

Kəmiyyət davamlı xüsusiyyətlərinə görə qruplaşdırarkən, intervalın ölçüsünü müəyyən etmək vacibdir.

Nümunə orta və seçmə dispersiyasına əlavə olaraq, variasiya seriyasının digər xüsusiyyətlərindən də istifadə olunur.

ModaƏn yüksək tezlikə malik olan variant deyilir.

Statistik təhlildə xüsusi yer tədqiq olunan xarakteristikanın və ya hadisənin orta səviyyəsinin müəyyən edilməsinə aiddir. Orta səviyyəəlamət orta qiymətlərlə ölçülür.

Orta qiymət tədqiq olunan xarakteristikanın ümumi kəmiyyət səviyyəsini xarakterizə edir və statistik əhalinin qrup xassəsidir. Ayrı-ayrı müşahidələrin bu və ya digər istiqamətdə təsadüfi kənarlaşmalarını səviyyələşdirir, zəiflədir və tədqiq olunan xarakteristikanın əsas, tipik xassəsini vurğulayır.

Ortalamalar geniş istifadə olunur:

1. Əhalinin sağlamlıq vəziyyətini qiymətləndirmək üçün: fiziki inkişafın xüsusiyyətləri (boy, çəki, çevrə sinə s.), müxtəlif xəstəliklərin yayılması və müddətini müəyyən etmək, demoqrafik göstəriciləri (əhalinin həyati hərəkəti, orta ömür uzunluğu, əhalinin təkrar istehsalı, əhalinin orta sayı və s.) təhlili.

2. Tibb müəssisələrinin, tibb işçilərinin fəaliyyətini öyrənmək və onların işinin keyfiyyətini qiymətləndirmək, əhalinin ehtiyaclarını planlaşdırmaq və müəyyən etmək. müxtəlif növlər tibbi xidmət (bir rezidentə düşən müraciətlərin və ya ziyarətlərin orta sayı, bir xəstənin xəstəxanada orta qalma müddəti, xəstənin müayinəsinin orta müddəti, həkimlərin, çarpayıların orta mövcudluğu və s.).

3. Sanitariya-epidemioloji vəziyyəti xarakterizə etmək (emalatxanada orta hava tozunun miqdarı, adambaşına düşən orta sahə, zülalların, yağların və karbohidratların orta istehlakı və s.).

4. Normal və patoloji şəraitdə tibbi və fizioloji göstəriciləri müəyyən etmək, laboratoriya məlumatlarını emal edərkən, sosial, gigiyenik, klinik və eksperimental tədqiqatlarda nümunə tədqiqatının nəticələrinin etibarlılığını müəyyən etmək.

Orta dəyərlərin hesablanması variasiya sıraları əsasında aparılır. Variasiya seriyası ayrı-ayrı vahidləri tədqiq olunan xarakteristikanın və ya hadisənin kəmiyyət fərqlərini xarakterizə edən keyfiyyətcə bircins statistik çoxluqdur.

Kəmiyyət dəyişkənliyi iki növ ola bilər: fasiləsiz (diskret) və davamlı.

Fasiləsiz (diskret) atribut yalnız tam ədəd kimi ifadə edilir və heç bir ara dəyərə malik ola bilməz (məsələn, ziyarətlərin sayı, saytın əhalisi, ailədəki uşaqların sayı, ballarda xəstəliyin şiddəti və s.).

Davamlı bir xüsusiyyət, fraksiya daxil olmaqla, müəyyən məhdudiyyətlər daxilində istənilən dəyərləri qəbul edə bilər və yalnız təxminən ifadə edilir (məsələn, çəki - böyüklər üçün kiloqramla, yeni doğulmuşlar üçün isə qramla məhdudlaşdırıla bilər; boy, qan təzyiqi, xəstəni görməyə sərf olunan vaxt və s.).



Variasiya seriyasına daxil olan hər bir fərdi xarakteristikanın və ya fenomenin rəqəmsal dəyəri variant adlanır və hərflə təyin olunur. V . Məsələn, riyazi ədəbiyyatda başqa qeydlərə də rast gəlinir x və ya y.

Hər variantın bir dəfə göstərildiyi variasiya seriyası sadə adlanır. Belə seriyalar kompüter məlumatlarının işlənməsi vəziyyətində əksər statistik məsələlərdə istifadə olunur.

Müşahidələrin sayı artdıqca təkrarlanan variant dəyərləri baş verir. Bu vəziyyətdə yaradılır qruplaşdırılmış variasiya seriyası, təkrarların sayı göstərildiyi yerdə (tezlik, " hərfi ilə qeyd olunur" r »).

Reytinqli variasiya seriyası artan və ya azalan qaydada düzülmüş variantlardan ibarətdir. Həm sadə, həm də qruplaşdırılmış seriyalar sıralama ilə tərtib edilə bilər.

İnterval variasiya seriyasıçox sayda müşahidə vahidi (1000-dən çox) ilə kompüterdən istifadə etmədən aparılan sonrakı hesablamaları sadələşdirmək üçün tərtib edilmişdir.

Davamlı variasiya seriyası istənilən dəyər ola bilən seçim dəyərləri daxildir.

Variasiya seriyasında xarakteristikanın (variantların) qiymətləri fərdi xüsusi ədədlər şəklində verilirsə, belə bir sıra adlanır. diskret.

Ümumi xüsusiyyətlər variasiya silsiləsində əks olunan xarakteristikanın dəyərləri orta qiymətlərdir. Onların arasında ən çox istifadə olunanlar: arifmetik orta böyüklük M, moda Mo və median Mən. Bu xüsusiyyətlərin hər biri unikaldır. Onlar bir-birini əvəz edə bilməz və yalnız birlikdə variasiya seriyasının xüsusiyyətlərini kifayət qədər tam və sıxlaşdırılmış formada təmsil edirlər.

Moda (ay) ən tez-tez baş verən variantların dəyərini adlandırın.

Median (Mən) – bu, sıralanmış variasiya seriyasını yarıya bölən variantın dəyəridir (medianın hər tərəfində variantın yarısı var). Nadir hallarda simmetrik variasiya silsiləsi olduqda rejim və median bir-birinə bərabər olur və arifmetik ortanın qiyməti ilə üst-üstə düşür.

Seçim dəyərlərinin ən tipik xüsusiyyəti arifmetik orta dəyər( M ). Riyaziyyat ədəbiyyatında işarə olunur .

Arifmetik orta (M, ) keyfiyyətcə bircins statistik populyasiyanı təşkil edən tədqiq olunan hadisələrin müəyyən xarakteristikasının ümumi kəmiyyət xarakteristikasıdır. Sadə və çəkili arifmetik ortalamalar var. Sadə arifmetik orta bütün variantları toplamaq və bu məbləği bölmək yolu ilə sadə variasiya seriyası üçün hesablanır. ümumi miqdar seçim bu variasiya seriyasına daxildir. Hesablamalar düstura görə aparılır:

Harada: M - sadə arifmetik orta;

Σ V - məbləğ seçimi;

n- müşahidələrin sayı.

Qruplaşdırılmış variasiya sıralarında çəkili arifmetik orta müəyyən edilir. Onu hesablamaq üçün düstur:

Harada: M - arifmetik çəkili orta;

Σ Vp - variantın hasillərinin onların tezlikləri üzrə cəmi;

n- müşahidələrin sayı.

Əllə hesablamalar halında çox sayda müşahidə ilə anlar metodundan istifadə edilə bilər.

Arifmetik orta aşağıdakı xüsusiyyətlərə malikdir:

· orta göstəricidən kənarlaşmaların cəmi ( Σ d ) sıfıra bərabərdir (Cədvəl 15-ə bax);

· bütün variantları eyni əmsala (bölənə) vurarkən (bölərkən) arifmetik orta eyni əmsala (bölənə) vurulur (bölülür);

· bütün variantlara eyni ədədi əlavə etsəniz (çıxsanız), arifmetik orta eyni sayda artır (azalır).

Hesablandıqları sıraların dəyişkənliyini nəzərə almadan öz-özünə götürülmüş arifmetik ortalar variasiya sıralarının xassələrini tam əks etdirməyə bilər, xüsusən də digər orta qiymətlərlə müqayisə etmək lazım olduqda. Dəyəri yaxın olan ortalar müxtəlif səpilmə dərəcələrinə malik seriyalardan əldə edilə bilər. Fərdi variantlar kəmiyyət xüsusiyyətlərinə görə bir-birinə nə qədər yaxındırsa, bir o qədər azdır dispersiya (salınma, dəyişkənlik) sıra, onun ortalaması daha tipikdir.

Xüsusiyyətin dəyişkənliyini qiymətləndirməyə imkan verən əsas parametrlər bunlardır:

· Əhatə dairəsi;

· Amplituda;

· Standart kənarlaşma;

· Dəyişmə əmsalı.

Xarakterin dəyişkənliyi təxminən variasiya seriyasının diapazonu və amplitudası ilə qiymətləndirilə bilər. Aralıq seriyadakı maksimum (V max) və minimum (V dəq) seçimləri göstərir. Amplituda (A m) bu variantlar arasındakı fərqdir: A m = V max - V min.

Variasiya seriyasının dəyişkənliyinin əsas, ümumi qəbul edilmiş ölçüsüdür dispersiya (D ). Lakin ən çox istifadə edilən parametr dispersiya əsasında hesablanan daha əlverişli parametrdir - standart sapma ( σ ). Bu, sapmanın böyüklüyünü nəzərə alır ( d ) hər variasiya seriyasının arifmetik ortasından ( d=V - M ).

Ortadan kənarlaşmalar müsbət və mənfi ola biləcəyi üçün cəmləndikdə “0” qiymətini verirlər (S d=0). Bunun qarşısını almaq üçün sapma dəyərləri ( d) ikinci dərəcəyə qaldırılır və orta ölçülür. Beləliklə, variasiya seriyasının dispersiyası variantın arifmetik ortadan kənarlaşmalarının orta kvadratıdır və düsturla hesablanır:

Dəyişkənliyin ən mühüm xarakteristikasıdır və bir çox statistik meyarları hesablamaq üçün istifadə olunur.

Dispersiya kənarlaşmaların kvadratı kimi ifadə olunduğu üçün onun dəyəri arifmetik orta ilə müqayisədə istifadə edilə bilməz. Bu məqsədlər üçün istifadə olunur standart sapma, "Sigma" işarəsi ilə təyin olunur ( σ ). Variasiya sıralarının bütün variantlarının arifmetik ortadan orta kənarlaşmasını eyni vahidlərdə xarakterizə edir. orta dəyər, belə ki, onlar birlikdə istifadə edilə bilər.

Standart sapma düsturla müəyyən edilir:

Göstərilən düstur müşahidələrin sayı ( n ) 30-dan çox. Daha kiçik rəqəmlə n standart sapma dəyərində riyazi ofset ilə əlaqəli bir xəta olacaq ( n - 1). Bu baxımdan, daha çox dəqiq nəticə standart sapmanın hesablanması düsturunda belə qərəzliliyi nəzərə almaqla əldə edilə bilər:

standart sapma (s ) təsadüfi kəmiyyətin standart kənarlaşmasının qiymətləndirilməsidir X onun dispersiyasının qərəzsiz qiymətləndirilməsinə əsaslanan riyazi gözləntisinə nisbətən.

Dəyərlərlə n > 30 standart sapma ( σ ) və standart sapma ( s ) eyni olacaq ( σ =s ). Buna görə də əksər praktiki dərsliklərdə bu meyarların müxtəlif mənaları olduğu nəzərə alınır. Excel-də standart kənarlaşma =STDEV(aralıq) funksiyasından istifadə etməklə hesablana bilər. Və standart sapmanı hesablamaq üçün müvafiq düstur yaratmalısınız.

Orta kvadrat və ya standart sapma, bir xarakteristikanın dəyərlərinin orta dəyərdən nə qədər fərqli ola biləcəyini müəyyən etməyə imkan verir. Tutaq ki, orta gündəlik temperatur eyni olan iki şəhər var yay dövrü. Bu şəhərlərdən biri sahildə, digəri isə qitədə yerləşir. Məlumdur ki, sahildə yerləşən şəhərlərdə gündüz temperatur fərqləri ölkə daxilində yerləşən şəhərlərə nisbətən daha azdır. Buna görə də, sahil şəhəri üçün gündüz temperaturunun standart sapması ikinci şəhərdən daha az olacaq. Praktikada bu o deməkdir ki orta temperatur qitədə yerləşən bir şəhərdə hər hansı bir günün havası sahildəki bir şəhərə nisbətən orta qiymətdən daha çox fərqlənəcəkdir. Bundan əlavə, standart sapma, mümkün olan temperatur sapmalarını tələb olunan ehtimal səviyyəsi ilə orta səviyyədən qiymətləndirməyə imkan verir.

Ehtimal nəzəriyyəsinə görə, normal paylanma qanununa tabe olan hadisələrdə arifmetik orta, standart kənarlaşma və variantlar arasında ciddi əlaqə mövcuddur ( üç siqma qaydası). Məsələn, dəyişən bir xarakteristikanın dəyərlərinin 68,3% -i M ± 1 daxilindədir σ , 95,5% - M ± 2 daxilində σ və 99,7% - M ± 3 daxilində σ .

Standart kənarlaşmanın dəyəri variasiya seriyasının və tədqiqat qrupunun homojenliyinin xarakterini mühakimə etməyə imkan verir. Standart sapmanın dəyəri kiçikdirsə, bu, tədqiq olunan fenomenin kifayət qədər yüksək homojenliyini göstərir. Bu vəziyyətdə arifmetik orta müəyyən bir variasiya seriyası üçün olduqca xarakterik hesab edilməlidir. Bununla belə, çox kiçik bir siqma dəyəri müşahidələrin süni seçimi haqqında düşünməyə vadar edir. Çox böyük siqma ilə arifmetik orta variasiya seriyasını daha az dərəcədə xarakterizə edir ki, bu da tədqiq olunan xarakteristikanın və ya hadisənin əhəmiyyətli dəyişkənliyini və ya tədqiq olunan qrupun heterojenliyini göstərir. Bununla belə, standart kənarlaşmanın dəyərinin müqayisəsi yalnız eyni ölçüdə olan xüsusiyyətlər üçün mümkündür. Həqiqətən, yeni doğulmuş uşaqların və böyüklərin çəkilərinin müxtəlifliyini müqayisə etsək, böyüklərdə həmişə daha yüksək siqma dəyərləri alacağıq.

Müxtəlif ölçülü xüsusiyyətlərin dəyişkənliyinin müqayisəsi istifadə edilə bilər variasiya əmsalı. O, müxtəlifliyi orta göstəricinin faizi kimi ifadə edərək, müxtəlif əlamətlər arasında müqayisə aparmağa imkan verir. Tibbi ədəbiyyatda variasiya əmsalı " işarəsi ilə göstərilir. İLƏ ", və riyazi" v"və düsturla hesablanır:

Dəyişmə əmsalının 10%-dən az olan dəyərləri kiçik səpilməni, 10-dan 20%-ə qədər - təxminən orta, 20% -dən çox - arifmetik orta ətrafında güclü səpilməni göstərir.

Arifmetik orta adətən nümunə populyasiyasından alınan məlumatlar əsasında hesablanır. Təkrar tədqiqatlar zamanı təsadüfi hadisələrin təsiri altında arifmetik orta dəyişə bilər. Bu, bir qayda olaraq, mümkün müşahidə vahidlərinin yalnız bir hissəsinin, yəni seçmə populyasiyasının öyrənilməsi ilə əlaqədardır. Öyrənilən fenomeni təmsil edən bütün mümkün vahidlər haqqında məlumatı bütün populyasiyanı öyrənməklə əldə etmək olar, bu həmişə mümkün olmur. Eyni zamanda, eksperimental məlumatların ümumiləşdirilməsi məqsədi ilə ümumi populyasiyada orta göstəricinin dəyəri maraq doğurur. Odur ki, tədqiq olunan hadisə haqqında ümumi nəticəni formalaşdırmaq üçün statistik metodlardan istifadə etməklə seçmə populyasiyası əsasında alınan nəticələr ümumi əhali kütləsinə ötürülməlidir.

Nümunəvi tədqiqat və ümumi əhali arasında razılıq dərəcəsini müəyyən etmək üçün nümunə müşahidəsi zamanı qaçılmaz olaraq yaranan xətanın miqyasını qiymətləndirmək lazımdır. Bu səhv deyilir " Təmsilçiliyin səhvi"və ya "Arifmetik ortanın orta xətası." Bu, əslində seçmə statistik müşahidədən əldə edilən orta göstəricilərlə eyni obyektin davamlı tədqiqindən əldə ediləcək oxşar dəyərlər arasındakı fərqdir, yəni. ümumi əhalini öyrənərkən. Seçim ortası təsadüfi dəyişən olduğundan, belə bir proqnoz tədqiqatçı üçün məqbul olan ehtimal səviyyəsi ilə həyata keçirilir. Tibbi tədqiqatlarda ən azı 95% təşkil edir.

Təcrübə zamanı istifadə olunan adekvat üsul və vasitələrlə minimuma endirilməli olan representasiya xətası qeydiyyat xətaları və ya diqqət xətaları (sürüşmələr, səhv hesablamalar, yazı xətləri və s.) ilə qarışdırıla bilməz.

Reprezentativlik xətasının böyüklüyü həm seçmə ölçüsündən, həm də əlamətin dəyişkənliyindən asılıdır. Müşahidələrin sayı nə qədər çox olarsa, nümunə populyasiyaya bir o qədər yaxın olar və səhv bir o qədər kiçik olar. İşarə nə qədər çox dəyişkəndirsə, statistik səhv bir o qədər böyükdür.

Təcrübədə variasiya sıralarında reprezentativlik xətasını təyin etmək üçün aşağıdakı düsturdan istifadə olunur:

Harada: m – təmsilçilik səhvi;

σ – standart sapma;

n– nümunədəki müşahidələrin sayı.

Formula göstərir ki, orta xətanın ölçüsü standart sapmaya, yəni tədqiq olunan xarakteristikanın dəyişkənliyinə düz mütənasibdir və müşahidələrin sayının kvadrat kökü ilə tərs mütənasibdir.

Nisbi dəyərlərin hesablanması əsasında statistik təhlil apararkən variasiya seriyasının qurulmasına ehtiyac yoxdur. Bu halda, nisbi göstəricilər üçün orta xətanın müəyyən edilməsi sadələşdirilmiş düsturdan istifadə etməklə həyata keçirilə bilər:

Harada: R– faizlə ifadə olunan nisbi göstəricinin qiyməti, ppm və s.;

q– P-nin əksi və göstəricinin hesablandığı əsasdan asılı olaraq (1-P), (100-P), (1000-P) və s. kimi ifadə edilir;

n– nümunə populyasiyasında müşahidələrin sayı.

Bununla birlikdə, nisbi dəyərlər üçün təmsilçilik səhvinin hesablanması üçün göstərilən düstur yalnız göstəricinin dəyəri onun bazasından az olduqda tətbiq edilə bilər. İntensiv göstəricilərin hesablanmasının bir sıra hallarda bu şərt yerinə yetirilmir və göstərici 100% və ya 1000% -dən çox rəqəmlə ifadə edilə bilər. Belə bir vəziyyətdə, bir variasiya seriyası qurulur və standart sapmaya əsaslanan orta dəyərlər üçün düsturdan istifadə edərək təmsilçilik səhvi hesablanır.

Əhalidəki arifmetik orta dəyərinin proqnozlaşdırılması iki dəyəri - minimum və maksimumu göstərməklə həyata keçirilir. Əhalinin istənilən orta dəyərinin dəyişə biləcəyi mümkün sapmaların bu həddindən artıq dəyərləri "adlanır. Güvən sərhədləri».

Ehtimal nəzəriyyəsinin postulatları sübut etdi ki, 99,7% ehtimalı olan bir xarakteristikanın normal paylanması ilə ortanın kənara çıxmalarının ekstremal dəyərləri reprezentativlik xətasının üçqat dəyərindən çox olmayacaq ( M ± 3 m ); 95,5% - orta dəyərin orta xətasından iki dəfədən çox olmayan ( M ± 2 m ); 68,3% - birdən çox orta səhv ( M ± 1 m ) (Şəkil 9).

P%

düyü. 9. Normal paylanmanın ehtimal sıxlığı.

Qeyd edək ki, yuxarıdakı ifadə yalnız normal Qauss paylama qanununa tabe olan xüsusiyyət üçün doğrudur.

Əksər eksperimental tədqiqatlar, o cümlədən tibb sahəsində, nəticələri müəyyən bir intervalda demək olar ki, hər hansı bir dəyəri ala bilən ölçmələrlə əlaqələndirilir, buna görə də, bir qayda olaraq, davamlı təsadüfi dəyişənlər modeli ilə təsvir olunur. Bu baxımdan, əksər statistik metodlar davamlı paylanmaları nəzərə alır. Riyazi statistikada əsas rolu olan belə bir paylanmadır normal və ya Qauss paylanması.

Bu bir sıra səbəblərlə bağlıdır.

1. Əvvəla, bir çox eksperimental müşahidələri normal paylanmadan istifadə etməklə uğurla təsvir etmək olar. Dərhal qeyd etmək lazımdır ki, tam normal olacaq empirik məlumatların heç bir paylanması yoxdur, çünki normal paylanmış təsadüfi dəyişən praktikada heç vaxt rast gəlinməyən -dən -ə qədər dəyişir. Bununla belə, normal paylama çox vaxt təxmini olaraq yaxşı işləyir.

İnsan bədəninin çəkisi, boyu və digər fizioloji parametrlərinin ölçülməsindən asılı olmayaraq, nəticələrə həmişə çox sayda təsadüfi amillər (təbii səbəblər və ölçmə səhvləri) təsir göstərir.

Üstəlik, bir qayda olaraq, bu amillərin hər birinin təsiri əhəmiyyətsizdir. Təcrübə göstərir ki, belə hallarda nəticələr təxminən normal şəkildə paylanacaqdır.

2. Təsadüfi seçmə ilə əlaqəli bir çox paylanma, sonuncunun həcmi artdıqca normal olur.

4. Normal paylanma bir sıra əlverişli riyazi xassələrə malikdir ki, bu da onun statistikada geniş istifadəsini əsasən təmin edir.

Eyni zamanda qeyd etmək lazımdır ki, tibbi məlumatlarda normal paylanma modeli ilə təsvir edilə bilməyən çoxlu eksperimental paylanmalar mövcuddur. Bu məqsədlə statistika adətən “Qeyri-parametrik” adlanan metodlar işləyib hazırlamışdır.

Müəyyən bir təcrübədən əldə edilən məlumatların emalı üçün uyğun olan statistik metodun seçimi, əldə edilən məlumatların normal paylanma qanununa aid olub-olmamasından asılı olaraq aparılmalıdır. İşarənin normal paylanma qanununa tabe olması ilə bağlı fərziyyənin yoxlanılması tezlik paylanması histoqramından (qrafik), həmçinin bir sıra statistik meyarlardan istifadə etməklə həyata keçirilir. Onların arasında:

Asimmetriya meyarı ( b );

Kurtosis üçün test meyarı ( g );

Şapiro-Wilks testi ( W ) .

Hər bir parametr üçün verilənlərin paylanmasının təbiətinin təhlili (paylanmanın normallığı testi də deyilir) aparılır. Parametrin paylanmasının normal qanuna uyğun olub-olmadığını əminliklə mühakimə etmək üçün kifayət qədər çox sayda müşahidə vahidi (ən azı 30 dəyər) tələb olunur.

Normal paylanma üçün əyrilik və kurtoz meyarları 0 qiymətini alır. Paylanma sağa sürüşdürülürsə b > 0 (müsbət asimmetriya), ilə b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. At g > 0 olarsa, paylanma əyrisi daha kəskin olar g < 0 пик более сглаженный, чем функция нормального распределения.

Şapiro-Wilks kriteriyasından istifadə edərək normallığı yoxlamaq üçün statistik cədvəllərdən istifadə edərək bu meyarın qiymətini tələb olunan əhəmiyyət səviyyəsində və müşahidə vahidlərinin sayından (sərbəstlik dərəcələri) asılı olaraq tapmaq lazımdır. Əlavə 1. Normallıq hipotezi bu meyarın kiçik dəyərlərində, bir qayda olaraq, w <0,8.

Variasiya seriyası: tərifi, növləri, əsas xüsusiyyətləri. Hesablama üsulu
tibbi və statistik tədqiqatlarda rejim, median, arifmetik orta
(şərti nümunə ilə göstərin).

Variasiya silsiləsi tədqiq olunan xarakteristikanın bir-birindən böyüklüyünə görə fərqlənən və müəyyən ardıcıllıqla (artan və ya azalan qaydada) düzülən ədədi dəyərlər silsiləsidir. Seriyanın hər bir ədədi dəyəri variant (V) adlanır və müəyyən bir variantın verilmiş seriyada nə qədər tez-tez baş verdiyini göstərən rəqəmlər tezlik (p) adlanır.

Variasiya seriyasını təşkil edən müşahidə hallarının ümumi sayı n hərfi ilə işarələnir. Öyrənilən xüsusiyyətlərin məna fərqinə variasiya deyilir. Dəyişən xüsusiyyətin kəmiyyət ölçüsü yoxdursa, variasiya keyfiyyət, paylanma sırası isə atributiv adlanır (məsələn, xəstəliyin nəticəsi, sağlamlıq vəziyyəti və s. üzrə paylanma).

Əgər dəyişən xarakteristikanın kəmiyyət ifadəsi varsa, belə dəyişkənliyə kəmiyyət, paylanma sırasına isə variasiya deyilir.

Variasiya sıraları kəmiyyət xarakteristikasının xarakterinə görə fasiləsiz və davamlı olaraq - variantın baş vermə tezliyinə görə bölünür;

Sadə variasiya seriyasında hər bir variant yalnız bir dəfə (p=1), çəkili seriyada eyni variant bir neçə dəfə baş verir (p>1). Bu cür seriyaların nümunələri mətndə daha sonra müzakirə ediləcəkdir. Əgər kəmiyyət xarakteristikası davamlıdırsa, yəni. Tam ədədli kəmiyyətlər arasında ara kəsrli kəmiyyətlər var variasiya sırası davamlı adlanır;

Məsələn: 10.0 – 11.9

14.0 - 15.9 və s.

Əgər kəmiyyət xarakteristikası fasiləsizdirsə, yəni. onun fərdi dəyərləri (variantları) bir-birindən tam ədədlə fərqlənir və aralıq fraksiya dəyərləri yoxdur;

Əvvəlki nümunədəki ürək dərəcəsi məlumatlarından istifadə

21 tələbə üçün bir variasiya seriyası quracağıq (Cədvəl 1).

Cədvəl 1

Tibb tələbələrinin ürək dərəcəsinə görə bölgüsü (bpm)

Beləliklə, variasiya seriyası qurmaq mövcud ədədi dəyərləri (variantları) sistemləşdirmək və təşkil etmək deməkdir, yəni. onların müvafiq tezlikləri ilə müəyyən ardıcıllıqla (artan və ya azalan qaydada) düzün. Baxılan misalda variantlar artan qaydada düzülür və tam kəsikli (diskret) ədədlər kimi ifadə edilir, hər seçim bir neçə dəfə baş verir, yəni. biz çəkili, fasiləsiz və ya diskret variasiya seriyası ilə məşğul oluruq.

Bir qayda olaraq, tədqiq etdiyimiz statistik populyasiyada müşahidələrin sayı 30-dan çox deyilsə, o zaman öyrənilən xarakteristikanın bütün qiymətlərini Cədvəldəki kimi artan variasiya seriyasında təşkil etmək kifayətdir. 1 və ya azalan sıra.

At böyük miqdarda müşahidələr (n>30), baş verən variantların sayı çox böyük ola bilər, bu halda interval və ya qruplaşdırılmış variasiya seriyası tərtib edilir, bu zaman sonrakı emalları sadələşdirmək və paylanmanın xarakterini aydınlaşdırmaq üçün variantlar qruplara birləşdirilir. .

Tipik olaraq qrup seçimlərinin sayı 8 ilə 15 arasında dəyişir.

Onların ən azı 5-i olmalıdır, çünki... əks halda çox kobud, həddindən artıq genişlənmə olacaq ki, bu da variasiyanın ümumi mənzərəsini təhrif edir və orta dəyərlərin düzgünlüyünə böyük təsir göstərir. Qrup variantlarının sayı 20-25-dən çox olduqda, orta dəyərlərin hesablanmasının dəqiqliyi artır, lakin xarakteristikanın dəyişməsinin xüsusiyyətləri əhəmiyyətli dərəcədə təhrif edilir və riyazi emal daha mürəkkəbləşir.

Qruplaşdırılmış seriya tərtib edərkən nəzərə almaq lazımdır

− opsion qrupları müəyyən ardıcıllıqla (artan və ya azalan) düzülməlidir;

− variant qruplarında intervallar eyni olmalıdır;

− interval sərhədlərinin dəyərləri üst-üstə düşməməlidir, çünki ayrı-ayrı variantların hansı qruplara təsnif ediləcəyi bəlli olmayacaq;

− interval həddini təyin edərkən toplanmış materialın keyfiyyət xüsusiyyətlərini nəzərə almaq lazımdır (məsələn, böyüklərin çəkisini öyrənərkən 3-4 kq interval məqbuldur, həyatın ilk aylarında isə uşaqlar üçün bu 100 q-dan çox olmamalıdır)

İmtahandan əvvəl 55 tibb tələbəsinin nəbz dərəcəsi (dəqiqədə döyünmə) haqqında məlumatları xarakterizə edən qruplaşdırılmış (interval) sıra quraq: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Qruplaşdırılmış seriya yaratmaq üçün sizə lazımdır:

1. Aralığın ölçüsünü müəyyən edin;

2. Variasiya silsiləsi qruplarının ortasını, başlanğıcını və sonunu müəyyən edin.

● (i) intervalının ölçüsü ehtimal olunan qrupların (r) sayı ilə müəyyən edilir, onların sayı xüsusi cədvələ əsasən müşahidələrin sayından (n) asılı olaraq təyin olunur.

Müşahidələrin sayından asılı olaraq qrupların sayı:

Bizim vəziyyətimizdə 55 tələbə üçün 8-dən 10-a qədər qrup yarada bilərsiniz.

(i) intervalının qiyməti aşağıdakı düsturla müəyyən edilir -

i = V max-V min/r

Bizim nümunəmizdə intervalın qiyməti 82-58/8= 3-dür.

Əgər interval dəyəri olarsa kəsr sayı, nəticə tam ədədə yuvarlaqlaşdırılmalıdır.

Ortalamaların bir neçə növü var:

● arifmetik orta,

● həndəsi orta,

● harmonik orta,

● orta kvadrat,

● orta proqressiv,

● median

Tibbi statistikada arifmetik ortalamalardan ən çox istifadə olunur.

Arifmetik orta (M) bütün əhali üçün xarakterik olanı müəyyən edən ümumiləşdirici dəyərdir. M-nin hesablanması üçün əsas üsullar bunlardır: arifmetik orta metod və momentlər üsulu (şərti kənarlaşmalar).

Sadə arifmetik orta və çəkili arifmetik ortanı hesablamaq üçün arifmetik orta metoddan istifadə olunur. Arifmetik ortanın hesablanması metodunun seçimi variasiya sıralarının növündən asılıdır. Hər bir variantın yalnız bir dəfə baş verdiyi sadə variasiya seriyası vəziyyətində, arifmetik orta düsturla müəyyən edilir:

burada: M – arifmetik orta qiymət;

V – dəyişən xarakteristikanın (variantların) qiyməti;

Σ – hərəkəti göstərir – toplama;

n – müşahidələrin ümumi sayı.

Sadə arifmetik ortanın hesablanmasına bir nümunə. 35 yaşlı 9 kişidə tənəffüs dərəcəsi (dəqiqədə tənəffüs hərəkətlərinin sayı): 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 yaşlı kişilərdə tənəffüs dərəcəsinin orta səviyyəsini müəyyən etmək üçün aşağıdakılar lazımdır:

1. Bütün variantları artan və ya azalan ardıcıllıqla düzən bir variasiya seriyası qurun, çünki sadə variasiya seriyası əldə etdik seçim dəyərləri yalnız bir dəfə baş verir.

M = ∑V/n = 171/9 = dəqiqədə 19 nəfəs

Nəticə. 35 yaşlı kişilərdə tənəffüs sürəti dəqiqədə orta hesabla 19 tənəffüs hərəkətidir.

Variantın fərdi dəyərləri təkrarlanırsa, hər bir variantı sətirdə yazmağa ehtiyac yoxdur, baş verən variant ölçülərini (V) sadalamaq və onların təkrar sayını (p) göstərmək kifayətdir. Variantların, sanki, onlara uyğun gələn tezliklərin sayı ilə ölçüldüyü belə bir variasiya sırası çəkili variasiya seriyası adlanır və hesablanmış orta qiymət çəkili arifmetik ortadır.

Çəkili arifmetik orta düsturla müəyyən edilir: M= ∑Vp/n

burada n - tezliklərin cəminə bərabər olan müşahidələrin sayı – Σр.

Arifmetik çəkili ortanın hesablanmasına nümunə.

Cari ilin birinci rübü ərzində ərazi həkimi tərəfindən müalicə olunan kəskin respirator xəstəlikləri (KRİ) olan 35 xəstədə əlillik müddəti (günlərlə): 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 gün.

Kəskin respirator infeksiyaları olan xəstələrdə əlilliyin orta müddətini təyin etmək üsulu aşağıdakı kimidir:

1. Çəkili variasiya seriyası quraq, çünki Seçimlərin fərdi dəyərləri bir neçə dəfə təkrarlanır. Bunu etmək üçün bütün variantları müvafiq tezlikləri ilə artan və ya azalan qaydada təşkil edə bilərsiniz.

Bizim vəziyyətimizdə variantlar artan qaydada düzülür

2. Aşağıdakı düsturdan istifadə edərək arifmetik çəkili ortanı hesablayın: M = ∑Vp/n = 233/35 = 6,7 gün

Kəskin respirator infeksiyalı xəstələrin əlillik müddətinə görə bölgüsü:

Əlillik müddəti (V) Xəstələrin sayı (p) Vp
∑p = n = 35 ∑Vp = 233

Nəticə. Kəskin respirator xəstəlikləri olan xəstələrdə əlilliyin müddəti orta hesabla 6,7 ​​gün təşkil edib.

Rejim (Mo) variasiya seriyasında ən çox yayılmış seçimdir. Cədvəldə təqdim olunan paylama üçün rejim 10-a bərabər olan bir seçimə uyğundur, digərlərindən daha tez-tez baş verir - 6 dəfə.

Xəstələrin xəstəxana çarpayısında qalma müddətinə görə bölgüsü (günlərlə)

V
səh

Bəzən rejimin dəqiq ölçüsünü müəyyən etmək çətindir, çünki tədqiq olunan məlumatlarda bir neçə "ən çox yayılmış" müşahidələr ola bilər.

Median (Me) variasiya seriyasını iki bərabər yarıya bölən qeyri-parametrik göstəricidir: eyni sayda variantlar medianın hər iki tərəfində yerləşir.

Məsələn, cədvəldə göstərilən paylama üçün median 10-dur, çünki bu dəyərin hər iki tərəfində 14-cü variant var, yəni. 10 rəqəmi bu seriyada mərkəzi mövqe tutur və onun medianıdır.

Bu misaldakı müşahidələrin sayının cüt (n=34) olduğunu nəzərə alsaq, medianı aşağıdakı kimi müəyyən etmək olar:

Mən = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Bu o deməkdir ki, seriyanın ortası 10-a bərabər mediana uyğun gələn on yeddinci varianta düşür. Cədvəldə təqdim olunan paylanma üçün arifmetik orta bərabərdir:

M = ∑Vp/n = 334/34 = 10.1

Beləliklə, cədvəldən 34 müşahidə üçün. 8, əldə etdik: Mo=10, Me=10, arifmetik orta (M) 10,1-dir. Bizim nümunəmizdə hər üç göstərici tamamilə fərqli olsa da, bərabər və ya bir-birinə yaxın oldu.

Arifmetik orta, müəyyən bir fenomen və ya populyasiya üçün çox vaxt atipik olan, istisnasız olaraq bütün variantların təsirli cəmidir;

Rejim və median, arifmetik ortadan fərqli olaraq, dəyişən xarakteristikanın bütün fərdi dəyərlərinin dəyərindən (ekstremal variantların dəyərləri və seriyanın dağılma dərəcəsi) asılı deyildir. Arifmetik orta müşahidələrin bütün kütləsini, rejim və median isə kütləni xarakterizə edir.

Statistik paylanma seriyası– bu, müəyyən dəyişən xüsusiyyətə görə əhali vahidlərinin qruplara nizamlı şəkildə bölünməsidir.
Paylanma sıralarının formalaşmasının əsasını təşkil edən xüsusiyyətdən asılı olaraq, var atributiv və variasiya paylama seriyaları.

Ümumi xarakteristikanın olması öyrənilən obyektlərin ümumi xüsusiyyətlərinin təsviri və ya ölçülməsinin nəticələrini əks etdirən statistik əhalinin formalaşması üçün əsasdır.

Statistikada öyrənilən mövzu dəyişən (dəyişən) xüsusiyyətlər və ya statistik xüsusiyyətlərdir.

Statistik xüsusiyyətlərin növləri.

Dağıtım seriyaları atributiv adlanır keyfiyyət meyarlarına uyğun tikilmişdir. Atributiv– bu, adı olan işarədir (məsələn, peşə: tikişçi, müəllim və s.).
Dağıtım seriyası adətən cədvəllər şəklində təqdim olunur. Cədvəldə 2.8 atribut paylama seriyasını göstərir.
Cədvəl 2.8 - Rusiya Federasiyasının bölgələrindən birinin vətəndaşlarına vəkillər tərəfindən göstərilən hüquqi yardım növlərinin bölgüsü.

Variasiya seriyası– bunlar xarakteristikanın dəyərləri (və ya qiymət intervalları) və onların tezlikləridir.
Variasiya seriyaları paylama seriyalarıdır, kəmiyyət əsasında qurulmuşdur. İstənilən variasiya seriyası iki elementdən ibarətdir: variantlar və tezliklər.
Variantlar bir variasiya seriyasında götürdüyü bir xüsusiyyətin fərdi dəyərləri hesab olunur.
Tezliklər fərdi variantların və ya variasiya seriyasının hər bir qrupunun nömrələridir, yəni. Bunlar bir paylama seriyasında müəyyən variantların nə qədər tez-tez baş verdiyini göstərən rəqəmlərdir. Bütün tezliklərin cəmi bütün əhalinin ölçüsünü, həcmini müəyyən edir.
Tezliklər vahidin fraksiyaları və ya ümuminin faizi kimi ifadə edilən tezliklərdir. Müvafiq olaraq, tezliklərin cəmi 1 və ya 100% -ə bərabərdir. Variasiya seriyası faktiki məlumatlar əsasında paylama qanununun formasını qiymətləndirməyə imkan verir.

Xarakterin variasiyasının xarakterindən asılı olaraq, var diskret və interval variasiya sıraları.
Diskret variasiya seriyasının nümunəsi cədvəldə verilmişdir. 2.9.
Cədvəl 2.9 - Rusiya Federasiyasında 1989-cu ildə fərdi mənzillərdə tutulan otaqların sayına görə ailələrin bölgüsü.

Cədvəlin birinci sütununda diskret variasiya seriyası üçün seçimlər, ikinci sütunda variasiya seriyasının tezlikləri, üçüncüsündə isə tezlik göstəriciləri yer alır.

Variasiya seriyası

Ümumi populyasiyada müəyyən kəmiyyət xarakteristikası öyrənilir. Həcm nümunəsi ondan təsadüfi olaraq çıxarılır n, yəni nümunə elementlərinin sayı bərabərdir n. Statistik emalın birinci mərhələsində diapazonlu nümunələr, yəni. nömrə sifarişi x 1 , x 2 , …, x n Artan. Hər bir müşahidə olunan dəyər x içağırdı seçim. Tezlik m i dəyərin müşahidələrinin sayıdır x i nümunədə. Nisbi tezlik (tezlik) w i tezlik nisbətidir m i nümunə ölçüsünə n: .
Variasiya sıralarını öyrənərkən yığılmış tezlik və yığılmış tezlik anlayışlarından da istifadə olunur. Qoy x bəzi nömrə. Sonra variantların sayı , kimin dəyərləri azdır x, yığılmış tezlik adlanır: x i üçün n yığılmış tezlik w i max adlanır.
Fərdi dəyərləri (variantları) bir-birindən müəyyən sonlu dəyərlə (adətən tam ədəd) fərqlənirsə, xarakteristikaya diskret dəyişən deyilir. Belə bir xarakteristikanın variasiya sırasına diskret variasiya seriyası deyilir.

Cədvəl 1. Tezliklərin diskret variasiya seriyasının ümumi görünüşü

Xarakterik dəyərlərx i x 1 x 2 x n
Tezliklərm i m 1 m 2 m n

Bir xarakteristikaya davamlı dəyişən deyilir, əgər onun dəyərləri bir-birindən ixtiyari az miqdarda fərqlənirsə, yəni. işarə müəyyən intervalda istənilən qiymət ala bilər. Belə bir xüsusiyyət üçün davamlı variasiya seriyası interval adlanır.

Cədvəl 2. Tezliklərin interval variasiya sıralarının ümumi görünüşü

Cədvəl 3. Variasiya seriyasının qrafik təsvirləri

SıraÇoxbucaqlı və ya histoqramEmpirik paylama funksiyası
Diskret
Interval
Müşahidələrin nəticələrini nəzərdən keçirərək, hər bir xüsusi intervala variantların neçə dəyərinin düşdüyü müəyyən edilir. Hər bir intervalın onun uclarından birinə aid olduğu güman edilir: ya bütün hallarda solda (daha tez-tez) və ya bütün hallarda sağda, tezliklər və ya tezliklər isə göstərilən sərhədlər daxilində olan variantların sayını göstərir. Fərqlər a i – a i +1 qismən intervallar adlanır. Sonrakı hesablamaları sadələşdirmək üçün interval dəyişikliyi seriyası şərti diskret ilə əvəz edilə bilər. Bu vəziyyətdə orta dəyər i-interval variant kimi götürülür x i, və müvafiq interval tezliyi m i– bu intervalın tezliyi üçün.
Variasiya sıralarının qrafik təsviri üçün ən çox istifadə edilənlər çoxbucaqlı, histoqram, kumulyativ əyri və empirik paylanma funksiyasıdır.

Cədvəldə 2.3 (1994-cü ilin aprelində Rusiya əhalisinin adambaşına düşən orta gəlirə görə qruplaşdırılması) təqdim olunur. interval variasiya seriyası.
Paylanmanın formasını mühakimə etməyə imkan verən qrafik təsvirdən istifadə edərək paylama seriyalarını təhlil etmək rahatdır. Variasiya sıralarının tezliklərindəki dəyişikliklərin təbiətinin vizual təsviri ilə verilir çoxbucaqlı və histoqram.
Çoxbucaqlı diskret variasiya seriyalarını təsvir edərkən istifadə olunur.
Məsələn, mənzil fondunun mənzillərin növləri üzrə bölgüsünü qrafik şəkildə təsvir edək (Cədvəl 2.10).
Cədvəl 2.10 - Şəhər ərazisinin mənzil fondunun mənzillərin növlərinə görə bölgüsü (şərti rəqəmlər).


düyü. Mənzil paylama sahəsi


Ordinat oxları üzərində təkcə tezlik qiymətləri deyil, həm də variasiya sıralarının tezlikləri çəkilə bilər.
Histoqram interval variasiya seriyasını təsvir etmək üçün istifadə olunur. Histoqram qurarkən, aralıqların dəyərləri absis oxunda, tezliklər isə müvafiq intervallar üzərində qurulmuş düzbucaqlılarla təsvir edilir. Bərabər intervallar olduqda sütunların hündürlüyü tezliklərə mütənasib olmalıdır. Histoqram, seriyanın bir-birinə bitişik çubuqlar şəklində təsvir olunduğu bir qrafikdir.
Cədvəldə verilmiş interval paylanma sıralarını qrafik şəkildə təsvir edək. 2.11.
Cədvəl 2.11 - Bir nəfərə düşən yaşayış sahəsinin ölçüsünə görə ailələrin bölgüsü (şərti rəqəmlər).
N p/p Adambaşına düşən yaşayış sahəsinin ölçüsünə görə ailə qrupları Verilmiş yaşayış sahəsi olan ailələrin sayı Ailələrin məcmu sayı
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ÜMUMİ 115 ----


düyü. 2.2. Adambaşına düşən yaşayış sahəsinin ölçüsünə görə ailələrin paylanması histoqramı


Yığılmış seriyanın məlumatlarından istifadə edərək (cədvəl 2.11) qururuq toplanan paylama.


düyü. 2.3. Adambaşına düşən yaşayış sahəsinin ölçüsünə görə ailələrin məcmu bölgüsü


Variasiya seriyasının kumulyat şəklində təqdim edilməsi xüsusilə tezlikləri seriya tezliklərinin cəminin fraksiyaları və ya faizləri ilə ifadə olunan variasiya seriyaları üçün effektivdir.
Variasiya seriyasını kumulyasiya şəklində qrafik olaraq təsvir edərkən oxları dəyişdirsək, onda alırıq ogiva. Şəkildə. 2.4-də Cədvəldəki məlumatlar əsasında qurulmuş bir ogiv göstərilir. 2.11.
Düzbucaqlıların tərəflərinin orta nöqtələrini tapmaq və sonra bu nöqtələri düz xətlərlə birləşdirməklə histoqramı paylama poliqonuna çevirmək olar. Nəticə paylama poliqonu Şəkildə göstərilmişdir. 2.2 nöqtəli xətt ilə.
Qeyri-bərabər intervallara malik variasiya sıralarının paylanması histoqramını qurarkən ordinat oxu boyunca tezliklər deyil, xarakteristikanın müvafiq intervallarda paylanmasının sıxlığı çəkilir.
Paylanma sıxlığı vahid interval eni üçün hesablanan tezlikdir, yəni. hər qrupda neçə vahid interval dəyəri vahidinə düşür. Paylanma sıxlığının hesablanması nümunəsi cədvəldə təqdim olunur. 2.12.
Cədvəl 2.12 - Müəssisələrin işçilərin sayına görə bölgüsü (şərti rəqəmlər)
N p/p İşçilərin sayına görə müəssisə qrupları, adamlar. Müəssisələrin sayı Interval ölçüsü, insanlar. Paylanma sıxlığı
A 1 2 3=1/2
1 20-yə qədər 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ÜMUMİ 147 ---- ----

Variasiya seriyalarını qrafik şəkildə təmsil etmək üçün də istifadə edilə bilər kumulyativ əyri. Kumulyatdan (cəm əyrisindən) istifadə edərək bir sıra yığılmış tezliklər təsvir olunur. Kumulyativ tezliklər qruplar üzrə tezliklərin ardıcıl cəmlənməsi ilə müəyyən edilir və populyasiyada neçə vahidin nəzərdən keçirilən dəyərdən çox olmayan atribut dəyərlərinə malik olduğunu göstərir.


düyü. 2.4. Ailələrin adambaşına düşən yaşayış sahəsinin ölçüsünə görə bölgüsü

İnterval variasiya seriyasının kumulyatlarını qurarkən, silsilənin variantları absis oxu boyunca, yığılmış tezliklər isə ordinat oxu boyunca çəkilir.

Davamlı variasiya seriyası

Davamlı variasiya seriyası - kəmiyyət statistik xarakteristikası əsasında qurulan sıra. Misal. Bu ilin payız-qış dövründə məhkumların orta xəstəlik müddəti (adambaşına düşən gün) olub:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

Müasir elmi inkişafları həyata keçirərkən xüsusilə vacib olan böyük həcmli məlumatların işlənməsi zamanı tədqiqatçının qarşısında mənbə məlumatlarını düzgün qruplaşdırmaq kimi ciddi vəzifə durur. Əgər məlumatlar diskret xarakter daşıyırsa, onda gördüyümüz kimi, heç bir problem yaranmır - sadəcə olaraq hər bir xüsusiyyətin tezliyini hesablamaq lazımdır. Tədqiq olunan xüsusiyyət varsa davamlı xarakter (praktikada daha çox yayılmışdır), onda xüsusiyyət qruplaşdırma intervallarının optimal sayını seçmək heç bir əhəmiyyət kəsb etmir.

Davamlı təsadüfi dəyişənləri qruplaşdırmaq üçün xarakteristikanın bütün variasiya diapazonu müəyyən sayda intervala bölünür. Kimə.

Qruplaşdırılmış interval (davamlı) variasiya seriyası atributunun () dəyəri ilə sıralanan intervallar adlanır, burada r"-ci intervala düşən müşahidələrin sayı və ya nisbi tezliklər (), müvafiq tezliklərlə () ilə birlikdə göstərilir:

Xarakterik dəyər intervalları

mi tezlik

Histoqramtoplamaq (ogiva), artıq bizim tərəfimizdən ətraflı müzakirə edilmiş, məlumatların vizuallaşdırılması üçün əla vasitədir və məlumat strukturu haqqında ilkin təsəvvür əldə etməyə imkan verir. Belə qrafiklər (şəkil 1.15) fasiləsiz verilənlər üçün diskret verilənlər üçün olduğu kimi, yalnız fasiləsiz verilənlərin istənilən qiymətləri alaraq onun mümkün qiymətlərinin regionunu tamamilə doldurması nəzərə alınmaqla qurulur.

düyü. 1.15.

Buna görə histoqramdakı sütunlar və kumulyasiya bir-birinə toxunmalı və atribut dəyərlərinin mümkün olan bütün sahələrə düşmədiyi sahələr olmamalıdır.(yəni histoqramma və kumulyasiyalarda Şəkil 1.16-da olduğu kimi tədqiq olunan dəyişənin dəyərlərini ehtiva etməyən absis oxu boyunca “deşiklər” olmamalıdır). Çubuğun hündürlüyü tezlikə - müəyyən bir intervala düşən müşahidələrin sayına və ya nisbi tezlikə - müşahidələrin nisbətinə uyğundur. Intervallar kəsişməməlidir və adətən eyni genişlikdədir.

düyü. 1.16.

Histoqram və çoxbucaqlı ehtimal sıxlığı əyrisinin təxminləridir (diferensial funksiya) f(x) ehtimal nəzəriyyəsi kursunda nəzərdən keçirilən nəzəri paylanma. Buna görə də, onların qurulması kəmiyyət davamlı məlumatların ilkin statistik emalı üçün çox vacibdir - onların görünüşü ilə hipotetik paylanma qanununu mühakimə etmək olar.

Kumulyasiya – interval dəyişmə seriyasının yığılmış tezliklərinin (tezliklərinin) əyrisi. Kumulyativ paylanma funksiyasının qrafiki kumulyasiya ilə müqayisə edilir F(x), ehtimal nəzəriyyəsi kursunda da müzakirə olunur.

Əsasən, histoqramma və kumulyasiya anlayışları xüsusi olaraq davamlı verilənlər və onların interval dəyişmə seriyaları ilə əlaqələndirilir, çünki onların qrafikləri müvafiq olaraq ehtimal sıxlığı funksiyası və paylanma funksiyasının empirik təxminləridir.

İnterval variasiya seriyasının qurulması intervalların sayını təyin etməklə başlayır k. Və bu məsələ araşdırılan məsələdə bəlkə də ən çətin, vacib və mübahisəlidir.

Fasilələrin sayı çox kiçik olmamalıdır, çünki bu histoqramı çox hamar edəcək ( həddindən artıq hamarlanmış), orijinal məlumatların dəyişkənliyinin bütün xüsusiyyətlərini itirir - Şek. 1.17-də Şəkil 1-dəki qrafiklərin eyni məlumatların necə olduğunu görə bilərsiniz. 1.15, daha az intervalla histoqram qurmaq üçün istifadə olunur (soldakı qrafik).

Eyni zamanda, intervalların sayı çox böyük olmamalıdır - əks halda biz tədqiq olunan məlumatların ədədi ox boyunca paylanma sıxlığını qiymətləndirə bilməyəcəyik: histoqram az hamarlanacaq. (az hamarlanmış), boş intervallarla, qeyri-bərabər (bax. Şəkil 1.17, sağdakı qrafik).

düyü. 1.17.

Ən çox üstünlük verilən intervalların sayını necə təyin etmək olar?

Hələ 1926-cı ildə Herbert Sturges, tədqiq olunan xarakteristikanın orijinal dəyər dəstini bölmək lazım olan intervalların sayını hesablamaq üçün bir düstur təklif etdi. Bu düstur həqiqətən də son dərəcə populyarlaşdı - əksər statistik dərsliklər bunu təklif edir və bir çox statistik paketlər ondan standart olaraq istifadə edir. Bunun nə dərəcədə əsaslı olduğu və bütün hallarda çox ciddi sualdır.

Beləliklə, Sturges düsturu nəyə əsaslanır?

binom paylanmasına nəzər salın)