Paloturvallisuuden tietosanakirja

Tuntemattoman parametrin tilastollisen arvion määrittäminen. Pistearvio ja sen ominaisuudet. Arvosanan vertailu ja tehokkuus

Tilastollisen arvioinnin kysymykset yhdistävät matemaattisen tilaston ongelmallisia näkökohtia, kuten tieteellinen metodologia, satunnaismuuttujat, tilastolliset jakaumat jne. Jokaisessa otoksessa on luontaisia ​​virheitä, jotka johtuvat yksiköiden puutteellisesta kattamisesta, mittausvirheistä ja vastaavista syistä. Tällaiset virheet tosielämässä antavat jokaiselle hypoteesille (erityisesti taloudellisten päätelmien perusteella muotoillulle) satunnaisen, stokastisen luonteen. Riippumatta teoreettisten hypoteesien antamien muuttujien lukumäärästä oletetaan, että erilaisten virheiden vaikutus voidaan kuvata tarkasti käyttämällä vain yhtä komponenttia. Tämän metodologisen lähestymistavan avulla voimme rajoittua yksiulotteiseen todennäköisyysjakaumaan useiden parametrien samanaikaisen estimoinnilla.

Tilastollinen arviointi on yksi kahdesta tilastollisen arvioinnin tyypistä (toinen tyyppi on hypoteesien testaus). Se on erityinen menetelmä yleisen populaation jakauman ominaisuuksien (parametrien) numeeristen arvojen arvioimiseksi tämän populaation otostietojen perusteella. Toisin sanoen valikoivan havainnoinnin tuloksilla yritämme arvioida (suurimmalla tarkkuudella) tiettyjen parametrien arvot, joista meitä kiinnostavan ominaisuuden (korvattava) jakautuminen riippuu yleisestä väestöstä. Koska otokseen kuuluu vain osa perusjoukosta (joskus hyvin pieni määrä), virheriski on olemassa. Huolimatta tämän riskin vähenemisestä havainnointiyksiköiden määrän lisääntyessä, se tapahtuu edelleen valikoivan havainnoinnin aikana. Näin ollen otoksen tulosten perusteella tehty päätös on luonteeltaan todennäköisyyspohjainen. Mutta olisi väärin tarkastella tilastollisia arvioita vain todennäköisyyksien kannalta. Tämä lähestymistapa ei aina riitä muodostamaan oikeita teoreettisia oletuksia yleisen populaation parametreista. Usein tarvitaan useita lisätuomioita syvemmän perustelun saamiseksi. Esimerkiksi alueen yritysten keskimääräistä ammattitaitoista työvoimaa on arvioitava mahdollisimman tarkasti. Tässä tapauksessa estimoidaan muuttujan x aritmeettinen keskiarvo normaalijakauman omaavasta yleisjoukosta. Saatuaan näytteen tästä määritteestä summassa P yksikköä, on tarpeen ratkaista kysymys: mikä arvo olisi otantatietojen mukaan lähimpänä yleisen perusjoukon keskiarvoa? Tällaisia ​​arvoja on useita, joiden matemaattinen odotus on yhtä suuri kuin haluttu parametri (tai lähellä sitä): a) aritmeettinen keskiarvo; b) muoti; c) mediaani; d) vaihteluvälin perusteella laskettu keskiarvo jne.

Todennäköisyysnäkökulmasta katsottuna jokaisen edellä mainitun suuren voidaan katsoa antavan parhaan likiarvon halutulle populaatioparametrille (x), koska kunkin funktion matemaattinen odotus (erityisesti suurille näytteille) on yhtä suuri kuin yleinen keskiarvo. . Tämä oletus johtuu siitä, että toistamalla otosta samasta yleisjoukosta saadaan "keskimäärin" oikea tulos.

Oikeus "keskimäärin" selittyy ilmaantuvien virheiden positiivisten ja negatiivisten poikkeamien toistojen yhtäläisyydellä yleisen keskiarvon estimoinnissa, eli keskimääräinen estimointivirhe on nolla.

Käytännössä pääsääntöisesti on järjestetty yksi näyte, joten tutkijaa kiinnostaa kysymys halutun parametrin tarkemmasta arvioinnista tietyn otoksen tulosten perusteella. Tällaisen ongelman ratkaisemiseksi tarvitaan abstraktista todennäköisyyksien laskennasta suoraan seuraavien päätelmien lisäksi lisäsääntöjä, joilla motivoidaan estimaatin paras approksimaatio yleisen perusjoukon haluttuun parametriin.

On olemassa riittävä määrä tapoja arvioida vakioita näytehavaintojen perusteella. Mitkä niistä ovat parhaita tiettyjen tutkimusongelmien ratkaisemisessa - käsittelee tilastollisen arvioinnin teoriaa. Se tutkii ehtoja, joita tämän tai toisen arvioinnin tulee noudattaa, keskittyy arvioihin, jotka ovat suositeltavia tietyissä olosuhteissa. Arviointiteoria osoittaa yhden arvioinnin paremmuuden toiseen verrattuna.

Kuten tiedätte, otoksen perusteella saadut tiedot eivät ole johtopäätöksessä kategorisia. Jos esimerkiksi 100 tutkitusta eläimestä 99 osoittautui terveeksi sairautensa vuoksi, niin on mahdollista, että yksi tutkimatta jäänyt eläin kantaa väitetyn taudin virusta. Koska tämä on epätodennäköistä, päätellään, että tautia ei ole olemassa. Useimmissa tapauksissa tämä johtopäätös on täysin perusteltu.

Tällaisten johtopäätösten ohjaamana käytännön toiminnassa kokeilija (tutkija) ei luota tiedon luotettavuuteen, vaan ainoastaan ​​sen todennäköisyyteen.

Otoshavainnoinnin toinen puoli, kuten jo todettiin, ratkaisee ongelman määrittää saatujen otantaestimaattien luotettavuusaste mahdollisimman objektiivisesti. Tämän ongelman ratkaisu yrittää tarjota tarkimman todennäköisyyslausekkeen, eli puhumme estimaatin tarkkuusasteen määrittämisestä. Tässä tutkija määrittelee rajat mahdolliselle erolle otoksesta saadun arvion ja sen arvon todellisen arvon välillä yleisessä perusjoukossa.

Arvion tarkkuus johtuu sen otostietojen mukaisesta laskentamenetelmästä ja otoksen yksiköiden valintamenetelmästä.

Arvioiden hankintamenetelmään sisältyy mikä tahansa laskennallinen menettely (menetelmä, sääntö, algebrallinen kaava). Tämä on tilastollisen arvioinnin teorian prioriteetti. Valintamenetelmät johtavat kysymyksiin otantatutkimuksen suorittamisen tekniikasta.

Edellä oleva antaa meille mahdollisuuden määritellä "tilastollisen arvioinnin" käsite.

Tilastollinen arviointi- tämä on yleisen perusjoukon halutun parametrin likimääräinen arvo, joka saadaan otoksen tuloksista ja tarjoaa mahdollisuuden tehdä tietoisia päätöksiä yleisen perusjoukon tuntemattomista parametreista.

Oletetaan, että ^ "on tilastollinen arvio teoreettisen jakauman tuntemattomasta parametrista ^. Toistamalla sama

Otoskoko löytyi populaatiosta arvioita ja 2 ^ ""n,

joilla on erilaisia ​​merkityksiä. Siksi arviota ^ ", voidaan pitää

satunnaismuuttuja, ja +17 kaksi, 3 ~ "n - sen mahdollisina arvoina. Satunnaismuuttujana sille on ominaista tietty todennäköisyystiheysfunktio. Koska tämä funktio johtuu valikoivan havainnon (kokeilun) tuloksesta, se on nimeltään valikoiva jakelu. Tällainen funktio kuvaa kunkin estimaatin todennäköisyystiheyttä käyttämällä tiettyä määrää otoksia

havainnot. Jos oletetaan, että tilastollinen estimaatti ^ ", on tietyn tietojoukon algebrallinen funktio ja tällainen joukko saadaan valikoivan havainnoinnin aikana, niin

Yleensä estimaatti saa lausekkeen: ® n = f (Xl.X2, ^ 3, ... X t).

Otostutkimuksen lopussa tämä toiminto ei ole enää yleinen arvio, vaan se saa tietyn arvon, eli siitä tulee määrällinen arvio (luku). Toisin sanoen yllä olevasta funktion lausekkeesta seuraa, että mitä tahansa otoshavainnon tuloksia karakterisoivaa indikaattoria voidaan pitää estimaatina. Otoskeskiarvo on arvio väestön keskiarvosta. Otuksesta laskettu varianssi tai siitä laskettu keskihajonnan arvo ovat arvioita yleisen perusjoukon vastaavista ominaisuuksista jne.

Kuten jo todettiin, tilastollisten arvioiden laskeminen ei takaa virheiden poistamista. Tärkeintä on, että jälkimmäisen ei pitäisi olla järjestelmällistä. Niiden läsnäolon tulee olla satunnaista. Tarkastellaanpa tämän määräyksen metodologista puolta.

Oletetaan, että estimaatti ^ "antaa epätarkan arvon väestön arviolle ^, jossa on epäkohta. Tässä tapauksessa jokainen laskettu arvo = 1,2,3, ..., n) on pienempi kuin arvon todellinen arvo. arvo $.

Tästä syystä satunnaismuuttujan matemaattinen odotus (keskiarvo) in on pienempi kuin in, eli (M (^ n. Ja päinvastoin, jos se antaa ylimääräisen arvion, niin matemaattinen odotus

satunnainen ^" tulee suuremmiksi kuin $.

Tästä seuraa, että tilastollisen arvion, jonka matemaattinen odotus ei ole sama kuin estimoitu parametri, käyttö johtaa systemaattisiin virheisiin, eli ei-satunnaisiin virheisiin, jotka vääristävät mittaustuloksia yhteen suuntaan.

Syntyy luonnollinen vaatimus: estimaatin matemaattisen odotuksen ^" tulee olla yhtä suuri kuin arvioitu parametri. Tämän vaatimuksen noudattaminen ei yleensä poista virheitä, koska estimaatin otosarvot voivat olla suurempia tai pienempiä kuin todellinen arvo Mutta virheitä arvoista ^ tapahtuu yhteen ja toiseen suuntaan (todennäköisyysteorian mukaan) samalla tiheydellä. Näin ollen tämän vaatimuksen noudattaminen edellyttää otosestimaatin matemaattista odotusta. olla yhtä suuri kuin arvioitu parametri, eliminoi systemaattisten (ei-satunnaisten) virheiden vastaanottamisen, eli

M (sisään) = 6.

Arvioidun parametrin parhaan approksimation antavan tilastollisen arvion valinta on tärkeä ongelma estimointiteoriassa. Jos tiedetään, että tutkittavan satunnaismuuttujan jakauma yleisväestössä vastaa normaalijakauman lakia, on tarpeen arvioida matemaattinen odotusarvo ja keskihajonna otostiedoista. Tämä selittyy sillä, että nämä kaksi ominaisuutta määrittävät täysin perusteet, joille normaalijakauma rakennetaan. Jos tutkittava satunnaismuuttuja jakautuu Poissonin lain mukaan, parametri ^ arvioidaan, koska se määrittää tämän jakauman.

Matemaattisissa tilastoissa erotetaan sellaiset menetelmät tilastollisten arvioiden saamiseksi otantatiedoista: momenttien menetelmä, maksimitodennäköisyyden menetelmä.

Kun arvioita saadaan momenttimenetelmällä, yleisen perusjoukon momentit korvataan otosjoukon momenteilla (painotodennäköisyyksien sijaan käytetään taajuuksia).

Jotta tilastollinen arvio voisi antaa "parhaan likiarvon" yleiselle ominaisuudelle, sillä on oltava useita ominaisuuksia. Niitä käsitellään alla.

Mahdollisuus valita paras arvio perustuu niiden perusominaisuuksien tuntemiseen ja kykyyn luokitella arvioita näiden ominaisuuksien mukaan. Matemaattisessa kirjallisuudessa "estimaattien ominaisuuksia" kutsutaan joskus "estimaattien vaatimuksiksi" tai "estimaattien kriteereiksi". Tilastollisten arvioiden tärkeimpiä ominaisuuksia ovat: puolueettomuus, tehokkuus, kyky, riittävyys.

Jos oletetaan, että otoksen keskiarvo (~) ja otosvarianssi

(Sv) ovat arvioita vastaavista yleisominaisuuksista (^), eli niiden matemaattisista odotuksista, otamme huomioon, että suurella luvulla

Ominaisuuksiksi (~) nimetyt näytteenottoyksiköt likimääräiset niiden matemaattisten odotusten mukaisesti. Jos otosyksiköiden määrä on pieni, nämä ominaisuudet voivat poiketa merkittävästi vastaavista matemaattisista odotuksista.

Jos estimaatiksi valittujen otosominaisuuksien keskiarvo vastaa yleisen ominaisuuden arvoa, estimaattia kutsutaan puolueettomaksi. Todiste siitä, että otoksen keskiarvon odotus on yhtä suuri kuin yleinen keskiarvo (m (x) = x), osoittaa, että arvo ~ on puolueeton yleinen

keskiverto. Tilanne on toinen valikoivan dispersion (o) kanssa. hänen

M (ST 2) \u003d - o-2. .

matemaattinen odotus n, ei ole yhtä suuri kuin yleinen

dispersio. Joten a h on ":n puolueellinen estimaattori. Järjestelmällisen virheen eliminoimiseksi ja puolueettoman estimaattorin saamiseksi näyte

varianssi kerrotaan korjauksella n - 1 (tämä seuraa muodostumisesta

vuonna 2 _ 2 p P -1 "n -1

yllä oleva yhtälö: n).

Pienellä otoksella varianssi on siis:

2 Ch, - ~) 2 P E (x ja - ~) 2

cg sisään= x - = -.

p p - 1 p -1

Murto-osa (P- 1) kutsutaan Besselin korjaukseksi. Besselin matemaatikko totesi ensimmäisenä, että otosvarianssi on yleisen varianssin puolueellinen arvio, ja sovelsi määritettyä korjausta korjatakseen

arvosanat. Pienillä näytteillä korjaus (n - 1) eroaa merkittävästi arvosta 1. Havaintoyksiköiden lukumäärän kasvaessa se lähestyy nopeasti arvoa n.<>50 pisteiden ero häviää, ts.

° ~ "- . Edellä olevasta seuraa seuraavat puolueettomuuden vaatimusten määritelmät.

puolueeton kutsutaan tilastolliseksi estimaatiksi, jonka matemaattinen odotus minkä tahansa otoskoon kohdalla on yhtä suuri kuin arvo

yleisen populaation parametri, eli m (^) = 9; m(x) = x.

Kategoria "matemaattinen odotus" tutkitaan todennäköisyysteorian aikana. Tämä on satunnaismuuttujan numeerinen ominaisuus. Matemaattinen odotus on suunnilleen yhtä suuri kuin satunnaismuuttujan keskiarvo. Diskreetin satunnaismuuttujan matemaattinen odotus on kaikkien sen mahdollisten arvojen ja niiden todennäköisyyksien tulojen summa. Oletetaan, että on tehty n tutkimusta, joissa satunnaismuuttuja X otti w 1 kertaa w:n arvon 2 kertaa W:n arvo ja kertaa X k:n arvon. Tässä tapauksessa W 1 + W 2 + W 3 + ... + W k \u003d n. Sitten kaikkien summa arvot on otettu x on yhtä suuri kuin

x 1 v 1 + x 2 v 2 + x 3 v 3 + ... + x k w k

Näiden arvojen aritmeettinen keskiarvo on:

X 1 v 1 + x 2 v 2 + x 3 v 3 + ... + x k w k - w 1^ w 2 ^ w 3 ^ ^ w k

P tai 1 p 2 p 3 p 1 p.

Koska n on suhteellinen taajuus ^-arvo X ^ P- arvon x 2 suhteellinen taajuus jne., yllä oleva yhtälö on muodossa:

X = X 1 nro 1 + X 2 nro 2 + X 3 nro 3 + ... + X - N>

Suurella määrällä näytehavaintoja suhteellinen esiintymistiheys on suunnilleen yhtä suuri kuin tapahtuman todennäköisyys, eli

u> 1 = L; ^ 2 \u003d W \u003d ™ k \u003d Pk ja siksi x 2 x 1 p 1 + x 2 p 2 + X 3 g. 3 + ... + X KRK. Sitten

x~ m(x) Laskelmien tuloksen todennäköisyysmerkitys on, että matemaattinen odotus on suunnilleen yhtä suuri (mitä tarkempi, sitä suurempi otos) satunnaismuuttujan havaittujen arvojen aritmeettisen keskiarvon kanssa [M (x -) = ~ 1.

Puolueettomuuskriteeri takaa systemaattisten virheiden puuttumisen yleisen perusjoukon parametrien arvioinnissa.

Huomaa, että otosestimaatti (^) on satunnaismuuttuja, jonka arvo voi vaihdella näytteestä toiseen. Sen varianssin (sironta) mitta yleisjoukon parametrin # matemaattisen odotuksen ympärillä luonnehtii varianssia c2 (t).

Päästää jaAT -- kaksi puolueetonta arviota parametrista ^, ts. M (in") \u003d 6 ja M (d,) \u003d c. Niiden varianssit sisään 1 (sisään -) ja sisäänGf -). Valitse kahdesta 0:sta Artaud'n arvoon se, jolla on pienin hajonta arvioidun parametrin ympärillä. Jos pisteiden varianssi ^ "on pienempi kuin varianssi

arvioi Sp, niin ensimmäinen estimaatti otetaan muodossa &, eli ^ ".

Eroamatonta estimaattoria t, jolla on pienin varianssi kaikkien mahdollisten samankokoisista näytteistä laskettujen parametrin t puolueettomien estimaattorien joukossa, kutsutaan tehokkaaksi estimaattoriksi. Tämä on yleisen perusjoukon parametrien tilastollisten arvioiden toinen ominaisuus (vaatimus). On muistettava, että yleisen perusjoukon parametrin efektiivinen estimaatti tietyn jakautumislain alaisena ei ole sama kuin toisen osan parametrin efektiivinen estimaatti.

Kun tarkastellaan suuria otoksia, tilastollisilla arvioilla tulisi olla kykyominaisuus. Arviointi kykenee (käytetään myös termiä "sovitus" tai "yhtenäinen") tarkoittaa, että mitä suurempi otoskoko on, sitä todennäköisemmin estimaattivirhe ei ylitä mielivaltaisen pientä positiivista

numero E. Parametrin ^ estimaattia 6 kutsutaan konsistensiksi, jos se noudattaa suurten lukujen lakia, eli seuraava yhtäläisyys pätee:

/ shh | G sisään-in <Е} = 1.

Kuten näette, tällaista tilastollista arviota kutsutaan kykeneväksi, joka n:llä lähestyy arvioitua parametria todennäköisyydellä. Toisin sanoen tämä on otoksesta saadun ja lähestyvän (todennäköisyydeltä yhtäläisen) indikaattorin arvo suurten lukujen lain johdosta otoksen koon kasvaessa sen matemaattiseen odotukseen. Jos esimerkiksi puolueettoman estimaatin varianssi pyrkii nollaan n:nä, niin tällainen estimaatti osoittautuu myös johdonmukaiseksi, koska sillä on pienin mahdollinen varianssi (tietylle otoskoolle).

Mahdolliset arviot ovat:

1) kohteen osuus otoksesta eli esiintymistiheys estimaattina kohteen osuudesta perusjoukossa;

2) otoskeskiarvo yleisen keskiarvon estimaattina;

3) otosvarianssi yleisvarianssin estimaattina;

4) otos epäsymmetria- ja kurtoosikertoimet yleisten kertoimien estimaattina.

Matemaattisten tilastojen kirjallisuudessa ei jostain syystä aina ole mahdollista löytää kuvausta tilastollisten arvioiden neljännestä ominaisuudesta - riittävyydestä. Arvosana riittävä(tai tyhjentävä) on arvio, joka johtaa (varmistaa) kaiken otostietojen kattavuuden yleisen perusjoukon tuntemattomasta parametrista. Näin ollen riittävä estimaatti sisältää kaikki otokseen sisältyvät tiedot tutkituista yleisen perusjoukon tilastollisista ominaisuuksista. Mikään kolmesta aiemmin käsitellystä estimaatista ei voi antaa tarvittavaa lisätietoa tutkittavasta parametrista riittävänä tilastollisena arviona.

Siksi otoksen ~ aritmeettinen keskiarvo on puolueeton arvio populaation x aritmeettisesta keskiarvosta. Tämän estimaatin ei-harhatekijä osoittaa: jos suuri määrä satunnaisotoksia otetaan yleisestä populaatiosta, niin niiden keskiarvot *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

Symmetrisissä jakaumasarjoissa mediaani on puolueeton arvio kokonaiskeskiarvosta. Ja edellyttäen, että otosjoukon koko lähestyy yleistä populaatiota (P ~ * N), mediaani voi olla sellaisissa sarjoissa ja johdonmukainen arvio yleisestä keskiarvosta. suuri määrä, mediaanin keskivirhe (Stme) on 1,2533 otoskeskiarvon keskivirheestä

). Eli Stme *. Siksi mediaani ei voi olla tehokas arvio perusjoukon aritmeettisesta keskiarvosta, koska sen keskineliövirhe on suurempi kuin aritmeettisen otoksen keskimääräinen neliövirhe. Lisäksi aritmeettinen keskiarvo täyttää puolueettomuuden ja kyvykkyyden ehdot ja on siksi paras arvio.

Myös tällainen asetus on mahdollinen. Voiko otoksen aritmeettinen keskiarvo olla puolueeton arvio mediaanista symmetrisissä populaatiojakaumissa, joiden keskiarvo ja mediaani ovat samat? Ja onko otoksen keskiarvo johdonmukainen arvio väestömediaanista? Molemmissa tapauksissa vastaus on myönteinen. Populaatiomediaanille (symmetrisellä jakaumalla) otoksen aritmeettinen keskiarvo on puolueeton ja johdonmukainen arvio.

Pitäen mielessä, että Cme ~ 1.2533. th, tulemme siihen tulokseen: otoksen aritmeettinen keskiarvo, ei mediaani, on tehokkaampi arvio tutkitun yleisen populaation mediaanista.

Jokainen otoksen piirre ei välttämättä ole paras arvio perusjoukon vastaavasta ominaisuudesta. Arvioiden ominaisuuksien tunteminen antaa meille mahdollisuuden ratkaista arvioiden valinnan lisäksi myös niiden parantamisen ongelma. Tarkastellaan esimerkkinä tapausta, jossa laskelmat osoittavat, että useiden samasta yleisjoukosta olevien näytteiden keskihajonnan arvot ovat kaikissa tapauksissa pienempiä kuin yleisen perusjoukon keskihajonnan ja eron suuruus johtuu näytteen koko. Kertomalla otoksen keskihajonnan arvo korjauskertoimella saadaan parempi arvio perusjoukon keskihajonnasta. Tällaiselle korjauskertoimelle käytetään Besselin korjausta

P a I P

(P - 1), eli harhan eliminoimiseksi saadaan arvioita "P- 1. Tällainen numeerinen lauseke osoittaa, että otoksen keskihajonta, jota käytetään estimaatina, antaa perusjoukon parametrin aliarvioinnin.

Kuten tiedät, otosjoukon tilastolliset ominaisuudet ovat karkea arvio populaation tuntemattomista parametreista. Itse pistemäärä voi olla yksittäisen luvun tai tietyn pisteen muodossa. Yksittäisellä luvulla määritettyä arviota kutsutaan pisteestimaatiksi. Täten otoskeskiarvo (~) on yleisen keskiarvon (x) puolueeton ja tehokkain pisteestimaatti ja otosvarianssi) on yleisen harhaanjohtava pisteestimaatti.

varianssi (). Jos merkitsemme otoksen keskiarvon keskivirhettä t <>silloin yleisen keskiarvon pisteestimaatti voidaan kirjoittaa muodossa x ± m °. Tämä tarkoittaa, että ~ on yleisen keskiarvon x estimaatti, jonka virhe on yhtä suuri kuin m". On selvää, että x:n ja o:n pistetilastollisissa estimaateissa ei pitäisi olla systemaattista virhettä

ooo~~o<в 2

estimoitujen parametrien x ja aliarvioinnin suunta. Kuten aiemmin mainittiin, kutsutaan arvioijia, jotka täyttävät tällaisen ehdon

puolueeton. Mikä on parametrin m "virhe? Tämä on monien erityisten virheiden keskiarvo:

Yleisen perusjoukon parametrin pisteestimaatti koostuu siitä, että eri mahdollisista otantaestimaateista valitaan ensin se, jolla on optimaaliset ominaisuudet, ja sitten lasketaan tämän arvion arvo. Jälkimmäisen tuloksena saatua laskettua arvoa pidetään parhaana likiarvona populaatioparametrin tuntemattomaan todelliseen arvoon. Mahdollisen estimointivirheen määrittämiseen liittyvät lisälaskelmat eivät aina ole pakollisia (riippuen estimointitehtävien varianssista), mutta niitä tehdään pääsääntöisesti lähes aina.

Tarkastellaan esimerkkejä pisteestimaatin määrittämisestä tutkittavien ominaisuuksien keskiarvolle ja niiden osuudelle väestöstä.

Esimerkki. Alueen viljasato on 20 000 hehtaaria. Peltojen 10 % otantatutkimuksella saatiin seuraavat selektiiviset ominaisuudet: keskisato - 30 senttiä hehtaarilta, sadon hajonta - 4, korkeatuottoisten kasvien viljelyala - 1200 hehtaaria.

Mitä tietää alueen viljakasvien keskisadon indikaattorin arvosta ja mikä on korkeatuottoisten kasvien osuuden (ominaispainon) indikaattorin numeerinen arvo koko alueen pinta-alasta u200b viljakasveja tutkittavana

alue? Eli on tarpeen arvioida nimetyt parametrit (x, z) yleisessä populaatiossa. Arvosanojen laskemiseksi meillä on:

N = 20000; - = 20000 x 0,1 = 2000; ~ = 30;<т = л / 4; № 2000,

Kuten tiedetään, valikoiva aritmeettinen keskiarvo on tehokas arvio

yleinen aritmeettinen keskiarvo. Näin ollen se voidaan hyväksyä

yleisen parametrin (^) paras estimaatti on 30. Asteen määrittämiseksi

arvion tarkkuus, on tarpeen löytää sen keskimääräinen (standardi) virhe:

ia. n~i Huhtikuu 2000 PPL

t = L - (1--) = - (1--) = 0,04

v n N i2000 2000^

Tuloksena oleva virhearvo osoittaa arvion suurta tarkkuutta. M:n arvo tarkoittaa tässä, että tällaisten näytteiden toistettaessa parametrin estimointivirhe olisi keskimäärin 0,04. Eli pisteen takana

Alueen tilojen keskisato on arvioiden mukaan x = 30 - 0,04 senttiä hehtaarilta.

Pisteestimaatin saamiseksi korkeatuottoisten viljasatojen osuudesta viljasatojen kokonaispinta-alasta parhaaksi arvioksi voidaan ottaa osuus otoksesta ¥ = 0,6. Voidaan siis sanoa, että havaintojen tulosten mukaan paras arvio halutusta rakenneindikaattorista on luku 0,6. Laskelmia tarkentamalla tulisi laskea tämän arvion keskimääräinen virhe: t ja (1 _ p) ja 0,6 (1 - 0,b) (1 = 0,01

v P N v 2000 2000 a

Kuten näet, keskimääräinen virhe yleisen ominaisuuden arvioinnissa on 0,01.

Saatu tulos tarkoittaa, että jos näyte toistetaan useita kertoja 2000 hehtaarin viljamäärällä, yritysten viljakasvien alueella korkeatuottoisten kasvien osuuden (ominaispainon) hyväksytyn arvion keskivirhe alueella olisi ± 0,01. Tässä tapauksessa P = 0,6 ± 0,01. Prosentteina korkeatuottoisten kasvien osuus alueen viljan kokonaisalasta on keskimäärin 60 ± I.

Laskelmat osoittavat, että tietyssä tapauksessa paras arvio halutusta rakenneindikaattorista on luku 0,6 ja arvion keskimääräinen virhe suuntaan tai toiseen on suunnilleen 0,01. Kuten näet, arvio on melko tarkka.

Tunnetaan useita menetelmiä keskihajonnan pisteen estimointiin tapauksissa, joissa näyte on tehty normaalijakauman yksiköiden yleisestä perusjoukosta ja parametria β ei tunneta. Yksinkertainen (helppoimmin laskettava) arvio on otoksen vaihteluväli (ja °) kerrottuna vakiotaulukoista otetulla korjauskertoimella, joka riippuu otoksen koosta (pienten otosten osalta). Yleispopulaation keskihajonnan parametri voidaan arvioida käyttämällä laskettua otosvarianssia ottaen huomioon vapausasteiden lukumäärä. Tämän varianssin neliöjuuri antaa arvon, jota käytetään yleisen keskihajonnan arviona).

Käyttämällä parametrin arvoa kohdassa "laske yleisen keskiarvon (x") estimaatin keskivirhe edellä kuvatulla tavalla.

Kuten aiemmin mainittiin, kykyvaatimuksen mukaisesti luottamus tietyn pisteestimaatin tarkkuuteen kasvaa otoskoon kasvaessa. Tätä teoreettista kantaa on hieman vaikea osoittaa pisteestimaatin esimerkillä. Otoskoon vaikutus estimaatin tarkkuuteen on ilmeinen intervalliestimaatteja laskettaessa. Niitä käsitellään alla.

Taulukossa 39 on lueteltu yleisimmin käytetyt populaatioparametrien pisteestimaatit.

Taulukko 39

Peruspistearviot _

Eri tavoin lasketut arviot eivät välttämättä ole saman suuruisia. Tältä osin käytännön laskelmissa ei pidä käsitellä mahdollisten vaihtoehtojen peräkkäistä laskentaa, vaan erilaisten arvioiden ominaisuuksiin luottaen valita niistä yksi.

Pienellä havaintoyksiköiden määrällä pisteestimaatti on suurelta osin satunnainen, eikä siksi kovin luotettava. Siksi pienissä näytteissä se voi poiketa suuresti yleisen populaation arvioidusta ominaisuudesta. Tämä tilanne johtaa suuriin virheisiin päätelmissä, jotka koskevat otoksen tulosten perusteella yleistä perusjoukkoa. Tästä syystä pienille näytteille käytetään intervalliarvioita.

Toisin kuin pisteestimaatti, intervalliestimaatti antaa pistealueen, jonka sisällä populaatioparametrin on oltava. Lisäksi intervalliestimaatti ilmaisee todennäköisyyden, ja siksi se on tärkeä tilastollisessa analyysissä.

Kutsutaan intervalliestimaatti, jolle on tunnusomaista kaksi numeroa - estimoidun parametrin peittävän (peittävän) intervallin rajat. Tällainen estimaatti on tietty aikaväli, jossa haluttu parametri sijaitsee tietyllä todennäköisyydellä. Intervallin keskipiste on näytepisteestimaatti.

Väliestimaatio on siis pisteestimoinnin jatkokehitys, kun tällainen estimointi on tehoton pienellä otoskoolla.

Intervalliestimoinnin ongelma yleisessä muodossa voidaan muotoilla seuraavasti: otantahavainnon tietojen mukaan on tarpeen rakentaa numeerinen intervalli, jonka suhteen voidaan aiemmin valitulla todennäköisyystasolla väittää, että estimoitu parametri on tämän aikavälin sisällä.

Jos otetaan riittävän suuri määrä näytteenottoyksiköitä, voidaan Ljapunov-lauseen avulla todistaa todennäköisyys, että näytteenottovirhe ei ylitä jotakin annettua arvoa a, ts.

Ja ~ "*!" A tai I No. "g. yA.

Erityisesti tämä lause mahdollistaa likimääräisten yhtälöiden virheet:

- "P (n ja - taajuus) x "x. n

Jos ^ * 2Xz..., x - ~ riippumattomia satunnaismuuttujia ja n, niin niiden keskiarvon (x) todennäköisyys on välillä a - 6 ja se voidaan määrittää yhtälöillä:

p(a(X (e) 1e 2 nämä,

_a- E (x); _ in - E (x) DE ° a

Todennäköisyyttä P kutsutaan luottamustodennäköisyydeksi.

Näin ollen yleisen parametrin estimoimisen otosestimaatin luottamustodennäköisyys (luotettavuus) on todennäköisyys, jolla epäyhtälöt toteutuvat:

| ~ X | <а; | и, ориентир | <д

jossa a on estimaatin rajavirhe keskiarvon ja osuuden mukaan.

Rajaja, joihin yleinen ominaisuus voidaan sijoittaa tällä annetulla todennäköisyydellä, kutsutaan luottamusväliksi (luottamusrajaksi). Ja tämän intervallin rajoja kutsutaan luottamusrajoilla.

Luottamus- (tai suvaitsevaisuus-) rajat ovat rajoja, joiden ylittyessä tietyllä satunnaisista vaihteluista johtuvalla ominaisuudella on merkityksetön todennäköisyys (A ^ 0,5; p 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

tästä seuraa, että ~ _A - x - ~ + A; Nro _A - g. - nro + A.

Matemaattisissa tilastoissa parametrin luotettavuus arvioidaan seuraavan kolmen todennäköisyystason arvolla (jota joskus kutsutaan "todennäköisyyskynnyksiksi"): L \u003d 0,95; ^ 2 \u003d 0,99; P 3 \u003d 0,999 todennäköisyydet. päätettiin laiminlyödä, eli a 1 = 0,05;; a2 = 0,01; "3 \u003d 0,001 kutsutaan merkitsevyystasoiksi tai merkittävyystasoiksi. Yllä olevista tasoista luotettavat johtopäätökset saadaan todennäköisyydellä P 3 = 0,999. Jokainen luottamustaso vastaa tiettyä normalisoidun poikkeaman arvoa (katso taulukko 27). Jos käytössä ei ole vakioarvotaulukoita todennäköisyysvälin arvoista, tämä todennäköisyys voidaan laskea tietyllä likimääräisellä kaavalla:

R (<) = - = ^ = 1 e"~ y i.

Kuvassa 11 normaalikäyrän ja abskissa-akselin rajaamat kokonaisalueen osat, jotka vastaavat arvoa <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Yksikön valinnan periaatteista (toistuva tai ei-toistuva) riippuen näytteenottovirheiden laskennan rakennekaavat

eroavat korjauksen suuruudesta (N).

Riisi. 11. Normaali todennäköisyyskäyrä

Taulukossa 40 on esitetty yleisparametrin arvioiden virheiden laskentakaavat.

Tarkastellaan yksittäistä tapausta yleisen perusjoukon parametrien intervalliarvioinnista otoshavaintotietojen perusteella.

Esimerkki. Alueen tilojen valikoivassa kartoituksessa todettiin, että lehmien (x) keskimääräinen vuorokausimaito on 10 kg. Puhdasrotuisten nautojen osuus kotieläinten kokonaismäärästä on 80 %. Näytteenottovirhe, jonka luottamustodennäköisyys P = 0,954, osoittautui 0,2 kg:ksi; yksityinen puhdasrotuinen nautakarja 1 %.

Siten ne rajat, joissa yleinen keskiarvo voi olla

esitys on 9.8<х <10,2; для генеральной доли скота -79 <Р <81.

Johtopäätös: Todennäköisyydellä 0,954 voidaan väittää, että ero lehmien valikoivan keskimääräisen tuottavuuden ja yleisen tuottavuuden välillä on 0,2 kg. Keskimääräisen vuorokautisen maidontuotannon raja on 9,8 ja 10,2 kg. Puhdasrotuisen karjan osuus (ominaispaino) alueen yrityksissä vaihtelee välillä 79-81 %, estimointivirhe ei ylitä 1 %.

Taulukko 40

Piste- ja intervallinäytteenottovirheiden laskeminen

Näytettä järjestettäessä on tärkeää määrittää tarvittava koko (n). Jälkimmäinen riippuu tutkittavan väestön yksiköiden vaihtelusta. Mitä suurempi satunnaisuus, sitä suurempi otoskoon tulisi olla. Palaute otoskoon ja sen marginaalivirheen välillä. Halu saada pienempi virhe edellyttää otoksen koon kasvattamista.

Vaadittu otoskoko määritetään rajallisen otantavirheen (e) kaavojen perusteella tietyllä todennäköisyystasolla (P). Matemaattisilla muunnoksilla saadaan kaavat otoskoon laskemiseksi (taulukko 41).

Taulukko 41

Tarvittavan otoskoon laskeminen _

On huomattava, että kaikki tilastollisiin arvioihin liittyvä perustuu olettamukseen, että otosjoukko, jonka parametreja arvioinnissa käytetään, saadaan käyttämällä otantatodennäköisyydet antavaa valintamenetelmää (menetelmää).

Samanaikaisesti estimaatin luottamustasoa valittaessa tulee noudattaa periaatetta, että sen tason valinta ei ole matemaattinen ongelma, vaan sen määrää tietty ratkaistava ongelma. Harkitse esimerkkiä yllä olevan tueksi.

Esimerkki. Oletetaan, että kahdessa yrityksessä valmiiden (korkealaatuisten) tuotteiden valmistuksen todennäköisyys on P = 0,999, eli viallisten tuotteiden saamisen todennäköisyys on a = 0,001. Voidaanko matemaattisten näkökohtien puitteissa, tuotteen luonteesta kiinnostumatta, päättää, oliko puutetta suuri todennäköisyys a = 0,001. Oletetaan, että yksi yritys tuottaa kylvökoneita ja toinen - lentokoneita sadonkäsittelyyn. Jos 1000 kylvökonetta kohden on yksi viallinen, niin tämä voidaan sietää, koska 0,1 % kylvökoneista uudelleensulatus on halvempaa kuin teknologisen prosessin uudelleenjärjestely. Jos 1000 lentokonetta kohti on yksi viallinen lentokone, tämä johtaa varmasti vakaviin seurauksiin sen käytön aikana. Joten ensimmäisessä tapauksessa avioliiton solmimisen todennäköisyys a = 0,001 voidaan hyväksyä, toisessa tapauksessa - ei. Tästä syystä luottamustodennäköisyyden valinta laskelmissa yleensä ja erityisesti estimaattien laskennassa tulee tehdä ongelman erityisolosuhteiden perusteella.

Tutkimuksen tavoitteista riippuen voi olla tarpeen laskea yksi tai kaksi luottamusrajaa. Jos ratkaistavan ongelman ominaisuudet edellyttävät vain yhden rajan asettamista, ylä- tai alarajaa, voit varmistaa, että todennäköisyys, jolla tämä raja asetetaan, on suurempi kuin silloin, kun molemmat rajat on määritetty samalle luottamuskertoimen arvolle. 1

Asetetaan luottamusrajat todennäköisyydellä P = 0,95, eli

95 %:ssa tapauksista yleinen keskiarvo (x) ei ole pienempi kuin alempi

luottamusväli x ™ - x "m ja enintään ylempi luottamus

väli Xup - = x + Tässä tapauksessa vain todennäköisyydellä a = 0,05 (tai 5%), keskimääräinen yleinen voi ylittää määritetyt rajat. Koska X:n jakauma on symmetrinen, niin puolet tästä tasosta

todennäköisyys, eli 2,5 % putoaa tapaukseen, jossa x (x ™ -ja toinen puolisko - tapaukseen, jossa x ^ x "^ -. Tästä seuraa, että todennäköisyys, että keskimääräinen yleinen voi olla pienempi kuin huippuarvo

Khwein luottamusraja "-, on yhtä suuri kuin 0,975 (eli 0,95 + 0,025). Siksi luodaan olosuhteet, kun jätämme huomiotta kahdella luottamusrajalla

x:n arvo on pienempi kuin x "" *., ja suurempi tai Xeerx. kutsumus

vain yksi luottamusraja, esimerkiksi Хylempi., jätämme huomiotta vain tämän rajan ylittävät ~. Samalla luottamuskertoimen X arvolla merkitsevyystaso a tässä osoittautuu kaksi kertaa pienemmäksi.

Jos lasketaan vain ominaisarvot, jotka ylittävät

(tai päinvastoin älä ylitä) halutun parametrin x arvoa, luottamusväliä kutsutaan yksipuoliseksi. Jos tarkasteltavat arvot ovat molemmin puolin rajoitettuja, luottamusväliä kutsutaan kaksipuoliseksi. Edellä esitetystä seuraa, että hypoteesit ja useat kriteerit, erityisesti Studentin X-testi, on katsottava yksipuolisiksi ja kaksipuoleisiksi. Siksi kaksisuuntaisessa hypoteesissa saman X:n arvon merkitsevyystaso on kaksi kertaa korkeampi kuin yksisuuntainen. Jos haluamme pitää merkitsevyystason (ja luottamustason) samana yksisuuntaisella hypoteesilla kuin kaksisuuntaisella hypoteesilla, niin X:n arvoa tulisi ottaa pienemmäksi. Tämä ominaisuus on otettu huomioon laadittaessa X-Student-kriteerien vakiotaulukoita (Liite 1).

Tiedetään, että käytännön näkökulmasta katsottuna ei kiinnosta niinkään yleisen keskiarvon mahdollisen arvon luottamusvälit, vaan ne maksimi- ja minimiarvot, enemmän tai vähemmän joita yleinen keskiarvo ei voi olla. tietty (luottamus)todennäköisyys. Matemaattisissa tilastoissa niitä kutsutaan taatuksi maksimi- ja taatuiksi minimikeskiarvoiksi. Ilmoittaa nimetyt parametrit

vastaavasti, kautta ja x ™, voit kirjoittaa: ХШ ™ = x +; xship = x~.

Laskettaessa yleisen keskiarvon taattua maksimi- ja minimiarvoa yksipuolisen luottamusvälin rajoilla yllä olevissa kaavoissa arvo 1 pidetään yksipuolisena kriteerinä.

Esimerkki. 20 näytteenottopaikan osalta sokerijuurikkaan keskisato oli 300 n/ha. Tämä näytekeskiarvo luonnehtii vastaavaa

populaatioparametri (x), jonka virhe on 10 n/ha. Arvioiden selektiivisyyden mukaan yleinen keskisaanto voi olla joko suurempi tai pienempi kuin otoskeskiarvo x = 300. Todennäköisyydellä P = 0,95 voidaan väittää, että haluttu parametri ei ole suurempi kuin ХШ "= 300 + 1,73 x 10 = 317,3 q / ha.

Arvo 1 otetaan vapausasteiden lukumäärälle ^ = 20-1, jossa on yksipuolinen kriittinen alue ja merkitsevyystaso a = 0,05 (Liite 1). Joten todennäköisyydellä P = 0,95, yleisen keskisadon taattu maksimi mahdollinen taso on arviolta 317 n / ha, eli suotuisissa olosuhteissa sokerijuurikkaan keskisato ei ylitä määritettyä arvoa.

Joillakin tiedon aloilla (esimerkiksi luonnontieteissä) arvioinnin teoria on huonompi kuin tilastollisten hypoteesien testaamisen teoria. Taloustieteessä tilastollisilla arviointimenetelmillä on erittäin tärkeä rooli tutkimustulosten luotettavuuden varmistamisessa sekä erilaisissa käytännön laskelmissa. Ensinnäkin tämä koskee tutkittavien tilastollisten populaatioiden pisteestimaatin käyttöä. Parhaan mahdollisen arvion valinta on pisteestimoinnin pääongelma. Tällaisen valinnan mahdollisuus johtuu tilastollisten arvioiden perusominaisuuksien (vaatimusten) tuntemisesta.

matematiikan käytännön oppitunnille valmistautumiseen

Aihe: Otos-, diskreetti- ja intervallivariaatiosarjojen tilastollinen jakauma. Jakaumaparametrien piste- ja intervalliestimaatit. Mittausvirheet ja niiden arviot.

Aiheen relevanssi: matemaattisen tilaston peruskäsitteisiin ja menetelmiin tutustuminen keinona ratkaista fysikaalisia, kemiallisia, biologisia ja muita ongelmia, joita kohdataan sekä erikoisalojen opiskelussa että jatkossa ammatillisessa toiminnassa

Oppitunnin tarkoitus: oppia rakentamaan tilastosarjoja diskreeteille ja jatkuville satunnaismuuttujille ja laskemaan yleisten parametrien pisteestimaatteja, laskemaan suorien ja epäsuorien mittausten virheitä.

Aiheopintosuunnitelma

1. Matemaattisen tilastotieteen päätehtävät.

2. Yleiset ja otantapopulaatiot.

3. Diskreetti variaatiosarja ja sen graafinen esitys.

4. Intervallivariaatiosarja ja sen graafinen esitys. Tilastollisten arvioiden tyypit.

5. Tilastollisten arvioiden vaatimukset.

6. Yleisten ja otoskeskiarvojen käsitteet.

7. Yleisten, otos- ja korjattujen varianssien käsitteet.

8. Yleisen, otoksen ja korjatun keskihajonnan käsitteet.

Pääkirjallisuus:

1. Morozov, Yu.V. Korkeamman matematiikan ja tilastotieteen perusteet: oppikirja. lääketieteen opiskelijoille ja apteekki. yliopistot ja tiedekunnat / Yu.V. Morozov.

M.: Lääketiede, 2004.-232 s.

2. Korkeamman matematiikan ja matemaattisen tilaston perusteet: oppikirja. lääketieteen opiskelijoille ja apteekki. yliopistot / I.V. Pavlushkov, L. V. Rozovsky, A. E. Kapultsevich ja muu-2. painos, Rev.-M.: GOETAR-

Media, 2006.-423 s.

Lisäkirjallisuutta:

Ohjeita korkeamman matematiikan käytännön harjoituksiin [Sähköinen resurssi]: tutkimusmenetelmä. yliopistokorvaus / toim.-komp. : T.A. Novichkova; GOU VPO "Kursk. osavaltio. lääketieteellinen. un-t", osasto. fysiikka, informatiikka ja matematiikka. - Kursk: KSMU, 2009.

Gmurman V.E. Teoria ja matemaattinen tilasto. M. "Higher School", toim. 5, 2004.

Itsehillintäkysymyksiä:

1) Tilastosarjan määritelmä.

2) Yleisen väestön määritelmä.

3) Otospopulaation määrittäminen.

4) Otoksen edustavuus.

5) Näytteiden tyypit.

6) Mikä on variantti?

7) Luokituksen määritelmä.

8) Taajuuden, suhteellisen taajuuden, kumuloituneen taajuuden määritelmä.

9) Algoritmi intervallivaihtelusarjan muodostamiseksi.

10) Monikulmion määritelmä, kumulat (diskreetti variaatiosarja).

11) Histogrammin määritys, kumulaatiot (välivaihtelusarjat) tilastollisen arvioinnin määritys.

12) mitkä ovat tilastollisten arvioiden vaatimukset.

13) Mitä tilastollista arviota kutsutaan puolueelliseksi, puolueettomaksi?

14) kaavat yleisen ja otoskeskiarvon laskemiseksi ryhmitellylle ja ryhmittämättömälle tiedolle.

15) kaavat ryhmitellyn ja ryhmittämättömän tiedon yleisen ja otosvarianssin laskemiseen.

16) Mitä otos tarkoittaa yleisellä keskiarvolla?

17) Mikä on yleisen arvion otosvarianssi?

18) Kaava korjatun keskihajonnan laskemiseksi.

19) Mitkä ovat suorat mitat?

20) Mitä X:n todellisella absoluuttisella virheellä tarkoitetaan?

21) Mikä on X:n todellinen arvo?

22) Mikä toimii pisteestimaatina X:n todellisesta arvosta?

23) Mikä toimii arviona X:n varianssista?

25) Kuinka löytää X:n todellisen arvon luottamusvälin rajat?

26) Mitä mittauksia kutsutaan epäsuoriksi?

27) Jos y = f(x1, x2, ..., xn), niin millä kaavalla lasketaan keskiarvon y neliövirhe?

28) Mitä kaavaa käytetään absoluuttisen virheen y etsimiseen: osoitteessa ?

29) Kuinka löytää suhteellinen virhe y:ε y?

Itseopiskelutehtävät:

1. Erillisten tetrasykliinin aktiivisuustestien tuloksena saatiin seuraavat arvot (vaikutusyksikköinä 1 mg:aa kohti): 925, 940, 760, 905, 995, 965, 940, 925, 940, 905. muodostavat jakelusarjan. Rakenna kaatopaikka, kumuloi.

2. Muodosta suhteellisten taajuuksien histogrammi näytejakauman mukaan: 11, 15, 16, 18, 15,5, 19, 20,1, 20,9, 23, 24,5, 23, 21, 23,9, 24,6, 25,5, 26, ..6, 26,. 32.

3. Etsi korjattu keskihajonna annetulle näytejakaumalla

Toimintaohjeet:

1. Opi aiheen peruskäsitteet

2. Vastaa kysymyksiin itsehillintää varten

3. Keksi esimerkkejä aiheen ongelmien ratkaisemisesta

4. Suorita itsehillintätehtävät

5. Ratkaise aiheeseen liittyviä ohjaustehtäviä

Tämän aiheen opiskelun jälkeen opiskelijan tulee tietää: variaatiosarjan käsite, sen tyypit ja niiden graafinen esitys,

tilastollisen arvioinnin käsitteet, niiden tyypit, estimaatin vaatimukset, yleisen ja otoskeskiarvon käsitteet, yleiset ja otantavarianssit. osaa: rakentaa tilastosarjoja diskreeteille ja jatkuville satunnaismuuttujille ja laskea yleisten parametrien pisteestimaatteja, laskea suorien ja epäsuorien mittausten virheitä.

Lyhyt teoria

Matemaattiset tilastot on soveltavan matematiikan ala, joka on omistettu havaintojen tai kokeiden tuloksena saadun tilastollisen tiedon keräämisen, ryhmittelyn ja analysoinnin menetelmille.

Tästä seuraa matemaattisen tilaston tehtävät:

tapoja valita tilastotietoja.

tapoja ryhmitellä tilastotietoja.

tietojen analysointimenetelmät:

tunnettujen jakautumisparametrien estimointi;

tuntemattoman jakaumafunktion estimointi;

yhden satunnaismuuttujan riippuvuuden arviointi muista;

tilastollisten hypoteesien testaus.

menetelmät havaintojen lukumäärän määrittämiseksi (kokeilusuunnittelu).

tehdä päätöksiä.

AT matemaattiseen tilastoon satunnaismuuttujan tutkimus liittyy

Kanssa suorittaa sarjan riippumattomia kokeita, joissa se saa tietyt arvot.

Väestö- joukko objekteja, jotka ovat homogeenisia jonkin laadullisen tai määrällisen ominaisuuden suhteen.

Esimerkiksi, jos lääkeainetabletteja on sarja, tabletin vakioisuus voi toimia laadullisena merkkinä ja tabletin kontrolloitu paino voi toimia kvantitatiivisena merkkinä.

Väestö- joukko kaikkia esineitä, jotka voidaan liittää siihen.

Teoriassa näin voi olla. äärettömän suuri tai lähestyvä ääretön joukko.

Esimerkiksi kaikki potilaat, joilla on reuma maapallolla - koko väestö. Todellisuudessa tämä on tietyissä rajoissa (kaupunki, alue).

Yleisen populaation esineiden lukumäärää kutsutaan tilavuudeksi ja sitä merkitään N.

Otospopulaatio- joukko esineitä, jotka on valittu satunnaisesti yleisestä populaatiosta.

Otoksen objektien lukumäärää kutsutaan sen kooksi ja merkitään n:llä.

Jotta otoksen ominaisuudet kuvastavat perusjoukon ominaisuuksia riittävän hyvin, otoksen on oltava edustaja (edustaja).

Tämä vaatimus varmistaa otokseen kuuluvien elementtien valinnan satunnaisuuden, ts. todennäköisyys, että mikä tahansa esine sisällytetään otokseen.

Riippuen tekniikasta, jolla objektit valitaan yleisestä populaatiosta, näytteet jaetaan:

Toistettu

Ei-toistuva

(valittu objekti palautetaan

(valittua objektia ei palauteta

suurelle väestölle)

suurelle väestölle)

Käytännössä käytetään ei-toistuvaa näytteenottoa.

Yleisen populaation suuret volyymit N ja otoksen suhteellinen koko n/N ovat pieniä, joten erot molempia näytteitä kuvaavissa kaavoissa ovat pieniä.

Diskreetti jakelualue

Ominaisuuden havaittuja arvoja kutsutaan varianteiksi. Ranking - vaihtoehdon järjestys nousevassa järjestyksessä tai

laskeva.

variaatiosarja kutsutaan vaihteluväliksi valinnat ja niitä vastaavat taajuudet.

Otoksen tilastollinen jakautuminen kutsua optioluettelo ja niitä vastaavat taajuudet tai suhteelliset taajuudet.

Otetaan n-kokoinen näyte yleisestä perusjoukosta. Tutkitun piirteen kvantitatiivinen arvo x1 ilmestyi m1 kertaa, x2 - m 2

kertaa, …, x k – m k kertaa.

Lisäksi ∑ m i = n

i=1

Lukuja mi kutsutaan taajuuksiksi ja niiden suhteita otoskokoon n suhteellisiksi taajuuksiksi pi =mi /n. Lisäksi Σpi =1.

Siinä tapauksessa, että määrällinen attribuutti on diskreetti, sen arvot ja niitä vastaavat taajuudet tai suhteelliset taajuudet esitetään taulukon muodossa.

pi =mi/n

pi*=

m1/n

(m1+m2)/n

mi*/n

Variaatiosarjoja tutkittaessa käytetään taajuuden käsitteen ohella kumuloitua taajuutta (mi * ). Kertynyt taajuus osoittaa, kuinka monta varianttia havaittiin, joiden ominaisarvo on pienempi kuin x.

Polvitaajuuden mi * suhdetta havaintojen kokonaismäärään n kutsutaan suhteelliseksi taajuudelle pi * = mi * /n.

Diskreetin tilastosarjan graafinen esitys on taajuuksien monikulmio (suhteellinen).

Monikulmio toimii diskreetin variaatiosarjan näyttämiseen ja on katkoviiva, jossa suorien viivaosien päillä on koordinaatit (xi , mi ) tai (xi , pi ) suhteellisten taajuuksien monikulmion tapauksessa.

Intervallitilastosarjat.

Jos muunnelmia on paljon (n>50) ja ominaisuuden jatkuva jakauma, ominaisuuden tilastollinen jakauma voidaan määrittää intervallien ja niitä vastaavien frekvenssien sarjana.

Useammin käytetään yhtäjaksoista sarjaa.

Sinun on valittava oikea luokkavälin leveys. Välien lukumäärän tulisi riippua otoksen laajuudesta ja koosta.

Algoritmi histogrammin muodostamiseksi.

1. Annettu näyte X = (x 1 , x 2 , ..., x n ) ; n on sen tilavuus

Näytealue D = x max – x min

2. Luokkien lukumäärä

K \u003d 1 + 3,32 × lg n (Sturgessin kaava n:lle< 100 )

K \u003d 5 × lg n (Brooksin kaava arvolle n > 100)

3. Luokkavälin D x \u003d D / K arvo

4. Osittaisten välien rajat ja keskipisteet

x1l \u003d xmin - D x / 2

x1pr \u003d x2l \u003d xmin + D x / 2

x 1 = x min

x 2 \u003d x 1 + D x

5. Intervallin osumistiheys:

variaatiosarja ja on portaittainen kuva suorakulmioista, joiden kanta on yhtä suuri kuin piirrearvojen xi =xi+1 -xi , i=1,2,…,k välit ja korkeudet, jotka vastaavat taajuuksia (suhteellisia taajuuksia) mi (pi ) väliajoin.

Jos yhdistät suorakulmioiden yläkantojen keskipisteet suorilla janoilla, saat saman jakautuman monikulmion.

Empiirinen jakaumafunktio Saadaksesi käsityksen satunnaisjakaumasta

suureet X, joiden jakautumislakia ei tunneta, rakentavat empiirisen jakaumafunktion.

Empiirinen jakaumafunktio (otosjakaumafunktio) on funktio F* ​​(x), joka määrittää kullekin arvolle x tapahtuman X suhteellisen tiheyden.

, jossa m* on niiden havaintojen määrä, joissa piirteen X arvo havaittiin pienempi kuin x.

Väestönjakaumafunktiota kutsutaan teoreettiseksi funktioksi.

Empiiristen ja teoreettisten funktioiden ero on siinä, että teoreettinen funktio määrittää tapahtuman X todennäköisyyden<х, а эмпирическая – относительную частоту данного события.

Tilastollisen arvioinnin käsite.

On tutkittava väestön kvantitatiivista merkkiä. Oletetaan, että tunnemme väestön jakautumislain. Tämä laki määräytyy useiden parametrien perusteella. Otosdataa käytetään yleisen populaation tuntemattomien parametrien arvioimiseen.

Tilastollinen arviointi Yleisen populaation tuntematonta jakautumisparametria kutsutaan havaittujen satunnaismuuttujien funktioksi.

Merkitse:

θ on tuntematon parametri; θ* – tuntemattoman parametrin tilastollinen estimointi; θ* = f (x 1, x 2, ..., x n)

Tilastollinen arvio θ* on Satunnaismuuttuja, siksi sillä on varianssi ja keskihajonna sekä edustavuusvirhe (otosindikaattorin poikkeama yleisestä).

Tilastollisia arvioita on kahdenlaisia: piste- ja intervalli.

Yhdellä luvulla tehtyä arviota, joka riippuu näytetiedoista, kutsutaan pisteestimaatiksi.

Arviointia kahdella luvulla, jotka ovat intervallin päät, kutsutaan intervalliestimaatiksi.

Pistetilastollisten arvioiden vaatimukset.

Arvion laatua ei määritä yksittäinen otos, vaan se

koko ajateltavissa olevaan tiettyjen näytteiden joukkoon, ts. läpi joukon

tuntemattoman parametrin θ pisteestimaatit θ i * .

Jotta tilastolliset arvioinnit antaisivat hyvää

arvioitujen parametrien likiarvo, niiden on täytettävä

seuraavat vaatimukset:

puolueeton (systeemisten virheiden puuttuminen

mikä tahansa näytekoko М(θ *) = θ );

tehokkuus (kaikkien mahdollisten arvioiden joukossa tehokas

estimaatin varianssi on pienin min D(θ *) ).

vakavaraisuus

(takaa

todennäköisyyksiä

arvioitu parametri n → ∞ , ts. θ*¾¾¾® θ);

n→∞

Kenraali

Piste-arvio

Ominaisuudet

parametri

pistearvio

M(X) = xr =

ei-siirrettävä

x in = ∑ x i

= ∑ m i x i valikoiva

Tehokas

∑ x i

i = 1

i = 1

Varakas

N i = 1

Asymptoottisesti

− x

− x

puolueeton, ts.

M(Dv) ¹ σ g 2, mutta

ni = 1

ni = 1

D(X) = σ r =

näytteen varianssi

) = σ

− x i)

n→∞

N i = 1

S2 =

D korjattu

n - 1

ei-siirrettävä

dispersio

δ in =

siirrettävä

(vakio)

σ g =

σ g 2

korjattu

rms

puolueeton

poikkeama

on satunnaismuuttuja, niin sillä on varianssi -

xv

näytteen keskivarianssi:

× n × S2 =

) = D(

∑ xi ) =

D(∑xi) =

∑ D(xi) =

∑ (xi −

n(n − 1) i =1

Arvioiden tarkkuus, luotettavuus

intervalliarvio kutsutaan arvioksi, joka määräytyy kahdella numerolla - intervallin päillä.

Intervalliarvioiden avulla voit määrittää pisteestimaatin tarkkuuden ja luotettavuuden.

Olkoon q * pisteestimaatti tuntemattomasta parametrista q , joka on satunnaismuuttuja.

Mitä pienempi ½q - q * ½ , sitä tarkemmin q * määrittää parametrin q .

Jos δ > 0 ja ½q - q * ½< δ , то чем меньше δ , тем точнее оценка. Число

δ kutsutaan arvioinnin tarkkuus.

AT sattuman voima q * voimme puhua vain epäyhtälön ½q - q * ½ todennäköisyydestä< e .

Arvioinnin q * luotettavuus (luottamustodennäköisyys) kutsutaan todennäköisyydeksi g , jonka kanssa epätasa-arvo½q - q * ½< δ .

Yleensä g = 0,95; 0,99; 0,999…P(|Θ-Θ*|< δ)=γ

Joskus sanotaan, että luottamustaso g luonnehtii luottamustamme siihen, että luottamusväli kattaa parametrin q .

P (q* - e< q < q * + e} = g означает, что вероятность того, что интервал (q * - e ; q * + e ) заключает в себе неизвестный параметр q , равна g :

Todennäköisyys, että tuntematon parametri ei osu väliin ½q - q * ½< e , равна 1 - g = a (уровень значимости).

Merkitystaso (riski) on todennäköisyys, että empiirisen ominaisuuden poikkeamamoduuli teoreettisesta ylittää rajavirheen P(|Θ-Θ*|< ∆)=γ , предельная ошибка – максимально допустимая |Θ-Θ*|< ∆

Opiskelijoiden jakelu

Olkoon X ~ N(µ,σ), ja jakauman parametrit ovat tuntemattomia.

Tarkastellaan suuren T = x jakautumista − μ .

T:n jakaumaa f=n-1 vapausasteella kutsutaan t-jakaumaksi tai Studentin jakaumaksi.

Todennäköisyystiheysfunktio φ(t) riippuu vapausasteiden lukumäärästä, eikä se riipu satunnaismuuttujien dispersiosta.

Vapausasteiden lukumäärän kasvaessa tämän suuren jakauma lähestyy normaalia

Tuntemattoman varianssin matemaattisen odotuksen intervalliestimaatti on intervalli

(x - tγ (f ) × Sx ; x + tγ (f ) × Sx )

Matemaattisen odotuksen intervalliarvio tunnetulla

varianssi on intervalli

(x - uα × Sx ; x + uα × Sx )

Ф (u α ) = 1− α - Laplacen funktio.

Esimerkkejä ongelmanratkaisusta

1) Esitä tilastollisen diskreetin sarjan muodossa, muodosta monikulmio taajuuksista, suhteellisista taajuuksista, kumulatiivinen käyrä (kumulatiivinen taajuuskäyrä): 6,7; 6,8; 7; 6,5; 7,3; 7; 7,2; 6,9; 7,1; 6,8; 7,1; 6,8; 7,1; 7,2; 6,8; 6,9;

7; 6,7; 6,6; 6,3; 7,5; 6,9.

Ratkaisu. mi – taajuus, p – suhteellinen taajuus, pi * - kumulatiivinen suhteellinen taajuus

pi*

Taajuus monikulmio

Matemaattisten tilastojen jakaumille on tunnusomaista monet tilastolliset parametrit. Tuntemattomien jakaumaparametrien estimointi erilaisiin näytetietoihin mahdollistaa satunnaismuuttujan jakaumien muodostamisen.

Etsi tilastollinen arvio tuntemattomasta jakaumaparametrista - etsi havaittujen satunnaismuuttujien funktio, joka antaa arvioidun parametrin likimääräisen arvon.

Tilastolliset arviot voidaan jakaa puolueettomiin, puolueellisiin, tehokkaisiin ja johdonmukaisiin.

Määritelmä 1

Puolueeton estimaattori-- tilastollinen arvio $Q^*$, jolla on mille tahansa otoskoon arvolle matemaattinen odotusarvo, joka on yhtä suuri kuin arvioitu parametri, eli

Määritelmä 2

Puolueellinen arvio-- tilastollinen arvio $Q^*$, jolla on mille tahansa otoskoon arvolle matemaattinen odotus, joka ei ole yhtä suuri kuin arvioitu parametri, eli

Määritelmä 4

Johdonmukainen arviointi-- tilastollinen arvio, jossa otoskoon suuntautuessa äärettömyyteen pyrkii todennäköisyydellä arvioituun parametriin $Q.$

Määritelmä 5

Johdonmukainen arviointi-- tilastollinen estimaatti, jossa otoskoon pyrkiessä äärettömyyteen puolueettoman estimaatin varianssi pyrkii nollaan.

Yleiset ja mallikeinot

Määritelmä 6

Yleinen keskiarvo-- yleisen populaation muunnelman arvojen aritmeettinen keskiarvo.

Määritelmä 7

Esimerkki keskiarvo- näytepopulaation muunnelman arvojen aritmeettinen keskiarvo.

Yleisen ja näytekeskiarvon arvot löytyvät seuraavilla kaavoilla:

  1. Jos muunnelman $x_1,\ x_2,\dots ,x_k$ arvoilla on vastaavasti taajuudet $n_1,\ n_2,\dots ,n_k$, niin
  1. Jos muunnelman $x_1,\ x_2,\dots ,x_k$ arvot ovat erilaiset,

Tähän käsitteeseen liittyy käsite poikkeama keskiarvosta. Tämä arvo saadaan seuraavalla kaavalla:

Keskipoikkeamalla on seuraavat ominaisuudet:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    Poikkeaman keskiarvo on nolla.

Yleiset, otos- ja korjatut varianssit

Toinen pääparametreista on yleisen ja otosvarianssin käsite:

Yleinen varianssi:

Otosvarianssi:

Nämä käsitteet liittyvät myös yleisiin ja otosstandardipoikkeamiin:

Yleisvarianssin estimaattina otetaan käyttöön korjatun varianssin käsite:

Myös korjatun keskihajonnan käsite esitellään:

Esimerkki ongelmanratkaisusta

Esimerkki 1

Populaatio saadaan seuraavasta jakautumistaulukosta:

Kuva 1.

Etsi sille yleiskeskiarvo, yleisvarianssi, yleinen keskihajonna, korjattu varianssi ja korjattu keskihajonta.

Tämän ongelman ratkaisemiseksi teemme ensin laskentataulukon:

Kuva 2.

$\overline(x_v)$ (näytteen keskiarvo) arvo saadaan kaavasta:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2,9\]

Etsitään yleinen varianssi kaavalla:

Yleinen keskihajonta:

\[(\sigma )_v=\sqrt(D_v)\noin 1,42\]

Korjattu varianssi:

\[(S^2=\frac(n)(n-1)D)_in=\frac(30)(29)\cdot 2.023\noin 2.09\]

Korjattu keskihajonta.

on siirtynyt sivulta O. varianssin vuoksi, koska ; kuin siirtämätön O. kanssa. s 2:lle yleensä käytetään funktiota


Katso myös Puolueeton estimaattori.

Siirtämättömän O.:n tarkkuuden mittaamiseksi. ja parametrille käytetään useimmiten varianssia Da.

O. s. pienimmällä dispersiolla. paras. Yllä olevassa esimerkissä aritmeettinen keskiarvo (1) on paras O. kanssa. Kuitenkin, jos satunnaismuuttujia X i poikkeaa normaalista, niin O. s. (1) ei ehkä ole paras. Esimerkiksi jos havaintojen tulokset Х i jakautuu tasaisesti väliin ( b, c), sitten paras O. s. matematiikasta. odotuksia a=(b+c)/2 on puolet ääriarvojen summasta

(3)

Ominaisuudena erilaisten O. s:n tarkkuuden vertailuun. soveltaa parhaan estimaatin ja annetun puolueettoman arvion tehokkuutta - varianssia. Esimerkiksi jos havaintojen tulokset Х i ovat tasaisesti jakautuneita, niin estimaattien (1) ja (3) varianssit ilmaistaan ​​kaavoilla

ja (4)

Koska arvio (3) on paras, estimaatin (1) tehokkuus tässä tapauksessa on

Suuri määrä havaintoja, ne yleensä edellyttävät, että valittu O. kanssa. todennäköisyydellä tavoiteltu parametrin todellista arvoa a, eli mille tahansa e > 0

sellainen O. s. nimeltään johdonmukainen (esimerkki johdonmukaisesta O. s, - mikä tahansa, jonka varianssi pyrkii nollaan; katso myös Johdonmukainen arviointi). Koska taipumuksella rajaan on tässä tärkeä rooli, asymptoottisesti parhaita ovat asymptoottisesti tehokkaat O.:t, eli ne O.:t, joille

Esimerkiksi, jos se jakautuu tasaisesti normaalisti, niin O. s. (2) on asymptoottisesti tehokas estimaatti tuntemattomalle parametrille, koska , estimaatin varianssi ja parhaan estimaatin varianssi ovat asymptoottisesti ekvivalentteja:

ja sitä paitsi,

Perusarvo O:n sivuteorialle. ja sen hakemuksissa on se tosiasia, että O. s. parametrille a se on alhaalta rajoitettu tietyllä arvolla (R. Fischer ehdotti havaintojen tulosten sisältämän tuntemattoman parametrin a informaation karakterisoimista tällä arvolla). Esimerkiksi jos ne ovat riippumattomia ja tasaisesti jakautuneita todennäköisyystiheydellä p(x; a).ja jos - O. s. jollekin funktiolle g(a) parametrilla a, niin laajassa tapausluokassa

Funktiota b(a) kutsutaan. siirtymä ja epäyhtälön oikean puolen käänteisluku (5), ns. tiedon määrä (Fisherin mukaan) funktiosta g(a) , havaintoon sisältyvät. Erityisesti, jos a on puolueeton O. s. parametri a, sitten,

ja tiedon määrä nIa tässä tapauksessa se on verrannollinen havaintojen määrään (funktiota I(a) kutsutaan yhden havainnon sisältämän tiedon määräksi).

Tärkeimmät ehdot, joissa epäyhtälöt (5) ja (6) pätevät, ovat a:n estimaatin tasaisuus X i, ja myös näiden pisteiden joukon parametriin X, missä p( x, a)=0. Viimeinen ehto ei täyty esimerkiksi tasaisen jakauman ja siten O. s:n varianssin tapauksessa. (3) ei täytä epäyhtälöä (6) [(4):n mukaan tämä dispersio on suuruusluokkaa n -2, kun taas epäyhtälöllä (6) se ei voi olla pienempi kuin n -1].

Epäyhtälöt (5) ja (6) pätevät myös diskreetti jakautuneille satunnaismuuttujille X i tarvitaan vain tiedon I(a) määrittelyssä. p(x; a).korvaa tapahtuman todennäköisyydellä (X=x).

Jos puolueettoman O. s. a* parametrille a osuu epäyhtälön (6) oikean puolen kanssa, silloin on paras arvio. Käänteinen väite, yleisesti ottaen, ei pidä paikkaansa: parhaan O. s.:n varianssi. voi ylittää. Kuitenkin, jos , niin parhaan estimaatin varianssi on asymptoottisesti yhtä suuri kuin (6) oikea puoli, eli . Siten tiedon määrää käyttämällä (Fisherin mukaan) voidaan määrittää asymptoottinen sivun siirtämättömän O.:n tehokkuus. a, olettaen

Erityisen hedelmällistä on informaatiolähestymistapa O.:n teoriaan s. vaikuttaa siihen milloin satunnaismuuttujien yhteisjakauman tiheys (diskreetissä tapauksessa - ) voidaan esittää kahden funktion h( x 1 ,x 2 ,...,x p).[y( x 1 , x 2 ,..., x n);a] , joista ensimmäinen ei riipu a, ja toinen on tietyn satunnaismuuttujan jakautumistiheys Z=y(X 1, X 2,....,X s), nimeltään riittävästi tilastoja tai kattavat tilastot.

Yksi yleisimmistä tavoista löytää piste O. sivu - hetkien menetelmä. Tämän menetelmän mukaan teoreettinen tuntemattomista parametreista riippuvainen jakauma laitetaan diskreettiin otokseen, joka määräytyy havaintojen tulosten perusteella X i ja edustaa kuvitteellisen satunnaismuuttujan todennäköisyysjakaumaa, joka saa arvot yhtä todennäköisyyksillä kuin 1/n (otosjakaumaa voidaan pitää teoreettisen jakauman pistejakaumana). Kuten O. kanssa. teoreettisia hetkiä varten. jakaumat ottavat vastaavat näytteenottojakauman hetket; esim matematiikasta. odotus ai ja varianssi s 2 momenttien menetelmä antaa seuraavan käyttöjärjestelmän: (1) ja otosvarianssi (2). Tuntemattomat parametrit ilmaistaan ​​yleensä (täsmälleen tai likimääräisesti) useiden teoreettisten momenttien funktioina. jakelu. Korvaaminen näissä funktioissa teoreettista. hetket valikoiva, vastaanottaa vaadittu O. kanssa. Tämä menetelmä, joka käytännössä johtaa usein suhteellisen yksinkertaisiin laskelmiin, tuottaa yleensä O. s. alhainen asymptoottinen tehokkuus (katso edellä esimerkki tasaisen jakauman matemaattisen odotuksen arvioinnista).

Toinen tapa löytää sivun O., täydellisempi teoreettisella. näkökulmat,- suurimman todennäköisyyden menetelmä, tai suurimman todennäköisyyden menetelmä. Tämän menetelmän mukaan otetaan huomioon todennäköisyysfunktio L(a), joka on tuntemattoman parametrin a funktio ja joka saadaan argumenttien yhteisjakauman tiheyden korvaamisen tuloksena. x i satunnaismuuttujat itse X i; jos Xi - ovat riippumattomia ja jakautuneet tasaisesti todennäköisyystiheydellä p(x; a), sitten

(jos X i ovat diskreetti jakautuneet, niin todennäköisyysfunktion L määrittelyssä tiheys tulisi korvata tapahtumien todennäköisyyksillä ). Kuten O. kanssa. suurimmaksi todennäköisyydeksi tuntemattomalle parametrille a otetaan sellainen arvo a, jolle L(a) saavuttaa maksimiarvonsa (tässä tapauksessa L:n sijaan ajatellaan usein ns. logaritmista todennäköisyysfunktiota ; logaritmin monotonisuuden vuoksi funktioiden L(a) ja l(a) maksimipisteet osuvat yhteen). Esimerkkejä O. kanssa. suurimmat todennäköisyysarviot ovat pienimmän neliösumman menetelmä.

Suurin etu O. kanssa. Suurin todennäköisyys on siinä, että tietyissä yleisissä olosuhteissa nämä estimaatit ovat johdonmukaisia, asymptoottisesti tehokkaita ja suunnilleen normaalijakautuneita.

Listatut ominaisuudet tarkoittavat, että jos a on O. s. suurin todennäköisyys siis

(jos X on riippumaton, niin ). Näin ollen normalisoidun O. s:n jakaumafunktiolle. on rajasuhde

O:n edut. suurin todennäköisyys oikeuttaa laskennallisen työn funktion L(tai l) maksimin löytämiseksi . Joissakin tapauksissa laskennallinen työ vähenee merkittävästi seuraavien ominaisuuksien vuoksi: ensinnäkin, jos a* on sellainen O.S., jolle (6) tulee yhtäläisyys, niin O.S. suurin todennäköisyys on ainutlaatuinen ja sama kuin a*; toiseksi, jos Z on olemassa, niin O. s. suurin todennäköisyys on funktio Z.

Olkoon esimerkiksi riippumaton ja jakautunut tasaisesti normaalisti siten, että

siksi

Koordinaatit a = a 0 ja s= s 0 funktion I( a, s).täytä yhtälöjärjestelmä


Näin ollen ja näin ollen tässä tapauksessa O. s. (1) ja (2) - maksimitodennäköisyysarviot ja - parhaat O. s. parametri a, normaalisti jakautunut (, ), ja - asymptoottisesti tehokas O. s. parametri s 2 , jaettu suurelle p:lle on suunnilleen normaali (). Molemmat arviot ovat riittävän riippumattomia tilastoja.

Toinen esimerkki, jossa

Tämä tiheys kuvaa tyydyttävästi litteän valkokankaan saavuttaneiden ja ruudun ulkopuolella sijaitsevasta pisteestä paenneiden hiukkasten yhden koordinaatin jakautumista (a on lähdeprojektion koordinaatti kankaalle, sen oletetaan olevan tuntematon). Määritetylle matematiikan jakautumiselle. odotusta ei ole olemassa, koska vastaava poikkeaa. Siksi O:n haku sivuittain. sillä hetkien menetelmä on mahdoton. Virallinen hakemus sivun O.:na. aritmeettinen keskiarvo (1) on merkityksetön, koska se jakautuu tässä tapauksessa samalla tiheydellä p(x; a) kuin jokainen yksittäinen havaintotulos. Arvioinnissa voidaan käyttää sitä tosiasiaa, että tarkasteltu jakauma on symmetrinen pisteen suhteen x=a ja siksi, a - teoreettinen mediaani jakelu. Hieman modifioimalla hetkien menetelmää, kuten O. s. hyväksyäkseen ns. näytemediaani m, joka on puolueeton O. s. a:lle ja jos p on suuri, niin m jakautuu suunnilleen normaalisti varianssilla


Samaan aikaan

siksi ja siten kohdan (7) mukaisesti asymptoottisesti. tehokkuus on sama. Näin ollen, jotta m olisi yhtä tarkka O. s. a:n ja suurimman todennäköisyyden estimaatin a osalta havaintojen määrää tulee lisätä 25 %. Jos kokeilun kustannukset ovat korkeat, niin sivun määrittämiseen tulee käyttää O.:ta. a, joka tässä tapauksessa määritellään yhtälöiksi

Ensimmäiseksi approksimaatioksi valitaan 0 =u ja sitten tämä ratkaistaan ​​peräkkäisillä approksimaatioilla kaavan mukaan

Katso myös Piste-arvio.

Intervalliarviot. Intervalliestimaattia kutsutaan. sellainen rajajärjestelmä, joka on geometrisesti esitettävissä parametriavaruuteen kuuluvien pisteiden joukkona. Väli O. kanssa. voidaan pitää pisteenä O. kanssa. Tämä joukko riippuu havaintojen tuloksista ja siksi se on satunnainen; siksi jokainen intervalli O. kanssa. on asetettu vastaamaan todennäköisyyttä, jolla tämä estimaatti "kattaa" tuntemattoman parametrin. kohta. Tällainen todennäköisyys riippuu yleisesti ottaen tuntemattomista parametreista; siksi intervallin O luotettavuuden ominaisuus. hyväksy luottamus - määritetyn todennäköisyyden pienin mahdollinen arvo. Informatiivinen tilasto. johtopäätösten avulla on mahdollista saada vain ne intervallit O. s., luottamuskerroin to-rykh on lähellä yksikköä.

Jos yksi parametri a on estimoitu, niin intervalli O. kanssa. yleensä on jokin (b, g) (ns. ), jonka päätepisteet (b ja g ovat havaintojen tulosten funktioita; luottamuskerroin tässä tapauksessa määritellään todennäköisyyksiksi kahden tapahtuman samanaikaiselle esiintymiselle (b< a} и (g >a) lasketaan parametrin a kaikista mahdollisista arvoista:


Jos tällaisen välin keskikohta otetaan pisteeksi O. kanssa. parametrille a, niin ainakin todennäköisyydellä ω voidaan väittää, että tämä O. s. ei ylitä puolta välin pituudesta. Toisin sanoen, jos noudatamme annettua absoluuttisen virheen estimointisääntöä, virheellinen johtopäätös saadaan keskimäärin alle tapauksia. Kiinteälle luottamuskertoimelle lyhimmät luottamusvälit ovat edullisimpia, joille matemaattinen pituusodotus saavuttaa pienimmän arvon.

Jos satunnaismuuttujien jakauma X i riippuu vain yhdestä tuntemattomasta parametrista a, silloin luottamusvälin rakentaminen suoritetaan yleensä jonkin pisteen O. s avulla. a. Useimmissa käytännöllisesti kiinnostavissa tapauksissa järkevästi valitun O. s. ja monotonisesti riippuu parametrista a. Näissä olosuhteissa sivun välin O. etsimiseksi. seuraa F(x; a) korvike x= a . ja löytää juuret a 1 = a 1(a, w) ja a 2 \u003d a 2 (a, w) yhtälöt

(9) missä

[jatkuville jakeluille]. Pisteet, joissa on koordinaatit ja rajoittavat luottamusväliä luottamuskertoimella w. Tietenkin näin yksinkertaisella tavalla rakennettu intervalli voi monissa tapauksissa poiketa optimaalisesta (lyhyimmästä). Kuitenkin, jos a on asymptoottisesti tehokas O.S. a, niin riittävän suurelle määrälle havaintoja tällainen intervalli O. s. käytännössä merkityksettömästi erilainen kuin optimaalinen. Tämä pätee erityisesti O. s. suurin todennäköisyys, koska se jakautuu asymptoottisesti normaalisti (katso (8)). Tapauksissa, joissa yhtälöt (9) ovat vaikeita, väli O. s. laske suunnilleen pisteen O avulla. kanssa. suurin todennäköisyys ja suhde (8):

missä X - yhtälön juuri

Jos , niin intervalliestimaatin todellinen luottamuskerroin pyrkii olemaan w. Yleisemmässä tapauksessa havaintojen tulosten jakautuminen X i- riippuu useista parametreista a, b.... Näissä olosuhteissa yllä olevat säännöt luottamusvälien muodostamiseksi osoittautuvat usein soveltumattomiksi, koska pisteen O. jakauma. a , riippuu pääsääntöisesti paitsi a:sta, myös muista parametreista. Kuitenkin käytännössä mielenkiintoisissa tapauksissa O. s. a voidaan korvata tällaisella funktiolla havaintojen tuloksista X i ja tuntematon parametri i, jonka jakauma ei riipu (tai "lähes ei riipu") kaikista tuntemattomista parametreista. Esimerkki tällaisesta funktiosta on normalisoitu O. s. suurin todennäköisyys; jos nimittäjä sisältää argumentteja a, b... korvaa ne maksimitodennäköisyyden arvioilla a, b,. . . , niin rajajakauma pysyy samana kuin kaavassa (8). Siksi likimääräiset luottamusvälit kullekin parametrille erikseen voidaan rakentaa seuraavasti sama, kuten yhden parametrin tapauksessa.

Kuten edellä todettiin, jos , ... ovat riippumattomia ja tasaisesti jakautuneita satunnaismuuttujia, niin s 2 ovat parhaat O. s. parametreille a ja s 2 vastaavasti. Jakotoiminto O. s. ilmaistaan ​​kaavalla


ja siksi se ei riipu vain a:sta, vaan myös s:stä. Samalla levitetään ns. opiskelijasuhde


ei riipu a:sta tai s:stä ja

jossa vakio valitaan niin, että yhtäläisyys . Luottamusväli siis

vastaa luottamuskerrointa

Arvion s 2 jakauma riippuu vain s 2:sta ja O. s:n jakaumafunktiosta. s 2 saadaan kaavalla

jossa vakio D n-1 määräytyy ehdon mukaan (ns. -jakauma n-1 vapausasteella).

Koska todennäköisyys kasvaa monotonisesti s:n kasvaessa, muodostaa intervalli O. s. sääntöä (9) sovelletaan. Eli jos x 1 ja x 2 ovat yhtälöiden juuret ja = , sitten luottamusväli

vastaa luottamuskerrointa w. Tästä seuraa erityisesti, että suhteellisen virheen luottamusväli annetaan epäyhtälöillä

Yksityiskohtaiset taulukot Studentin jakautumisfunktioista ja -jakaumista löytyvät useimmista matematiikan käsikirjoista. tilastot.

Tähän asti on oletettu, että havaintojen tulosten jakautumisfunktio tunnetaan useiden parametrien arvojen sisällä. Sovelluksissa kohtaa kuitenkin usein tapaus, jossa jakelufunktio on tuntematon. Tässä tilanteessa ns. ei-parametriset tilastomenetelmät(eli menetelmiä, jotka eivät riipu alkuperäisestä todennäköisyysjakaumasta). Olkoon esimerkiksi tarpeen arvioida teoreettisen mediaani riippumattomien satunnaismuuttujien jatkuva jakauma X 1 , X 2 ,..., X s(symmetrisillä jakaumilla se on sama kuin matemaattinen odotus, jos se tietysti on olemassa). Olkoon Y 1 samat suureet X i mutta nousevaan järjestykseen. Sitten jos k- epäyhtälöt tyydyttävä kokonaisluku n/2, sitten

Siten - intervalli O. kanssa. TS:lle luottamuskertoimella w=w n,k. Tämä pätee mihin tahansa satunnaismuuttujien jatkuvaan jakaumaan X i.

Edellä todettiin, että valikoiva jakauma on piste O. kanssa. tuntemattomalle teoreettiselle jakelu. Lisäksi otantajakaumafunktio F n(x) - siirtämätön O. s. teoreettiselle toiminnalle. jakelu F(x) . Samaan aikaan, kuten kuvassa MUTTA. N. Kolmogorov, tilastojakauma

ei riipu tuntemattomasta teoreettisesta. jakauma ja taipumus rajajakaumaan K(y) , to-roe naz. Kolmogorov-jakauma. Eli jos y - yhtälön K(y)=w ratkaisu, niin todennäköisyydellä w voidaan väittää, että teoreettiset funktiot. jakauma F (y). on täysin "peitetty" funktiokaavioiden välissä olevalla nauhalla (kun tilaston l n ennakko- ja rajajakaumien välinen ero on käytännössä merkityksetön). Tällainen intervalli O. kanssa. nimeltään luottamusvyöhyke. Katso myös Intervalliarviointi.

Tilastolliset estimaatit virheteoriassa. Virheteoria on matemaattisten tilastojen osa, joka on omistettu tuntemattomien suureiden numeeriseen määrittämiseen mittaustuloksista. Mittausvirheiden satunnaisuudesta ja ehkä tutkittavan ilmiön satunnaisuudesta johtuen kaikki tällaiset tulokset eivät ole samanarvoisia: toistuvissa mittauksissa jotkut niistä esiintyvät useammin, toiset harvemmin.

Virheteorian perusta on matemaattinen. , jonka mukaan ennen koetta kaikkien ajateltavissa olevien mittaustulosten kokonaisuutta käsitellään tietyn satunnaismuuttujan arvojen joukkona. Siksi O. saa tärkeän roolin. Virheteorian päätelmät ovat tilastollisia. . Tällaisten johtopäätösten merkitys ja sisältö (samoin kuin O.

Jos oletetaan, että mittaustulos X on satunnaismuuttuja, mittausvirheitä on kolme päätyyppiä: systemaattinen, satunnainen ja karkea (tällaisten virheiden kvalitatiiviset kuvaukset on annettu 2000-luvussa). Virheteoria). Tässä tapauksessa tuntemattoman suuren anaz mittausvirhe. X-a, matemaattinen. tämän eron odotus E( Ha)=b nimeltään systemaattinen virhe (jos b \u003d 0, niin sanotaan, että mittauksissa ei ole systemaattisia virheitä), ja ero d \u003d X- a-b nimeltään satunnainen virhe . Jos siis annetaan p-riippumattomat mittaukset a:lle, niin niiden tulokset voidaan kirjoittaa yhtälöiksi

missä ai ja b ovat vakioita, a d i- satunnaismuuttujat. Yleisemmin

missä b i- eivät ole riippuvaisia ​​d:stä i satunnaismuuttujat, jotka ovat yhtä suuria kuin nolla todennäköisyydellä, joka on hyvin lähellä yksikköä (joten muut arvot ovat epätodennäköisiä). b i nimeltään törkeä virhe.

Tehtävä arvioida (ja eliminoida) systemaattinen. virheet ylittävät yleensä matemaattisen. tilastot. Poikkeuksia ovat ns. standardien menetelmä Kromin mukaan b:n arvioimiseksi, suoritetaan sarja tunnetun arvon a mittauksia (tässä menetelmässä b- arvioitu arvo ja a - tunnettu systemaattinen. virhe), sekä , jonka avulla voit arvioida systemaattista. eroja useiden mittaussarjojen välillä.

Virheteorian päätehtävä on löytää O. kanssa. a:n tuntemattomalle arvolle ja arviolle mittaustarkkuudesta. Jos järjestelmällistä virhe on eliminoitu (b=0) ja havainnot eivät sisällä karkeita virheitä, silloin (10) X i=a+d i ja siksi tässä tapauksessa c:n estimointiongelma rajoittuu tavalla tai toisella optimaalisen O. s:n löytämiseen. matematiikasta. identtisesti jakautuneiden satunnaismuuttujien odotukset X i. Kuten edellisissä osissa näkyy, tällaisten O. s. (piste tai väli) riippuu olennaisesti satunnaisvirheiden jakautumislaista. Jos tämä laki tunnetaan muutamaan tuntemattomaan parametriin asti, niin estimointiin, kuten myös estimointiin, voidaan soveltaa esimerkiksi maksimitodennäköisyyden menetelmää; muuten se seuraa ensin havaintojen tulosten mukaan Х i etsi O. s. tuntemattomalle satunnaisvirheen jakaumafunktiolle d i(sellaisen funktion "ei-parametrinen" väli O. on osoitettu edellä). Käytännössä työt tyytyvät usein kahteen sivun O.:een. ja (katso (1) ja (2)). Jos d i jakautuvat tasaisesti normaalisti, niin nämä O. s. paras; muissa tapauksissa nämä arviot voivat olla tehottomia.

Karkeiden virheiden esiintyminen vaikeuttaa parametrin a estimointiongelmaa. Yleensä havaintojen osuus on pieni ja matemaattinen. odottaa nollasta poikkeavaa |b i| ylittää merkittävästi (karkeat virheet syntyvät satunnaisen laskuvirheen, mittalaitteen lukemien virheellisen lukemisen seurauksena jne.). Karkeavirheitä sisältävät mittaustulokset näkyvät usein selvästi, koska ne eroavat suuresti muista mittaustuloksista. Näissä olosuhteissa tarkoituksenmukaisin tapa karkeiden virheiden tunnistamiseksi (ja eliminoimiseksi) on mittausten suora analyysi, kaikkien kokeiden olosuhteiden invarianssin perusteellinen tarkistus, tulosten kirjaaminen "kahdessa käsissä" jne. Tilastollinen. menetelmiä karkeiden virheiden havaitsemiseksi tulisi käyttää vain epäilyttävissä tapauksissa.

Yksinkertaisin esimerkki tällaisista menetelmistä on tilasto. yhden poikkeavan havainnon tunnistaminen, kun jompikumpi Y 1 = min X 1, tai Y p \u003d maxX i(oletetaan, että yhtälöissä (11) b=0 ja suureiden jakauman laissa d i tiedossa). Jotta saadaan selville, onko oletus yhden karkean virheen olemassaolosta perusteltua, parille Y 1, Y n laske liitosväli O. kanssa. (luottamus ), olettaen, että kaikki b i nolla. Jos tämä O. s. "peittää" pisteen koordinaatteilla ( Y 1, Y n), epäilyä törkeän virheen olemassaolosta on pidettävä tilastollisesti perusteettomana; Muussa tapauksessa hypoteesi karkean virheen olemassaolosta on tunnustettava vahvistetuksi (tässä tapauksessa hylätty havainto yleensä hylätään, koska yhdestä havainnosta ei ole tilastollisesti mahdollista arvioida luotettavasti karkean virheen suuruutta).

Aihe 7. Jakaumaparametrien tilastolliset estimaatit: piste- ja intervalliestimaatit

Tilastollisten menetelmien merkitys on siinä, että rajallisen kokoisen otoksen, eli tietyn osan yleisestä populaatiosta, perusteella tehdään järkevä arvio sen ominaisuuksista kokonaisuutena.

Luonnollisesti populaatiotutkimuksen korvaaminen otantatutkimuksella herättää useita kysymyksiä:

1. Missä määrin otos heijastaa yleisen perusjoukon ominaisuuksia, eli missä määrin otos edustaa yleistä populaatiota?

2. Mitä tietoa yleisen perusjoukon parametrien arvoista otoksen parametrit voivat antaa?

3. Voidaanko väittää, että otannalla saadut tilastolliset ominaisuudet (keskiarvot, varianssi tai muut johdetut arvot) ovat samat kuin ne ominaisuudet, jotka voidaan saada yleisestä perusjoukosta.

Tarkastus osoittaa, että samasta yleisjoukosta eri näytteille saatujen parametrien arvot eivät yleensä täsmää. Satunnaisesti laskettujen näyteparametrien numeeriset arvot ovat vain likimääräisen tuloksen tulosta tilastollinen arviointi näiden parametrien arvot yleisessä populaatiossa. Tilastollinen estimointi mahdollistaa havaittujen ilmiöiden vaihtelevuuden vuoksi vain niiden likimääräisten arvojen saamisen.

Merkintä. Tarkkaan ottaen tilastoissa estimaatti on sääntö arvioitavan parametrin laskemiseksi, ja termi arvioida eli arvioida tarkoittaa likimääräisen arvon ilmaisemista.

Erota arviot kohta ja intervalliarviot.

Jakaumaparametrien pisteestimaatti

Päästää x 1 , x 2 , …, x n– tilavuusnäytteenotto n yleisestä populaatiosta, jolla on jakautumisfunktio F(x).

Tämän näytteen numeerisia ominaisuuksia kutsutaan valikoiva (empiirinen) numeerisia ominaisuuksia.

Huomaa, että otoksen numeeriset ominaisuudet ovat tietyn otoksen ominaisuuksia, mutta eivät yleisen populaation jakauman ominaisuuksia. Näitä ominaisuuksia voidaan kuitenkin käyttää yleisen populaation parametrien arvioimiseen.

pilkullinen kutsutaan tilastolliseksi estimaatiksi, joka määritellään yhdellä numerolla.

Pisteestimaattia kuvaa ominaisuudet: puolueettomuus, elinkelpoisuus ja tehokkuus.

puolueeton kutsutaan pisteestimaatiksi, jonka matemaattinen odotusarvo on yhtä suuri kuin minkä tahansa otoskoon arvioitu parametri.

Pistearvio on ns varakas , jos otoskokoa kasvatetaan rajattomasti ( n® ¥) se konvergoi todennäköisyydessään parametrin todelliseen arvoon, eli pyrkii yleisen perusjoukon estimoidun parametrin todelliseen arvoon.

tehokas kutsutaan pisteestimaatiksi, joka (tietylle otoskoolle n) on pienin mahdollinen varianssi, eli se takaa otosestimaatin pienimmän poikkeaman samasta perusjoukon estimaatista.

Matemaattiset tilastot osoittavat, että johdonmukainen, puolueeton arvio yleisestä keskiarvosta a on otoskeskiarvo:

missä x i- näytteenottomahdollisuus, n i– taajuusvaihtoehdot x i, on otoksen koko.

Yleisvarianssin puolueeton arvio korjaa otosvarianssin

,

Kätevämpi kaava .

Arvosana s 2 yleisvarianssille on myös johdonmukainen, mutta ei tehokas. Normaalijakauman tapauksessa se on kuitenkin "asymptoottisesti tehokas", eli kasvaen n sen varianssin suhde pienimpään mahdolliseen lähestyy yhtenäisyyttä loputtomasti.

Joten, annettu esimerkki jakelusta F(x) Satunnaismuuttuja X tuntemattomilla odotuksilla a ja dispersio s 2, niin näiden parametrien arvojen laskemiseen meillä on oikeus käyttää seuraavia likimääräisiä kaavoja:

Pisteestimaateilla on se haittapuoli, että pienellä otoskoolla ne voivat poiketa merkittävästi arvioiduista parametreista. Siksi, jotta saadaan käsitys parametrin ja sen arvion läheisyydestä, matemaattisessa tilastossa otetaan käyttöön ns. intervalliestimaatteja.

Luottamusväli

Jos tulosten tilastollisen käsittelyn aikana vaaditaan tuntemattoman parametrin θ pisteestimaattien lisäksi myös tämän arvion tarkkuuden karakterisointia, niin luottamusväli löytyy.

Luottamusväli on aikaväli, jossa yleisen populaation tuntematon parametri löydetään ennalta määrätyllä luottamustodennäköisyydellä.

Luottamuksen todennäköisyys on todennäköisyys, jolla tuntematon populaatioparametri kuuluu luottamusväliin.

Luottamusvälin pituus luonnehtii intervallin estimoinnin tarkkuutta ja riippuu otoksen koosta ja luottamustasosta. Otoskoon kasvaessa pituus muuttuu. intervalli pienenee (tarkkuus kasvaa), ja kun luottamustodennäköisyys on 1, pituus on luottamus. intervalli kasvaa (tarkkuus laskee) Luottamustason p ohella käytännössä käytetään usein merkitsevyystasoa α = 1 - p.

Ota yleensä p = 0,95 tai (harvoin) 0,99. Nämä todennäköisyydet tunnustetaan riittäviksi, jotta yleisten parametrien luotettavuus voidaan tehdä tunnettujen otosindikaattoreiden perusteella.

Matemaattisen odotuksen luottamusväli on: missä S - RMS, - Studentin jakauman kriittinen arvo (katso aiheen 7 LIITE 1)

Samanlaisia ​​viestejä