Paloturvallisuuden tietosanakirja

Tilastollisten arvioiden ominaisuuksien tuntemattomien parametrien estimointi. Tilastollinen arviointi. Esimerkki ongelman ratkaisusta

tilastollisen estimoinnin jakauman näyte

Arvio on arvio halutun suuren arvoista, joka on saatu näytehavaintotulosten perusteella. Arviot ovat satunnaismuuttujia. Ne tarjoavat mahdollisuuden muodostaa tietoon perustuvia arvioita populaation tuntemattomista parametreista. Esimerkki yleisen keskiarvon estimoinnista on yleisvarianssin otoskeskiarvo - otosvarianssi jne.

Sen arvioimiseksi, kuinka "hyvin" arviointi täyttää vastaavat yleiset ominaisuudet, on kehitetty 4 kriteeriä: johdonmukaisuus, puolueettomuus, tehokkuus ja riittävyys. Tämä lähestymistapa perustuu siihen, että estimaatin laatua eivät määrää sen yksittäiset arvot, vaan sen satunnaismuuttujan jakautumisen ominaisuudet.

Todennäköisyysteorian periaatteiden perusteella voidaan osoittaa, että sellaisista otosominaisuuksista kuin aritmeettinen keskiarvo, moodi ja mediaani vain aritmeettinen keskiarvo edustaa johdonmukaista, puolueetonta, tehokasta ja riittävää yleisen keskiarvon estimaattia. Tämä määrittää aritmeettisen keskiarvon suosimisen muiden otosominaisuuksien joukossa.

Puolueeton arviointi ilmenee siinä, että sen matemaattinen odotus minkä tahansa otoskoon kohdalla on yhtä suuri kuin estimoidun parametrin arvo yleisessä populaatiossa. Jos tämä vaatimus ei täyty, niin arviointi on siirretty.

Puolueettoman estimoinnin ehdolla pyritään eliminoimaan systemaattiset estimointivirheet.

Ratkaiseessaan estimointiongelmia he käyttävät myös asymptoottisesti puolueettomia arvioita, jolle otoksen koon kasvaessa matemaattinen odotus suuntautuu yleisen perusjoukon estimoituun parametriin.

Rikkaus tilastolliset estimaatit ilmenevät siinä, että otoskoon kasvaessa estimaatti lähestyy ja lähemmäs estimoidun parametrin todellista arvoa tai, kuten sanotaan, estimaatti konvergoi todennäköisyydessään haluttuun parametriin tai suuntautuu sen matemaattiseen odotukseen. . Vain johdonmukaisilla arvioinneilla on käytännön merkitystä.

Tämä on arvio puolueettomasta parametrista, jolla on pienin varianssi tietyllä otoskoolla. Käytännössä estimointivarianssi tunnistetaan yleensä estimointivirheellä.

Kuten arvioinnin tehokkuustoimenpiteitä ota pienimmän mahdollisen varianssin suhde toisen arvion varianssiin.

Kutsutaan estimaattia, joka varmistaa kaiken otokseen sisältyvän tiedon täydellisen käytön populaation tuntemattomasta ominaisuudesta riittävä(tyhjentävä).

Yllä käsiteltyjen tilastollisten estimaattien ominaisuuksien noudattaminen mahdollistaa yleisen perusjoukon parametrien estimointiin tarkoitettujen otosominaisuuksien pitämisen parhaimpana.

Matemaattisten tilastojen tärkein tehtävä on saada näytetiedoista rationaalisin, "oikein" data. tilastollisia arvioita yleisen väestön halutut parametrit. Tilastollisia päätelmiä on kahdenlaisia: tilastollinen estimointi; tilastollisten hypoteesien testaaminen.

Tilastollisten arvioiden saamisen päätehtävä on valita ja perustella parhaat arviot, joka tarjoaa mahdollisuuden yleisen väestön tuntemattomien parametrien järkevään arvioimiseen.

Tuntemattomien parametrien estimointiongelma voidaan ratkaista kahdella tavalla:

  • 1. tuntematon parametri on luonnehdittu yhdellä numerolla (pisteellä) - käytetään pisteen estimointimenetelmää;
  • 2. intervallin estimointi, eli määritetään intervalli, jossa haluttu parametri voi jollain todennäköisyydellä sijaita.

Piste-arvio Tuntematon parametri on, että otosestimaatin tietty numeerinen arvo otetaan parhaaksi approksimaatioksi todelliseen populaatioparametriin, eli tuntematon populaatioparametri estimoidaan yhdellä näytteestä määritetyllä numerolla (pisteellä). Tällä lähestymistavalla on aina riski tehdä virhe, joten pisteestimaattia on täydennettävä indikaattorilla mahdollinen virhe tietyllä todennäköisyystasolla.

Sen keskihajonna on otettu keskimääräiseksi estimointivirheeksi.

Tällöin yleisen keskiarvon pisteestimaatti voidaan esittää intervalliksi

missä on otoksen aritmeettinen keskiarvo.

Pisteestimaattia tehtäessä käytetään useita menetelmiä arvioiden saamiseksi näytetiedoista:

  • 1. momenttien menetelmä, jossa yleisen perusjoukon momentit korvataan otosjoukon momenteilla;
  • 2. pienimmän neliösumman menetelmä;
  • 3. suurimman todennäköisyyden menetelmä.

Monissa ongelmissa on välttämätöntä löytää populaatioparametrin numeerisen arvion lisäksi myös sen tarkkuus ja luotettavuus. Tämä on erityisen tärkeää suhteellisen pienille näytteille. Tilastollisen parametrin pisteestimaatin yleistys on sen intervalliarvio- estimoidun parametrin tietyllä todennäköisyydellä sisältävän numeerisen välin löytäminen.

Koska yleisiä ominaisuuksia määritettäessä näytetiedoista tulee aina jokin virhe, on käytännöllisempää määrittää löydetyn pisteestimaatin keskipisteenä oleva intervalli, jonka sisällä yleisen ominaisuuden estimoidun parametrin todellinen haluttu arvo sijaitsee tietty määrätty todennäköisyys. Tätä intervallia kutsutaan luottamusväliksi.

Luottamusväli on numeerinen väli, joka tietyllä todennäköisyydellä r kattaa populaation arvioidun parametrin. Tätä todennäköisyyttä kutsutaan luottamukseksi. Luottamuksen todennäköisyys r on todennäköisyys, jota voidaan pitää riittävänä ratkaistavan ongelman puitteissa otoshavaintojen perusteella saatujen ominaisuuksien luotettavuuden arvioimiseksi. Koko

virheen tekemisen todennäköisyyttä kutsutaan merkitystaso.

Otos (piste)estimaatin JA * (theta) parametrin JA yleisen populaation tarkkuudella ( äärimmäinen virhe) D ja luottamustodennäköisyys r, luottamusväli määräytyy yhtälöllä:

Luottamustodennäköisyys r mahdollistaa määrittämisen luottamusrajoja tutkitun parametrin JA satunnainen vaihtelu tietylle otokselle.

Seuraavia arvoja ja niitä vastaavia arvoja pidetään usein luottamustodennäköisyyksinä: merkitystasoja

Taulukko 1. - Yleisimmin käytetyt luottamustodennäköisyydet ja merkitsevyystasot

Esimerkiksi 5 prosentin merkitsevyystaso tarkoittaa seuraavaa: 5 tapauksessa 100:sta on olemassa riski tehdä virhe tunnistettaessa populaation ominaisuuksia otostiedoista. Tai toisin sanoen 95 tapauksessa 100:sta otoksen perusteella tunnistettu yleinen ominaisuus on luottamusvälin sisällä.

Väestön parametrien tilastolliset arviot. Tilastollisia hypoteeseja

LUENTO 16

Olkoon tarpeen tutkia yleisen populaation kvantitatiivista ominaisuutta. Oletetaan, että olemme teoreettisin perustein pystyneet määrittämään tarkalleen, mikä jakauma ominaisuudella on. Tämä nostaa esiin tämän jakauman määrittävien parametrien arvioinnin ongelman. Jos esimerkiksi tiedetään, että tutkittava ominaisuus jakautuu yleiseen perusjoukkoon normaalin lain mukaan, on tarpeen arvioida (likimäärin löytää) matemaattinen odotusarvo ja keskihajonta, koska nämä kaksi parametria määräävät täysin normaalijakauman. . Jos on syytä uskoa, että ominaisuudella on Poisson-jakauma, on tarpeen arvioida parametri, jolla tämä jakauma määräytyy.

Tyypillisesti jakaumassa tutkijalla on vain näytedataa, esimerkiksi havaintojen tuloksena saadut kvantitatiivisen ominaisuuden arvot (jäljempänä havainnot oletetaan riippumattomiksi). Arvioitu parametri ilmaistaan ​​näiden tietojen avulla.

Tarkastellaan itsenäisten satunnaismuuttujien arvoina , voidaan sanoa, että tilastollisen arvion löytäminen teoreettisen jakauman tuntemattomasta parametrista tarkoittaa havaittujen satunnaismuuttujien funktion löytämistä, joka antaa arvioidulle parametrille likimääräisen arvon. Esimerkiksi, kuten alla näytetään, voit arvioida normaalijakauman matemaattisen odotuksen käyttämällä funktiota (attribuutin havaittujen arvojen aritmeettinen keskiarvo):

.

Niin, tilastollinen arviointi Teoreettisen jakauman tuntematonta parametria kutsutaan havaittujen satunnaismuuttujien funktioksi. Kutsutaan tilastollinen estimaatti tuntemattomasta populaatioparametrista, joka on kirjoitettu yhtenä numerona kohta. Harkitse seuraavia pistearvioita: puolueellinen ja puolueeton, tehokas ja johdonmukainen.

Jotta tilastolliset estimaatit antaisivat "hyviä" likiarvoja arvioiduista parametreista, niiden on täytettävä tietyt vaatimukset. Osoittakaamme nämä vaatimukset.

Olkoon tilastollinen arvio teoreettisen jakauman tuntemattomasta parametrista. Oletetaan, että tilavuutta otettaessa arvio löytyy. Toistetaan koe, eli poimimme toisen samankokoisen otoksen yleisestä populaatiosta ja käytämme sen tietoja löytääksemme arvion jne. Toistamalla kokeen monta kertaa saamme numerot , jotka yleisesti ottaen eroavat toisistaan. Siten pistemäärää voidaan pitää satunnaismuuttujana ja numeroina – sen mahdollisina merkityksinä.

On selvää, että jos estimaatti antaa likimääräisen arvon ylijäämällä, niin jokainen näytedatasta löydetty luku on suurempi kuin todellinen arvo. Näin ollen tässä tapauksessa satunnaismuuttujan matemaattinen (keskiarvo) on suurempi kuin , eli . Ilmeisesti, jos se antaa likimääräisen arvon haitalla, niin .


Siksi tilastollisen arvion, jonka matemaattinen odotus ei ole yhtä suuri kuin estimoitu parametri, käyttö johtaa systemaattisiin (samamerkkisiin) virheisiin. Tästä syystä on luonnollista edellyttää, että estimaatin matemaattinen odotus on yhtä suuri kuin arvioitu parametri. Vaikka tämän vaatimuksen noudattaminen ei yleensä poista virheitä (jotkut arvot ovat suurempia ja toiset pienempiä), eri merkkisiä virheitä esiintyy yhtä usein. Vaatimuksen noudattaminen takaa kuitenkin systemaattisten virheiden saamisen mahdottomuuden eli eliminoi systemaattiset virheet.

Puolueeton kutsutaan tilastolliseksi estimaatiksi (virhe), jonka matemaattinen odotus on yhtä suuri kuin minkä tahansa otoskoon estimoitu parametri, eli.

Siirretty kutsutaan tilastolliseksi estimaatiksi, jonka matemaattinen odotus ei ole yhtä suuri kuin minkä tahansa otoskoon estimoitu parametri, ts.

Olisi kuitenkin virhe olettaa, että puolueeton estimaatti antaa aina hyvän likiarvon arvioitavalle parametrille. Mahdolliset arvot voivat todellakin olla hajallaan keskiarvonsa ympärillä, eli hajonta voi olla merkittävä. Tällöin esimerkiksi yhden otoksen tiedoista saatu arvio voi osoittautua hyvin kaukana keskiarvosta ja siten itse estimoidusta parametrista. Siten ottamalla likimääräiseksi arvoksi teemme suuren virheen. Jos haluat, että varianssi on pieni, suuren virheen mahdollisuus suljetaan pois. Tästä syystä tilastollisen arvioinnin edellytyksenä on tehokkuus.

Tehokas on tilastollinen arvio, jolla (tietylle otoskoolle) on pienin mahdollinen varianssi.

Varakas he kutsuvat tilastollista estimaatia, joka todennäköisyydellä pyrkii estimoituun parametriin, eli yhtälö on tosi:

.

Jos esimerkiksi puolueettoman arvion varianssi pisteessä pyrkii nollaan, niin tällainen estimaatti osoittautuu myös johdonmukaiseksi.

Tarkastellaanpa kysymystä, mitkä otosominaisuudet parhaiten arvioivat yleisen keskiarvon ja varianssin puolueettomuuden, tehokkuuden ja johdonmukaisuuden suhteen.

Tutkitaan diskreettiä yleispopulaatiota jonkin kvantitatiivisen ominaisuuden suhteen.

Yleinen toissijainen kutsutaan yleisen väestön ominaisarvojen aritmeettiseksi keskiarvoksi. Se lasketaan kaavalla:

§ – jos kaikki yleisen tilavuusjoukon ominaisuuden arvot ovat erilaisia;

§ – jos yleisen perusjoukon ominaisuuden arvoilla on vastaavasti taajuuksia, ja . Toisin sanoen yleinen keskiarvo on ominaisuusarvojen painotettu keskiarvo, jonka painot ovat yhtä suuria kuin vastaavat taajuudet.

Kommentti: anna aseman yleisen populaation sisältää objekteja, joilla on erilaiset attribuutin arvot. Kuvitellaan, että tästä joukosta valitaan sattumanvaraisesti yksi kohde. Todennäköisyys, että esimerkiksi objekti, jolla on ominaisuuden arvo, haetaan, on luonnollisesti yhtä suuri kuin . Mikä tahansa muu objekti voidaan hakea samalla todennäköisyydellä. Näin ollen ominaisuuden arvoa voidaan pitää satunnaismuuttujana, jonka mahdollisilla arvoilla on samat todennäköisyydet kuin . Tässä tapauksessa ei ole vaikea löytää matemaattista odotusta:

Joten jos tarkastellaan yleisen populaation tutkittua ominaisuutta satunnaismuuttujana, niin ominaisuuden matemaattinen odotus on yhtä suuri kuin tämän ominaisuuden yleinen keskiarvo: . Saimme tämän johtopäätöksen ottamalla huomioon, että kaikilla yleisen väestön esineillä on erilaisia ​​merkityksiä merkki. Sama tulos saadaan, jos oletetaan, että yleinen populaatio sisältää useita objekteja, joilla on sama attribuuttiarvo.

Yleistämällä saatu tulos yleiseen populaatioon ominaisuuden jatkuvalla jakaumalla, määrittelemme yleisen keskiarvon ominaisuuden matemaattiseksi odotukseksi: .

Otetaan näyte tilavuudesta yleisen populaation tutkimiseksi kvantitatiivisen ominaisuuden suhteen.

Näytteen keskiarvo kutsutaan näytepopulaation ominaisarvojen aritmeettiseksi keskiarvoksi. Se lasketaan kaavalla:

§ – jos kaikki näytetilavuuden ominaisuuden arvot ovat erilaisia;

§ – jos otosjoukon ominaisuuden arvoilla on vastaavasti taajuuksia, ja . Toisin sanoen otoskeskiarvo on attribuuttiarvojen painotettu keskiarvo, jonka painot ovat yhtä suuria kuin vastaavat taajuudet.

Kommentti: Yhden otoksen tiedoista löydetty otoskeskiarvo on ilmeisesti tietty luku. Jos otat samasta populaatiosta muita samankokoisia näytteitä, otoksen keskiarvo muuttuu näytteestä toiseen. Otoskeskiarvoa voidaan siis pitää satunnaismuuttujana, ja siksi voidaan puhua otoskeskiarvon jakaumista (teoreettisista ja empiirisista) ja tämän jakauman numeerisista ominaisuuksista, erityisesti otoksen matemaattisesta odotuksesta ja varianssista. jakelu.

Lisäksi, jos yleinen keskiarvo on tuntematon ja se on estimoitava otantadatan avulla, otoskeskiarvo, joka on puolueeton ja johdonmukainen arvio, otetaan yleisen keskiarvon estimaatiksi (ehdotamme tämän väitteen todistamista itse). Yllä olevasta seuraa, että jos näytteenottokeskiarvot löydetään useammalle riittävän suurelle näytteelle samasta yleisjoukosta, niin ne ovat suunnilleen samat keskenään. Tämä on omaisuus näytevälineiden stabiilisuus.

Huomaa, että jos kahden populaation varianssit ovat samat, otoskeskiarvojen läheisyys yleisiin keskiarvoihin ei riipu otoskoon suhteesta yleisen perusjoukon kokoon. Se riippuu otoksen koosta: mitä suurempi otoskoko, sitä vähemmän otoksen keskiarvo poikkeaa yleisestä keskiarvosta. Jos esimerkiksi 1 % objekteista valitaan yhdestä populaatiosta ja 4 % objekteista valitaan toisesta populaatiosta ja ensimmäisen otoksen tilavuus osoittautuu suuremmiksi kuin toisen, ensimmäisen otoksen keskiarvo poikkeaa vähemmän. vastaava yleinen keskiarvo kuin toinen.

Luennon sisältö:

    Arvioinnin käsite

    Tilastollisten arvioiden ominaisuudet

    Menetelmät pisteestimaattien löytämiseksi

    Intervalliparametrien estimointi

    Matemaattisen odotuksen luottamusväli normaalijakauman populaation tunnetulla varianssilla.

    Chi-neliöjakauma ja Studentin t-jakauma.

    Luottamusväli sellaisen satunnaismuuttujan matemaattiselle odotukselle, jolla on normaalijakauma tuntemattoman varianssin kanssa.

    Normaalijakauman keskihajonnan luottamusväli.

Bibliografia:

    Wentzel, E.S. Todennäköisyysteoria [teksti] / E.S. Wentzel. -M.: valmistua koulusta, 2006. – 575 s.

    Gmurman, V.E. Todennäköisyysteoria ja matemaattiset tilastot [Teksti] / V.E. Gmurman. - M.: Higher School, 2007. - 480 s.

    Kremer, N.Sh. Todennäköisyysteoria ja matemaattiset tilastot [Teksti] / N.Sh. Kremer - M: UNITY, 2002. – 543 s.

P.1. Arvioinnin käsite

Jakaumat, kuten binomi-, eksponentiaalinen ja normaali, ovat jakaumien perheitä, jotka riippuvat yhdestä tai useammasta parametrista. Esimerkiksi eksponentiaalinen jakauma, jolla on todennäköisyystiheys, riippuu yhdestä parametrista λ, normaalijakaumasta
- kahdesta parametrista m ja σ. Tutkittavan ongelman ehdoista käy yleensä selväksi, mistä jakaumien perheestä puhutaan. Tämän jakauman parametrien erityiset arvot, jotka sisältyvät meitä kiinnostavien jakauman ominaisuuksien lausekkeisiin, jäävät kuitenkin tuntemattomiksi. Siksi on tarpeen tietää ainakin näiden määrien likimääräinen arvo.

Määritetään yleisen populaation jakautumislaki sen jakaumaan sisältyvien parametrien arvoihin asti
, joista osa voi olla tiedossa. Yksi matemaattisen tilaston tehtävistä on löytää havaintojen otoksesta estimaatteja tuntemattomille parametreille
yleisestä väestöstä. Tuntemattomien parametrien estimointi koostuu funktion muodostamisesta
satunnaisotoksesta siten, että tämän funktion arvo on suunnilleen sama kuin arvioitu tuntematon parametri θ . Toiminto nimeltään tilastot parametri θ .

Tilastollinen arviointi(tulevaisuudessa yksinkertaisesti arviointi) parametri θ Teoreettista jakaumaa kutsutaan sen likimääräiseksi arvoksi, riippuen valintatiedoista.

Arvosana on satunnaismuuttuja, koska on riippumattomien satunnaismuuttujien funktio
; Jos teet toisen näytteen, funktio saa yleisesti ottaen eri arvon.

Arvioita on kahdenlaisia: piste- ja intervalli.

Kohta kutsutaan pisteeksi, joka määräytyy yhden luvun perusteella. Pienellä määrällä havaintoja nämä arviot voivat johtaa suuriin virheisiin. Niiden välttämiseksi käytetään intervalliestimaatteja.

Intervalli on arvio, joka määräytyy kahdella luvulla - sen välin päillä, joihin estimoitu arvo sisältyy tietyllä todennäköisyydellä θ .

S. 2 Tilastollisten arvioiden ominaisuudet

Koko
nimeltään arvioinnin tarkkuus. Vähemmän
, mitä paremmin, sitä tarkemmin tuntematon parametri määritetään.

Minkä tahansa parametrin arviointiin liittyy useita vaatimuksia, jotka sen on täytettävä ollakseen "lähellä" parametrin todellista arvoa, ts. olla jossain mielessä "hyvänlaatuinen" arvio. Arvion laatu määritetään tarkistamalla, onko sillä puolueettomuuden, tehokkuuden ja johdonmukaisuuden ominaisuuksia.

Arvosana parametri θ nimeltään siirtymättä(ilman systemaattisia virheitä), jos estimaatin matemaattinen odotus osuu yhteen todellisen arvon kanssa θ :

. (1)

Jos yhtälö (1) ei päde, niin estimaatti nimeltään siirretty(systeemisillä virheillä). Tämä harha voi johtua mittausvirheistä, laskentavirheistä tai näytteen ei-satunnaisesta luonteesta. Systemaattiset virheet johtavat yli- tai aliarviointiin.

Joissakin matemaattisten tilastojen ongelmissa voi olla useita puolueettomia arvioita. Yleensä suositaan sitä, jolla on vähiten sironta (dispersio).

Arvosana nimeltään tehokas, jos sillä on pienin varianssi kaikkien mahdollisten parametrin puolueettomien arvioiden joukossa θ .

Antaa D() on pienin varianssi ja
– minkä tahansa muun puolueettoman arvion varianssi parametri θ . Sitten arvion tehokkuus yhtä kuin

. (2)

Se on selvää
. Mitä lähemmäksi
arvoon 1, sitä tehokkaampi arviointi on . Jos
klo
, niin arviota kutsutaan asymptoottisesti tehokas.

Kommentti: Jos pisteet puolueellinen, silloin sen varianssin pienuus ei osoita sen virheen pienuutta. Otetaan esimerkiksi parametrin arvio θ joku numero , saamme arvion jopa nollavarianssilla. Tässä tapauksessa virhe (virhe)
voi olla niin suuri kuin haluat.

Arvosana nimeltään varakas, jos näytekoko kasvaa (
) estimaatti konvergoi todennäköisyydessään parametrin tarkkaan arvoon θ , eli jos jollekin

. (3)

Arvioinnin pätevyys parametri θ tarkoittaa sitä kasvun kanssa n otoskoko arvioinnin laatu paranee.

Lause 1. Otoskeskiarvo on puolueeton ja johdonmukainen arvio matemaattisesta odotuksesta.

Lause 2. Korjattu otosvarianssi on varianssin puolueeton ja johdonmukainen estimaatti.

Lause 3. Otoksen empiirinen jakaumafunktio on puolueeton ja johdonmukainen estimaatti satunnaismuuttujan jakaumafunktiosta.

Tämän luvun tutkittuaan opiskelija tekee tietää, että näytettä voidaan pitää yleisen populaation empiirisenä analogina, että otostietojen avulla voidaan arvioida yleisen populaation ominaisuuksia ja arvioida sen ominaisuuksia, tilastollisten arvioiden jakautumisen peruslakeja, pystyä tuottaa populaatioparametrien piste- ja intervalliestimaatteja momenttien ja maksimitodennäköisyyden menetelmällä, oma tapoja määrittää saatujen arvioiden tarkkuus ja luotettavuus.

Tilastollisten arvioiden tyypit

Tiedämme yleisen populaation parametreistä sen, että ne ovat objektiivisesti olemassa, mutta niitä on mahdotonta määrittää suoraan, koska yleinen populaatio on joko ääretön tai liian suuri. Siksi kysymys voi olla vain näiden ominaisuuksien arvioinnista.

Aikaisemmin on todettu, että yleisestä populaatiosta otetulle näytteelle on mahdollista edustavuuden ehtojen mukaisesti määrittää ominaisuudet, jotka ovat analogisia yleisen populaation ominaisuuksien kanssa.

cjp Määritelmä 8.1. Otuksesta löydettyjä jakaumaparametrien likimääräisiä arvoja kutsutaan parametriestimaateiksi.

Merkitään satunnaismuuttujan (yleisen populaation) estimoitu parametri 0:ksi ja sen otoksesta saatu arvio 0:ksi.

Pistemäärä 0 on satunnaismuuttuja, koska mikä tahansa näyte on satunnainen. Eri näytteille saadut arviot eroavat toisistaan. Siksi pidämme 0:ta funktiona näytteestä riippuen: 0 = 0(X in).

ShchR Määritelmä 8.2. Tilastollinen arviointi on ns varakas, jos se todennäköisyydellä pyrkii arvioituun parametriin:

Tämä yhtäläisyys tarkoittaa, että tapahtumasta 0=0 tulee luotettava, kun otoskoko kasvaa loputtomasti.

Esimerkkinä voisi olla jonkin tapahtuman suhteellinen esiintymistiheys A, joka on johdonmukainen arvio tämän tapahtuman todennäköisyydestä Poissonin lauseen mukaisesti (katso kaava (6.1), osa 1).

Määritelmä 8.3. Tilastollisen estimaatin sanotaan olevan tehokas, jos sillä on pienin varianssi samoilla otoskokoilla.

Harkitse arviointia M x matemaattinen odotus M x Satunnaismuuttuja X. Sellaisena arviona valitsemme X. Etsitään satunnaismuuttujan matemaattinen odotus X.

Tehkäämme ensin tärkeä lausunto: koska kaikki satunnaismuuttujat X, ovat peräisin samasta populaatiosta X, mikä tarkoittaa, että niillä on sama jakautuminen kuin X, voidaan kirjoittaa:

Nyt etsitään M(X in):


Otoskeskiarvo on siis tilastollinen arvio satunnaismuuttujan matemaattisesta odotuksesta. Tämä arvio on johdonmukainen, koska Tšebyshevin lauseen mukaan se konvergoi todennäköisyydessään matemaattiseen odotukseen (6.3).

Olemme todenneet, että tarkasteltavassa tapauksessa valitsemamme estimaatin (satunnaismuuttujan) matemaattinen odotus on yhtä suuri kuin itse estimoitu parametri. Tällä ominaisuudella estimaatilla on erityinen paikka matemaattisissa tilastoissa; niitä kutsutaan puolueettomiksi.

Määritelmä 8.4. Tilastollista estimaattia © kutsutaan puolueettomaksi, jos sen matemaattinen odotus on yhtä suuri kuin arvioitu parametri

Jos tämä vaatimus ei täyty, arviota kutsutaan puolueelliseksi.

Siten otoskeskiarvo on odotusarvon puolueeton arvio.

Analysoidaan otoksen varianssiharhaa D, jos se valitaan yleisen varianssin estimaatiksi Dx. Tätä varten tarkistetaan täyttyykö ehto (8.2):


Muunnetaan kumpikin tuloksena oleva termi:

Tässä käytettiin tasa-arvoa M(X.) = M(X 2), oikeudenmukainen samasta syystä kuin (8.1).

Katsotaanpa toista termiä. Käytä neliösummakaavaa P saamme ehdot


Ottaen jälleen huomioon yhtäläisyyden (8.1) sekä sen, että X ja X ovat itsenäisiä satunnaismuuttujia, kirjoitamme

ja lopuksi saamme:

Korvataan saadut tulokset arvolla (8.3)

Muutoksen jälkeen saamme

Siten voimme päätellä, että otosvarianssi on siirretty yleisvarianssin estimointi.

Saadun tuloksen huomioon ottaen asetimme tehtäväksi rakentaa yleisvarianssin estimaatti, joka tyydyttäisi puolueettoman ehdon (8.2). Tätä varten harkitse satunnaismuuttujaa

On helppo nähdä, että tälle määrälle ehto (8.2) täyttyy:

Huomaa, että erot otosvarianssin ja korjatun otosvarianssin välillä muuttuvat merkityksettömiksi suuremmilla otoskooilla.

Satunnaismuuttujien ominaisuuksien arvioita valittaessa on tärkeää tietää niiden tarkkuus. Joissakin tapauksissa se on pakollinen korkea tarkkuus, ja joskus riittää karkea arvio. Esimerkiksi jatkolentoa suunnitellessamme on tärkeää tietää mahdollisimman tarkasti suunniteltu saapumisaika jatkopisteeseen. Toisessa tilanteessa, esimerkiksi ollessaan kotona ja odottaessamme kuriiria tilaamamme tavaran kanssa, sen saapumisajan korkea tarkkuus ei ole meille tärkeää. Molemmissa tapauksissa satunnaismuuttuja on saapumisaika, ja meitä kiinnostava satunnaismuuttujan ominaisuus on keskimääräinen matka-aika.

Arvioita on kahdenlaisia. Ensimmäisessä tapauksessa tehtävänä on saada parametrille tietty numeerinen arvo. Toisessa tapauksessa määritetään väli, jossa meitä kiinnostava parametri putoaa tietyllä todennäköisyydellä.

Oletetaan, että haluat tutkia esimerkiksi yleisen populaation kvantitatiivista ominaisuutta. Oletetaan, että olemme teoreettisin perustein pystyneet määrittämään tarkalleen, mikä jakauma ominaisuudella on. Luonnollisesti ongelma syntyy tämän jakauman määrittävien parametrien arvioinnissa. Jos esimerkiksi tiedetään etukäteen, että tutkittava ominaisuus jakautuu normaalisti perusjoukossa, on tarpeen arvioida (likimäärin löytää) matemaattinen odotus a ja keskihajonta s, koska nämä kaksi parametria määräävät täysin normaalijakauman. .

Yleensä tutkijalla on käytössään vain näytedataa, esimerkiksi n havainnon tuloksena saadut kvantitatiivisen ominaisuuden x 1, x 2, ..., x n arvot. Arvioitu parametri ilmaistaan ​​näiden tietojen avulla.

Olkoon q * tilastollinen estimaatti teoreettisen jakauman tuntemattomasta parametrista q. Erottaa puolueeton Ja siirretty arvioita.

Puolueeton kutsua tilastollinen arvio q *, jonka matemaattinen odotus on yhtä suuri kuin minkä tahansa otoskoon estimoitu parametri q, eli

Muuten, eli jos M(q *) ¹ q, kutsutaan estimaattia siirretty.

Puolueeton vaatimus tarkoittaa, että havaituissa arvoissa ei saa olla systemaattista poikkeamaa samaan suuntaan q:stä.

Tilastollista arviointia vaaditaan myös tehokkuutta, mikä tarkoittaa (tietylle otoskoolle) pienintä mahdollista varianssia ja suuren otoskoon tapauksessa vaatimusta vakavaraisuus, eli satunnaismuuttujan havaittujen arvojen käytännön yhteensopivuus arvioidun parametrin kanssa.

Jos tilastollinen materiaali esitetään vaihtelusarjan muodossa, sen myöhempi analyysi suoritetaan yleensä joidenkin vakioarvojen avulla, jotka heijastavat täysin tutkittavan populaation luontaisia ​​​​malleja.

Nämä vakiot sisältävät keskiarvot, joista merkittävin on aritmeettinen keskiarvo- Se on yksinkertaisempi kuin muut merkitykseltään, ominaisuuksiltaan ja valmistusmenetelmältään.

Koska yleisen populaation tutkimuksessa otetaan näyte, kutsutaan näytettä kuvaavaa vakioarvoa näytteen keskiarvo ja on nimetty.

Voidaan osoittaa, että on puolueeton arvio yleisen perusjoukon ominaisuuden aritmeettinen keskiarvo, eli

Jaetaan joukko osiin - ryhmiä, ei välttämättä sama määrä. Sitten kutsutaan ryhmän jäsenten aritmeettisia keskiarvojakaumia ryhmän keskiarvot ja jakauman aritmeettinen keskiarvo koko populaation samalle ominaisuudelle - yleinen keskiarvo. Ryhmät ovat ns epäyhtenäinen, jos jokainen väestön jäsen kuuluu vain yhteen ryhmään.

Kokonaiskeskiarvo on yhtä suuri kuin kaikkien epäyhtenäisten ryhmien ryhmän keskiarvojen aritmeettinen keskiarvo.

Esimerkki. Laske yrityksen työntekijöiden keskipalkka taulukon tietojen mukaan

Ratkaisu. Määritelmän mukaan kokonaiskeskiarvo on

. (*)

n1 = 40, n2 = 50, n3 = 60

Työntekijöiden keskipalkka konepajassa nro 1. Sen selvittämiseksi kokosimme koko konepajan aritmeettisen keskipalkan: 75, 85, 95 ja 105 (cu) Mukavuussyistä näitä arvoja voidaan alentaa viisi kertaa (tämä on heidän suurin yhteinen jakaja): 15, 17, 19, 21. Loput selviää kaavasta.

Suoritettuamme vastaavat toiminnot, huomaamme , .

Korvaamalla saadut arvot (*) saamme

Keskiarvot ovat vakioarvoja, jotka kuvaavat jakaumia tietyllä tavalla. Jotkut jakaumat arvioidaan vain keinoin. Esimerkiksi tasojen vertailuun palkat eri toimialoilla riittää vertailla niiden keskipalkkoja. Keskiarvoista ei kuitenkaan voida arvioida korkeimman ja alimman palkan palkattujen työntekijöiden palkkatason eroja tai sitä, mitä poikkeamia keskipalkoista esiintyy.

Tilastoissa eniten kiinnostaa attribuuttiarvojen leviäminen niiden aritmeettisen keskiarvon ympärille. Käytännössä ja teoreettisissa tutkimuksissa ominaisuuden hajaannukselle on useammin tunnusomaista dispersio ja keskihajonta.

Otosvarianssi D B on ominaisuuden havaittujen arvojen keskiarvosta poikkeaman neliöiden aritmeettinen keskiarvo.

Jos kaikki tilavuuden n näytteen ominaisuuden arvot x 1, x 2, ... x n ovat erilaisia, niin

. (3)

Jos attribuutin x 1, x 2, ... x k arvoilla on taajuudet n 1, n 2, ... n k ja n 1 + n 2 + ... + n k = n, niin

. (4)

Jos hajontaindikaattori on ilmaistava samoissa yksiköissä kuin attribuuttiarvot, voit käyttää yhteenvetoominaisuutta - keskihajonta

Varianssin laskemiseen käytetään yleensä kaavaa

Jos populaatio jaetaan ei-päällekkäisiin ryhmiin, voidaan niiden karakterisoimiseksi ottaa käyttöön käsitteet ryhmä, ryhmän sisäinen, ryhmien välinen ja kokonaishajonta.

Ryhmä dispersio on j:nnen ryhmän jäsenten jakauman dispersio suhteessa heidän keskiarvoonsa - ryhmän keskiarvoon, eli

missä n i on arvon x i taajuus, on ryhmän j tilavuus.

Ryhmän sisäinen dispersio on ryhmädispersioiden aritmeettinen keskiarvo

missä N j (j = 1, 2, …, m) ovat hajanaisten ryhmien tilavuuksia.

Ryhmänvälinen dispersio on aritmeettinen keskiarvo kaikkien epäyhtenäisten ryhmien ryhmäkeskiarvojen neliöidyistä poikkeamista kokonaiskeskiarvosta, eli

.

Kenraali dispersio on koko populaation ominaisuuden arvojen hajonta suhteessa kokonaiskeskiarvoon

,

missä n i on arvon x i taajuus; - kokonaiskeskiarvo; n on koko väestön tilavuus.

Voidaan osoittaa, että D:n kokonaisvarianssi on yhtä suuri kuin summa, eli

Esimerkki. Määritä seuraavista kahdesta ryhmästä koostuvan populaation kokonaisvarianssi

Ensimmäinen ryhmä Toinen ryhmä
x i n i x i n i

Ratkaisu. Etsitään ryhmien keskiarvot

Etsitään ryhmävarianssit

Etsitään yleinen keskiarvo

Vaadittu kokonaisvarianssi

Edellä tarkasteltuja arvioita kutsutaan yleensä ns kohta, koska nämä arviot on määritetty yksi numero. Kun pieni tilavuus otos, intervalliarviota käytetään, määritetään kaksi numeroa, jota kutsutaan intervallin päiksi.

Intervalliarvioiden avulla voimme määrittää tarkkuus ja luotettavuus arvosanat. Selvitetään näiden käsitteiden merkitys. Olkoon näytetiedoista löydetty tilastollinen ominaisuus q * estimaatti tuntemattomasta parametrista q. On selvää, että q * mitä tarkemmin parametri q määritetään, sitä pienempi on itseisarvo . Toisin sanoen, jos d > 0 ja , niin mitä pienempi d, sitä tarkempi arvio.

Siten luku d > 0 kuvaa tarkkuus arvioinnit. Mutta toisaalta tilastolliset menetelmät eivät salli kategorisesti todeta, että estimaatti q * tyydyttää epäyhtälön. Täällä voimme vain puhua todennäköisyys g, jolla tämä epätasa-arvo toteutuu. Tätä todennäköisyyttä g kutsutaan luotettavuus (luottamustodennäköisyys) arvioi q:sta q * .

Näin ollen sanotusta seuraa, että

Suhde (*) tulee ymmärtää seuraavasti: todennäköisyys, että väli (q * - d, q * + d) sisältää (peittää) tuntemattoman parametrin q, on yhtä suuri kuin g. Aikaväliä (q * - d, q * + d), joka kattaa tuntemattoman parametrin tietyllä luotettavuudella g, kutsutaan luotettavuudeksi.

Esimerkki. Satunnaismuuttujan X on normaalijakauma tunnetulla keskihajonnalla s = 3. Etsi luottamusvälit tuntemattoman matemaattisen odotuksen a estimoimiseksi otoskeskiarvoilla, jos otoskoko on n = 36 ja estimaatin luotettavuus on g = 0,95 .

Ratkaisu. Huomaa, että jos satunnaismuuttuja X on normaalijakautuma, niin riippumattomista havainnoista saatu otoskeskiarvo on myös normaalijakautumassa ja jakauman parametrit ovat seuraavat: , (katso sivu 54).

Vaadimme, että suhde täyttyy

.

Käyttämällä kaavaa (**) (katso sivu 43) ja korvaamalla X:llä ja s:llä saamme

Aiheeseen liittyvät julkaisut