Енциклопедія пожежної безпеки

Оцінка невідомих властивостей якості статистичних оцінок. Статистичне оцінювання. Приклад розв'язання задачі

статистична оцінка розподіл вибірка

Оцінка - це наближення значень шуканої величини, отримане виходячи з результатів вибіркового спостереження. Оцінки є випадковими величинами. Вони забезпечують можливість формування обґрунтованого судження про невідомі параметри генеральної сукупності. Прикладом оцінки генеральної середньої є вибіркова середня генеральна дисперсія - вибіркова дисперсія і т.д.

Для того щоб оцінити наскільки «добре» оцінка відповідає відповідній генеральній характеристиці, розроблено 4 критерії: спроможність, несміщеність, ефективність і достатність. Цей підхід ґрунтується на тому, що якість оцінки визначається не за її окремими значеннями, а за характеристиками її розподілу як випадкової величини.

Грунтуючись на положеннях теорії ймовірностей, можна довести, що з таких вибіркових характеристик, як середня арифметична, мода та медіана, тільки середня арифметична є заможною, незміщеною, ефективною та достатньою оцінкою генеральної середньої. Цим і зумовлюється перевага, що віддається середньої арифметичної серед інших вибіркових показників.

Незміщеністьоцінки проявляється в тому, що її математичне очікування при будь-якому обсязі вибірки дорівнює значенню параметра, що оцінюється в генеральній сукупності. Якщо ця вимога не виконується, то оцінка є зміщеною.

Умова несмещенности оцінки спрямовано усунення систематичних помилок оцінювання.

При вирішенні завдань оцінювання застосовують також асимптотично незміщені оцінки, для яких при збільшенні обсягу вибірки математичне очікування прагне оцінюваного параметра генеральної сукупності.

Заможністьстатистичних оцінок проявляється в тому, що зі збільшенням обсягу вибірки оцінка все більше і більше наближається до справжнього значення параметра, що оцінюється, або, як кажуть, оцінка сходиться по ймовірності до шуканого параметра, або прагне свого математичного очікування. Лише заможні оцінки мають практичне значення.

Це така оцінка незміщеного параметра, яка має найменшу дисперсію при даному обсязі вибірки. Насправді дисперсія оцінки зазвичай ототожнюється з помилкою оцінки.

В якості заходи ефективності оцінкиприймають відношення мінімально можливої ​​дисперсії до дисперсії іншої оцінки.

Оцінка, що забезпечує повноту використання всієї інформації, що міститься у вибірці, про невідому характеристику генеральної сукупності, називається достатньою(вичерпною).

Дотримання розглянутих вище властивостей статистичних оцінок дає можливість вважати вибіркові характеристики з метою оцінки параметрів генеральної сукупності найкращими з можливих.

Найважливіше завдання математичної статистики у тому, щоб за вибірковими даними отримати найраціональніші, «правдиві» статистичні оцінки шуканих параметрів генеральної сукупності. Розрізняють два види статистичних висновків: - статистична оцінка; перевірка статистичних гіпотез.

Основне завдання отримання статистичних оцінок полягає у виборі та обґрунтуванні найкращих оцінок, що забезпечують можливість змістовної оцінки невідомих параметрів генеральної сукупності.

Завдання оцінки невідомих параметрів може бути вирішене двома способами:

  • 1. невідомий параметр характеризується одним числом (точкою) – використовується метод точкової оцінки;
  • 2. інтервальна оцінка, тобто визначається інтервал, у якому з певною ймовірністю може бути шуканий параметр.

Точкова оцінканевідомого параметра у тому, що конкретне числове значення вибіркової оцінки приймається за найкраще наближення до справжнього параметра генеральної сукупності, тобто невідомий параметр генеральної сукупності оцінюється одним числом (точкою), визначеним за вибіркою. За такого підходу завжди існує ризик зробити помилку, тому точкова оцінка має доповнюватися показником можливої ​​помилки за певного рівня ймовірності.

Як середня помилка оцінки приймається її середнє квадратичне відхилення.

Тоді точкова оцінка генеральної середньої може бути подана у вигляді інтервалу

де – вибіркова середня арифметична.

При точковій оцінці застосовують кілька методів одержання оцінок за вибірковими даними:

  • 1. спосіб моментів, у якому моменти генеральної сукупності замінюються моментами вибіркової сукупності;
  • 2. спосіб найменших квадратів;
  • 3. Метод максимальної правдоподібності.

У багатьох завданнях потрібно знайти як числову оцінку параметра генеральної сукупності, а й оцінити її точність і надійність. Особливо це важливо для вибірок щодо малого обсягу. Узагальненням точкової оцінки статистичного параметра є його інтервальна оцінка- Знаходження числового інтервалу, що містить з певною ймовірністю оцінюваний параметр.

У зв'язку з тим, що при визначенні генеральних характеристик за вибірковими даними завжди присутня деяка помилка, практичніше визначити інтервал з центром у знайденій точковій оцінці, всередині якого з певною заданою ймовірністю знаходиться справжнє значення параметра генеральної характеристики, що оцінюється. Такий інтервал називають довірчим.

Довірчий інтервал- це числовий інтервал, який із заданою ймовірністю г накриває оцінюваний параметр генеральної сукупності. Таку ймовірність називають довірчою. Довірча ймовірністьг - це ймовірність, яку можна визнати достатньою в рамках розв'язуваної задачі для судження про достовірність характеристик, отриманих на основі вибіркових спостережень. Величину

ймовірності припуститися помилки називають рівнем значимості.

Для вибіркової (точкової) оцінки І * (тета) параметра І генеральної сукупності з точністю ( граничною помилкою) Д і довірчою ймовірністю г довірчий інтервал визначається рівністю:

Довірча можливість г дає можливість встановити довірчі кордонивипадкового коливання параметра І для даної вибірки.

Як довірчу ймовірність приймають найчастіше такі значення та відповідні їм рівні значущості

Таблиця 1. - Найбільш уживані довірчі ймовірності та рівні значимості

Наприклад, 5-відсотковий рівень значущості означає наступне: у 5-ти випадках із 100 існує ризик зробити помилку при виявленні характеристик генеральної сукупності за вибірковими даними. Або, іншими словами, у 95 випадках зі 100 генеральна характеристика, виявлена ​​на основі вибірки лежатиме в межах довірчого інтервалу.

Статистичні оцінки властивостей генеральної сукупності. Статистичні гіпотези

лекція 16

Нехай потрібно вивчити кількісну ознаку генеральної сукупності. Припустимо, що з теоретичних міркувань вдалося встановити, який саме розподіл має ознаку. Звідси виникає завдання оцінки параметрів, якими визначається цей розподіл. Наприклад, якщо відомо, що ознака розподілена в генеральній сукупності за нормальним законом, то необхідно оцінити (наближено знайти) математичне очікування і середньоквадратичне відхилення, так як ці два параметри повністю визначають нормальний розподіл. Якщо є підстави вважати, що ознака має розподіл Пуассона, необхідно оцінити параметр , яким цей розподіл визначається.

Зазвичай у розподілі дослідник має дані вибірки, наприклад, значення кількісного ознаки , отримані результаті спостережень (тут і далі спостереження передбачаються незалежними). Через ці дані і виражають оцінюваний параметр.

Розглядаючи як значення незалежних випадкових величин , можна сказати, що знайти статистичну оцінку невідомого параметра теоретичного розподілу означає знайти функцію від випадкових величин, що спостерігаються, яка і дає наближене значення оцінюваного параметра. Наприклад, як буде показано далі, для оцінки математичного очікування нормального розподілу служить функція (середнє арифметичне значень ознаки, що спостерігаються):

.

Отже, статистичною оцінкоюневідомого параметра теоретичного розподілу називають функцію від випадкових величин, що спостерігаються. Статистична оцінка невідомого параметра генеральної сукупності, записана одним числом, називається точковий. Розглянемо такі точкові оцінки: зміщені та незміщені, ефективні та заможні.

Для того, щоб статистичні оцінки давали «хороші» наближення параметрів, що оцінюються, вони повинні задовольняти певним вимогам. Зазначимо ці вимоги.

Нехай є статистична оцінка невідомого параметра теоретичного розподілу. Припустимо, що з вибірці обсягу знайдено оцінка . Повторимо досвід, тобто витягнемо з генеральної сукупності іншу вибірку того ж обсягу і за даними знайдемо оцінку і т.д. Повторюючи досвід багаторазово, отримаємо числа , які, взагалі кажучи, відрізнятимуться між собою. Отже, оцінку можна як випадкову величину, а числа - Як можливі її значення.

Зрозуміло, що якщо оцінка дає наближене значення з надлишком, то кожне знайдене за даними вибірок число буде більшим за справжнє значення . Отже, що в цьому випадку і математичне (середнє значення) випадкової величини буде більшим, ніж , тобто . Очевидно, якщо дає наближене значення з недоліком, то .


Тому використання статистичної оцінки, математичне очікування якої не дорівнює оцінюваному параметру, призводить до систематичних (одного знаку) помилок. З цієї причини природно вимагати, щоб математичне очікування оцінки дорівнювало оцінюваного параметра. Хоча дотримання цієї вимоги, загалом, не усуне помилок (одні значення більші, а інші менше ніж ), помилки різних знаків будуть зустрічатися однаково часто. Однак дотримання вимог гарантує неможливість отримання систематичних помилок, тобто усуває систематичні помилки.

Незміщеноюназивають статистичну оцінку (помилку) , математичне очікування якої дорівнює параметру, що оцінюється при будь-якому обсязі вибірки, тобто .

Зміщеноюназивають статистичну оцінку , математичне очікування якої однаково оцінюваному параметру за будь-якого обсягу вибірки, тобто .

Однак було б помилковим вважати, що незміщена оцінка завжди дає хороше наближення параметра, що оцінюється. Справді, можливі значення можуть бути розсіяні навколо свого середнього значення, тобто дисперсія може бути значною. У цьому випадку, знайдена за даними однієї вибірки оцінка, наприклад, може виявитися дуже віддаленою від середнього значення, а значить, і від самого оцінюваного параметра. Таким чином, прийнявши як наближене значення , ми припустимо велику помилку. Якщо ж вимагати, щоб дисперсія була малою, то можливість припуститися великої помилки буде виключена. Тому до статистичної оцінки пред'являється вимога ефективності.

Ефективноюназивають статистичну оцінку, яка (при заданому обсязі вибірки) має найменшу можливу дисперсію.

Заможноюназивають статистичну оцінку, яка прагне за ймовірністю до оцінюваного параметра, тобто, справедлива рівність:

.

Наприклад, якщо дисперсія незміщеної оцінки прагне до нуля, то така оцінка виявляється також заможною.

Розглянемо питання про те, які вибіркові характеристики найкраще у сенсі незміщеності, ефективності та спроможності оцінюють генеральну середню та дисперсію.

Нехай вивчається дискретна генеральна сукупність щодо деякої кількісної ознаки.

Генеральної середньоїназивається середнє арифметичне значень ознаки генеральної сукупності. Вона обчислюється за такою формулою:

§ - якщо всі значення ознаки генеральної сукупності обсягу різні;

§ - Якщо значення ознаки генеральної сукупності мають відповідно частоти, причому. Тобто генеральна середня є середня зважена значень ознаки з вагами, рівними відповідним частотам.

Зауваження: Нехай генеральна сукупність обсягу містить об'єкти з різними значеннями ознаки. Уявімо, що з цієї сукупності навмання витягується один об'єкт. Імовірність того, що буде вилучено об'єкт зі значенням ознаки, наприклад, очевидно, дорівнює. З цією ж ймовірністю може бути вилучений будь-який інший об'єкт. Отже, величину ознаки можна як випадкову величину, можливі значення якої мають однакові ймовірності, рівні . Неважко, в цьому випадку, знайти математичне очікування:

Отже, якщо розглядати обстежуваний ознака генеральної сукупності як випадкову величину, то математичне очікування ознаки дорівнює генеральної середньої цієї ознаки: . Цей висновок ми отримали, вважаючи, що це об'єкти генеральної сукупності мають різні значення ознаки. Такий же результат буде отримано, якщо припустити, що генеральна сукупність містить кілька об'єктів з однаковим значенням ознаки.

Узагальнюючи отриманий результат на генеральну сукупність з безперервним розподілом ознаки, визначимо генеральну середню як математичне очікування ознаки: .

Нехай для вивчення генеральної сукупності щодо кількісної ознаки вилучено вибірку обсягу.

Вибіркової середньоїназивають середнє арифметичне значень ознаки вибіркової сукупності. Вона обчислюється за такою формулою:

§ - якщо всі значення ознаки вибіркової сукупності обсягу різні;

§ - Якщо значення ознаки вибіркової сукупності мають відповідно частоти, причому. Тобто вибіркова середня є середня зважена значень ознаки з вагами, рівними відповідним частотам.

Зауваження: середня вибіркова, знайдена за даними однієї вибірки є, очевидно, певне число. Якщо витягувати інші вибірки того ж обсягу з тієї ж генеральної сукупності, то вибіркова середня змінюватиметься від вибірки до вибірки. Таким чином, вибіркову середню можна розглядати як випадкову величину, а отже, можна говорити про розподіли (теоретичний та емпіричний) вибіркової середньої та про числові характеристики цього розподілу, зокрема, про математичне очікування та дисперсію вибіркового розподілу.

Далі, якщо генеральна середня невідома і потрібно оцінити її за даними вибірки, то як оцінка генеральної середньої приймають вибіркову середню, яка є незміщеною та заможною оцінкою (пропонуємо це твердження довести самостійно). Зі сказаного випливає, що якщо за кількома вибірками досить великого обсягу з однієї й тієї ж генеральної сукупності будуть знайдені середні вибіркові, то вони будуть приблизно рівні між собою. У цьому полягає властивість стійкості вибіркових середніх.

Зазначимо, що й дисперсії двох сукупностей однакові, то близькість вибіркових середніх до генеральним залежить від відношення обсягу вибірки до обсягу генеральної сукупності. Вона залежить від обсягу вибірки: чим обсяг вибірки більше, тим менше середня вибіркова відрізняється від генеральної. Наприклад, якщо з однієї сукупності відібрано 1% об'єктів, а з іншої сукупності відібрано 4% об'єктів, причому обсяг першої вибірки виявився більшим, ніж другий, то перша середня вибіркова буде менше відрізнятися від відповідної генеральної середньої, ніж друга.

План лекції:

    Поняття оцінки

    Властивості статистичних оцінок

    Методи знаходження точкових оцінок

    Інтервальне оцінювання параметрів

    Довірчий інтервал для математичного очікування за відомої дисперсії нормально розподіленої генеральної сукупності.

    Розподіл хі-квадрат та розподіл Стьюдента.

    Довірчий інтервал для математичного очікування випадкові величини, що має нормальний розподіл при невідомій дисперсії.

    Довірчий інтервал для середнього відхилення квадратичного нормального розподілу.

Список літератури:

    Вентцель, Є.С. Теорія ймовірностей [Текст]/Є.С. Вентцель. - М.: Вища школа, 2006. - 575 с.

    Гмурман, В.Є. Теорія ймовірностей та математична статистика [Текст]/В.Є. Гмурман. – К.: Вища школа, 2007. – 480 с.

    Кремер, Н.Ш. Теорія ймовірностей та математична статистика [Текст]/Н.Ш. Кремер - М: ЮНІТІ, 2002. - 543 с.

П.1. Поняття оцінки

Такі розподіли, як біномне, показове, нормальне, є сімействами розподілів, що залежать від одного або декількох параметрів. Наприклад, показовий розподіл із щільністю ймовірностей залежить від одного параметра λ, нормальний розподіл
- від двох параметрів mта σ. З умов досліджуваного завдання, як правило, ясно, про яке сімейство розподілів йдеться. Однак залишаються невідомими конкретні значення параметрів цього розподілу, що входять у вирази цікавлять нас характеристик розподілу. Тому потрібно знати хоча б наближене значення цих величин.

Нехай закон розподілу генеральної сукупності визначений з точністю до значень параметрів, що входять до його розподілу
частина з яких може бути відома. Одним із завдань математичної статистики є знаходження оцінок невідомих параметрів щодо вибірки спостережень
із генеральної сукупності. Оцінка невідомих параметрів полягає у побудові функції
від випадкової вибірки, такий, що значення цієї функції приблизно дорівнює невідомому параметру, що оцінюється θ . Функція називається статистикоюпараметра θ .

Статистичній оцінкою(надалі просто оцінкою) параметра θ теоретичного розподілу називається його наближене значення, що залежить від даних вибору.

Оцінка є випадковою величиною, т.к. є функцією незалежних випадкових величин
; якщо зробити іншу вибірку, то функція набуде, взагалі кажучи, іншого значення.

Існує два види оцінок – точкові та інтервальні.

Точковийназивається оцінка, що визначається одним числом. При малій кількості спостережень ці оцінки можуть призводити до грубих помилок. Щоб уникнути їх, використовують інтервальні оцінки.

Інтервальнийназивається оцінка, яка визначається двома числами - кінцями інтервалу, в якому із заданою ймовірністю укладена величина, що оцінюється θ .

П. 2 Властивості статистичних оцінок

Величину
називають точністю оцінки. Чим менше
, тим краще, точніше визначено невідомий параметр.

До оцінки будь-якого параметра пред'являється ряд вимог, яким вона повинна задовольняти, щоб бути «близькою» до значення параметра, тобто. бути у якомусь сенсі «доброякісною» оцінкою. Якість оцінки визначають, перевіряючи, чи має вона властивості незміщеності, ефективності та спроможності.

Оцінка параметра θ називається незміщеною(без систематичних помилок), якщо математичне очікування оцінки збігається з дійсним значенням θ :

. (1)

Якщо рівність (1) не має місця, то оцінка називається зміщеною(З систематичними помилками). Це зміщення може бути пов'язане з помилками виміру, рахунку чи невипадковим характером вибірки. Систематичні помилки призводять до завищення чи заниження оцінки.

Для деяких завдань математичної статистики може бути кілька незміщених оцінок. Зазвичай перевагу віддають тій, яка має найменше розсіювання (дисперсію).

Оцінка називається ефективноюякщо вона має найменшу дисперсію серед усіх можливих незміщених оцінок параметра θ .

Нехай D() – мінімальна дисперсія, а
– дисперсія будь-якої іншої незміщеної оцінки параметра θ . Тоді ефективність оцінки дорівнює

. (2)

Зрозуміло, що
. Чим ближче
до 1, тим ефективніша оцінка . Якщо
при
, то оцінка називається асимптотично ефективною.

Зауваження: Якщо оцінка зміщена, то дещиці її дисперсії ще не говорить про дещицю її похибки. Взявши, наприклад, як оцінку параметра θ деяке число , отримаємо оцінку навіть із нульовою дисперсією. Однак у цьому випадку помилка (похибка)
може бути як завгодно великий.

Оцінка називається заможною, якщо зі збільшенням обсягу вибірки (
) оцінка сходиться ймовірно до точного значення параметра θ , тобто. якщо для будь-кого

. (3)

Спроможність оцінки параметра θ означає, що зі зростанням nобсягу вибірки якість оцінки покращується.

Теорема 1. Вибіркова середня є незміщеною та заможною оцінкою математичного очікування.

Теорема 2. Виправлена ​​вибіркова дисперсія є незміщеною та заможною оцінкою дисперсії.

Теорема 3. Емпірична функція розподілу вибірки є незміщеною та заможною оцінкою функції розподілу випадкової величини.

Вивчивши цей розділ, студент буде знати,що вибірка може розглядатися як емпіричний аналог генеральної сукупності, що за допомогою вибіркових даних можна будувати висновки про властивості генеральної сукупності та оцінювати її характеристики, основні закони розподілу статистичних оцінок, вмітипроводити точкові та інтервальні оцінки параметрів генеральної сукупності методом моментів та максимальної правдоподібності, володітиспособами визначення точності та надійності отриманих оцінок.

Види статистичних оцінок

Про параметри генеральної сукупності ми знаємо те, що вони об'єктивно існують, але визначити їх безпосередньо неможливо через те, що генеральна сукупність або нескінченна або надмірно велика. Тому може стояти питання лише оцінці цих характеристик.

Раніше було встановлено, що для вибірки, витягнутої з генеральної сукупності, за умови дотримання умов репрезентативності, можна визначити характеристики, які є аналогами характеристик генеральної сукупності.

cjp Визначення 8.1.Наближені значення параметрів розподілу, знайдені на вибірці, називаються оцінкою параметра.

Позначимо оцінюваний параметр випадкової величини (генеральної сукупності) як 0, яке оцінку, отриману з допомогою вибірки, 0.

Оцінка 0 є випадковою величиною, оскільки будь-яка вибірка випадкова. Оцінки, отримані для різних вибірок, відрізнятимуться один від одного. Тому вважатимемо 0 функцією, яка залежить від вибірки: 0 = 0(Х в).

ЩР Визначення 8.2. Статистична оцінка називається заможною,якщо вона прагнути ймовірності до оцінюваного параметра:

Ця рівність означає, що подія 0=0 стає достовірною при необмеженому зростанні обсягу вибірки.

Як приклад можна навести відносну частоту деякої події А,яка є спроможною оцінкою ймовірності цієї події відповідно до теореми Пуассона (див. формулу (6.1), частина 1).

Визначення 8.3.Статистична оцінка називається ефективною, якщо вона має найменшу дисперсію при одних і тих же обсягах вибірки.

Розглянемо оцінку М хматематичного очікування М хвипадкової величини X.Як таку оцінку виберемо X.Знайдемо математичне очікування випадкової величини X.

Спочатку зробимо важливе твердження: враховуючи те, що всі випадкові величини X,вилучаються з однієї і тієї ж генеральної сукупності X,отже, мають один і той самий розподіл що й X,можна записати:

Тепер знайдемо М(Х ст):


Таким чином, середня вибіркова є статистичною оцінкою математичного очікування випадкової величини. Ця оцінка є спроможною оскільки відповідно до слідства з теореми Чебишева вона сходиться ймовірно до математичного очікування (6.3).

Ми встановили, що у цьому випадку математичне очікування обраної нами оцінки (випадкової величини) дорівнює самому оцінюваному параметру. Оцінки, що мають таку властивість, займають особливе місце в математичній статистиці, вони називаються незміщеними.

Визначення 8.4.Статистична оцінка © називається незміщеною, якщо її математичне очікування дорівнює параметру, що оцінюється.

Якщо ця вимога не виконана, то оцінка називається зміщеною.

Таким чином, середня вибіркова є незміщеною оцінкою математичного очікування.

Проведемо аналіз зміщеності вибіркової дисперсії D, якщо її вибрати як оцінку генеральної дисперсії D x.Для цього перевіримо здійсненність умови (8.2) для?):


Перетворимо кожне з двох отриманих доданків:

Тут було використано рівність М(Х.) = М(Х 2),справедливе з тієї ж причини, що й (8.1).

Розглянемо другий доданок. За допомогою формули квадрата суми пдоданків отримуємо


враховуючи знову рівність (8.1), а також те, що X. та X незалежні випадкові величини запишемо

і остаточно отримаємо:

Підставимо отримані результати (8.3)

Після перетворення отримаємо

Таким чином, можна зробити висновок, що вибіркова дисперсія є зміщеноюоцінкою генеральної дисперсії.

Враховуючи отриманий результат, поставимо завдання побудувати таку оцінку генеральної дисперсії, яка б задовольняла умові несмещенности (8.2). Для цього розглянемо випадкову величину

Легко бачити, що з цієї величини умова (8.2) виконується:

Зауважимо, що різниця між вибірковою дисперсією та виправленою вибірковою дисперсією стають незначними при великих обсягах вибірки.

При виборі оцінок показників випадкових величин важливо знати їх точність. У деяких випадках потрібна висока точність, інколи ж досить мати грубу оцінку. Наприклад, плануючи переліт з пересадкою нам важливо знати якомога точніше запланований час прильоту до місця стикування авіарейсів. В іншій ситуації, наприклад, перебуваючи вдома і чекаючи на кур'єра із замовленим нами товаром, висока точність часу його прибуття для нас не важлива. В обох випадках випадковою величиною є час прибуття, а цікавою для нас характеристикою випадкової величини - середній час у дорозі.

Оцінки бувають двох видів. У першому випадку ставиться завдання отримати конкретне числове значення параметра. В іншому випадку визначається інтервал, в який із заданою ймовірністю потрапляє цікавий для нас параметр.

Нехай потрібно вивчити, наприклад, кількісна ознака генеральної сукупності. Припустимо, що з теоретичних міркувань вдалося встановити, який саме розподіл має ознаку. Звичайно, виникає завдання оцінки параметрів, якими визначається цей розподіл. Наприклад, якщо наперед відомо, що ознака розподілений в генеральній сукупності нормально, то необхідно оцінити (наближено знайти) математичне очікування а і середнє квадратичне відхилення s, так як ці два параметри повністю визначають нормальний розподіл.

Зазвичай у розпорядженні дослідника є лише дані вибірки, наприклад, значення кількісної ознаки х 1, х 2, …, х n отримані в результаті n спостережень. Через ці дані і виражають оцінюваний параметр.

Нехай q* – статистична оцінка невідомого параметра q теоретичного розподілу. Розрізняють незміщенуі зміщенуоцінки.

Незміщеноюназивають статистичну оцінку q * , математичне очікування якої дорівнює параметру q, що оцінюється, при будь-якому обсязі вибірки, тобто

В іншому випадку, тобто якщо М(q *) 1 q, оцінка називається зміщеною.

Вимога незміщеності означає, що не повинно бути систематичного відхилення в одну і ту ж сторону значень, що спостерігаються від q.

До статистичної оцінки висувається також вимога ефективності, що має на увазі (при заданому обсязі вибірки) найменшу можливу дисперсію, а у разі великого обсягу вибірки та вимогу спроможності, тобто практичний збіг значень випадкової величини, що спостерігаються, з оцінюваним параметром.

Якщо статистичний матеріал представлений у вигляді варіаційного ряду, то подальший його аналіз здійснюється, як правило, за допомогою деяких постійних величин, що досить повно відображають властиві генеральній сукупності закономірності, що вивчається.

До таких постійних відносяться середні величини, серед яких найбільш значущою є середня арифметична- вона простіше інших і за змістом, і за властивостями, і способом отримання.

Так як при дослідженні генеральної сукупності здійснюється вибірка, то стала величина, що характеризує вибірку, називається вибіркової середньоїі позначається.

Можна показати, що є незміщена оцінкасереднього арифметичного значення ознаки генеральної сукупності, тобто

Нехай деяка сукупність розбита на частини групи, Не обов'язково однакові за обсягом. Тоді середні арифметичні розподіли членів груп називають груповими середніми, а середню арифметичну розподілу за тією ж ознакою всієї сукупності - загальної середньої. Групи називаються непересічнимиякщо кожен член сукупності належить тільки одній групі.

Загальна середня дорівнює середньої арифметичної групових середніх всіх груп, що не перетинаються.

приклад.Обчислити середню заробітну плату робітників підприємства за даними таблиці

Рішення.За визначенням загальна середня дорівнює

. (*)

n 1 = 40, n 2 = 50, n 3 = 60

Середня заробітна плата робітників цеху № 1. Для її знаходження ми склали середню арифметичну зарплату по всьому цеху: 75, 85, 95 та 105 (у.о.) Для зручності ці значення можна зменшити в п'ять разів (це їх найбільший спільний дільник): 15, 17, 19, 21. Інше зрозуміло з формули.

Зробивши аналогічні операції, знайдемо , .

Підставивши отримані значення (*), отримаємо

Середні – це постійні величини, які певним чином характеризують розподіли.Про деякі розподіли судять лише за середніми. Наприклад, для порівняння рівнів заробітної плати в різних галузях промисловості достатньо порівняти середні заробітні плати у них. Однак за середніми не можна судити ні про відмінності між рівнями заробітної плати найбільш високо- та низькооплачуваних працівників, ні про те, які відхилення від середньої заробітної плати мають місце.

У статистиці найбільший інтерес представляє розкид значень ознаки при їх середній арифметичній.На практиці та в теоретичних дослідженнях розсіювання ознаки частіше характеризується дисперсією та середнім квадратичним відхиленням.

Вибірковою дисперсією D У називають середнє арифметичне квадратів відхилення значень ознаки від їх середнього значення .

Якщо всі значення х 1 , х 2 ... х n ознаки вибірки обсягу n різні, то

. (3)

Якщо значення ознаки х 1 , х 2 , ... х k мають відповідно частоти n 1 , n 2 , ... n k , причому n 1 + n 2 + ... + n k = n, то

. (4)

Якщо є необхідність, щоб показник розсіювання виражався в тих самих одиницях, що і значення ознаки, то можна користуватися зведеною характеристикою - середнім квадратичним відхиленням

Для обчислення дисперсії зазвичай використовується формула

Якщо сукупність розбита на групи, що не перетинаються, то для їх характеристики можна ввести поняття групової, внутрішньогрупової, міжгрупової та загальної дисперсії.

Груповийдисперсією називається дисперсія розподілу членів j-ої групи щодо їх середньої - групової середньої, тобто

де n i - частота значення x i - обсяг групи j.

Внутрішньогруповийдисперсією називається середня арифметична групових дисперсій

де N j (j = 1, 2, …, m) - обсяги груп, що не перетинаються.

Міжгруповийдисперсією називається середня арифметична квадратів відхилень групових середніх всіх непересічних груп від загальної середньої, тобто

.

Загальноюдисперсією називають дисперсію значень ознаки всієї сукупності щодо загальної середньої

,

де n i - Частота значення x i; - загальна середня; n - обсяг усієї сукупності.

Можна показати, що загальна дисперсія D дорівнює сумі, тобто

приклад.Знайти загальну дисперсію сукупності, що складається з двох груп

Перша група Друга група
x i n i x i n i

Рішення.Знайдемо групові середні

Знайдемо групові дисперсії

Знайдемо загальну середню

Шукана загальна дисперсія

Розглянуті вище оцінки прийнято називати точковими, оскільки ці оцінки визначаються одним числом. В разі невеликого обсягувибірки використовується інтервальна оцінка, що визначається двома числами, Звані кінцями інтервалу.

Інтервальні оцінки дозволяють встановити точність та надійністьоцінок. Пояснимо зміст цих понять. Нехай знайдена за даними вибірки статистична характеристика q* є оцінкою невідомого параметра q. Ясно, що q * тим точніше визначатиме параметр q, чим менша абсолютна величина . Іншими словами, якщо d > 0 і , то чим менше d, то точніше оцінка.

Таким чином, число d> 0 характеризує точністьоцінки. Але з іншого боку статистичні методи неможливо категорично стверджувати, що оцінка q * задовольняє нерівності . Тут можна говорити тільки про ймовірності g, з якою ця нерівність здійснюється. Цю ймовірність g і називають надійністю (довірчою ймовірністю)оцінки q по q *.

Таким чином, зі сказаного випливає, що

Співвідношення (*) слід розуміти так: ймовірність того, що інтервал (q * - d, q * + d) містить у собі (покриває) невідомий параметр q, дорівнює g. Інтервал (q * - d, q * + d), що покриває невідомий параметр із заданою надійністю g, називають довірчим.

приклад.Випадкова величина Х має нормальний розподіл з відомим середнім квадратичним відхиленням s = 3. Знайти довірчі інтервали для оцінки невідомого математичного очікування а за середнім вибірковим , якщо обсяг вибірки n = 36 і задана надійність оцінки g = 0,95.

Рішення.Зауважимо, що й випадкова величина Х розподілено нормально, то вибіркова середня , знайдена за незалежними спостереженнями, також розподілена нормально, а параметри розподілу такі: , (див. стор. 54).

Вимагаємо виконання співвідношення

.

Користуючись формулою (**) (див. стор. 43), замінивши в ній Х на і s на , отримаємо

Подібні публікації