Які існують розподіли ймовірностей

0 Comments

Розподіл ймовірностей у статистиці

Якщо ви взагалі витрачаєте багато часу на роботу зі статистикою , незабаром ви зіткнетеся з фразою «розподіл ймовірностей». Саме тут ми дійсно бачимо, наскільки області ймовірності та статистики перетинаються. Хоча це може звучати як щось технічне, фраза «розподіл ймовірностей» насправді є лише способом поговорити про організацію списку ймовірностей. Розподіл ймовірностей — це функція або правило, яке присвоює ймовірності кожному значенню випадкової величини. У деяких випадках розподіл може бути перераховано. В інших випадках він представлений у вигляді графіка.

приклад

Припустимо, що ми кидаємо два кубики , а потім записуємо суму кубиків. Можливі суми від двох до 12. Кожна сума має певну ймовірність появи. Ми можемо просто перерахувати їх таким чином:

  • Сума 2 має ймовірність 1/36
  • Сума 3 має ймовірність 2/36
  • Сума 4 має ймовірність 3/36
  • Сума 5 має ймовірність 4/36
  • Сума 6 має ймовірність 5/36
  • Сума 7 має ймовірність 6/36
  • Сума 8 має ймовірність 5/36
  • Сума 9 має ймовірність 4/36
  • Сума 10 має ймовірність 3/36
  • Сума 11 має ймовірність 2/36
  • Сума 12 має ймовірність 1/36

Цей список є розподілом ймовірностей для ймовірнісного експерименту підкидання двох кубиків. Ми також можемо розглядати наведене вище як розподіл ймовірностей випадкової змінної , визначений шляхом розгляду суми двох кубиків.

Графік

Розподіл ймовірностей можна побудувати на графіку, і іноді це допомагає нам показати особливості розподілу, які не були очевидні, просто прочитавши список ймовірностей. Випадкова величина відкладається по осі x , а відповідна ймовірність – по осі y . Для дискретної випадкової величини ми матимемо гістограму . Для безперервної випадкової величини ми матимемо внутрішню частину гладкої кривої.

Правила ймовірності все ще діють, і вони проявляються декількома способами. Оскільки ймовірності більші або дорівнюють нулю, графік розподілу ймовірностей повинен мати невід’ємні y- координати. Інша особливість ймовірностей, а саме те, що одиниця є максимальною ймовірністю події, проявляється іншим чином.

Площа = Імовірність

Графік розподілу ймовірностей будується таким чином, що області являють собою ймовірності. Для дискретного розподілу ймовірностей ми просто обчислюємо площі прямокутників. На графіку вище площі трьох смужок, що відповідають чотирьом, п’яти та шести, відповідають ймовірності того, що сума наших кубиків дорівнює чотирьом, п’яти чи шести. Площі всіх смужок у сумі становлять один.

У стандартному нормальному розподілі або дзвоноподібній кривій ми маємо подібну ситуацію. Площа під кривою між двома значеннями z відповідає ймовірності того, що наша змінна потрапляє між цими двома значеннями. Наприклад, площа під дзвоноподібною кривою для -1 z.

Важливі розподіли

Існує буквально нескінченна кількість розподілів ймовірностей . Нижче наведено список деяких найбільш важливих дистрибутивів:

  • Біноміальний розподіл – дає кількість успішних результатів серії незалежних експериментів із двома результатами
  • Розподіл хі-квадрат – для використання для визначення того, наскільки спостережувані величини відповідають запропонованій моделі
  • F-розподіл – використовується в дисперсійному аналізі (ANOVA)
  • Нормальний розподіл – називається дзвоноподібною кривою та зустрічається в статистиці.
  • Розподіл Стьюдента – для використання з малими розмірами вибірки з нормального розподілу

5.1: Основи розподілу ймовірностей

Наскільки високому рослині дають нове добриво? Безперервна. Це те, що ви вимірюєте. Скільки бліх на прерійних собаках в колонії? Дискретні. Це те, що ви вважаєте. Якщо у вас є змінна, і ви можете знайти ймовірність, пов’язану з цією змінною, вона називається випадковою величиною. У багатьох випадках випадкова величина – це те, що ви вимірюєте, але коли справа доходить до дискретних випадкових величин, це, як правило, те, що ви рахуєте. Отже, для прикладу того, наскільки висока рослина, яка отримує нове добриво, випадкова величина – це висота рослини, що дається новому добриву. Для прикладу того, скільки бліх на прерійних собаках в колонії, випадкова величина – це кількість бліх на прерійній собаці в колонії. Тепер припустимо, ви поклали всі значення випадкової величини разом з ймовірністю, що випадкова величина буде відбуватися. Тоді ви могли б мати розподіл, як раніше, але тепер це називається розподілом ймовірностей, оскільки він включає ймовірності. Розподіл ймовірностей – це присвоєння ймовірностей значенням випадкової величини. Абревіатура pdf використовується для функції розподілу ймовірностей. Для розподілу ймовірностей, \(0 \leq P(x) \leq 1 \operatorname \sum P(x)=1\)

Приклад \(\PageIndex<1>\) : Probability Distribution Перепис 2010 року в США виявив ймовірність того, що домогосподарство має певний розмір. Дані наведені в прикладі \(\PageIndex<1>\) («Домашні господарства за віком», 2013 р.).

Таблиця \(\PageIndex\) : Розмір домогосподарств з перепису населення США 2010 року

Розмір домашнього господарства1234567 або більше
Імовірність26,7%33,6%15,8%13,7%6,3%2,4%1,5%

Рішення У цьому випадку випадкова величина дорівнює x = кількість людей у домашньому господарстві. Це дискретна випадкова величина, так як ви підраховуєте кількість людей в домашньому господарстві. Це розподіл ймовірностей, оскільки у вас є значення x і ймовірності, які йдуть з ним, всі ймовірності знаходяться між нулем і одиницею, а сума всіх ймовірностей одна.

Ви можете дати розподіл ймовірностей у вигляді таблиці (як у прикладі \(\PageIndex<1>\) ) або у вигляді графіка. Графік виглядає як гістограма. Розподіл ймовірностей – це в основному відносний розподіл частот на основі дуже великої вибірки.

Приклад \(\PageIndex<2>\) graphing a probability distribution Перепис 2010 року в США виявив ймовірність того, що домогосподарство має певний розмір. Дані є в таблиці («Домашні господарства за віком», 2013 р.). Намалюйте гістограму розподілу ймовірностей.

Таблиця \(\PageIndex\) : Розмір домогосподарств з перепису населення США 2010 року

Розмір домашнього господарства1234567 або більше
Імовірність26,7%33,6%15,8%13,7%6,3%2,4%1,5%

Рішення Стан випадкова величина: x = кількість людей у домогосподарстві Ви малюєте гістограму, де значення x знаходяться на горизонтальній осі і є значеннями x класів (для категорії 7 або більше, просто назвіть її 7). Ймовірності знаходяться на вертикальній осі. Малюнок \(\PageIndex\) : Гістограма розміру домогосподарств з перепису населення США 2010 року Зверніть увагу, що цей графік перекіс праворуч.

Так само, як і з будь-яким набором даних, ви можете обчислити середнє і стандартне відхилення. У задачах, пов’язаних з функцією розподілу ймовірностей (pdf), ви враховуєте розподіл ймовірностей населення, хоча pdf в більшості випадків походить від повторення експерименту багато разів. Це пов’язано з тим, що ви використовуєте дані повторних експериментів для оцінки істинної ймовірності. Оскільки pdf – це в основному сукупність, середнє та стандартне відхилення, які обчислюються, насправді є параметрами населення, а не вибірковою статистикою. Використовувані позначення такі ж, як позначення для середнього чисельності населення та стандартного відхилення населення, яке було використано в главі 3.

Примітка Середнє значення можна розглядати як очікуване значення. Це значення, яке ви очікуєте отримати, якщо випробування повторювалися нескінченну кількість разів. Середнє або очікуване значення не обов’язково має бути цілим числом, навіть якщо можливі значення x є цілими числами.

Для дискретної функції розподілу ймовірностей Середнє або очікуване значення \(\mu=\sum x P(x)\) Дисперсія – це \(\sigma^<2>=\sum(x-\mu)^ <2>P(x)\) Стандартне відхилення становить \(\sigma=\sqrt <\sum(x-\mu)^<2>P(x)>\) де x = значення випадкової величини і P (x) = ймовірність, що відповідає певному значенню x.

Приклад \(\PageIndex<3>\) : Calculating mean, variance, and standard deviation for a discrete probability distribution Перепис 2010 року в США виявив ймовірність того, що домогосподарство має певний розмір. Дані є в таблиці («Домашні господарства за віком», 2013 р.).

Таблиця \(\PageIndex\) : Розмір домогосподарств з перепису населення США 2010 року

Розмір домашнього господарства1234567 або більше
Імовірність26,7%33,6%15,8%13,7%6,3%2,4%1,5%
  1. Знайдіть середнє
  2. Знайдіть дисперсію
  3. Знайти стандартне відхилення
  4. Використовуйте TI-83/84 для обчислення середнього та стандартного відхилення
  5. Використання R для обчислення середнього

Рішення

Стан випадкова величина:

x= кількість людей у домогосподарстві

а Щоб знайти середнє, простіше просто скористатися таблицею, як показано нижче. Розглянемо категорію 7 або більше просто бути 7. Формула середнього говорить помножити значення x на значення P (x), тому додайте рядок в таблицю для цього розрахунку. Також перетворіть усі P (x) у десяткову форму.

Таблиця \(\PageIndex\) : Обчислення середнього значення для дискретного PDF-файлу

х1234567
П (х)0,2670,3360.1580.1370.0630,0240,015
xP (х)0,2670,6720,4740.5480,3150.1440.098

Тепер складіть новий рядок, і ви отримаєте відповідь 2,525. Це середнє або очікуване значення, \(\mu\) = 2,525 чоловік. Це означає, що ви очікуєте, що домогосподарство в США матиме 2,525 чоловік. Тепер, звичайно, ви не можете мати половину людини, але це говорить вам про те, що ви очікуєте, що домогосподарство матиме 2 або 3 людини, з трохи більше домогосподарств з трьома особами, ніж домогосподарства з двома особами.

б Щоб знайти дисперсію, знову ж простіше скористатися табличною версією, ніж намагатися просто формулу в рядку. Дивлячись на формулу, ви помітите, що перша операція, яку ви повинні зробити, це відняти середнє значення з кожного значення x. Потім ви квадратуєте кожне з цих значень. Потім ви помножте кожну з цих відповідей на ймовірність кожного значення x. Нарешті, ви складаєте всі ці значення.

Таблиця \(\PageIndex\) : Обчислення дисперсії для дискретного PDF-файлу

х1234567
П (х)0,2670,3360.1580.1370.0630,0240,015
\(x-\mu\) -1.525-0.5250,4751,4752.4753.4754.475
\((x-\mu)^\) 2.32560,27560,22562.17566.125612.075620.0256
\((x-\mu)^ P(x)\) 0.62090.09260.03560,29810,38590,28980,3004

Тепер складіть останній рядок, щоб знайти дисперсію, \(\sigma^=2.02375 \text < people >^\) . (Примітка: намагайтеся не округлити числа занадто багато, щоб ви не створювали помилку округлення у вашій відповіді. Числа в таблиці вище були округлені через обмеження простору, але відповідь обчислювалася з використанням багатьох знаків після коми.)

c Щоб знайти стандартне відхилення, просто візьміть квадратний корінь дисперсії, \(\sigma=\sqrt \approx 1.422454\) люди. Це означає, що ви можете очікувати, що домогосподарство в США матиме 2,525 осіб зі стандартним відхиленням 1,42 людини.

d. зайдіть в меню STAT, потім в меню Правка. Введіть значення x в L1, а P (x) значення в L2. Потім зайдіть в меню STAT, потім в меню CALC. Виберіть 1:1 -Var Статистика. Це поставить статистику 1-Var на головному екрані. Тепер введіть L1, L2 (є кома між L1 і L2), а потім натисніть ENTER. Якщо у вас новіша операційна система на TI-84, то ваш вхід буде трохи іншим. Ви побачите результат на малюнку \(\PageIndex\) .

Малюнок \(\PageIndex\) : TI-83/84 Вихід

Середнє значення становить 2,525 чоловік, а стандартне відхилення – 1,422 людини.

e Команда буде зважений.mean (x, p). Отже, для цього прикладу процес буде виглядати так:

Отже, середнє значення становить 2,525.

Щоб знайти стандартне відхилення, вам потрібно буде запрограмувати процес на R. Так що простіше просто зробити це за допомогою формули.

Приклад \(\PageIndex\) Calculating the expected value

У лотереї в Арізоні під назвою Pick 3 гравець платить 1 долар, а потім вибирає тризначне число. Якщо ці три числа вибрані в такому конкретному порядку, людина виграє $500. Яке очікуване значення в цій грі?

Рішення

Щоб знайти очікуване значення, потрібно спочатку створити розподіл ймовірностей. В даному випадку випадкова величина x = виграш. Якщо ви вибираєте правильні цифри в правильному порядку, то ви виграєте 500 доларів, але ви заплатили 1 долар, щоб грати, так що ви насправді виграєте $499. Якщо ви не вибрали правильні цифри, ви втрачаєте $1, значення x – $1. Також потрібна ймовірність виграшу і програшу. Оскільки ви вибираєте тризначне число, і для кожної цифри є 10 цифр, які ви можете вибрати з кожним незалежним від інших, ви можете використовувати правило множення. Щоб виграти, ви повинні вибрати правильні цифри в правильному порядку. Перша цифра, ви вибираєте 1 число з 10, другу цифру ви вибираєте 1 число з 10, а третю цифру ви вибираєте 1 число з 10. Імовірність вибору потрібного числа в правильному порядку є \(\dfrac * \dfrac * \dfrac=\dfrac=0.001\) . Імовірність програшу (не виграшу) була б \(1-\dfrac=\dfrac=0.999\) . Внесення цієї інформації в таблицю допоможе розрахувати очікуване значення.

Таблиця \(\PageIndex\) : Пошук очікуваного значення

Виграй або програйхП (х)xP (х)
Виграй$4990,001$0.499
Втратити-$10.999-$0.999

Тепер додайте два значення разом, і ви отримаєте очікуване значення. Це є \(\$ 0.499+(-\$ 0.999)=-\$ 0.50\) . У довгостроковій перспективі ви очікуєте втратити $0.50. Так як очікуване значення не дорівнює 0, то ця гра не чесна. Оскільки ви втрачаєте гроші, Арізона заробляє гроші, саме тому у них є лотерея.

Причина ймовірності вивчається в статистиці полягає в тому, щоб допомогти в прийнятті рішень в інференційній статистиці. Щоб зрозуміти, як це робиться, потрібна концепція рідкісної події.

Визначення \(\PageIndex\) : Rare Event Rule for Inferential Statistics

Якщо при даному припущенні ймовірність того чи іншого спостережуваного події вкрай мала, то можна зробити висновок, що припущення, ймовірно, не є правильним.

Прикладом цього є припустимо, що ви кидаєте передбачуваний справедливий померти 1000 разів і отримаєте шість 600 разів, коли ви повинні були тільки прокату шість навколо 160 разів, то ви повинні вірити, що ваше припущення про те, що це справедливий померти не відповідає дійсності.

Визначення, чи є подія незвичною

Чому це «x або більше» або «x або менше» замість просто «x», коли ви визначаєте, чи є подія незвичною? Розглянемо цей приклад: ви з другом щодня виходите на обід. Замість того, щоб Going Dutch (кожен платить за власний обід), ви вирішили перевернути монету, і той, хто програв платить за обидва. Ваш друг, здається, виграє частіше, ніж ви очікували, тому ви хочете визначити, чи це незвично, перш ніж ви вирішите змінити спосіб оплати обіду (або звинуватити свого друга в обмані). Процес обчислення цих ймовірностей буде представлений у наступному розділі про біноміальний розподіл. Якщо ваш друг виграв 6 з 10 обідів, ймовірність того, що трапиться виявиться близько 20,5%, що не є незвичайним. Імовірність виграшу 6 і більше становить близько 37,7%. Але що станеться, якщо ваш друг виграв 501 з 1000 обідів? Це не здається таким малоймовірним! Імовірність виграшу 501 або більше обідів становить близько 47,8%, і це відповідає вашій думці, що це не так вже й незвично. Але ймовірність виграти рівно 501 обід набагато менше, всього близько 2,5%. Ось чому ймовірність отримати саме це значення не є правильним питанням: ви повинні запитати ймовірність отримати це значення або більше (або це значення або менше з іншого боку).

Значення 0.05 буде пояснено пізніше, і це не єдине значення, яке ви можете використовувати.

Приклад \(\PageIndex\) is the event unusual

Перепис 2010 року в США виявив ймовірність того, що домогосподарство має певний розмір. Дані є в таблиці («Домашні господарства за віком», 2013 р.).

Таблиця \(\PageIndex\) : Розмір домогосподарств з перепису населення США 2010 року

Розмір домашнього господарства1234567 або більше
Імовірність26,7%33,6%15,8%13,7%6,3%2,4%1,5%
  1. Чи незвично домогосподарству мати в сім’ї шість чоловік?
  2. Якби ви натрапили на багато сімей, які мали шість людей у сім’ї, що б ви думали?
  3. Чи незвично домогосподарству мати чотирьох людей в сім’ї?
  4. Якби ви натрапили на сім’ю, яка має чотирьох людей, що б ви подумали?

Рішення

Стан випадкова величина:

x= кількість людей у домогосподарстві

а. щоб визначити це, потрібно подивитися на ймовірності. Однак не можна просто подивитися на ймовірність шести чоловік. Вам потрібно подивитися на ймовірність того, що х буде шістьма або більше людей або ймовірність того, що х буде шістьма або менше людей. The

Так як ця ймовірність більше 5%, то шість не є надзвичайно низьким значенням. The

Так як ця ймовірність менше 5%, то шість – надзвичайно висока величина. Для домогосподарства незвично мати в сім’ї шість чоловік.

б Оскільки для сім’ї незвично мати шість людей, то ви можете подумати, що або розмір сімей збільшується від того, що було, або що ви перебуваєте в місці, де сім’ї більше, ніж в інших місцях.

с. щоб визначити це, потрібно подивитися на ймовірності. Знову ж таки, подивіться на ймовірність того, що х буде чотири або більше, або ймовірність того, що х буде чотири або менше. The

Так як ця ймовірність більше 5%, чотири не є надзвичайно високим значенням. The

Оскільки ця ймовірність більше 5%, чотири не є надзвичайно низьким значенням. Таким чином, чотири – це не незвичайний розмір сім’ї.

d Оскільки для сім’ї не є незвичайним мати чотирьох членів, то ви б не подумали, що щось погане.

Домашнє завдання

    Eyeglassomatic виробляє окуляри для різних роздрібних продавців. Кількість днів, необхідних для виправлення дефектів окулярів, і ймовірність того, що це займе така кількість днів, вказані в таблиці.

Кількість днівймовірності
124,9%
210,8%
39,1%
412,3%
513,3%
611,4%
77,0%
84,6%
91,9%
101,3%
111,0%
120,8%
130,6%
140,4%
150,2%
160,2%
170,1%
180,1%
  1. Створити випадкову величину.
  2. Напишіть розподіл ймовірностей на кількість голів.
  3. Намалюйте гістограму для кількості голів.
  4. Знайти середню кількість голів.
  5. Знайдіть дисперсію за кількістю голів.
  6. Знайдіть стандартне відхилення для кількості голів.
  7. Знайти ймовірність наявності двох і більше кількості голів.
  8. Чи незвично перевертати дві голови?

1. a. Див. Рішення, б. Див. Рішення, c. 4.175 днів, d. 8.414375 \(\text < days >^\) , е. 2.901 день, ф. 0.004, г. Див. Рішення, h.

Які існують розподіли ймовірностей

Запрошуємо усіх хто любить цікаві задачі та головоломки відвідати групу! Зараз діє акція – підтримай студента! Знижки на роботи + безкоштовні консультації.

Контакти

Адміністратор,
розв’язування задач
Роман

Tel. +380685083397
[email protected]
skype,facebook:
roman.yukhym

Розв’язування задач
Андрій

facebook:
dniprovets25