Tip:
Highlight text to annotate it
X
Миналия път намерихме 95%-ния интервал
на увереност
за средната загуба на тегло между групата за отслабване
и контролната група.
В този клип всъщност искам да направя хипотетичен тест,
за да изпитам реално дали тези данни ще ни накарат да повярваме,
че диетата за отслабване е въобще ефективна.
За да направим това, нека установим нашите нулева и
алтернативна хипотези.
Нулевата ни хипотеза трябва да е, че тази
диета за отслабване е неефективна.
И ако диетата за отслабване е неефективна, това означава,
че популационната средна стойност на тази диета минус популационната средна стойност
на контролната ще е равна на 0.
Това е напълно равносилно твърдение на това, че
средната стойност на образцовото разпределение на нашата диета за отслабване
минус средната стойност на образцовото разпределение на
контролната ще е равно на 0.
Това е така, защото го видяхме много пъти.
Средната стойност на образцовото разпределение ще е равна на
популационната средна стойност.
Това е равно на това.
Това пък на това.
Или друг начин да го кажем е, ако помислим за средната стойност
на разпределението от разликата на образцовите средни стойности,
обърнахме внимание на това миналия път, че
тук ще е равно на 0.
Понеже това нещо тук е точно равно
на това тук.
Та това е нашата нулева хипотеза.
А нашата алтернативна хипотеза,
ще я напиша тук.
Тя всъщност е тази,
коятони върши някаква работа.
И нека кажем, че тя всъщност има подобрение.
Това ще означава, че имаме налице по-голямо отслабване.
И ако разполагаме със средната стойност на група едно, популационната средна стойност
на група едно минус популационната средна стойност на група две
трябва да е по-голяма от нула.
Така че това ще е едностранно разпределение.
Или друг начин, по който бихме го разглеждали, е този, когато средната стойност
на разликата от разпределения, х1 минус х2
ще е по-голяма от нула.
Това са равносилни твърдения.
Защото знаем, че това е равно на това, което
е рвано на това, което е
написаното тук.
И сега, за да направим някакъв хипотетичен тест, трябва
да решим
нивото на значителност.
Това, което ще направим, е че ще приемем нашата
нулева хипотеза за вярна.
И с това предположение, че нулевата хипотеза
е вярна, ще видим каква е вероятността
да получим тези образцови данни тук.
И ако тази вероятност е под някакъв праг,
ще отхвърлим нулевата хипотеза в полза на алтернативната
хипотеза.
Така, този праг на вероятността, видяхме това
и преди, се нарича ниво на значителност, понякога
наречено алфа.
И тук, ще изберем ниво
на значителност 95%.
Или друг начин да го обсъдим, приемайки
нулевата хипотеза за вярна, искаме да няма повече от 5%
възможност да се получи този резултат тук.
Или да няма повече от 5% възможност, която неправилно отхвърля нулевата
хипотеза, когато всъщност тя е вярна.
Или това ще е грешка от вид едно.
И ако има по-малко от 5% вероятност това да се случи,
ще отхвърлим нулевата хипотеза.
По-малко от 5% вероятност с дадена вярна нулева хипотеза,
тогава ще отхвърлим нулевата хипотеза
в полза на алтернативната.
Нека помислим за това.
Имаме нулевата хипотеза.
Нека тук начертая едно разпределение.
Нулевата хипотеза казва, че средната стойност от разликите на
образцовите разпределения трябва да е равна на нула.
И в тази ситуация, какъв ще е нашият критически
район тук?
Ами, нужен ни е резултат, така че ще тук ще ни трябва дадена
критична стойност.
Защото това не е нормализирано обикновено
разпределение.
Но има някаква критична
стойност тук.
В статистиката най-трудното нещо е намирането на
правилните думи.
Има една критическа стойност тук, че вероятността
да се намери образец над тази стойност в това разпределение
е само
5%.
И трябва само да намерим каква е тази критична стойност.
И ако нашата стойност е по-голяма от тази критична стойност, тогава
можем да отхвърлим нулевата хипотеза.
Защото това означава, че вероятността да получим този резултат
е по-малка от 5%.
Бихме могли да отхвърлим нулевата хипотеза и да продължим
с алтернативаната хипотеза.
Пак да не забравяме, че можем да използваме Z-резултати,
и да приемем, че имаме обикновено разпределение, защото нашият
образцов размер е достатъчно голям за двата образеца.
Имаме образцов размер 100.
И за да намерим търсеното, най-напред, ако само погледнем
едно нормализирано обикновено разпределение като това, каква е
нашата
критична Z-стойност?
Получаваме един резултат над тази Z-стойност,
която има само 5% възмоност.
И това всъщност е растяща стойност.
И тази цяла област тук
ще има 95% възможност.
Можем да погледнем Z-таблицата.
Търсим 95% процента.
Търсим в едностранния случай.
Нека потърсим 95%.
Това е най-близката стойност.
Искаме да избегнем по-голямата грешка да бъдем тук
от дясната страна.
Та нека кажем, че 95,05 си е доста добре.
Така тук имаме 1,65.
Така че тази критична Z-стойност е равна на 1,65.
Или друг начин да разглеждаме това е, когато това разстояние тук
ще е 1,65 стандартни
отклонения.
Знам, че почеркът ми е наистина дребен.
Само казвам стандартното отклонение на това
разпределение.
И какво е стандартното отклонение на това
разпределение?
Всъщност го пресметнахме миналия път, но
и тук ще го изчислим.
Стандартното отклонение на нашето разпределение при разликата
от образцовите средни стойности ще е равно на корен квадратен
от промяната на нашето първо население.
И промяната в първото ни население, нея не я знаем.
Но можем да я изчислим чрез нашето образцово стандартно отклонение.
Ако вземем това образцово стандартно отклонение, 4,67
и го повдигнем на квадрат, получаваме нашата образцова промяна.
И това е промяната.
Това е нашият най-добър резултат от промяната
на населението.
И искаме да разделим това на образцовия размер.
И след това плюс нашият най-добър резултат от промяната
на населението при група две, който е 4,04 на квадрат.
Образцовото стандартно отклонение на група две на квадрат.
Това ни дава промяната, разделена на 100.
Направих това миналия път. Може би още се вижда в моя
калкулатор.
Да, още е в калкулатора.
Това е количеството тук горе.
4,67 на квадрат, делено на 100 плюс 4,04
на квадрат, делено на 100.
Така получихме 0,617.
Т.е. това тук ще е 0,617.
А това разстояние тук ще е
равно на 1,65 пъти по 0,617.
Нека го пресметнем на колко е равно.
И така, 0,617, умножено по 1,65.
Това дава 1,02.
Това разстояние тук е 1,02.
И това ни казва, че ако приемем диетата като
неефективна, има само 5% възможност да е налице
разлика между средните стойности на тези два образеца, която
е повече от 1,02.
Има само 5% възможност за това.
Ами, средната стойност, която всъщност получихме е 1,91.
И това е тук някъде.
И определено спада към този критичен район.
Вероятността да получим това, приемайки че нулевата
хипотеза е вярна, тази вероятност е по-малка от 5%.
Така имаме по-малка вероятност от нашето ниво на значителност.
Всъщност нека бъда много ясен.
Нивото на значителност, това алфа
тук, трябва да е 5%.
Не 95-те %.
Мисля, че може да съм го казвал.
Но там написах погрешното число.
Извадих го от едно случайно.
Вероятно в ума си съм го направил.
Но както и да е, нивото на значителноаст е 5%.
Вероятността, дадена при вярна нулева хипотеза,
вероятността да получим резултата, който получихме,
вероятността да получим тази разлика, е по-малка от нашето
ниво на значителност.
Тя е по-малка от 5%.
Така, основани на правилата, които приемаме да имаме
ниво на значителност от 5%, ще отхвърлим нулевата
хипотеза в полза на алтернативата, че диетата
всъщност ни кара
да отслабнем повече.