Доверителен интервал за разликата на Средства

Опитваме се да изпробваме дали една нова диета за отслабване фактически помага на напълнелите да отслабнат. 100 произволно избрани хора са причислени към група едно, подлагайки се на диетата. Други 100 произволно избрани напълнели хора са причислени към група две, подлагайки се на диета с приблизително същото количество храна, но без намалени мазнини. Един вид група две е контролата, където няма диета. Група едно е тази, която е подложена на диетата, за да се види действителния й ефект. След четири месеца, средната стойност в загубата на тегло била 9,31 фунта при първата група. Нека напиша това. Нека го представя много ясно. И при отслабващата група, средната стойност на загубата на тегло била 9,31фунта. Т.е. нашата образцова средна стойност за група едно е 9,31 фунта, с образцово стандартно отклонение 4,67. Тези двете са очевидно много лесно изчислими, имайки предвид реалните данни. Тогава при нашата контролна група, образцовата средна стойност е 7,40 фунта за група две. С образцово стандартно отклонение 4,04 фунта. Сега, ако погледнем бегло това, сякаш отслабващата група е изгубила повече тегло, базирана само на нашите образци, в сравнение с контролната група. Ако вземем разликата помежду им. Та ако вземем разликата между подложената на диета група и контролната група, тогава получаваме 9,31 минус 7,40 е равно на, нека вземем калкулатора, 1,91. Така разликата от нашите образци е 1,91. Въз основа на видяното, може би губим една нарастнала част от 1,91 фунта на всеки четири месеца ако сме на тази диета. В този клип искаме да получим 95%-ен интервал на увереност около това число. За да го видим в този 95%-ен интервал на увереност, може би, дали винаги губим тегло? Или има ли някаква възможност да минем по другия начин при диетата за отслабване? И в този клип, 95% интервал на увереност. В следващия клип, ще направим един хипотетичен тест, като използваме същите данни. А сега, за да определим този 95%-ен интервал на увереност, нека помислим за разпределението, което разглеждаме. Нека погледнем разпределението. Разбира се, ще помислим за разпределението, което е задачата ни. Искаме да помислим за разпределението, касаещо разликата в средните стойности. И тук то ще има някаква вярна средна стойност. Която е средната стойност на разликата между образцовите средни стойности. Записваме това. Това не е у, а имаме х1 и х2. И имаме образовата средна стойност на х1 минус образовата средна стойност на х2. Впоследствие това разпределение тук ще има някакво стандартно отклонение. Т.е. тоа е стандартното отклонение на разпределението на средната стойност за х1 минус образцовата средна стойност на х2. Тук ще е налице някакво стандартно отклонение. Искаме да направим подразбиране относно това. Или предполагам, най-добрият начин да помислим по въпроса е като поискаме един 95%-ен интервал на увереност. Базирано на образеца ни, искаме да създадем един интервал около това, където сме уверени, че е налице 95% възможност тази вярна средна стойност, вярната средна стойност на разликите, да е в рамките на този интервал. А за да напарвим това, нека погледнем по другия начин. Как можем да изградим един интервал около това, където сме 95% сигурни, че който и да е образец от това разпределение, и този образец сред образците, че има 95% възможност да изберем от този регион тук. Т.е. интересува ни един 95% регион тук. И колко на брой стандартни отклонения имаме, за да отидем във всяка посока? За да направим това, трябва да погледнем една Z- таблица. И само запомнете, ако имаме 95% тук в средата, ще имаме 2,5% тук и ще имаме 2,5% тук. Трябва да е налице 5% разделение между тези два симетрични края. И когато погледнем Z-таблицата, търсим критичната Z-стойност, която ни е дадена тук. Трябва да внимаваме тук. Няма да гледаме на 95%, защото една Z-таблица ни дава растящата вероятност към тази критична стойност. А Z-таблицата ще обясним по следния начин. Ще има някаква Z-стойност тук, каквато имаме на 2,5% отвъд. Вероятността да получим един по-краен резултат или Z-резултат над този е 2,5%. А вероятността да получим такъв под този ще е 97,5%. Но ако можем да намерим каквато и да е Z-стойност за това тук, ще имаме налице Z-стойност, равна на тази. И вместо да мислим по начина на едностранната идея, ще помислим по двустранния начин. Та нека потърсим 97,5 % в нашата Z-таблица. Ето тук. Това е 0,975, или 97,5. Това ни дава Z-стойността за 1,96. Т.е. Z е равно на 1,96. Или 2,5% от образците на това население ще са по-големи от 1,96 стндартните отклонения извън средната стойност. Така че тази критична стойност тук е 1,96 стандартни отклонения. Това е 1,96 пъти по стандартното отклонение на х1 минус х2. После това тук ще е равно на минус 1,96, умножено по същото нещо. Нека го напиша. И това тук, налице е симетричност. Това разстояние ще е равно на това разстояние. Т.е. имаме минус 1,96, умножено по стандартното отклонение на това разпределение. И да го запишем така, има 95% възможност за това образецът, който получихме от нашето разпределение-това е образецът като разлика между тези образци. Има 95% възможност 1,91 да се намира в рамките на 1,96 пъти по стандартното отклонение на това разпределение. И може това да се счита за стандартна грешка на тази статистика. Така, имаме х1 минус х2. Нека довърша това изрречение. Има 95% възможност за 1,91, което е образцовата статистика, или статистиката, която получихме, да е в рамките на 1,96, умножено по стандартното отклонение на това разпределение за реалната средна стойност на разпределението. Или можем да кажем това по другия начин. Има 95% възможност реалната средна стойност на разпределението да е в рамките на 1,96 пъти по стандартното отклонение за разпределението на 1,91. Това са развносилни твърдения. Ако каж, че се намирам на около три фута от вас, това е равносилно на факта, че вие сте на около три фута от мен. Това е всичко, което се казва. Но когато имаме изграждане по този начин, става пределно ясно, как всъщност изграждаме интервала на увереност? Трябва просто да намерим какво е това разстояние тук. И за да го намерим, ще разберем какво е стандартното отклонение на разпределението. Ами стандартното отклонение на разликите между образцовите средни стойности ще е равно на, видяхме това на миналия клип-всъщност, мисля, че го имаме тук в дъното-ще е равно на корен квадратен от промените във всяко от тези разпределения. Нека го напиша така. Промяната, ще я докажа наново. Промяната на ншето разпределение ще е равна на сумата от промените на тези образцови разпределения. И знаем, че промяната във всяко от образцовите разпределения е равна на промяната в това образцово разпределение, което е равно на промяната в популационното разпределение, разделено на образцовия размер. а нашият образцов размер в този случай е 100. И промяната на това образцово разпределение, на нашата контрола, ще е равна на промяната на популационното разпределение за контролата, разделено на нейния образцов размер. И след като не знаем какво са тези неща, можем да се доближаваме до тях. Най-вече поради това, че n е по-голямо от 30 при двете обстоятелства. Можем да ги приближим с образцовите промени за всяко от тези разпределения. И нека изясня това. Нашите образцови промени за всяко от тези разпределения. Това ще е нашето образцово стандартно отклонение едно, на квадрат, което представлява образцовата промяна за това разпределение, върху 100. Плюс моето образово стандартно отклонение за контролата на квадрат, което е образцовата промяна. Квадратът на стандартното отклонение си е промяната, разделена на 100. А това ще ни даде промяната при даденото разпределение. И ако търсим стандартното отклонение, просто вмъкваме квадратните корени от двете страни. Ако търсим стандартното отклонение на това разпределение тук, това сега е промяната, и трябва само да вмъкнем квадратните корени. Нека пресметнем това. Всъщност знаем тези стойности. S1, нашето образцово стандартно отклонение за група едно е 4,67. Тук също го написахме. Това е 4,76 и 4,04. S е 4,67, ще трябва да го повдигнем на квадрат. А S2 е 4,04, ще трябва и него да го повдигнем на квадрат. Извършваме изчисленията. Ще вземем квадратния корен от 4,67 на квадрат, разделен на 100 плюс 4,04 на квадрат, разделено на 100. И затваряме кръглите скоби. Получаваме 0,617. Нека го напиша тук. Това ще е равно на 0,617. Ако се върнем тук, ние изчислихме стандартното отклонение на това разпределение да е 0,617. Сега можем вече да изчислим нашия интервал. Защото това ще е 0,617. И ако търсим 1,96 пъти по това, получаваме 1,96 пъти по 0,617, ще запиша отговора, който току що получихме. Така получаваме 1,21. И 95%-ният интервал на увереност ще е разликата от нашите средни стойности, 1,91, плюс или минус това число, 1,21. И какъв е нашият интервал на увереност? Долният край на интервала, мястото ми нещо свършва, 1,91 минус 1,21, това дава 0,7. И тук долният край е 0,7. Тогава горният край, 1,91 плюа 1,21, това е 2,12. Нека се уверим тук. Понякога умът ми не работи много качествено при записа на тези клипове. 3,12. И за да съм ясен, няма пълна 95% възможност истинската разлика при реалните средни стойности да е тук. Само сме уверени, че има 95% възможност. И винаги трябва да прибавяме малко увереност там, защото, запомнете, ние реално не знаехме популационните стандартни отклонения, или популационните промени. Изчислихме ги чрез нашия образец. И поради това, не знаем, че имаме една точна вероятност. Само казваме, че сме уверени в това, че е налице една 95% вероятност. Ето защо казваме, че това е интервал на увереност. Не е чиста вероятност. Но си е доста приличен резултат. И сме уверени, че има 95% възможност исртинската разлика на тези два образци-и запомнете, нека изясня малко нещата, очакваната промяна в образцовите средни стойностие всъщност равна на очакваната стойност при населенията. И така, това, което получаваме тук, всъщност е един интервал на увереност за вярната разлика между населенията. Нека дадем на всички, на всеки възможен човек, диета едно. И на всеки възможен човек, диета две. Това ни дава интервал на увереност за верните популационни средни стойности. Така когато погледнем тук, като че ли диета едно всъщност има някакъв ефект. Понеже във всеки случай, дори и в долния край от интервала на увереност, още имаме по-голяма загуба в теглото, от колкото при втората диета. Надявам се, че това не е много объркващо. В следващия клип ще направим хипотетичен тест със същите данни.