Разлика от Проба означава дистрибуторска

Искам малко да градя на базата от направеното в миналия клип. да кажем, че имаме две произволни променливи. Така, имам произволната променлива х. Нека изобразя нейното вероятностно разпределение. И всъщност не е нужно то да е нормално. Но ще го начертая като нормално разпределение. Така, това е разпределението на произволната променлива х. Това е средната стойност. Популационната средна стойност на произволната променлива х. Тогава тя ще има някакво стандартно отклонение. Всъщност, нека обърнем внимание на промяната. Тук е налице промяна при произволната променлива х. Това е х, разпределението за х. Да кажем, че имаме още една произволна променлива. Произволната променлива у. Нека направим същото с нея. Начертаваме нейното разпределение. Нека покажем параметрите при това разпределение. Така, налице е дадена реална средна стойност, една популационна средна стойност на произволната променлива у. И тя има някаква промяна ето тук. Начертал съм я да е сравнително нормална. И пак да кажа, че не е нужно да допускаме, че е нормална. Защото ще допуснем, когато минем на следващото ниво, че при вземане на образците, избираме от тях достатъчен брой, така че централната гранична теорема да се приложи. Но имайки това впредвид, нека помислим за образцовите разпределения при всяка от тези произволни променливи. Т.е. нека помислим за образцовото разпределение на образцовата средна стойност на х. Нека кажем, че образцовият размер тук ще е равен на n. Каква картина получаваме? Ами ще е налице дадено разпределение. И допускаме, че n е едно сравнително голямо число. Т.е., ще разполагаме с едно нормално разпределение. Или може би то би се доближило до нормално разпределение. Нека някак го променя. Ще го изобразя да е малко тясно. Чертая средната стойност. И популационната средна стойност на това образцово рапределение ще обозначим с тази х кутийка, която ни казва разпределението на средните стойности при образцов размер n. И знаем, че това ще е равно на популационната средна стойност за тази произволна променлива. А от централната гранична теорема знаем, че промяната на образцовото разпределение или, с други думи стандартната грешка на средната стойност ще е равна на популационната промяна, разделена на това n тук. И ако търсим стандартното отклонение на това, вземаме квадратният корен на двете страни. Нека направим същото при произволната променлива у. Вземаме образцовото разпределение за тази средна стойност. Но тук говорим за у, произволната променлива у. И нека кажем, че тя има различен образцов размер. Не е нужно той да е различен. Показано е, че не е нужно да е същия. Така, налице е образцов размер m. Нека начертая неговото разпределение тук. Пак казваме, че това ще е по-тясно разпределение от популационното разпределение. И това ще е почти нормално, допускайки, че имаме достатъчно голям образцов размер. А средната стойност на образцовото разпределение за дадена образцова средна стойност, ще е равна на популационната средна стойност. Видяхме това много пъти. Същото видяхме при промяната в образцовите средни стойности, или в грешката на средната стойност. Всъщност това не е стандартната грешка. Стандартната грешка ще е квадратният корен от това. И ако нарека това стандартна грешка на средната стойност, не е правилно. Стандартната грешка на средната стойност в квадратният корен от това. Което е стандартното отклонение. Това е промяната в средната стойност. Не искам да ви объркам. Така че промяната в средната стойност тук ще е абсолютно същото нещо. Тя ще е равна на промяната в населението, разделена на нашия образцов размер. И всичко, което до тук направихме, е един пълен преговор. Малко различно е, защото използвам две различни произволни променливи. А използвам две различни произволни променливи поради една причина. Тя е че сега ще дефинирам една нова произволна променлива. Бихме могли да я наречем z. Но z е равна на разликата от нашите образцови средни стойности. Равна е на х образцовата средна стойност минус у образцовата средна стойност. А какво реално означава това? Ами, за да получим дадена образцова средна стойност поне за това разпределение, вземаме n образци от тази популация тук. Може би n е 10. Вземаме 10 образеца и намираме средната им стойност. Тази образцова средна стойност представлява една произволна променлива. Да кажем, че вземаме 10 образеца от тук и получаваме 9,2 като тяхна средна стойност. На това 9,2 може да се гледа като на образец от това разпределение ето тук. Същото получаваме ако това тук е m. Или ако m тук е 12. Вземаме 12 образеца, с тяхната средна стойност. И тази средна стойност, може би тя е 15,2, може да се приеме като образец от това разпределение. Като образец от образцовото разпределение. Т.е. това, което е z, z е една произволна променлива, където вземаме n образци от това разпределение тук горе, това популационно разпределение, като вземаме неговата средна стойност. След това вземаме m образци от това популационно разпределение тук горе, с неговата средна стойност. После намираме разликата между тази средна стойност и тази средна стойност. Което е друга произволна променлива. Но какво е разпределението на z? Нека го начертаем. Има две неща, които моментално се сещаме за z. Стигнахме някак до тези факти в миналия клип. Вместо да пиша z, само ще представя средната стойност за х- кутийката, която е образец от образцовото разпределение на х, или образцовата средна стойност на х, минус образцовата средна стойност на у. Видяхме това в миналия клип. Всъщност, мисля, че още имам какво да свърша тук горе. Да, все още имам работа тук. Средната стойност на разликата ще е равна на разликата от средните стойности. Средната стойност на разликата е едно и също нещо като разликата на средните стойности. Така че средната стойност на това ново разпределение тук ще е равна на средната стойност на нашата образцова средна стойност минус средната стойност на нашата образцова средна стойност на у. В този клип това може да изглежда малко абстрактно. В следващиия клип ще извършваме всичко това с конкретни числа. И вероятно така ще има повече смисъл. И само за да знаете къде ще стигнем с това, цялата му същност е с целта да можем накрая да приложим някаква подразбираща се статистика относно разликите в средните стойности. Каква е вероятността за разликата на средните стойности, с произволна възможност или с непроизволна възможност? Или какъв е интервалът на увереност при дадена разлика в средните стойности? На този принцип изграждаме тук. Та какот и да е, знаем средната стойност на това разпределение тук. А каква е промяната на това разпределение? Стигнахме до този резултат миналия път. Ако по същество вземаме разликата на две произволни променливи, промяната ще представлява сбора от тези две произволни променливи. И смисълът в този клип е да можем да покажем, че не разликата на промените е важна, а сборът от тези промени. Промяната в това ново разпределение- и още не съм начертал разпределението-промяната в това ново разпределение, само ще запиша х кутийката минус у кутийката, ще е равно на сбора от промените във всяко от тези разпределения. Промяната на х кутийката плюс промяната на у кутийката. Всъщност, нека начертая това тук. За да можем да представим едно друго разпределение. Въпреки че всичко, което ще начертая е едно друго обикновено разпределение. Отивам малко надолу. И средната стойност тук, средната стойност на х кутийката минус у кутийката, ще е равна на разликата от тези средни стойности тук. Не е нужно да преписвам това. Нека начертая извивката. И забележете, че сега извивката е по-широка отколкото при разпределението за една промяна. Защо правя това? Защото промяната тук представлява сумата от промените тук. Поради което ще имаме по-широка извивка. Тя ще има по-голяма промяна или по-голямо стандартно отклонение от всяка една сред тези тук. И имаме някаква промяна, промяната от х кутийката минус у кутийката. А какви са тези елементи, визирайки оригиналното популационно разпределение? Получихме тези резултати тук. Знаем какво е стандартното отклонение. Знаем, че това е равно на промяната в популационното разпределение, разделено на n. Такива сметки сме правили много, много пъти. На какво ще е равно това? Това тук е равно на разликата в нашето популационно разпределение. А този х означава, че се визира произволната променлива х. Но на върха няма кутийка. Това е действителното популационно разпределение, а не образцовото разпределение на средната стойност. Делим това на n. И след това ако искаме промяната в у в образцовото разпределение, нека използвам тук различен цвят. Ще използвам синьо, защото го използвахме за произволната променлива у. Това ще е равно на това тук. И това сме го правили много пъти. Същата точна логика имаме. Популационно разпределение при у, разделено на m. И така, ще напиша пак това отпред. Това е промяната в разликите на образцовите средни стойности. И сега ако търсим стандартното отклонение от разликите на образцовите средни стойности, трябва да добавим квадратния корен от двете страни тук. След като поставим това под квадратния корен, получаваме стандартното отклонение от разликата на образцовите средни стойности, че е равно на корен квадратен от популационното разпределение на х. Или промяната на популационното разпределение от х, разделено на n плюс промяната на популационното разпределение от у, делено на m. Това вече е добре. Защото изглежда някак като формула за разстоянието. Ще изхвърля това там, защото става много сложно с тази статистика и ще се опитаме да визираме какво означава целият материал в по-напреднали теми. Но важното тук е, че сега можем да правим заключения относно дадена арзлика от средни стойности. Ако разполагаме с два образеца, и вземем средните стойности на двата образеца, можем да си направим някакви изводи относно вероятността тази разлика да е случайна. Ще направим това в следващия клип.