Закон за големите числа

Нека научим малко за закона за големите числа, който на много нива е един от най-разбираемите закони в математиката и в теорията на вероятностите. Но понеже е толкова приложим в различни области, понякога се прилага погрешно, като е леко неразбран. За да бъдем малко формални в нашата математика, нека просто най-напред ви го дефинирам и след това ще говорим малко за разбирането. Та да кажем, че имам една случайна променлива, Х. И знаем нейната очаквана стойност или популационната й средна стойност. Законът за големите числа казва, че ако вземем даден образец от n на брой наблюдения на нашата случайна променлива, и ако определим средностатистически всички тези наблюдения - тук нека дефинирам още една променлива. Нека я наречем х с индекс n с черта над нея. Това представлява средната стойност за n наблюдения на нашата случайна променлива. Така че буквално това е първото ми наблюдение. И може някак да си кажете, че веднъж провел експеримента, получавам наблюдаваното, и пак го провеждам, и пак е налице това наблюдение. Продължавам да го провеждам n на брой пъти, след което разделям на моя брой наблюдения. Така че това е моята образцова средна стойност. Това е средната стойност на всички направени от мен наблюдения. Законът на големите числа ни казва, че моята образцова средна стойност ще достигне очакваната ми стойност на случайната променлива. Или бих могъл да го напиша и така сякаш моята образцова средна стойност ще достигне популационната ми средна стойност при n, клонящо към безкрайност. Ще използвам малко по-обикновен език относно това какво значи клонящ или приближаване. Но мисля, че имате основното разбиране относно това, че ако тук взема достатъчно голям образец, то накрая ще получа очакваната стойност на популацията като цяло. И мисля, че за много от нас това е ясно. Че ако направя достатъчно опити с големи образци, тези опити биха ми дали числата, които ще покажат очакваната стойност и вероятността и подобните на тях. Но мисля, че често това не се разбира, визирайки причината, поради която се случва. Преди да премина по-нататък, нека ви дам конкретен пример. Законът за големите числа ще ни каже, че - да кажем, че имам една случайна променлива - Х е равно на броя ези-та след 100 подхвърляния на една симетрична монета - подхвърляния или хвърляния на една симетрична монета. Най-напред, знаем каква е очакваната стойност на тази случайна променлива. Тя представлява броя подхвърляния, броя опити, умножен по вероятностите за успех при всеки опит. А това е равно на 50. Законът за големите числа гласи, че ако взема един образец или ако взема средната стойност от образеца на всички тези опити, знаете ли, че получавам - първият ми път, в който провеждам този опит аз подхвърлям 100 монети или разполагам със 100 монети в една кутия за обувки, разтърсвам кутията и преброявам броя на ези-тата, като получавам 55. Това ще е Х1. След това отново разтърсвам кутията и получавам 65. Тогава пак разтърсвам кутията и получавам 45. Така правя това n пъти, след което го разделям на броя пъти, който съм го направил. Законът за големите числа ни казва, че това представлява средната стойност на всички мои наблюдения, тя ще доближи 50 при n, клонящо към безкрайност. Или при n, клонящо към 50. Извинявам се, при n, клонящо към безкрайност. Сега искам да говоря малко за причината това да се случва или интуитивно да покажа защо е така. Много хора някак си чувстват, че, о, това означава, ако след 100 опита аз съм над средната стойност, и законите на вероятностите ще ми предоставят повече ези-та или по-малко ези-та, за да се определи разликата. Това не е съвсем предстоящото. Често го наричаме заблудата на комарджията. Нека разгранича нещата. И ще използвам този пример. Та да кажем - тук ще начертая една графика. И ще мина на цветове. Това е n, моята абсцисна ос е n. Това е броят опити, които правя. А моята ординатна ос, нека тя е образцовата средна стойност. Знаем какво представлява очакваната стойност, знаем и това, че за тази случайна променлива тя е 50. Нека начертая това тук. Така, 50. Сега се връщаме на разгледания пример. Та, когато n е равно на - нека го приложа тук. При първия си опит получих 55, и това беше моята средна стойност. Имах само една точка за данните. Тогава след два опита, да видим, резултатът е 65. И моята средна стойност ще е равна на 65 плюс 55, делено на 2. Което е 60. Така моята средна стойност малко се е покачила. При следващия пример имахме 45, което леко ще намали средната стойност. Тук няма да нанасям 45. Сега трябва да открием средната стойност на всичко. Колко е 45 плюс 65? Нека всъщност намеря числото просто, за да схванете основното. Та имаме 55 плюс 65. Това е 120 плюс 45, което дава 165. Делено на 3. 3 отива при 165 - 5 пъти по 3 е 15. Това е 53. Не, не, не. 55. Така че средната стойност слиза на 55. И можем да продължим да правим тези опити. Може да си казвате, че законът за големите числа гласи следното, добре, след като сме извършили 3 опита и нашата средна стойност е налице. И много хора мислят, че някак си властелините на вероятността ще я направят по-голяма, така че в бъдеще да получим по-малко на брой ези-та. Че някак си следващите два опита ще трябва да са тук долу, за да може нашата средна стойност да намалее. Но това не е задължителният случай. При продължаването нататък вероятностите си остават същите. Вероятностите винаги са 50%, че ще получа ези-та. Не е като в случая, когато имам определен брой езита за начало или повече на брой от този, с който съм очаквал да започна, така че изведнъж нещата биха се подредили и бих получил повече страни тура. Това представлява заблудата на комарджията. Така, ако имаме една голяма поредица от ези-та или диспропорционален брой ези-та, на определен етап ще имаме - една по-голяма вероятност да е налице диспропорционален брой ези-та. А това не е съвсем вярно. Основното в закона за големите числа е, че той не се интересува... Да кажем, че след определен брой опити вашата средна стойност всъщност - има малка вероятност това да се случи, но да кажем, че средната стойност е тук горе. Тя всъщност е на 70. Все едно, олеле, наистина сме се отклонили от очакваната стойност. Но това, което ни казва законът за големите числа, ами, не ме интересува колко опити са направени. Остатъкът от опити, който имаме е неопределен. А очакваната стойност за този неопределен брой опити, най-вече е в този вид ситуация, ще е следната. И когато осредняваме определено число откъм някакво голямо число, а след това неопределено число, което ще се приближи към стойността на това, отвъд времето ще се приближим до очакваната стойност. Този начин на описание беше малко неформален, но така гласи законът за големите числа. И това е нещо важно. Не е казано, че ако са налице няколко ези-та, тогава вероятността да получим ези-та някак си ще се увеличи за сметка на ези-тата. Това, което се казва тук, е че без значение какво се е случило, за определен брой опити, без значение каква е средната стойност след този определен брой опити, останали са ни неопределен брой опити. И ако човек направи достатъчно от тях, това ще се приближи до нашата очаквана стойност. А да помислим за това е много важно. Но това не се използва за ежедневната практика при лотарията и в казината, защото там знаят, че ако човек направи достатъчно голям брой опити, а можем дори да изчислим дали правим достатъчен брой опити, каква е вероятността тогава нещата значително да се отклонят? Но казината и лотарията ежедневно прилагат този принцип , така че ако визираме достатъчно хора - естествено, в кратък срок - или с няколко опита, двама ще ударят джакпота. Но през повечето от времето казиното винаги ще печели, поради параметрите на игрите, които то ви кара да играете. Както и да е, това е нещо важно при вероятностите и мисля, че е сравнително разбираемо. Въпреки че понякога, когато го виждаме обяснено подробно, като в случая със случайните променливи, а това е малко объркващо. Всичко, което се казва е, че като правим повече и повече опити, средната стойност на този образец ще приближава истинската средна стойност. Или трябва да съм малко по-конкретен. Средната стойност на вашия образец ще се доближи до истинската средна стойност на популацията или до очакваната стойност на случайната променлива. Както и да е, ще се видим следващия път.