[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:06.26,Default,,0000,0000,0000,,В последните две видеа първо пресметнахме общата вариация на тези 9 данни тук Dialogue: 0,0:00:06.26,0:00:09.96,Default,,0000,0000,0000,,и получихме 30, което е общият сбор на квадратите. Dialogue: 0,0:00:09.96,0:00:15.50,Default,,0000,0000,0000,,После се запитахме колко от тази вариация се дължи на вариация, породена Dialogue: 0,0:00:15.50,0:00:19.53,Default,,0000,0000,0000,,ВЪВ всяка от групите, и колко е поради вариация МЕЖДУ самите групи. Dialogue: 0,0:00:19.53,0:00:24.93,Default,,0000,0000,0000,,За вътрешногруповата вариацията изчислихме сбора на квадратите в групите (SSW) . Dialogue: 0,0:00:24.93,0:00:26.93,Default,,0000,0000,0000,,Това е 6. Dialogue: 0,0:00:26.94,0:00:32.08,Default,,0000,0000,0000,,После равенството с това 30, равенството с тази вариация Dialogue: 0,0:00:32.08,0:00:36.33,Default,,0000,0000,0000,,дойде от междугруповата вариацията, която пресметнахме (SSB), Dialogue: 0,0:00:36.34,0:00:39.48,Default,,0000,0000,0000,,като получихме 24. Dialogue: 0,0:00:39.48,0:00:43.02,Default,,0000,0000,0000,,В това видео искам да използвам този вид информация – Dialogue: 0,0:00:43.02,0:00:46.18,Default,,0000,0000,0000,,тези статистически оценки, които пресметнахме – Dialogue: 0,0:00:46.18,0:00:49.14,Default,,0000,0000,0000,,за да направим някои дедуктивни статистически оценки, Dialogue: 0,0:00:49.14,0:00:53.20,Default,,0000,0000,0000,,за да достигнем до определен извод или да не достигнем до никакви изводи. Dialogue: 0,0:00:53.20,0:00:56.82,Default,,0000,0000,0000,,Искам да дам малко пояснения около тези групи. Dialogue: 0,0:00:56.82,0:01:00.08,Default,,0000,0000,0000,,Досега се занимавахме с тях абстрактно, но можеш да си представиш, Dialogue: 0,0:01:00.08,0:01:02.90,Default,,0000,0000,0000,,че това са резултатите на някакъв вид експеримент. Dialogue: 0,0:01:02.90,0:01:11.86,Default,,0000,0000,0000,,Да кажем, че съм дал 3 различни вида хапчета или 3 различни вида храна на хора, които правят тест. Dialogue: 0,0:01:11.87,0:01:13.93,Default,,0000,0000,0000,,И това са резултатите от теста. Dialogue: 0,0:01:13.94,0:01:22.00,Default,,0000,0000,0000,,Това е храна 1, храна 2, Dialogue: 0,0:01:22.00,0:01:26.46,Default,,0000,0000,0000,,а това тук е храна 3. Dialogue: 0,0:01:26.46,0:01:31.04,Default,,0000,0000,0000,,Искам да открия дали видът храна, който хората ядат, преди да направят теста, Dialogue: 0,0:01:31.04,0:01:33.40,Default,,0000,0000,0000,,има влияние върху резултатите им. Dialogue: 0,0:01:33.40,0:01:38.57,Default,,0000,0000,0000,,Ако погледнеш тези стойности, изглежда хората в група 3 се представят по-добре, Dialogue: 0,0:01:38.57,0:01:40.27,Default,,0000,0000,0000,,отколкото в група 2 или 1. Dialogue: 0,0:01:40.27,0:01:44.73,Default,,0000,0000,0000,,Но дали тази разлика е напълно случайна? Случайна ли е вероятността? Dialogue: 0,0:01:44.74,0:01:50.52,Default,,0000,0000,0000,,Мога ли да бъда достатъчно уверен, че това е поради реалните разлики Dialogue: 0,0:01:50.52,0:01:53.66,Default,,0000,0000,0000,,в средните стойности на генералната съвкупност – на всички хора, Dialogue: 0,0:01:53.66,0:01:56.86,Default,,0000,0000,0000,,които някога ще ядат храна 3, храна 2 или храна 1? Dialogue: 0,0:01:56.86,0:01:58.86,Default,,0000,0000,0000,,Въпросът ми е: Dialogue: 0,0:01:58.87,0:02:03.73,Default,,0000,0000,0000,,"Еднакви ли са средните стойностите и реалните средни стойности на генералната съвкупност?" Dialogue: 0,0:02:03.74,0:02:06.58,Default,,0000,0000,0000,,Това е средна стойност на извадката, базирана на 3 извадки. Dialogue: 0,0:02:06.58,0:02:10.33,Default,,0000,0000,0000,,Но ако знаех реалните средни стойности на генералната съвкупност... Dialogue: 0,0:02:10.34,0:02:14.76,Default,,0000,0000,0000,,Въпросът ми е: "Средната стойност на генералната съвкупност на хората, които ядат храна 1, Dialogue: 0,0:02:14.76,0:02:17.68,Default,,0000,0000,0000,,еднаква ли е със средната стойност за храна 2?" Dialogue: 0,0:02:17.68,0:02:20.94,Default,,0000,0000,0000,,Очевидно никога няма да мога да дам тази храна на всяко човешко същество, Dialogue: 0,0:02:21.00,0:02:24.52,Default,,0000,0000,0000,,което ще живее някога, и да накарам всички тях да направят тест. Dialogue: 0,0:02:24.54,0:02:29.40,Default,,0000,0000,0000,,Но тук има реална средна стойност, просто тя не може да бъде измерена. Dialogue: 0,0:02:29.40,0:02:33.30,Default,,0000,0000,0000,,Въпросът ми е "това" (мю1) равно ли е на "това" (мю2) равно ли е на средната стойност на 3 (мю3) – Dialogue: 0,0:02:33.30,0:02:35.56,Default,,0000,0000,0000,,реалната средна стойност на генералната съвкупност 3. Dialogue: 0,0:02:35.56,0:02:38.82,Default,,0000,0000,0000,,Въпросът ми е: "Равни ли са тези?" Dialogue: 0,0:02:38.82,0:02:43.76,Default,,0000,0000,0000,,Понеже, ако не са равни, това означава, че видът храна, която сме дали, Dialogue: 0,0:02:43.76,0:02:50.06,Default,,0000,0000,0000,,има някакъв вид въздействие върху представянето на хората на теста. Dialogue: 0,0:02:50.06,0:02:52.40,Default,,0000,0000,0000,,Нека направим малка проверка на хипотеза. Dialogue: 0,0:02:52.40,0:02:55.00,Default,,0000,0000,0000,,Да кажем, че нулевата ми хипотеза е, Dialogue: 0,0:02:55.00,0:02:59.36,Default,,0000,0000,0000,,че средните стойности са еднакви. Dialogue: 0,0:02:59.36,0:03:07.88,Default,,0000,0000,0000,,"Храната няма значение." Dialogue: 0,0:03:07.88,0:03:16.88,Default,,0000,0000,0000,,Алтернативната ми хипотеза е, че храната има значение. "Има значение." Dialogue: 0,0:03:16.88,0:03:19.00,Default,,0000,0000,0000,,Начинът да мислим количествено за това е, Dialogue: 0,0:03:19.00,0:03:21.10,Default,,0000,0000,0000,,че ако няма значение, тогава средните стойности на Dialogue: 0,0:03:21.10,0:03:24.00,Default,,0000,0000,0000,,реалните генерални съвкупности на групите ще бъдат еднакви. Dialogue: 0,0:03:24.00,0:03:27.52,Default,,0000,0000,0000,,Реалната средна стойност на генералната съвкупност на групата, която е яла храна 1, Dialogue: 0,0:03:27.52,0:03:30.44,Default,,0000,0000,0000,,ще е същата като на групата, която е яла храна 2, Dialogue: 0,0:03:30.44,0:03:35.18,Default,,0000,0000,0000,,което ще е същото като групата, която е яла храна 3. Dialogue: 0,0:03:35.20,0:03:40.28,Default,,0000,0000,0000,,Ако алтернативната ни хипотеза е вярна, тогава тези средни стойности няма да са еднакви. Dialogue: 0,0:03:40.28,0:03:42.72,Default,,0000,0000,0000,,Как можем да проверим тази хипотеза? Dialogue: 0,0:03:42.72,0:03:47.08,Default,,0000,0000,0000,,Ще започнем с нулевата хипотеза, което е това, Dialogue: 0,0:03:47.08,0:03:49.80,Default,,0000,0000,0000,,което правим винаги, когато проверяваме хипотези – Dialogue: 0,0:03:49.80,0:03:52.60,Default,,0000,0000,0000,,започваме с нулевата хипотеза. Dialogue: 0,0:03:52.60,0:03:56.12,Default,,0000,0000,0000,,После ще открием каква е вероятността Dialogue: 0,0:03:56.12,0:03:59.26,Default,,0000,0000,0000,,да получим определена статистика, чиято стойност да е критична. Dialogue: 0,0:03:59.27,0:04:01.20,Default,,0000,0000,0000,,Не съм дефинирал каква ще е тази статистика. Dialogue: 0,0:04:01.20,0:04:04.94,Default,,0000,0000,0000,,Ще започнем с нулевата хипотеза, Dialogue: 0,0:04:04.94,0:04:08.66,Default,,0000,0000,0000,,а после ще намерим статистиката, наречена F статистика. Dialogue: 0,0:04:08.67,0:04:11.93,Default,,0000,0000,0000,,Нашата F статистика, Dialogue: 0,0:04:11.94,0:04:16.38,Default,,0000,0000,0000,,която има F разпределение – и няма да се задълбочаваме в детайлите Dialogue: 0,0:04:16.38,0:04:19.06,Default,,0000,0000,0000,,на F разпределението, но винаги можеш да започнеш да мислиш за него Dialogue: 0,0:04:19.06,0:04:21.14,Default,,0000,0000,0000,,като отношението на две разпределения хи-квадрат, Dialogue: 0,0:04:21.14,0:04:23.80,Default,,0000,0000,0000,,които може да имат или да нямат различни степени на свобода. Dialogue: 0,0:04:23.80,0:04:31.93,Default,,0000,0000,0000,,Нашата F статистика ще е отношението на междугруповата дисперсия – Dialogue: 0,0:04:31.93,0:04:37.08,Default,,0000,0000,0000,,сбора от квадратите между групите, Dialogue: 0,0:04:37.08,0:04:41.73,Default,,0000,0000,0000,,разделен на степените на свобода между групите, Dialogue: 0,0:04:41.73,0:04:46.33,Default,,0000,0000,0000,,и това понякога бива наричано средни квадрати – средна стойност на квадратите между групите (MSB) – Dialogue: 0,0:04:46.34,0:04:52.28,Default,,0000,0000,0000,,и това, разделено на вътрешногруповата дсперсия... Dialogue: 0,0:04:52.28,0:04:56.54,Default,,0000,0000,0000,,Това направих тук – разделих вътрешногруповата вариация, Dialogue: 0,0:04:56.58,0:05:01.06,Default,,0000,0000,0000,,сбора от квадратите {\i1}в{\i0} групите, SSW, което е в синьо, Dialogue: 0,0:05:01.06,0:05:08.74,Default,,0000,0000,0000,,на степените на свобода между групите и това беше m (n-1). Dialogue: 0,0:05:08.74,0:05:12.10,Default,,0000,0000,0000,,Нека сега помислим колко прави това тук. Dialogue: 0,0:05:12.10,0:05:18.33,Default,,0000,0000,0000,,Ако това число – числителят, е много по-голям от знаменателя, Dialogue: 0,0:05:18.33,0:05:27.33,Default,,0000,0000,0000,,тогава това ни казва, че вариацията в тези данни е предимно поради Dialogue: 0,0:05:27.33,0:05:31.60,Default,,0000,0000,0000,,разликите {\i1}между{\i0} реалните средни стойности Dialogue: 0,0:05:31.60,0:05:35.93,Default,,0000,0000,0000,,и по-малко поради вариацията на средните в групите. Dialogue: 0,0:05:35.93,0:05:40.87,Default,,0000,0000,0000,,Това е, ако този числител е много по-голям от този знаменател. Dialogue: 0,0:05:40.87,0:05:45.10,Default,,0000,0000,0000,,Това трябва да ни накара да повярваме, че има разлика Dialogue: 0,0:05:45.12,0:05:46.74,Default,,0000,0000,0000,,в реалната средна стойност на генералната съвкупност. Dialogue: 0,0:05:46.74,0:05:48.73,Default,,0000,0000,0000,,Ако това число е много голямо, Dialogue: 0,0:05:48.73,0:05:51.33,Default,,0000,0000,0000,,това трябва да ни каже, че има по-малка вероятност Dialogue: 0,0:05:51.33,0:05:53.60,Default,,0000,0000,0000,,нулевата ни хипотеза да е вярна. Dialogue: 0,0:05:53.60,0:05:58.53,Default,,0000,0000,0000,,Ако това число е много малко и знаменателят ни е по-голям, Dialogue: 0,0:05:58.53,0:06:02.07,Default,,0000,0000,0000,,това означава, че вариацията ВЪВ всяка извадка Dialogue: 0,0:06:02.07,0:06:04.20,Default,,0000,0000,0000,,е по-голяма част от общата вариация, отколкото Dialogue: 0,0:06:04.20,0:06:05.56,Default,,0000,0000,0000,,вариацията МЕЖДУ извадките. Dialogue: 0,0:06:05.56,0:06:08.88,Default,,0000,0000,0000,,Това означава, че вариацията ни ВЪВ всяка от тези извадки Dialogue: 0,0:06:08.88,0:06:15.20,Default,,0000,0000,0000,,е по-голям процент от общата вариация, спрямо вариацията МЕЖДУ извадките. Dialogue: 0,0:06:15.20,0:06:17.80,Default,,0000,0000,0000,,Това ще ни накара да повярваме, че...всяка разлика, Dialogue: 0,0:06:17.80,0:06:21.00,Default,,0000,0000,0000,,която видим между средните стойности, вероятно е просто случайна. Dialogue: 0,0:06:21.00,0:06:24.40,Default,,0000,0000,0000,,Това ще затрудни отхвърлянето на нулевата хипотеза. Dialogue: 0,0:06:24.40,0:06:26.87,Default,,0000,0000,0000,,Нека да изчислим. Dialogue: 0,0:06:26.87,0:06:34.20,Default,,0000,0000,0000,,В този случай междугруповата вариация (SSB), която изчислихме тук, беше 24 Dialogue: 0,0:06:34.20,0:06:37.93,Default,,0000,0000,0000,,и имахме 2 степени на свобода. Dialogue: 0,0:06:37.94,0:06:49.52,Default,,0000,0000,0000,,Вътрешногруповата ни вариация (SSW) беше 6 и колко степени на свобода имахме? Dialogue: 0,0:06:49.52,0:06:52.66,Default,,0000,0000,0000,,Също 6. 6 степени на свобода. Dialogue: 0,0:06:52.67,0:06:58.60,Default,,0000,0000,0000,,Това ще е 24/2, което е 12, делено на 1. Dialogue: 0,0:06:58.60,0:07:05.54,Default,,0000,0000,0000,,F статистиката, която пресметнахме, е равна на 12. Dialogue: 0,0:07:05.54,0:07:10.86,Default,,0000,0000,0000,,F идва от "Fischer" (Фишер) – биолог и статистик, който е измислил това. Dialogue: 0,0:07:10.86,0:07:15.02,Default,,0000,0000,0000,,Нашата F статистика е 12. Dialogue: 0,0:07:15.02,0:07:17.46,Default,,0000,0000,0000,,Ще видим, че това е доста високо число. Dialogue: 0,0:07:17.46,0:07:20.02,Default,,0000,0000,0000,,Едно от нещата, които забравих да спомена, е, че при всяка проверка на хипотези Dialogue: 0,0:07:20.02,0:07:22.26,Default,,0000,0000,0000,,ще ни трябва някакво ниво на значимост. Dialogue: 0,0:07:22.27,0:07:24.73,Default,,0000,0000,0000,,Нека кажем, че нивото на значимост, което ни интересува Dialogue: 0,0:07:24.73,0:07:28.33,Default,,0000,0000,0000,,за проверката на хипотезите, е 10%. Dialogue: 0,0:07:28.34,0:07:31.40,Default,,0000,0000,0000,,0,10 – което означава, Dialogue: 0,0:07:31.40,0:07:35.08,Default,,0000,0000,0000,,че ако приемем нулевата хипотеза, Dialogue: 0,0:07:35.08,0:07:39.92,Default,,0000,0000,0000,,ще има по-малко от 10% вероятност да получим резултата, който получихме – Dialogue: 0,0:07:39.92,0:07:41.66,Default,,0000,0000,0000,,да получим тази F статистика и тогава Dialogue: 0,0:07:41.66,0:07:44.64,Default,,0000,0000,0000,,ще трябва да отхвърлим нулевата хипотеза. Dialogue: 0,0:07:44.64,0:07:48.36,Default,,0000,0000,0000,,Искаме да намерим критичната стойност на F статистиката, Dialogue: 0,0:07:48.36,0:07:53.52,Default,,0000,0000,0000,,при която получаването на такава стойност или по-висока от нея, е 10%. Dialogue: 0,0:07:53.52,0:07:57.13,Default,,0000,0000,0000,,И ако получената F статистика е по-голяма от критичната стойност Dialogue: 0,0:07:57.13,0:07:59.53,Default,,0000,0000,0000,,тогава ще отхвърлим нулевата хипотеза, Dialogue: 0,0:07:59.53,0:08:01.40,Default,,0000,0000,0000,,а ако е по-малка, не можем да отхвърлим нулевата хипотеза. Dialogue: 0,0:08:01.40,0:08:06.27,Default,,0000,0000,0000,,Няма да навлизам в много детайли за F статистиката, Dialogue: 0,0:08:06.27,0:08:08.98,Default,,0000,0000,0000,,но вече можем да видим, че всеки от тези сборове на квадратите Dialogue: 0,0:08:08.98,0:08:10.52,Default,,0000,0000,0000,,има разпределение хи-квадрат Dialogue: 0,0:08:10.52,0:08:12.53,Default,,0000,0000,0000,,"Това" има едно разпределение хи-квадрат, Dialogue: 0,0:08:12.53,0:08:15.20,Default,,0000,0000,0000,,а "това" има друго разпределение хи-квадрат. Dialogue: 0,0:08:15.20,0:08:17.53,Default,,0000,0000,0000,,Това има разпределение хи-квадрат с 2 степени на свобода, Dialogue: 0,0:08:17.53,0:08:21.33,Default,,0000,0000,0000,,а това е разпределение хи-квадрат с – и не сме го нормализирали – Dialogue: 0,0:08:21.33,0:08:24.07,Default,,0000,0000,0000,,но приблизително разпределение хи-квадрат с 6 степени на свобода. Dialogue: 0,0:08:24.07,0:08:29.80,Default,,0000,0000,0000,,F разпределението е отношението на две разпределения Хи-квадрат Dialogue: 0,0:08:29.80,0:08:34.93,Default,,0000,0000,0000,,и получих това – това е скрийншот от курса на един професор в UCLA, Dialogue: 0,0:08:34.93,0:08:38.53,Default,,0000,0000,0000,,надявам се, че нямат нищо против, трябваше да намеря F таблица, която да погледнем. Dialogue: 0,0:08:38.53,0:08:41.80,Default,,0000,0000,0000,,Така изглежда едно F разпределение. Dialogue: 0,0:08:41.80,0:08:44.16,Default,,0000,0000,0000,,Очевидно ще изглежда различно, в зависимост от Dialogue: 0,0:08:44.16,0:08:46.60,Default,,0000,0000,0000,,степените на свобода на числителя и знаменателя. Dialogue: 0,0:08:46.60,0:08:49.20,Default,,0000,0000,0000,,Има две степени на свобода, за които да помислим – Dialogue: 0,0:08:49.20,0:08:52.53,Default,,0000,0000,0000,,степените на свобода на числителя и степените на свобода на знаменателя. Dialogue: 0,0:08:52.53,0:08:56.93,Default,,0000,0000,0000,,Като уточнихме това, нека пресметнем критичната F стойност Dialogue: 0,0:08:56.93,0:09:02.87,Default,,0000,0000,0000,,за алфа равно на 0,10 Dialogue: 0,0:09:02.87,0:09:06.53,Default,,0000,0000,0000,,и ще видиш различни F таблици за всяка различна алфа, Dialogue: 0,0:09:06.53,0:09:11.93,Default,,0000,0000,0000,,при което степените на свобода за числителя са 2, а степените на свобода за знаменателя са 6. Dialogue: 0,0:09:11.93,0:09:17.40,Default,,0000,0000,0000,,Тази цялата таблица е за алфа от 10% Dialogue: 0,0:09:17.40,0:09:25.16,Default,,0000,0000,0000,,или 0,10 и степените на свобода за числителя ни бяха 2, а степените на свобода за знаменателя ни са 6. Dialogue: 0,0:09:25.16,0:09:30.13,Default,,0000,0000,0000,,Така че критичната ни F стойност е 3,46. Dialogue: 0,0:09:30.14,0:09:39.78,Default,,0000,0000,0000,,Критичната F стойност е 3,46 – тази стойност ето тук е 3,46. Dialogue: 0,0:09:39.78,0:09:43.53,Default,,0000,0000,0000,,Стойността, която получихме от тези данни, е много по-голяма от това. Dialogue: 0,0:09:43.54,0:09:46.12,Default,,0000,0000,0000,,Това ще има много, много малка "р" стойност. Dialogue: 0,0:09:46.12,0:09:48.32,Default,,0000,0000,0000,,Вероятността случайно да получим нещо толкова екстремно, Dialogue: 0,0:09:48.32,0:09:51.42,Default,,0000,0000,0000,,като приемаме нулевата хипотеза, е много ниска. Dialogue: 0,0:09:51.42,0:09:54.66,Default,,0000,0000,0000,,Това е много по-голямо от критичната ни F статистика Dialogue: 0,0:09:54.66,0:09:56.78,Default,,0000,0000,0000,,с ниво на значимост от 10%. Dialogue: 0,0:09:56.78,0:10:01.52,Default,,0000,0000,0000,,Поради това можем да отхвърлим нулевата хипотеза. Dialogue: 0,0:10:01.52,0:10:04.40,Default,,0000,0000,0000,,Което ни кара да повярваме, че вероятно Dialogue: 0,0:10:04.40,0:10:06.60,Default,,0000,0000,0000,,има разлика в средните стойности на генералната съвкупност. Dialogue: 0,0:10:06.60,0:10:09.60,Default,,0000,0000,0000,,Което ни казва, че има вероятност да има разлики в представянето Dialogue: 0,0:10:09.60,0:10:13.47,Default,,0000,0000,0000,,на един изпит, ако им дадем различни храни.