Kur klaida?

Čia matematika, šio semestro kursas.  Sprendžiant vieną uždavinį (Nr. 2 iš e-pratybų) dviem būdais (ar tikrai tai tas pats uždavinys?), gaunami labai skirtingi rezultatai. Už tai, kad studentai suras klaidą, paskyriau DIDELĘ premiją! Vienas tikisi klaidą suradęs (tekstas mėlynu šriftu). O aš manau, kad jis tik keistai „sukryžmino“ tuos du sprendimus…

*

Padėkite išsiaiškinti!

Štai tas uždavinys ir jo vienas sprendimas:

Štai mano pateikta teorinė dalis ir to (o gal ne to?) uždavinio kitas sprendimas:

O štai studento paraiška gauti premiją:

Dabar reikia, labai reikia, jūsų atidaus žvilgsnio ir komentarų!

Atsakymai

Burgis, 2011-04-21 15:56:59

Reitinguokite tokią studijų formą…

įdomu, 2011-04-21 18:25:31

Nežinau kas ta funkcija FI ir kaip skaičiuojama jos reikšmė.

O kas matosi iš studento sprendimo.. Studentas parodė, kad jeigu antrame sprendime tam tikroje vietoje būtų visai kitas skaičius, tada sprendimas gautųsi. Bet kodėl būtent toks skaičius turi būti ir iš kur jis antruoju sprendimu turėtų išdygti, bent man liko neaišku. Galbūt aiškiau tiems kas žino kas ta FI.

O šiaip studentas užsiima spekuliacija: į pirmo būdo sprendimą trumpam įrašė antro būdo formules, tada tas antro būdo formules išėmė ir toliau tęsė pirmo būdo sprendimą. Pradžioje užrašė sąlygos duomenų, tada pirmo būdo formulę, o visą sekantį tekstą galima laisvai išmesti iki tų 1) 2) 3), nes tie 1) 2) 3) tiesiog naudoja tą pradžioje užrašytą pirmo būdo formulę.

Dar yra netikslumų sprendime. Ženklas “daugiau lygu” staiga pavirto lygybe. Santykis k/n pavirto į m/n (galbūt tai tas pats, tačiau reikėtų išaiškinimo ar(/kodėl) k galima pakeisti į m, o gal čia visai skirtingi dydžiai).

Beje, vadovėliniame pirmo būdo sprendime man dar neaišku ar pagrįstas ženklo “daugiau lygu” naudojimas. Pradinė sąlyga, kaip suprantu, rašo kad P(blabla) >= 0.95. Tada sprendime parašoma kad P(blabla) >= chmchm, o tada iš kažkur gauna kad P(blabla) >= chmchm >= 0.95.

Tiek pasikabinėjau prie detalių pats nespręsdamas ir nesigilindamas į esmę, nesiaiškindamas kas tie Fi, k ir m. Bet gal vis į naudą tiems kas norės gilintis 🙂

Manfredas, 2011-04-21 18:40:15

Iš akies užmetimo – pirmas sprendimas (su Čebyševo nelygybe) teisingas. Antram “sprendime” – centrinės ribos teorema nepriklausomų atsitiktinių dydžių sumos vidurkį aproksimuoja į normaliąją distribuciją tik ribiškai; išpešt normalųjį skirstinį iš 3000 detalių – drąsoka 🙂

Burgis, 2011-04-21 19:09:37

Įdomu: labai nebloga analizė!

Manfredui: Bernulio DSD ir Laplaso teorema – ne mano išradimas… Ir toks uždavinio sprendimo būdas – klasika.

Pentium100, 2011-04-21 21:12:38

Geras skeneris – nuskenavo tiesiai per tą geltoną lapelį pavardei uždengt.

Burgis, 2011-04-21 21:23:38

Anokia čia paslaptis… Galiu tik pagirti tą studentą.

Laurynas, 2011-04-22 00:07:57

Čebyševo nelygybė yra ganėtinai silpna ir lygybės sąlyga praktiškai niekada netenkinama. Todėl su n=18000 detalių, skaičiuojama tikimybė greičiausiai yra žymiai didesnė nei norima 0,95 reikšmė. Tiesiog šis metodas garantuoja apatinę ribą. Nesu susipažinęs su Laplaso integraline teorema, bet šis rezultatas atrodo gerokai stipresnis nei Čebyševo nelygybė (spėju, kad jis remiasi centinės ribos teorema), tad ir tikimybė apskaičiuojama tiksliau, kas turi įtakos detalių kiekiui. Žinoma reiktų atsargiau įvertinti tikimybės paklaidą, nes visgi naudojamas rezultatas, kur n tolsta į begalybę. Bet kokiu atveju nereikėtų tikėtis gauti tą patį atsakymą. Tad klaidos ko gero ir nėra.

Ps. pastaba studentui: negalima traukti šaknies iš skaičiaus, po to gautą iracionalų rezultatą suapvalinti ir galiausiai kelti kvadratu. Tiesiog negalima! 😉

Manfredas, 2011-04-22 03:21:50

Na, gerai… Antras šūvis: Čebyševo nelygybė atsitiktiniam dydžiui X galioja nepriklausomai nuo jo pasiskirstymo, dėl to “grubesnė” nei antras variantas (žinantis apie binominį pasiskirstymą).

Kitaip tariant, tiesa, kad nusipirkus 18 000 detalių ieškoma tikimybė ne mažesnė nei 0.95, bet anot Bernulio DSD būtų užtekę ir apie 3 500.

O anot informatiko, bandančio sapaliot apie matematiką – gal užtektų ir dar mažiau: http://bit.ly/e29uB4 ir http://ideone.com/SCYDo.

Tomas Juskevicius, 2011-04-22 06:53:54

Abu variantai per silpni ir stai priezastis: Cebysevo nelygybe yra optimali vienam atsitiktiniam dydziui, kuris turi du atomus ir reikiamus momentus. O kai imame suma, ivertis turi gerokai pageret (juk zinom, kad suma padalinta is skaiciaus demenu silpnai konverguoja i konstanta – vidurki). Bet cia antraeile priezastis. Reali priezastis – dirbame su apreztai dydziais, o tokiem dydziam sumu uodegu tikimybes, t.y. P{(X_1+…+X_n)/n>x) gesta greiciau nei eksponentiskai nuo x. Siulau sitoj vietoj naudot gana sena bet cia labiausiai tinkama rezultata – Hoeffding nelygybe (turetu patikti B. Burgiui, jei uzmes aki, ka nelygybe ta sako) ir ja galima paziureti cia: http://en.wikipedia.org/wiki/Hoeffding_inequality

Sita nelygybe yra garantuotai ispildoma visiems apreztiems skirstiniams. Beda su normaliaja aproksimacija yra ta, kad reikia naudotis klaidu tikimybiu iverciais kaip gerai zinomoj Berry-Esseen teoremoj. Dar galima butu pasakyti – o kodel ne Puasonu aproksimuoti tokia suma, kodel normalusis cia geriau? Tai nera akivaizdu. Todel siulau ta Hoeffding nelygybe, garantuoju kad ji duos geresnius rezultatus visais atvejais.

Burgis, 2011-04-22 08:35:59

Oho! Tai bent! Perskaitęs Lauryno ir Tomo komentarus, noriu pasakyti taip, kaip pasakė Izaokas Niutonas (nors nesu garantuotas…): „Aš mačiau toliau ir aiškiau, nes stovėjau ant milžinų pečių.“ Visiems studentams, kurie pakomentuotų kaip Tomas, neabejodamas parašyčiau po 10, nepriklausomai nuo to, KĄ jie pakomentuotų. Žaviuosi!

Nors į klausimą, atrodo, tiksliau atsakė Laurynas. Ir mano tokia prielaida: Čebyšovo nelygybė pernelyg „apsidraudžia“, o Bernulio DSD labiau priartėja prie realybės. Bet tai – tik prielaida… Paieškos tęsiasi.

Manfredas, 2011-04-22 12:51:09

Pastaba sau – atnaujint puslapį prieš rašant. Laurynas parašė tą patį trim valandom anksčiau… 🙂

Ačiū už Hoeffding nelygybę, Tomai!

Laurynas, 2011-04-22 14:38:47

Naudojant Heoffding nelygybę šiuo konkrečiu atveju gaunama silpnesnė riba nei duoda Čebyševas, t.y. n > (ln(40)*10^4)/2 ~ 18 445. Ko gero antrajame sprendime naudojama apytikslė formulė, turi paklaidą, kuri yra ganėtinai reikšminga šio uždavinio kontekste, dėl to gaunamas labai netikslus atsakymas. Žinoma reiktų tiksliai įvertinti tą paklaidą.

Tadas Varanavičius, 2011-04-22 15:49:07

Nors tai ir ne uždavinio “kur klaida?” sprendimas, bet kaip rašė Manfredas, visada galima mėginti skaitmeniškai integruoti skirstinį.

Anksčiau pateiktas (http://bit.ly/e29uB4) sumavimas, mano galva, nėra teisingas.

Reikėtų sumuoti taip:

http://bit.ly/hGqvif

Taigi panašu, jog tikslus atsakymas yra 3400, o antrasis sprendimas duoda pakankamai artimą vertę.

Manfredas, 2011-04-22 16:08:42

Įdomumo dėlei – pagal Bennett’o nelygybę (http://bit.ly/i9JMeG) riba gaunasi ~6886. Vistiek gan toli nuo empirinės ribos ~2400 (praeito post’o antroje nurodoje, http://ideone.com/SCYDo).

Et, kad laiko daugiau būtų… Įdomus uždavinys!

Tomas Juskevicius, 2011-04-23 00:32:00

Aha, idomu, Hoeffding’as nedave geresnio ivercio nei Cebysevas, tai nutinka tik tada, kai epsilon mazas (taip ir yra, jis 0.01). Kai jau epsilon didesnis pradeda stipriai skirtis ir laimi Hoeffding’as – eile ivercio is virsaus kita, tiek nuo epsilon, tiek nuo n.

B.Burgiui: Dekui Jums uz gera ivertinima 🙂 Mane, kai dar buvau VU matematikos fakultete kazkaip maziau jie mylejo, ypac uz kritika ju tvarku…

Manfredui: Prasom!

Pasiulymas tiem, kurie dar galvoja apie uzdavini: Kai epsilon labai mazas, tikriausiai geriausiai turetu veikti ivertis tikimybei, kuris kuo mazesni momenta sumos naudoja (Hoeffdingas naudoja eksponentini, Cebysevas antra), tad gal butu idomu suskaiciuoti sumos absoliutini momenta, t.y. E|X|, kur X yra musu suma Bernulio dydziu su atimtu vidurkiu np. Tuomet P{|X|>epsilon}<E|X|/x. Tikriausiai ta momenta bus nelengva suskaiciuoti, uztektu ivertinti. Jei idomu tai kam, tai pirma pasiulyciau E|X| laikyti funkcija nuo p ir parodyti, kad ta funkcija igyja didziausia reiksme kai p=1/2 (siek tiek viska sugrubinsime) ir gauta istraika statyti i nelygybe. Gal jau ir su tiek gausis geresnis n nei su Cebysevu. Jei ne, kazkaip reikia gudriau vertinti E|X| kaip funkcija nuo n ir p (pirmu atveju paemem blogiausia atveji pagal p, o cia jau p turetu likti ivertyje ir statytumem pabaigoje p=0.1).

Gedas, 2011-04-28 15:50:57

Sunerimau, nes niekaip nepavyksta suprasti uzdavinio salygos (i uzdavini nebandziau gilintis). As cia toks vienas isskirtinis? Tiesiog gramatiskai nesupratau. “… daznio absoliutus nuokrypis nuo _tikimybes_ nevirsys …” – kas cia per tikimybe isdygsta ir pranyksta?