Wasifu Sifa Uchambuzi

Uchambuzi wa takwimu za nambari za nambari (takwimu zisizo za kigezo). Sheria ya kawaida ya usambazaji wa uwezekano

katika nadharia ya uwezekano na takwimu za hisabati, familia mbalimbali za parametric za usambazaji wa vigezo vya nambari za random huzingatiwa. Yaani, wanasoma familia za ugawaji wa kawaida, usio wa kawaida, wa kielelezo, ugawaji wa gamma, ugawaji wa Weibull-Gnedenko, n.k. Zote zinategemea kigezo kimoja, mbili au tatu. Kwa hivyo kwa maelezo kamili usambazaji, inatosha kujua au kukadiria nambari moja, mbili au tatu. Raha sana. Kwa hiyo, nadharia ya parametric inaendelezwa sana takwimu za hisabati, ambapo inachukuliwa kuwa ugawaji wa matokeo ya uchunguzi ni wa familia moja au nyingine ya parametric.

Kwa bahati mbaya, familia za parametric zipo tu katika mawazo ya waandishi wa vitabu juu ya nadharia ya uwezekano na takwimu za hisabati. KATIKA maisha halisi Hawapo hapa. Kwa hivyo, uchumi hutumia mbinu zisizo za kigezo, ambazo ugawaji wa matokeo ya uchunguzi unaweza kuwa na fomu ya kiholela.

Kwanza, kwa kutumia mfano wa usambazaji wa kawaida, tutajadili kwa undani zaidi kutowezekana matumizi ya vitendo familia za parametric kuelezea usambazaji wa data mahususi ya kiuchumi. Kisha tutachambua mbinu za parametric za kukataa uchunguzi wa nje na kuonyesha kutowezekana kwa matumizi ya vitendo ya idadi ya mbinu za takwimu za parametric na uwongo wa hitimisho ambalo wanaongoza. Kisha tutachambua njia zisizo za kigezo za kukadiria kujiamini kwa sifa kuu za anuwai za nambari za nasibu - matarajio ya hisabati, wastani, tofauti, kupotoka kwa kawaida, mgawo wa tofauti. Mhadhara utahitimishwa na mbinu za kupima usawa wa sampuli mbili, huru au zinazohusiana.

Usambazaji wa uchunguzi mara nyingi ni kawaida?

Katika mifano ya kiuchumi na kiuchumi-hisabati, inayotumika, haswa, katika kusoma na uboreshaji wa michakato ya uuzaji na usimamizi, usimamizi wa biashara na mkoa, usahihi na utulivu. michakato ya kiteknolojia, katika matatizo ya kuegemea, kuhakikisha usalama, ikiwa ni pamoja na usalama wa mazingira, utendaji wa vifaa vya kiufundi na vitu, na maendeleo ya chati za shirika, dhana na matokeo ya nadharia ya uwezekano na takwimu za hisabati hutumiwa mara nyingi. Katika kesi hii, familia moja au nyingine ya parametric ya usambazaji wa uwezekano hutumiwa mara nyingi. Maarufu sana usambazaji wa kawaida. Pia hutumika logarithmically usambazaji wa kawaida, usambazaji wa kielelezo, usambazaji wa gamma, usambazaji wa Weibull-Gnedenko, n.k.

Ni wazi, daima ni muhimu kuangalia mawasiliano ya mifano kwa ukweli. Maswali mawili yanatokea. Ugawaji halisi hutofautiana na ule unaotumiwa kwenye mfano? Je, tofauti hii inaathiri vipi hitimisho?

Hapo chini, kwa kutumia mfano wa usambazaji wa kawaida na mbinu kulingana na hilo kwa kukataa uchunguzi tofauti (wa nje), inaonyeshwa kuwa usambazaji halisi karibu kila mara hutofautiana na wale waliojumuishwa katika familia za parametric, na kupotoka kwa sasa kutoka kwa familia zilizopewa hufanya hitimisho lisilo sahihi. katika kesi inayozingatiwa, kuhusu kukataliwa kulingana na matumizi ya familia hizi.

Kuna sababu zozote za priori kudhani hali ya kawaida ya matokeo ya kipimo?

Wakati mwingine inasemekana kuwa katika kesi ambapo makosa ya kipimo (au nyingine thamani ya nasibu) imedhamiriwa kama matokeo ya hatua ya pamoja ya mambo mengi madogo, basi kwa mujibu wa Nadharia ya Kikomo cha Kati (CLT) ya nadharia ya uwezekano, thamani hii inakadiriwa vyema (katika usambazaji) na kutofautiana kwa kawaida kwa nasibu. Taarifa hii ni kweli ikiwa mambo madogo yanafanya kazi kwa kuongeza na bila ya kila mmoja. Ikiwa wanatenda kwa kuzidisha, basi kwa sababu ya CLT sawa ni muhimu kukadiria logarithmically. usambazaji wa kawaida. KATIKA matatizo yaliyotumika Kwa kawaida haiwezekani kuthibitisha nyongeza badala ya wingi wa hatua ya mambo madogo. Ikiwa utegemezi una tabia ya jumla, haijapunguzwa kuwa fomu ya kuongeza au ya kuzidisha, na pia hakuna sababu ya kukubali mifano ambayo inatoa ufafanuzi, Weibull-Gnedenko, gamma au usambazaji mwingine, basi hakuna chochote kinachojulikana kuhusu usambazaji wa kutofautiana kwa nasibu ya mwisho, isipokuwa kwa intra- mali ya hisabati kama vile kawaida.

Wakati wa kusindika data maalum, wakati mwingine inaaminika kuwa makosa ya kipimo yana usambazaji wa kawaida. Kwa dhana ya hali ya kawaida, mifano ya kitamaduni ya rejista, utawanyiko, uchambuzi wa sababu , mifano ya metrolojia ambayo inaendelea kupatikana katika nyaraka za udhibiti wa ndani na kiufundi na katika viwango vya kimataifa. Mifano ya kuhesabu viwango vya juu vinavyoweza kufikiwa vya sifa fulani zinazotumiwa katika muundo wa mifumo ili kuhakikisha usalama wa uendeshaji ni msingi wa dhana sawa. miundo ya kiuchumi, vifaa vya kiufundi na vitu. Hata hivyo misingi ya kinadharia hakuna dhana kama hiyo. Inahitajika kusoma usambazaji wa makosa kwa majaribio.

Je, matokeo ya majaribio yanaonyesha nini? Muhtasari uliotolewa katika monograph unapendekeza kwamba katika hali nyingi usambazaji wa makosa ya kipimo hutofautiana na kawaida. Kwa hiyo, katika Taasisi ya Uhandisi wa Mitambo na Umeme (Varna, Bulgaria), usambazaji wa makosa ya calibration kwenye mizani ya vyombo vya kupimia umeme vya analog ilisoma. Vifaa vilivyotengenezwa huko Czechoslovakia, USSR na Bulgaria vilisoma. Sheria ya usambazaji wa makosa iligeuka kuwa sawa. Ina msongamano

Data ilichanganuliwa kwenye vigezo vya mgawanyo halisi wa makosa 219 uliosomwa na waandishi tofauti, wakati wa kupima umeme na zisizo za umeme kiasi cha umeme aina mbalimbali za vifaa (vya umeme). Kutokana na utafiti huu, ikawa kwamba mgawanyo 111, i.e. takriban 50% ni ya darasa la usambazaji na msongamano

wapi parameter ya shahada; - parameter ya kuhama; - parameter ya kiwango; - kazi ya gamma kutoka kwa hoja;

Katika maabara hisabati iliyotumika Tartu chuo kikuu cha serikali Sampuli 2500 kutoka kwenye kumbukumbu ya data halisi ya takwimu zilichanganuliwa. Katika 92%, nadharia ya kawaida ilibidi kukataliwa.

Maelezo yaliyotolewa ya data ya majaribio yanaonyesha kuwa makosa ya kipimo katika hali nyingi huwa na usambazaji ambao hutofautiana na wa kawaida. Hii inamaanisha, haswa, kwamba matumizi mengi ya jaribio la Mwanafunzi, la kawaida uchambuzi wa kurudi nyuma na mbinu zingine za kitakwimu kulingana na nadharia ya kawaida, tukisema, sio sawa, kwani msingi wa hali ya kawaida ya ugawaji wa viambatisho vinavyolingana vya nasibu sio sahihi.

Kwa wazi, ili kuhalalisha au kuhalalisha mabadiliko katika mazoezi ya sasa ya uchambuzi wa takwimu za takwimu, ni muhimu kujifunza sifa za taratibu za uchambuzi wa data wakati unatumiwa "kinyume cha sheria". Utafiti wa taratibu za kukataliwa umeonyesha kuwa hazibadiliki sana kwa kupotoka kutoka kwa kawaida, na kwa hivyo siofaa kuzitumia kwa kuchakata data halisi (tazama hapa chini); kwa hivyo, haiwezi kubishaniwa kuwa utaratibu uliochaguliwa kiholela ni sugu kwa kupotoka kutoka kwa kawaida.

Wakati mwingine inapendekezwa kuangalia hali ya kawaida kabla ya kutumia, kwa mfano, mtihani wa Mwanafunzi wa homogeneity ya sampuli mbili. Ingawa kuna vigezo vingi vya hii, mtihani wa hali ya kawaida ni utaratibu ngumu zaidi na unaotumia wakati wa takwimu kuliko mtihani wa usawa (wote kwa kutumia takwimu za Mwanafunzi na kutumia. vipimo vya nonparametric) Ili kuanzisha hali ya kawaida kwa uhakika, inahitaji sana idadi kubwa uchunguzi. Kwa hivyo, ili kuhakikisha kuwa kazi ya usambazaji wa matokeo ya uchunguzi inatofautiana na ile ya kawaida kwa si zaidi ya 0.01 (kwa thamani yoyote ya hoja), uchunguzi wa 2500 unahitajika. Katika zaidi ya kiuchumi, kiufundi, matibabu na mengine utafiti uliotumika idadi ya uchunguzi ni ndogo sana. Hii ni kweli hasa kwa data inayotumika katika kusoma matatizo yanayohusiana na kuhakikisha utendakazi salama wa miundo ya kiuchumi na vifaa vya kiufundi.

Wakati mwingine hujaribu kutumia CLT kuleta usambazaji wa makosa karibu na kawaida, pamoja na in mpango wa kiteknolojia kifaa cha kupimia nyongeza maalum. Hebu tutathmini manufaa ya kipimo hiki. Wacha iwe huru iliyosambazwa kwa njia sawa tofauti na chaguo za kukokotoa za usambazaji vile kwamba Fikiria

Kiashiria cha ukaribu na hali ya kawaida inayotolewa na adder ni

Kukosekana kwa usawa sahihi katika uhusiano wa mwisho hufuata kutoka kwa makadirio ya usawa wa mara kwa mara katika Berry-Esseen uliopatikana katika kitabu, na wa kushoto unafuata kutoka kwa mfano kwenye monograph. Kwa sheria ya kawaida, kwa sare , kwa pointi mbili (hii ni ya chini kwa ). Kwa hivyo, ili kuhakikisha umbali (katika metri ya Kolmogorov) hadi usambazaji wa kawaida sio zaidi ya 0.01 kwa usambazaji "usiofanikiwa", angalau maneno yanahitajika, ambapo uwezekano wa kuwa katika seti tofauti. nambari za desimali na nambari fulani ya nafasi za desimali ni sawa na 0.

Kutoka kwa hapo juu inafuata kwamba matokeo ya kipimo na data ya takwimu kwa ujumla ina mali ambayo inasababisha ukweli kwamba inapaswa kuigwa na anuwai za nasibu zilizo na usambazaji zaidi au chini tofauti na zile za kawaida. Katika hali nyingi, ugawaji hutofautiana sana kutoka kwa kawaida; kwa wengine, usambazaji wa kawaida unaweza kuzingatiwa kama aina fulani ya makadirio, lakini hakuna mechi kamili. Hii ina maana ya haja ya kujifunza sifa za taratibu za takwimu za classical katika zisizo za classical mifano ya uwezekano(sawa na jinsi ilivyofanywa hapa chini kwa mtihani wa Mwanafunzi), na hitaji la kukuza uthabiti (kwa kuzingatia uwepo wa mikengeuko kutoka kwa hali ya kawaida) na isiyo ya kigezo, ikijumuisha taratibu zisizo na usambazaji, na utekelezaji wao mkubwa katika mazoezi. usindikaji wa takwimu data.

Mazingatio yaliyoachwa hapa kwa familia zingine za parametric husababisha hitimisho sawa. Matokeo yanaweza kutayarishwa kama ifuatavyo. Usambazaji wa data halisi karibu kamwe haumilikiwi na familia yoyote maalum. Ugawaji halisi daima hutofautiana na wale waliojumuishwa katika familia za parametric. Tofauti zinaweza kuwa kubwa au ndogo, lakini zipo kila wakati. Hebu jaribu kuelewa jinsi tofauti hizi ni muhimu kwa uchambuzi wa kiuchumi.

Usambazaji wa kawaida (usambazaji wa Gaussian) umekuwa na jukumu kuu katika nadharia ya uwezekano, kwani hutokea mara nyingi sana kama matokeo ya ushawishi wa mambo mengi, mchango wa yoyote ambayo ni kidogo. Kati kikomo nadharia(CPT), hupata programu katika karibu yote sayansi zilizotumika, kufanya kifaa cha takwimu kuwa zima. Hata hivyo, kuna matukio ya mara kwa mara wakati matumizi yake haiwezekani, na watafiti wanajaribu kwa kila njia iwezekanavyo kuandaa kufaa kwa matokeo kwa Gaussian. Sasa nitakuambia juu ya mbinu mbadala katika kesi ya sababu nyingi zinazoathiri usambazaji.

Historia fupi ya CPT. Wakati Newton alikuwa bado hai, Abraham de Moivre alithibitisha nadharia juu ya muunganisho wa idadi ya uchunguzi wa tukio lililowekwa katikati na la kawaida katika mfululizo. vipimo vya kujitegemea kwa usambazaji wa kawaida. Katika karne ya 19 na mapema ya 20, nadharia hii ilitumika kama kielelezo cha kisayansi cha jumla. Laplace alithibitisha kesi ya usambazaji sare, Poisson - nadharia ya ndani kwa kesi na uwezekano tofauti. Poincaré, Legendre na Gauss walitengeneza nadharia tajiri ya makosa ya uchunguzi na mbinu angalau mraba, kutegemea muunganisho wa makosa kwa usambazaji wa kawaida. Chebyshev alithibitisha nadharia yenye nguvu zaidi kwa jumla ya anuwai za nasibu, baada ya kukuza njia ya wakati. Lyapunov mnamo 1900, akitegemea Chebyshev na Markov, alithibitisha CLP katika hali yake ya sasa, lakini tu na uwepo wa wakati wa mpangilio wa tatu. Na mnamo 1934 Feller alikomesha, akionyesha kuwa uwepo wa wakati wa mpangilio wa pili ni muhimu na. hali ya kutosha.

CLT inaweza kutengenezwa kama ifuatavyo: ikiwa vigeu vya nasibu vinajitegemea, vinasambazwa sawasawa na vina tofauti isiyo na sifuri isiyo na kikomo, basi hesabu (zilizowekwa katikati na kusawazishwa) za vigeu hivi huungana na kuwa sheria ya kawaida. Ni kwa namna hii ambapo nadharia hii inafundishwa katika vyuo vikuu na mara nyingi hutumiwa na waangalizi na watafiti ambao si mtaalamu wa hisabati. Kuna ubaya gani? Kwa kweli, nadharia hiyo inatumika kikamilifu katika maeneo ambayo Gauss, Poincaré, Chebyshev na wasomi wengine wa karne ya 19 walifanya kazi, ambayo ni: nadharia ya makosa ya uchunguzi, fizikia ya takwimu, MNCs, masomo ya idadi ya watu na labda kitu kingine. Lakini wanasayansi ambao hawana uhalisi wa uvumbuzi wanajishughulisha na jumla na wanataka kutumia nadharia hii kwa kila kitu, au kuvuta tu usambazaji wa kawaida kwa masikio, ambapo hauwezi kuwepo. Ikiwa unataka mifano, ninayo.

Intelligence quotient IQ. Hapo awali inamaanisha kuwa akili ya watu kawaida husambazwa. Wanafanya mtihani ambao umeandaliwa mapema kwa njia ambayo uwezo wa ajabu hauzingatiwi, lakini huzingatiwa kando na mambo sawa ya kushiriki: mawazo ya kimantiki, muundo wa akili, uwezo wa computational, kufikiri kufikirika na kitu kingine. Uwezo wa kutatua shida ambazo haziwezi kufikiwa na wengi, au kufaulu mtihani kwa wakati wa haraka sana hauzingatiwi kwa njia yoyote, na kupita mtihani mapema huongeza matokeo (lakini sio akili) katika siku zijazo. Na kisha Wafilisti wanaamini kwamba "hakuna mtu anayeweza kuwa na akili mara mbili zaidi yao," "hebu tuchukue kutoka kwa watu wenye akili na tugawanye."

Mfano wa pili: mabadiliko katika viashiria vya kifedha. Kutafiti mabadiliko katika bei za hisa, nukuu za sarafu, na chaguzi za bidhaa zinahitaji matumizi ya takwimu za hisabati, na hasa hapa ni muhimu kutofanya makosa na aina ya usambazaji. Kesi kwa uhakika: mwaka 1997 Tuzo la Nobel katika uchumi ililipwa kwa kupendekeza mtindo wa Black-Scholes, kulingana na dhana ya usambazaji wa kawaida wa ukuaji wa soko la hisa (kinachojulikana kelele nyeupe). Wakati huo huo, waandishi walisema wazi kuwa mtindo huu unahitaji ufafanuzi, lakini yote ambayo watafiti zaidi waliamua kufanya ni kuongeza usambazaji wa Poisson kwa usambazaji wa kawaida. Hapa, kwa hakika, kutakuwa na usahihi wakati wa kusoma mfululizo wa muda mrefu, kwa kuwa usambazaji wa Poisson unakidhi CLT vizuri sana, na tayari kwa maneno 20 hauwezi kutofautishwa na usambazaji wa kawaida. Angalia picha hapa chini (na ni kutoka kwa gazeti kubwa sana la kiuchumi), inaonyesha kwamba, licha ya kabisa idadi kubwa ya uchunguzi na upotoshaji dhahiri, dhana inafanywa juu ya kawaida ya usambazaji.


Ni dhahiri sana kwamba usambazaji hautakuwa wa kawaida mshahara kati ya wakazi wa jiji, ukubwa wa faili kwenye diski, idadi ya miji na nchi.

Kile ambacho usambazaji kutoka kwa mifano hii unafanana ni uwepo wa kinachojulikana kama "mkia mzito," ambayo ni, maadili ambayo yapo mbali na wastani, na asymmetry inayoonekana, kawaida kulia. Wacha tuchunguze ni nini usambazaji mwingine, mbali na kawaida, unaweza kuwa. Wacha tuanze na Poisson iliyotajwa hapo awali: ina mkia, lakini tunataka sheria irudiwe kwa seti ya vikundi, ambayo kila moja inazingatiwa (hesabu saizi ya faili za biashara, mishahara kwa miji kadhaa) au kupunguzwa (kuongeza au kupunguza kiholela muda wa mfano Nyeusi - Scholes), kama uchunguzi unavyoonyesha, mikia na asymmetry hazipotei, lakini usambazaji wa Poisson, kulingana na CLP, unapaswa kuwa wa kawaida. Kwa sababu sawa, Erlang, beta, isiyo ya kawaida, na zingine zote zilizo na usambazaji wa utawanyiko hazifai. Kilichobaki ni kukata usambazaji wa Pareto, lakini haifai kwa sababu ya bahati mbaya ya hali hiyo. thamani ya chini, ambayo karibu kamwe haitokei wakati wa kuchanganua data ya sampuli.

Usambazaji ambao una mali muhimu upo na huitwa usambazaji thabiti. Historia yao pia inavutia sana, na nadharia kuu ilithibitishwa mwaka mmoja baada ya kazi ya Feller, mnamo 1935, kwa juhudi za pamoja. mwanahisabati wa Ufaransa Paul Levy na mwanahisabati wa Soviet NA MIMI. Khinchin. CLT ilifanywa kwa ujumla; hali ya kuwepo kwa mtawanyiko iliondolewa kutoka kwayo. Tofauti na kawaida, wala msongamano wala kazi ya usambazaji wa vigeuzo thabiti vya nasibu haionyeshwa (isipokuwa nadra, ambayo inajadiliwa hapa chini); ubadilishaji kinyume Msongamano wa usambazaji wa nne, lakini kuelewa kiini, hii inaweza isijulikane).
Kwa hivyo, nadharia: ikiwa anuwai za nasibu zinajitegemea na zinasambazwa sawasawa, basi hesabu za anuwai hizi hubadilika kuwa sheria thabiti.

Sasa ufafanuzi. Thamani ya nasibu X itakuwa dhabiti ikiwa na tu ikiwa logariti ya utendaji wake wa tabia inawakilishwa katika fomu:

Wapi.

Kwa kweli, hakuna kitu ngumu sana hapa, unahitaji tu kueleza maana ya vigezo vinne. Vigezo sigma na mu ni mizani na suluhu ya kawaida, kama ilivyo katika usambazaji wa kawaida, mu itakuwa sawa na matarajio ya hisabati, ikiwa ipo, na ipo wakati alfa ni kubwa kuliko moja. Kigezo cha beta ni asymmetry; ikiwa ni sawa na sifuri, usambazaji ni ulinganifu. Lakini alfa ni parameta ya tabia, inaashiria ni mpangilio gani wa ukubwa wa wakati wa wingi upo, karibu na mbili, zaidi usambazaji ni sawa na kawaida, wakati sawa na mbili usambazaji unakuwa wa kawaida, na tu katika kesi hii. ina wakati wa maagizo makubwa, pia katika kesi ya usambazaji wa kawaida, asymmetry hupungua. Katika kesi wakati alpha ni sawa na moja na beta ni sifuri, usambazaji wa Cauchy unapatikana, na katika kesi wakati alpha ni sawa na nusu na beta ni sawa na moja, usambazaji wa Lévy unapatikana, katika hali nyingine hakuna uwakilishi. katika quadratures kwa usambazaji wa msongamano wa kiasi hicho.
Katika karne ya 20 ilitengenezwa nadharia tajiri idadi na michakato thabiti (inayojulikana kama michakato ya Ushuru), unganisho wao na viambatanisho vya sehemu huonyeshwa; njia mbalimbali parameterization na modeling, vigezo vilikadiriwa kwa njia kadhaa na uthabiti na uthabiti wa makadirio ulionyeshwa. Angalia picha, inaonyesha mwelekeo ulioiga wa mchakato wa Ushuru na kipande kilichopanuliwa mara 15.


Ilikuwa wakati wa kusoma michakato kama hii na matumizi yao katika kifedha ambapo Benoit Mandelbrot alikuja na fractals. Walakini, haikuwa nzuri kila mahali. Nusu ya pili ya karne ya 20 ilipita chini ya mwelekeo wa jumla wa sayansi iliyotumika na ya cybernetic, na hii ilimaanisha shida ya hisabati safi, kila mtu alitaka kutoa, lakini hakutaka kufikiria, wanabinadamu na uandishi wao wa habari walichukua nyanja za hesabu. Mfano: kitabu "Fifty Entertaining Probabilistic Probilistic Problems with Solutions" na American Mosteller, kazi Na. 11:


Suluhisho la mwandishi kwa shida hii ni kushindwa kwa akili ya kawaida:

Hali ni sawa na tatizo la 25, ambapo majibu MATATU kinzani yanatolewa.

Lakini wacha turudi kwa usambazaji thabiti. Katika nakala iliyobaki nitajaribu kuonyesha kuwa haipaswi kuwa na shida za ziada wakati wa kufanya kazi nao. Yaani, kuna namba na mbinu za takwimu, hukuruhusu kukadiria vigezo, kuhesabu kazi ya usambazaji na kuigiza, yaani, fanya kazi kwa njia sawa na usambazaji mwingine wowote.

Uundaji wa vigeu vya nasibu thabiti. Kwa kuwa kila kitu kinasomwa kwa kulinganisha, kwanza nitakumbuka njia inayofaa zaidi, kutoka kwa maoni ya hesabu, njia ya kutoa thamani ya kawaida (njia ya Box-Muller): ikiwa ni vijiti vya kimsingi vya nasibu (vimesambazwa kwa usawa kwenye )