Wasifu Sifa Uchambuzi

Njia za uchambuzi wa urejeshaji. Uchanganuzi wa urejeshi ni njia ya takwimu ya kusoma utegemezi wa anuwai ya nasibu kwenye anuwai

Ikiwa kuna uwiano kati ya kipengele na sifa za utendaji, madaktari mara nyingi wanapaswa kutambua kwa kiasi gani thamani ya sifa moja inaweza kubadilika wakati nyingine inabadilika kwa kitengo cha kipimo kinachokubalika kwa ujumla au kilichoanzishwa na mtafiti mwenyewe.

Kwa mfano, uzito wa mwili wa watoto wa shule ya daraja la 1 (wasichana au wavulana) utabadilikaje ikiwa urefu wao huongezeka kwa cm 1? Kwa madhumuni haya, njia ya uchambuzi wa regression hutumiwa.

Mara nyingi, njia ya uchambuzi wa urejeshi hutumiwa kukuza mizani ya kawaida na viwango vya ukuaji wa mwili.

  1. Ufafanuzi wa Kurudi nyuma. Urejeshaji ni chaguo la kukokotoa ambalo huruhusu, kutoka kwa thamani ya wastani ya sifa moja, kubainisha thamani ya wastani ya sifa nyingine ambayo inahusiana na ya kwanza.

    Kwa kusudi hili, mgawo wa regression na idadi ya vigezo vingine hutumiwa. Kwa mfano, unaweza kuhesabu idadi ya homa kwa wastani kwa maadili fulani ya wastani wa joto la hewa kila mwezi katika kipindi cha vuli-baridi.

  2. Uamuzi wa mgawo wa urejeshaji. Mgawo wa urejeshaji ni thamani kamili ambayo, kwa wastani, thamani ya sifa moja hubadilika wakati sifa nyingine inayohusishwa inabadilika na kitengo maalum cha kipimo.
  3. Fomula ya mgawo wa urejeshaji. R y/x = r xy x (σ y / σ x)
    ambapo R у/х - mgawo wa regression;
    r xy - mgawo wa uwiano kati ya sifa x na y;
    (σ y na σ x) - upungufu wa kawaida wa sifa x na y.

    Kwa mfano wetu;
    σ x = 4.6 (kupotoka kwa kawaida kwa joto la hewa katika kipindi cha vuli-baridi;
    σ y = 8.65 (kupotoka kwa kawaida kwa idadi ya magonjwa ya kuambukiza na ya baridi).
    Kwa hivyo, R y/x ndio mgawo wa rejista.
    R у/х = -0.96 x (4.6 / 8.65) = 1.8, i.e. Wakati wastani wa joto la kila mwezi la hewa (x) hupungua kwa digrii 1, wastani wa idadi ya magonjwa ya kuambukiza na baridi (y) katika kipindi cha vuli-baridi itabadilika kwa kesi 1.8.

  4. Mlinganyo wa kurudi nyuma. y = M y + R y/x (x - M x)
    ambapo y ni thamani ya wastani ya sifa, ambayo inapaswa kubainishwa wakati thamani ya wastani ya sifa nyingine inabadilika (x);
    x ni thamani ya wastani inayojulikana ya sifa nyingine;
    R y/x - mgawo wa kurejesha;
    M x, M y - thamani za wastani zinazojulikana za sifa x na y.

    Kwa mfano, idadi ya wastani ya magonjwa ya kuambukiza na baridi (y) inaweza kuamua bila vipimo maalum kwa thamani yoyote ya wastani ya wastani wa joto la kila mwezi la hewa (x). Kwa hiyo, ikiwa x = - 9 °, R y / x = 1.8 magonjwa, M x = -7 °, M y = magonjwa 20, basi y = 20 + 1.8 x (9-7) = 20 + 3 .6 = 23.6 magonjwa.
    Mlinganyo huu unatumika katika kesi ya uhusiano wa mstari kati ya sifa mbili (x na y).

  5. Madhumuni ya Mlinganyo wa Urejeshaji. Mlinganyo wa urejeshi hutumika kuunda laini ya urejeshi. Mwisho hufanya iwezekanavyo, bila vipimo maalum, kuamua thamani yoyote ya wastani (y) ya sifa moja ikiwa thamani (x) ya tabia nyingine inabadilika. Kulingana na data hizi, grafu inaundwa - mstari wa kurudi nyuma, ambayo inaweza kutumika kuamua idadi ya wastani ya homa kwa thamani yoyote ya wastani wa joto la kila mwezi ndani ya safu kati ya maadili yaliyohesabiwa ya idadi ya homa.
  6. Regression Sigma (formula).
    ambapo σ Rу/х - sigma (kupotoka kwa kawaida) ya regression;
    σ y - kupotoka kwa kiwango cha tabia y;
    r xy - mgawo wa uwiano kati ya sifa x na y.

    Kwa hivyo, ikiwa σ y - kupotoka kwa kiwango cha idadi ya homa = 8.65; r xy - mgawo wa uwiano kati ya idadi ya homa (y) na wastani wa joto la kila mwezi la hewa katika kipindi cha vuli-baridi (x) ni sawa na - 0.96, basi

  7. Mgawo wa sigma ya regression. Hutoa maelezo ya kipimo cha utofauti wa sifa inayotokana (y).

    Kwa mfano, ni sifa ya utofauti wa idadi ya homa kwa thamani fulani ya wastani wa joto la hewa kila mwezi katika kipindi cha vuli-baridi. Kwa hivyo, idadi ya wastani ya baridi kwenye joto la hewa x 1 = -6 ° inaweza kuanzia magonjwa 15.78 hadi magonjwa 20.62.
    Katika x 2 = -9 °, idadi ya wastani ya baridi inaweza kuanzia magonjwa 21.18 hadi magonjwa 26.02, nk.

    Regression sigma hutumiwa kuunda kiwango cha rejista, ambayo inaonyesha kupotoka kwa maadili ya tabia inayotokana na thamani yake ya wastani iliyopangwa kwenye mstari wa rejista.

  8. Data inahitajika ili kukokotoa na kupanga kiwango cha urejeshaji
    • mgawo wa regression - R у/х;
    • equation regression - y = M y + R y/x (x-M x);
    • sigma ya regression - σ Rx/y
  9. Mlolongo wa hesabu na uwakilishi wa picha wa kiwango cha urejeshaji.
    • amua mgawo wa urejeshaji kwa kutumia fomula (tazama aya ya 3). Kwa mfano, ni muhimu kuamua ni kiasi gani cha uzito wa mwili kitabadilika kwa wastani (katika umri fulani kulingana na jinsia) ikiwa urefu wa wastani unabadilika kwa 1 cm.
    • kwa kutumia formula ya equation ya regression (angalia hatua ya 4), tambua nini, kwa mfano, uzito wa mwili utakuwa wastani (y, y 2, y 3 ...) * kwa thamani fulani ya urefu (x, x 2, x 3 . ..).
      ________________
      * Thamani ya "y" inapaswa kuhesabiwa kwa angalau thamani tatu zinazojulikana za "x".

      Wakati huo huo, maadili ya wastani ya uzito wa mwili na urefu (M x, na M y) kwa umri fulani na jinsia hujulikana.

    • kuhesabu sigma ya rejista, kujua maadili yanayolingana ya σ y na r xy na kubadilisha maadili yao kwenye fomula (tazama aya ya 6).
    • kulingana na maadili yanayojulikana x 1, x 2, x 3 na maadili ya wastani yanayolingana y 1, y 2 y 3, na vile vile ndogo (y - σ rу/х) na kubwa zaidi (y + σ rу /х) maadili (y) huunda kiwango cha rejista.

      Ili kuwakilisha kielelezo kiwango cha urejeshi, maadili x, x2, x3 (mhimili wa kuratibu) huwekwa alama ya kwanza kwenye grafu, i.e. mstari wa regression hujengwa, kwa mfano, utegemezi wa uzito wa mwili (y) kwa urefu (x).

      Kisha, katika pointi zinazofanana 1, y 2, y 3, maadili ya nambari ya sigma ya regression yanajulikana, i.e. kwenye grafu pata thamani ndogo na kubwa zaidi za 1, y 2, y 3.

  10. Utumiaji wa kivitendo wa kiwango cha rejista. Mizani na viwango vya kawaida vinatengenezwa, haswa kwa ukuaji wa mwili. Kutumia kiwango cha kawaida, unaweza kutoa tathmini ya mtu binafsi ya ukuaji wa watoto. Katika kesi hii, ukuaji wa mwili hupimwa kuwa sawa ikiwa, kwa mfano, kwa urefu fulani, uzani wa mwili wa mtoto uko ndani ya sigma moja ya kurudi nyuma kwa kitengo cha wastani kilichohesabiwa cha uzani wa mwili - (y) kwa urefu fulani (x) ( y ± 1 σ Ry/x).

    Ukuaji wa kimwili unachukuliwa kuwa usio na usawa katika suala la uzito wa mwili ikiwa uzito wa mwili wa mtoto kwa urefu fulani uko ndani ya sigma ya pili ya kurudi nyuma: (y ± 2 σ Ry/x)

    Ukuaji wa mwili hautakuwa na usawa kwa sababu ya uzito wa ziada na wa kutosha wa mwili ikiwa uzito wa mwili kwa urefu fulani uko ndani ya sigma ya tatu ya regression (y ± 3 σ Ry/x).

Kulingana na matokeo ya utafiti wa takwimu juu ya ukuaji wa mwili wa wavulana wa miaka 5, inajulikana kuwa urefu wao wa wastani (x) ni 109 cm, na uzito wa wastani wa mwili (y) ni kilo 19. Mgawo wa uwiano kati ya urefu na uzito wa mwili ni +0.9, tofauti za kawaida zinawasilishwa kwenye jedwali.

Inahitajika:

  • kuhesabu mgawo wa kurejesha;
  • kwa kutumia usawa wa regression, tambua uzito wa mwili unaotarajiwa wa wavulana wa umri wa miaka 5 utakuwa na urefu sawa na x1 = 100 cm, x2 = 110 cm, x3 = 120 cm;
  • hesabu sigma ya urejeshi, jenga kiwango cha rejista, na uwasilishe matokeo ya suluhisho lake kwa michoro;
  • fanya hitimisho linalofaa.

Masharti ya shida na matokeo ya suluhisho lake yanawasilishwa kwenye jedwali la muhtasari.

Jedwali 1

Masharti ya tatizo Matokeo ya kutatua tatizo
mlinganyo wa kurudi nyuma sigma ya regression kipimo cha regression (uzito wa mwili unaotarajiwa (katika kilo))
M σ r xy R y/x X U σ R x/y y - σ Rу/х y + σ Rу/х
1 2 3 4 5 6 7 8 9 10
Urefu (x) sentimita 109 ± 4.4cm +0,9 0,16 100cm 17.56 kg ± 0.35 kg 17.21 kg Kilo 17.91
Uzito wa mwili (y) 19 kg ± 0.8 kg 110 cm 19.16 kg 18.81 kg 19.51 kg
120 cm 20.76 kg 20.41 kg 21.11 kg

Suluhisho.

Hitimisho. Kwa hivyo, kiwango cha rejista ndani ya mipaka ya maadili yaliyohesabiwa ya uzito wa mwili hufanya iwezekanavyo kuamua kwa thamani nyingine yoyote ya urefu au kutathmini ukuaji wa mtu binafsi wa mtoto. Ili kufanya hivyo, kurejesha perpendicular kwa mstari wa regression.

  1. Vlasov V.V. Epidemiolojia. - M.: GEOTAR-MED, 2004. - 464 p.
  2. Lisitsyn Yu.P. Afya ya umma na huduma ya afya. Kitabu cha maandishi kwa vyuo vikuu. - M.: GEOTAR-MED, 2007. - 512 p.
  3. Daktari V.A., Yuryev V.K. Kozi ya mihadhara juu ya afya ya umma na huduma ya afya: Sehemu ya 1. Afya ya umma. - M.: Dawa, 2003. - 368 p.
  4. Minyaev V.A., Vishnyakov N.I. na wengine.. Shirika la matibabu ya kijamii na afya (Mwongozo katika juzuu 2). - St. Petersburg, 1998. -528 p.
  5. Kucherenko V.Z., Agarkov N.M. na wengine Usafi wa kijamii na shirika la afya (Mafunzo) - Moscow, 2000. - 432 p.
  6. S. Glanz. Takwimu za matibabu na kibaolojia. Tafsiri kutoka Kiingereza - M., Praktika, 1998. - 459 p.

A) Uchanganuzi wa picha wa urejeshaji rahisi wa mstari.

Mlinganyo rahisi wa urejeshaji wa mstari y=a+bx. Ikiwa kuna uunganisho kati ya anuwai za nasibu Y na X, basi thamani y = ý + ,

ambapo ý ni thamani ya kinadharia ya y iliyopatikana kutoka kwa mlinganyo ý = f(x),

 - kosa la kupotoka kwa mlinganyo wa kinadharia ý kutoka kwa data halisi (ya majaribio).

Mlinganyo wa utegemezi wa thamani ya wastani ý kwenye x, yaani, ý = f(x), inaitwa mlinganyo wa regression. Uchambuzi wa kurudi nyuma una hatua nne:

1) kuweka tatizo na kuanzisha sababu za uhusiano.

2) kizuizi cha kitu cha utafiti, ukusanyaji wa habari za takwimu.

3) uteuzi wa mlingano wa kuunganisha kulingana na uchanganuzi na asili ya data iliyokusanywa.

4) hesabu ya maadili ya namba, sifa za uhusiano wa uwiano.

Ikiwa vigezo viwili vinahusiana kwa njia ambayo mabadiliko katika kutofautiana moja yanalingana na mabadiliko ya utaratibu katika kutofautiana nyingine, basi uchambuzi wa regression hutumiwa kukadiria na kuchagua equation kwa uhusiano kati yao ikiwa vigezo hivi vinajulikana. Tofauti na uchanganuzi wa urejeshi, uchanganuzi wa uunganisho hutumiwa kuchanganua ukaribu wa uhusiano kati ya X na Y.

Wacha tuzingatie kupata mstari ulionyooka katika uchanganuzi wa rejista:

Mlingano wa urejeshaji wa kinadharia.

Neno "regression rahisi" linaonyesha kuwa thamani ya kigezo kimoja inakadiriwa kulingana na maarifa kuhusu kigezo kingine. Tofauti na urekebishaji rahisi wa multivariate, hutumiwa kukadiria kutofautisha kulingana na maarifa ya anuwai mbili, tatu au zaidi. Wacha tuangalie uchanganuzi wa picha wa urejeshaji rahisi wa mstari.

Tuseme kuna matokeo ya vipimo vya uchunguzi juu ya ajira ya awali na tija ya kazi.

Matokeo ya uteuzi (alama 100), x

Tija (alama 20), y

Kwa kupanga pointi kwenye grafu, tunapata mchoro wa kutawanya (shamba). Tunaitumia kuchambua matokeo ya vipimo vya uteuzi na tija ya kazi.

Kwa kutumia scatterplot, hebu tuchambue mstari wa rejista. Katika uchanganuzi wa rejista, angalau vijiti viwili hubainishwa kila wakati. Mabadiliko ya utaratibu katika kutofautiana moja yanahusishwa na mabadiliko ya mwingine. lengo la msingi uchambuzi wa kurudi nyuma inajumuisha kukadiria thamani ya kigezo kimoja ikiwa thamani ya kigezo kingine inajulikana. Kwa kazi kamili, tathmini ya tija ya kazi ni muhimu.

Tofauti ya kujitegemea katika uchanganuzi wa urejeshi, kiasi ambacho hutumika kama msingi wa kuchanganua kigezo kingine. Katika kesi hii, haya ni matokeo ya vipimo vya uteuzi (pamoja na mhimili wa X).

Tofauti tegemezi inaitwa thamani iliyokadiriwa (pamoja na mhimili wa Y). Katika uchanganuzi wa rejista, kunaweza kuwa na kigezo kimoja tu tegemezi na zaidi ya kigezo kimoja huru.

Kwa uchanganuzi rahisi wa urejeshi, utegemezi unaweza kuwakilishwa katika mfumo wa kuratibu mbili (x na y), na mhimili wa X ukiwa kigezo huru na mhimili wa Y ukiwa kigezo tegemezi. Tunapanga sehemu za makutano ili jozi ya maadili iwakilishwe kwenye grafu. Ratiba inaitwa kiwanja. Ujenzi wake ni hatua ya pili ya uchanganuzi wa rejista, kwani ya kwanza ni uteuzi wa maadili yaliyochambuliwa na ukusanyaji wa data ya sampuli. Kwa hivyo, uchambuzi wa regression hutumiwa kwa uchambuzi wa takwimu. Uhusiano kati ya data ya sampuli kwenye chati ni ya mstari.

Ili kukadiria ukubwa wa kigezo y kulingana na kigezo cha x, ni muhimu kubainisha nafasi ya mstari ambayo inawakilisha vyema uhusiano kati ya x na y kulingana na eneo la pointi kwenye eneo la kutawanya. Katika mfano wetu, hii ni uchambuzi wa utendaji. Mstari uliochorwa kupitia sehemu za kutawanya - mstari wa kurudi nyuma. Njia moja ya kuunda laini ya rejista kulingana na uzoefu wa kuona ni njia ya bure. Mstari wetu wa kurudi nyuma unaweza kutumika kubainisha tija ya kazi. Wakati wa kupata equation ya mstari wa regression

Mtihani wa mraba mdogo hutumiwa mara nyingi. Mstari unaofaa zaidi ni ule ambapo jumla ya kupotoka kwa mraba ni ndogo

Mlinganyo wa hisabati wa mstari wa ukuaji unawakilisha sheria ya ukuaji katika maendeleo ya hesabu:

katika = AbX.

Y = A + bX- equation iliyotolewa na parameta moja ni aina rahisi zaidi ya equation ya kuunganisha. Inakubalika kwa maadili ya wastani. Ili kuelezea kwa usahihi uhusiano kati ya X Na katika, mgawo wa ziada wa uwiano huletwa b, ambayo inaonyesha mteremko wa mstari wa regression.

B) Ujenzi wa mstari wa urejeshaji wa kinadharia.

Mchakato wa kuipata ni pamoja na kuchagua na kuhalalisha aina ya curve na vigezo vya kuhesabu. A, b, Na na kadhalika. Mchakato wa ujenzi unaitwa kusawazisha, na usambazaji wa curves unaotolewa na mkeka. uchambuzi, tofauti. Mara nyingi, katika shida za kiuchumi, familia ya curves hutumiwa, hesabu ambazo zinaonyeshwa na polynomials ya nguvu chanya kamili.

1)
- equation ya mstari wa moja kwa moja;

2)
- equation ya hyperbola;

3)
- equation ya parabola;

ambapo ý ni vielelezo vya mstari wa urejeleaji wa kinadharia.

Baada ya kuchagua aina ya equation, unahitaji kupata vigezo ambavyo equation hii inategemea. Kwa mfano, asili ya eneo la pointi katika uwanja wa kueneza ilionyesha kuwa mstari wa urejeshaji wa kinadharia ni sawa.

Mtawanyiko hukuruhusu kuwakilisha tija ya kazi kwa kutumia uchanganuzi wa rejista. Katika uchumi, uchanganuzi wa kurudi nyuma hutumiwa kutabiri sifa nyingi zinazoathiri bidhaa ya mwisho (kwa kuzingatia bei).

B) Kigezo cha viunzi vidogo zaidi vya kupata mstari ulionyooka.

Kigezo kimoja ambacho tunaweza kutumia kwa laini ya urejeleaji inayofaa katika scatterplot ni msingi wa kuchagua mstari ambao jumla ya makosa ya mraba ni ndogo.

Ukaribu wa pointi za kueneza kwa mstari wa moja kwa moja hupimwa na kuratibu za makundi. Mikengeuko ya pointi hizi inaweza kuwa chanya na hasi, lakini jumla ya miraba ya kupotoka kwa mstari wa kinadharia kutoka kwa mstari wa majaribio daima ni chanya na inapaswa kuwa ndogo. Ukweli kwamba pointi zote za kutawanya haziendani na nafasi ya mstari wa kurejesha inaonyesha kuwepo kwa tofauti kati ya data ya majaribio na ya kinadharia. Kwa hivyo, tunaweza kusema kwamba hakuna mstari mwingine wa urejeshaji, isipokuwa ule uliopatikana, unaoweza kutoa kiasi kidogo cha upotovu kati ya data ya majaribio na majaribio. Kwa hivyo, baada ya kupata equation ya kinadharia ý na mstari wa kurejesha nyuma, tunakidhi mahitaji ya miraba kidogo zaidi.

Hii inafanywa kwa kutumia equation ya kuunganisha
kutumia fomula kupata vigezo A Na b. Kuchukua thamani ya kinadharia
na kuashiria upande wa kushoto wa mlinganyo kwa f, tunapata kazi
kutoka kwa vigezo visivyojulikana A Na b. Maadili A Na b itakidhi utendakazi wa chini kabisa f na hupatikana kutoka kwa milinganyo ya sehemu tofauti
Na
. Hii hali ya lazima, hata hivyo, kwa utendaji mzuri wa quadratic hii pia ni hali ya kutosha ya kutafuta A Na b.

Wacha tupate fomula za parameta kutoka kwa milinganyo ya sehemu ya derivative A Na b:



tunapata mfumo wa equations:

Wapi
- makosa ya maana ya hesabu.

Kubadilisha maadili ya nambari, tunapata vigezo A Na b.

Kuna dhana
. Hii ndio sababu ya kukadiria.

Kama e < 33%, то модель приемлема для дальнейшего анализа;

Kama e> 33%, basi tunachukua hyperbola, parabola, nk. Hii inatoa haki ya uchambuzi katika hali mbalimbali.

Hitimisho: kwa mujibu wa kigezo cha mgawo wa makadirio, mstari unaofaa zaidi ni ule ambao

, na hakuna laini nyingine ya rejista kwa shida yetu inayopeana kupotoka kwa kiwango cha chini.

D) Makosa ya mraba ya makadirio, kuangalia hali yao ya kawaida.

Kuhusiana na idadi ya watu ambayo idadi ya vigezo vya utafiti ni chini ya 30 ( n < 30), для проверки типичности параметров уравнения регрессии используется t-Mtihani wa t wa mwanafunzi. Hii inakokotoa thamani halisi t-vigezo:

Kutoka hapa

Wapi - kosa la mabaki la mzizi-maana-mraba. Imepokelewa t a Na t b ikilinganishwa na muhimu t k kutoka kwa jedwali la Mwanafunzi kwa kuzingatia kiwango cha umuhimu kinachokubalika ( = 0.01 = 99% au  = 0.05 = 95%). P = f = k 1 = m- idadi ya vigezo vya equation chini ya utafiti (shahada ya uhuru). Kwa mfano, ikiwa y = a + bx; m = 2, k 2 = f 2 = uk 2 = n – (m+ 1), wapi n- idadi ya sifa zilizosomwa.

t a < t k < t b .

Hitimisho: kwa kutumia vigezo vya mlinganyo wa urejeshi uliojaribiwa kwa ukawaida, mtindo wa kihisabati wa mawasiliano hujengwa
. Katika kesi hiyo, vigezo vya kazi ya hisabati kutumika katika uchambuzi (linear, hyperbola, parabola) kupokea maadili ya kiasi sambamba. Maudhui ya semantic ya mifano iliyopatikana kwa njia hii ni kwamba wanaonyesha thamani ya wastani ya tabia inayosababisha
kutoka kwa ishara ya sababu X.

D) Urejeshaji wa curvilinear.

Mara nyingi, uhusiano wa curvilinear hutokea wakati uhusiano unaobadilika unaanzishwa kati ya vigezo. Nguvu ya ongezeko (kupungua) inategemea kiwango cha X. Kuna aina tofauti za utegemezi wa curvilinear. Kwa mfano, fikiria uhusiano kati ya mavuno ya mazao na mvua. Kwa kuongezeka kwa mvua chini ya hali sawa za asili, kuna ongezeko kubwa la mavuno, lakini hadi kikomo fulani. Baada ya hatua muhimu, mvua hubadilika kuwa nyingi, na mavuno hupungua kwa bahati mbaya. Mfano unaonyesha kwamba mwanzoni uhusiano ulikuwa mzuri na kisha hasi. Jambo muhimu ni kiwango bora cha sifa X, ambacho kinalingana na kiwango cha juu au cha chini cha sifa Y.

Katika uchumi, uhusiano kama huo unazingatiwa kati ya bei na matumizi, tija na uzoefu.

Utegemezi wa kimfano.

Ikiwa data inaonyesha kuwa ongezeko la tabia ya sababu husababisha kuongezeka kwa tabia ya matokeo, basi equation ya pili (parabola) inachukuliwa kama equation ya regression.

. Coefficients a,b,c hupatikana kutoka kwa milinganyo ya sehemu tofauti:

Tunapata mfumo wa equations:

Aina za milinganyo ya curvilinear:

,

,

Tuna haki ya kudhani kuwa kuna uhusiano wa curvilinear kati ya tija ya kazi na alama za mtihani wa uteuzi. Hii inamaanisha kuwa kadiri mfumo wa bao unavyoongezeka, utendakazi utaanza kupungua kwa kiwango fulani, kwa hivyo mtindo ulionyooka unaweza kugeuka kuwa curvilinear.

Muundo wa tatu utakuwa hyperbola, na katika milinganyo yote kigezo cha x kitabadilishwa na usemi .

Katika machapisho yaliyotangulia, uchanganuzi mara nyingi ulilenga kigezo kimoja cha nambari, kama vile mapato ya fedha za pande zote, nyakati za upakiaji wa ukurasa wa Wavuti, au matumizi ya vinywaji baridi. Katika maelezo haya na yafuatayo, tutaangalia njia za kutabiri maadili ya kutofautisha kwa nambari kulingana na maadili ya anuwai moja au zaidi ya nambari.

Nyenzo zitaonyeshwa kwa mfano wa kukata msalaba. Utabiri wa kiasi cha mauzo katika duka la nguo. Msururu wa maduka ya nguo za alizeti umekuwa ukipanuka kila mara kwa miaka 25. Hata hivyo, kampuni kwa sasa haina mbinu ya kimfumo ya kuchagua maduka mapya. Mahali ambapo kampuni inakusudia kufungua duka jipya hubainishwa kulingana na mambo yanayozingatiwa. Vigezo vya uteuzi ni hali nzuri za kukodisha au wazo la msimamizi la eneo linalofaa la duka. Fikiria kuwa wewe ni mkuu wa idara maalum ya miradi na mipango. Umepewa jukumu la kuunda mpango mkakati wa kufungua maduka mapya. Mpango huu unapaswa kujumuisha utabiri wa mauzo ya kila mwaka kwa maduka mapya yaliyofunguliwa. Unaamini kuwa nafasi ya rejareja inahusiana moja kwa moja na mapato na unataka kujumuisha hili katika mchakato wako wa kufanya maamuzi. Je, unawezaje kuunda kielelezo cha takwimu cha kutabiri mauzo ya kila mwaka kulingana na saizi ya duka jipya?

Kwa kawaida, uchanganuzi wa rejista hutumiwa kutabiri maadili ya kutofautisha. Kusudi lake ni kuunda muundo wa takwimu ambao unaweza kutabiri maadili ya kigezo tegemezi, au jibu, kutoka kwa maadili ya angalau tofauti moja huru, au ya kuelezea. Katika dokezo hili, tutaangalia urejeshaji rahisi wa mstari - njia ya takwimu ambayo hukuruhusu kutabiri maadili ya kutofautisha tegemezi. Y kwa maadili tofauti tofauti X. Vidokezo vifuatavyo vitaelezea modeli nyingi za rejista iliyoundwa kutabiri maadili ya tofauti huru Y kulingana na maadili ya anuwai kadhaa tegemezi ( X 1, X 2, …, X k).

Pakua noti katika au umbizo, mifano katika umbizo

Aina za mifano ya urejeshaji

Wapi ρ 1 - mgawo wa uunganisho wa kiotomatiki; Kama ρ 1 = 0 (hakuna uhusiano otomatiki), D≈ 2; Kama ρ 1 ≈ 1 (uhusiano mzuri wa kiotomatiki), D≈ 0; Kama ρ 1 = -1 (uhusiano hasi wa kiotomatiki), D ≈ 4.

Katika mazoezi, matumizi ya kigezo cha Durbin-Watson inategemea kulinganisha thamani D yenye maadili muhimu ya kinadharia dL Na d U kwa idadi fulani ya uchunguzi n, idadi ya vigezo vya kujitegemea vya mfano k(kwa urejeshaji rahisi wa mstari k= 1) na kiwango cha umuhimu α. Kama D< d L , hypothesis kuhusu uhuru wa kupotoka kwa nasibu inakataliwa (kwa hiyo, kuna uunganisho mzuri wa autocorrelation); Kama D>dU, hypothesis haijakataliwa (yaani, hakuna autocorrelation); Kama dL< D < d U , hakuna sababu za kutosha za kufanya uamuzi. Wakati thamani iliyohesabiwa D inazidi 2, kisha na dL Na d U Sio mgawo yenyewe unaolinganishwa D, na usemi (4- D).

Ili kuhesabu takwimu za Durbin-Watson katika Excel, hebu tugeuke kwenye jedwali la chini kwenye Mtini. 14 Uondoaji wa usawa. Nambari katika usemi (10) inakokotolewa kwa kutumia chaguo za kukokotoa =SUMMAR(safu1;safu2), na dhehebu =SUMMAR(safu) (Mchoro 16).

Mchele. 16. Fomula za kukokotoa takwimu za Durbin-Watson

Katika mfano wetu D= 0.883. Swali kuu ni: ni thamani gani ya takwimu ya Durbin-Watson inapaswa kuzingatiwa kuwa ndogo vya kutosha kuhitimisha kuwa uunganisho mzuri wa moja kwa moja upo? Ni muhimu kuunganisha thamani ya D na maadili muhimu ( dL Na d U), kulingana na idadi ya uchunguzi n na kiwango cha umuhimu α (Mchoro 17).

Mchele. 17. Thamani muhimu za takwimu za Durbin-Watson (kipande cha jedwali)

Kwa hivyo, katika tatizo la kiasi cha mauzo katika duka la kupeleka bidhaa nyumbani, kuna tofauti moja ya kujitegemea ( k= 1), uchunguzi 15 ( n= 15) na kiwango cha umuhimu α = 0.05. Kwa hivyo, dL= 1.08 na dU= 1.36. Kwa sababu ya D = 0,883 < dL= 1.08, kuna uhusiano mzuri kati ya mabaki, njia ya angalau mraba haiwezi kutumika.

Kujaribu Dhana kuhusu Mteremko na Mgawo wa Uwiano

Hapo juu, regression ilitumika kwa utabiri pekee. Kuamua mgawo wa rejista na kutabiri thamani ya kigezo Y kwa thamani fulani ya kutofautisha X Njia ya angalau mraba ilitumiwa. Kwa kuongeza, tulichunguza kosa la msingi la mraba wa makadirio na mgawo mchanganyiko wa uwiano. Iwapo uchanganuzi wa mabaki unathibitisha kuwa hali ya utumiaji wa njia ya miraba ndogo zaidi haijakiukwa, na muundo rahisi wa urejeshaji wa mstari unatosha, kulingana na data ya sampuli, inaweza kubishaniwa kuwa kuna uhusiano wa mstari kati ya vigeu katika idadi ya watu.

Maombit -vigezo vya mteremko. Kwa kupima kama mteremko wa idadi ya watu β 1 ni sawa na sufuri, unaweza kubaini kama kuna uhusiano muhimu wa kitakwimu kati ya viambajengo. X Na Y. Ikiwa nadharia hii imekataliwa, inaweza kubishaniwa kuwa kati ya vigezo X Na Y kuna uhusiano wa mstari. Dhana potofu na mbadala zimeundwa kama ifuatavyo: H 0: β 1 = 0 (hakuna utegemezi wa mstari), H1: β 1 ≠ 0 (kuna utegemezi wa mstari). A-kipaumbele t-takwimu ni sawa na tofauti kati ya mteremko wa sampuli na thamani ya dhahania ya mteremko wa idadi ya watu, iliyogawanywa na msingi wa makosa ya mraba ya makadirio ya mteremko:

(11) t = (b 1 β 1 ) / S b 1

Wapi b 1 - mteremko wa rejista ya moja kwa moja kwenye data ya sampuli, β1 - mteremko wa dhahania wa idadi ya watu moja kwa moja; , na takwimu za mtihani t Ina t- usambazaji na n - 2 digrii za uhuru.

Hebu tuangalie ikiwa kuna uhusiano muhimu wa kitakwimu kati ya saizi ya duka na mauzo ya kila mwaka kwa α = 0.05. t-kigezo huonyeshwa pamoja na vigezo vingine vinapotumika Mfuko wa uchambuzi(chaguo Kurudi nyuma) Matokeo kamili ya Kifurushi cha Uchambuzi yanaonyeshwa kwenye Mtini. 4, kipande kinachohusiana na t-takwimu - kwenye Mtini. 18.

Mchele. 18. Matokeo ya maombi t

Tangu idadi ya maduka n= 14 (tazama Mchoro 3), thamani muhimu t-takwimu katika kiwango cha umuhimu cha α = 0.05 inaweza kupatikana kwa kutumia fomula: tL=MWANAFUNZI.ARV(0.025,12) = -2.1788, ambapo 0.025 ni nusu ya kiwango cha umuhimu, na 12 = n – 2; tU=MWANAFUNZI.OBR(0.975,12) = +2.1788.

Kwa sababu ya t-takwimu = 10.64 > tU= 2.1788 (Mchoro 19), hypothesis isiyo na maana H 0 kukataliwa. Upande mwingine, R-thamani kwa X= 10.6411, iliyokokotolewa kwa fomula =1-STUDENT.DIST(D3,12,TRUE), ni takriban sawa na sufuri, kwa hivyo nadharia tete H 0 tena kukataliwa. Ukweli kwamba R-thamani ya karibu sifuri inamaanisha kwamba ikiwa hakungekuwa na uhusiano wa kweli wa mstari kati ya saizi za duka na mauzo ya kila mwaka, itakuwa vigumu kuigundua kwa kutumia urejeshaji wa mstari. Kwa hivyo, kuna uhusiano wa kitakwimu wa mstari kati ya wastani wa mauzo ya kila mwaka ya duka na ukubwa wa duka.

Mchele. 19. Kujaribu nadharia tete kuhusu mteremko wa idadi ya watu katika kiwango cha umuhimu cha digrii 0.05 na 12 za uhuru.

MaombiF -vigezo vya mteremko. Njia mbadala ya kujaribu dhahania juu ya mteremko wa rejista rahisi ya mstari ni kutumia F-vigezo. Hebu tuwakumbushe hilo F-test inatumika kujaribu uhusiano kati ya tofauti mbili (kwa maelezo zaidi, ona). Wakati wa kujaribu nadharia ya mteremko, kipimo cha makosa ya nasibu ni tofauti ya makosa (jumla ya makosa ya mraba iliyogawanywa na idadi ya digrii za uhuru), kwa hivyo. F-criterion hutumia uwiano wa tofauti iliyoelezewa na rejista (yaani thamani SSR, imegawanywa na idadi ya vigezo vya kujitegemea k), kwa tofauti ya makosa ( MSE = S YX 2 ).

A-kipaumbele F-takwimu ni sawa na wastani wa mraba wa rejista (MSR) iliyogawanywa na tofauti za makosa (MSE): F = MSR/ MSE, Wapi MSR=SSR / k, MSE =SSE/(n- k - 1), k- idadi ya vigezo huru katika modeli ya urejeshaji. Takwimu za mtihani F Ina F- usambazaji na k Na n- k - 1 digrii za uhuru.

Kwa kiwango fulani cha umuhimu α, sheria ya uamuzi imeundwa kama ifuatavyo: ikiwa F>FU, nadharia tupu imekataliwa; vinginevyo haijakataliwa. Matokeo, yaliyowasilishwa kwa namna ya jedwali la muhtasari wa uchanganuzi wa tofauti, yanaonyeshwa kwenye Mtini. 20.

Mchele. 20. Uchanganuzi wa jedwali la tofauti kwa ajili ya kupima dhahania kuhusu umuhimu wa takwimu wa mgawo wa rejista.

Vivyo hivyo t-kigezo F-kigezo kinaonyeshwa kwenye jedwali kinapotumika Mfuko wa uchambuzi(chaguo Kurudi nyuma) Matokeo kamili ya kazi Mfuko wa uchambuzi zinaonyeshwa kwenye Mtini. 4, kipande kuhusiana na F-takwimu - katika Mtini. 21.

Mchele. 21. Matokeo ya maombi F-vigezo vilivyopatikana kwa kutumia Excel Analysis Package

F-takwimu ni 113.23, na R-thamani karibu na sifuri (seli UmuhimuF) Ikiwa kiwango cha umuhimu α ni 0.05, tambua thamani muhimu F-usambazaji na digrii moja na 12 za uhuru zinaweza kupatikana kwa kutumia fomula F U=F.OBR (1-0.05;1;12) = 4.7472 (Mchoro 22). Kwa sababu ya F = 113,23 > F U= 4.7472, na R- Thamani karibu na 0< 0,05, нулевая гипотеза H 0 inakataliwa, i.e. Saizi ya duka inahusiana kwa karibu na mauzo yake ya kila mwaka.

Mchele. 22. Kujaribu nadharia ya mteremko wa idadi ya watu kwa kiwango cha umuhimu cha 0.05 na digrii moja na 12 za uhuru.

Muda wa kujiamini ulio na mteremko β 1 . Ili kujaribu dhana kwamba kuna uhusiano wa mstari kati ya vigeu, unaweza kuunda muda wa kujiamini ulio na mteremko β 1 na uthibitishe kuwa thamani ya dhahania β 1 ​​= 0 ni ya muda huu. Katikati ya muda wa kujiamini iliyo na mteremko β 1 ni sampuli ya mteremko b 1 , na mipaka yake ni kiasi b 1 ±tn –2 S b 1

Kama inavyoonyeshwa kwenye Mtini. 18, b 1 = +1,670, n = 14, S b 1 = 0,157. t 12 =MWANAFUNZI.ARV(0.975,12) = 2.1788. Kwa hivyo, b 1 ±tn –2 S b 1 = +1.670 ± 2.1788 * 0.157 = +1.670 ± 0.342, au + 1.328 ≤ β 1 ≤ +2.012. Kwa hivyo, kuna uwezekano wa 0.95 kwamba mteremko wa idadi ya watu upo kati ya +1.328 na +2.012 (yaani, $1,328,000 hadi $2,012,000). Kwa kuwa thamani hizi ni kubwa kuliko sifuri, kuna uhusiano muhimu wa kitakwimu kati ya mauzo ya kila mwaka na eneo la duka. Ikiwa muda wa kujiamini ulikuwa na sifuri, hakutakuwa na uhusiano kati ya vigeuzo. Kwa kuongezea, muda wa kujiamini unamaanisha kuwa kila ongezeko la eneo la duka kwa 1,000 sq. ft. husababisha ongezeko la wastani wa kiasi cha mauzo kati ya $1,328,000 na $2,012,000.

Matumizit -kigezo cha mgawo wa uwiano. mgawo wa uunganisho ulianzishwa r, ambacho ni kipimo cha uhusiano kati ya viambishi viwili vya nambari. Inaweza kutumika kubainisha kama kuna uhusiano muhimu wa kitakwimu kati ya viambajengo viwili. Wacha tuonyeshe mgawo wa uunganisho kati ya idadi ya anuwai zote mbili kwa ishara ρ. Dhana potofu na mbadala zimeundwa kama ifuatavyo: H 0: ρ = 0 (hakuna uwiano), H 1: ρ ≠ 0 (kuna uwiano). Kuangalia uwepo wa uhusiano:

Wapi r = + , Kama b 1 > 0, r = – , Kama b 1 < 0. Тестовая статистика t Ina t- usambazaji na n - 2 digrii za uhuru.

Katika tatizo kuhusu mlolongo wa maduka ya Alizeti r 2= 0.904, a b 1- +1.670 (tazama Mchoro 4). Kwa sababu ya b 1> 0, mgawo wa uwiano kati ya mauzo ya kila mwaka na ukubwa wa duka ni r= +√0.904 = +0.951. Wacha tujaribu nadharia tupu kwamba hakuna uhusiano kati ya anuwai hizi kwa kutumia t-takwimu:

Katika kiwango cha umuhimu cha α = 0.05, dhana potofu inapaswa kukataliwa kwa sababu t= 10.64 > 2.1788. Kwa hivyo, inaweza kubishana kuwa kuna uhusiano muhimu wa kitakwimu kati ya mauzo ya kila mwaka na saizi ya duka.

Wakati wa kujadili makisio kuhusu mteremko wa idadi ya watu, vipindi vya kujiamini na majaribio ya dhahania hutumiwa kwa kubadilishana. Walakini, kuhesabu muda wa kujiamini ulio na mgawo wa uunganisho kunageuka kuwa ngumu zaidi, kwani aina ya usambazaji wa sampuli ya takwimu. r inategemea mgawo wa uunganisho wa kweli.

Ukadiriaji wa matarajio ya hisabati na utabiri wa maadili ya mtu binafsi

Sehemu hii inajadili mbinu za kukadiria matarajio ya kihisabati ya jibu Y na utabiri wa maadili ya mtu binafsi Y kwa maadili yaliyopewa ya kutofautisha X.

Kuunda muda wa kujiamini. Katika mfano 2 (tazama sehemu hapo juu Njia ya angalau mraba) equation ya rejista ilifanya iwezekane kutabiri thamani ya kutofautisha Y X. Katika shida ya kuchagua eneo la duka la rejareja, wastani wa mauzo ya kila mwaka katika duka yenye eneo la 4000 sq. miguu ilikuwa sawa na dola milioni 7.644. Hata hivyo, makadirio haya ya matarajio ya hisabati ya idadi ya watu kwa ujumla ni ya busara. Ili kukadiria matarajio ya hisabati ya idadi ya watu, dhana ya muda wa kujiamini ilipendekezwa. Vile vile, tunaweza kuanzisha dhana muda wa kujiamini kwa matarajio ya kihisabati ya majibu kwa thamani fulani ya kutofautisha X:

Wapi , = b 0 + b 1 Xi- thamani iliyotabiriwa inabadilika Y katika X = Xi, S YX- mzizi maana ya makosa ya mraba, n- saizi ya sampuli, Xi- thamani maalum ya kutofautiana X, µ Y|X = Xi- matarajio ya hisabati ya kutofautiana Y katika X = Xi, SSX =

Uchambuzi wa fomula (13) unaonyesha kuwa upana wa muda wa kujiamini unategemea mambo kadhaa. Kwa kiwango fulani cha umuhimu, ongezeko la amplitude ya kushuka kwa thamani karibu na mstari wa regression, kupimwa kwa kutumia mzizi wa makosa ya mraba, husababisha kuongezeka kwa upana wa muda. Kwa upande mwingine, kama mtu angetarajia, ongezeko la saizi ya sampuli inaambatana na kupunguzwa kwa muda. Kwa kuongeza, upana wa muda hubadilika kulingana na maadili Xi. Ikiwa thamani ya kutofautiana Y iliyotabiriwa kwa wingi X, karibu na thamani ya wastani , muda wa kujiamini unageuka kuwa mdogo kuliko wakati wa kutabiri jibu la maadili mbali na wastani.

Hebu tuseme kwamba wakati wa kuchagua eneo la duka, tunataka kujenga muda wa kujiamini wa 95% kwa wastani wa mauzo ya kila mwaka ya maduka yote ambayo eneo lake ni mita za mraba 4000. miguu:

Kwa hivyo, wastani wa mauzo ya kila mwaka katika duka zote zilizo na eneo la sq 4,000. miguu, na uwezekano wa 95% upo katika anuwai kutoka dola 6.971 hadi 8.317 milioni.

Kokotoa muda wa kutegemewa kwa thamani iliyotabiriwa. Kando na muda wa kujiamini kwa matarajio ya hisabati ya jibu kwa thamani fulani ya kigezo X, mara nyingi ni muhimu kujua muda wa kujiamini kwa thamani iliyotabiriwa. Ingawa fomula ya kukokotoa muda kama huu wa kujiamini inafanana sana na fomula (13), muda huu una thamani iliyotabiriwa badala ya makadirio ya kigezo. Muda wa majibu yaliyotabiriwa YX = Xi kwa thamani maalum ya kutofautisha Xi imedhamiriwa na formula:

Tuseme kwamba, tunapochagua eneo la duka la reja reja, tunataka kujenga muda wa kujiamini wa 95% kwa kiasi kilichotabiriwa cha mauzo ya kila mwaka kwa duka ambalo eneo lake ni mita za mraba 4000. miguu:

Kwa hivyo, kiasi cha mauzo ya kila mwaka kilichotabiriwa kwa duka yenye eneo la sq 4000. futi, na uwezekano wa 95% upo katika safu kutoka dola milioni 5.433 hadi 9.854. Kama tunavyoona, muda wa kujiamini kwa thamani iliyotabiriwa ya majibu ni pana zaidi kuliko muda wa kujiamini kwa matarajio yake ya hisabati. Hii ni kwa sababu tofauti katika kutabiri maadili ya mtu binafsi ni kubwa zaidi kuliko kukadiria matarajio ya hisabati.

Mitego na masuala ya kimaadili yanayohusiana na kutumia rejista

Ugumu unaohusishwa na uchanganuzi wa urekebishaji:

  • Kupuuza masharti ya utumiaji wa njia ndogo ya mraba.
  • Tathmini isiyo sahihi ya masharti ya utumiaji wa mbinu ya angalau miraba.
  • Uchaguzi usio sahihi wa mbinu mbadala wakati masharti ya utumiaji wa njia ya angalau mraba yamekiukwa.
  • Utumiaji wa uchanganuzi wa urejeshi bila ufahamu wa kina wa somo la utafiti.
  • Kuongeza urejeshaji zaidi ya masafa ya utofauti wa maelezo.
  • Mkanganyiko kati ya uhusiano wa kitakwimu na sababu.

Kuenea kwa matumizi ya lahajedwali na programu za takwimu kumeondoa matatizo ya ukokotoaji ambayo yalikuwa yamezuia utumiaji wa uchanganuzi wa urejeshaji. Hata hivyo, hii ilisababisha ukweli kwamba uchambuzi wa urejeshaji ulitumiwa na watumiaji ambao hawakuwa na sifa na ujuzi wa kutosha. Watumiaji wanawezaje kujua kuhusu mbinu mbadala ikiwa wengi wao hawajui hata kidogo kuhusu masharti ya utumiaji wa njia ndogo ya mraba na hawajui jinsi ya kuangalia utekelezaji wao?

Mtafiti hapaswi kubebwa na nambari za kubana - kuhesabu mabadiliko, mteremko na mgawo mchanganyiko wa uunganisho. Anahitaji maarifa ya kina. Wacha tuonyeshe hili kwa mfano wa kawaida uliochukuliwa kutoka kwa vitabu vya kiada. Anscombe ilionyesha kuwa seti zote nne za data zilizoonyeshwa kwenye Mtini. 23, kuwa na vigezo sawa vya kurejesha (Mchoro 24).

Mchele. 23. Seti nne za data za bandia

Mchele. 24. Uchambuzi wa urejeshaji wa seti nne za data za bandia; kufanyika na Mfuko wa uchambuzi(bofya kwenye picha ili kupanua picha)

Kwa hivyo, kwa mtazamo wa uchanganuzi wa rejista, seti hizi zote za data zinafanana kabisa. Uchambuzi ukiishia hapo, tungepoteza habari nyingi muhimu. Hii inathibitishwa na viwanja vya kutawanya (Mchoro 25) na viwanja vya mabaki (Kielelezo 26) vilivyoundwa kwa seti hizi za data.

Mchele. 25. Viwanja vya kutawanya kwa seti nne za data

Viwanja vya kutawanya na viwanja vya mabaki vinaonyesha kuwa data hizi hutofautiana kutoka kwa kila mmoja. Seti pekee iliyosambazwa kwenye mstari wa moja kwa moja imewekwa A. Mpangilio wa mabaki yaliyohesabiwa kutoka kwa kuweka A hauna muundo wowote. Hii haiwezi kusemwa kuhusu seti B, C na D. Mpangilio wa kutawanya uliopangwa kwa seti B unaonyesha muundo uliotamkwa wa quadratic. Hitimisho hili linathibitishwa na njama ya mabaki, ambayo ina sura ya kimfano. Njama ya kutawanya na njama mabaki zinaonyesha kuwa seti ya data B ina nje. Katika hali hii, ni muhimu kuwatenga nje kutoka kwa seti ya data na kurudia uchambuzi. Njia ya kugundua na kuondoa vitu vya nje katika uchunguzi inaitwa uchambuzi wa ushawishi. Baada ya kuondokana na nje, matokeo ya kukadiria tena mfano inaweza kuwa tofauti kabisa. Mtawanyiko uliopangwa kutoka kwa data kutoka kwa seti G unaonyesha hali isiyo ya kawaida ambayo modeli ya majaribio inategemea sana jibu la mtu binafsi ( X 8 = 19, Y 8 = 12.5). Vile mifano ya urejeshaji lazima ihesabiwe hasa kwa uangalifu. Kwa hivyo, viwanja vya kutawanya na mabaki ni zana muhimu kwa uchanganuzi wa rejista na inapaswa kuwa sehemu yake muhimu. Bila wao, uchambuzi wa regression sio wa kuaminika.

Mchele. 26. Viwanja vya mabaki kwa seti nne za data

Jinsi ya kuzuia mitego katika uchanganuzi wa rejista:

  • Uchambuzi wa uhusiano unaowezekana kati ya vigezo X Na Y kila mara anza kwa kuchora njama ya kutawanya.
  • Kabla ya kutafsiri matokeo ya uchambuzi wa urejeshaji, angalia hali ya utumiaji wake.
  • Panga mabaki dhidi ya tofauti huru. Hii itafanya iwezekane kubainisha jinsi modeli ya majaribio inavyolingana na matokeo ya uchunguzi na kugundua ukiukaji wa uthabiti wa tofauti.
  • Tumia histogramu, sehemu za shina na majani, sehemu za sanduku, na sehemu za kawaida za usambazaji ili kupima dhana ya usambazaji wa makosa ya kawaida.
  • Ikiwa masharti ya utumiaji wa mbinu ya miraba ndogo zaidi hayatimizwi, tumia mbinu mbadala (kwa mfano, miundo ya urejeleaji ya quadratic au nyingi).
  • Iwapo masharti ya utumiaji wa mbinu ya miraba ya chini kabisa yametimizwa, ni muhimu kupima dhahania kuhusu umuhimu wa takwimu wa hesabu za urejeshi na kuunda vipindi vya kujiamini vilivyo na matarajio ya hisabati na thamani ya majibu iliyotabiriwa.
  • Epuka kutabiri thamani za tofauti tegemezi nje ya anuwai ya kigezo huru.
  • Kumbuka kwamba uhusiano wa takwimu sio kila wakati sababu-na-athari. Kumbuka kwamba uunganisho kati ya anuwai haimaanishi kuwa kuna uhusiano wa sababu-na-athari kati yao.

Muhtasari. Kama inavyoonyeshwa kwenye mchoro wa kuzuia (Mchoro 27), noti inaelezea modeli rahisi ya urejeshaji mstari, masharti ya utumiaji wake, na jinsi ya kujaribu hali hizi. Imezingatiwa t-kigezo cha kupima umuhimu wa takwimu wa mteremko wa kurudi nyuma. Mfano wa urejeshaji ulitumiwa kutabiri maadili ya utofauti tegemezi. Mfano unazingatiwa kuhusiana na uchaguzi wa eneo la duka la rejareja, ambalo utegemezi wa kiasi cha mauzo ya kila mwaka kwenye eneo la duka huchunguzwa. Taarifa iliyopatikana inakuwezesha kuchagua kwa usahihi zaidi eneo la duka na kutabiri kiasi cha mauzo ya kila mwaka. Vidokezo vifuatavyo vitaendeleza mjadala wa uchanganuzi wa rejista na pia kuangalia mifano nyingi ya urejeshaji.

Mchele. 27. Kumbuka mchoro wa muundo

Nyenzo kutoka kwa kitabu Levin et al.. Takwimu za Wasimamizi zinatumika. - M.: Williams, 2004. - p. 792–872

Ikiwa kigezo tegemezi ni cha kategoria, urekebishaji wa vifaa lazima utumike.

Uchambuzi wa urejeshi ni mojawapo ya mbinu maarufu zaidi za utafiti wa takwimu. Inaweza kutumika kuanzisha kiwango cha ushawishi wa vigeu huru kwenye kigezo tegemezi. Microsoft Excel ina zana iliyoundwa kufanya aina hii ya uchanganuzi. Wacha tuangalie ni nini na jinsi ya kuzitumia.

Lakini, ili kutumia kazi ambayo inakuwezesha kufanya uchambuzi wa regression, kwanza unahitaji kuamsha Kifurushi cha Uchambuzi. Kisha tu zana zinazohitajika kwa utaratibu huu zitaonekana kwenye Ribbon ya Excel.


Sasa tunapoenda kwenye kichupo "Takwimu", kwenye utepe kwenye kisanduku cha zana "Uchambuzi" tutaona kitufe kipya - "Uchambuzi wa data".

Aina za Uchambuzi wa Kurudi nyuma

Kuna aina kadhaa za kurudi nyuma:

  • kimfano;
  • kutuliza;
  • logarithmic;
  • kielelezo;
  • maandamano;
  • hyperbolic;
  • rejeshi la mstari.

Tutazungumza kwa undani zaidi juu ya kufanya aina ya mwisho ya uchambuzi wa urekebishaji katika Excel baadaye.

Urekebishaji wa mstari katika Excel

Ifuatayo, kama mfano, ni jedwali linaloonyesha wastani wa halijoto ya hewa ya kila siku nje na idadi ya wateja wa duka kwa siku inayolingana ya kazi. Wacha tujue kwa kutumia uchambuzi wa urekebishaji haswa jinsi hali ya hewa katika mfumo wa joto la hewa inaweza kuathiri mahudhurio ya uanzishwaji wa rejareja.

Mlingano wa urejeshaji wa mstari wa jumla ni kama ifuatavyo: Y = a0 + a1x1 +…+ akhk. Katika fomula hii Y ina maana ya kutofautiana, ushawishi wa mambo ambayo tunajaribu kujifunza. Kwa upande wetu, hii ni idadi ya wanunuzi. Maana x ni sababu mbalimbali zinazoathiri kutofautiana. Chaguo a ni mgawo wa urejeshaji. Hiyo ni, wao ndio wanaoamua umuhimu wa jambo fulani. Kielezo k inaashiria jumla ya idadi ya vipengele hivi.


Uchambuzi wa matokeo ya uchambuzi

Matokeo ya uchanganuzi wa urejeshaji huonyeshwa kwa namna ya jedwali mahali palipoainishwa kwenye mipangilio.

Moja ya viashiria kuu ni R-mraba. Inaonyesha ubora wa mfano. Kwa upande wetu, mgawo huu ni 0.705 au kuhusu 70.5%. Hiki ni kiwango kinachokubalika cha ubora. Utegemezi chini ya 0.5 ni mbaya.

Kiashiria kingine muhimu iko kwenye seli kwenye makutano ya mstari "Y-makutano" na safu "Uwezekano". Hii inaonyesha thamani gani Y itakuwa na, na kwa upande wetu, hii ni idadi ya wanunuzi, na mambo mengine yote sawa na sifuri. Katika jedwali hili, thamani hii ni 58.04.

Thamani kwenye makutano ya grafu "Variable X1" Na "Uwezekano" inaonyesha kiwango cha utegemezi wa Y kwenye X. Kwa upande wetu, hii ni kiwango cha utegemezi wa idadi ya wateja wa duka kwenye joto. Mgawo wa 1.31 unachukuliwa kuwa kiashiria cha juu cha ushawishi.

Kama unaweza kuona, kutumia Microsoft Excel ni rahisi sana kuunda jedwali la uchambuzi wa rejista. Lakini mtu aliyefunzwa tu ndiye anayeweza kufanya kazi na data ya pato na kuelewa kiini chake.

Hotuba ya 3.

Uchambuzi wa kurudi nyuma.

1) Tabia za nambari za kurudi nyuma

2) Urejeshaji wa mstari

3) Urejeshaji usio na mstari

4) Rejea nyingi

5) Kutumia MS EXCEL kufanya uchanganuzi wa rejista

Chombo cha kudhibiti na tathmini - kazi za mtihani

1. Tabia za nambari za kurudi nyuma

Uchanganuzi wa urejeshi ni mbinu ya takwimu ya kusoma ushawishi wa vigeu moja au zaidi vinavyojitegemea kwenye kigezo tegemezi. Vigezo vinavyojitegemea huitwa vinginevyo virejeshi au vitabiri, na vigeu tegemezi vinaitwa vigezo vya kigezo. Istilahi ya vigeu tegemezi na vinavyojitegemea huakisi tu utegemezi wa kihisabati wa viasili, na si uhusiano wa sababu-na-athari.

Malengo ya Uchambuzi wa Kurudi nyuma

  • Kuamua kiwango cha uamuzi wa tofauti ya kigezo (tegemezi) na watabiri (vigezo vinavyojitegemea).
  • Kutabiri thamani ya kigezo tegemezi kwa kutumia viwezo huru.
  • Uamuzi wa mchango wa vigezo vya kujitegemea vya kibinafsi kwa tofauti ya kutofautiana tegemezi.

Uchambuzi wa urejeshaji hauwezi kutumiwa kuamua ikiwa kuna uhusiano kati ya vigeu, kwani uwepo wa uhusiano kama huo ni sharti la kutumia uchanganuzi.

Ili kufanya uchanganuzi wa urejeshi, kwanza unahitaji kufahamiana na dhana za kimsingi za takwimu na nadharia ya uwezekano.

Sifa za kimsingi za nambari za anuwai za nasibu zisizo na maana na zinazoendelea: matarajio ya kihisabati, mtawanyiko na kupotoka kwa kawaida.

Vigezo vya nasibu vimegawanywa katika aina mbili:

  • · dhabiti, ambayo inaweza kuchukua tu maadili maalum, yaliyokubaliwa mapema (kwa mfano, maadili ya nambari kwenye ukingo wa juu wa kete iliyotupwa au maadili ya kawaida ya mwezi wa sasa);
  • · kuendelea (mara nyingi - maadili ya kiasi fulani cha kimwili: uzito, umbali, joto, nk), ambayo, kulingana na sheria za asili, inaweza kuchukua maadili yoyote, angalau kwa muda fulani.

Sheria ya usambazaji wa kutofautisha bila mpangilio ni mawasiliano kati ya maadili yanayowezekana ya kutofautisha kwa nasibu na uwezekano wake, kawaida huandikwa kwenye jedwali:

Ufafanuzi wa takwimu wa uwezekano unaonyeshwa kupitia marudio ya jamaa ya tukio la nasibu, yaani, hupatikana kama uwiano wa idadi ya vigeu vya nasibu kwa jumla ya idadi ya vigeu vya nasibu.

Matarajio ya hisabati ya kigeu kisicho na mpangilio maalumX inaitwa jumla ya bidhaa za maadili ya wingi X juu ya uwezekano wa maadili haya. Matarajio ya hisabati yanaonyeshwa na au M(X) .

n

= M(X) = x 1 uk 1 + x 2 uk 2 +… + x n p n = S Xi p i

i=1

Mtawanyiko wa kigeugeu cha nasibu na matarajio yake ya kihisabati hubainishwa kwa kutumia sifa ya nambari inayoitwa mtawanyiko. Kwa ufupi, tofauti ni uenezaji wa kibadilishaji nasibu karibu na thamani ya wastani. Ili kuelewa kiini cha utawanyiko, fikiria mfano. Mshahara wa wastani nchini ni karibu rubles elfu 25. Je, takwimu hii inatoka wapi? Uwezekano mkubwa zaidi, mishahara yote huongezwa na kugawanywa na idadi ya wafanyikazi. Katika kesi hii, kuna utawanyiko mkubwa sana (mshahara wa chini ni karibu rubles elfu 4, na kiwango cha juu ni karibu rubles elfu 100). Ikiwa mshahara wa kila mtu ulikuwa sawa, basi tofauti itakuwa sifuri na hakutakuwa na kuenea.

Mtawanyiko wa tofauti tofauti nasibuX ni matarajio ya kihisabati ya tofauti ya mraba ya tofauti isiyo ya kawaida na matarajio yake ya hisabati:

D = M [ ((X - M (X))) 2]

Kutumia ufafanuzi wa matarajio ya hisabati kuhesabu tofauti, tunapata fomula:

D = S (x i - M (X)) 2 p i

Lahaja ina kipimo cha mraba wa kigeu cha nasibu. Katika hali ambapo inahitajika kuwa na tabia ya nambari ya utawanyiko wa maadili yanayowezekana katika kipimo sawa na tofauti ya nasibu yenyewe, kupotoka kwa kawaida hutumiwa.

Mkengeuko wa kawaida kutofautisha nasibu huitwa mzizi wa mraba wa tofauti zake.

Mkengeuko wa kawaida ni kipimo cha mtawanyiko wa maadili ya tofauti ya nasibu karibu na matarajio yake ya hisabati.

Mfano.

Sheria ya usambazaji wa mabadiliko ya nasibu X imetolewa na jedwali lifuatalo:

Pata matarajio yake ya hisabati, tofauti na kupotoka kwa kawaida .

Tunatumia fomula hapo juu:

M (X) = 1 0.1 + 2 0.4 + 4 0.4 + 5 0.1 = 3

D = (1-3) 2 0.1 + (2 - 3) 2 0.4 + (4 - 3) 2 0.4 + (5 - 3) 2 0.1 = 1.6

Mfano.

Katika bahati nasibu ya pesa taslimu, ushindi 1 wa rubles 1000, ushindi 10 wa rubles 100 na ushindi 100 wa ruble 1 kila moja huchezwa na jumla ya tikiti za 10,000. Unda sheria ya usambazaji kwa ushindi wa nasibu X kwa mmiliki wa bahati nasibu moja. tiketi na kubainisha matarajio ya hisabati, mtawanyiko na mkengeuko wa kawaida wa kigeuzo nasibu .

X 1 = 1000, X 2 = 100, X 3 = 1, X 4 = 0,

P 1 = 1/10000 = 0.0001, P 2 = 10/10000 = 0.001, P 3 = 100/10000 = 0.01, P 4 = 1 - (P 1 + P 2 + P 3) = 0.9889.

Wacha tuweke matokeo kwenye meza:

Matarajio ya hisabati ni jumla ya bidhaa zilizooanishwa za thamani ya kigezo cha nasibu na uwezekano wake. Kwa kazi hii, ni vyema kuhesabu kwa kutumia formula

1000 · 0.0001 + 100 · 0.001 + 1 · 0.01 + 0 · 0.9889 = 0.21 rubles.

Tulipokea bei halisi ya tikiti "ya haki".

D = S (x i - M (X)) 2 p i = (1000 - 0.21) 2 0.0001 + (100 - 0.21) 2 0.001 +

+ (1 - 0,21) 2 0,01 + (0 - 0,21) 2 0,9889 ≈ 109,97

Utendakazi wa usambazaji wa vigeu vinavyoendelea bila mpangilio

Thamani ambayo, kama matokeo ya jaribio, itachukua thamani moja inayowezekana (ambayo haijulikani mapema) inaitwa tofauti ya nasibu. Kama ilivyotajwa hapo juu, anuwai za nasibu zinaweza kuwa tofauti (zisizoendelea) na zinazoendelea.

Discrete ni tofauti ya nasibu ambayo inachukua maadili tofauti iwezekanavyo na uwezekano fulani ambao unaweza kuhesabiwa.

Kuendelea ni kigezo cha nasibu ambacho kinaweza kuchukua thamani zote kutoka kwa muda usio na kikomo au usio na kikomo.

Hadi kufikia hatua hii, tulipunguzwa kwa "aina" moja tu ya vigezo vya random - discrete, i.e. kuchukua maadili yenye ukomo.

Lakini nadharia na mazoezi ya takwimu yanahitaji matumizi ya dhana ya kutofautiana kwa nasibu - kuruhusu maadili yoyote ya nambari kutoka kwa muda wowote.

Ni rahisi kufafanua sheria ya usambazaji wa mabadiliko ya nasibu endelevu kwa kutumia kinachojulikana kama chaguo za kukokotoa za uwezekano. f(x). Uwezekano P (a< X < b) того, что значение, принятое случайной величиной Х, попадет в промежуток (a; b), определяется равенством

P (a< X < b) = ∫ f(x) dx

Grafu ya chaguo za kukokotoa f (x) inaitwa curve ya usambazaji. Kijiometri, uwezekano wa tofauti ya nasibu inayoanguka kwenye muda (a; b) ni sawa na eneo la trapezoid inayolingana ya curvilinear iliyopakana na msafara wa usambazaji, mhimili wa Ox na mistari iliyonyooka x = a, x = b.

P (£ X

Iwapo seti yenye kikomo au inayoweza kuhesabika imetolewa kutoka kwa tukio changamano, uwezekano wa kutokea kwa tukio jipya bado haujabadilika.

Kazi f(x) - kitendakazi cha hesabu cha hoja halisi x inaitwa wiani wa uwezekano, na iko katika hatua x ikiwa kikomo kipo katika hatua hii:

Sifa za wiani wa uwezekano:

  1. Msongamano wa uwezekano ni chaguo za kukokotoa zisizo hasi, yaani f(x) ≥ 0

(ikiwa maadili yote ya mabadiliko ya nasibu X yamo katika muda (a;b), basi ya mwisho

usawa unaweza kuandikwa kama ∫ f (x) dx = 1).

Hebu sasa tuzingatie kazi F(x) = P(X< х). Эта функция называется функцией распределения вероятности случайной величины Х. Функция F(х) существует как для дискретных, так и для непрерывных случайных величин. Если f (x) - функция плотности распределения вероятности

mabadiliko ya nasibu yanayoendelea X, kisha F (x) = ∫ f(x) dx = 1).

Kutoka kwa usawa wa mwisho inafuata kwamba f (x) = F" (x)

Wakati mwingine chaguo za kukokotoa f(x) huitwa chaguo za kukokotoa za usambaaji wa uwezekano tofauti, na chaguo za kukokotoa F(x) huitwa chaguo za kukokotoa za usambaaji wa uwezekano limbikizi.

Wacha tuangalie sifa muhimu zaidi za kitendakazi cha usambazaji wa uwezekano:

  1. F(x) ni chaguo la kukokotoa lisilopungua.
  2. F (- ∞) = 0.
  3. F (+ ∞) = 1.

Dhana ya chaguo za kukokotoa za usambazaji ni msingi wa nadharia ya uwezekano. Kwa kutumia dhana hii, tunaweza kutoa ufafanuzi mwingine wa kutofautiana kwa nasibu endelevu. Tofauti nasibu inaitwa kuendelea ikiwa kitendakazi chake limbikizi cha usambazaji F(x) ni endelevu.

Sifa za nambari za vigeu vya nasibu vinavyoendelea

Matarajio ya hisabati, mtawanyiko na vigezo vingine vya vigeuzo vyovyote vya nasibu karibu kila mara huhesabiwa kwa kutumia fomula zinazotokana na sheria ya usambazaji.

Kwa tofauti inayoendelea ya nasibu, matarajio ya hisabati huhesabiwa kwa kutumia fomula:

M(X) = ∫ x f(x) dx

Utawanyiko:

D (X) = ∫ ( x- M (X)) 2 f(x) dx au D(X) = ∫ x 2 f(x) dx - (M (X)) 2

2. Urejeshaji wa mstari

Acha vijenzi X na Y vya kigezo cha nasibu chenye pande mbili (X, Y) kiwe tegemezi. Tutafikiria kuwa moja yao inaweza kuwakilishwa takriban kama kazi ya mstari wa nyingine, kwa mfano

Y ≈ g(Х) = α + βХ, na tunaamua vigezo α na β kwa kutumia njia ya angalau mraba.

Ufafanuzi. Chaguo za kukokotoa g(Х) = α + βХ inaitwa makadirio bora Y kwa maana ya mbinu ya angalau miraba, ikiwa matarajio ya hisabati M(Y - g(X)) 2 inachukua thamani ndogo iwezekanavyo; kazi g(X) inaitwa maana ya kurudi nyuma kwa mraba Y hadi X.

Nadharia Urejeshaji wa wastani wa mraba wa Y kwenye X una fomu:

iko wapi mgawo wa uunganisho wa X na Y.

Migawo ya milinganyo.

Inaweza kuthibitishwa kuwa kwa maadili haya chaguo za kukokotoa F(α, β)

F(α, β ) = M(Y - α - βX)² ina kiwango cha chini, ambacho kinathibitisha nadharia.

Ufafanuzi. Mgawo unaitwa mgawo wa urekebishaji Y kwenye X, na mstari ulionyooka -- rejeshi la wastani la mraba la Y kwenye X.

Kwa kubadilisha viwianishi vya sehemu ya kusimama katika usawa, tunaweza kupata thamani ya chini ya chaguo za kukokotoa F(α, β), sawa na Kiasi hiki kinaitwa. tofauti ya mabaki Y inahusiana na X na inaangazia kiwango cha makosa kinachoruhusiwa wakati wa kubadilisha Y na

g(X) = α+βX. Wakati tofauti iliyobaki ni sawa na 0, ambayo ni, usawa sio makadirio, lakini ni sawa. Kwa hivyo, kwa Y na X zinahusiana na utegemezi wa kazi wa mstari. Vivyo hivyo, unaweza kupata rejista ya moja kwa moja ya mraba ya X kwenye Y:

na tofauti iliyobaki ya X inayohusiana na Y. Katika hali zote mbili za kurudi nyuma zinalingana. Kwa kulinganisha hesabu za urekebishaji Y kwenye X na X kwenye Y na kusuluhisha mfumo wa equations, unaweza kupata hatua ya makutano ya mistari ya rejista - hatua na kuratibu (m x, m y), inayoitwa. katikati ya usambazaji wa pamoja wa maadili ya X na Y.

Tutazingatia algoriti ya kutunga milinganyo ya urejeshi kutoka kwa kitabu cha kiada cha V. E. Gmurman "Nadharia ya Uwezekano na Takwimu za Hisabati" uk. 256.

1) Chora jedwali la hesabu ambalo nambari za vipengee vya sampuli, chaguzi za sampuli, miraba yao na bidhaa zitarekodiwa.

2) Hesabu jumla ya safu wima zote isipokuwa nambari.

3) Kukokotoa thamani za wastani kwa kila thamani, tofauti na mikengeuko ya kawaida.

5) Jaribu dhana juu ya kuwepo kwa uhusiano kati ya X na Y.

6) Unda milinganyo kwa mistari yote miwili ya rejista na chora grafu za milinganyo hii.

Mteremko wa laini ya regression ya moja kwa moja Y kwenye X ni sampuli ya mgawo wa rejista

Mgawo b=

Tunapata equation inayohitajika kwa safu ya rejista ya Y kwenye X:

Y = 0.202 X + 1.024

Equation ya rejista ya X kwenye Y ni sawa:

Mteremko wa laini ya rejista moja kwa moja ya Y kwenye X ni sampuli ya mgawo wa rejista:

Mgawo b=

X = 4.119U - 3.714

3. Urejeshaji usio na mstari

Ikiwa kuna uhusiano usio na mstari kati ya matukio ya kiuchumi, basi huonyeshwa kwa kutumia kazi zinazofanana zisizo za mstari.

Kuna aina mbili za rejista zisizo za mstari:

1. Marekebisho ambayo hayana mstari kuhusiana na vigezo vya maelezo vilivyojumuishwa katika uchanganuzi, lakini vinafuatana kwa kuzingatia vigezo vilivyokadiriwa, kwa mfano:

Polynomials ya digrii tofauti

Hyperbola ya usawa -;

Kazi ya semilogarithmic -.

2. Marekebisho ambayo hayana mstari kulingana na vigezo vinavyokadiriwa, kwa mfano:

Nguvu -;

Kuonyesha -;

Kielelezo -.

Marekebisho ambayo hayana mstari kwa heshima na vigeu vilivyojumuishwa huletwa kwa fomu ya mstari kwa kubadilisha tu vigeu, na ukadiriaji zaidi wa vigezo unafanywa kwa kutumia njia ya angalau mraba. Hebu tuangalie baadhi ya vipengele.

Parabola ya shahada ya pili imepunguzwa kwa fomu ya mstari kwa kutumia uingizwaji:. Kama matokeo, tunafika kwenye equation ya sababu mbili, makadirio ya vigezo ambavyo kwa kutumia Njia ya Angalau ya Mraba husababisha mfumo wa hesabu:

Kielelezo cha shahada ya pili kawaida hutumiwa katika hali ambapo, kwa muda fulani wa maadili ya sababu, asili ya uhusiano kati ya sifa zinazozingatiwa hubadilika: uunganisho wa moja kwa moja hubadilika ili kurudi nyuma au kinyume na moja kwa moja.

Hyperbola ya usawa inaweza kutumika kuashiria uhusiano kati ya gharama maalum za malighafi, malighafi, mafuta na kiasi cha pato, wakati wa mzunguko wa bidhaa na kiasi cha mauzo. Mfano wake wa kawaida ni mkunjo wa Phillips, unaoangazia uhusiano usio na mstari kati ya kiwango cha ukosefu wa ajira x na asilimia ya ukuaji wa mishahara y.

Hyperbola inapunguzwa hadi mlingano wa mstari kwa uingizwaji rahisi:. Unaweza pia kutumia Mbinu ya Angalau Mraba kuunda mfumo wa milinganyo ya mstari.

Kwa njia sawa, utegemezi hupunguzwa kwa fomu ya mstari:, na wengine.

Hyperbola equilateral na mkunjo wa nusu-logarithmic hutumiwa kuelezea mkunjo wa Engel (maelezo ya hisabati ya uhusiano kati ya sehemu ya matumizi ya bidhaa za kudumu na jumla ya matumizi (au mapato)). Milinganyo ambayo huingia hutumika katika masomo ya tija na nguvu ya kazi ya uzalishaji wa kilimo.

4. Rejea nyingi

Rejea nyingi ni usawa wa uhusiano na anuwai kadhaa huru:

iko wapi tofauti tegemezi (sifa ya matokeo);

Vigezo vya kujitegemea (sababu).

Ili kuunda equation nyingi za rejista, kazi zifuatazo hutumiwa mara nyingi:

mstari -

nguvu -

kielelezo -

hyperbole -.

Unaweza kutumia vitendaji vingine ambavyo vinaweza kupunguzwa hadi fomu ya mstari.

Ili kukadiria vigezo vya mlingano wa regression nyingi, mbinu ya angalau mraba (OLS) inatumiwa. Kwa hesabu za mstari na hesabu zisizo za mstari zinazoweza kupunguzwa kwa zile za mstari, mfumo ufuatao wa hesabu za kawaida hujengwa, suluhisho ambalo huturuhusu kupata makadirio ya vigezo vya rejista:

Ili kuisuluhisha, njia ya viashiria inaweza kutumika:

iko wapi kiashiria cha mfumo;

Wahitimu maalum; ambazo hupatikana kwa kubadilisha safu wima inayolingana ya matriki ya kibainishi cha mfumo na data iliyo upande wa kushoto wa mfumo.

Aina nyingine ya mlinganyo wa urejeleaji nyingi ni mlinganyo wa urejeleaji kwenye mizani iliyosanifiwa; OLS inatumika kwa mlingano wa urejeleaji nyingi kwenye mizani iliyosanifiwa.

5.MatumiziMSEXCELkufanya uchambuzi wa urejeshaji

Uchanganuzi wa urejeshaji huanzisha aina za utegemezi kati ya kutofautisha kwa nasibu Y (tegemezi) na maadili ya idadi moja au zaidi tofauti (huru), na maadili ya mwisho yanazingatiwa kubainishwa kwa usahihi. Utegemezi kama huo kawaida huamuliwa na muundo fulani wa hisabati (mlinganyo wa rejista) iliyo na vigezo kadhaa visivyojulikana. Wakati wa uchambuzi wa urejeshaji, kulingana na data ya sampuli, makadirio ya vigezo hivi hupatikana, makosa ya takwimu katika makadirio au mipaka ya vipindi vya kujiamini imedhamiriwa, na kufuata (kutosha) kwa mfano uliopitishwa wa hisabati na data ya majaribio huangaliwa.

Katika uchanganuzi wa urejeshaji wa mstari, uhusiano kati ya vigeu vya nasibu huchukuliwa kuwa mstari. Katika kesi rahisi zaidi, katika mfano wa urejeshaji wa mstari wa paired kuna vigezo viwili X na Y. Na inahitajika kujenga (kufaa) mstari wa moja kwa moja kwa kutumia n jozi za uchunguzi (X1, Y1), (X2, Y2), .. ., (Xn, Yn), iitwayo laini ya rejista ambayo "bora" inakadiria maadili yaliyozingatiwa. Mlinganyo wa mstari huu y=ax+b ni mlinganyo wa rejista. Kwa kutumia equation ya rejista, unaweza kutabiri thamani inayotarajiwa ya kigezo tegemezi y kinacholingana na thamani fulani ya tofauti huru x. Katika kesi wakati utegemezi kati ya tofauti tegemezi ya Y na vigezo kadhaa vya kujitegemea X1, X2, ..., Xm inazingatiwa, tunazungumza juu ya urejeshaji wa safu nyingi.

Katika kesi hii, equation ya regression ina fomu

y = a 0 +a 1 x 1 +a 2 x 2 +…+a m x m ,

ambapo a0, a1, a2, …, am ni hesabu za rejista ambazo zinahitaji uamuzi.

Viwango vya mlinganyo wa urejeshi huamuliwa kwa kutumia mbinu ya miraba ndogo zaidi, kufikia kiwango cha chini kabisa kinachowezekana cha tofauti za mraba kati ya thamani halisi za utofauti wa Y na zile zinazokokotolewa kutoka kwa mlinganyo wa rejista. Kwa hivyo, kwa mfano, usawa wa regression wa mstari unaweza kujengwa hata katika kesi ambapo hakuna uunganisho wa mstari.

Kipimo cha ufanisi wa mtindo wa kurejesha ni mgawo wa uamuzi R2 (R-mraba). Mgawo wa uamuzi unaweza kuchukua maadili kati ya 0 na 1; huamua kiwango cha usahihi ambacho equation ya urejeshaji inayotokana inaelezea (takriban) data asili. Umuhimu wa kielelezo cha urejeshi pia huchunguzwa kwa kutumia jaribio la F (Fisher) na kutegemewa kwa tofauti kati ya viambajengo a0, a1, a2, ..., am na sifuri huangaliwa kwa kutumia mtihani wa t wa Mwanafunzi.

Katika Excel, data ya majaribio inakadiriwa na mlinganyo wa mstari hadi mpangilio wa 16:

y = a0+a1x1+a2x2+…+a16x16

Ili kupata mgawo wa urejeshaji wa mstari, utaratibu wa "Regression" kutoka kwa kifurushi cha uchanganuzi unaweza kutumika. Pia, taarifa kamili kuhusu mlingano wa rejista ya mstari hutolewa na chaguo la kukokotoa la LINEST. Kwa kuongezea, kazi za SLOPE na INTERCEPT zinaweza kutumika kupata vigezo vya equation ya rejista, na kazi za TREND na FORECAST zinaweza kutumika kupata maadili ya Y yaliyotabiriwa kwa pointi zinazohitajika (kwa urekebishaji wa jozi).

Hebu tuzingatie kwa kina matumizi ya chaguo za kukokotoa za LINEST (inayojulikana_y, [inayojulikana_x], [mara kwa mara], [takwimu]): inayojulikana_y - anuwai ya thamani zinazojulikana za kigezo tegemezi cha Y. Katika uchanganuzi wa urejeshi uliooanishwa inaweza kuwa na yoyote fomu; katika wingi lazima iwe safu au safu; inayojulikana_x - safu ya thamani zinazojulikana za kigezo kimoja au zaidi huru. Lazima iwe na sura sawa na safu ya Y (kwa vigezo kadhaa - safu kadhaa au safu, kwa mtiririko huo); mara kwa mara ni hoja yenye mantiki. Ikiwa, kwa msingi wa maana ya vitendo ya shida ya uchanganuzi wa rejista, ni muhimu kwamba mstari wa rejista upitie asili, ambayo ni, mgawo wa bure ni sawa na 0, thamani ya hoja hii inapaswa kuwekwa sawa na 0 (au " uongo"). Ikiwa thamani imewekwa kwa 1 (au kweli) au imeachwa, basi mgawo wa bure huhesabiwa kwa njia ya kawaida; takwimu ni hoja yenye mantiki. Ikiwa thamani imewekwa kuwa 1 (au "kweli"), basi takwimu za urejeshaji zinarejeshwa (angalia jedwali) zinazotumiwa kutathmini ufanisi na umuhimu wa muundo. Kwa ujumla, kwa urejeshaji wa jozi y=ax+b, matokeo ya kutumia kitendakazi cha LINEST yana fomu:

Jedwali. Aina ya matokeo ya chaguo za kukokotoa za LINEST kwa uchanganuzi wa urejeshaji wa jozi

Katika hali ya uchanganuzi wa urejeshaji nyingi wa equation y=a0+a1x1+a2x2+…+amxm, mstari wa kwanza unaonyesha vipatanishi am,…,a1,a0, na mstari wa pili unaonyesha makosa ya kawaida ya vigawo hivi. Safu mlalo ya 3-5, bila kujumuisha safu wima mbili za kwanza zilizojazwa takwimu za urejeshaji, zitarejesha #N/A.

Chaguo za kukokotoa za LINEST zinapaswa kuandikwa kama fomula ya safu, kwanza ikichagua safu ya ukubwa unaohitajika kwa matokeo (safu wima m+1 na safu mlalo 5 ikiwa takwimu za urejeshaji zinahitajika) na kukamilisha uingizaji wa fomula kwa kubofya CTRL+SHIFT+ENTER. .

Matokeo kwa mfano wetu:

Kwa kuongeza, programu ina kazi iliyojengwa - Uchambuzi wa Data kwenye kichupo cha Data.

Inaweza pia kutumika kufanya uchambuzi wa rejista:

Slaidi inaonyesha matokeo ya uchanganuzi wa urejeleaji uliofanywa kwa kutumia Uchanganuzi wa Data.

HITIMISHO LA MATOKEO

Takwimu za kurudi nyuma

Wingi R

R-mraba

R-mraba ya kawaida

Hitilafu ya kawaida

Uchunguzi

Uchambuzi wa tofauti

Umuhimu F

Kurudi nyuma

Odd

Hitilafu ya kawaida

T-takwimu

Thamani ya P

Chini 95%

95% ya juu

Chini 95.0%

Juu 95.0%

Makutano ya Y

Kigezo cha X 1

Milinganyo ya urekebishaji ambayo tuliangalia hapo awali pia iliundwa katika MS Excel. Ili kuzitekeleza, kwanza jenga Chati ya Kutawanya, kisha kupitia menyu ya muktadha chagua - Ongeza Mstari wa Mwenendo. Katika dirisha jipya, chagua kisanduku - Onyesha mlinganyo kwenye mchoro na uweke thamani ya kutegemewa ya kukadiria (R^2) kwenye mchoro.

Fasihi:

  1. Nadharia ya Uwezekano na Takwimu za Hisabati. Gmurman V. E. Kitabu cha maandishi kwa vyuo vikuu. - Mh. ya 10, imefutwa. - M.: Juu zaidi. shule, 2010. - 479 p.
  2. Hisabati ya juu katika mazoezi na matatizo. Kitabu cha maandishi kwa vyuo vikuu / Danko P. E., Popov A. G., Kozhevnikova T. Ya., Danko S. P. Katika masaa 2 - Ed. 6, kufutwa. - M.: Onyx Publishing House LLC: Mir na Education Publishing House LLC, 2007. - 416 p.
    1. 3. http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8 %D1%8F - habari fulani juu ya uchambuzi wa urejeshaji