Wasifu Sifa Uchambuzi

Mfano wa urejeshaji nyingi. Utangulizi wa Marudio Mengi

Nyenzo hiyo itaonyeshwa kwa mfano mtambuka: utabiri wa mauzo ya OmniPower. Fikiria kuwa wewe ni meneja wa uuzaji wa msururu mkubwa wa mboga wa kitaifa. KATIKA miaka iliyopita baa za lishe zimeonekana kwenye soko zenye idadi kubwa ya mafuta, wanga na kalori. Wanakuruhusu kurejesha haraka akiba ya nishati inayotumiwa na wakimbiaji, wapanda farasi na wanariadha wengine wakati wa mafunzo na mashindano magumu. Uuzaji wa baa za lishe umekua kwa kasi katika miaka ya hivi karibuni, na usimamizi wa OmniPower umefikia hitimisho kwamba sehemu hii ya soko inaahidi sana. Kabla ya kuanzisha aina mpya ya pipi katika soko la kitaifa, kampuni ingependa kutathmini athari za gharama na gharama za utangazaji kwenye mauzo. Maduka 34 yalichaguliwa kwa ajili ya utafiti wa masoko. Unahitaji kuunda modeli ya urejeshaji ambayo inakuruhusu kuchanganua data iliyopatikana kutoka kwa utafiti. Inawezekana kutumia modeli rahisi ya rejista iliyojadiliwa katika chapisho lililopita kwa hili? Inapaswa kubadilishwaje?

Muundo wa kurejesha hali nyingi

Kwa utafiti wa uuzaji, OmniPower iliunda sampuli ya maduka 34 yenye takriban viwango sawa vya mauzo. Fikiria anuwai mbili huru - bei ya upau wa OmniPower kwa senti ( X 1) na bajeti ya mwezi kampeni ya matangazo iliyofanywa katika duka, iliyoonyeshwa kwa dola ( X 2) Bajeti hii inajumuisha gharama za alama na maonyesho, pamoja na kuponi na sampuli za bure. Kigezo Tegemezi Y inawakilisha idadi ya baa za OmniPower zinazouzwa kwa mwezi (Mchoro 1).

Mchele. 1. Kiasi cha mauzo ya kila mwezi cha baa za OmniPower, bei yake na gharama za utangazaji

Pakua noti katika au umbizo, mifano katika umbizo

Ufafanuzi wa mgawo wa urejeshaji. Ikiwa vigezo vingi vya maelezo vinachunguzwa katika tatizo, mtindo rahisi wa urejeshaji wa mstari unaweza kupanuliwa ili kudhani kuwa kuna uhusiano kati ya majibu na kila moja ya vigeu vinavyojitegemea. utegemezi wa mstari. Kwa mfano, ikiwa kuna k vigezo vya maelezo, modeli nyingi za urejeshaji za mstari huchukua fomu:

(1) Y i = β 0 + β 1 X 1i + β 2 X 2i + … + β k X ki + ε i

Wapi β 0 - kuhama, β 1 - mteremko wa mstari wa moja kwa moja Y, kulingana na kutofautiana X 1, ikiwa vigezo X 2, X 3, …, X k ni za kudumu β 2 - mteremko wa mstari wa moja kwa moja Y, kulingana na kutofautiana X 2, ikiwa vigezo Х 1, Х 3, ..., Х k ni za kudumu β k- mteremko wa mstari wa moja kwa moja Y, kulingana na kutofautiana X k, ikiwa vigezo X 1, X 2, …, X k-1 ni za kudumu ε i Y V i-m uchunguzi.

Hasa, mfano wa rejista nyingi na vijiti viwili vya maelezo:

(2) Y i = β 0 + β 1 X 1 i + β 2 X 2 i + e

Wapi β 0 - kuhama, β 1 - mteremko wa mstari wa moja kwa moja Y, kulingana na kutofautiana X 1, ikiwa inabadilika X 2 ni ya kudumu β 2 - mteremko wa mstari wa moja kwa moja Y, kulingana na kutofautiana X 2, ikiwa inabadilika X 1 ni ya kudumu ε i- hitilafu ya kutofautiana bila mpangilio Y V i-m uchunguzi.

Wacha tulinganishe modeli hii ya rejista nyingi na modeli rahisi ya rejista ya laini: Y i = β 0 + β 1 Xi + e. Katika mfano rahisi wa urejeshaji wa mstari, mteremko β 1 Y wakati thamani ya kutofautiana X inabadilika kwa moja na haizingatii ushawishi wa mambo mengine. Katika modeli nyingi za rejista na vigeu viwili huru (2), mteremko β 1 inawakilisha mabadiliko katika thamani ya wastani ya kigezo Y wakati wa kubadilisha thamani ya kutofautisha X 1 kwa kila kitengo kwa kuzingatia ushawishi wa kutofautisha X 2. Thamani hii inaitwa mgawo safi wa regression (au urejeshaji sehemu).

Kama ilivyo katika modeli rahisi ya urejeshaji rejea, sampuli za mgawo wa rejista b 0 , b 1 , Na b 2 kuwakilisha makadirio ya vigezo vya idadi ya watu inayolingana β 0 , β 1 Na β 2 .

Mlinganyo wa rejista nyingi na anuwai mbili huru:

(3) = b 0 + b 1 X 1 i + b 2 X 2 i

Ili kuhesabu coefficients ya regression, njia hutumiwa angalau mraba. Katika Excel unaweza kutumia Mfuko wa uchambuzi, chaguo Kurudi nyuma. Tofauti na kupanga njama ya urekebishaji wa mstari, weka tu kama Muda wa kuingiza X eneo ambalo linajumuisha vigezo vyote vya kujitegemea (Mchoro 2). Katika mfano wetu ni $C$1:$D$35.

Mchele. 2. Dirisha la Urejeshaji wa Kundi Uchambuzi wa Excel

Matokeo ya Kifurushi cha Uchambuzi yanawasilishwa kwenye Mtini. 3. Kama tunavyoona, b 0 = 5 837,52, b 1 = -53.217 na b 2 = 3.163. Kwa hivyo, = 5 837,52 –53,217 X 1 i + 3,163 X 2 i, Wapi Ŷ i- kiasi cha mauzo kilichotabiriwa cha baa za lishe za OmniPower ndani i duka (vipande), X 1i- bei ya baa ya pipi (kwa senti) ndani i duka, X 2i- gharama za matangazo ya kila mwezi i duka (kwa dola).

Mchele. 3. Utafiti mwingi wa urejeshaji wa kiasi cha mauzo ya baa za OmniPower

Teule ya kuchagua b 0 ni sawa na 5,837.52 na ni makadirio ya idadi ya wastani ya baa za OmniPower zinazouzwa kwa mwezi kwa bei sifuri na hakuna gharama za utangazaji. Kwa kuwa hali hizi hazina maana, katika hali hii ukubwa wa mteremko b 0 haina tafsiri ya maana.

Teule ya kuchagua b 1 sawa na -53.217. Hii ina maana kwamba kwa matumizi ya kila mwezi ya utangazaji, ongezeko la senti moja la bei ya baa ya peremende itasababisha kupungua kwa mauzo yanayotarajiwa ya vipande 53,217. Vile vile, mteremko wa sampuli b 2 , sawa na 3.613, ina maana kwamba wakati bei ya kudumu Ongezeko la gharama za kila mwezi za matangazo ya dola moja linaambatana na ongezeko la mauzo yanayotarajiwa ya baa ya pipi ya uniti 3,613. Makadirio haya hutoa maarifa kuhusu athari za bei na utangazaji kwenye mauzo. Kwa mfano, kwa kiasi fulani cha gharama za utangazaji, kupungua kwa bei ya baa ya pipi kwa senti 10 kutaongeza mauzo kwa vitengo 532.173, na kwa bei ya kudumu ya baa ya pipi, ongezeko la gharama za matangazo kwa $ 100 litaongeza mauzo. kwa vitengo 361.31.

Kutafsiri miteremko katika modeli nyingi za rejista. Coefficients katika muundo wa regression nyingi huitwa coefficients safi ya regression. Wanakadiria mabadiliko ya wastani katika majibu Y wakati wa kubadilisha thamani X kwa moja ikiwa vigezo vingine vyote vya maelezo "vimegandishwa". Kwa mfano, katika tatizo la upau wa pipi wa OmniPower, duka lililo na matumizi yasiyobadilika ya kila mwezi ya utangazaji linaweza kuuza peremende chache 53,217 ikiwa ingeongeza bei yake kwa senti moja. Tafsiri nyingine ya coefficients hizi inawezekana. Hebu fikiria maduka yanayofanana na kiasi sawa cha matumizi ya utangazaji. Ikiwa bei ya baa ya peremende itapungua kwa senti moja, mauzo katika maduka haya yataongezeka kwa pipi 53,217. Sasa fikiria maduka mawili ambayo bei ya baa ni sawa, lakini gharama za matangazo ni tofauti. Ikiwa gharama hizi zitaongezeka kwa dola moja, mauzo katika maduka haya yataongezeka kwa vitengo 3,613. Kama tunavyoona, tafsiri ya busara ya mteremko inawezekana tu chini ya vizuizi fulani vilivyowekwa kwenye anuwai ya maelezo.

Kutabiri maadili ya kutofautisha tegemezi Y. Baada ya kubaini kuwa data iliyokusanywa huturuhusu kutumia modeli nyingi za urejeshaji, tunaweza kutabiri kiasi cha mauzo ya kila mwezi cha pau za OmniPower na kuunda vipindi vya kujiamini kwa wastani na kiasi cha mauzo kilichotabiriwa. Ili kutabiri wastani wa mauzo ya kila mwezi ya baa za OmniPower zilizo na bei ya senti 79 kwenye duka ambalo linatumia $400 kwa mwezi kwenye matangazo, tumia usawa wa regression nyingi: Y = 5,837.53 - 53.2173*79 + 3.6131*400 = 3,079 kiasi cha mauzo. katika maduka ya kuuza baa za OmniPower kwa bei ya senti 79 na kutumia $400 kwa mwezi kwa matangazo ni 3,079 units.

Baada ya kuhesabu thamani Y na kukadiria mabaki, inawezekana kuunda vipindi vya kujiamini vilivyo na thamani inayotarajiwa na thamani ya majibu iliyotabiriwa. tulichunguza utaratibu huu ndani ya modeli rahisi ya rejista ya mstari. Walakini, kuunda makadirio sawa kwa modeli nyingi za rejista kunahusishwa na shida kubwa za hesabu na hazijawasilishwa hapa.

Mgawo mwingi wa uunganisho mchanganyiko. Kumbuka kuwa mfano wa rejista hukuruhusu kuhesabu mgawo mchanganyiko wa uunganisho r 2. Kwa kuwa kuna angalau vigeu viwili vya maelezo katika modeli ya urejeshaji nyingi, mgawo wa uunganisho mwingi wa mchanganyiko unawakilisha sehemu ya tofauti katika utofautishaji. Y, iliyofafanuliwa na seti fulani ya anuwai ya maelezo:

Wapi SSR- jumla ya mraba wa kurudi nyuma, SSTJumla mraba.

Kwa mfano, katika shida ya mauzo ya bar ya OmniPower SSR = 39 472 731, SST= 52,093,677 na k = 2. Hivyo,

Hii ina maana kwamba 75.8% ya tofauti katika kiasi cha mauzo inaelezwa na mabadiliko ya bei na kushuka kwa matumizi ya matangazo.

Uchanganuzi wa mabaki ya modeli nyingi za rejista

Uchanganuzi wa mabaki hukuruhusu kubaini ikiwa muundo wa rejista nyingi na vielelezo viwili (au zaidi) vya maelezo vinaweza kutumika. Kama sheria, wanafanya aina zifuatazo uchambuzi wa mabaki:

Grafu ya kwanza (Mchoro 4a) inakuwezesha kuchambua usambazaji wa mabaki kulingana na maadili yaliyotabiriwa. Ikiwa ukubwa wa mabaki hautegemei maadili yaliyotabiriwa na inachukua chanya na maadili hasi(kama katika mfano wetu), hali ya utegemezi wa mstari wa kutofautisha Y kutoka kwa vigezo vyote viwili vya maelezo imeridhika. Kwa bahati mbaya, katika Mfuko wa uchambuzi Kwa sababu fulani grafu hii haijaundwa. Inawezekana kwenye dirisha Kurudi nyuma(tazama Mchoro 2) wezesha Mabaki. Hii itawawezesha kuonyesha meza na mizani, na kisha kujenga kutoka humo njama ya kutawanya(Mchoro 4).

Mchele. 4. Utegemezi wa mabaki kwenye thamani iliyotabiriwa

Grafu ya pili na ya tatu inaonyesha utegemezi wa mabaki kwenye vigezo vya maelezo. Viwanja hivi vinaweza kuonyesha athari ya quadratic. Katika hali hii, inahitajika kuongeza utofauti wa maelezo ya mraba kwa modeli nyingi za rejista. Grafu hizi hutolewa na Kifurushi cha Uchambuzi (ona Mchoro 2) ikiwa utawezesha chaguo la Grafu ya Mabaki (Mchoro 5).

Mchele. 5. Utegemezi wa salio kwa bei na gharama za matangazo

Kujaribu umuhimu wa modeli nyingi za urejeshaji.

Mara tu unapothibitisha kuwa modeli ya urejeshaji nyingi ya mstari inatosha kupitia uchanganuzi wa mabaki, unaweza kubaini kama kuna uhusiano muhimu wa kitakwimu kati ya utofauti tegemezi na seti ya vigeu vya maelezo. Kwa kuwa kielelezo kinajumuisha vigezo kadhaa vya maelezo, dhana potofu na mbadala zimeundwa kama ifuatavyo: H 0: β 1 = β 2 = ... = β k = 0 (hakuna uhusiano wa mstari kati ya majibu na vigezo vya maelezo), H 1: kuna angalau thamani moja β j ≠ 0 (kuna uhusiano wa mstari kati ya jibu na angalau kigezo kimoja cha maelezo).

Ili kujaribu nadharia tupu, tumia F-kigezo - mtihani F-takwimu ni sawa na wastani wa mraba uliowekwa na rejista (MSR) iliyogawanywa na tofauti za makosa (MSE):

Wapi F F- usambazaji na k Na n – k – 1 viwango vya uhuru, k - idadi ya vigezo huru katika modeli ya urejeleaji.

Kanuni ya uamuzi ni kama ifuatavyo: katika kiwango cha umuhimu α, hypothesis isiyofaa H 0 kukataliwa kama F > F U(k,n – k – 1), vinginevyo hypothesis H 0 haijakataliwa (Mchoro 6).

Mchele. 6. Jedwali la muhtasari wa uchambuzi wa tofauti ili kupima hypothesis kuhusu umuhimu wa takwimu mgawo wa regression nyingi

Jedwali la muhtasari wa ANOVA limekamilika kwa kutumia Mfuko wa uchambuzi Excel wakati wa kutatua tatizo la kuuza baa za OmniPower inavyoonyeshwa kwenye Mtini. 3 (tazama eneo A10:F14). Ikiwa kiwango cha umuhimu ni 0.05, thamani muhimu F-usambazaji wenye digrii mbili na 31 za uhuru F U(2.31)= F.OBR (1-0.05;2;31) = sawa na 3.305 (Mchoro 7).

Mchele. 7. Kujaribu dhahania kuhusu umuhimu wa mgawo wa urejeshaji katika kiwango cha umuhimu cha α = 0.05, na uhuru wa digrii 2 na 31.

Kama inavyoonyeshwa kwenye Mtini. 3, F-takwimu ni 48.477 > F U(2.31)= 3.305, a uk-thamani ya karibu 0,000< 0,05. Следовательно, нулевая гипотеза Н 0 отклоняется, и объем продаж линейно связан хотя бы с одной из объясняющих переменных (ценой и/или затратами на рекламу).

Maoni ya takwimu kuhusu mgawo wa rejista ya idadi ya watu

Ili kutambua uhusiano muhimu wa kitakwimu kati ya vigezo X Na Y kwa mfano rahisi wa urejeshaji wa mstari, mtihani wa nadharia ya mteremko ulifanyika. Kwa kuongeza, kukadiria mteremko wa idadi ya watu, a muda wa kujiamini(sentimita. ).

Dhana za kupima. Ili kupima dhana kwamba mteremko wa idadi ya watu β 1 katika muundo rahisi wa urejeshaji wa mstari ni sifuri, tumia fomula t = (b 1 – β 1)/S b 1 . Inaweza kupanuliwa kwa modeli nyingi za rejista:

Wapi t ni takwimu ya mtihani ambayo ina t- usambazaji na n – k – 1 viwango vya uhuru, b j- mteremko wa kutofautiana Xj kuhusiana na kutofautiana Y, ikiwa vigezo vingine vyote vya maelezo ni vya kudumu, S bj- hitilafu ya mzizi wa maana ya mraba ya mgawo wa kurejesha b j, k- idadi ya vigeu vya maelezo katika mlinganyo wa urejeshi, β j - mteremko dhahania wa idadi ya majibu j th inayohusiana na kutofautisha wakati vigeu vingine vyote vimewekwa.

Katika Mtini. 3 (meza ya chini) inaonyesha matokeo ya maombi t-vigezo (vilivyopatikana kwa kutumia Mfuko wa uchambuzi) kwa kila moja ya vigeu vinavyojitegemea vilivyojumuishwa kwenye modeli ya rejista. Kwa hivyo, ikiwa unahitaji kuamua ikiwa kutofautisha kuna X 2(gharama za utangazaji) athari kubwa kwa kiasi cha mauzo kwa bei maalum ya upau wa OmniPower, dhana potofu na mbadala zimeundwa: H 0: β2 = 0, H 1: β2 ≠ 0. Kwa mujibu wa fomula (6), tunapata :

Ikiwa kiwango cha umuhimu ni 0.05, maadili muhimu t-usambazaji wenye digrii 31 za uhuru ni t L = STUDENT.ORR(0.025,31) = -2.0395 na t U = STUDENT.ORR(0.975,31) = 2.0395 (Mchoro 8). R-thamani = 1- STUDENT.DIST(5.27;31;TRUE) na inakaribia 0.0000. Kulingana na moja ya ukosefu wa usawa t= 5.27 > 2.0395 au R = 0,0000 < 0,05 нулевая гипотеза H 0 kukataliwa. Kwa hiyo, kwa bei ya kudumu ya bar ya pipi kati ya kutofautiana X 2(gharama za matangazo) na kiasi cha mauzo kuna uhusiano muhimu wa kitakwimu. Kwa hivyo, kuna uwezekano mdogo sana wa kukataa nadharia tupu, ikiwa hakuna uhusiano wa mstari kati ya gharama za utangazaji na kiasi cha mauzo.

Mchele. 8. Kujaribu dhahania kuhusu umuhimu wa mgawo wa rejeshi katika kiwango cha umuhimu cha α = 0.05, chenye digrii 31 za uhuru.

Kujaribu umuhimu wa misimbo mahususi ya urejeleaji kwa kweli ni kujaribu dhahania juu ya umuhimu wa kigezo mahususi kilichojumuishwa katika muundo wa rejista pamoja na zingine. Kwa hivyo, t-kigezo cha kupima dhahania kuhusu umuhimu wa mgawo wa urejeshi ni sawa na kupima dhahania kuhusu ushawishi wa kila moja ya vigeu vya maelezo.

Vipindi vya kujiamini. Badala ya kujaribu dhana kuhusu mteremko wa idadi ya watu, mtu anaweza kukadiria thamani ya mteremko huo. Mfano wa urejeshaji nyingi hutumia fomula kuunda muda wa kujiamini:

(7) b j ± tnk –1 S bj

Wacha tutumie fomula hii kuunda muda wa kujiamini wa 95% ulio na mteremko wa idadi ya watu β 1 (athari ya bei X 1 kwa kiasi cha mauzo Y na kiasi kisichobadilika cha gharama za utangazaji X 2) Kwa kutumia formula (7) tunapata: b 1 ± tnk –1 S b 1 . Kwa sababu ya b 1 = -53.2173 (tazama Mchoro 3), S b 1 = 6.8522, thamani muhimu t- takwimu kwa 95% kiwango cha kujiamini na digrii 31 za uhuru tnk –1 = STUDENT.OBR(0.975,31) = 2.0395, tunapata:

–53.2173 ± 2.0395*6.8522

-53.2173 ± 13.9752

-67.1925 ≤ β 1 ≤ -39.2421

Kwa hivyo, kwa kuzingatia athari za gharama za matangazo, inaweza kusema kuwa kwa kuongezeka kwa bei ya bar ya pipi kwa senti moja, kiasi cha mauzo hupungua kwa kiasi ambacho kinatoka kwa vitengo 39.2 hadi 67.2. Kuna uwezekano wa 95% kwamba muda huu unakadiria kwa usahihi uhusiano kati ya vijiti viwili. Kwa kuwa muda huu wa kutegemewa hauna sifuri, inaweza kubishaniwa kuwa mgawo wa rejista β 1 ​​una athari kubwa kitakwimu kwa kiasi cha mauzo.

Kutathmini umuhimu wa vigeu vya maelezo katika muundo wa urejeshi mwingi

Vigezo hivyo tu vya maelezo ambavyo vinatabiri kwa usahihi thamani ya utofauti tegemezi ndivyo vinavyopaswa kujumuishwa katika muundo wa rejista nyingi. Ikiwa vigezo vyovyote vya maelezo haitimizi mahitaji haya, lazima iondolewe kutoka kwa mfano. Kama njia mbadala ya kukadiria mchango wa kigezo cha maelezo, njia ya sehemu hutumiwa kwa kawaida. F-kigezo. Inajumuisha kutathmini mabadiliko katika jumla ya miraba ya urekebishaji baada ya kujumuisha kigezo kingine kwenye modeli. Tofauti mpya imejumuishwa katika mfano tu wakati inasababisha ongezeko kubwa la usahihi wa utabiri.

Ili kutumia jaribio la F ili kutatua tatizo la mauzo ya baa ya OmniPower, ni muhimu kukadiria mchango wa kutofautisha. X 2(gharama za utangazaji) baada ya kujumuisha utofauti katika muundo X 1(bei ya bar). Ikiwa mfano unajumuisha vigezo kadhaa vya maelezo, mchango wa kutofautiana kwa maelezo Xj inaweza kuamuliwa kwa kuiondoa kutoka kwa modeli na kukadiria jumla ya miraba ya regression (SSR) iliyohesabiwa juu ya vigeu vilivyobaki. Ikiwa mfano unajumuisha vigezo viwili, mchango wa kila mmoja wao umedhamiriwa na fomula:

Ukadiriaji wa mchango wa kigezo X 1 X 2:

(8a) SSR(X 1 | X 2) = SSR(X 1 na X 2) - SSR(X 2)

Ukadiriaji wa mchango wa kigezo X 2 mradi utofauti umejumuishwa kwenye modeli X 1:

(8b) SSR(X 2 |X 1) = SSR(X 1 na X 2) - SSR(X 1)

Kiasi SSR(X 2) Na SSR(X 1) kwa mtiririko huo kuwakilisha jumla ya miraba ya regression iliyohesabiwa kwa moja tu ya vigezo vilivyoelezwa (Mchoro 9).

Mchele. 9. Vigawo vya muundo rahisi wa urejeshaji wa mstari kwa kuzingatia: (a) kiasi cha mauzo na bei ya bar - SSR(X 1); (b) kiasi cha mauzo na gharama za matangazo - SSR(X 2)(imepatikana kwa kutumia Excel Analysis Pack)

Dhana potofu na mbadala kuhusu mchango wa kigezo X 1 zimeundwa kama ifuatavyo: H 0- wezesha kutofautiana X 1 haina kusababisha ongezeko kubwa la usahihi wa mfano unaozingatia kutofautiana X 2; H 1- wezesha kutofautiana X 1 husababisha ongezeko kubwa la usahihi wa mfano ambao kutofautiana huzingatiwa X 2. Takwimu za msingi za kibinafsi F- Vigezo vya vigezo viwili, vilivyohesabiwa na formula:

Wapi MSE- tofauti ya makosa (salio) kwa sababu mbili kwa wakati mmoja. A-kipaumbele F-takwimu zina F-usambazaji na moja na n-k-1 digrii za uhuru.

Kwa hiyo, SSR(X 2)= 14,915,814 (Kielelezo 9), SSR(X 1 na X 2)= 39,472,731 (Mchoro 3, kiini C12). Kwa hivyo, kulingana na formula (8a) tunapata: SSR(X 1 |X 2) = SSR(X 1 na X 2) - SSR(X 2) = 39,472,731 – 14,915,814 = 24,556,917. SSR(X 1 |X 2) = 24,556,917 na MSE (X 1 na X 2) = 407 127 (Mchoro 3, kiini D13), kwa kutumia formula (9), tunapata: F= 24,556,917 / 407,127 = 60.32. Ikiwa kiwango cha umuhimu ni 0.05, basi thamani muhimu F-usambazaji wenye digrii moja na 31 za uhuru =F.OBR(0.95;1;31) = 4.16 (Mchoro 10).

Mchele. 10. Kujaribu dhahania kuhusu umuhimu wa mgawo wa rejeshi katika kiwango cha umuhimu cha 0.05, chenye uhuru wa digrii moja na 31.

Tangu thamani iliyohesabiwa F-takwimu ni kubwa kuliko muhimu (60.32> 4.17), hypothesis H 0 inakataliwa, kwa hiyo, kwa kuzingatia kutofautiana X 1(bei) inaboresha kwa kiasi kikubwa muundo wa rejista ambao tayari unajumuisha kutofautisha X 2(gharama za matangazo).

Vile vile, unaweza kutathmini ushawishi wa kutofautiana X 2(gharama za utangazaji) kwa muundo ambao tayari unajumuisha utofauti X 1(bei). Fanya mahesabu mwenyewe. Hali madhubuti husababisha 27.8> 4.17, na hivyo kujumuisha kigezo. X 2 pia husababisha ongezeko kubwa la usahihi wa mfano, ambayo inazingatia kutofautiana X 1. Kwa hiyo, ikiwa ni pamoja na kila moja ya vigezo inaboresha usahihi wa mfano. Kwa hivyo, bei na gharama za utangazaji lazima zijumuishwe katika modeli nyingi za urejeshaji.

Inafurahisha kwamba maana t-takwimu zilizokokotwa kwa kutumia fomula (6), na thamani ya mgawo F-takwimu, fomula iliyopewa(9) yanahusiana kwa uwazi:

Wapi A- idadi ya digrii za uhuru.

Miundo ya urejeshaji wa utofauti wa dummy na athari za mwingiliano

Wakati wa kujadili mifano mingi ya rejista, tulidhani kuwa kila kigezo huru kilikuwa cha nambari. Hata hivyo, katika hali nyingi ni muhimu kujumuisha vigezo vya kitengo katika mfano. Kwa mfano, katika tatizo la mauzo ya baa ya OmniPower, bei na gharama za utangazaji zilitumika kutabiri wastani wa mauzo ya kila mwezi. Mbali na vigezo hivi vya nambari, unaweza kujaribu kuzingatia eneo la bidhaa ndani ya duka (kwa mfano, kwenye maonyesho au la) katika mfano. Ili kuhesabu anuwai za kitengo katika muundo wa rejista, lazima ujumuishe anuwai za dummy. Kwa mfano, ikiwa tofauti ya maelezo ya kategoria ina aina mbili, tofauti moja ya dummy inatosha kuwawakilisha Xd: Xd= 0 ikiwa uchunguzi ni wa kitengo cha kwanza, Xd= 1 ikiwa uchunguzi ni wa kategoria ya pili.

Ili kuonyesha vigeu vya dummy, fikiria mfano wa kutabiri wastani wa thamani ya mali iliyokadiriwa kulingana na sampuli ya nyumba 15. Kama vigezo vya maelezo, tutachagua eneo la kuishi la nyumba (mita za mraba elfu) na uwepo wa mahali pa moto (Mchoro 11). Tofauti ya dummy X 2(uwepo wa mahali pa moto) hufafanuliwa kama ifuatavyo: X 2= 0, ikiwa hakuna mahali pa moto ndani ya nyumba, X 2= 1 ikiwa nyumba ina mahali pa moto.

Mchele. 11. Thamani iliyokadiriwa iliyotabiriwa na eneo la kuishi na uwepo wa mahali pa moto

Fikiria kuwa mteremko wa thamani iliyopimwa kulingana na eneo la kuishi ni sawa kwa nyumba zilizo na mahali pa moto na zisizo na moto. Halafu mtindo wa rejista nyingi unaonekana kama hii:

Y i = β 0 + β 1 X 1i + β 2 X 2i + ε i

Wapi Y i- thamani iliyopimwa i- nyumba, iliyopimwa ndani maelfu ya dola, β 0 - mabadiliko ya majibu, X 1i, - nafasi ya kuishi i-th nyumba, kipimo katika mita za mraba elfu. miguu, β 1 - mteremko wa thamani inayokadiriwa kulingana na eneo la kuishi la nyumba na thamani ya mara kwa mara ya kutofautisha kwa dummy; X 1i, - tofauti ya dummy inayoonyesha uwepo au kutokuwepo kwa mahali pa moto, β 1 - mteremko wa thamani iliyokadiriwa kulingana na eneo la kuishi la nyumba kwa thamani ya mara kwa mara ya kutofautiana kwa dummy β 2 - athari ya kuongeza thamani ya makadirio ya nyumba kulingana na uwepo wa mahali pa moto wakati thamani ya kudumu nafasi ya kuishi, ε i- hitilafu ya nasibu katika thamani iliyokadiriwa i- nyumba. Matokeo ya kuhesabu muundo wa urekebishaji yanawasilishwa kwenye Mtini. 12.

Mchele. 12. Matokeo ya kukokotoa modeli ya urejeshaji kwa makadirio ya thamani ya nyumba; kupatikana kwa kutumia Mfuko wa uchambuzi katika Excel; Kwa hesabu, meza sawa na Mchoro 1 ilitumiwa. 11, na mabadiliko pekee: "Ndiyo" hubadilishwa na wale, na "Hapana" - kwa zero

Katika mfano huu, mgawo wa rejista hufasiriwa kama ifuatavyo:

  1. Ikiwa kutofautiana kwa dummy ni mara kwa mara, ongezeko la nafasi ya kuishi ya 1000 sq. ft. husababisha ongezeko la $16,200 katika thamani iliyokadiriwa ya wastani.
  2. Ikiwa nafasi ya kuishi ni ya kudumu, kuwa na mahali pa moto huongeza thamani ya wastani ya tathmini ya nyumba kwa $ 3.9 elfu.

Tafadhali kumbuka (Mchoro 12), t-takwimu zinazohusiana na nafasi ya kuishi ni 6.29, na R-thamani ni karibu sifuri. Wakati huo huo t-takwimu sambamba na kutofautiana kwa dummy ni 3.1, na uk-thamani - 0.009. Kwa hivyo, kila moja ya vigezo hivi viwili huchangia kwa kiasi kikubwa kwa mfano ikiwa kiwango cha umuhimu ni 0.01. Zaidi ya hayo, mgawo wa uunganisho mwingi wa mchanganyiko unamaanisha kuwa 81.1% ya tofauti katika thamani iliyotathminiwa inaelezewa na kutofautiana katika eneo la kuishi la nyumba na kuwepo kwa mahali pa moto.

Athari ya mwingiliano. Katika mifano yote ya urejeshi iliyojadiliwa hapo juu, athari ya jibu kwenye kigezo cha maelezo ilichukuliwa kuwa huru kitakwimu kutokana na athari ya jibu kwenye vigeu vingine vya maelezo. Ikiwa hali hii haijafikiwa, mwingiliano kati ya vigezo tegemezi hutokea. Kwa mfano, kuna uwezekano kwamba utangazaji una athari kubwa kwa mauzo ya bidhaa za bei ya chini. Hata hivyo, ikiwa bei ya bidhaa ni ya juu sana, ongezeko la matumizi ya utangazaji huenda lisiongeze mauzo kwa kiasi kikubwa. Katika kesi hii, kuna mwingiliano kati ya bei ya bidhaa na gharama ya utangazaji wake. Kwa maneno mengine, mtu hawezi kutoa taarifa za jumla kuhusu utegemezi wa kiasi cha mauzo kwa gharama za matangazo. Athari za matumizi ya matangazo kwenye mauzo hutegemea bei. Ushawishi huu unazingatiwa katika modeli nyingi za rejista kwa kutumia athari ya mwingiliano. Ili kuonyesha dhana hii, hebu turudi kwenye tatizo la bei za nyumba.

Mfano wa urejeshaji tuliounda ulidhani kuwa athari ya saizi ya nyumba kwa thamani yake haitegemei ikiwa nyumba ina mahali pa moto. Kwa maneno mengine, iliaminika kuwa mteremko wa thamani iliyopimwa, kulingana na eneo la kuishi la nyumba, ni sawa kwa nyumba zilizo na mahali pa moto na bila. Ikiwa mteremko huu ni tofauti kutoka kwa kila mmoja, kuna mwingiliano kati ya ukubwa wa nyumba na uwepo wa mahali pa moto.

Kujaribu nadharia ya usawa wa mteremko huja kutathmini mchango ambao bidhaa ya utofauti wa maelezo hutoa kwa modeli ya rejista. X 1 na kutofautiana kwa dummy X 2. Ikiwa mchango huu ni muhimu kitakwimu, muundo asili wa urejeshaji hauwezi kutumika. Matokeo ya uchanganuzi wa urejeshi ikijumuisha vigeu X 1, X 2 Na X 3 = X 1 * X 2 zinaonyeshwa kwenye Mtini. 13.

Mchele. 13. Matokeo yaliyopatikana kwa kutumia Mfuko wa uchambuzi Excel kwa mfano wa urejeshaji unaozingatia nafasi ya kuishi, uwepo wa mahali pa moto, na mwingiliano wao

Ili kupima hypothesis isiyo na maana H 0: β 3 = 0 na hypothesis mbadala H 1: β 3 ≠ 0, kwa kutumia matokeo yaliyoonyeshwa kwenye Mtini. 13, tafadhali kumbuka hilo t-takwimu zinazolingana na athari za mwingiliano wa vigezo ni 1.48. Kwa sababu ya R-thamani ni 0.166 > 0.05, nadharia tupu haijakataliwa. Kwa hiyo, mwingiliano wa vigezo hauna athari kubwa juu ya mtindo wa kurejesha kwa kuzingatia nafasi ya kuishi na kuwepo kwa mahali pa moto.

Muhtasari. Dokezo linaonyesha jinsi meneja wa uuzaji anavyoweza kutumia uchanganuzi wa mistari mingi kutabiri mauzo kama kipengele cha bei na gharama za utangazaji. Mitindo mbalimbali ya urejeshi nyingi ilizingatiwa, ikiwa ni pamoja na mifano ya quadratic, mifano yenye vigezo vya dummy, na mifano yenye athari za mwingiliano (Mchoro 14).

Mchele. 14. Mpango wa muundo maelezo

Nyenzo kutoka kwa kitabu Levin et al.. Takwimu za Wasimamizi zinatumika. - M.: Williams, 2004. - p. 873–936

Tuseme msanidi programu anatathmini thamani ya kikundi cha majengo madogo ya ofisi katika wilaya ya biashara ya kitamaduni.

Msanidi programu anaweza kutumia uchanganuzi mwingi wa urejeshaji kukadiria bei ya jengo la ofisi katika eneo fulani kulingana na vigezo vifuatavyo.

y ni makadirio ya bei ya jengo la ofisi;

x 1 - eneo la jumla katika mita za mraba;

x 2 - idadi ya ofisi;

x 3 - idadi ya pembejeo (pembejeo 0.5 inamaanisha pembejeo tu kwa utoaji wa mawasiliano);

x 4 - wakati wa uendeshaji wa jengo kwa miaka.

Mfano huu unadhania kuwa kuna uhusiano wa mstari kati ya kila kigezo huru (x 1 , x 2 , x 3 na x 4 ) na kigezo tegemezi (y), ambacho ni bei ya jengo la ofisi katika eneo fulani. Data ya chanzo imeonyeshwa kwenye takwimu.

Mipangilio ya kutatua shida imeonyeshwa kwenye picha ya dirisha " Kurudi nyuma". Matokeo ya hesabu yanawekwa kwenye karatasi tofauti katika meza tatu

Matokeo yake tulipata yafuatayo mfano wa hisabati:

y = 52318 + 27.64*x1 + 12530*x2 + 2553*x3 - 234.24*x4.

Sasa msanidi anaweza kuamua thamani inayokadiriwa ya jengo la ofisi katika eneo moja. Ikiwa jengo hili lina eneo la 2500 mita za mraba, ofisi tatu, viingilio viwili na wakati wa kufanya kazi - miaka 25, unaweza kukadiria gharama yake kwa kutumia formula ifuatayo:

y = 27.64 * 2500 + 12530 * 3 + 2553 * 2 - 234.24 * 25 + 52318 = 158,261 c.u.

Katika uchambuzi wa urejeshaji, matokeo muhimu zaidi ni:

  • coefficients ya vigezo na Y-intersection, ambayo ni vigezo vinavyohitajika vya mfano;
  • R nyingi, inayoonyesha usahihi wa mfano wa data ya chanzo inayopatikana;
  • Mtihani wa F ya Fisher(katika mfano unaozingatiwa, kwa kiasi kikubwa huzidi thamani muhimu ya 4.06);
  • T-takwimu- maadili yanayoonyesha kiwango cha umuhimu wa coefficients ya mtu binafsi ya mfano.

T-takwimu zinastahili tahadhari maalum. Mara nyingi sana, wakati wa kujenga muundo wa rejista, haijulikani ikiwa hii au sababu hiyo x inaathiri y. Ikiwa ni pamoja na mambo katika modeli ambayo hayaathiri thamani ya pato huharibu ubora wa mfano. Kuhesabu t-takwimu husaidia kugundua mambo kama haya. Kadirio la kukadiria linaweza kufanywa kama ifuatavyo: ikiwa, kwa n>>k, thamani ya t-takwimu katika thamani kamili ni kubwa zaidi kuliko tatu, mgawo unaolingana unapaswa kuzingatiwa kuwa muhimu, na sababu inapaswa kujumuishwa katika muundo. , vinginevyo kutengwa na mfano. Kwa hivyo, tunaweza kupendekeza teknolojia ya kuunda muundo wa rejista, unaojumuisha hatua mbili:

1) mchakato na kifurushi " Kurudi nyuma"data zote zinazopatikana, chambua maadili ya t-takwimu;

2) ondoa kutoka kwa safuwima za jedwali la data ya chanzo na mambo hayo ambayo coefficients sio muhimu na uzichakate na kifurushi " Kurudi nyuma"meza mpya.

Katika machapisho yaliyotangulia, uchanganuzi mara nyingi ulilenga kigezo kimoja cha nambari, kama vile mapato ya fedha za pande zote, nyakati za upakiaji wa ukurasa wa Wavuti, au matumizi ya vinywaji baridi. Katika maelezo haya na yafuatayo, tutaangalia njia za kutabiri maadili ya kutofautisha kwa nambari kulingana na maadili ya anuwai moja au zaidi ya nambari.

Nyenzo zitaonyeshwa kwa mfano wa kukata msalaba. Utabiri wa kiasi cha mauzo katika duka la nguo. Msururu wa maduka ya nguo za alizeti umekuwa ukipanuka kila mara kwa miaka 25. Hata hivyo, kampuni kwa sasa haina mbinu ya kimfumo ya kuchagua maduka mapya. Mahali ambapo kampuni inakusudia kufungua duka jipya hubainishwa kulingana na mambo yanayozingatiwa. Vigezo vya uteuzi ni hali nzuri za kukodisha au wazo la msimamizi la eneo linalofaa la duka. Fikiria kuwa wewe ni mkuu wa idara maalum ya miradi na mipango. Umepewa kazi ya kukuza mpango mkakati kufungua maduka mapya. Mpango huu unapaswa kujumuisha utabiri wa mauzo ya kila mwaka kwa maduka mapya yaliyofunguliwa. Je, unafikiri hivyo eneo la biashara inahusiana moja kwa moja na kiasi cha mapato, na unataka kuzingatia ukweli huu katika mchakato wa kufanya maamuzi. Jinsi ya kuendeleza mfano wa takwimu ambayo inatabiri mauzo ya kila mwaka kulingana na saizi ya duka mpya?

Kwa kawaida, uchanganuzi wa rejista hutumiwa kutabiri maadili ya kutofautisha. Kusudi lake ni kuunda muundo wa takwimu ambao unaweza kutabiri maadili ya kigezo tegemezi, au jibu, kutoka kwa maadili ya angalau tofauti moja huru, au ya kuelezea. Katika chapisho hili tutaangalia urejeshaji rahisi wa mstari - njia ya takwimu, kuruhusu kutabiri maadili ya kutofautiana tegemezi Y kwa maadili tofauti tofauti X. Vidokezo vifuatavyo vitaelezea modeli nyingi za rejista iliyoundwa kutabiri maadili ya tofauti huru Y kulingana na maadili ya anuwai kadhaa tegemezi ( X 1, X 2, …, X k).

Pakua noti katika au umbizo, mifano katika umbizo

Aina za mifano ya urejeshaji

Wapi ρ 1 - mgawo wa uunganisho wa kiotomatiki; Kama ρ 1 = 0 (hakuna uhusiano otomatiki), D≈ 2; Kama ρ 1 ≈ 1 (uhusiano mzuri wa kiotomatiki), D≈ 0; Kama ρ 1 = -1 (uhusiano mbaya wa kiotomatiki), D ≈ 4.

Katika mazoezi, matumizi ya kigezo cha Durbin-Watson inategemea kulinganisha thamani D yenye maadili muhimu ya kinadharia dL Na d U kwa idadi fulani ya uchunguzi n, idadi ya kujitegemea vigezo vya mfano k(kwa urejeshaji rahisi wa mstari k= 1) na kiwango cha umuhimu α. Kama D< d L , nadharia ya uhuru kupotoka bila mpangilio kukataliwa (kwa hiyo kuna autocorrelation chanya); Kama D>dU, hypothesis haijakataliwa (yaani, hakuna autocorrelation); Kama dL< D < d U , hakuna sababu za kutosha za kufanya uamuzi. Wakati thamani iliyohesabiwa D inazidi 2, kisha na dL Na d U Sio mgawo yenyewe unaolinganishwa D, na usemi (4- D).

Ili kuhesabu takwimu za Durbin-Watson katika Excel, hebu tugeuke kwenye jedwali la chini kwenye Mtini. 14 Uondoaji wa usawa. Nambari katika usemi (10) inakokotolewa kwa kutumia chaguo za kukokotoa =SUMMAR(safu1;safu2), na dhehebu =SUMMAR(safu) (Mchoro 16).

Mchele. 16. Fomula za kukokotoa takwimu za Durbin-Watson

Katika mfano wetu D= 0.883. Swali kuu ni: ni thamani gani ya takwimu ya Durbin-Watson inapaswa kuzingatiwa kuwa ndogo vya kutosha kuhitimisha kuwa uunganisho mzuri wa moja kwa moja upo? Ni muhimu kuunganisha thamani ya D na maadili muhimu ( dL Na d U), kulingana na idadi ya uchunguzi n na kiwango cha umuhimu α (Mchoro 17).

Mchele. 17. Thamani muhimu za takwimu za Durbin-Watson (kipande cha jedwali)

Kwa hivyo, katika tatizo la kiasi cha mauzo katika duka la kupeleka bidhaa nyumbani, kuna tofauti moja ya kujitegemea ( k= 1), uchunguzi 15 ( n= 15) na kiwango cha umuhimu α = 0.05. Kwa hivyo, dL= 1.08 na dU= 1.36. Kwa sababu ya D = 0,883 < dL= 1.08, kuna uhusiano mzuri kati ya mabaki, njia ya angalau mraba haiwezi kutumika.

Kujaribu Dhana kuhusu Mteremko na Mgawo wa Uwiano

Hapo juu, regression ilitumika kwa utabiri pekee. Kuamua mgawo wa rejista na kutabiri thamani ya kigezo Y katika thamani iliyopewa kutofautiana X Njia ya angalau mraba ilitumiwa. Kwa kuongeza, tulichunguza kosa la msingi la mraba wa makadirio na mgawo mchanganyiko wa uwiano. Iwapo uchanganuzi wa mabaki unathibitisha kuwa hali ya utumiaji wa njia ya miraba ndogo zaidi haijakiukwa, na muundo rahisi wa urejeshaji wa mstari unatosha, kulingana na data ya sampuli, inaweza kubishaniwa kuwa kuna uhusiano wa mstari kati ya vigeu katika idadi ya watu.

Maombit -vigezo vya mteremko. Kwa kupima kama mteremko wa idadi ya watu β 1 ni sawa na sufuri, unaweza kubaini kama kuna uhusiano muhimu wa kitakwimu kati ya viambajengo. X Na Y. Ikiwa nadharia hii imekataliwa, inaweza kubishaniwa kuwa kati ya vigezo X Na Y kuna uhusiano wa mstari. Dhana potofu na mbadala zimeundwa kama ifuatavyo: H 0: β 1 = 0 (hakuna utegemezi wa mstari), H1: β 1 ≠ 0 (kuna utegemezi wa mstari). A-kipaumbele t-takwimu ni sawa na tofauti kati ya mteremko wa sampuli na thamani ya dhahania ya mteremko wa idadi ya watu, iliyogawanywa na msingi wa makosa ya mraba ya makadirio ya mteremko:

(11) t = (b 1 β 1 ) / S b 1

Wapi b 1 - mteremko wa rejista ya moja kwa moja kwenye data ya sampuli, β1 - mteremko wa dhahania wa idadi ya watu moja kwa moja; , na takwimu za mtihani t Ina t- usambazaji na n - 2 digrii za uhuru.

Hebu tuangalie ikiwa kuna uhusiano muhimu wa kitakwimu kati ya saizi ya duka na mauzo ya kila mwaka kwa α = 0.05. t-kigezo huonyeshwa pamoja na vigezo vingine vinapotumika Mfuko wa uchambuzi(chaguo Kurudi nyuma) Matokeo kamili ya Kifurushi cha Uchambuzi yanaonyeshwa kwenye Mtini. 4, kipande kinachohusiana na t-takwimu - kwenye Mtini. 18.

Mchele. 18. Matokeo ya maombi t

Tangu idadi ya maduka n= 14 (tazama Mchoro 3), thamani muhimu t-takwimu katika kiwango cha umuhimu cha α = 0.05 inaweza kupatikana kwa kutumia fomula: tL=MWANAFUNZI.ARV(0.025,12) = -2.1788, ambapo 0.025 ni nusu ya kiwango cha umuhimu, na 12 = n – 2; tU=MWANAFUNZI.OBR(0.975,12) = +2.1788.

Kwa sababu ya t-takwimu = 10.64 > tU= 2.1788 (Mchoro 19), hypothesis isiyo na maana H 0 kukataliwa. Upande mwingine, R-thamani kwa X= 10.6411, iliyokokotolewa kwa fomula =1-STUDENT.DIST(D3,12,TRUE), ni takriban sawa na sufuri, kwa hivyo nadharia tete H 0 tena kukataliwa. Ukweli kwamba R-thamani ya karibu sifuri inamaanisha kwamba ikiwa hakungekuwa na uhusiano wa kweli wa mstari kati ya saizi za duka na mauzo ya kila mwaka, itakuwa vigumu kuigundua kwa kutumia urejeshaji wa mstari. Kwa hivyo, kuna uhusiano wa kitakwimu wa mstari kati ya wastani wa mauzo ya kila mwaka ya duka na ukubwa wa duka.

Mchele. 19. Kujaribu nadharia tete kuhusu mteremko wa idadi ya watu katika kiwango cha umuhimu cha digrii 0.05 na 12 za uhuru.

MaombiF -vigezo vya mteremko. Njia mbadala ya kujaribu dhahania juu ya mteremko wa rejista rahisi ya mstari ni kutumia F-vigezo. Hebu tuwakumbushe hilo F-test inatumika kujaribu uhusiano kati ya tofauti mbili (kwa maelezo zaidi, ona). Wakati wa kupima hypothesis ya mteremko na kipimo makosa ya nasibu ni tofauti ya makosa (jumla ya makosa ya mraba iliyogawanywa na idadi ya digrii za uhuru), kwa hivyo F-criterion hutumia uwiano wa tofauti iliyoelezewa na rejista (yaani thamani SSR, imegawanywa na idadi ya vigezo vya kujitegemea k), kwa tofauti ya makosa ( MSE = S YX 2 ).

A-kipaumbele F-takwimu ni sawa na wastani wa mraba wa rejista (MSR) iliyogawanywa na tofauti za makosa (MSE): F = MSR/ MSE, Wapi MSR=SSR / k, MSE =SSE/(n- k - 1), k- idadi ya vigezo huru katika modeli ya urejeshaji. Takwimu za mtihani F Ina F- usambazaji na k Na n- k - 1 digrii za uhuru.

Katika kiwango fulani cha umuhimu α kanuni ya maamuzi imeundwa kama ifuatavyo: ikiwa F>FU, nadharia tupu imekataliwa; vinginevyo haijakataliwa. Matokeo, yaliyowasilishwa kwa namna ya jedwali la muhtasari wa uchanganuzi wa tofauti, yanaonyeshwa kwenye Mtini. 20.

Mchele. 20. Uchanganuzi wa jedwali la tofauti kwa ajili ya kupima dhahania kuhusu umuhimu wa takwimu wa mgawo wa rejista.

Vivyo hivyo t-kigezo F-kigezo kinaonyeshwa kwenye jedwali kinapotumika Mfuko wa uchambuzi(chaguo Kurudi nyuma) Matokeo kamili ya kazi Mfuko wa uchambuzi zinaonyeshwa kwenye Mtini. 4, kipande kuhusiana na F-takwimu - katika Mtini. 21.

Mchele. 21. Matokeo ya maombi F-vigezo vilivyopatikana kwa kutumia Excel Analysis Package

F-takwimu ni 113.23, na R-thamani karibu na sifuri (seli UmuhimuF) Ikiwa kiwango cha umuhimu α ni 0.05, tambua thamani muhimu F-usambazaji na digrii moja na 12 za uhuru zinaweza kupatikana kwa kutumia fomula F U=F.OBR (1-0.05;1;12) = 4.7472 (Mchoro 22). Kwa sababu ya F = 113,23 > F U= 4.7472, na R- Thamani karibu na 0< 0,05, нулевая гипотеза H 0 inakataliwa, i.e. Saizi ya duka inahusiana kwa karibu na mauzo yake ya kila mwaka.

Mchele. 22. Kujaribu nadharia ya mteremko wa idadi ya watu kwa kiwango cha umuhimu cha 0.05 na digrii moja na 12 za uhuru.

Muda wa kujiamini ulio na mteremko β 1 . Ili kujaribu dhana kwamba kuna uhusiano wa mstari kati ya vigeu, unaweza kuunda muda wa kujiamini ulio na mteremko β 1 na uthibitishe kuwa thamani ya dhahania β 1 ​​= 0 ni ya muda huu. Katikati ya muda wa kujiamini iliyo na mteremko β 1 ni sampuli ya mteremko b 1 , na mipaka yake ni kiasi b 1 ±tn –2 S b 1

Kama inavyoonyeshwa kwenye Mtini. 18, b 1 = +1,670, n = 14, S b 1 = 0,157. t 12 =MWANAFUNZI.ARV(0.975,12) = 2.1788. Kwa hivyo, b 1 ±tn –2 S b 1 = +1.670 ± 2.1788 * 0.157 = +1.670 ± 0.342, au + 1.328 ≤ β 1 ≤ +2.012. Kwa hivyo, kuna uwezekano wa 0.95 kwamba mteremko wa idadi ya watu upo kati ya +1.328 na +2.012 (yaani, $1,328,000 hadi $2,012,000). Kwa kuwa thamani hizi ni kubwa kuliko sifuri, kuna uhusiano muhimu wa kitakwimu kati ya mauzo ya kila mwaka na eneo la duka. Ikiwa muda wa kujiamini ulikuwa na sifuri, hakutakuwa na uhusiano kati ya vigeuzo. Kwa kuongezea, muda wa kujiamini unamaanisha kuwa kila ongezeko la eneo la duka kwa 1,000 sq. ft. husababisha ongezeko la wastani wa kiasi cha mauzo kati ya $1,328,000 na $2,012,000.

Matumizit -kigezo cha mgawo wa uwiano. mgawo wa uunganisho ulianzishwa r, ambacho ni kipimo cha uhusiano kati ya viambishi viwili vya nambari. Inaweza kutumika kubainisha kama kuna uhusiano muhimu wa kitakwimu kati ya viambajengo viwili. Wacha tuonyeshe mgawo wa uunganisho kati ya idadi ya anuwai zote mbili kwa ishara ρ. Dhana potofu na mbadala zimeundwa kama ifuatavyo: H 0: ρ = 0 (hakuna uwiano), H 1: ρ ≠ 0 (kuna uwiano). Kuangalia uwepo wa uhusiano:

Wapi r = + , Kama b 1 > 0, r = – , Kama b 1 < 0. Тестовая статистика t Ina t- usambazaji na n - 2 digrii za uhuru.

Katika tatizo kuhusu mlolongo wa maduka ya Alizeti r 2= 0.904, a b 1- +1.670 (tazama Mchoro 4). Kwa sababu ya b 1> 0, mgawo wa uwiano kati ya mauzo ya kila mwaka na ukubwa wa duka ni r= +√0.904 = +0.951. Wacha tujaribu nadharia tupu kwamba hakuna uhusiano kati ya anuwai hizi kwa kutumia t-takwimu:

Katika kiwango cha umuhimu cha α = 0.05, dhana potofu inapaswa kukataliwa kwa sababu t= 10.64 > 2.1788. Kwa hivyo, inaweza kubishana kuwa kuna uhusiano muhimu wa kitakwimu kati ya mauzo ya kila mwaka na saizi ya duka.

Wakati wa kujadili makisio kuhusu mteremko wa idadi ya watu, vipindi vya kujiamini na majaribio ya dhahania hutumiwa kwa kubadilishana. Walakini, kuhesabu muda wa kujiamini ulio na mgawo wa uunganisho kunageuka kuwa ngumu zaidi, kwani aina ya usambazaji wa sampuli ya takwimu. r inategemea mgawo wa uunganisho wa kweli.

Ukadiriaji wa matarajio ya hisabati na utabiri maadili ya mtu binafsi

Sehemu hii inajadili mbinu za kukadiria matarajio ya kihisabati ya jibu Y na utabiri wa maadili ya mtu binafsi Y kwa maadili yaliyopewa ya kutofautisha X.

Kuunda muda wa kujiamini. Katika mfano 2 (tazama sehemu hapo juu Njia ya angalau mraba) equation ya rejista ilifanya iwezekane kutabiri thamani ya kutofautisha Y X. Katika shida ya kuchagua eneo la duka la rejareja, wastani wa mauzo ya kila mwaka katika duka yenye eneo la 4000 sq. miguu ilikuwa sawa na dola milioni 7.644. Hata hivyo, makadirio haya ya matarajio ya hisabati ya idadi ya watu kwa ujumla ni ya busara. Ili kukadiria matarajio ya hisabati ya idadi ya watu, dhana ya muda wa kujiamini ilipendekezwa. Vile vile, tunaweza kuanzisha dhana muda wa kujiamini kwa matarajio ya kihisabati ya majibu katika kuweka thamani kutofautiana X:

Wapi , = b 0 + b 1 Xi- thamani iliyotabiriwa inabadilika Y katika X = Xi, S YX- mzizi maana ya makosa ya mraba, n- saizi ya sampuli, Xi- thamani maalum ya kutofautiana X, µ Y|X = Xi- matarajio ya hisabati ya kutofautiana Y katika X = Xi, SSX =

Uchambuzi wa fomula (13) unaonyesha kuwa upana wa muda wa kujiamini unategemea mambo kadhaa. Kwa kiwango fulani cha umuhimu, ongezeko la amplitude ya kushuka kwa thamani karibu na mstari wa regression, kupimwa kwa kutumia mzizi wa makosa ya mraba, husababisha kuongezeka kwa upana wa muda. Kwa upande mwingine, kama mtu angetarajia, ongezeko la saizi ya sampuli inaambatana na kupunguzwa kwa muda. Kwa kuongeza, upana wa muda hubadilika kulingana na maadili Xi. Ikiwa thamani ya kutofautiana Y iliyotabiriwa kwa wingi X, karibu na thamani ya wastani , muda wa kujiamini unageuka kuwa mdogo kuliko wakati wa kutabiri jibu la maadili mbali na wastani.

Hebu tuseme kwamba wakati wa kuchagua eneo la duka, tunataka kujenga muda wa kujiamini wa 95% kwa wastani wa mauzo ya kila mwaka ya maduka yote ambayo eneo lake ni mita za mraba 4000. miguu:

Kwa hivyo, wastani wa mauzo ya kila mwaka katika duka zote zilizo na eneo la sq 4,000. miguu, na uwezekano wa 95% upo katika anuwai kutoka dola 6.971 hadi 8.317 milioni.

Kokotoa muda wa kutegemewa kwa thamani iliyotabiriwa. Kando na muda wa kujiamini kwa matarajio ya hisabati ya jibu kwa thamani fulani ya kigezo X, mara nyingi ni muhimu kujua muda wa kujiamini kwa thamani iliyotabiriwa. Ingawa fomula ya kukokotoa muda kama huu wa kujiamini inafanana sana na fomula (13), muda huu una thamani iliyotabiriwa badala ya makadirio ya kigezo. Muda wa majibu yaliyotabiriwa YX = Xi kwa thamani maalum ya kutofautisha Xi imedhamiriwa na formula:

Tuseme kwamba, tunapochagua eneo la duka la reja reja, tunataka kujenga muda wa kujiamini wa 95% kwa kiasi kilichotabiriwa cha mauzo ya kila mwaka kwa duka ambalo eneo lake ni mita za mraba 4000. miguu:

Kwa hivyo, kiasi cha mauzo ya kila mwaka kilichotabiriwa kwa duka yenye eneo la sq 4000. futi, na uwezekano wa 95% upo katika safu kutoka dola milioni 5.433 hadi 9.854. Kama tunavyoona, muda wa kujiamini kwa thamani iliyotabiriwa ya majibu ni pana zaidi kuliko muda wa kujiamini kwa matarajio yake ya hisabati. Hii ni kwa sababu tofauti katika kutabiri maadili ya mtu binafsi ni kubwa zaidi kuliko kukadiria matarajio ya hisabati.

Mitego na masuala ya kimaadili yanayohusiana na kutumia rejista

Ugumu unaohusishwa na uchanganuzi wa urekebishaji:

  • Kupuuza masharti ya utumiaji wa njia ndogo ya mraba.
  • Tathmini isiyo sahihi ya masharti ya utumiaji wa mbinu ya angalau miraba.
  • Uchaguzi usio sahihi wa mbinu mbadala wakati masharti ya utumiaji wa njia ya angalau mraba yamekiukwa.
  • Utumiaji wa uchanganuzi wa urejeshi bila ufahamu wa kina wa somo la utafiti.
  • Kuongeza urejeshaji zaidi ya masafa ya utofauti wa maelezo.
  • Mkanganyiko kati ya uhusiano wa kitakwimu na sababu.

Matumizi makubwa ya lahajedwali na programu kwa hesabu za takwimu ziliondoa matatizo ya hesabu ambayo yalizuia matumizi ya uchanganuzi wa kurejesha. Hata hivyo, hii ilisababisha ukweli kwamba uchambuzi wa urejeshaji ulitumiwa na watumiaji ambao hawakuwa na sifa na ujuzi wa kutosha. Watumiaji wanawezaje kujua kuhusu mbinu mbadala ikiwa wengi wao hawajui hata kidogo kuhusu masharti ya utumiaji wa njia ndogo ya mraba na hawajui jinsi ya kuangalia utekelezaji wao?

Mtafiti hapaswi kubebwa na nambari za kubana - kuhesabu mabadiliko, mteremko na mgawo mchanganyiko wa uunganisho. Anahitaji maarifa ya kina. Hebu tuonyeshe hili mfano classic zilizochukuliwa kutoka kwa vitabu vya kiada. Anscombe ilionyesha kuwa seti zote nne za data zilizoonyeshwa kwenye Mtini. 23, kuwa na vigezo sawa vya kurejesha (Mchoro 24).

Mchele. 23. Seti nne za data za bandia

Mchele. 24. Uchambuzi wa urejeshaji wa seti nne za data za bandia; kufanyika na Mfuko wa uchambuzi(bofya kwenye picha ili kupanua picha)

Kwa hivyo, kwa mtazamo wa uchanganuzi wa rejista, seti hizi zote za data zinafanana kabisa. Uchambuzi ungeishia hapo tungepoteza sana habari muhimu. Hii inathibitishwa na viwanja vya kutawanya (Mchoro 25) na viwanja vya mabaki (Kielelezo 26) vilivyoundwa kwa seti hizi za data.

Mchele. 25. Viwanja vya kutawanya kwa seti nne za data

Viwanja vya kutawanya na viwanja vya mabaki vinaonyesha kuwa data hizi hutofautiana kutoka kwa kila mmoja. Seti pekee iliyosambazwa kwenye mstari wa moja kwa moja imewekwa A. Mpangilio wa mabaki yaliyohesabiwa kutoka kwa kuweka A hauna muundo wowote. Hii haiwezi kusemwa kuhusu seti B, C na D. Mpangilio wa kutawanya uliopangwa kwa seti B unaonyesha muundo uliotamkwa wa quadratic. Hitimisho hili linathibitishwa na njama ya mabaki, ambayo ina sura ya kimfano. Njama ya kutawanya na njama mabaki zinaonyesha kuwa seti ya data B ina nje. Katika hali hii, ni muhimu kuwatenga nje kutoka kwa seti ya data na kurudia uchambuzi. Njia ya kugundua na kuondoa vitu vya nje katika uchunguzi inaitwa uchambuzi wa ushawishi. Baada ya kuondokana na nje, matokeo ya kukadiria tena mfano inaweza kuwa tofauti kabisa. Mpango wa kutawanya kulingana na data kutoka kwa vielelezo vya G hali isiyo ya kawaida, ambapo mtindo wa majaribio unategemea sana mwitikio wa mtu binafsi ( X 8 = 19, Y 8 = 12.5). Vile mifano ya urejeshaji lazima ihesabiwe hasa kwa uangalifu. Kwa hivyo, viwanja vya kutawanya na mabaki ni zana muhimu kwa uchanganuzi wa rejista na inapaswa kuwa sehemu yake muhimu. Bila wao, uchambuzi wa regression sio wa kuaminika.

Mchele. 26. Viwanja vya mabaki kwa seti nne za data

Jinsi ya kuzuia mitego katika uchanganuzi wa rejista:

  • Uchambuzi wa uhusiano unaowezekana kati ya vigezo X Na Y kila mara anza kwa kuchora njama ya kutawanya.
  • Kabla ya kutafsiri matokeo ya uchambuzi wa urejeshaji, angalia hali ya utumiaji wake.
  • Panga mabaki dhidi ya tofauti huru. Hii itafanya iwezekane kubainisha jinsi modeli ya majaribio inavyolingana na matokeo ya uchunguzi na kugundua ukiukaji wa uthabiti wa tofauti.
  • Tumia histogramu, sehemu za shina na majani, sehemu za sanduku, na sehemu za kawaida za usambazaji ili kupima dhana ya usambazaji wa makosa ya kawaida.
  • Ikiwa masharti ya utumiaji wa mbinu ya miraba ndogo zaidi hayatimizwi, tumia mbinu mbadala (kwa mfano, miundo ya urejeleaji ya quadratic au nyingi).
  • Iwapo masharti ya utumiaji wa mbinu ya miraba ya chini kabisa yametimizwa, ni muhimu kupima dhahania kuhusu umuhimu wa takwimu wa hesabu za urejeshi na kuunda vipindi vya kujiamini vilivyo na matarajio ya hisabati na thamani ya majibu iliyotabiriwa.
  • Epuka kutabiri thamani za tofauti tegemezi nje ya anuwai ya kigezo huru.
  • Kumbuka hilo utegemezi wa takwimu si mara zote sababu-na-athari. Kumbuka kwamba uunganisho kati ya anuwai haimaanishi kuwa kuna uhusiano wa sababu-na-athari kati yao.

Muhtasari. Kama inavyoonyeshwa kwenye mchoro wa kuzuia (Mchoro 27), noti inaelezea modeli rahisi ya urejeshaji mstari, masharti ya utumiaji wake, na jinsi ya kujaribu hali hizi. Imezingatiwa t-kigezo cha kupima umuhimu wa takwimu wa mteremko wa kurudi nyuma. Ili kutabiri maadili ya kutofautisha tegemezi, tulitumia mfano wa urejeshaji. Mfano unazingatiwa kuhusiana na uchaguzi wa eneo la duka la rejareja, ambalo utegemezi wa kiasi cha mauzo ya kila mwaka kwenye eneo la duka huchunguzwa. Taarifa iliyopatikana inakuwezesha kuchagua kwa usahihi zaidi eneo la duka na kutabiri kiasi cha mauzo ya kila mwaka. Vidokezo vifuatavyo vitaendeleza mjadala wa uchanganuzi wa rejista na pia kuangalia mifano nyingi ya urejeshaji.

Mchele. 27. Kumbuka mchoro wa muundo

Nyenzo kutoka kwa kitabu Levin et al.. Takwimu za Wasimamizi zinatumika. - M.: Williams, 2004. - p. 792–872

Ikiwa kigezo tegemezi ni cha kategoria, urekebishaji wa vifaa lazima utumike.

Madhumuni ya urejeleaji mwingi ni kuchambua uhusiano kati ya tegemezi moja na anuwai kadhaa huru.

Mfano: Kuna data juu ya gharama ya kituo kimoja cha kazi (wakati wa kununua vituo 50 vya kazi) kwa mifumo mbalimbali ya PDM. Inahitajika: tathmini uhusiano kati ya bei ya kituo cha kazi cha mfumo wa PDM na idadi ya sifa zinazotekelezwa ndani yake, zilizotolewa katika Jedwali 2.

Jedwali 2 - Tabia za mifumo ya PDM

Nambari ya agizo Mfumo wa PDM Bei Usimamizi wa Usanidi wa Bidhaa Mifano ya bidhaa Kazi ya pamoja Usimamizi wa mabadiliko ya bidhaa Mtiririko wa hati Kumbukumbu Tafuta hati Upangaji wa mradi Usimamizi wa utengenezaji wa bidhaa
iMAN Ndiyo Ndiyo
PartYPlus Ndiyo Ndiyo
PDM STEP Suite Ndiyo Ndiyo
Tafuta Ndiyo Ndiyo
Upepo wa upepo Ndiyo Ndiyo
Meneja wa dira Ndiyo Ndiyo
Hati za T-Flex Ndiyo Ndiyo
TechnoPro Hapana Hapana

Thamani ya nambari ya sifa (isipokuwa "Gharama", "Miundo ya Bidhaa" na "Kazi ya Pamoja") inamaanisha idadi ya mahitaji ya kila sifa inayotekelezwa.

Hebu tuunda na kujaza lahajedwali na data ya awali (Mchoro 27).

Thamani "1" ya vigezo "Mod. mh." na "Mkusanyiko." wilaya." inalingana na thamani ya "Ndiyo" ya data ya chanzo, na thamani "0" kwa thamani ya "Hapana" ya data ya chanzo.

Wacha tujenge urejeshi kati ya kigezo tegemezi cha "Gharama" na vigeu vinavyojitegemea "Mf. conf.", "Mod. ed.", "Kusanya. r-ta", "Kutoka. badilisha.", "Hati.", "Kumbukumbu", "Tafuta", "Panga-e", "Dhibiti. kufanywa."

Ili kuanza uchanganuzi wa takwimu wa data ya chanzo, piga moduli ya "Regression nyingi" (Mchoro 22).

Katika kisanduku cha mazungumzo kinachoonekana (Kielelezo 23), onyesha vigezo ambavyo uchambuzi wa takwimu utafanywa.

Kielelezo 27 - Data ya awali

Ili kufanya hivyo, bofya kitufe cha Vigezo na kwenye kisanduku cha mazungumzo kinachoonekana (Mchoro 28), katika sehemu inayolingana na vigezo tegemezi (Dependent var.), chagua "1-Gharama", na katika sehemu inayolingana na vigezo vya kujitegemea. (Orodha ya kutofautisha inayojitegemea), chagua anuwai zingine zote. Kuchagua vigezo kadhaa kutoka kwenye orodha hufanywa kwa kutumia funguo za "Ctrl" au "Shift", au kwa kutaja nambari (nambari mbalimbali) za vigezo katika uwanja unaofanana.



Kielelezo 28 - Kisanduku kidadisi cha kuweka vigeu vya uchanganuzi wa takwimu

Baada ya vigezo kuchaguliwa, bofya kitufe cha "Sawa" kwenye sanduku la mazungumzo kwa kuweka vigezo vya moduli ya "Regression nyingi". Katika dirisha inayoonekana na uandishi "No of indep. vars. >=(N-1); haiwezi kugeuza kor. matrix." (Mchoro 29) bonyeza kitufe cha "OK".

Ujumbe huu unaonekana wakati mfumo hauwezi kujenga regression kwa vigezo vyote vya kujitegemea vilivyotangazwa, kwa sababu idadi ya vigeu ni kubwa kuliko au sawa na idadi ya visa kasoro 1.

Katika dirisha inayoonekana (Mchoro 30) kwenye kichupo cha "Advanced", unaweza kubadilisha njia ya kujenga usawa wa regression.

Kielelezo 29 - Ujumbe wa hitilafu

Ili kufanya hivyo, katika uwanja wa "Njia", chagua "Mbele kwa hatua" (hatua kwa hatua na kuingizwa).

Kielelezo 30 - Dirisha la kuchagua njia na kuweka vigezo vya kuunda equation ya rejista.

Njia ya urejeshaji wa hatua kwa hatua inajumuisha kuongeza au kuwatenga tofauti fulani huru kwa modeli katika kila hatua. Kwa hivyo, vigezo vingi vya "muhimu" vinasisitizwa. Hii inakuwezesha kupunguza idadi ya vigezo vinavyoelezea utegemezi.

Uchambuzi wa hatua kwa hatua na uondoaji ("Nyuma hatua kwa hatua"). Katika kesi hii, vigezo vyote vitajumuishwa kwanza kwenye mfano, na kisha kwa kila hatua, vigezo vinavyochangia kidogo kwa utabiri vitaondolewa. Kisha, kama matokeo ya uchambuzi uliofanikiwa, vigezo "muhimu" tu katika mfano vinaweza kubakishwa, yaani, vigezo hivyo ambavyo mchango wao kwa ubaguzi ni mkubwa zaidi kuliko wengine.

Uchambuzi wa hatua kwa hatua na ujumuishaji ("Mbele kwa hatua"). Wakati wa kutumia njia hii, vigeu vinavyojitegemea hujumuishwa kwa mpangilio katika mlinganyo wa urejeshi hadi mlinganyo huo uelezee data asili kwa kuridhisha. Kuingizwa kwa vigezo imedhamiriwa kwa kutumia mtihani wa F. Katika kila hatua, vigeu vyote vinaangaliwa na ile inayotoa mchango mkubwa katika tofauti kati ya idadi ya watu inapatikana. Tofauti hii inapaswa kujumuishwa katika mfano wa hatua hii, na mpito kwa hatua inayofuata hutokea.

Katika sehemu ya "Kata" (neno lisilolipishwa la urejeshaji), unaweza kuchagua ikiwa utaijumuisha kwenye mlinganyo ("Jumuisha katika mfano") au usiizingatie na uichukue sawa na sifuri ("Weka hadi sifuri").

Kigezo cha "Uvumilivu" ni uvumilivu wa vigezo. Inafafanuliwa kama 1 kuondoa mraba wa mgawo uwiano mwingi tofauti hii na vigeu vingine vyote huru katika mlinganyo wa rejista. Kwa hivyo, kadiri uvumilivu wa kibadilikaji unavyopungua, ndivyo mchango wake katika mlinganyo wa rejista unavyopungua. Ikiwa ustahimilivu wa vigezo vyovyote katika mlinganyo wa kurejesha hali ni sawa na au karibu na sufuri, basi mlingano wa kurejesha hali hauwezi kukadiriwa. Kwa hiyo, ni vyema kuweka parameter ya uvumilivu hadi 0.05 au 0.1.

Kigezo "Regression ya Ridge; lambda:" hutumika wakati vigeu vinavyojitegemea vimeunganishwa sana, na makadirio thabiti ya mgawo wa mlinganyo wa regression hauwezi kupatikana kupitia njia ya angalau miraba. Mara kwa mara iliyoainishwa (lambda) itaongezwa kwenye ulalo wa matrix ya uunganisho, ambayo itasawazishwa tena (ili vipengele vyote vya diagonal ni sawa na 1.0). Kwa maneno mengine, parameta hii inapunguza kwa njia bandia migawo ya uunganisho ili makadirio ya nguvu zaidi (bado yana upendeleo) ya vigezo vya urekebishaji yanaweza kuhesabiwa. Kwa upande wetu, parameter hii haitumiki.

Kigezo cha "Uchakataji / uchapishaji wa kundi" hutumiwa wakati inahitajika kuandaa mara moja meza kadhaa kwa ripoti, inayoonyesha matokeo na mchakato wa uchambuzi wa regression. Chaguo hili ni muhimu sana unapohitaji kuchapisha au kuchambua matokeo ya uchanganuzi wa urejeshaji wa hatua kwa hatua katika kila hatua.

Kwenye kichupo cha "Hatua" (Kielelezo 31), unaweza kuweka vigezo vya masharti ya kujumuishwa ("F kuingia") au kutengwa ("F kuondoa") ya vigeu wakati wa kuunda mlinganyo wa rejista, pamoja na idadi ya hatua za kuunda equation ("Idadi ya hatua").

Kielelezo 31 - kichupo cha "Hatua" cha dirisha kwa kuchagua njia na kuweka vigezo vya kuunda equation ya rejista.

F ni ukubwa wa thamani ya mtihani wa F.

Ikiwa, wakati wa uchanganuzi wa hatua kwa hatua na ujumuishaji, ni muhimu kwamba vigezo vyote au karibu vyote viingie kwenye mlinganyo wa rejista, basi thamani ya "F kuingia" lazima iwekwe kwa kiwango cha chini (0.0001), na "F kuondoa" ” thamani lazima pia iwekwe kwa kiwango cha chini zaidi.

Ikiwa, wakati wa uchambuzi wa hatua kwa hatua na kutengwa, ni muhimu kuondoa vigezo vyote (moja kwa wakati) kutoka kwa usawa wa regression, basi ni muhimu kuweka thamani ya "F kuingia" kubwa sana, kwa mfano 999, na uweke thamani ya "F ili kuondoa" karibu na "F ili kuingia".

Ikumbukwe kwamba thamani ya parameter ya "F ili kuondoa" inapaswa kuwa chini ya "F kuingia".

Chaguo la "Onyesha matokeo" lina chaguzi mbili:

2) Katika kila hatua - onyesha matokeo ya uchambuzi katika kila hatua.

Baada ya kubofya kitufe cha "Sawa" kwenye dirisha kwa kuchagua mbinu za uchambuzi wa urejeshaji, dirisha la matokeo ya uchambuzi litaonekana (Mchoro 32).

Kielelezo 32 - Dirisha la matokeo ya uchambuzi

Kielelezo 33 - Matokeo mafupi ya uchambuzi wa urejeshaji

Kulingana na matokeo ya uchambuzi, mgawo wa uamuzi ni. Hii inamaanisha kuwa urekebishaji uliojengwa unaelezea 99.987% ya kuenea kwa maadili yanayohusiana na wastani, i.e. inaelezea karibu tofauti zote za vigezo.

Umuhimu mkubwa na kiwango chake cha umuhimu kinaonyesha kuwa urejeshaji uliojengwa ni muhimu sana.

Ili kuona matokeo ya urejeshaji wa muhtasari, bofya kitufe cha "Muhtasari: Matokeo ya Urejeshaji". Skrini itaonekana lahajedwali na matokeo ya uchambuzi (Kielelezo 33).

Safu ya tatu ("B") inaonyesha makadirio ya vigezo visivyojulikana vya mfano, i.e. mgawo wa mlinganyo wa regression.

Kwa hivyo, regression inayotaka inaonekana kama:

Mlinganyo wa urejeleaji ulioundwa kwa ubora unaweza kufasiriwa kama ifuatavyo:

1) Gharama ya mfumo wa PDM huongezeka kwa ongezeko la idadi ya kazi zinazotekelezwa kwa usimamizi wa mabadiliko, mtiririko wa hati na kupanga, na pia ikiwa mfumo unajumuisha kazi ya usaidizi wa mfano wa bidhaa;

2) Gharama ya mfumo wa PDM hupungua kwa kuongezeka kwa vipengele vya usimamizi wa usanidi vinavyotekelezwa na kwa kuongeza uwezo wa utafutaji.

Kusudi la urejeshaji wa safu nyingi ni kuunda muundo wa mstari wa uhusiano kati ya seti ya watabiri endelevu na tofauti tegemezi inayoendelea. Equation ifuatayo ya rejista hutumiwa mara nyingi:

Hapa na i- mgawo wa regression, b 0- mwanachama wa bure (ikiwa inatumiwa), e- neno lililo na kosa - mawazo anuwai hufanywa juu yake, ambayo, hata hivyo, mara nyingi zaidi huja kwa hali ya kawaida ya usambazaji na mkeka wa vekta sifuri. matarajio na matrix ya uwiano.

Vile mfano wa mstari kazi nyingi zimeelezewa vizuri katika tofauti maeneo ya masomo, kwa mfano, uchumi, viwanda, dawa. Hii ni kwa sababu baadhi ya matatizo ni linear katika asili.

Hebu tutoe mfano rahisi. Tuseme unahitaji kutabiri gharama ya kuweka barabara kulingana na vigezo vyake vinavyojulikana. Wakati huo huo, tuna data juu ya barabara zilizowekwa tayari, zinaonyesha urefu, kina cha lami, kiasi cha nyenzo za kazi, idadi ya wafanyakazi, na kadhalika.

Ni wazi kwamba gharama ya barabara itakuwa hatimaye kuwa sawa na kiasi gharama za mambo haya yote tofauti. Utahitaji kiasi fulani, kwa mfano, cha mawe yaliyoangamizwa, na gharama inayojulikana kwa tani, na kiasi fulani cha lami, pia kwa gharama inayojulikana.

Inaweza kuwa muhimu kukata misitu kwa ajili ya ufungaji, ambayo pia itasababisha gharama za ziada. Yote hii kwa pamoja itatoa gharama ya kuunda barabara.

Katika kesi hii, mfano utajumuisha mwanachama wa bure, ambayo, kwa mfano, itawajibika kwa gharama za shirika (ambazo ni takriban sawa kwa kazi zote za ujenzi na ufungaji. kiwango hiki) au makato ya kodi.

Hitilafu itajumuisha mambo ambayo hatukuzingatia wakati wa kujenga mfano (kwa mfano, hali ya hewa wakati wa ujenzi - haiwezekani kuzingatia kabisa).

Mfano: Uchambuzi wa Marekebisho mengi

Kwa mfano huu, uwiano kadhaa unaowezekana wa kiwango cha umaskini na kiwango kinachotabiri asilimia ya familia zilizo chini ya mstari wa umaskini utachambuliwa. Kwa hivyo, tutazingatia utofauti unaobainisha asilimia ya familia zilizo chini ya mstari wa umaskini kuwa kigezo tegemezi, na vigeu vilivyosalia kuwa vibashiri endelevu.

Migawo ya urejeshaji

Ili kujua ni kigeu gani kati ya vigeu huru vinavyochangia zaidi kutabiri umaskini, tunachunguza viambajengo sanifu (au Beta) vya urejeshaji.

Mchele. 1. Makadirio ya vigezo vya mgawo wa regression.

Beta coefficients ni coefficients unayoweza kupata ikiwa ungerekebisha vigezo vyote kuwa wastani wa 0 na mkengeuko wa kawaida wa 1. Kwa hivyo, ukubwa wa vigawo hivi vya Beta hukuruhusu kulinganisha mchango wa jamaa wa kila kigezo huru na kigezo tegemezi. Kama inavyoonekana kutoka kwenye Jedwali lililoonyeshwa hapo juu, vigezo ni mabadiliko ya idadi ya watu tangu 1960 (POP_ CHING), asilimia ya wakazi wanaoishi katika kijiji (PT_RURAL) na idadi ya watu walioajiriwa katika kijiji. kilimo(N_Empld) ndio watabiri muhimu zaidi wa viwango vya umaskini, kwa sababu pekee ni muhimu kitakwimu (muda wao wa 95% wa kujiamini haujumuishi 0). Mgawo wa urejeleaji wa mabadiliko ya idadi ya watu tangu 1960 (Pop_Chng) ni mbaya, kwa hivyo, kadiri idadi ya watu inavyoongezeka, ndivyo familia zaidi wanaoishi chini ya mstari wa umaskini katika kaunti husika. Mgawo wa kurudi nyuma kwa idadi ya watu (%) wanaoishi katika kijiji (Pt_Rural) ni chanya, yaani, asilimia kubwa zaidi wakazi wa vijijini, wale kiwango cha juu umaskini.

Umuhimu wa athari za kitabiri

Wacha tuangalie jedwali na vigezo vya umuhimu.

Mchele. 2. Matokeo ya wakati mmoja kwa kila kigeu kilichotolewa.

Kama Jedwali hili linavyoonyesha, ni athari za vigeu 2 pekee ndizo muhimu kitakwimu: mabadiliko ya idadi ya watu tangu 1960 (Pop_Chng) na asilimia ya watu wanaoishi katika kijiji (Pt_Rural), p.< .05.

Uchambuzi wa mabaki. Baada ya kuweka usawa wa rejista, karibu kila wakati unahitaji kuangalia maadili na mabaki yaliyotabiriwa. Kwa mfano, wauzaji wakubwa wanaweza kupotosha sana matokeo na kusababisha hitimisho potofu.

Grafu ya uzalishaji wa mstari kwa mstari

Kwa kawaida ni muhimu kuangalia mabaki ya awali au sanifu kwa wauzaji wakubwa.

Mchele. 3. Nambari za uchunguzi na mabaki.

Mizani mhimili wima ya grafu hii imepangwa kwa thamani ya sigma, yaani, kupotoka kwa kawaida mabaki Ikiwa uchunguzi mmoja au zaidi hauingii ndani ya muda wa ± 3 mara sigma, basi inaweza kuwa na thamani ya kuondoa uchunguzi huo (hii inaweza kufanywa kwa urahisi kupitia hali ya uteuzi wa uchunguzi) na kuendesha uchambuzi tena ili kuhakikisha kuwa matokeo hayaathiriwi na haya. nje.

Umbali wa Mahalanobis

Vitabu vingi vya takwimu hutumia muda mwingi kwenye wauzaji wa nje na mabaki yanayohusiana na kutofautisha tegemezi. Walakini, jukumu la wauzaji nje katika watabiri mara nyingi hubaki bila kutambuliwa. Kwenye upande wa kutofautisha wa utabiri kuna orodha ya vigeuzo ambavyo hushiriki na uzani tofauti (coefficients za rejista) katika kutabiri utofauti tegemezi. Unaweza kufikiria vigeu vya kujitegemea kama nafasi ya multidimensional ambayo uchunguzi wowote unaweza kupangwa. Kwa mfano, ikiwa una vigezo viwili vya kujitegemea na tabia mbaya sawa regression, tunaweza kupanga mgawanyiko wa anuwai mbili na kuweka kila uchunguzi kwenye njama hiyo. Kisha unaweza kuashiria thamani ya wastani kwenye grafu hii na kuhesabu umbali kutoka kwa kila uchunguzi hadi wastani huu (kinachojulikana kama kituo cha mvuto) katika nafasi ya pande mbili. Hili ndilo wazo kuu nyuma ya kuhesabu umbali wa Mahalanobis. Sasa hebu tuangalie historia ya mabadiliko ya mabadiliko ya idadi ya watu tangu 1960.

Mchele. 4. Histogram ya usambazaji wa umbali wa Mahalanobis.

Inafuata kutoka kwa grafu kwamba kuna muuzaji mmoja katika umbali wa Mahalanobis.

Mchele. 5. Maadili yaliyozingatiwa, yaliyotabiriwa na mabaki.

Kumbuka kwamba Shelby County (katika safu ya kwanza) inatofautiana na kaunti zingine. Ukiangalia data mbichi, utagundua kuwa Kaunti ya Shelby ndiyo inayo zaidi idadi kubwa watu walioajiriwa katika kilimo (variable N_Empld). Huenda ikawa jambo la busara kuieleza kama asilimia badala ya nambari kamili, ambapo umbali wa Mahalanobis katika Kaunti ya Shelby haungekuwa mkubwa ikilinganishwa na kaunti zingine. Ni wazi kuwa Kaunti ya Shelby ni ya nje.

Mabaki Yaliyoondolewa

Takwimu nyingine muhimu sana ambayo husaidia kutathmini ukali wa tatizo la utoaji wa hewa chafu ni mabaki yaliyoondolewa. Haya ni mabaki sanifu kwa uchunguzi sambamba unaopatikana wakati uchunguzi huo unapoondolewa kwenye uchanganuzi. Kumbuka kuwa utaratibu wa urejeleaji nyingi unalingana na uso wa rejista ili kuonyesha uhusiano kati ya utofauti tegemezi na utofauti wa utabiri. Ikiwa uchunguzi mmoja ni wa nje (kama Kaunti ya Shelby), basi kuna tabia ya uso wa rejista "kuvuta" kuelekea nje. Matokeo yake, ikiwa uchunguzi unaofanana umeondolewa, uso tofauti (na mgawo wa Beta) utapatikana. Kwa hivyo, ikiwa mabaki yaliyoondolewa ni tofauti sana na mabaki ya kawaida, basi utakuwa na sababu ya kuamini kwamba uchambuzi wa kurudi nyuma kupotoshwa sana na angalizo husika. Katika mfano huu, mabaki yaliyoondolewa kwa Kaunti ya Shelby yanaonyesha kuwa ni muuzaji nje, ambayo inaegemea sana uchanganuzi. Mtawanyiko unaonyesha wazi kitu cha nje.

Mchele. 6. Mabaki ya awali na Mabaki yaliyofutwa ya tofauti inayoonyesha asilimia ya familia zinazoishi chini ya kiwango cha kujikimu.

Wengi wao wana tafsiri zaidi au chini ya wazi, hata hivyo, wacha tugeuke kwenye grafu za kawaida za uwezekano.

Kama ilivyotajwa tayari, rejista nyingi hufikiri kwamba kuna uhusiano wa mstari kati ya vijiti kwenye equation na kwamba mabaki kawaida husambazwa. Ikiwa mawazo haya yamekiukwa, hitimisho linaweza kuwa si sahihi. Mpango wa kawaida wa uwezekano wa mabaki utakuambia ikiwa kuna ukiukwaji mkubwa wa mawazo haya au la.

Mchele. 7. Grafu ya uwezekano wa kawaida; Mizani ya awali.

Grafu hii iliundwa kama ifuatavyo. Kwanza, mabaki ya sanifu yamewekwa kwa mpangilio. Kutoka kwa safu hizi, alama z (yaani, thamani za kawaida za usambazaji wa kawaida) zinaweza kuhesabiwa kulingana na dhana kwamba data inafuata usambazaji wa kawaida. Thamani hizi za z zimepangwa kwenye mhimili y kwenye grafu.

Ikiwa mabaki yaliyozingatiwa (yaliyopangwa kwenye mhimili wa x) yalisambazwa kwa kawaida, basi maadili yote yangeanguka kwenye mstari wa moja kwa moja kwenye grafu. Kwenye grafu yetu, vidokezo vyote viko karibu sana na curve. Ikiwa mabaki hayajasambazwa kwa kawaida, basi hutoka kwenye mstari huu. Bidhaa za nje pia zinaonekana kwenye grafu hii.

Ikiwa kuna upotezaji wa kifafa na data inaonekana kuunda curve wazi (kwa mfano, umbo la S) kuhusu mstari, basi kigezo tegemezi kinaweza kubadilishwa kwa njia fulani (k.m. mabadiliko ya logarithmic"kupunguza" mkia wa usambazaji, nk). Majadiliano ya njia hii ni zaidi ya upeo wa mfano huu (Neter, Wasserman, na Kutner, 1985, uk. 134-141, wanawasilisha mjadala wa mabadiliko ambayo yanaondoa hali isiyo ya kawaida na isiyo ya kawaida katika data). Walakini, watafiti mara nyingi hufanya tu uchanganuzi moja kwa moja bila kujaribu mawazo ya msingi, na kusababisha hitimisho potofu.