Wasifu Sifa Uchambuzi

Mfano wa urejeshaji wa laini nyingi. Suluhisho kwa kutumia kichakataji lahajedwali la Excel

Nina rafu kubwa ya vitabu ikijumuisha vitabu vingi vilivyogawanywa katika aina nyingi. Juu ya rafu kuna vitabu vya kidini kama vile vitabu vya Fiqh, vitabu vya Tauhid, vitabu vya Tasawuf, vitabu vya Nahwu, n.k. Wamepangwa vizuri katika safu nyingi na baadhi yao wamepangwa vizuri kulingana na waandishi. Kwenye kiwango cha pili ni vitabu vyangu vya kusoma kama vile vitabu vya Sarufi, Vitabu vya Kuandika, vitabu vya TOEFL, n.k. Hizi zimepangwa kulingana na ukubwa. Kwenye rafu inayofuata kuna aina nyingi za kisayansi na vitabu vya ujuzi; kwa mfano, Falsafa, Siasa, Historia n.k. Kuna viwango vitatu kwa haya. Hatimaye, chini ya rafu yangu ya vitabu kuna kamusi, ni kamusi za Kiarabu na kamusi za Kiingereza na pia kamusi za Kiindonesia. Hakika, kuna viwango sita kwenye rafu yangu kubwa ya vitabu na vimewekwa katika safu mlalo nyingi. Ngazi ya kwanza inajumuisha vitabu vya dini, ngazi ya pili inajumuisha vitabu vyangu vya kusoma, ngazi ya tatu ikiwa na viwango vitatu inajumuisha aina nyingi za vitabu vya kisayansi na maarifa na ngazi ya mwisho inajumuisha kamusi. Kwa kifupi, napenda rafu yangu ya vitabu.

Agizo maalum kwa jumla

Ujuzi unaohitajika kuandika huanzia kutengeneza alama za michoro zinazofaa, kupitia kutumia rasilimali za lugha teule, hadi kutazamia miitikio ya wasomaji wanaokusudiwa. Sehemu ya kwanza ya ustadi inahusisha kupata mfumo wa uandishi, ambao unaweza kuwa wa kialfabeti (kama ilivyo katika lugha za Ulaya) au zisizo za anafabeti (kama ilivyo katika lugha nyingi za Asia). Eneo la ujuzi wa pili linahitaji kuteua sarufi na msamiati ufaao ili kuunda sentensi zinazokubalika na kisha kuzipanga katika aya. Tatu, uandishi unahusisha kufikiri juu ya madhumuni ya matini itakayotungwa na kuhusu athari zake zinazoweza kutokea kwa wasomaji wanaokusudiwa. Kipengele kimoja muhimu cha kipengele hiki cha mwisho ni uchaguzi wa mtindo unaofaa. Tofauti na kuzungumza, kuandika ni mchakato changamano wa utambuzi wa kijamii ambao unapaswa kupatikana kupitia miaka ya mafunzo au shule. (Swales and Feak, 1994, p. 34)

Agizo la jumla-kwa-maalum

"Kufanya kazi kwa muda kama cashier katika Piggly Wiggly kumenipa fursa nzuri ya kuchunguza tabia za binadamu. Wakati mwingine mimi hufikiria wanunuzi kama panya weupe katika majaribio ya maabara, na njia kama maze iliyoundwa na mwanasaikolojia. panya - wateja, namaanisha - kufuata muundo wa kawaida, kutembea juu na chini ya njia, kuangalia kupitia chute yangu, na kisha kutoroka kwa njia ya kutoka, lakini sio kila mtu anayetegemea sana . mteja asiye wa kawaida: amnesiac, super shopper, na dawdler."

Kuna mambo mengi yanayochangia kufaulu kwa wanafunzi chuoni. Jambo la kwanza ni kuwa na lengo akilini kabla ya kuanzisha kozi ya masomo. Lengo linaweza kuwa la jumla kama vile kutaka kujielimisha vizuri zaidi kwa siku zijazo. Lengo mahususi zaidi litakuwa kupata kitambulisho cha ualimu. Jambo la pili linalohusiana na mafanikio ya mwanafunzi ni kujitolea na kujitolea. Mwanafunzi anayetaka kufaulu na kufanya kazi kwa hamu hii atapata mafanikio kwa urahisi kama mwanafunzi wa chuo kikuu. Jambo la tatu linalohusishwa na kufaulu kwa wanafunzi ni kutumia huduma za chuo kikuu. Wanafunzi wengi wanaoanza chuo kikuu hushindwa kutambua jinsi inavyoweza kuwa muhimu kuona mshauri au kushauriana na mkutubi au afisa wa usaidizi wa kifedha.

Kuna sababu tatu kwa nini Kanada ni moja ya Bora nchi duniani. Kwanza, Kanada ina huduma bora ya afya. Wakanada wote wanaweza kupata huduma za matibabu kwa bei nzuri. Pili, Kanada ina kiwango cha juu cha elimu. Wanafunzi wanafundishwa kuwa walimu waliofunzwa vyema na wanahimizwa kuendelea kusoma chuo kikuu. Hatimaye, miji ya Kanada ni safi na imepangwa vyema. Miji ya Kanada ina mbuga nyingi na nafasi nyingi kwa watu kuishi. Kwa hiyo, Kanada ni mahali pazuri pa kuishi.

York alishtakiwa na askari sita wa Ujerumani ambao walikuja kwake na bayonets fasta. Alichora shanga juu ya mtu wa sita, akafyatua risasi, na kisha juu ya wa tano. Alifanya kazi chini ya mstari, na kabla ya kujua, mtu wa kwanza alikuwa peke yake. York ilimuua kwa risasi moja.

Alipotazama chuo kikuu, ambacho kilikuwa hakijabadilika, bila fahamu alijipa raha zile nyakati alizokaa na Nancy. Alikumbuka jinsi wawili hao walivyokuwa wakiketi kando ya bwawa, wakipiga soga bila kikomo huku wakiwalisha samaki na pia jinsi wangetembea pamoja, wakiwa wamepotea katika ulimwengu wao. Ndiyo, Nancy alikuwa mmoja wa marafiki wachache ambao amewahi kuwa nao. ....ghafla alijawa na hali ya huzuni huku akikumbuka mchana ule alimuaga Nancy. Alinusa kwa nguvu huku macho yake yakitokwa na machozi.

Mifano ya kutatua matatizo mengi ya rejista

Mfano 1. Mlinganyo wa rejista kulingana na uchunguzi 17 una fomu:

Weka thamani zinazokosekana, na pia ujenge muda wa kujiamini kwa b 2 na uwezekano 0.99.

Suluhisho. Tunaamua maadili yanayokosekana kwa kutumia fomula:

Kwa hivyo, equation ya rejista na sifa za takwimu inaonekana kama hii:

Muda wa kujiamini kwa b 2 tunajenga kulingana na fomula inayofaa. Hapa kiwango cha umuhimu ni 0.01 na idadi ya digrii za uhuru ni nuk– 1 = 17 – 3 – 1 = 13, wapi n= 17 - saizi ya sampuli, uk= 3 - idadi ya vipengele katika mlinganyo wa kurejesha. Kutoka hapa

au . Muda huu wa kujiamini hufunika thamani halisi ya kigezo na uwezekano wa 0.99.

Mfano 2. Mlinganyo wa urekebishaji katika vigeu vya sanifu inaonekana kama hii:

Katika kesi hii, tofauti za vigezo vyote ni sawa na maadili yafuatayo:

Linganisha mambo kulingana na kiwango cha ushawishi juu ya tabia inayosababishwa na kuamua maadili ya mgawo wa elasticity.

Suluhisho. Milinganyo ya urekebishaji sanifu hukuruhusu kulinganisha mambo kulingana na nguvu ya ushawishi wao kwenye matokeo. Zaidi ya hayo, kadri thamani kamili ya mgawo wa kigezo sanifu inavyozidi kuwa kikubwa, ndivyo sababu hii inavyoathiri kwa nguvu zaidi sifa inayotokana. Katika equation inayozingatiwa, jambo ambalo lina athari kubwa zaidi kwenye matokeo ni x 1, kuwa na mgawo wa 0.82, dhaifu ni sababu x 3 na mgawo sawa na - 0.43.

Katika modeli ya urejeshaji nyingi ya mstari, mgawo wa jumla (wastani) wa unyumbufu wa sehemu hubainishwa na usemi unaojumuisha thamani za wastani za vigeuzo na mgawo wa kipengele kinacholingana cha mlingano wa urekebishaji wa mizani asilia. Katika hali ya shida, idadi hii haijabainishwa. Kwa hivyo, tutatumia misemo kwa utofauti wa anuwai:

Odd b j kuhusiana na mgawo sanifu β j uwiano unaolingana, ambao tunabadilisha katika fomula ya mgawo wa wastani wa elasticity:

.

Katika kesi hii, ishara ya mgawo wa elasticity itafanana na ishara β j:

Mfano 3. Kwa uchunguzi 32, data ifuatayo ilipatikana:

Amua maadili ya mgawo uliorekebishwa wa uamuzi, mgawo wa usawa wa sehemu na parameta. A.

Suluhisho. Thamani ya mgawo uliorekebishwa wa uamuzi itaamuliwa kwa kutumia moja ya fomula za kuihesabu:

Mgawo wa usawa wa sehemu (wastani wa idadi ya watu) huhesabiwa kwa kutumia fomula zinazofaa:

Kwa kuwa equation ya rejista nyingi ya mstari imeridhika kwa kubadilisha maadili ya wastani ya anuwai zote ndani yake, tunafafanua parameta. A:

Mfano 4. Takwimu zifuatazo zinapatikana kwa anuwai kadhaa:

Tengeneza mlinganyo wa urejeshi kwa mizani sanifu na asilia.

Suluhisho. Kwa kuwa migawo ya uunganisho wa jozi kati ya vigeu inajulikana mwanzoni, tunapaswa kuanza kwa kuunda mlinganyo wa rejista kwenye mizani sanifu. Ili kufanya hivyo, ni muhimu kutatua mfumo unaofanana wa equations ya kawaida, ambayo katika kesi ya mambo mawili ina fomu:

au, baada ya kubadilisha data asili:

Kutatua mfumo huu kwa njia yoyote, tunapata: β 1 = 0,3076, β 2 = 0,62.

Wacha tuandike equation ya rejista kwa kiwango sanifu:

Sasa wacha tuendelee kwenye mlinganyo wa rejista kwa kiwango asilia, ambacho tunatumia fomula za kukokotoa mgawo wa rejista kupitia mgawo wa beta na mali ya uhalali wa mlingano wa rejista kwa anuwai ya wastani:

Mlinganyo wa urejeshaji kwa kiwango cha asili ni:

Mfano 5. Wakati wa kuunda rejista nyingi za mstari kwa vipimo 48, mgawo wa uamuzi ulikuwa 0.578. Baada ya kuwatenga mambo x 3, x 7 Na x 8 mgawo wa uamuzi ulipungua hadi 0.495. Je, uamuzi ulifanywa wa kubadilisha muundo wa vibadilishio vyenye ushawishi katika viwango vya umuhimu vya 0.1, 0.05 na 0.01 ulihalalishwa?

Suluhisho. Hebu iwe mgawo wa uamuzi wa equation ya kurejesha na seti ya awali ya vipengele, na iwe mgawo wa uamuzi baada ya kujumuisha mambo matatu. Tunatoa nadharia:

;

Dhana kuu inadhani kuwa kupungua kwa ukubwa haukuwa muhimu na uamuzi wa kuwatenga kundi la mambo ulikuwa sahihi. Dhana mbadala inaonyesha kuwa uamuzi wa kuwatenga ulikuwa sahihi.

Ili kujaribu nadharia tupu tunatumia takwimu zifuatazo:

,

Wapi n = 48, uk= 10 - idadi ya awali ya sababu, k= 3 - idadi ya mambo yaliyotengwa. Kisha

Wacha tulinganishe dhamana iliyopatikana na ile muhimu F(α ; 3; 39) katika ngazi 0.1; 0.05 na 0.01:

F(0,1; 3; 37) = 2,238;

F(0,05; 3; 37) = 2,86;

F(0,01; 3; 37) = 4,36.

Katika ngazi α = 0,1 F obs. > F cr, sifuri - hypothesis inakataliwa, kutengwa kwa kundi hili la mambo sio haki, katika viwango vya 0.05 0.01 zero - hypothesis haiwezi kukataliwa, na kutengwa kwa mambo kunaweza kuchukuliwa kuwa sawa.

Mfano 6. Kulingana na data ya robo mwaka kutoka 2000 hadi 2004, equation hupatikana. Katika kesi hii, ESS=110.3, RSS=21.4 (ESS - ilielezea kupotoka kwa kawaida, RSS - kupotoka kwa kiwango cha mabaki). Vigezo vitatu vya dummy vinavyolingana na robo tatu za kwanza za mwaka viliongezwa kwa equation, na thamani ya ESS iliongezeka hadi 120.2. Je, kuna msimu katika mlingano huu?

Suluhisho. Hili ni jukumu la kuangalia uhalali wa kujumuisha kikundi cha mambo katika mlingano wa rejista nyingi. Vigezo vitatu vinavyolingana na robo tatu za kwanza za mwaka viliongezwa kwenye mlinganyo wa awali wa vipengele vitatu.

Wacha tujue coefficients ya uamuzi wa equations. Jumla ya mkengeuko wa kawaida unafafanuliwa kama jumla ya kipengele na mchepuko wa kawaida wa mabaki:

TSS = ESS 1 + RSS 1 = 110.3 + 21.4 = 131.7

Tunajaribu hypotheses. Ili kujaribu nadharia tupu tunatumia takwimu

Hapa n= 20 (robo 20 zaidi ya miaka mitano - kutoka 2000 hadi 2004), uk = 6 (jumla mambo katika mlinganyo wa rejista baada ya kujumuisha mambo mapya), k= 3 (idadi ya mambo pamoja). Hivyo:

Wacha tuamue maadili muhimu ya takwimu za Fisher katika viwango tofauti vya umuhimu:

Katika viwango vya umuhimu vya 0.1 na 0.05 F obs.> F cr, null - dhana imekataliwa kwa ajili ya mbadala, na kwa kuzingatia msimu katika urejeshaji ni haki (kuongeza mambo matatu mapya ni haki), na katika kiwango cha 0.01 F obs.< F cr, na sifuri - hypothesis haiwezi kukataliwa; kuongeza sababu mpya sio sawa; msimu katika urejeshaji sio muhimu.

Mfano 7. Wakati wa kuchambua data kwa heteroskedasticity, sampuli nzima, baada ya kuagiza kwa moja ya sababu, iligawanywa katika sampuli tatu. Kisha, kulingana na matokeo ya uchambuzi wa urejeshaji wa mambo matatu, iliamuliwa kuwa kupotoka kwa kiwango cha mabaki katika sampuli ya kwanza ilikuwa 180, na ya tatu - 63. Je, uwepo wa heteroscedasticity umethibitishwa ikiwa ukubwa wa data katika kila sampuli ni 20?

Suluhisho. Wacha tuhesabu takwimu ili kujaribu nadharia potofu ya usawa wa jinsia moja kwa kutumia jaribio la Goldfeld–Quandt:

.

Wacha tupate maadili muhimu ya takwimu za Fisher:

Kwa hiyo, katika viwango vya umuhimu wa 0.1 na 0.05 F obs.> F cr, na heteroskedasticity hutokea, na kwa kiwango cha 0.01 F obs.< F cr, na hypothesis ya homoscedasticity haiwezi kukataliwa.

Mfano 8. Kulingana na data ya robo mwaka, equation nyingi za regression zilipatikana ambazo ESS = 120.32 na RSS = 41.4. Kwa mfano huo huo, urejeshaji ulifanyika tofauti kulingana na data ifuatayo: robo ya 1 ya 1991 - robo ya 1 ya 1995 na robo ya 2 ya 1995 - robo ya 4 ya 1996. Katika marekebisho haya, upungufu wa kiwango cha mabaki ulikuwa 22.25 na 12.32, kwa mtiririko huo. . Jaribu hypothesis kuhusu kuwepo kwa mabadiliko ya kimuundo katika sampuli.

Suluhisho. Tatizo la kuwepo kwa mabadiliko ya kimuundo katika sampuli hutatuliwa kwa kutumia mtihani wa Chow.

Nadharia zina umbo: , wapi s 0, s 1 Na s 2- mikengeuko ya kawaida ya mabaki, mtawalia, kwa mlinganyo mmoja wa sampuli nzima na milinganyo ya rejista kwa sampuli ndogo mbili za sampuli jumla. Dhana kuu inakanusha kuwepo kwa mabadiliko ya kimuundo katika sampuli. Ili kujaribu nadharia tupu, takwimu zinahesabiwa ( n = 24; uk = 3):

Kwa kuwa takwimu ya F ni chini ya moja, nadharia tete haiwezi kukataliwa katika kiwango chochote cha umuhimu. Kwa mfano, kwa kiwango cha umuhimu cha 0.05.

Uchambuzi wa urejeshi ni njia ya utafiti wa takwimu ambayo hukuruhusu kuonyesha utegemezi wa kigezo fulani kwenye kigezo kimoja au zaidi cha kujitegemea. Katika enzi ya kabla ya kompyuta, matumizi yake yalikuwa magumu sana, haswa linapokuja suala la idadi kubwa ya data. Leo, baada ya kujifunza jinsi ya kujenga regression katika Excel, unaweza kutatua matatizo magumu ya takwimu katika dakika chache tu. Chini ni mifano maalum kutoka uwanja wa uchumi.

Aina za Kurudi nyuma

Wazo hili lenyewe lilianzishwa katika hisabati mnamo 1886. Kurudi nyuma hufanyika:

  • mstari;
  • kimfano;
  • kutuliza;
  • kielelezo;
  • hyperbolic;
  • maandamano;
  • logarithmic.

Mfano 1

Wacha tuzingatie shida ya kuamua utegemezi wa idadi ya washiriki wa timu ambao waliacha kwa wastani wa mshahara katika biashara 6 za viwandani.

Kazi. Katika makampuni sita, wastani wa mshahara wa kila mwezi na idadi ya wafanyakazi ambao waliacha kazi kutokana na kwa mapenzi. Katika fomu ya jedwali tunayo:

Idadi ya watu walioacha

Mshahara

30,000 rubles

35,000 rubles

40,000 rubles

rubles 45,000

50,000 rubles

55,000 rubles

60,000 rubles

Kwa kazi ya kuamua utegemezi wa idadi ya wafanyikazi wanaoacha kazi kwa wastani wa mshahara katika biashara 6, muundo wa regression una fomu ya equation Y = a 0 + a 1 x 1 +...+a k x k, ambapo x i ni kuathiri vigeu, a i ni hesabu za rejista, na k ni idadi ya mambo.

Kwa shida hii, Y ni kiashiria cha kuacha wafanyikazi, na sababu ya ushawishi ni mshahara, ambayo tunaashiria kwa X.

Kwa kutumia uwezo wa kichakataji lahajedwali la Excel

Uchambuzi wa urejeshaji katika Excel lazima utanguliwe kwa kutumia vitendaji vilivyojumuishwa kwenye data iliyopo ya jedwali. Hata hivyo, kwa madhumuni haya ni bora kutumia nyongeza ya "Uchambuzi Pack" muhimu sana. Ili kuiwasha unahitaji:

  • kutoka kwenye kichupo cha "Faili" nenda kwenye sehemu ya "Chaguo";
  • katika dirisha linalofungua, chagua mstari wa "Ongeza";
  • bonyeza kitufe cha "Nenda" kilicho hapa chini, upande wa kulia wa mstari wa "Usimamizi";
  • angalia kisanduku karibu na jina "Kifurushi cha uchambuzi" na uthibitishe vitendo vyako kwa kubofya "Ok".

Ikiwa kila kitu kimefanywa kwa usahihi, kifungo kinachohitajika kitaonekana upande wa kulia wa kichupo cha "Data", kilicho juu ya karatasi ya Excel.

katika Excel

Kwa kuwa sasa tuna zana zote muhimu za mtandaoni za kufanya hesabu za uchumi, tunaweza kuanza kutatua tatizo letu. Kwa hii; kwa hili:

  • Bonyeza kitufe cha "Uchambuzi wa Takwimu";
  • katika dirisha linalofungua, bofya kitufe cha "Regression";
  • kwenye kichupo kinachoonekana, ingiza anuwai ya maadili ya Y (idadi ya wafanyikazi walioacha kazi) na kwa X (mishahara yao);
  • Tunathibitisha vitendo vyetu kwa kushinikiza kitufe cha "Ok".

Kwa hivyo, programu itajaza lahajedwali mpya kiotomatiki na data ya uchanganuzi wa rejista. Kumbuka! Excel hukuruhusu kuweka mwenyewe eneo unalopendelea kwa madhumuni haya. Kwa mfano, inaweza kuwa karatasi sawa ambapo thamani za Y na X ziko, au hata Kitabu kipya, iliyoundwa mahususi kwa kuhifadhi data kama hiyo.

Uchambuzi wa matokeo ya urejeshaji wa R-mraba

Katika Excel, data iliyopatikana wakati wa usindikaji wa data katika mfano unaozingatiwa ina fomu:

Kwanza kabisa, unapaswa kuzingatia thamani ya R-mraba. Inawakilisha mgawo wa uamuzi. Katika mfano huu, R-mraba = 0.755 (75.5%), yaani, vigezo vilivyohesabiwa vya mfano vinaelezea uhusiano kati ya vigezo vinavyozingatiwa na 75.5%. Thamani ya juu ya mgawo wa uamuzi, inafaa zaidi mfano uliochaguliwa kwa kazi maalum. Inachukuliwa kuelezea kwa usahihi hali halisi wakati thamani ya R-mraba iko juu ya 0.8. Ikiwa R-mraba<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Uchambuzi wa Odds

Nambari 64.1428 inaonyesha thamani ya Y itakuwa nini ikiwa vijiti vyote vya xi katika mfano tunaozingatia vitawekwa upya hadi sifuri. Kwa maneno mengine, inaweza kusema kuwa thamani ya parameter iliyochambuliwa pia huathiriwa na mambo mengine ambayo hayajaelezewa katika mfano maalum.

Mgawo unaofuata -0.16285, ulio katika kiini B18, unaonyesha uzito wa ushawishi wa kutofautiana kwa X kwenye Y. Hii ina maana kwamba wastani wa mshahara wa kila mwezi wa wafanyakazi ndani ya mfano unaozingatiwa huathiri idadi ya waachaji na uzito wa -0.16285, i.e. kiwango cha ushawishi wake ni kidogo kabisa. Ishara "-" inaonyesha kwamba mgawo ni hasi. Hii ni dhahiri, kwa kuwa kila mtu anajua kuwa mshahara wa juu katika biashara, watu wachache huonyesha hamu ya kusitisha mkataba wa ajira au kuacha.

Rejea nyingi

Neno hili linarejelea mlingano wa uhusiano na vigeu kadhaa huru vya fomu:

y=f(x 1 +x 2 +…x m) + ε, ambapo y ni sifa tokeo (kigeu tegemezi), na x 1, x 2,…x m ni sifa za kipengele (vigezo vinavyojitegemea).

Makadirio ya Parameta

Kwa regression nyingi (MR), inafanywa kwa kutumia njia ya angalau mraba (OLS). Kwa milinganyo ya mstari wa fomu Y = a + b 1 x 1 +…+b m x m + ε tunaunda mfumo wa milinganyo ya kawaida (tazama hapa chini)

Ili kuelewa kanuni ya njia, fikiria kesi ya sababu mbili. Kisha tuna hali iliyoelezwa na formula

Kutoka hapa tunapata:

ambapo σ ni tofauti ya sifa inayolingana inayoonyeshwa kwenye faharasa.

OLS inatumika kwa mlinganyo wa MR kwa mizani iliyosanifiwa. Katika kesi hii, tunapata equation:

ambayo t y, t x 1, ... t xm ni vigezo vya kawaida, ambavyo maadili ya wastani ni sawa na 0; β i ni hesabu sanifu za urekebishaji, na mkengeuko wa kawaida ni 1.

Tafadhali kumbuka kuwa β i zote katika kesi hii zimeainishwa kama za kawaida na za kati, kwa hivyo ulinganisho wao na kila mmoja unachukuliwa kuwa sawa na unakubalika. Kwa kuongeza, ni desturi ya kuchunguza vipengele kwa kutupa zile zilizo na thamani za chini kabisa za βi.

Tatizo la kutumia Mlingano wa Regression wa Linear

Tuseme tuna jedwali la mienendo ya bei ya bidhaa mahususi N katika kipindi cha miezi 8 iliyopita. Ni muhimu kufanya uamuzi juu ya ushauri wa ununuzi wa kundi lake kwa bei ya rubles 1850 / t.

nambari ya mwezi

jina la mwezi

bei ya bidhaa N

Rubles 1750 kwa tani

Rubles 1755 kwa tani

Rubles 1767 kwa tani

Rubles 1760 kwa tani

Rubles 1770 kwa tani

Rubles 1790 kwa tani

Rubles 1810 kwa tani

Rubles 1840 kwa tani

Ili kutatua tatizo hili katika processor ya lahajedwali ya Excel, unahitaji kutumia chombo cha "Uchambuzi wa Data", tayari kinachojulikana kutoka kwa mfano uliowasilishwa hapo juu. Ifuatayo, chagua sehemu ya "Regression" na uweke vigezo. Ni lazima ikumbukwe kwamba katika sehemu ya "Muda wa Kuingiza Y" anuwai ya maadili lazima iingizwe kwa tofauti tegemezi (katika kesi hii, bei za bidhaa katika miezi maalum ya mwaka), na katika "Muda wa Kuingiza X" - kwa kutofautiana kwa kujitegemea (nambari ya mwezi). Thibitisha kitendo kwa kubofya "Sawa". Kwenye laha mpya (ikiwa imeonyeshwa hivyo) tunapata data ya urekebishaji.

Kwa kuzitumia, tunaunda equation ya mstari wa fomu y=ax+b, ambapo vigezo a na b ni coefficients ya mstari na jina la nambari ya mwezi na coefficients na mistari "Y-intersection" kutoka kwa karatasi na. matokeo ya uchambuzi wa urejeshaji. Kwa hivyo, equation ya regression ya mstari (LR) ya kazi ya 3 imeandikwa kama:

Bei ya bidhaa N = 11.714 * nambari ya mwezi + 1727.54.

au katika nukuu za aljebra

y = 11.714 x + 1727.54

Uchambuzi wa matokeo

Kuamua kama equation inayotokana inatosha rejeshi la mstari, viambajengo vingi vya uunganisho (MCC) na viambajengo vya kubainisha vinatumika, pamoja na mtihani wa Fisher na mtihani wa Mwanafunzi. Katika lahajedwali la Excel na matokeo ya urekebishaji, huitwa nyingi R, R-mraba, F-takwimu na t-takwimu, kwa mtiririko huo.

KMC R inafanya uwezekano wa kutathmini ukaribu wa uhusiano wa uwezekano kati ya vigeu huru na tegemezi. Thamani yake ya juu inaonyesha uhusiano wenye nguvu kati ya vigezo "Nambari ya mwezi" na "Bei ya bidhaa N katika rubles kwa tani 1". Walakini, asili ya uhusiano huu bado haijulikani.

Mraba wa mgawo wa uamuzi R2 (RI) ni tabia ya nambari ya uwiano wa jumla ya kutawanyika na inaonyesha kusambaza ambayo sehemu ya data ya majaribio, i.e. maadili ya tofauti tegemezi inalingana na usawa wa rejista ya mstari. Katika tatizo linalozingatiwa, thamani hii ni sawa na 84.8%, yaani, data ya takwimu inaelezwa kwa kiwango cha juu cha usahihi na SD inayosababisha.

Takwimu za F, pia huitwa mtihani wa Fisher, hutumiwa kutathmini umuhimu wa uhusiano wa mstari, kukanusha au kuthibitisha dhana ya kuwepo kwake.

(Jaribio la Mwanafunzi) husaidia kutathmini umuhimu wa mgawo kwa neno lisilojulikana au lisilolipishwa la uhusiano wa mstari. Ikiwa thamani ya t-test > t cr, basi dhana juu ya kutokuwa na maana ya neno huru mlinganyo wa mstari kukataliwa.

Katika tatizo linalozingatiwa kwa muda wa bure, kwa kutumia zana za Excel, ilipatikana kuwa t = 169.20903, na p = 2.89E-12, yaani, tuna uwezekano wa sifuri kwamba hypothesis sahihi kuhusu kutokuwa na maana ya neno la bure itakataliwa. . Kwa mgawo wa kisichojulikana t=5.79405, na p=0.001158. Kwa maneno mengine, uwezekano kwamba hypothesis sahihi juu ya kutokuwa na maana ya mgawo kwa haijulikani itakataliwa ni 0.12%.

Kwa hivyo, inaweza kubishaniwa kuwa equation ya rejista ya mstari inayotokana inatosha.

Tatizo la uwezekano wa ununuzi wa block ya hisa

Rejea nyingi katika Excel hufanywa kwa kutumia zana sawa ya Uchambuzi wa Data. Hebu fikiria tatizo maalum la maombi.

Wasimamizi wa kampuni ya NNN lazima waamue kuhusu ushauri wa kununua hisa 20% katika MMM JSC. Gharama ya kifurushi (SP) ni dola milioni 70 za Kimarekani. Wataalamu wa NNN wamekusanya data kuhusu miamala kama hiyo. Iliamuliwa kutathmini thamani ya kizuizi cha hisa kulingana na vigezo kama hivyo, vilivyoonyeshwa kwa mamilioni ya dola za Kimarekani, kama:

  • akaunti zinazolipwa (VK);
  • kiasi mauzo ya kila mwaka(VO);
  • akaunti zinazopokelewa (VD);
  • gharama ya mali zisizohamishika (COF).

Kwa kuongezea, kigezo cha malimbikizo ya mishahara ya biashara (V3 P) katika maelfu ya dola za Kimarekani hutumiwa.

Suluhisho kwa kutumia kichakataji lahajedwali la Excel

Kwanza kabisa, unahitaji kuunda meza ya data ya chanzo. Inaonekana kama hii:

  • piga dirisha la "Uchambuzi wa Data";
  • chagua sehemu ya "Regression";
  • Katika kisanduku cha "Ingiza muda Y", ingiza anuwai ya anuwai ya anuwai tegemezi kutoka kwa safu G;
  • Bofya kwenye aikoni iliyo na mshale mwekundu upande wa kulia wa dirisha la "Ingiza muda X" na uangazie anuwai ya thamani zote kutoka safu wima B, C, D, F kwenye laha.

Weka alama kwenye kipengee cha "Karatasi Mpya" na ubofye "Sawa".

Pata uchanganuzi wa rejista kwa shida fulani.

Utafiti wa matokeo na hitimisho

"Tunakusanya" mlinganyo wa kurejesha hali kutoka kwa data iliyozungushwa iliyowasilishwa hapo juu kwenye lahajedwali ya Excel:

SP = 0.103 * SOF + 0.541 * VO - 0.031 * VK +0.405 * VD +0.691 * VZP - 265.844.

Katika inayojulikana zaidi fomu ya hisabati inaweza kuandikwa kama:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

Data ya MMM JSC imewasilishwa kwenye jedwali:

Tukiziweka katika mlinganyo wa kurudi nyuma, tunapata kiasi cha dola za Marekani milioni 64.72. Hii ina maana kwamba hisa za MMM JSC hazifai kununuliwa, kwa kuwa thamani yao ya dola milioni 70 za Marekani imepanda sana.

Kama unavyoona, matumizi ya lahajedwali ya Excel na mlinganyo wa kurudi nyuma ulifanya iwezekane kufanya uamuzi sahihi kuhusu uwezekano wa shughuli mahususi.

Sasa unajua regression ni nini. Mifano ya Excel iliyojadiliwa hapo juu itakusaidia kutatua matatizo ya vitendo katika uwanja wa uchumi.

Maswali:

4. Ukadiriaji wa vigezo vya muundo wa urejeshaji mwingi wa mstari.

5. Kutathmini ubora wa urejeshaji wa mstari mwingi.

6. Uchambuzi na utabiri kulingana na mifano ya multifactor.

Rejea nyingi ni ujanibishaji wa urejeleaji wa pande mbili. Inatumika kuelezea uhusiano kati ya mabadiliko (tegemezi) yaliyoelezewa na vigeu vya maelezo (huru) X 1, X 2,..., X k. Urejeshaji mara nyingi unaweza kuwa wa mstari au usio na mstari, lakini urejeshaji mwingi wa mstari umeenea sana katika uchumi.

Kinadharia mfano wa mstari regression nyingi ina fomu:

Tunaashiria urejeshaji wa sampuli unaolingana:

Kama ilivyo katika urejeleaji wa pande mbili, neno nasibu ε lazima likidhi mawazo ya kimsingi ya uchanganuzi wa urejeshi. Kisha, kwa kutumia OLS, makadirio bora yasiyo na upendeleo na yenye ufanisi ya vigezo vya urejeshaji wa kinadharia hupatikana. Kwa kuongezea, vigeuzo X 1, X 2,…, X k lazima visiwe na uhusiano (vinajitegemea kimstari) na kila kimoja. Ili kuandika fomula za kukadiria hesabu za urejeshi (2), zilizopatikana kwa msingi wa miraba ndogo zaidi, tunatanguliza nukuu ifuatayo:

Kisha tunaweza kuandika katika fomu ya vector-matrix mfano wa kinadharia:

na sampuli ya kurudi nyuma

LSM inaongoza kwa formula ifuatayo ya kukadiria vekta ya coefficients sampuli rejeshi:

(3)

Ili kukadiria coefficients nyingi za urejeleaji wa mstari na vigeu viwili huru , tunaweza kutatua mfumo wa equations:

(4)

Kama ilivyo katika urejeshaji wa mstari uliooanishwa, kosa la kawaida la urekebishaji S huhesabiwa kwa rejista nyingi:

(5)

na makosa ya kawaida ya coefficients regression:

(6)

Umuhimu wa coefficients huangaliwa kwa kutumia t-test.

kuwa na nyongeza ya Mwanafunzi na idadi ya digrii za uhuru v= n-k-1.

Ili kutathmini ubora wa rejista, mgawo wa uamuzi (index) hutumiwa:

, (8)

inapokaribia 1, ndivyo ubora wa urejeshaji unavyoongezeka.

Ili kuangalia umuhimu wa mgawo wa uamuzi, mtihani wa Fisher au F-takwimu hutumiwa.



(9)

Na v 1=k, v 2=n-k-1 digrii za uhuru.

Katika regression ya multivariate, kuongeza vigezo vya ziada vya maelezo huongeza mgawo wa uamuzi. Ili kufidia ongezeko hili, mgawo uliorekebishwa (au wa kawaida) wa uamuzi huletwa:

(10)

Ikiwa ongezeko la sehemu ya urejeshaji ulioelezewa wakati wa kuongeza kibadilishaji kipya ni ndogo, inaweza kupungua. Hii inamaanisha kuwa kuongeza kigezo kipya siofaa.

Mfano 4:

Wacha tuzingatie utegemezi wa faida ya biashara kwa gharama ya vifaa na teknolojia mpya na juu ya gharama za kuboresha ujuzi wa wafanyikazi. Data ya takwimu juu ya biashara 6 sawa ilikusanywa. Data katika mamilioni ya dola. vitengo yametolewa kwenye jedwali 1.

Jedwali 1

Panga urejeshaji wa mstari wa sababu mbili na kutathmini umuhimu wake. Wacha tuanzishe nukuu ifuatayo:

Tunabadilisha matrix X:

Ugeuzi wa matrix hii:

Kwa hivyo, utegemezi wa faida kwa gharama za vifaa na mashine mpya na gharama za kuboresha ustadi wa wafanyikazi unaweza kuelezewa na hali ifuatayo:

Kwa kutumia fomula (5), ambapo k=2, tunakokotoa kosa la kawaida la urejeshaji S=0.636.

Tunakokotoa makosa ya kawaida ya hesabu za urejeshaji kwa kutumia fomula (6):

Vile vile:

Wacha tuangalie umuhimu wa mgawo wa rejista 1, 2. Wacha tuhesabu t calc.

Wacha tuchague kiwango cha umuhimu, idadi ya digrii za uhuru

inamaanisha mgawo a 1 muhimu

Wacha tutathmini umuhimu wa mgawo wa 2:

Mgawo a 2 isiyo na maana

Wacha tuhesabu mgawo wa uamuzi kwa kutumia fomula (7). Faida ya biashara inategemea 96% kwa gharama ya vifaa na teknolojia mpya na mafunzo ya hali ya juu kwa 4% kwa sababu zingine na za nasibu. Wacha tuangalie umuhimu wa mgawo wa uamuzi. Wacha tuhesabu F iliyohesabiwa:

Hiyo. mgawo wa uamuzi ni muhimu, usawa wa regression ni muhimu.

Ya umuhimu mkubwa katika uchambuzi kulingana na urekebishaji wa multivariate ni kulinganisha kwa ushawishi wa mambo kwenye kiashiria tegemezi y. Migawo ya urejeshaji haitumiki kwa kusudi hili kwa sababu ya tofauti katika vitengo vya kipimo na viwango tofauti kushuka kwa thamani. Kutoka kwa mapungufu haya, coefficients ya elasticity ya bure:

Msisimko unaonyesha ni kwa asilimia ngapi kwa wastani kiashirio tegemezi y kinabadilika wakati kigeu kinapobadilika kwa 1%, mradi tu thamani za vigeu vingine zibaki bila kubadilika. Kubwa, ndivyo ushawishi mkubwa wa kigeu kinacholingana. Kama ilivyo katika urejeshaji wa jozi, urejeleaji mwingi hutofautisha kati ya utabiri wa uhakika na utabiri wa muda. Utabiri wa uhakika (nambari) hupatikana kwa kubadilisha thamani zilizotabiriwa za vigeu huru kwenye mlinganyo wa rejista nyingi. Wacha tuashiria kwa:

(12)

vekta ya maadili yaliyotabiriwa ya anuwai huru, kisha utabiri wa uhakika

Hitilafu ya kawaida utabiri katika kesi ya regression nyingi hufafanuliwa kama ifuatavyo:

(15)

Hebu tuchague kiwango cha umuhimu α kulingana na jedwali la usambazaji la Wanafunzi. Kwa kiwango cha umuhimu α na idadi ya digrii za uhuru ν = n-k-1, tunapata t cr. Halafu thamani ya kweli y p na uwezekano 1- α huanguka kwenye muda:


Mada ya 5:

Mfululizo wa wakati.

Maswali:

4. Dhana za msingi za mfululizo wa wakati.

5. Mwelekeo kuu wa maendeleo ni mwenendo.

6. Kujenga mfano wa kuongeza.

Mfululizo wa wakati kuwakilisha seti ya maadili ya kiashirio chochote kwa muda au vipindi kadhaa mfululizo.

Wakati (au kipindi) cha wakati kinaonyeshwa na t, na thamani ya kiashirio kwa sasa inaonyeshwa na y (t) na inaitwa. ngazi ya safu .

Kila ngazi ya safu ya wakati huundwa chini ya ushawishi wa idadi kubwa ya mambo, ambayo yanaweza kugawanywa katika vikundi 3:

Mambo ya muda mrefu, yanayoendelea ambayo yana ushawishi mkubwa juu ya jambo linalosomwa na kuunda mwenendo kuu wa mfululizo - mwenendo T (t).

Sababu za muda mfupi zinazounda mabadiliko ya msimu katika mfululizo wa S(t).

Sababu nasibu zinazounda mabadiliko nasibu katika viwango vya mfululizo ε(t).

Mfano wa nyongeza mfululizo wa muda ni kielelezo ambacho kila ngazi ya mfululizo inawakilishwa na jumla ya mwenendo, msimu na sehemu ya nasibu:

Muundo wa kuzidisha ni mfano ambao kila ngazi ya mfululizo ni bidhaa ya vipengele vilivyoorodheshwa:

Uchaguzi wa moja ya mifano ni msingi wa uchambuzi wa muundo wa kushuka kwa msimu. Ikiwa amplitude ya oscillations ni takriban mara kwa mara, basi mfano wa kuongeza hujengwa. Ikiwa amplitude huongezeka, basi mfano wa kuzidisha.

Kazi kuu ya uchambuzi wa uchumi ni kutambua kila moja ya vipengele vilivyoorodheshwa.

Mwenendo kuu wa maendeleo (mwelekeo) inayoitwa badiliko nyororo na thabiti katika viwango vya mfululizo baada ya muda, lisilo na mabadiliko ya nasibu na ya msimu.

Kazi ya kutambua mwelekeo kuu wa maendeleo inaitwa mpangilio wa mfululizo wa wakati .

Mbinu za upatanishi wa mfululizo wa wakati ni pamoja na:

1) njia ya kupanua vipindi,

2) mbinu wastani wa kusonga,

3) usawa wa uchambuzi.

1) Vipindi vya muda ambavyo viwango vya mfululizo vinahusiana vimeongezwa. Kisha viwango vya mfululizo vinajumlishwa juu ya vipindi vilivyopanuliwa. Kushuka kwa viwango kwa sababu za nasibu kughairi nyingine. Mwelekeo wa jumla utajitokeza wazi zaidi.

2) Kuamua idadi ya viwango vya kwanza vya mfululizo, hesabu thamani ya wastani. Kisha wastani huhesabiwa kutoka kwa idadi sawa ya viwango vya mfululizo, kuanzia ngazi ya pili, nk. thamani ya wastani huteleza pamoja na mfululizo wa mienendo, kusonga mbele kwa kipindi 1 (pointi kwa wakati). Idadi ya viwango vya mfululizo ambapo wastani huhesabiwa inaweza kuwa sawa au isiyo ya kawaida. Kwa nambari isiyo ya kawaida, wastani wa kusonga hurejelewa kama katikati ya kipindi cha kuteleza. Kwa muda hata, kutafuta thamani ya wastani hailinganishwi na uamuzi wa t, lakini utaratibu wa centering hutumiwa, i.e. hesabu wastani wa wastani wa kusonga mbili mfululizo.

3) Ujenzi kazi ya uchambuzi, inayoonyesha utegemezi wa kiwango cha mfululizo kwa wakati. Vipengele vifuatavyo vinatumika kuunda mitindo:

Vigezo vya mwenendo huamuliwa kwa kutumia miraba angalau. Uchaguzi wa kazi bora zaidi unategemea mgawo R 2 .

Tutaunda mfano wa kuongeza kwa kutumia mfano.

Mfano 7:

Kuna data ya robo mwaka juu ya kiasi cha matumizi ya umeme katika eneo fulani kwa miaka 4. Data katika kW milioni kwenye jedwali 1.

Jedwali 1

Tengeneza muundo wa mfululizo wa wakati.

Katika mfano huu, tunazingatia nambari ya robo kama kigezo huru, na matumizi ya umeme kwa robo hiyo kama kigezo tegemezi y(t).

Kutoka kwa scatterplot unaweza kuona kwamba mwenendo ni mstari. Mtu anaweza pia kuona uwepo wa mabadiliko ya msimu (kipindi = 4) ya amplitude sawa, kwa hiyo tutajenga mfano wa kuongeza.

Kuunda muundo ni pamoja na hatua zifuatazo:

1. Wacha tupange safu asili kwa kutumia njia ya wastani ya kusonga kwa robo 4 na tufanye kuweka katikati:

1.1. Hebu tujumuishe viwango vya mfululizo kwa kufuatana kwa kila robo 4 na mabadiliko ya pointi 1 kwa wakati.

1.2. Kugawanya kiasi kinachosababishwa na 4 tunapata wastani wa kusonga.

1.3. Tunaleta maadili haya katika mawasiliano na pointi halisi kwa wakati, ambayo tunapata thamani ya wastani ya wastani wa kusonga mbili mfululizo - wastani wa kusonga unaozingatia.

2. Hebu tuhesabu tofauti ya msimu. Tofauti ya msimu (t) = y(t) - wastani wa kusonga mbele. Wacha tujenge meza 2.

meza 2

Nambari ya kuzuia-mwisho-mwisho t Matumizi ya umeme Y(t) Robo 4 wastani wa kusonga Wastani wa kusonga ulio katikati Ukadiriaji wa tofauti za msimu
6,0 - - -
4,4 6,1 - -
5,0 6,4 6,25 -1,25
9,0 6,5 6,45 2,55
7,2 6,75 6,625 0,575
: : : : :
6,6 8,35 8,375 -1,775
7,0 - - -
10,8 - - -

3. Kulingana na tofauti ya msimu katika Jedwali la 3, kipengele cha msimu kinahesabiwa.

Viashiria Mwaka Idadi ya robo mwaka I II III IV
- - -1,250 2,550
0,575 -2,075 -1,100 2,700
0,550 -2,025 -1,475 2,875
0,675 -1,775 - -
Jumla 1,8 -5,875 -3,825 8,125 Jumla
Wastani 0,6 -1,958 -1,275 2,708 0,075
Sehemu ya msimu 0,581 -1,977 -1,294 2,690

4. Kuondoa sehemu ya msimu kutoka kwa viwango vya awali vya safu:

Hitimisho:

Mfano wa nyongeza unaelezea 98.4% tofauti ya jumla viwango vya mfululizo wa saa asilia.

Kwa kubofya kitufe cha "Pakua kumbukumbu", utapakua faili unayohitaji bila malipo kabisa.
Kabla ya kupakua faili hili kumbuka insha hizo nzuri, mitihani, karatasi za muda, hizi, makala na hati zingine ambazo hazijadaiwa kwenye kompyuta yako. Hii ni kazi yako, inapaswa kushiriki katika maendeleo ya jamii na kunufaisha watu. Tafuta kazi hizi na uziwasilishe kwa msingi wa maarifa.
Sisi na wanafunzi wote, wanafunzi waliohitimu, wanasayansi wachanga wanaotumia msingi wa maarifa katika masomo na kazi zao tutakushukuru sana.

Ili kupakua kumbukumbu iliyo na hati, weka nambari ya tarakimu tano kwenye sehemu iliyo hapa chini na ubofye kitufe cha "Pakua kumbukumbu".

###### ## ## ###### ######
## ### ### ## ##
## #### ## ##### ##
## ## ## ## ## ##
## ## ###### ## ## ## ## ##
#### ## ###### #### ####

Ingiza nambari iliyoonyeshwa hapo juu:

Nyaraka zinazofanana

    Misingi ya ujenzi na upimaji wa utoshelevu mifano ya kiuchumi regression nyingi, tatizo la vipimo vyao na matokeo ya makosa. Msaada wa kimbinu na habari kwa urejeleaji mwingi. Mfano wa nambari mifano nyingi za urejeshaji.

    kazi ya kozi, imeongezwa 02/10/2014

    Dhana ya modeli nyingi za rejista. Kiini cha mbinu ya angalau miraba, ambayo hutumika kubainisha vigezo vya mlingano wa urejeshaji wa mstari mwingi. Tathmini ya ubora wa kufaa mlinganyo wa kurudi nyuma kwa data. Mgawo wa uamuzi.

    kazi ya kozi, imeongezwa 01/22/2015

    Ujenzi wa muundo wa urejeshaji wa laini nyingi kwa kutumia vigezo maalum. Tathmini ya ubora wa mfano kwa kutumia coefficients ya uamuzi na uwiano nyingi. Kubainisha umuhimu wa mlinganyo wa rejista kulingana na jaribio la Fisher F na jaribio la t la Mwanafunzi.

    mtihani, umeongezwa 12/01/2013

    Kuunda mlingano wa urejeshaji nyingi katika umbo la mstari na seti kamili vipengele, uteuzi wa mambo ya habari. Kukagua umuhimu wa mlinganyo wa kurudi nyuma kwa kutumia kigezo cha Fisher na umuhimu wa takwimu wa vigezo vya urejeshi kwa kutumia kigezo cha Mwanafunzi.

    kazi ya maabara, imeongezwa 10/17/2009

    Maelezo ya mtindo wa kawaida wa urejeshaji mwingi wa mstari. Uchambuzi wa matriki ya migawo ya uunganisho uliooanishwa kwa uwepo wa multicollinearity. Ukadiriaji wa muundo wa urejeshaji wa pande mbili wenye kipengele muhimu zaidi. Ujenzi wa mchoro wa muda wa utabiri.

    kazi ya kozi, imeongezwa 01/17/2016

    Sababu zinazounda bei ya vyumba katika nyumba zinazojengwa huko St. Kukusanya matriki ya migawo ya uunganisho iliyooanishwa ya vigeu asili. Kujaribu hitilafu nyingi za mlinganyo wa regression kwa heteroskedasticity. Mtihani wa Gelfeld-Quandt.

    mtihani, umeongezwa 05/14/2015

    Makadirio ya usambazaji wa kigezo cha X1. Kuiga uhusiano kati ya vigeu vya Y na X1 kwa kutumia kitendakazi cha mstari na mbinu ya urejeshaji ya mstari mwingi. Ulinganisho wa ubora wa mifano iliyojengwa. Kufanya utabiri wa uhakika kulingana na maadili uliyopewa.

    kazi ya kozi, imeongezwa 06/24/2015

Habari za mchana, wasomaji wapendwa.
Katika makala zilizopita, kwa kutumia mifano ya vitendo, nilionyesha njia za kutatua matatizo ya uainishaji (tatizo la alama ya mikopo) na misingi ya uchambuzi wa habari za maandishi (tatizo la pasipoti). Leo ningependa kugusa juu ya darasa lingine la shida, ambayo ni kupona tena. Shida za darasa hili kawaida hutumiwa katika utabiri.
Kwa mfano wa kutatua tatizo la utabiri, nilichukua data ya ufanisi wa Nishati kutoka kwenye hazina kubwa zaidi ya UCI. Kijadi, tutatumia Python na vifurushi vya uchanganuzi panda na scikit-jifunze kama zana.

Maelezo ya seti ya data na taarifa ya tatizo

Kwa kuzingatia seti ya data inayoelezea sifa zifuatazo za chumba:

Inayo sifa za chumba kwa msingi ambao uchambuzi utafanywa, na maadili ya mzigo ambayo yanahitaji kutabiriwa.

Uchambuzi wa awali wa data

Kwanza, hebu tupakue data yetu na tuitazame:

Kutoka kwa panda kuagiza read_csv, DataFrame kutoka sklearn.neighbors leta KNeighborsRegressor kutoka sklearn.linear_model agiza LinearRegression, LogisticRegression kutoka sklearn.svm leta SVR kutoka sklearn.ensemble agiza RandomForestRegressor kutoka sklearnscore_metric_metric plit dataset = read_csv("EnergyEffici ency /ENB2012_data.csv",";") dataset.head()

X1 X2 X3 X4 X5 X6 X7 X8 Y1 Y2
0 0.98 514.5 294.0 110.25 7 2 0 0 15.55 21.33
1 0.98 514.5 294.0 110.25 7 3 0 0 15.55 21.33
2 0.98 514.5 294.0 110.25 7 4 0 0 15.55 21.33
3 0.98 514.5 294.0 110.25 7 5 0 0 15.55 21.33
4 0.90 563.5 318.5 122.50 7 2 0 0 20.84 28.28

Sasa hebu tuone ikiwa sifa zozote zinahusiana. Hii inaweza kufanywa kwa kuhesabu coefficients ya uunganisho kwa safu wima zote. Jinsi ya kufanya hivyo ilielezewa katika makala iliyotangulia:

Dataset.corr()

X1 X2 X3 X4 X5 X6 X7 X8 Y1 Y2
X1 1.000000e+00 -9.919015e-01 -2.037817e-01 -8.688234e-01 8.277473e-01 0.000000 1.283986e-17 1.764620e-17 0.622272 0.634339
X2 -9.919015e-01 1.000000e+00 1.955016e-01 8.807195e-01 -8.581477e-01 0.000000 1.318356e-16 -3.558613e-16 -0.658120 -0.672999
X3 -2.037817e-01 1.955016e-01 1.000000e+00 -2.923165e-01 2.809757e-01 0.000000 -7.969726e-19 0.000000e+00 0.455671 0.427117
X4 -8.688234e-01 8.807195e-01 -2.923165e-01 1.000000e+00 -9.725122e-01 0.000000 -1.381805e-16 -1.079129e-16 -0.861828 -0.862547
X5 8.277473e-01 -8.581477e-01 2.809757e-01 -9.725122e-01 1.000000e+00 0.000000 1.861418e-18 0.000000e+00 0.889431 0.895785
X6 0.000000e+00 0.000000e+00 0.000000e+00 0.000000e+00 0.000000e+00 1.000000 0.000000e+00 0.000000e+00 -0.002587 0.014290
X7 1.283986e-17 1.318356e-16 -7.969726e-19 -1.381805e-16 1.861418e-18 0.000000 1.000000e+00 2.129642e-01 0.269841 0.207505
X8 1.764620e-17 -3.558613e-16 0.000000e+00 -1.079129e-16 0.000000e+00 0.000000 2.129642e-01 1.000000e+00 0.087368 0.050525
Y1 6.222722e-01 -6.581202e-01 4.556712e-01 -8.618283e-01 8.894307e-01 -0.002587 2.698410e-01 8.736759e-02 1.000000 0.975862
Y2 6.343391e-01 -6.729989e-01 4.271170e-01 -8.625466e-01 8.957852e-01 0.014290 2.075050e-01 5.052512e-02 0.975862 1.000000

Kama unavyoona kutoka kwa matrix yetu, safu wima zifuatazo zinahusiana (thamani ya mgawo wa uunganisho ni kubwa kuliko 95%):
  • y1 --> y2
  • x1 --> x2
  • x4 --> x5
Sasa hebu tuchague safu wima zipi za jozi zetu tunaweza kuondoa kutoka kwa sampuli yetu. Ili kufanya hivyo, katika kila jozi, tunachagua nguzo ambazo zina athari kubwa juu ya maadili yaliyotabiriwa Y1 Na Y2 na uwaache na uwafute wengine.
Kama unaweza kuona, matrices na coefficients uunganisho juu y1 ,y2 thamani kubwa zaidi kutoa X2 Na X5 , badala ya X1 na X4, ili tuweze kuondoa safu wima za mwisho.

Seti ya data = dataset.drop(["X1","X4"], mhimili=1) dataset.head()
Aidha, unaweza taarifa kwamba mashamba Y1 Na Y2 unganisha kwa karibu sana na kila mmoja. Lakini, kwa kuwa tunahitaji kutabiri maadili yote mawili, tunawaacha "kama ilivyo".

Uchaguzi wa mfano

Wacha tutenganishe maadili yaliyotabiriwa kutoka kwa sampuli yetu:

Trg = seti ya data[["Y1","Y2"]] trn = dataset.drop(["Y1","Y2"], mhimili=1)
Baada ya usindikaji wa data, unaweza kuendelea na kujenga mfano. Ili kuunda mfano, tutatumia njia zifuatazo:

Nadharia juu ya njia hizi inaweza kusomwa wakati wa mihadhara na K.V.
Tutafanya tathmini kwa kutumia mgawo wa uamuzi ( R-mraba). Mgawo huu inafafanuliwa kama ifuatavyo:

Ambapo ni tofauti ya masharti ya wingi tegemezi katika kwa sababu X.
Mgawo huchukua thamani kwa muda na kadiri inavyokaribia 1, ndivyo utegemezi unavyoongezeka.
Naam, sasa unaweza kwenda moja kwa moja kujenga mfano na kuchagua mfano. Wacha tuweke mifano yetu yote katika orodha moja kwa urahisi wa uchambuzi zaidi:

Mifano =
Kwa hivyo mifano iko tayari, sasa tutagawanya data yetu ya awali katika sampuli 2: mtihani Na kielimu. Wale ambao wamesoma nakala zangu zilizopita wanajua kuwa hii inaweza kufanywa kwa kutumia train_test_split() kazi kutoka kwa kifurushi cha scikit-learn:

Xtrn, Xtest, Ytrn, Ytest = train_test_split(trn, trg, test_size=0.4)
Sasa, kwa kuwa tunahitaji kutabiri vigezo 2, tunahitaji kujenga regression kwa kila mmoja wao. Kwa kuongeza, kwa uchambuzi zaidi, unaweza kurekodi matokeo yaliyopatikana kwa muda mfupi DataFrame. Unaweza kuifanya kama hii:

#unda miundo ya muda TestModels = DataFrame() tmp = () #kwa kila muundo kutoka kwa orodha ya modeli katika mifano: #pata jina la mfano m = str(model) tmp["Model"] = m[:m.index( "( ")] #kwa kila safu ya matokeo yaliyowekwa kwa i katika xrange(Ytrn.shape): #train model model.fit(Xtrn, Ytrn[:,i]) #kokotoa mgawo wa tmp ya kubainisha["R2_Y %s"%str(i +1)] = r2_score(Ytest[:,0], model.predict(Xtest)) #rekodi data na DataFrame TestModels ya mwisho = TestModels.append() #tengeneza faharasa kulingana na kielelezo jina TestModels.set_index("Model", inplace= True)
Kama unavyoona kutoka kwa nambari iliyo hapo juu, r2_score() chaguo za kukokotoa hutumika kukokotoa mgawo.
Kwa hivyo, data ya uchambuzi imepokelewa. Wacha sasa tupange njama na tuone ni mfano gani ulioonyesha matokeo bora:

Mtini, shoka = plt.subplots(ncols=2, figsize=(10,4)) TestModels.R2_Y1.plot(ax=axes, kind="bar", title="R2_Y1)") TestModels.R2_Y2.plot(ax=axes, kind="bar", color="green", title="R2_Y2") !}

Uchambuzi wa matokeo na hitimisho

Kutoka kwa grafu hapo juu, tunaweza kuhitimisha kuwa njia hiyo ilikabiliana na kazi bora zaidi kuliko wengine RandomForest(msitu wa nasibu). Coefficients yake ya uamuzi ni ya juu kuliko zingine kwa anuwai zote mbili:
Kwa uchanganuzi zaidi, wacha turudie mfano wetu:

Model = model model.fit(Xtrn, Ytrn)
Baada ya uchunguzi wa karibu, swali linaweza kutokea kwa nini sampuli tegemezi iligawanywa wakati uliopita. Ytrn kwa vigezo (kwa safu), lakini sasa hatufanyi hivyo.
Jambo ni kwamba baadhi ya mbinu, kama vile RandomForestRegressor, inaweza kushughulika na anuwai nyingi za utabiri, wakati zingine (k.m. SVR) inaweza kufanya kazi na tofauti moja tu. Kwa hiyo, wakati wa mafunzo ya awali, tulitumia ugawaji wa safu ili kuepuka makosa katika mchakato wa kujenga baadhi ya mifano.
Kuchagua mfano ni, kwa kweli, nzuri, lakini pia itakuwa nzuri kuwa na habari juu ya jinsi kila sababu inavyoathiri thamani iliyotabiriwa. Kwa kusudi hili, mfano una mali kipengele_umuhimu_.
Ukitumia, unaweza kuona uzito wa kila sababu katika mifano ya mwisho:

Muundo.kipengele_umuhimu_
safu([ 0.40717901, 0.11394948, 0.34984766, 0.00751686, 0.09158358,
0.02992342])

Kwa upande wetu, inaweza kuonekana kuwa urefu wa jumla na eneo huathiri mzigo wa joto na baridi zaidi. Mchango wao wa jumla kwa mfano wa utabiri ni karibu 72%.
Ikumbukwe pia kuwa kwa kutumia mchoro hapo juu unaweza kuona ushawishi wa kila sababu kando juu ya kupokanzwa na kando juu ya baridi, lakini kwa kuwa mambo haya yanahusiana sana na kila mmoja (), tulifanya hitimisho la jumla juu yao wote wawili, ambayo iliandikwa hapo juu.

Hitimisho

Katika makala nilijaribu kuonyesha hatua kuu wakati uchambuzi wa kurudi nyuma data kwa kutumia Python na vifurushi vya uchanganuzi panda Na scikit-jifunze.
Ikumbukwe kwamba seti ya data ilichaguliwa maalum kwa namna ya kurasimishwa iwezekanavyo na usindikaji wa msingi data ya pembejeo itakuwa ndogo. Kwa maoni yangu, makala hiyo itakuwa muhimu kwa wale ambao wanaanza safari yao katika uchambuzi wa data, na pia kwa wale ambao wana msingi mzuri wa kinadharia, lakini wanachagua zana za kazi.