Biografije Karakteristike Analiza

Prema metodi najmanjih kvadrata, sljedeći izraz je minimiziran. Pronalaženje parametara regresijske linije

Funkciju aproksimiramo polinomom 2. stupnja. Da bismo to učinili, izračunavamo koeficijente normalnog sustava jednadžbi:

, ,

Napravimo normalan sustav najmanjih kvadrata, koji izgleda ovako:

Rješenje sustava je lako pronaći:, , .

Tako se nalazi polinom 2. stupnja: .

Teorijska pozadina

Povratak na stranicu<Введение в вычислительную математику. Примеры>

Primjer 2. Pronalaženje optimalnog stupnja polinoma.

Povratak na stranicu<Введение в вычислительную математику. Примеры>

Primjer 3. Izvođenje normalnog sustava jednadžbi za određivanje parametara empirijske ovisnosti.

Izvedimo sustav jednadžbi za određivanje koeficijenata i funkcija , koji izvodi aproksimaciju srednjeg kvadrata zadanu funkciju po bodovima. Sastavite funkciju i pisati za nju potrebno stanje ekstrem:

Zatim normalan sustav imat će oblik:

Dobio sam linearni sustav jednadžbe za nepoznate parametre i koja se lako rješava.

Teorijska pozadina

Povratak na stranicu<Введение в вычислительную математику. Примеры>

Primjer.

Eksperimentalni podaci o vrijednostima varijabli x i na date su u tablici.

Kao rezultat njihovog usklađivanja, funkcija

Korištenje metoda najmanjeg kvadrata, aproksimira ove podatke linearnom ovisnošću y=ax+b(pronađi opcije a i b). Saznajte koja je od dvije linije bolja (u smislu metode najmanjih kvadrata) poravnava eksperimentalne podatke. Napravite crtež.

Bit metode najmanjih kvadrata (LSM).

Problem je pronaći koeficijente linearna ovisnost, za koji je funkcija dviju varijabli a i bprihvaća najmanju vrijednost. Odnosno, s obzirom na podatke a i b zbroj kvadrata odstupanja eksperimentalnih podataka od pronađene ravne linije bit će najmanji. To je cijela poanta metode najmanjih kvadrata.

Dakle, rješenje primjera se svodi na pronalaženje ekstrema funkcije dviju varijabli.

Izvođenje formula za pronalaženje koeficijenata.

Sastavlja se i rješava sustav dviju jednadžbi s dvije nepoznanice. Pronalaženje parcijalnih derivacija funkcija po varijablama a i b, te derivacije izjednačavamo s nulom.

Rezultirajući sustav jednadžbi rješavamo bilo kojom metodom (npr metoda zamjene ili Cramerovu metodu) i dobiti formule za pronalaženje koeficijenata metodom najmanjih kvadrata (LSM).

S podacima a i b funkcija uzima najmanju vrijednost. Dokaz za ovu činjenicu dat je u nastavku teksta na kraju stranice.

To je cijela metoda najmanjih kvadrata. Formula za pronalaženje parametra a sadrži zbrojeve , , , i parametar n je količina eksperimentalnih podataka. Vrijednosti ovih zbroja preporuča se izračunati zasebno.

Koeficijent b pronađeno nakon izračuna a.

Vrijeme je da se prisjetimo izvornog primjera.

Odluka.

U našem primjeru n=5. Ispunjavamo tablicu radi praktičnosti izračuna iznosa koji su uključeni u formule potrebnih koeficijenata.

Vrijednosti u četvrtom retku tablice dobivaju se množenjem vrijednosti 2. retka s vrijednostima 3. retka za svaki broj i.

Vrijednosti u petom retku tablice dobivaju se kvadriranjem vrijednosti 2. retka za svaki broj i.

Vrijednosti posljednjeg stupca tablice su zbroji vrijednosti u redovima.

Za pronalaženje koeficijenata koristimo formule metode najmanjih kvadrata a i b. U njih zamjenjujemo odgovarajuće vrijednosti iz posljednjeg stupca tablice:

Stoga, y=0,165x+2,184 je željena aproksimirajuća ravna linija.

Ostaje saznati koja od linija y=0,165x+2,184 ili bolje aproksimira izvorne podatke, tj. napraviti procjenu metodom najmanjih kvadrata.

Procjena pogreške metode najmanjih kvadrata.

Da biste to učinili, morate izračunati zbroje kvadrata odstupanja izvornih podataka od ovih redaka i , manja vrijednost odgovara liniji koja bolje aproksimira izvorne podatke u smislu metode najmanjih kvadrata.

Od , onda linija y=0,165x+2,184 bolje približava izvorne podatke.

Grafička ilustracija metode najmanjih kvadrata (LSM).

Sve izgleda super na ljestvicama. Crvena linija je pronađena linija y=0,165x+2,184, plava linija je , ružičaste točkice su izvorni podaci.

Čemu služi, čemu sve te aproksimacije?

Ja osobno koristim za rješavanje problema izglađivanja podataka, problema interpolacije i ekstrapolacije (u izvornom primjeru od vas bi se moglo tražiti da pronađete vrijednost promatrane vrijednosti y na x=3 ili kada x=6 prema MNC metodi). Ali o tome ćemo više govoriti kasnije u drugom dijelu stranice.

Vrh stranice

Dokaz.

Tako da kad se nađe a i b funkcija uzima najmanju vrijednost, potrebno je da u ovom trenutku matrica kvadratnog oblika diferencijala drugog reda za funkciju bilo pozitivno određeno. Pokažimo to.

Diferencijal drugog reda ima oblik:

tj

Prema tome, matrica kvadratnog oblika ima oblik

a vrijednosti elemenata ne ovise o a i b.

Pokažimo da je matrica pozitivno određena. To zahtijeva da manji kutovi budu pozitivni.

Kutni minor prvog reda . Nejednakost je stroga, jer se točke ne podudaraju. To će se podrazumijevati u onome što slijedi.

Kutni minor drugog reda

Dokažimo to metoda matematičke indukcije.

Zaključak: pronađene vrijednosti a i b odgovaraju najmanjoj vrijednosti funkcije , dakle, su željeni parametri za metodu najmanjih kvadrata.

Jeste li ikada razumjeli?
Naručite Rješenje

Vrh stranice

Izrada prognoze metodom najmanjih kvadrata. Primjer rješenja problema

Ekstrapolacija je metoda znanstveno istraživanje, koji se temelji na distribuciji prošlih i sadašnjih trendova, obrazaca, odnosa prema budućem razvoju objekta predviđanja. Metode ekstrapolacije uključuju metoda pokretnog prosjeka, metoda eksponencijalno izglađivanje, metoda najmanjeg kvadrata.

Esencija metoda najmanjih kvadrata sastoji se u minimiziranju sume standardne devijacije između promatranih i izračunatih vrijednosti. Izračunate vrijednosti se nalaze prema odabranoj jednadžbi - jednadžbi regresije. Što je manja udaljenost između stvarnih vrijednosti i izračunatih, to je točnija prognoza temeljena na jednadžbi regresije.

Teorijska analiza suštine proučavanog fenomena, čija se promjena prikazuje vremenskim nizom, služi kao osnova za odabir krivulje. Razmatranja o prirodi rasta razina serije ponekad se uzimaju u obzir. Dakle, ako se očekuje rast proizvodnje u aritmetička progresija, tada se zaglađivanje izvodi u ravnoj liniji. Ako se pokaže da je rast in geometrijska progresija, tada treba izglađivanje izvesti prema eksponencijalnoj funkciji.

Radna formula metode najmanjih kvadrata : Y t+1 = a*X + b, gdje je t + 1 razdoblje prognoze; Ut+1 – predviđeni pokazatelj; a i b su koeficijenti; X - simbol vrijeme.

Koeficijenti a i b izračunavaju se prema sljedećim formulama:

gdje je, Uf - stvarne vrijednosti serije dinamike; n je broj razina u vremenskoj seriji;

Izglađivanje vremenskih serija metodom najmanjih kvadrata služi za odraz obrazaca razvoja fenomena koji se proučava. U analitičkom izrazu trenda, vrijeme se smatra nezavisnom varijablom, a razine serije djeluju kao funkcija ove nezavisne varijable.

Razvoj neke pojave ne ovisi o tome koliko je godina prošlo od početne točke, već o tome koji su čimbenici utjecali na njegov razvoj, u kojem smjeru i kojim intenzitetom. Iz ovoga je jasno da se razvoj neke pojave u vremenu javlja kao rezultat djelovanja ovih čimbenika.

Ispravno postavite vrstu krivulje, tip analitičke ovisnosti o vremenu je jedan od najvažnijih izazovni zadaci prediktivna analiza .

Izbor vrste funkcije koja opisuje trend, čiji se parametri određuju metodom najmanjih kvadrata, u većini je slučajeva empirijski, konstruiranjem niza funkcija i međusobnom uspoređivanjem u smislu vrijednosti korijena. -srednja kvadratna greška, izračunata po formuli:

gdje je Uf - stvarne vrijednosti serije dinamike; Ur – izračunate (izglađene) vrijednosti vremenske serije; n je broj razina u vremenskoj seriji; p je broj parametara definiranih u formulama koje opisuju trend (trend razvoja).

Nedostaci metode najmanjih kvadrata :

  • kada se pokušava opisati ekonomski fenomen koji se proučava pomoću matematička jednadžba, prognoza će biti točna za kratko vremensko razdoblje i regresijska jednadžba se treba ponovno izračunati kako nove informacije postanu dostupne;
  • složenost izbora regresijske jednadžbe, koja je rješiva ​​standardnim računalnim programima.

Primjer korištenja metode najmanjih kvadrata za razvoj prognoze

Zadatak . Postoje podaci koji karakteriziraju razinu nezaposlenosti u regiji, %

  • Izgradite prognozu stope nezaposlenosti u regiji za mjesec studeni, prosinac, siječanj, koristeći metode: pokretni prosjek, eksponencijalno izravnavanje, najmanji kvadrati.
  • Izračunajte pogreške u rezultirajućim prognozama koristeći svaku metodu.
  • Usporedite dobivene rezultate, donesite zaključke.

Rješenje najmanjih kvadrata

Za rješenje ćemo sastaviti tablicu u kojoj ćemo napraviti potrebne izračune:

ε = 28,63/10 = 2,86% točnost prognoze visoka.

Zaključak : Usporedba rezultata dobivenih u proračunima metoda pokretnog prosjeka , eksponencijalno izglađivanje i metoda najmanjih kvadrata, možemo reći da je prosjek relativna greška kada se izračunava metodom eksponencijalnog zaglađivanja, pada unutar 20-50%. To znači da je točnost predviđanja ovaj slučaj je samo zadovoljavajuća.

U prvom i trećem slučaju točnost prognoze je visoka, jer je prosječna relativna pogreška manja od 10%. Ali metoda pokretnog prosjeka omogućila je dobivanje pouzdanijih rezultata (prognoza za studeni - 1,52%, prognoza za prosinac - 1,53%, prognoza za siječanj - 1,49%), budući da je prosječna relativna pogreška pri korištenju ove metode najmanja - 1 ,trinaest%.

Metoda najmanjeg kvadrata

Ostali povezani članci:

Popis korištenih izvora

  1. Znanstvene i metodološke preporuke za dijagnosticiranje društvenih rizika i predviđanje izazova, prijetnji i društvene posljedice. Ruska država društvenog sveučilišta. Moskva. 2010.;
  2. Vladimirova L.P. Predviđanje i planiranje u tržišnim uvjetima: Zbornik radova. džeparac. M.: Izdavačka kuća"Daškov i Co", 2001.;
  3. Novikova N.V., Pozdeeva O.G. Prognoziranje nacionalna ekonomija: Nastavno pomagalo. Jekaterinburg: Izdavačka kuća Ural. država Ekonomija sveučilište, 2007.;
  4. Slutskin L.N. MBA tečaj poslovnog predviđanja. Moskva: Alpina Business Books, 2006.

Program MNE

Unesite podatke

Podaci i aproksimacija y = a + b x

i- broj pokusne točke;
x i- vrijednost fiksnog parametra u točki i;
y i- vrijednost izmjerenog parametra u točki i;
ω i- mjerenje težine u točki i;
y i, izrač.- razlika između izmjerene vrijednosti i vrijednosti izračunate iz regresije y u točki i;
S x i (x i)- procjena pogreške x i prilikom mjerenja y u točki i.

Podaci i aproksimacija y = kx

i x i y i ω i y i, izrač. Δy i S x i (x i)

Kliknite na grafikon

Korisnički priručnik za MNC online program.

U podatkovno polje unesite u svaki zasebni redak vrijednosti `x` i `y` u jednoj eksperimentalnoj točki. Vrijednosti moraju biti odvojene razmakom (razmak ili tab).

Treća vrijednost može biti težina točke `w`. Ako težina točke nije navedena, onda je jednaka jedan. U velikoj većini slučajeva težine eksperimentalnih točaka su nepoznate ili nisu izračunate; svi eksperimentalni podaci smatraju se ekvivalentnim. Ponekad težine u proučavanom rasponu vrijednosti definitivno nisu ekvivalentne i mogu se čak i teoretski izračunati. Na primjer, u spektrofotometriji, težine se mogu izračunati pomoću jednostavnih formula, iako u osnovi svi to zanemaruju kako bi smanjili troškove rada.

Podaci se mogu zalijepiti kroz međuspremnik iz proračunske tablice uredskog paketa, kao što je Excel iz Microsoft Officea ili Calc iz Open Officea. Za ovo u proračunska tablica označite raspon podataka za kopiranje, kopirajte u međuspremnik i zalijepite podatke u podatkovno polje na ovoj stranici.

Za izračunavanje metodom najmanjih kvadrata potrebne su najmanje dvije točke za određivanje dva koeficijenta `b` - tangenta kuta nagiba ravne linije i `a` - vrijednosti odsječene ravnom crtom na `y ` osi.

Za procjenu pogreške izračunatih regresijskih koeficijenata potrebno je postaviti broj eksperimentalnih točaka na više od dvije.

Metoda najmanjih kvadrata (LSM).

Što je veći broj eksperimentalnih točaka, to je točniji statističko vrednovanje koeficijenata (zbog smanjenja Studentovog koeficijenta) i što je procjena bliža procjeni općeg uzorka.

Dobivanje vrijednosti u svakoj eksperimentalnoj točki često je povezano sa značajnim troškovima rada, stoga se često provodi kompromisni broj eksperimenata, što daje probavljivu procjenu i ne dovodi do pretjeranih troškova rada. U pravilu se broj eksperimentalnih točaka za linearnu ovisnost najmanjih kvadrata s dva koeficijenta bira u području od 5-7 točaka.

Kratka teorija najmanjih kvadrata za linearnu ovisnost

Pretpostavimo da imamo skup eksperimentalnih podataka u obliku parova vrijednosti [`y_i`, `x_i`], gdje je `i` broj jednog eksperimentalnog mjerenja od 1 do `n`; `y_i` - vrijednost izmjerene vrijednosti u točki `i`; `x_i` - vrijednost parametra koji smo postavili u točki `i`.

Primjer je djelovanje Ohmovog zakona. Promjenom napona (razlike potencijala) između sekcija strujni krug, mjerimo količinu struje koja prolazi kroz ovaj dio. Fizika nam daje ovisnost pronađenu eksperimentalno:

`I=U/R`,
gdje je `I` - jačina struje; `R` - otpor; `U` - napon.

U ovom slučaju, "y_i" je izmjerena vrijednost struje, a "x_i" je vrijednost napona.

Kao drugi primjer, razmotrite apsorpciju svjetlosti otopinom tvari u otopini. Kemija nam daje formulu:

`A = εl C`,
gdje je "A" optička gustoća otopine; `ε` - propusnost otopljene tvari; `l` - duljina puta kada svjetlost prolazi kroz kivetu s otopinom; `C` je koncentracija otopljene tvari.

U ovom slučaju, `y_i` je izmjerena optička gustoća `A`, a `x_i` je koncentracija tvari koju smo postavili.

Razmotrit ćemo slučaj kada je relativna pogreška u postavljanju `x_i` mnogo manja, relativna greška mjerenja `y_i`. Također ćemo pretpostaviti da su sve izmjerene vrijednosti `y_i` slučajne i normalno raspoređene, tj. poslušati normalan zakon distribucija.

U slučaju linearne ovisnosti `y` od `x`, možemo napisati teorijsku ovisnost:
`y = a + bx`.

S geometrijska točka gledano, koeficijent `b` označava tangentu kuta nagiba linije prema osi `x`, a koeficijent `a` - vrijednost `y` u točki presjeka pravca s ` y` os (za `x = 0`).

Pronalaženje parametara regresijske linije.

U eksperimentu, izmjerene vrijednosti `y_i` ne mogu ležati točno na teorijskoj liniji zbog pogrešaka mjerenja, koje su uvijek svojstvene stvaran život. Stoga, linearna jednadžba mora biti predstavljena sustavom jednadžbi:
`y_i = a + b x_i + ε_i` (1),
gdje je `ε_i` nepoznata pogreška mjerenja `y` u `i` eksperimentu.

Ovisnost (1) također se naziva regresija, tj. ovisnost dviju veličina jedna o drugoj sa statističkom značajnošću.

Zadatak obnavljanja ovisnosti je pronaći koeficijente `a` i `b` iz eksperimentalnih točaka [`y_i`, `x_i`].

Za pronalaženje koeficijenata obično se koriste `a` i `b` metoda najmanjeg kvadrata(MNK). To je poseban slučaj principa maksimalne vjerojatnosti.

Zapišimo (1) kao `ε_i = y_i - a - b x_i`.

Tada će zbroj grešaka na kvadrat biti
`Φ = zbroj_(i=1)^(n) ε_i^2 = zbroj_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Princip metode najmanjih kvadrata je minimiziranje zbroja (2) s obzirom na parametre `a` i `b`.

Minimum se postiže kada su parcijalne derivacije zbroja (2) s obzirom na koeficijente `a` i `b` jednake nuli:
`frac(djelomični Φ)(djelomični a) = frac(djelomični zbroj_(i=1)^(n) (y_i - a - b x_i)^2)(djelomični a) = 0`
`frac(djelomični Φ)(djelomični b) = frac(djelomični zbroj_(i=1)^(n) (y_i - a - b x_i)^2)(djelomični b) = 0`

Proširujući derivacije, dobivamo sustav dviju jednadžbi s dvije nepoznanice:
`zbroj_(i=1)^(n) (2a + 2bx_i - 2y_i) = zbroj_(i=1)^(n) (a + bx_i - y_i) = 0`
`zbroj_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = zbroj_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

Otvaramo zagrade i prenosimo zbrojeve neovisne o željenim koeficijentima na drugu polovicu, dobivamo sustav linearnih jednadžbi:
`zbroj_(i=1)^(n) y_i = a n + b zbroj_(i=1)^(n) bx_i`
`zbroj_(i=1)^(n) x_iy_i = a zbroj_(i=1)^(n) x_i + b zbroj_(i=1)^(n) x_i^2`

Rješavajući dobiveni sustav, nalazimo formule za koeficijente `a` i `b`:

`a = frac(zbroj_(i=1)^(n) y_i zbroj_(i=1)^(n) x_i^2 - zbroj_(i=1)^(n) x_i zbroj_(i=1)^(n ) x_iy_i) (n zbroj_(i=1)^(n) x_i^2 — (zbroj_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n zbroj_(i=1)^(n) x_iy_i - zbroj_(i=1)^(n) x_i zbroj_(i=1)^(n) y_i) (n zbroj_(i=1)^ (n) x_i^2 - (zbroj_(i=1)^(n) x_i)^2)` (3.2)

Ove formule imaju rješenja kada je `n > 1` (pravac se može povući koristeći najmanje 2 točke) i kada je determinanta `D = n zbroj_(i=1)^(n) x_i^2 — (zbroj_(i= 1 )^(n) x_i)^2 != 0`, tj. kada su točke "x_i" u eksperimentu različite (tj. kada linija nije okomita).

Procjena pogrešaka u koeficijentima regresijske linije

Za točniju procjenu pogreške u izračunu koeficijenata `a` i `b`, poželjno je veliki broj eksperimentalne točke. Kada je `n = 2`, nemoguće je procijeniti pogrešku koeficijenata, jer aproksimirajuća prava će jednoznačno prolaziti kroz dvije točke.

Greška nasumična varijabla`V` je definiran zakon akumulacije grešaka
`S_V^2 = zbroj_(i=1)^p (frac(djelomični f)(djelomični z_i))^2 S_(z_i)^2`,
gdje je `p` broj parametara `z_i` s greškom `S_(z_i)` koji utječu na pogrešku `S_V`;
`f` je funkcija ovisnosti `V` na `z_i`.

Napišimo zakon gomilanja grešaka za pogrešku koeficijenata `a` i `b`
`S_a^2 = zbroj_(i=1)^(n)(frac(djelomični a)(djelomični y_i))^2 S_(y_i)^2 + zbroj_(i=1)^(n)(frac(djelomični a )(djelomični x_i))^2 S_(x_i)^2 = S_y^2 zbroj_(i=1)^(n)(frac(djelomični a)(djelomični y_i))^2 `,
`S_b^2 = zbroj_(i=1)^(n)(frac(djelomični b)(djelomični y_i))^2 S_(y_i)^2 + zbroj_(i=1)^(n)(frac(djelomični b )(djelomični x_i))^2 S_(x_i)^2 = S_y^2 zbroj_(i=1)^(n)(frac(djelomični b)(djelomični y_i))^2 `,
jer `S_(x_i)^2 = 0` (prije smo rezervirali da je pogreška `x` zanemariva).

`S_y^2 = S_(y_i)^2` - pogreška (varijansa, na kvadrat standardna devijacija) u dimenziji `y`, uz pretpostavku da je pogreška ujednačena za sve vrijednosti `y`.

Zamjenom formula za izračunavanje `a` i `b` u rezultirajuće izraze, dobivamo

`S_a^2 = S_y^2 frac(zbroj_(i=1)^(n) (zbroj_(i=1)^(n) x_i^2 - x_i zbroj_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n zbroj_(i=1)^(n) x_i^2 - (zbroj_(i=1)^(n) x_i)^2) zbroj_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(zbroj_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(zbroj_(i=1)^(n) (n x_i - zbroj_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n zbroj_(i=1)^(n) x_i^2 - (zbroj_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

U većini stvarnih eksperimenata vrijednost "Sy" se ne mjeri. Da biste to učinili, potrebno je provesti nekoliko paralelnih mjerenja (eksperimenata) na jednoj ili više točaka plana, što povećava vrijeme (i eventualno trošak) eksperimenta. Stoga se obično pretpostavlja da se odstupanje `y` od regresijske linije može smatrati slučajnim. Procjena varijance "y" u ovom slučaju izračunava se po formuli.

`S_y^2 = S_(y, odmor)^2 = frac(zbroj_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Djelitelj `n-2` se pojavljuje jer smo smanjili broj stupnjeva slobode zbog izračuna dvaju koeficijenata za isti uzorak eksperimentalnih podataka.

Ova procjena se također naziva zaostala varijansa u odnosu na regresijsku liniju `S_(y, rest)^2`.

Procjena značajnosti koeficijenata provodi se prema studentovom kriteriju

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Ako je izračunati kriterij `t_a`, `t_b` je manji od tabelarni kriteriji`t(P, n-2)`, tada se smatra da se odgovarajući koeficijent ne razlikuje značajno od nule uz zadanu vjerojatnost `P`.

Da biste procijenili kvalitetu opisa linearnog odnosa, možete usporediti "S_(y, odmor)^2" i "S_(bar y)" u odnosu na srednju vrijednost koristeći Fisherov kriterij.

`S_(bar y) = frac(zbroj_(i=1)^n (y_i - bar y)^2) (n-1) = frac(zbroj_(i=1)^n (y_i - (zbroj_(i= 1)^n y_i) /n)^2) (n-1)` - evaluacija uzorka varijanca "y" u odnosu na srednju vrijednost.

Za procjenu učinkovitosti regresijske jednadžbe za opisivanje ovisnosti izračunava se Fisherov koeficijent
`F = S_(bar y) / S_(y, odmor)^2`,
koji se uspoređuje s tabličnim Fisherovim koeficijentom `F(p, n-1, n-2)`.

Ako je "F > F(P, n-1, n-2)", razlika između opisa ovisnosti "y = f(x)" pomoću regresijske jednadžbe i opisa pomoću srednje vrijednosti smatra se statistički značajnom s vjerojatnošću `P`. Oni. regresija bolje opisuje ovisnost od širenja 'y' oko srednje vrijednosti.

Kliknite na grafikon
za dodavanje vrijednosti u tablicu

Metoda najmanjeg kvadrata. Metoda najmanjih kvadrata znači određivanje nepoznatih parametara a, b, c, prihvaćene funkcionalne ovisnosti

Metoda najmanjih kvadrata znači određivanje nepoznatih parametara a, b, c,… prihvaćena funkcionalna ovisnost

y = f(x,a,b,c,…),

što bi osiguralo minimum srednjeg kvadrata (varijance) pogreške

, (24)

gdje je x i , y i - skup parova brojeva dobivenih iz eksperimenta.

Budući da je uvjet za ekstremum funkcije nekoliko varijabli uvjet da su njezini parcijalni derivati ​​jednaki nuli, tada parametri a, b, c,… određuju se iz sustava jednadžbi:

; ; ; … (25)

Treba imati na umu da se metoda najmanjih kvadrata koristi za odabir parametara nakon oblika funkcije y = f(x) definiran.

Ako se iz teorijskih razmatranja ne mogu izvući zaključci o tome što bi trebalo biti empirijska formula, onda se mora slijediti vizualni prikazi, prvenstveno grafički prikaz promatranih podataka.

U praksi se najčešće ograničava na sljedeće vrste funkcija:

1) linearni ;

2) kvadratni a .

Ako neki fizička veličina ovisi o drugoj veličini, onda se ta ovisnost može proučavati mjerenjem y at različite vrijednosti x . Kao rezultat mjerenja, dobiva se niz vrijednosti:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y i , ... , y n .

Na temelju podataka takvog eksperimenta moguće je nacrtati ovisnost y = ƒ(x). Rezultirajuća krivulja omogućuje prosuđivanje oblika funkcije ƒ(x). Međutim konstantni koeficijenti, koji su uključeni u ovu funkciju, ostaju nepoznati. Mogu se odrediti metodom najmanjih kvadrata. Eksperimentalne točke u pravilu ne leže točno na krivulji. Metoda najmanjih kvadrata zahtijeva da zbroj kvadrata odstupanja eksperimentalnih točaka od krivulje, t.j. 2 je bila najmanja.

U praksi se ova metoda najčešće (i najjednostavnije) koristi u slučaju linearnog odnosa, t.j. kada

y=kx ili y = a + bx.

Linearna ovisnost vrlo je raširena u fizici. Čak i kada je ovisnost nelinearna, obično pokušavaju izgraditi graf na takav način da dobiju ravnu liniju. Na primjer, ako se pretpostavi da je indeks loma stakla n povezan s valnom duljinom λ svjetlosnog vala relacijom n = a + b/λ 2 , tada je ovisnost n o λ -2 ucrtana na graf .

Uzmite u obzir ovisnost y=kx(pravac koji prolazi kroz ishodište). Sastavite vrijednost φ - zbroj kvadrata odstupanja naših točaka od ravne linije

Vrijednost φ je uvijek pozitivna i pokazuje se da je manja što su naše točke bliže pravoj liniji. Metoda najmanjih kvadrata kaže da za k treba izabrati takvu vrijednost pri kojoj φ ima minimum


ili
(19)

Proračun pokazuje da je srednja kvadratna pogreška pri određivanju vrijednosti k jednaka

, (20)
gdje je – n broj mjerenja.

Pogledajmo sada još nekoliko težak slučaj kada točke moraju zadovoljiti formulu y = a + bx(ravna crta koja ne prolazi kroz ishodište).

Zadatak je pronaći zadani skup vrijednosti x i , y i najbolje vrijednosti a i b.

Skladajmo opet kvadratni oblik φ , jednak zbroju kvadrata odstupanja točaka x i , y i od ravne linije

i pronađite vrijednosti a i b za koje φ ima minimum

;

.

.

Zajednička odluka ove jednadžbe daje

(21)

Srednje kvadratne greške određivanja a i b su jednake

(23)

.  (24)

Prilikom obrade rezultata mjerenja ovom metodom, prikladno je sve podatke sažeti u tablicu u kojoj se preliminarno izračunavaju svi zbroji uključeni u formule (19)–(24). Obrasci ovih tablica prikazani su u primjerima u nastavku.

Primjer 1 Proučavana je osnovna jednadžba dinamike rotacijsko gibanjeε = M/J (pravac koji prolazi kroz ishodište). Mjereno je pri različitim vrijednostima trenutka M kutno ubrzanjeε nekog tijela. Potrebno je odrediti moment tromosti ovog tijela. Rezultati mjerenja momenta sile i kutnog ubrzanja navedeni su u drugom i trećem stupcu tablice 5.

Tablica 5
n M, N m ε, s-1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formulom (19) određujemo:

.

Za određivanje korijenske srednje kvadratne pogreške koristimo formulu (20)

0.005775kg-jedan · m -2 .

Formulom (18) imamo

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m 2.

S obzirom na pouzdanost P = 0,95, prema tablici Studentovih koeficijenata za n = 5, nalazimo t = 2,78 i odredimo apsolutnu pogrešku ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2.

Rezultate zapisujemo u obliku:

J = (3,0 ± 0,2) kg m 2;


Primjer 2 Temperaturni koeficijent otpornosti metala izračunavamo metodom najmanjih kvadrata. Otpor ovisi o temperaturi prema linearnom zakonu

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

Slobodni član određuje otpor R 0 na temperaturi od 0 ° C, a nagib određuje proizvod temperaturni koeficijentα na otpor R 0 .

Rezultati mjerenja i proračuna dati su u tablici ( vidi tablicu 6).

Tablica 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Formulama (21), (22) određujemo

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Nađimo grešku u definiciji α. Budući da , tada po formuli (18) imamo:

.

Koristeći formule (23), (24) imamo

;

0.014126 Ohm.

S obzirom na pouzdanost P = 0,95, prema tablici Studentovih koeficijenata za n = 6 nalazimo t = 2,57 i odredimo apsolutnu pogrešku Δα = 2,57 0,000132 = 0,000338 stupanj -1.

α = (23 ± 4) 10 -4 tuča-1 kod P = 0,95.


Primjer 3 Potrebno je odrediti radijus zakrivljenosti leće iz Newtonovih prstenova. Izmjereni su polumjeri Newtonovih prstenova r m i određeni brojevi tih prstenova m. Polumjeri Newtonovih prstenova povezani su s polumjerom zakrivljenosti leće R i brojem prstena jednadžbom

r 2 m = mλR - 2d 0 R,

gdje je d 0 debljina razmaka između leće i ravnoparalelne ploče (ili deformacija leće),

λ je valna duljina upadne svjetlosti.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

tada će jednadžba poprimiti oblik y = a + bx.

.

Upisuju se rezultati mjerenja i proračuna tablica 7.

Tablica 7
n x = m y \u003d r 2, 10 -2 mm 2 m-¯m (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

koji najširu primjenu nalazi u raznim područjima znanost i praktične aktivnosti. To može biti fizika, kemija, biologija, ekonomija, sociologija, psihologija i tako dalje i tako dalje. Voljom sudbine, često moram imati posla s gospodarstvom, pa ću vam danas organizirati kartu za nevjerojatna zemlja pod naslovom Ekonometrija=) … Kako to ne želiš?! Tamo je jako dobro – samo se morate odlučiti! …Ali ono što vjerojatno sigurno želite je naučiti kako riješiti probleme najmanjih kvadrata. A posebno vrijedni čitatelji naučit će ih riješiti ne samo točno, nego i VRLO BRZO ;-) Ali prvo opći iskaz problema+ povezani primjer:

Pustite malo predmetno područje istražuju se pokazatelji koji imaju kvantitativni izraz. Istodobno, postoje svi razlozi za vjerovanje da pokazatelj ovisi o pokazatelju. Ova pretpostavka može biti znanstvena hipoteza, a na temelju elementarnog zdrav razum. No, ostavimo znanost po strani i istražimo privlačnija područja – naime trgovine mješovitom robom. Označi sa:

– prodajni prostor trgovine, m2
- godišnji promet trgovine mješovitom robom, milijun rubalja.

Sasvim je jasno što više površine trgovine, veći je njen promet u većini slučajeva.

Pretpostavimo da nakon provođenja promatranja / eksperimenata / proračuna / plesa s tamburom imamo na raspolaganju numeričke podatke:

S trgovinama mješovitom robom mislim da je sve jasno: - ovo je površina 1. trgovine, - njen godišnji promet, - površina 2. trgovine, - njen godišnji promet itd. Usput, nije potrebno imati pristup klasificirani materijali- dovoljno točna procjena promet se može ostvariti putem matematičke statistike. Međutim, nemojte se ometati, tečaj komercijalne špijunaže je već plaćen =)

Tablični podaci također se mogu zapisati u obliku točaka i prikazati na uobičajen način za nas. Kartezijanski sustav .

Mi ćemo odgovoriti važno pitanje: koliko bodova trebate kvalitativno istraživanje?

Što veće, to bolje. Minimalni dopušteni skup sastoji se od 5-6 bodova. Osim toga, s malom količinom podataka, “nenormalni” rezultati ne bi trebali biti uključeni u uzorak. Tako, na primjer, mala elitna trgovina može pomoći redovima veličine više od "njihovih kolega", čime se iskrivljuje opći obrazac, koji se nalazi!

Ako je sasvim jednostavno, moramo odabrati funkciju, raspored koji prolazi što bliže točkama . Takva funkcija se zove aproksimirajući (približna - aproksimacija) ili teorijska funkcija . Općenito govoreći, ovdje se odmah pojavljuje očiti "podnositelj zahtjeva" - polinom visoki stupanj, čiji graf prolazi kroz SVE točke. Ali ova je opcija komplicirana i često jednostavno netočna. (jer će grafikon cijelo vrijeme "vijati" i loše odražavati glavni trend).

Dakle, željena funkcija mora biti dovoljno jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pretpostaviti, zove se jedna od metoda za pronalaženje takvih funkcija najmanjih kvadrata. Prvo, analizirajmo njegovu bit u opći pogled. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako ocijeniti točnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalnih i funkcionalne vrijednosti (učimo crtež). Prva misao koja vam pada na pamet je procijeniti koliki je zbroj, ali problem je što razlike mogu biti negativne. (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja međusobno će se poništiti. Stoga se kao procjena točnosti aproksimacije predlaže uzeti zbroj modula odstupanja:

ili u presavijenom obliku: (odjednom, tko ne zna: je ikona zbroja, i pomoćna je varijabla-"brojač", koja uzima vrijednosti od 1 do ).

Aproksimirajući eksperimentalne točke raznim funkcijama, dobit ćemo različita značenja, i očito, gdje je ovaj zbroj manji, ta je funkcija točnija.

Takva metoda postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postao mnogo rašireniji. metoda najmanjeg kvadrata, u kojem je moguće negativne vrijednosti ne eliminiraju se modulom, već kvadraturom odstupanja:

, nakon čega se napori usmjeravaju na odabir takve funkcije da zbroj kvadrata odstupanja bio što manji. Zapravo, otuda i naziv metode.

A sada se vraćamo na drugu važna točka: kao što je gore navedeno, odabrana funkcija trebala bi biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearni , hiperboličke, eksponencijalna, logaritamski, kvadratna itd. I, naravno, ovdje bih odmah želio "smanjiti polje djelovanja". Koju klasu funkcija odabrati za istraživanje? Primitivno ali učinkovit prijem:

- Najlakši način za izvlačenje bodova na crtežu i analizirati njihov položaj. Ako imaju tendenciju da budu u ravnoj liniji, onda biste trebali potražiti jednadžba ravne linije s optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente – tako da zbroj kvadrata odstupanja bude najmanji.

Ako se točke nalaze, na primjer, uzduž hiperbola, onda je jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo najpovoljnije koeficijente za jednadžbu hiperbole - oni koji daju minimalni zbroj kvadrata .

Sada primijetite da u oba slučaja govorimo o funkcije dviju varijabli, čiji su argumenti tražili opcije ovisnosti:

A u biti, trebamo riješiti standardni problem – pronaći minimum funkcije dviju varijabli.

Prisjetimo se našeg primjera: pretpostavimo da se točke "trgovine" obično nalaze u ravnoj liniji i da postoji svaki razlog vjerovati u prisutnost linearna ovisnost promet iz trgovačkog područja. Nađimo TAKVE koeficijente "a" i "be" tako da zbroj kvadrata odstupanja bio najmanji. Sve kao i obično – prvo parcijalne izvedenice 1. reda. Prema pravilo linearnosti možete razlikovati odmah ispod ikone zbroja:

Ako želite koristiti ova informacija za esej ili seminarski rad - bit ću jako zahvalan na linku u popisu izvora, tako detaljne izračune naći ćete na nekoliko mjesta:

Napravimo standardni sustav:

Svaku jednadžbu smanjujemo za "dvojku" i, osim toga, "razbijamo" zbrojeve:

Bilješka : samostalno analizirati zašto se "a" i "be" mogu izbaciti iz ikone zbroja. Usput, formalno se to može učiniti sa zbrojem

Prepišimo sustav u "primijenjenom" obliku:

nakon čega se počinje crtati algoritam za rješavanje našeg problema:

Znamo li koordinate točaka? Znamo. Zbroji možemo li pronaći? Lako. Sastavljamo najjednostavnije sustav dviju linearnih jednadžbi s dvije nepoznanice("a" i "beh"). Rješavamo sustav, npr. Cramerova metoda, što rezultira stacionarna točka. Provjeravam dovoljan uvjet za ekstrem, možemo provjeriti da je u ovom trenutku funkcija doseže precizno minimum. Provjera je povezana s dodatnim izračunima i stoga ćemo je ostaviti iza scene. (ako je potrebno, okvir koji nedostaje može se vidjeti). Donosimo konačni zaključak:

Funkcija najbolji način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne točke . Grubo govoreći, njegov graf prolazi što bliže tim točkama. U tradiciji ekonometrije također se poziva rezultirajuća aproksimirajuća funkcija jednadžba para Linearna regresija .

Problem koji se razmatra ima veliki praktična vrijednost. U situaciji s našim primjerom, jednadžba omogućuje vam da predvidite kakav promet ("yig") bit će u trgovini s jednom ili drugom vrijednošću prodajnog područja (jedno ili drugo značenje "x"). Da, rezultirajuća prognoza bit će samo prognoza, ali će se u mnogim slučajevima pokazati prilično točnom.

Analizirat ću samo jedan problem s "pravim" brojevima, jer u tome nema poteškoća - svi izračuni su na razini školski kurikulum 7-8 razred. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazat ću da nije teže pronaći jednadžbe za optimalnu hiperbolu, eksponent i neke druge funkcije.

Zapravo, ostaje distribuirati obećane dobrote - tako da naučite kako riješiti takve primjere ne samo točno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva pokazatelja, dobiveni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje približuje empirijsku (iskusan) podaci. Napravite crtež u kojem u kartezijanskom pravokutni sustav koordinate za izgradnju eksperimentalnih točaka i graf aproksimirajuće funkcije . Pronađite zbroj kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Saznajte je li funkcija bolja (u smislu metode najmanjih kvadrata) približne eksperimentalne točke.

Imajte na umu da su vrijednosti "x" prirodne vrijednosti, a to ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti frakcijski. Osim toga, ovisno o sadržaju određenog zadatka, i "X" i "G" vrijednosti mogu biti potpuno ili djelomično negativne. Pa, dobili smo zadatak „bez lica“ i mi ga započinjemo odluka:

Nalazimo koeficijente optimalne funkcije kao rješenje sustava:

Za potrebe kompaktnijeg zapisa, varijabla "counter" može se izostaviti, jer je već jasno da se zbrajanje provodi od 1 do .

Prikladnije je izračunati potrebne količine u tabličnom obliku:


Izračuni se mogu izvesti na mikrokalkulatoru, ali je puno bolje koristiti Excel - i brže i bez grešaka; pogledajte kratki video:

Dakle, dobivamo sljedeće sustav:

Ovdje možete drugu jednadžbu pomnožiti s 3 i oduzmi 2. od 1. jednadžbe član po član. Ali to je sreća - u praksi sustavi često nisu nadareni, a u takvim slučajevima to štedi Cramerova metoda:
, pa sustav ima jedinstveno rješenje.

Napravimo provjeru. Razumijem da ne želim, ali zašto preskočiti pogreške gdje ih nikako ne možete propustiti? Zamijenite pronađeno rješenje u lijevu stranu svake jednadžbe sustava:

Desne strane primljene odgovarajuće jednadžbe, što znači da je sustav točno riješen.

Dakle, željena aproksimirajuća funkcija: – od sve linearne funkcije eksperimentalni podaci najbolje se približuju njime.

Za razliku od ravno ovisnost prometa trgovine o njezinoj površini, pronađena ovisnost je obrnuto (princip "što više - manje"), a tu činjenicu odmah otkriva negativac kutni koeficijent. Funkcija obavještava nas da se povećanjem određenog pokazatelja za 1 jedinicu smanjuje vrijednost ovisnog pokazatelja prosjek za 0,65 jedinica. Kako kažu, što je viša cijena heljde, to se manje prodaje.

Da bismo nacrtali aproksimirajuću funkciju, nalazimo dvije njezine vrijednosti:

i izvedi crtež:


Konstruirana linija se zove linija trenda (naime, linearna linija trenda, tj opći slučaj trend nije nužno ravna linija). Svima je poznat izraz "biti u trendu", a mislim da ovaj pojam ne treba dodatno komentirati.

Izračunajte zbroj kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, ovo je zbroj kvadrata duljina "grimiznih" segmenata (od kojih su dva tako mala da ih ne možete ni vidjeti).

Sumirajmo izračune u tablicu:


Opet se mogu izvesti ručno, za svaki slučaj dat ću primjer za 1. točku:

ali to je mnogo učinkovitije učiniti na određeni način:

da ponovimo: koji je smisao rezultata? Iz sve linearne funkcije funkcija eksponent je najmanji, odnosno najbolja je aproksimacija u svojoj obitelji. I ovdje, usput, nije slučajno. konačno pitanje problemi: što ako predložena eksponencijalna funkcija hoće li biti bolje aproksimirati eksperimentalne točke?

Nađimo odgovarajući zbroj kvadrata odstupanja - da ih razlikujemo, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet za svaki proračun požara za 1. točku:

U Excelu koristimo standardna funkcija EXP (Sintaksa se može pronaći u Excel pomoći).

Zaključak: , pa eksponencijalna funkcija aproksimira eksperimentalne točke lošije od ravne linije .

Ali ovdje treba napomenuti da je "gore". još ne znači, što nije u redu. Sada sam napravio graf ove eksponencijalne funkcije - i ona također prolazi blizu točaka - toliko da je bez analitičke studije teško reći koja je funkcija točnija.

Time je rješenje završeno i vraćam se na pitanje prirodnih vrijednosti argumenta. U raznim studijama, u pravilu, ekonomskim ili sociološkim, mjeseci, godine ili drugi jednaki vremenski intervali numeriraju se prirodnim "X". Razmotrimo, na primjer, takav problem.

Ima mnogo aplikacija, jer omogućuje približan prikaz dane funkcije drugim jednostavnijim. LSM može biti izuzetno koristan u obradi opažanja, a aktivno se koristi za procjenu nekih veličina iz rezultata mjerenja drugih koji sadrže slučajne greške. U ovom članku naučit ćete kako implementirati izračune najmanjih kvadrata u Excelu.

Iskaz problema na konkretnom primjeru

Pretpostavimo da postoje dva indikatora X i Y. Štoviše, Y ovisi o X. Budući da nas je OLS zanimljiv sa stajališta regresijske analize (u Excelu se njegove metode implementiraju pomoću ugrađenih funkcija), trebali bismo odmah nastaviti razmotriti konkretan problem.

Dakle, neka bude X trgovačko područje trgovina mješovitom robom, mjereno u četvornih metara, a Y je godišnji promet, definiran u milijunima rubalja.

Potrebno je napraviti prognozu koliki će promet (Y) imati trgovina ako ima jedan ili drugi prodajni prostor. Očito, funkcija Y = f (X) raste, budući da hipermarket prodaje više robe nego štand.

Nekoliko riječi o ispravnosti početnih podataka korištenih za predviđanje

Recimo da imamo tablicu izgrađenu s podacima za n trgovina.

Prema matematičke statistike, rezultati će biti manje-više točni ako se ispitaju podaci o najmanje 5-6 objekata. Također, ne mogu se koristiti "anomalni" rezultati. Konkretno, elitni mali butik može imati višestruko veći promet od prometa velikih prodajnih mjesta klase "masmarket".

Bit metode

Podaci tablice mogu se prikazati u Kartezijanska ravnina u obliku točaka M 1 (x 1, y 1), ... M n (x n, y n). Sada će se rješenje problema svesti na odabir aproksimirajuće funkcije y = f (x), koja ima graf koji prolazi što bliže točkama M 1, M 2, .. M n .

Naravno, možete koristiti polinom visokog stupnja, ali ova opcija nije samo teška za implementaciju, već je jednostavno netočna, jer neće odražavati glavni trend koji treba otkriti. Najrazumnije rješenje je tražiti ravnu liniju y = ax + b, koja najbolje aproksimira eksperimentalne podatke, točnije, koeficijente - a i b.

Ocjena točnosti

Za svaku aproksimaciju od posebne je važnosti procjena njegove točnosti. Označite sa e i razliku (odstupanje) između funkcionalne i eksperimentalne vrijednosti za točku x i , tj. e i = y i - f (x i).

Očito, da biste procijenili točnost aproksimacije, možete koristiti zbroj odstupanja, tj. pri odabiru ravne linije za približni prikaz ovisnosti X o Y, prednost treba dati onom koji ima najmanju vrijednost od zbroj e i u svim razmatranim točkama. No, nije sve tako jednostavno, jer će uz pozitivna odstupanja praktički biti i negativnih.

Problem možete riješiti pomoću modula odstupanja ili njihovih kvadrata. Posljednja metoda je dobila najviše široka upotreba. Koristi se u mnogim područjima uključujući regresijska analiza(u Excelu se njegova implementacija provodi pomoću dvije ugrađene funkcije) i odavno je dokazala svoju učinkovitost.

Metoda najmanjeg kvadrata

U Excelu, kao što znate, postoji ugrađena funkcija automatskog zbroja koja vam omogućuje izračunavanje vrijednosti svih vrijednosti koje se nalaze u odabranom rasponu. Dakle, ništa nas neće spriječiti da izračunamo vrijednost izraza (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

U matematičkom zapisu ovo izgleda ovako:

Budući da je prvobitno donesena odluka da se aproksimira ravnom linijom, imamo:

Dakle, zadatak pronalaženja ravne linije koja najbolje opisuje specifičan odnos između X i Y svodi se na izračunavanje minimuma funkcije dviju varijabli:

To zahtijeva izjednačavanje s nultim parcijalnim derivacijama s obzirom na nove varijable a i b i rješavanje primitivnog sustava koji se sastoji od dvije jednadžbe s 2 nepoznanice oblika:

Nakon jednostavnih transformacija, uključujući dijeljenje s 2 i manipuliranje zbrojima, dobivamo:

Rješavajući ga, primjerice, Cramerovom metodom, dobivamo stacionarnu točku s određenim koeficijentima a * i b * . Ovo je minimum, tj. da se predvidi koliki će promet trgovina imati kada određeno područje, ravna crta y \u003d a * x + b * će učiniti, što je regresijski model za dotični primjer. Naravno da vam neće dopustiti da pronađete točan rezultat, ali će vam pomoći da steknete predodžbu o tome hoće li se kupnja trgovine na kredit za određeno područje isplatiti.

Kako implementirati metodu najmanjih kvadrata u Excelu

Excel ima funkciju za izračunavanje vrijednosti najmanjih kvadrata. Ona ima sljedeći pogled: "TREND" (poznate Y vrijednosti; poznate X vrijednosti; nove X vrijednosti; konstanta). Primijenimo formulu za izračun OLS-a u Excelu na našu tablicu.

Da biste to učinili, u ćeliju u kojoj bi trebao biti prikazan rezultat izračuna primjenom metode najmanjih kvadrata u Excelu, unesite znak "=" i odaberite funkciju "TREND". U prozoru koji se otvori popunite odgovarajuća polja, istaknuvši:

  • raspon poznatih vrijednosti za Y (u ovom slučaju podaci za promet);
  • raspon x 1 , …x n , tj. veličina prodajnog prostora;
  • i poznati i nepoznate vrijednosti x, za koje trebate saznati veličinu prometa (za informacije o njihovom položaju na radnom listu, pogledajte dolje).

Osim toga, u formuli postoji logička varijabla "Const". Ako unesete 1 u polje koje mu odgovara, to će značiti da treba izvršiti izračune, pod pretpostavkom da je b = 0.

Ako trebate znati prognozu za više od jedne vrijednosti x, tada nakon unosa formule ne biste trebali pritisnuti "Enter", već morate upisati kombinaciju "Shift" + "Control" + "Enter" ("Enter" ) na tipkovnici.

Neke značajke

Regresijska analiza može biti dostupna čak i lutkama. Excel formula za predviđanje vrijednosti niza nepoznatih varijabli - "TREND" - mogu koristiti čak i oni koji nikada nisu čuli za metodu najmanjih kvadrata. Dovoljno je samo znati neke značajke njegovog rada. Posebno:

  • Ako raspoređujemo raspon poznatih vrijednosti varijable y u jedan redak ili stupac, tada svaki red (stupac) sa poznate vrijednosti x će program tretirati kao zasebna varijabla.
  • Ako raspon s poznatim x nije naveden u prozoru "TREND", tada u slučaju korištenja funkcije u Excel program smatrat će ga nizom koji se sastoji od cijelih brojeva, čiji broj odgovara rasponu s danim vrijednostima varijable y.
  • Za izlaz niza "predviđenih" vrijednosti, izraz trenda se mora unijeti kao formula polja.
  • Ako nisu navedene nove vrijednosti x, funkcija TREND ih smatra jednakima poznatim. Ako nisu specificirani, tada se niz 1 uzima kao argument; 2; 3; 4;…, što je razmjerno rasponu s već zadanim parametrima y.
  • Raspon koji sadrži nove vrijednosti x mora se sastojati od istih ili više retke ili stupce, kao raspon sa zadanim y vrijednostima. Drugim riječima, mora biti proporcionalan neovisnim varijablama.
  • Niz s poznatim x vrijednostima može sadržavati više varijabli. Međutim, ako pričamo samo oko jedan, tada je potrebno da rasponi s danim vrijednostima x i y budu razmjerni. U slučaju više varijabli, potrebno je da raspon sa zadanim y vrijednostima stane u jedan stupac ili jedan redak.

funkcija PROGNOZA

Realizira se pomoću nekoliko funkcija. Jedna od njih se zove "PREDIKCIJA". Sličan je TREND-u, tj. daje rezultat izračuna metodom najmanjih kvadrata. Međutim, samo za jedan X, za koji je vrijednost Y nepoznata.

Sada znate Excel formule za lutke koje vam omogućuju predviđanje vrijednosti buduće vrijednosti indikatora prema linearnom trendu.

Široko se koristi u ekonometriji u obliku jasne ekonomske interpretacije svojih parametara.

Linearna regresija se svodi na pronalaženje jednadžbe oblika

ili

Jednadžba tipa dopušta za postavljene vrijednosti parametar x imaju teorijske vrijednosti efektivnog obilježja, zamjenjujući stvarne vrijednosti faktora u njega x.

Izgradnja linearne regresije svodi se na procjenu njezinih parametara − a i u. Procjene parametara linearne regresije mogu se pronaći različitim metodama.

Klasični pristup procjeni parametara linearne regresije temelji se na najmanjih kvadrata(MNK).

LSM omogućuje dobivanje takvih procjena parametara a i u, pod kojim je zbroj kvadrata odstupanja stvarnih vrijednosti rezultirajuće osobine (y) od izračunatog (teorijskog) mini-minimum:

Da bismo pronašli minimum funkcije, potrebno je izračunati parcijalne derivacije s obzirom na svaki od parametara a i b i izjednačiti ih s nulom.

Označiti kroz S, tada:

Transformirajući formulu, dobivamo sljedeći sustav normalne jednadžbe za procjenu parametara a i u:

Rješavanje sustava normalnih jednadžbi (3.5) bilo metodom sekvencijalno isključivanje varijabli, ili metodom determinanti nalazimo tražene procjene parametara a i u.

Parametar u nazvan koeficijent regresije. Njegova vrijednost pokazuje prosječnu promjenu rezultata s promjenom faktora za jednu jedinicu.

Regresijska jednadžba se uvijek nadopunjuje pokazateljem čvrstoće odnosa. Kada se koristi linearna regresija, koeficijent linearne korelacije djeluje kao takav pokazatelj. Postoje različite verzije formule linearni koeficijent korelacije. Neki od njih su navedeni u nastavku:

Kao što znate, koeficijent linearne korelacije je unutar granica: -1 1.

Za procjenu kvalitete odabira linearna funkcija izračunava se kvadrat

Koeficijent linearne korelacije tzv koeficijent determinacije . Koeficijent determinacije karakterizira udio varijance efektivnog obilježja y, objašnjeno regresijom ukupna varijansa učinkovit znak:

Prema tome, vrijednost 1 - karakterizira udio disperzije y, uzrokovane utjecajem drugih čimbenika koji nisu uzeti u obzir u modelu.

Pitanja za samokontrolu

1. Bit metode najmanjih kvadrata?

2. Koliko varijabli daje parnu regresiju?

3. Koji koeficijent određuje nepropusnost veze između promjena?

4. U kojim granicama se utvrđuje koeficijent determinacije?

5. Procjena parametra b u korelacijsko-regresijskoj analizi?

1. Christopher Dougherty. Uvod u ekonometriju. - M.: INFRA - M, 2001. - 402 str.

2. S.A. Borodich. Ekonometrija. Minsk LLC "Novo znanje" 2001.


3. R.U. Rahmetov Kratki tečaj u ekonometriji. Vodič. Almaty. 2004. -78s.

4. I.I. Eliseeva.Ekonometrija. - M.: "Financije i statistika", 2002

5. Mjesečni informativno-analitički časopis.

Nelinearni ekonomski modeli. Modeli nelinearne regresije. Pretvorba varijable.

Nelinearni ekonomski modeli..

Pretvorba varijable.

koeficijent elastičnosti.

Ako između ekonomske pojave postoje nelinearni odnosi, onda se izražavaju pomoću odgovarajućih nelinearne funkcije: na primjer, jednakostranična hiperbola , parabole drugog stupnja i tako dalje.

Postoje dvije klase nelinearnih regresija:

1. Regresije koje su nelinearne u odnosu na varijable objašnjenja uključene u analizu, ali linearne u odnosu na procijenjene parametre, na primjer:

Polinomi raznih stupnjeva - , ;

Jednakostranična hiperbola - ;

Semilogaritamska funkcija - .

2. Regresije koje su nelinearne u procijenjenim parametrima, na primjer:

Snaga - ;

Demonstrativna -;

Eksponencijalni - .

Ukupni zbroj kvadrata odstupanja individualne vrijednosti učinkovita značajka na od prosječne vrijednosti uzrokovan je utjecajem mnogih čimbenika. Cijeli skup razloga uvjetno dijelimo u dvije skupine: proučavan faktor x i drugi čimbenici.

Ako faktor ne utječe na rezultat, tada je linija regresije na grafikonu paralelna s osi Oh i

Tada je cjelokupna disperzija rezultantnog atributa posljedica utjecaja drugih čimbenika i ukupan iznos kvadratna odstupanja poklopit će se s ostatkom. Ako drugi čimbenici ne utječu na rezultat, onda vezani ste s x funkcionalno i preostali iznos kvadrata je nula. U ovom slučaju, zbroj kvadrata odstupanja objašnjen regresijom jednak je ukupnom zbroju kvadrata.

Budući da sve točke korelacijskog polja ne leže na regresijskoj liniji, njihovo rasipanje se uvijek događa kao zbog utjecaja faktora x, tj. regresija na na X, a uzrokovane djelovanjem drugih uzroka (neobjašnjiva varijacija). Prikladnost regresijske linije za predviđanje ovisi o tome koji dio opća varijacija znak na objašnjava objašnjenu varijaciju

Očito, ako je zbroj kvadrata odstupanja zbog regresije veći od preostalog zbroja kvadrata, tada je regresijska jednadžba statistički značajna, a faktor x ima značajan utjecaj na ishod. y.

, tj. s brojem slobode neovisne varijacije obilježja. Broj stupnjeva slobode povezan je s brojem jedinica populacije n i brojem konstanti određenim iz njega. U odnosu na problem koji se proučava, broj stupnjeva slobode treba pokazati koliko je neovisnih odstupanja od P

Procjena značaja regresijske jednadžbe u cjelini data je uz pomoć F- Fisherov kriterij. U ovom slučaju postavlja se nulta hipoteza da je koeficijent regresije jednak nuli, tj. b= 0, a time i faktor x ne utječe na rezultat y.

Izravnom izračunu F-kriterija prethodi analiza varijance. Središnje je u njemu proširenje ukupnog zbroja kvadrata odstupanja varijable na od prosječne vrijednosti na na dva dijela - "objašnjeno" i "neobjašnjeno":

- ukupni zbroj kvadrata odstupanja;

- zbroj kvadrata odstupanja objašnjenih regresijom;

je rezidualni zbroj kvadrata odstupanja.

Svaki zbroj kvadrata odstupanja povezan je s brojem stupnjeva slobode , tj. s brojem slobode neovisne varijacije obilježja. Broj stupnjeva slobode povezan je s brojem populacijskih jedinica n i s brojem konstanti određenim iz njega. U odnosu na problem koji se proučava, broj stupnjeva slobode treba pokazati koliko je neovisnih odstupanja od P moguće je potrebno da se formira zadani zbroj kvadrata.

Disperzija po stupnju slobodeD.

F-omjeri (F-kriterij):

Ako je nulta hipoteza istinita, zatim faktorijel i rezidualna disperzija ne razlikuju jedni od drugih. Za H 0 potrebno je opovrgavanje kako bi varijanca faktora nekoliko puta premašila rezidual. Engleski statističar Snedecor razvio je tablice kritičnih vrijednosti F-odnosi na različitim razinama materijalnosti Nulta hipoteza i razni brojevi stupnjevi slobode. Vrijednost tablice F-kriterij - ovo je maksimalna vrijednost omjera varijanci, koja se može pojaviti u slučaju njihove nasumične divergencije za zadanu razinu vjerojatnost postojanja nulte hipoteze. Izračunata vrijednost F-odnos se priznaje kao pouzdan ako je o veće od tabelarnog.

U ovom slučaju odbacuje se nulta hipoteza o nepostojanju odnosa značajki i donosi se zaključak o značaju tog odnosa: F činjenica > F tablica H 0 je odbijen.

Ako je vrijednost manja od tablice F činjenica ‹, F tablica, tada je vjerojatnost nulte hipoteze veća od zadane razine i ne može se odbaciti bez ozbiljnog rizika od izvođenja pogrešnog zaključka o prisutnosti veze. U ovom slučaju, jednadžba regresije se smatra statistički beznačajnom. N o ne odstupa.

Standardna pogreška koeficijenta regresije

Da bi se procijenila značajnost koeficijenta regresije, njegova se vrijednost uspoređuje s njegovom standardna pogreška, tj. utvrđuje se stvarna vrijednost t-Učenički kriterij: koji se zatim uspoređuje sa vrijednost tablice na određenoj razini značaja i broju stupnjeva slobode ( n- 2).

Standardna pogreška parametra a:

Značajnost koeficijenta linearne korelacije provjerava se na temelju veličine pogreške koeficijent korelacije r:

Ukupna varijanca značajke x:

Višestruka linearna regresija

Izgradnja modela

Višestruka regresija je regresija rezultantnog obilježja s dva i veliki brojčimbenika, tj. modela pogleda

Regresija može dati dobar rezultat u modeliranju ako se zanemari utjecaj drugih čimbenika koji utječu na predmet proučavanja. Ponašanje pojedinih ekonomskih varijabli ne može se kontrolirati, odnosno nije moguće osigurati jednakost svih ostalih uvjeta za procjenu utjecaja jednog proučavanog čimbenika. U ovom slučaju trebate pokušati identificirati utjecaj drugih čimbenika uvodeći ih u model, tj. izgraditi jednadžbu višestruka regresija: y = a+b 1 x 1 +b 2 +…+b p x p + .

Glavni cilj višestruke regresije je izgradnja modela s velikim brojem čimbenika, pri čemu se utvrđuje utjecaj svakog od njih pojedinačno, kao i njihov kumulativni utjecaj na modelirani pokazatelj. Specifikacija modela uključuje dva područja pitanja: odabir faktora i izbor vrste regresijske jednadžbe