biografieën Kenmerken Analyse

Onderzoeksmethoden dispersiecorrelatieanalyse. ANOVA-METHODEN

Analyse van variantie

1. Begrip variantieanalyse

Analyse van variantie- dit is een analyse van de variabiliteit van een eigenschap onder invloed van eventuele gecontroleerde variabele factoren. In buitenlandse literatuur wordt variantieanalyse vaak ANOVA genoemd, wat zich vertaalt als variantieanalyse (Analysis of Variance).

De taak van variantieanalyse bestaat uit het isoleren van de variabiliteit van een andere soort van de algemene variabiliteit van de eigenschap:

a) variabiliteit als gevolg van de werking van elk van de bestudeerde onafhankelijke variabelen;

b) variabiliteit door de interactie van de bestudeerde onafhankelijke variabelen;

c) willekeurige variatie door alle andere onbekende variabelen.

De variabiliteit als gevolg van de werking van de bestudeerde variabelen en hun interactie correleert met willekeurige variabiliteit. Een indicator van deze verhouding is Fisher's F-test.

De formule voor het berekenen van het criterium F omvat schattingen van varianties, dat wil zeggen de distributieparameters van een kenmerk, daarom is het criterium F een parametrisch criterium.

dan in meer de variabiliteit van een eigenschap is te wijten aan de bestudeerde variabelen (factoren) of hun interactie, hoe hoger empirische waarden van het criterium.

Nul de hypothese in de variantieanalyse zal zeggen dat de gemiddelde waarden van het bestudeerde effectieve kenmerk in alle gradaties hetzelfde zijn.

Alternatief de hypothese zal stellen dat de gemiddelde waarden van het effectieve attribuut in verschillende gradaties van de bestudeerde factor verschillend zijn.

Variantieanalyse stelt ons in staat om een ​​verandering in een eigenschap vast te stellen, maar duidt niet op richting deze veranderingen.

Laten we de variantieanalyse starten met het eenvoudigste geval, wanneer we de actie bestuderen van alleen een variabele (enkele factor).

2. Eenrichtingsanalyse van variantie voor niet-gerelateerde steekproeven

2.1. Doel van de methode

De methode van univariate variantieanalyse wordt gebruikt in gevallen waarin veranderingen in het effectieve kenmerk worden bestudeerd onder invloed van veranderende omstandigheden of gradaties van een factor. In deze versie van de methode is de invloed van elk van de gradaties van de factor verscheidene steekproef van proefpersonen. Er moeten ten minste drie gradaties van de factor zijn. (Er kunnen twee gradaties zijn, maar in dit geval kunnen we geen niet-lineaire afhankelijkheden vaststellen en lijkt het redelijker om eenvoudigere te gebruiken).

Een niet-parametrische variant van dit type analyse is de Kruskal-Wallis H-test.

Hypothesen

H 0: Verschillen tussen factorgraden (verschillende condities) zijn niet meer uitgesproken dan willekeurige verschillen binnen elke groep.

H 1: Verschillen tussen factorgradaties (verschillende condities) zijn meer uitgesproken dan willekeurige verschillen binnen elke groep.

2.2. Beperkingen van univariate variantieanalyse voor niet-gerelateerde steekproeven

1. Univariate variantieanalyse vereist ten minste drie gradaties van de factor en ten minste twee proefpersonen in elke gradatie.

2. De resulterende eigenschap moet normaal verdeeld zijn in de onderzoekssteekproef.

Toegegeven, er wordt meestal niet aangegeven of we het hebben over de verdeling van een eigenschap in de gehele onderzochte steekproef of in dat deel ervan dat het dispersiecomplex vormt.

3. Een voorbeeld van het oplossen van het probleem met de methode van variantieanalyse met één factor voor niet-gerelateerde steekproeven met behulp van het voorbeeld:

Drie verschillende groepen van zes proefpersonen kregen lijsten van tien woorden. Woorden werden aan de eerste groep aangeboden met een lage snelheid van 1 woord per 5 seconden, aan de tweede groep met een gemiddelde snelheid van 1 woord per 2 seconden en aan de derde groep met een hoge snelheid van 1 woord per seconde. Er werd voorspeld dat reproductieprestaties afhankelijk waren van de snelheid van woordpresentatie. De resultaten zijn weergegeven in Tabel. een.

Aantal gereproduceerde woorden tafel 1

onderwerp nummer

lage snelheid

gemiddelde snelheid

hoge snelheid

totaalbedrag

H 0: Verschillen in woordvolume tussen groepen zijn niet meer uitgesproken dan willekeurige verschillen binnen elke groep.

H1: Verschillen in woordvolume tussen groepen zijn meer uitgesproken dan willekeurige verschillen binnen elke groep. Met behulp van de experimentele waarden gepresenteerd in tabel. 1, zullen we enkele waarden vaststellen die nodig zijn om het criterium F te berekenen.

De berekening van de belangrijkste grootheden voor eenrichtingsvariantieanalyse wordt weergegeven in de tabel:

tafel 2

tafel 3

Volgorde van bewerkingen in eenrichtings-ANOVA voor niet-verbonden monsters

Veel gebruikt in deze en volgende tabellen, is de aanduiding SS een afkorting voor "sum of squares". Deze afkorting wordt het meest gebruikt in vertaalde bronnen.

SS feit betekent de variabiliteit van het kenmerk, als gevolg van de werking van de bestudeerde factor;

SS gemeenschappelijk- algemene variabiliteit van het kenmerk;

S CA- variabiliteit als gevolg van niet-verklaarde factoren, "willekeurige" of "resterende" variabiliteit.

MEVROUW - "middelste vierkant", of het gemiddelde van de kwadratensom, de gemiddelde waarde van de overeenkomstige SS.

df - het aantal vrijheidsgraden, dat we, wanneer we kijken naar niet-parametrische criteria, hebben aangeduid met de Griekse letter v.

Conclusie: H 0 wordt verworpen. H1 wordt geaccepteerd. Verschillen in het volume van woordreproductie tussen groepen zijn meer uitgesproken dan willekeurige verschillen binnen elke groep (α=0.05). Dus de snelheid van presentatie van woorden beïnvloedt het volume van hun reproductie.

Hieronder ziet u een voorbeeld van het oplossen van het probleem in Excel:

Initiële data:

Met behulp van het commando: Tools->Data-analyse->Eenrichtingsanalyse van variantie, krijgen we de volgende resultaten:

De hierboven besproken verificatiemethoden statistische hypothesen over de betekenis van verschillen tussen de twee gemiddelden in de praktijk zijn van beperkt nut. Dit is te wijten aan het feit dat om het effect van alle mogelijke omstandigheden en factoren op een productief kenmerk te identificeren, het veld en de laboratoriumexperimenten, wordt in de regel uitgevoerd met niet twee, maar een groter aantal monsters (1220 of meer).

Vaak vergelijken onderzoekers de gemiddelden van verschillende steekproeven gecombineerd in enkel complex. Bijvoorbeeld het bestuderen van het effect verschillende soorten en doseringen van meststoffen op gewasopbrengsten, worden de experimenten herhaald in verschillende opties. In deze gevallen worden paarsgewijze vergelijkingen omslachtig en vereist de statistische analyse van het hele complex het gebruik van een speciale methode. Deze methode, ontwikkeld in de wiskundige statistiek, wordt variantieanalyse genoemd. Het werd voor het eerst gebruikt door de Engelse statisticus R. Fisher bij het verwerken van de resultaten van agronomische experimenten (1938).

Analyse van variantie is een methode statistische evaluatie de betrouwbaarheid van de manifestatie van de afhankelijkheid van het effectieve kenmerk van een of meer factoren. Met behulp van de variantieanalysemethode worden statistische hypothesen getest met betrekking tot de gemiddelden in verschillende algemene populaties die een normale verdeling hebben.

Variantieanalyse is een van de belangrijkste methoden voor statistische evaluatie van de resultaten van een experiment. Het wordt ook steeds vaker gebruikt bij de analyse van economische informatie. Variantieanalyse maakt het mogelijk om vast te stellen hoe selectieve indicatoren van de relatie tussen de effectieve tekens en de factortekens voldoende zijn om de uit de steekproef verkregen gegevens onder de algemene bevolking te verspreiden. Het voordeel van deze methode is dat deze redelijk betrouwbare conclusies geeft uit kleine steekproeven.

Door de variatie van het resulterende attribuut onder invloed van een of meer factoren te onderzoeken, met behulp van variantieanalyse, kan men, naast algemene schattingen van de significantie van afhankelijkheden, ook een beoordeling krijgen van de verschillen in de gemiddelde waarden die worden gevormd op verschillende niveaus van factoren, en de betekenis van de interactie van factoren. Variantieanalyse wordt gebruikt om de afhankelijkheden van zowel kwantitatieve als kwalitatieve kenmerken, evenals hun combinatie.

De essentie van deze methode is: statistische studie de waarschijnlijkheid van de invloed van een of meer factoren, evenals hun interactie op het effectieve kenmerk. Dienovereenkomstig worden met behulp van dispersieanalyse drie hoofdtaken opgelost: 1) totale score betekenis van verschillen tussen groepsgemiddelden; 2) beoordeling van de waarschijnlijkheid van interactie van factoren; 3) beoordeling van de significantie van verschillen tussen paren van middelen. Meestal moeten onderzoekers dergelijke problemen oplossen bij het uitvoeren van veld- en zoötechnische experimenten, wanneer de invloed van verschillende factoren op de resulterende eigenschap wordt bestudeerd.

Het principeschema van dispersieanalyse omvat het vaststellen van de belangrijkste bronnen van variatie van het resulterende attribuut en de bepaling van het variatievolume (sommen van gekwadrateerde afwijkingen) volgens de bronnen van zijn vorming; bepaling van het aantal vrijheidsgraden dat overeenkomt met de componenten van de totale variatie; berekening van varianties als de verhouding van de overeenkomstige variatievolumes tot hun aantal vrijheidsgraden; analyse van de relatie tussen dispersies; beoordeling van de betrouwbaarheid van het verschil tussen de gemiddelden en het formuleren van conclusies.

Dit schema blijft behouden zowel in eenvoudige ANOVA-modellen, wanneer gegevens worden gegroepeerd volgens één attribuut, als in complexe modellen, wanneer gegevens worden gegroepeerd volgens twee en een groot aantal tekens. Met een toename van het aantal groepskenmerken wordt het proces van ontbinding van de algemene variatie volgens de bronnen van zijn vorming echter gecompliceerder.

Volgens schakelschema variantieanalyse kan worden weergegeven als vijf opeenvolgende stappen:

1) definitie en ontleding van variatie;

2) bepaling van het aantal vrijheidsgraden van variatie;

3) berekening van dispersies en hun verhoudingen;

4) analyse van dispersies en hun verhoudingen;

5) beoordeling van de betrouwbaarheid van het verschil tussen de gemiddelden en het formuleren van conclusies over het toetsen van de nulhypothese.

Het meest tijdrovende deel van de variantieanalyse is de eerste fase - de definitie en decompositie van de variatie door de bronnen van zijn vorming. De volgorde van expansie van het totale volume van variatie werd in detail besproken in hoofdstuk 5.

De basis voor het oplossen van problemen van dispersieanalyse is de wet van expansie (toevoeging) van variatie, volgens welke: algemene variatie(fluctuaties) van het effectieve kenmerk wordt in tweeën gedeeld: de variatie als gevolg van de werking van de bestudeerde factor (factoren), en de variatie veroorzaakt door de werking van willekeurige oorzaken, dat wil zeggen

Laten we aannemen dat de bestudeerde populatie volgens een factorattribuut is verdeeld in verschillende groepen, die elk door hun eigen kenmerken worden gekenmerkt gemiddeld effectief teken. Tegelijkertijd kan de variatie van deze waarden worden verklaard door twee soorten redenen: redenen die systematisch inwerken op het effectieve kenmerk en vatbaar zijn voor aanpassing in de loop van het experiment en niet vatbaar zijn voor aanpassing. Het is duidelijk dat variatie tussen groepen (factoriële of systematische) voornamelijk afhangt van de werking van de bestudeerde factor, en intragroep (residueel of willekeurig) - van de werking van willekeurige factoren.

Om de significantie van verschillen tussen groepsgemiddelden te beoordelen, is het noodzakelijk om de intergroeps- en intragroepsvariaties te bepalen. Als de intergroepsvariatie (factoriële) de intragroepsvariatie (rest) aanzienlijk overschrijdt, heeft de factor de resulterende eigenschap beïnvloed, waardoor de waarden van de groepsgemiddelden aanzienlijk worden gewijzigd. Maar de vraag rijst, wat is de verhouding tussen de intergroeps- en intragroepsvariaties kan als voldoende worden beschouwd voor de conclusie over de betrouwbaarheid (significantie) van verschillen tussen de groepsgemiddelden.

Om de significantie van verschillen tussen de gemiddelden te beoordelen en conclusies te formuleren over het testen van de nulhypothese (H0: x1 = x2 = ... = xn), gebruikt de variantieanalyse een soort standaard - het G-criterium, de verdelingswet van die werd opgericht door R. Fisher. Dit criterium is de verhouding van twee varianties: faculteit, gegenereerd door de werking van de onderzochte factor, en residuaal, als gevolg van willekeurige oorzaken:

Dispersieverhouding r = t>u : £ * 2 door de Amerikaanse statisticus Snedecor voorgesteld te worden aangeduid met de letter G ter ere van de uitvinder van de variantieanalyse R. Fisher.

De varianties van °2 en io2 zijn schattingen van de variantie bevolking. Als steekproeven met varianties van °2 °2 worden getrokken uit dezelfde algemene populatie, waar de variatie in waarden had willekeurig karakter, dan is het verschil in de waarden van °2 °2 ook willekeurig.

Als het experiment de invloed van meerdere factoren (A, B, C, etc.) op het effectieve kenmerk tegelijkertijd controleert, dan moet de spreiding als gevolg van de werking van elk van hen vergelijkbaar zijn met °e.gP, dat is

Als de waarde van de factorvariantie significant groter is dan het residu, dan heeft de factor een significante invloed op het resulterende attribuut en vice versa.

In multifactoriële experimenten is er, naast de variatie als gevolg van de werking van elke factor, bijna altijd een variatie vanwege de interactie van factoren ($av: ^ls ^ss $liіs). De essentie van de interactie is dat het effect van één factor significant verandert in: verschillende niveaus de tweede (bijvoorbeeld de effectiviteit van de bodemkwaliteit bij verschillende doseringen meststoffen).

De interactie van factoren moet ook worden beoordeeld door de respectieve varianties 3 ^w.gr te vergelijken:

Bij het berekenen van de werkelijke waarde van het B-criterium wordt de grootste van de varianties in de teller genomen, dus B > 1. Het is duidelijk dat hoe groter het B-criterium, de meer significant verschil tussen dispersies. Als B = 1, dan wordt de kwestie van het beoordelen van de significantie van verschillen in varianties verwijderd.

Om de grenzen van willekeurige fluctuaties te bepalen, heeft de variantieverhouding G. Fisher speciale tabellen van de B-verdeling ontwikkeld (bijlage 4 en 5). Criterium B is functioneel gerelateerd aan waarschijnlijkheid en hangt af van het aantal vrijheidsgraden van variatie k1 en k2 van de twee vergeleken varianties. Er worden meestal twee tabellen gebruikt om conclusies te trekken over de limiet hoge waarde criterium voor significantieniveaus van 0,05 en 0,01. Een significantieniveau van 0,05 (of 5%) betekent dat slechts in 5 van de 100 gevallen criterium B een waarde kan aannemen gelijk aan of hoger dan aangegeven in de tabel. Een verlaging van het significantieniveau van 0,05 naar 0,01 leidt tot een verhoging van de waarde van het criterium B tussen twee varianties door het optreden van alleen willekeurige oorzaken.

De waarde van het criterium hangt ook direct af van het aantal vrijheidsgraden van de twee vergeleken dispersies. Als het aantal vrijheidsgraden neigt naar oneindig (k-me), dan neigt de verhouding van zou voor twee dispersies naar één.

De tabelwaarde van criterium B toont een mogelijke willekeurige waarde van de verhouding van twee varianties op een bepaald significantieniveau en het overeenkomstige aantal vrijheidsgraden voor elk van de vergeleken varianties. In deze tabellen wordt de waarde van B gegeven voor steekproeven gemaakt uit dezelfde algemene populatie, waarbij de redenen voor de verandering in waarden slechts willekeurig zijn.

De waarde van G is te vinden in de tabellen (bijlage 4 en 5) op het snijpunt van de corresponderende kolom (het aantal vrijheidsgraden voor een grotere spreiding - k1) en de rij (het aantal vrijheidsgraden voor een kleinere spreiding -k2). Dus als de grotere variantie (teller G) k1 = 4, en de kleinere (noemer G) k2 = 9, dan is Ga op significantieniveau a = 0,05 3,63 (ongeveer 4). Dus, als gevolg van het optreden van willekeurige oorzaken, aangezien de steekproeven klein zijn, kan de variantie van één steekproef, bij een significantieniveau van 5%, de variantie voor de tweede steekproef 3,63 keer overschrijden. Bij een verlaging van het significantieniveau van 0,05 naar 0,01 zal de tabelwaarde van het criterium D, zoals hierboven vermeld, toenemen. Dus, met dezelfde vrijheidsgraden k1 = 4 en k2 = 9 en a = 0,01, wordt de tabelwaarde van het criterium G 6,99 (ongeveer 5).

Beschouw de procedure voor het bepalen van het aantal vrijheidsgraden in de variantieanalyse. Het aantal vrijheidsgraden, dat overeenkomt met de totale som van gekwadrateerde afwijkingen, wordt ontleed in de overeenkomstige componenten op dezelfde manier als de ontleding van de som van gekwadrateerde afwijkingen totaal aantal vrijheidsgraden (k") wordt ontleed in het aantal vrijheidsgraden voor variaties tussen groepen (k1) en intragroep (k2).

Dus indien steekproefkader, bestaande uit N waarnemingen gedeeld door t groepen (aantal experimentopties) en P subgroepen (aantal herhalingen), dan is het aantal vrijheidsgraden k respectievelijk:

en voor totaalbedrag kwadratische afwijkingen (d7zar)

b) voor de intergroepssom van gekwadrateerde afwijkingen ^m.gP)

c) voor de intragroepssom van gekwadrateerde afwijkingen in w.gr)

Volgens de optelregel van variatie:

Als er bijvoorbeeld vier varianten van het experiment in het experiment werden gevormd (m = 4) in vijf herhalingen elk (n = 5), en totaal waarnemingen N = = t o p \u003d 4 * 5 \u003d 20, dan is het aantal vrijheidsgraden respectievelijk gelijk aan:

Als we de som van de gekwadrateerde afwijkingen van het aantal vrijheidsgraden kennen, is het mogelijk om onbevooroordeelde (aangepaste) schattingen te bepalen voor drie varianties:

De nulhypothese H0 door criterium B wordt op dezelfde manier getest als door Student's u-toets. Om een ​​beslissing te nemen over het controleren van H0, is het noodzakelijk om de werkelijke waarde van het criterium te berekenen en deze te vergelijken met de tabelwaarde Ba voor het geaccepteerde significantieniveau a en het aantal vrijheidsgraden k1 en k2 voor twee dispersies.

Als Bfakg > Ba, dan kunnen we, in overeenstemming met het geaccepteerde significantieniveau, concluderen dat de verschillen in steekproefvarianties niet alleen door willekeurige factoren worden bepaald; ze zijn aanzienlijk. In dit geval wordt de nulhypothese verworpen en is er reden om aan te nemen dat de factor het resulterende attribuut significant beïnvloedt. Als< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Het gebruik van een of ander model voor variantieanalyse hangt zowel af van het aantal onderzochte factoren als van de steekproefmethode.

Afhankelijk van het aantal factoren dat de variatie van het effectieve kenmerk bepaalt, kunnen steekproeven worden gevormd door een, twee of meer factoren. Volgens deze variantieanalyse is verdeeld in single-factor en multi-factor. Anders wordt het ook wel een single-factor en multi-factor dispersion complex genoemd.

Het ontledingsschema van de algemene variatie hangt af van de vorming van de groepen. Het kan willekeurig zijn (waarnemingen van één groep zijn niet gerelateerd aan de waarnemingen van de tweede groep) en niet-willekeurig (waarnemingen van twee monsters zijn onderling verbonden door de algemene voorwaarden van het experiment). Dienovereenkomstig worden onafhankelijke en afhankelijke steekproeven verkregen. Onafhankelijke steekproeven kunnen worden gevormd met zowel gelijke als oneven getallen. De vorming van afhankelijke steekproeven veronderstelt hun gelijk aantal.

Als de groepen in een niet-gewelddadige volgorde worden gevormd, omvat de totale hoeveelheid variatie van de resulterende eigenschap, samen met de factoriële (intergroeps) en resterende variatie, de variatie van herhalingen, dat wil zeggen

In de praktijk is het in de meeste gevallen noodzakelijk om afhankelijke steekproeven te overwegen wanneer de voorwaarden voor groepen en subgroepen gelijk zijn. Ja in praktijkervaring de hele site is verdeeld in blokken, met de meeste virivnyanniya-omstandigheden. Tegelijkertijd krijgt elke variant van het experiment gelijke kansen om in alle blokken te worden vertegenwoordigd, waardoor de voorwaarden voor alle geteste opties, ervaring gelijk worden gemaakt. Deze methode om ervaring te construeren wordt de methode van gerandomiseerde blokken genoemd. Experimenten met dieren worden op dezelfde manier uitgevoerd.

Bij het verwerken van sociaal-economische gegevens volgens de methode van dispersieanalyse, moet er rekening mee worden gehouden dat het vanwege het grote aantal factoren en hun onderlinge relatie moeilijk is, zelfs met de meest zorgvuldige afstemming van de omstandigheden, om de mate van objectieve invloed van elke individuele factor op het effectieve attribuut. Daarom wordt het niveau van de resterende variatie niet alleen bepaald door willekeurige oorzaken, maar ook door significante factoren waarmee geen rekening is gehouden bij het bouwen van het ANOVA-model. Hierdoor wordt de resterende spreiding als vergelijkingsbasis soms ontoereikend voor haar doel, wordt ze duidelijk in omvang overschat en kan ze niet als maatstaf dienen voor de significantie van de invloed van factoren. In dit opzicht wordt het bij het bouwen van modellen voor variantieanalyse: echt probleem selectie kritische factoren en het egaliseren van de voorwaarden voor de manifestatie van de actie van elk van hen. Daarnaast. het gebruik van variantieanalyse veronderstelt normaal of dichtbij normale verdeling statistische aggregaten bestudeerd. Als niet aan deze voorwaarde wordt voldaan, worden de schattingen die bij de variantieanalyse zijn verkregen, overdreven.

Analyse van variantie(van het Latijnse Dispersio - dispersie / in het Engels Variantieanalyse - ANOVA) wordt gebruikt om de invloed van een of meer kwalitatieve variabelen (factoren) op een afhankelijke kwantitatieve variabele (respons) te bestuderen.

De variantieanalyse is gebaseerd op de aanname dat sommige variabelen kunnen worden beschouwd als oorzaken (factoren, onafhankelijke variabelen): , en andere als gevolgen (afhankelijke variabelen). Onafhankelijke variabelen worden soms aanpasbare factoren genoemd, juist omdat de onderzoeker in het experiment de mogelijkheid heeft om ze te variëren en het resulterende resultaat te analyseren.

hoofd doel variantieanalyse(ANOVA) is de studie van de significantie van verschillen tussen gemiddelden door de varianties te vergelijken (analyseren). Door de totale variantie in meerdere bronnen te verdelen, kan men de variantie als gevolg van intergroepsverschillen vergelijken met de variantie als gevolg van variabiliteit binnen de groep. Als de nulhypothese waar is (over de gelijkheid van de gemiddelden in verschillende groepen observaties geselecteerd uit de algemene populatie), moet de schatting van de variantie geassocieerd met intragroepvariabiliteit dicht bij de schatting liggen intergroepsvariantie. Als u eenvoudigweg de gemiddelden van twee steekproeven vergelijkt, geeft de variantieanalyse hetzelfde resultaat als een gewone t-toets voor onafhankelijke steekproeven (als u twee onafhankelijke groepen objecten of waarnemingen vergelijkt) of een t-toets voor afhankelijke steekproeven ( als u twee variabelen op dezelfde en dezelfde set objecten of waarnemingen vergelijkt).

De essentie van variantieanalyse ligt in de verdeling van de totale variantie van het bestudeerde kenmerk in afzonderlijke componenten, vanwege de invloed van specifieke factoren, en het testen van hypothesen over de significantie van de invloed van deze factoren op het bestudeerde kenmerk. Door de componenten van de dispersie met elkaar te vergelijken met behulp van Fisher's F-test, is het mogelijk om te bepalen welk deel van de totale variabiliteit van de resulterende eigenschap te wijten is aan de werking van instelbare factoren.

Het bronmateriaal voor de variantieanalyse zijn de gegevens van de studie van drie of meer steekproeven: , die gelijk of ongelijk in aantal kunnen zijn, zowel verbonden als losgekoppeld. Afhankelijk van het aantal geïdentificeerde aanpasbare factoren, kan de variantieanalyse een-factor(tegelijkertijd wordt de invloed van één factor op de resultaten van het experiment bestudeerd), twee-factor(bij het bestuderen van de invloed van twee factoren) en multifactorieel(hiermee kunt u niet alleen de invloed van elk van de factoren afzonderlijk evalueren, maar ook hun interactie).

Variantieanalyse behoort tot de groep van parametrische methoden en mag daarom alleen worden gebruikt als is bewezen dat de verdeling normaal is.

Variantieanalyse wordt gebruikt als de afhankelijke variabele wordt gemeten op een schaal van verhoudingen, intervallen of volgorde, en de beïnvloedende variabelen niet-numeriek zijn (naamschaal).

Taakvoorbeelden

Bij problemen die worden opgelost door variantieanalyse, is er een respons van numerieke aard, die wordt beïnvloed door verschillende variabelen die een nominaal karakter hebben. Bijvoorbeeld verschillende soorten veemestrantsoenen of twee manieren om ze te houden, enz.

Voorbeeld 1: Gedurende de week waren er verschillende apotheekkiosken op drie verschillende locaties. In de toekomst kunnen we er maar één achterlaten. Het is noodzakelijk om te bepalen of er een statistisch significant verschil is tussen de verkoopvolumes van medicijnen in kiosken. Zo ja, dan selecteren we de kiosk met het hoogste gemiddelde dagelijkse verkoopvolume. Als het verschil in verkoopvolume statistisch onbeduidend blijkt te zijn, moeten andere indicatoren de basis vormen voor het kiezen van een kiosk.

Voorbeeld 2: Vergelijking van contrasten van groepsgemiddelden. De zeven politieke voorkeuren zijn gerangschikt van extreem liberaal tot extreem conservatief, en lineair contrast wordt gebruikt om te testen of er een opwaartse trend is die niet nul is in groepsgemiddelden, d.w.z. of er een significante lineaire toename van de gemiddelde leeftijd is bij het beschouwen van groepen die zijn gerangschikt in de richting van liberaal naar conservatief.

Voorbeeld 3: Tweerichtingsanalyse van variantie. Het aantal productverkopen wordt, naast de grootte van de winkel, vaak beïnvloed door de locatie van de schappen met het product. dit voorbeeld bevat wekelijkse verkoopcijfers die worden gekenmerkt door vier schapindelingen en drie winkelgroottes. De resultaten van de analyse laten zien dat beide factoren - de locatie van de schappen met de goederen en de grootte van de winkel - het aantal verkopen beïnvloeden, maar hun interactie is niet significant.

Voorbeeld 4: Univariate ANOVA: gerandomiseerd volledig blokontwerp met twee behandelingen. De invloed op het bakken van brood van allemaal mogelijke combinaties drie vetten en drie deegrollers. Vier meelmonsters genomen van vier verschillende bronnen, dienden als blokkerende factoren. Het belang van de interactie tussen vet-ripper moet worden geïdentificeerd. Om daarna de verschillende opties voor het kiezen van contrasten te bepalen, zodat u kunt achterhalen welke combinaties van niveaus van factoren verschillen.

Voorbeeld 5: Model van een hiërarchisch (genest) plan met gemengde effecten. De invloed van vier willekeurig geselecteerde koppen gemonteerd in een werktuigmachine op de vervorming van gefabriceerde glaskathodehouders wordt bestudeerd. (De koppen zijn in de machine ingebouwd, dus dezelfde kop kan niet op verschillende machines worden gebruikt.) Het hoofdeffect wordt behandeld als een willekeurige factor. Uit de ANOVA-statistieken blijkt dat er geen significante verschillen zijn tussen machines, maar er zijn aanwijzingen dat de koppen kunnen verschillen. Het verschil tussen alle machines is niet significant, maar voor twee ervan is het verschil tussen de soorten koppen significant.

Voorbeeld 6: Univariate analyse van herhaalde metingen met behulp van een split-plot-plan. Dit experiment werd uitgevoerd om het effect te bepalen van de angstscore van een persoon op de examenprestaties bij vier opeenvolgende pogingen. De gegevens zijn zo georganiseerd dat ze kunnen worden beschouwd als groepen van subsets van de gehele dataset ("de hele plot"). Het effect van angst was niet significant, terwijl het effect van proberen significant was.

Lijst met methoden

  • Modellen van factorieel experiment. Voorbeelden: factoren die het succes van het oplossen van wiskundige problemen beïnvloeden; factoren die de verkoopvolumes beïnvloeden.

De gegevens bestaan ​​uit verschillende reeksen waarnemingen (verwerkingen), die worden beschouwd als realisaties van onafhankelijke steekproeven. De initiële hypothese is dat er geen verschil is in behandelingen, d.w.z. er wordt aangenomen dat alle waarnemingen als één steekproef uit de totale populatie kunnen worden beschouwd:

  • Een-factor parametrisch model: Scheffe's methode.
  • Niet-parametrisch model met één factor [Lagutin M.B., 237]: Kruskal-Wallis-criterium [Hollender M., Wolf D.A., 131], Jonkheer-criterium [Lagutin M.B., 245].
  • Algemeen geval van een model met constante factoren, de stelling van Cochran [Afifi A., Eisen S., 234].

De gegevens zijn tweevoudig herhaalde waarnemingen:

  • Niet-parametrisch model met twee factoren: Friedman's criterium [Lapach, 203], Page's criterium [Lagutin M.B., 263]. Voorbeelden: vergelijking van de effectiviteit van productiemethoden, landbouwpraktijken.
  • Niet-parametrisch model met twee factoren voor onvolledige gegevens

Verhaal

Waar komt de naam vandaan? variantieanalyse? Het lijkt misschien vreemd dat de procedure voor het vergelijken van gemiddelden variantieanalyse wordt genoemd. In feite is dit te wijten aan het feit dat wanneer we de statistische significantie van het verschil tussen de gemiddelden van twee (of meerdere) groepen onderzoeken, we eigenlijk vergelijken (analyseren) voorbeeldafwijkingen. Het fundamentele concept van variantieanalyse wordt voorgesteld Visser in 1920. Misschien is een meer natuurlijke term kwadratenanalyse of analyse van variatie, maar vanwege de traditie wordt de term variantieanalyse gebruikt. Aanvankelijk werd variantieanalyse ontwikkeld om gegevens te verwerken die zijn verkregen in de loop van speciaal ontworpen experimenten, en werd beschouwd als de enige methode die causale verbanden correct onderzoekt. De methode werd gebruikt om experimenten in de productie van gewassen te evalueren. Later werd de algemene wetenschappelijke betekenis van dispersie-analyse voor experimenten in psychologie, pedagogiek, geneeskunde, enz. duidelijk.

Literatuur

  1. Sheff G. Dispersie analyse. - M., 1980.
  2. Ahrens H. Leider Yu. Multivariate variantieanalyse.
  3. Kobzar AI Toegepast wiskunde statistiek. - M.: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Statistieken in de wetenschap en het bedrijfsleven. - Kiev: Morion, 2002.
  5. Lagutin M.B. Visuele wiskundige statistieken. In twee delen. - M.: P-centrum, 2003.
  6. Afifi A., Eisen S. statistische analyse: De computerondersteunde benadering.
  7. Hollender M., Wolf D.A. Niet-parametrische methoden van statistiek.

Links

Mean squares en s R 2 zijn zuivere schattingen van de afhankelijke variabele, aangedreven door respectievelijk de regressie- of verklarende variabele X en de impact van niet-verklaarde willekeurige factoren en fouten; m is het aantal geschatte regressieparameters, n is het aantal waarnemingen. Bij afwezigheid van een lineair verband tussen de afhankelijke en verklarende (factoriële) variabele, hebben willekeurige variabelen en s R 2 respectievelijk een 2-verdeling met m-1 en n-m vrijheidsgraden, en hun verhouding F is een verdeling met dezelfde vrijheidsgraden. Daarom is de regressievergelijking significant op het niveau als de werkelijk waargenomen waarde van de statistiek de tabelwaarde overschrijdt:

(5.11),

waar is de tabelwaarde van F - de Fisher - Snedekor-test, bepaald op het significantieniveau op k1 = m-1 en k2 = n-m graden van vrijheid.

Gezien de betekenis van de waarden en s R 2 , kunnen we zeggen dat de waarde van F aangeeft in hoeverre de regressie de waarde van de afhankelijke variabele beter schat dan het gemiddelde ervan.

In het geval van een stoomkamer lineaire regressie m = 2, en de regressievergelijking is significant op het niveau als

(5.12)

Als maat voor de significantie van de regressielijn kan de volgende verhouding dienen:

waarbij ŷi -i-e gelijkgestelde waarde; -medium rekenkundige waarden y ik; σ y.x - root mean square error (benaderingsfout) regressievergelijking, berekend vanaf bekende formule; n is het aantal vergeleken paren kenmerkwaarden; m is het aantal factorkenmerken.

Inderdaad, de verbinding is des te groter, des te significanter de maat van de spreiding van het attribuut, als gevolg van regressie, de maat van de spreiding van de afwijkingen van de werkelijke waarden van de genivelleerde waarden overschrijdt.

Deze verhouding stelt ons in staat om de kwestie van de betekenis van de regressievergelijking als geheel op te lossen, dat wil zeggen, de aanwezigheid van een statistische afhankelijkheid tussen variabelen. De regressievergelijking is significant, d.w.z. er is een statistische relatie tussen de tekens, indien voor gegeven niveau significantie, de berekende waarde van het Fisher-criterium F overschrijdt de kritische waarde F cr , die staat op de kruising van de m-de kolom en de e rij van een speciale statistische tabel, die de "Tabel met waarden van de Fisher F-test".

Voorbeeld. Laten we Fisher's criterium gebruiken om de significantie te beoordelen van de regressievergelijking die in de laatste lezing is geconstrueerd, dat wil zeggen de vergelijking die de relatie uitdrukt tussen oogst en zaaien per hoofd van de bevolking.

Vervanging in de formule voor het berekenen van het Fisher-criterium, de gegevens van het vorige voorbeeld, krijgen we

Verwijzend naar de F-verdelingstabel voor P=0.95 (α=1-P=0.5) en rekening houdend met n-2=21, m-1=1, in de tabel met F-testwaarden voor de kruispunten van de 1e kolom en de 21e rij vinden we de kritische waarde F cr, gelijk aan 4,32 met een betrouwbaarheidsgraad P=0,95. Aangezien de berekende waarde van het F-criterium de Fcr-waarde significant overschrijdt, is de ontdekte lineaire relatie significant, d.w.z. de a priori hypothese over de aanwezigheid lineaire verbinding bevestigd. De conclusie is getrokken met de mate van betrouwbaarheid P=0.95. Er kan worden gecontroleerd of de uitvoer in deze zaak blijft hetzelfde als de betrouwbaarheid wordt verhoogd tot P=0,99 (de corresponderende waarde van F cr = 8,02 voor het significantieniveau α=0,01).


Bepaling coëfficiënt. Met behulp van het F-criterium hebben we vastgesteld dat er sprake is van: lineaire afhankelijkheid tussen de hoeveelheid graan die wordt geoogst en de hoeveelheid gezaaid per hoofd van de bevolking. Daarom kan worden gesteld dat de hoeveelheid graan die per hoofd van de bevolking wordt geoogst lineair afhangt van de hoeveelheid gezaaid per hoofd van de bevolking. Nu is het gepast om een ​​verhelderende vraag te stellen: in hoeverre bepaalt de hoeveelheid gezaaid per hoofd van de bevolking de hoeveelheid graanoogst per hoofd van de bevolking? Deze vraag kan worden beantwoord door te berekenen welk deel van de variatie van het resulterende kenmerk verklaard kan worden door de invloed van het factorkenmerk. Dit doel wordt gediend door de index (of coëfficiënt) van bepaling R 2 , die het mogelijk maakt om het aandeel van de spreiding te schatten waarmee rekening wordt gehouden door de regressie in de totale spreiding van het effectieve attribuut. Bepalingscoëfficiënt, gelijk aan de verhouding van de factoriële variatie tot de totale variatie van de eigenschap, maakt het mogelijk om te beoordelen hoe "succesvol" het type functie wordt gekozen dat de echte statistische afhankelijkheid beschrijft.

Als de determinatiecoëfficiënt R2 bekend is, dan kan het criterium voor de significantie van de regressievergelijking of de determinatiecoëfficiënt zelf (Fisher's criterium) worden geschreven als:

Fisher's criterium stelt ons ook in staat om het nut te evalueren van het opnemen van: aanvullende factoren in het model voor de vergelijking Meerdere lineaire regressie.

In de econometrie, afgezien van algemeen criterium Fisher, het concept wordt ook gebruikt privé criterium . Het partiële F-criterium toont de mate van invloed van een extra onafhankelijke variabele op het resulterende attribuut en kan worden gebruikt bij de beslissing om deze onafhankelijke variabele aan de vergelijking toe te voegen of ervan uit te sluiten.

De verstrooiing van het kenmerk verklaard door de eerder geconstrueerde twee-factor-regressievergelijking kan worden ontleed in twee typen: 1) de verstrooiing van het kenmerk door de onafhankelijke variabele x 1, en 2) de verstrooiing van het kenmerk door de onafhankelijke variabele x 2 wanneer x 1 al in de vergelijking is opgenomen. De eerste component komt overeen met de spreiding van het attribuut, verklaard door de vergelijking, die alleen de variabele x 1 bevat. Het verschil tussen de feature scatter als gevolg van de gepaarde lineaire regressievergelijking en de feature scatter als gevolg van de twee-weg lineaire regressievergelijking zal het deel van de spreiding bepalen dat wordt verklaard door de extra onafhankelijke variabele x 2 .

De verhouding van het gespecificeerde verschil tot de spreiding van het kenmerk, niet verklaard door regressie, is de waarde privé criterium. Een bepaalde F-toets wordt ook wel sequentiële if . genoemd statistische kenmerken worden geconstrueerd door achtereenvolgens variabelen aan de regressievergelijking toe te voegen.

Voorbeeld. Evalueer het nut van het opnemen van een extra variabele "opbrengst" in de regressievergelijking (volgens de gegevens en resultaten van de eerder overwogen voorbeelden).

De spreiding van het kenmerk verklaard door de vergelijking meervoudige regressie en berekend als de som van de gekwadrateerde verschillen van de vereffende waarden en hun gemiddelde, is gelijk aan 1623,8815. De spreiding van het attribuut, verklaard door de eenvoudige regressievergelijking, is 1545.1331.

De spreiding van het kenmerk, niet verklaard door regressie, wordt bepaald door het kwadraat van het gemiddelde kwadratische fout vergelijking en is gelijk aan 10,9948.

Met behulp van deze kenmerken berekenen we het privé F-criterium

Met een betrouwbaarheidsniveau van 0,95 (α = 0,05), de tabelwaarde F (1,20), d.w.z. de waarde op het snijpunt van de 1e kolom en de 20e rij van de tabel. 4A aanvraag, gelijk aan 4,35. De berekende waarde van het F-criterium overschrijdt aanzienlijk de getabelleerde waarde, en daarom is het zinvol om de variabele "opbrengst" in de vergelijking op te nemen.

De eerder gemaakte conclusies met betrekking tot de regressiecoëfficiënten zijn dus volkomen legitiem.

4e studie vraag. Beoordeling van de significantie van individuele parameters van de regressievergelijking met behulp van Student's t-test.

Heel vaak is het in de econometrie vereist om de significantie van de correlatiecoëfficiënt te evalueren r, dat wil zeggen, om te bepalen hoe significant het verschil van de correlatiecoëfficiënt van nul is (bijvoorbeeld bij het analyseren van multicollineariteit en het schatten van gepaarde correlatiecoëfficiënten tussen factoren in een meervoudige regressievergelijking).

Tegelijkertijd wordt aangenomen dat bij het ontbreken van een correlatie de statistieken t,

Het heeft t-Studentenverdeling met (n-2) vrijheidsgraden.

De correlatiecoëfficiënt r xy is significant op het niveau , (anders wordt de hypothese Н 0 over de gelijkheid van de algemene correlatiecoëfficiënt met nul verworpen), als

(5.13),

Waar is een tabelwaarde t-Studentencriterium, bepaald op significantieniveau a met het aantal vrijheidsgraden (n-2).

Bij lineaire regressie wordt meestal de betekenis van niet alleen de vergelijking als geheel, maar ook de individuele parameters geëvalueerd. Hiertoe wordt voor elk van de parameters de standaardfout bepaald. De procedure voor het beoordelen van de significantie van deze parameter verschilt niet van de procedure die hierboven is overwogen voor de regressiecoëfficiënt; de waarde van het t-criterium wordt berekend, de waarde ervan wordt vergeleken met de tabelwaarde bij (n-2) vrijheidsgraden. Het testen van hypothesen over de significantie van regressie- en correlatiecoëfficiënten is gelijk aan het testen van de hypothese over significantie lineaire vergelijking regressie.

Conclusie. Dus in deze lezing hebben we overwogen: algemene regels testen van statistische hypothesen en hun praktisch gebruik bij het beoordelen van de betekenis van regressievergelijkingen en hun individuele parameters met behulp van de Fisher- en Student-criteria.

Analyse van variantie

cursus werk door discipline: " Systeemanalyse»

Performer student gr. 99 ISE-2 Zhbanov V.V.

Orenburg Staatsuniversiteit

Faculteit informatie technologieën

Vakgroep Toegepaste Informatica

Orenburg-2003

Invoering

Het doel van het werk: kennismaken met een statistische methode als variantieanalyse.

Dispersieanalyse (van het Latijnse Dispersio - dispersie) - statistische methode, waardoor de invloed kan worden geanalyseerd Verschillende factoren naar de variabele die wordt bestudeerd. De methode is in 1925 ontwikkeld door de bioloog R. Fisher en werd oorspronkelijk gebruikt om experimenten in de gewasproductie te evalueren. Later werd de algemene wetenschappelijke betekenis van dispersie-analyse voor experimenten in psychologie, pedagogiek, geneeskunde, enz. duidelijk.

Het doel van de variantieanalyse is om de significantie van het verschil tussen de gemiddelden te testen door de varianties te vergelijken. De variantie van het gemeten attribuut wordt ontleed in onafhankelijke termen, die elk de invloed van een bepaalde factor of hun interactie karakteriseren. De daaropvolgende vergelijking van dergelijke termen stelt ons in staat om de significantie van elke onderzochte factor te evalueren, evenals hun combinatie /1/.

Als de nulhypothese waar is (over de gelijkheid van gemiddelden in verschillende groepen observaties geselecteerd uit de algemene populatie), moet de schatting van de variantie die samenhangt met de intragroepsvariabiliteit dicht bij de schatting van de intergroepsvariantie liggen.

Bij het uitvoeren van marktonderzoek rijst vaak de vraag naar vergelijkbaarheid van resultaten. Door bijvoorbeeld enquêtes te houden over het verbruik van een product in verschillende regio's landen, is het noodzakelijk om conclusies te trekken over in hoeverre de onderzoeksgegevens van elkaar verschillen of niet van elkaar verschillen. vergelijken individuele indicatoren heeft geen zin en daarom wordt de procedure voor vergelijking en daaropvolgende evaluatie uitgevoerd volgens enkele gemiddelde waarden en afwijkingen van deze gemiddelde schatting. De variatie van de eigenschap wordt bestudeerd. Variantie kan worden genomen als een maat voor variatie. Dispersie σ 2 is een maat voor variatie, gedefinieerd als het gemiddelde van de afwijkingen van een kenmerk in het kwadraat.

In de praktijk doen zich vaak problemen voor algemeen- taken om de significantie van verschillen in de gemiddelden van steekproeven van verschillende populaties te controleren. Het is bijvoorbeeld nodig om het effect van verschillende grondstoffen op de kwaliteit van producten te evalueren, om het probleem van het effect van de hoeveelheid meststoffen op de opbrengst van landbouwproducten op te lossen.

Soms wordt variantieanalyse gebruikt om de homogeniteit van verschillende populaties vast te stellen (de varianties van deze populaties zijn hetzelfde door aannames; als uit de variantieanalyse blijkt dat de wiskundige verwachtingen hetzelfde zijn, dan zijn de populaties in die zin homogeen). Homogene aggregaten kunnen worden gecombineerd tot één en daardoor meer informatie erover krijgen. volledige informatie, dus betrouwbaardere conclusies /2/.

1 variantieanalyse

1.1 Basisconcepten van variantieanalyse

Tijdens het observeren van het bestudeerde object veranderen de kwalitatieve factoren willekeurig of op een vooraf bepaalde manier. De specifieke implementatie van een factor (bijvoorbeeld een bepaald temperatuurregime, geselecteerde apparatuur of materiaal) wordt het factorniveau of verwerkingsmethode genoemd. Een ANOVA-model met vaste niveaus van factoren wordt model I genoemd, een model met willekeurige factoren wordt model II genoemd. Door de factor te variëren, kan men het effect ervan op de grootte van de respons onderzoeken. Momenteel algemene theorie variantieanalyse ontwikkeld voor modellen I.

Afhankelijk van het aantal factoren dat bepalend is voor de variatie van het resulterende kenmerk, wordt de variantieanalyse onderverdeeld in één-factor en multi-factor.

De belangrijkste schema's voor het organiseren van initiële gegevens met twee of meer factoren zijn:

Kruisclassificatie, kenmerkend voor modellen I, waarbij elk niveau van een factor wordt gecombineerd met elke gradatie van een andere factor bij het plannen van een experiment;

Hiërarchische (geneste) classificatie, kenmerkend voor model II, waarbij elke willekeurig gekozen waarde van één factor overeenkomt met zijn eigen subset van waarden van de tweede factor.

Als de afhankelijkheid van de respons van kwalitatieve en kwantitatieve factoren tegelijkertijd wordt onderzocht, d.w.z. factoren van gemengde aard, dan wordt covariantieanalyse gebruikt /3/.

Deze modellen verschillen dus van elkaar in de manier waarop ze de niveaus van de factor kiezen, wat uiteraard in de eerste plaats van invloed is op de mogelijkheid om de verkregen experimentele resultaten te generaliseren. Voor de variantieanalyse van experimenten met één factor is het verschil tussen deze twee modellen niet zo significant, maar bij multivariate variantieanalyse kan het erg belangrijk zijn.

Bij het uitvoeren van een variantieanalyse moet aan de volgende statistische aannames worden voldaan: ongeacht het niveau van de factor hebben de responswaarden een normale (Gaussiaanse) verdelingswet en dezelfde variantie. Deze gelijkheid van dispersies wordt homogeniteit genoemd. Het wijzigen van de verwerkingsmethode heeft dus alleen invloed op de positie van de willekeurige responsvariabele, die wordt gekenmerkt door de gemiddelde waarde of mediaan. Daarom behoren alle responsobservaties tot de verschuivingsfamilie van normale verdelingen.

Er wordt gezegd dat de ANOVA-techniek "robuust" is. Deze term, gebruikt door statistici, betekent dat deze veronderstellingen tot op zekere hoogte kunnen worden geschonden, maar desondanks kan de techniek worden gebruikt.

Wanneer de wet van distributie van responswaarden onbekend is, worden niet-parametrische (meestal rangorde) analysemethoden gebruikt.

De variantieanalyse is gebaseerd op de verdeling van de variantie in delen of componenten. De variatie als gevolg van de invloed van de factor die aan de groepering ten grondslag ligt, wordt gekenmerkt door de intergroepsspreiding σ 2 . Het is een maat voor de variatie van partiële gemiddelden voor groepen rond het gemeenschappelijk gemiddelde en wordt bepaald door de formule:

,

waarbij k het aantal groepen is;

n j is het aantal eenheden in de j-de groep;

Particulier gemiddelde voor de j-de groep;

Het totale gemiddelde over de populatie van eenheden.

De variatie als gevolg van de invloed van andere factoren wordt in elke groep gekenmerkt door de intragroepsspreiding σ j 2 .

.

Tussen totale variantieσ 0 2 , intragroepsvariantie σ 2 en intergroepsvariantie er is een relatie:

σ 0 2 = + σ 2 .

De intragroepsvariantie verklaart de invloed van factoren waarmee geen rekening wordt gehouden bij het groeperen, en de intergroepsvariantie verklaart de invloed van groeperingsfactoren op het groepsgemiddelde /2/.

1.2 Eenrichtingsanalyse van variantie

Het eenfactordispersiemodel heeft de vorm:

x ij = μ + F j + ε ij , (1)

waarbij x ij de waarde is van de variabele die wordt bestudeerd, verkregen op i-de niveau factor (i=1,2,...,m) met j-th serienummer(j=1,2,...,n);

Fi is het effect als gevolg van de invloed van het i-de niveau van de factor;

ij – willekeurige component, of verstoring veroorzaakt door de invloed van oncontroleerbare factoren, d.w.z. variatie binnen één niveau.

Basisvoorwaarden voor variantieanalyse:

De wiskundige verwachting van de verstoring ε ij is gelijk aan nul voor elke i, d.w.z.

M(εij) = 0; (2)

Storingen ε ij zijn onderling onafhankelijk;

De variantie van de variabele x ij (of verstoring ε ij) is constant voor

elke i, j, d.w.z.

D(ε ij) = σ 2 ; (3)

De variabele x ij (of verstoring ε ij) heeft normaal recht

verdelingen N(0;σ 2).

De invloed van factorniveaus kan vast of systematisch (model I) of willekeurig (model II) zijn.

Laat het bijvoorbeeld nodig zijn om na te gaan of er significante verschillen zijn tussen partijen producten in termen van een kwaliteitsindicator, d.w.z. controleer de impact op de kwaliteit van één factor - een batch producten. Als alle partijen grondstoffen in het onderzoek worden betrokken, dan is de invloed van het niveau van een dergelijke factor systematisch (model I) en zijn de bevindingen alleen van toepassing op die individuele partijen die bij het onderzoek zijn betrokken. Als we slechts een willekeurig gekozen deel van de partijen meenemen, is de invloed van de factor willekeurig (model II). In multifactorcomplexen is een gemengd model III mogelijk, waarbij sommige factoren willekeurige niveaus hebben, terwijl andere vast zijn.

Laat er m batches van producten zijn. Uit elke batch werden respectievelijk ni , n 2 , ..., n m producten geselecteerd (voor de eenvoud wordt aangenomen dat nl = n 2 =...=n m =n). De waarden van de kwaliteitsindicator van deze producten zijn weergegeven in de observatiematrix:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

………………… = (x ij), (i = 1,2, …, m; j = 1,2, …, n).

x m 1 x m 2 … x mn

Het is noodzakelijk om de betekenis van de invloed van partijen producten op hun kwaliteit te controleren.

Als we aannemen dat de rij-elementen van de waarnemingsmatrix numerieke waarden zijn willekeurige variabelenХ 1 ,Х 2 ,...,Х m , die de kwaliteit van producten uitdrukt en een normale verdelingswet heeft met wiskundige verwachtingen respectievelijk a 1 ,а 2 ,...,а m en identieke varianties σ 2 , dan gegeven taak wordt gereduceerd tot het controleren van de nulhypothese H 0: a 1 =a 2 =...= a m, uitgevoerd in de variantieanalyse.

Het gemiddelde over een bepaalde index wordt aangegeven met een asterisk (of een punt) in plaats van een index, dan gemiddeld kwaliteit producten i-th batch, of het groepsgemiddelde voor het i-de niveau van de factor, zal de vorm aannemen:

waarbij i * de gemiddelde waarde over de kolommen is;

Ij is een element van de waarnemingsmatrix;

n is de steekproefomvang.

En het algemene gemiddelde:

. (5)

De som van de gekwadrateerde afwijkingen van waarnemingen x ij van het totale gemiddelde ** ziet er als volgt uit:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

De laatste term is nul

omdat de som van de afwijkingen van de waarden van de variabele van het gemiddelde gelijk is aan nul, d.w.z.

2 =0.

De eerste term kan worden geschreven als:

Het resultaat is een identiteit:

Q = Q1 + Q2 , (8)

waar - totale of totale som van gekwadrateerde afwijkingen;

- de som van de gekwadrateerde afwijkingen van de groepsgemiddelden van het totale gemiddelde, of de intergroeps(factoriële) som van de gekwadrateerde afwijkingen;

- som van gekwadrateerde afwijkingen van waarnemingen van groepsgemiddelden, of intragroep (resterende) som van gekwadrateerde afwijkingen.

De uitbreiding (8) bevat het hoofdidee van de variantieanalyse. Met betrekking tot het beschouwde probleem toont gelijkheid (8) aan dat de algehele variatie van de kwaliteitsindicator, gemeten door de som Q, uit twee componenten bestaat - Q 1 en Q 2, die de variabiliteit van deze indicator tussen batches karakteriseren (Q 1 ) en variabiliteit binnen batches (Q 2), kenmerkend voor dezelfde variatie voor alle batches onder invloed van niet-verklaarde factoren.

Bij de variantieanalyse worden niet de sommen van de gekwadrateerde afwijkingen zelf geanalyseerd, maar de zogenaamde gemiddelde kwadraten, dit zijn zuivere schattingen van de overeenkomstige varianties, die worden verkregen door de som van de gekwadrateerde afwijkingen te delen door het overeenkomstige aantal graden van vrijheid.

Het aantal vrijheidsgraden wordt gedefinieerd als het totale aantal waarnemingen minus het aantal vergelijkingen dat daarmee verband houdt. Daarom wordt voor het gemiddelde kwadraat s 1 2 , dat een zuivere schatting is van de intergroepsvariantie, het aantal vrijheidsgraden k 1 = m-1, aangezien m groepsgemiddelden onderling verbonden door één vergelijking (5) in de berekening gebruikt. En voor het gemiddelde kwadraat s22, dat een zuivere schatting is van de intragroepvariantie, is het aantal vrijheidsgraden k2=mn-m, omdat het wordt berekend met behulp van alle mn waarnemingen die met elkaar zijn verbonden door m vergelijkingen (4).

Op deze manier:

Als we de wiskundige verwachtingen van de gemiddelde kwadraten en vinden, de uitdrukking xij (1) in hun formules vervangen door de modelparameters, krijgen we:

(9)

omdat rekening houdend met de eigenschappen van wiskundige verwachting

a

(10)

Voor model I met vaste niveaus van de factor Fi zijn i (i=1,2,...,m) niet-willekeurige waarden, dus

M(S) = 2 /(m-1) +σ 2 .

De hypothese H 0 heeft de vorm F i = F * (i = 1,2,...,m), d.w.z. de invloed van alle niveaus van de factor is hetzelfde. Als deze hypothese waar is

M(S)= M(S)= σ 2 .

Voor willekeurig model II term Fi in uitdrukking (1) is een willekeurige waarde. Aanduiden door variantie

we krijgen van (9)

(11)

en, zoals in model I

Tabel 1.1 presenteert algemene vorm berekening van waarden, met behulp van variantieanalyse.

Tabel 1.1 - Basistabel voor variantieanalyse

Variantiecomponenten

Som van de kwadraten

Aantal vrijheidsgraden

Medium vierkant

Gemiddelde vierkante verwachting

Intergroep

Intragroep

De hypothese H 0 zal de vorm aannemen σ F 2 =0. Als deze hypothese waar is

M(S)= M(S)= σ 2 .

In het geval van een eenfactorcomplex voor zowel model I als model II, zijn de gemiddelde kwadraten S 2 en S 2 zuivere en onafhankelijke schattingen van dezelfde variantie σ 2 .

Daarom werd het testen van de nulhypothese H 0 gereduceerd tot het testen van de significantie van het verschil tussen de onbevooroordeelde voorbeeldschattingen S- en S-dispersies σ 2 .

De hypothese H 0 wordt verworpen als de werkelijk berekende waarde van de statistiek F = S/S groter is dan de kritische F α: K 1: K 2 bepaald op het significantieniveau α met het aantal vrijheidsgraden k 1 =m- 1 en k 2 =mn-m, en geaccepteerd als F< F α: K 1: K 2 .

De Fisher F-verdeling (voor x > 0) heeft volgende functie dichtheid (voor = 1, 2, ...; = 1, 2, ...):

waar - vrijheidsgraden;

G - gamma-functie.

Met betrekking tot dit probleem betekent de weerlegging van de hypothese H 0 de aanwezigheid van significante verschillen in de kwaliteit van producten van verschillende batches op het niveau van significantie dat wordt overwogen.

Om de kwadratensom Q 1 , Q 2 , Q te berekenen is het vaak handig om de volgende formules te gebruiken:

(12)

(13)

(14)

die. het is over het algemeen niet nodig om de gemiddelden zelf te vinden.

De procedure voor eenrichtingsanalyse van variantie bestaat dus uit het testen van de hypothese H 0 dat er één groep homogene experimentele gegevens is tegen het alternatief dat er meer dan één dergelijke groep is. Homogeniteit verwijst naar de gelijkheid van gemiddelden en varianties in een subset van de gegevens. In dit geval kunnen de varianties vooraf zowel bekend als onbekend zijn. Als er reden is om aan te nemen dat de bekende of onbekende variantie van metingen hetzelfde is in de hele dataset, dan wordt de taak van eenrichtingsanalyse van variantie beperkt tot het bestuderen van de significantie van het verschil in de gemiddelden in de datagroepen / 1/.

1.3 Multivariate spreiding analyse

Er moet onmiddellijk worden opgemerkt dat er geen fundamenteel verschil is tussen multivariate en single-factor variantieanalyse. Multivariate analyse verandert niet gemeenschappelijke logica variantieanalyse, maar bemoeilijkt het alleen enigszins, omdat het, naast het in aanmerking nemen van de invloed op de afhankelijke variabele van elk van de factoren afzonderlijk, noodzakelijk is om hun gezamenlijke actie. Het nieuwe dat multivariate variantieanalyse met zich meebrengt voor data-analyse, betreft dus voornamelijk het vermogen om interfactoriële interactie te beoordelen. Het is echter nog steeds mogelijk om de invloed van elke factor afzonderlijk te evalueren. In die zin is de procedure van multivariate variantieanalyse (in de variant van het computergebruik) ongetwijfeld zuiniger, omdat het in slechts één run twee problemen tegelijk oplost: de invloed van elk van de factoren en hun interactie worden geschat / 3/.

Algemeen schema tweefactorexperiment, waarvan de gegevens worden verwerkt door variantieanalyse, heeft de vorm:



Figuur 1.1 - Schema van een twee-factorenexperiment

Gegevens die aan multivariate variantieanalyse worden onderworpen, worden vaak gelabeld op basis van het aantal factoren en hun niveaus.

Ervan uitgaande dat in het beschouwde probleem van de kwaliteit van verschillende m-batches, producten werden vervaardigd op verschillende t-machines en dat het nodig is om uit te zoeken of er significante verschillen zijn in de kwaliteit van producten voor elke factor:

A - een partij producten;

B-automaat.

Het resultaat is een overgang naar het probleem van de variantieanalyse met twee factoren.

Alle gegevens zijn weergegeven in tabel 1.2, waarin de rijen - niveaus Ai van factor A, de kolommen - niveaus Bj van factor B, en in de overeenkomstige cellen van de tabel de waarden van de productkwaliteitsindicator x ijk zijn (i = 1,2, ... ,m; j=1,2,...,l; k=1,2,...,n).

Tabel 1.2 - Indicatoren voor productkwaliteit

x 11l ,…,x 11k

x 12l ,…,x 12k

x 1jl ,…,x 1jk

x 1ll ,…,x 1lk

x 2 1l ,…,x 2 1k

x 22l ,…,x 22k

x 2jl ,…,x 2jk

x 2ll ,…,x 2lk

x i1l ,…,x i1k

x i2l ,…,x i2k

xijl ,…,xijk

xjll ,…,xjlk

x m1l ,…,x m1k

x m2l ,…,x m2k

xmjl ,…,xmjk

x mll ,…,x mlk

Het tweefactordispersiemodel heeft de vorm:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

waarbij x ijk de waarde is van de waarneming in cel ij met nummer k;

μ - algemeen gemiddelde;

Fi - effect als gevolg van de invloed van het i-de niveau van factor A;

Gj - effect als gevolg van de invloed van het j-de niveau van factor B;

I ij - effect als gevolg van de interactie van twee factoren, d.w.z. afwijking van het gemiddelde voor waarnemingen in cel ij van de som van de eerste drie termen in model (15);

ijk ijk - verstoring als gevolg van de variatie van de variabele binnen een enkele cel.

Er wordt aangenomen dat ε ijk een normale verdeling N(0; с 2) heeft, en dat alle wiskundige verwachtingen F * , G * , I i * , I * j gelijk zijn aan nul.

Groepsgemiddelden worden gevonden door de formules:

In cel:

per regel:

per kolom:

algemeen gemiddelde:

Tabel 1.3 geeft een algemeen beeld van de berekening van waarden met behulp van variantieanalyse.

Tabel 1.3 - Basistabel voor variantieanalyse

Variantiecomponenten

Som van de kwadraten

Aantal vrijheidsgraden

Middelste vierkanten

Intergroep (factor A)

Intergroep (factor B)

Interactie

residu

Het controleren van de nulhypothesen HA, HB, HAB over de afwezigheid van invloed op de beschouwde variabele van factoren A, B en hun interactie AB wordt uitgevoerd door de verhoudingen , , (voor model I met vaste niveaus van factoren) of relaties , , te vergelijken (voor een willekeurig model II) met de bijbehorende tabelwaarden F - Fisher-Snedecor-criterium. Voor het gemengde model III wordt de hypothesetoetsing voor factoren met vaste niveaus op dezelfde manier uitgevoerd als in model II, en voor factoren met willekeurige niveaus, zoals in model I.

Als n=1, d.w.z. met één waarneming in de cel, dan kunnen niet alle nulhypothesen worden getest, aangezien de Q3-component buiten de totale som van gekwadrateerde afwijkingen valt, en daarmee het gemiddelde kwadraat, aangezien er in dit geval geen sprake kan zijn van interactie van factoren.

Vanuit het oogpunt van computationele techniek is het handiger om de formules te gebruiken om de kwadratensom Q 1, Q 2, Q 3, Q 4, Q te vinden:

Q 3 \u003d Q - Q 1 - Q 2 - Q 4.

Afwijking van de basisvoorwaarden van de variantieanalyse - de normaliteit van de verdeling van de onderzochte variabele en de gelijkheid van varianties in de cellen (als deze niet overdreven is) - heeft geen significante invloed op de resultaten van de variantieanalyse met een gelijk aantal waarnemingen in de cellen, maar kan zeer gevoelig zijn als hun aantal ongelijk is. Bovendien neemt met een ongelijk aantal waarnemingen in de cellen de complexiteit van het apparaat voor variantieanalyse sterk toe. Daarom wordt aanbevolen om een ​​schema te plannen met: gelijk aantal waarnemingen in de cellen, en als er gegevens ontbreken, compenseer deze dan met de gemiddelde waarden van andere waarnemingen in de cellen. In dit geval mag bij de berekening van het aantal vrijheidsgraden /1/ echter geen rekening worden gehouden met kunstmatig ingevoerde ontbrekende gegevens.

2 Toepassing van ANOVA in verschillende processen en onderzoek

2.1 Variantieanalyse gebruiken in de studie van migratieprocessen

Migratie is complex sociaal fenomeen die grotendeels de economische en politieke aspecten van de samenleving bepaalt. De studie van migratieprocessen houdt verband met de identificatie van factoren die van belang zijn, tevredenheid met de werkomstandigheden en een beoordeling van de invloed van de verkregen factoren op de intergroepsbeweging van de bevolking.

λ ij = c ik q ij een j ,

waarbij λ ij de intensiteit is van overgangen van de oorspronkelijke groep i (uitvoer) naar de nieuwe groep j (invoer);

c i – mogelijkheid en vermogen om groep i te verlaten (c i ≥0);

q ij – aantrekkelijkheid nieuwe groep vergeleken met het origineel (0≤q ij ≤1);

a j – beschikbaarheid van groep j (a j ≥0).

ν ij ≈ n ik λ ij =n ik c ik q ij een j . (16)

in de praktijk voor individueel persoon de kans p om naar een andere groep te gaan is klein, en het aantal n van de beschouwde groep is groot. In dit geval is de wet zeldzame gebeurtenissen, dat wil zeggen, de limiet ν ij is de Poisson-verdeling met de parameter μ=np:

.

Naarmate μ toeneemt, nadert de verdeling normaal. De getransformeerde waarde √νij kan als normaal verdeeld worden beschouwd.

Als we de logaritme van uitdrukking (16) nemen en de nodige veranderingen in variabelen aanbrengen, kunnen we een variantieanalysemodel verkrijgen:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij ,

X i,j =2ln√ν ij -lnn ik -lnq ij ,

Xi,j =Ci +Aj +ε.

De waarden van C i en A j maken het mogelijk om een ​​bidirectioneel ANOVA-model te verkrijgen met één waarneming per cel. omgekeerde transformatie coëfficiënten ci en aj worden berekend uit Ci en Aj.

Bij het uitvoeren van een variantieanalyse moeten de volgende waarden worden genomen als de waarden van het effectieve kenmerk Y:

X \u003d (X 1.1 + X 1.2 +: + X mi, mj) / mimj,

waarbij mimj de schatting is van de wiskundige verwachting X i,j ;

X mi en X mj - respectievelijk het aantal uitgangs- en ingangsgroepen.

Factor I-niveaus zullen mi exit-groepen zijn, factor J-niveaus zullen mj entry-groepen zijn. Mi=mj=m wordt aangenomen. Het probleem is om de hypothesen H I en H J over de gelijkheden te testen wiskundige verwachtingen Y-waarden op niveaus I i en op niveaus J j , i,j=1,…,m. Hypothesetesten H I is gebaseerd op het vergelijken van de waarden van onbevooroordeelde schattingen van de variantie s I 2 en s o 2 . Als de hypothese H I juist is, dan heeft de waarde F (I) = s I 2 /s o 2 een Fisher-verdeling met het aantal vrijheidsgraden k 1 =m-1 en k 2 =(m-1)(m- 1). Voor een gegeven significantieniveau α, de rechterhand kritisch punt x pr,α cr. Als een numerieke waarde F (I) het aantal waarden valt in het interval (x pr, α kr, +∞), dan wordt de hypothese H I verworpen en wordt aangenomen dat de factor I het effectieve kenmerk beïnvloedt. De mate van deze invloed volgens de resultaten van waarnemingen wordt gemeten bemonsteringsfrequentie: bepaling, die laat zien welk deel van de variantie van het effectieve kenmerk in de steekproef te wijten is aan de invloed van factor I erop. Als F (I) een getal is

2.2 Principes van wiskundige en statistische analyse van biomedische onderzoeksgegevens

Afhankelijk van de taak, het volume en de aard van het materiaal, het type gegevens en hun relaties, is er een keuze uit methoden voor wiskundige verwerking in de stadia van zowel voorlopige (om de aard van de verdeling in de onderzoekssteekproef te beoordelen) als eindanalyse in overeenstemming met de doelstellingen van het onderzoek. Een uiterst belangrijk aspect is de verificatie van de homogeniteit van de geselecteerde observatiegroepen, inclusief controlegroepen, die kan worden uitgevoerd door een deskundige of door multivariate statistische methoden (bijvoorbeeld met behulp van clusteranalyse). Maar de eerste stap is het samenstellen van een vragenlijst die voorziet in een gestandaardiseerde beschrijving van de kenmerken. Vooral bij het uitvoeren van epidemiologische onderzoeken, waar eenheid nodig is bij het begrijpen en beschrijven van dezelfde symptomen door verschillende artsen, inclusief rekening houdend met het bereik van hun veranderingen (ernst). Als er significante verschillen zijn in de registratie van de initiële gegevens (subjectieve beoordeling van de aard van pathologische manifestaties door verschillende specialisten) en de onmogelijkheid om ze in een enkele vorm te brengen in het stadium van het verzamelen van informatie, dan kan de zogenaamde covariante correctie worden uitgevoerd, waarbij variabelen worden genormaliseerd, d.w.z. eliminatie van afwijkingen van indicatoren in de datamatrix. "Coördinatie van meningen" wordt uitgevoerd rekening houdend met de specialiteit en ervaring van artsen, wat het vervolgens mogelijk maakt om de resultaten van het door hen verkregen onderzoek met elkaar te vergelijken. Hiervoor kunnen multivariate variantie- en regressieanalyses worden gebruikt.

Tekens kunnen van hetzelfde type zijn, wat zeldzaam is, of van verschillende typen. Deze term verwijst naar hun verschillende metrologische evaluatie. Kwantitatieve of numerieke tekens zijn die gemeten op een bepaalde schaal en op schalen van intervallen en verhoudingen (I-groep van tekens). Kwalitatief, rangschikken of scoren worden gebruikt om medische termen en concepten uit te drukken die geen numerieke waarden hebben (bijvoorbeeld de ernst van de aandoening) en worden gemeten op een bestelschaal (groep II van tekens). Classificatie of nominaal (bijvoorbeeld beroep, bloedgroep) - deze worden gemeten in de schaal van namen (groep III van tekens).

In veel gevallen wordt geprobeerd een extreem groot aantal kenmerken te analyseren, wat zou moeten helpen om de informatie-inhoud van het gepresenteerde monster te vergroten. De keuze van nuttige informatie, dat wil zeggen de selectie van kenmerken, is echter een absoluut noodzakelijke operatie, aangezien om een ​​classificatieprobleem op te lossen, informatie moet worden geselecteerd die informatie bevat die nuttig is voor deze taak. Indien dit om de een of andere reden niet door de onderzoeker alleen wordt uitgevoerd of er om zinvolle redenen geen voldoende onderbouwde criteria zijn om de dimensie van de kenmerkruimte te verkleinen, wordt de strijd tegen informatieredundantie al door formele methoden gevoerd door het beoordelen van de informatie-inhoud.

Variantieanalyse stelt u in staat om de invloed van verschillende factoren (omstandigheden) op het onderzochte kenmerk (fenomeen) te bepalen, wat wordt bereikt door de totale variabiliteit (dispersie uitgedrukt als de som van gekwadrateerde afwijkingen van het algemeen gemiddelde) te ontleden in afzonderlijke componenten veroorzaakt door de invloed van verschillende bronnen van variabiliteit.

Met behulp van variantieanalyse worden de dreigingen van de ziekte onderzocht in aanwezigheid van risicofactoren. Het concept van relatief risico houdt rekening met de relatie tussen patiënten met een bepaalde ziekte en die zonder. De relatieve risicowaarde maakt het mogelijk om te bepalen hoe vaak de kans om ziek te worden toeneemt in zijn aanwezigheid, wat kan worden geschat met behulp van de volgende vereenvoudigde formule:

waarbij a de aanwezigheid van een eigenschap in de onderzoeksgroep is;

b - het ontbreken van een eigenschap in de onderzoeksgroep;

c - de aanwezigheid van een teken in de vergelijkingsgroep (controle);

d - afwezigheid van een teken in de vergelijkingsgroep (controle).

De attribuutrisicoscore (rA) wordt gebruikt om de proportie van de morbiditeit te beoordelen die verband houdt met een bepaalde risicofactor:

,

waarbij Q de frequentie is van de risicomarkerende eigenschap in de populatie;

r" - relatief risico.

Identificatie van factoren die bijdragen aan het optreden (manifestatie) van de ziekte, d.w.z. risicofactoren kunnen op verschillende manieren worden uitgevoerd, bijvoorbeeld door de informatie-inhoud te beoordelen met daaropvolgende rangschikking van tekens, die echter niet het cumulatieve effect van de geselecteerde parameters aangeeft, in tegenstelling tot het gebruik van regressie, factoranalyses, methoden van patroonherkenningstheorie, die het mogelijk maken om "symptomatische complexen" van risicofactoren te verkrijgen. Bovendien maken meer geavanceerde methoden het mogelijk om indirecte relaties tussen risicofactoren en ziekten /5/ te analyseren.

2.3 Bodembioassay

Diverse verontreinigende stoffen die in de agrocenose terechtkomen, kunnen er verschillende transformaties in ondergaan, terwijl ze hun toxische effect vergroten. Daarom bleken methoden voor de integrale beoordeling van de kwaliteit van agrocenosecomponenten noodzakelijk. De onderzoeken zijn uitgevoerd op basis van een multivariate variantieanalyse in een 11-velds graan-gras-gerijde vruchtwisseling. In het experiment is gekeken naar de invloed van de volgende factoren: bodemvruchtbaarheid (A), bemestingssysteem (B), gewasbeschermingssysteem (C). Bodemvruchtbaarheid, bemestingssysteem en gewasbeschermingssysteem werden bestudeerd bij doseringen van 0, 1, 2 en 3. De basisopties werden weergegeven door de volgende combinaties:

000 - het aanvankelijke niveau van vruchtbaarheid, zonder het gebruik van meststoffen en gewasbeschermingsmiddelen tegen plagen, ziekten en onkruid;

111 - het gemiddelde niveau van bodemvruchtbaarheid, de minimale dosis kunstmest, de biologische bescherming van planten tegen plagen en ziekten;

222 - het initiële niveau van bodemvruchtbaarheid, de gemiddelde dosis meststoffen, chemische bescherming van planten tegen onkruid;

333 - een hoge mate van bodemvruchtbaarheid, een hoge dosis meststoffen, chemische bescherming van planten tegen plagen en ziekten.

We hebben opties bestudeerd waarbij slechts één factor aanwezig is:

200 - vruchtbaarheid:

020 - meststoffen;

002 - gewasbeschermingsmiddelen.

Evenals opties met een andere combinatie van factoren - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Het doel van de studie was om de remming van chloroplasten en de coëfficiënt van instantane groei, als indicatoren van bodemverontreiniging, te bestuderen in verschillende varianten van een multifactorieel experiment.

De remming van fototaxis van chloroplasten van eendenkroos werd bestudeerd in verschillende bodemhorizonten: 0-20, 20-40 cm. Het aandeel in de totale verspreiding van bodemvruchtbaarheid was 39,7%, bemestingssystemen - 30,7%, gewasbeschermingssystemen - 30,7%.

Om het gecombineerde effect van factoren op de remming van chloroplast-fototaxis te bestuderen, werden verschillende combinaties van experimentele varianten gebruikt: in het eerste geval - 000, 002, 022, 222, 220, 200, 202, 020, in het tweede geval - 111, 333, 331, 313, 133, 311, 131.

De resultaten van de tweezijdige variantieanalyse wijzen op een significant effect van de interactie tussen mest- en gewasbeschermingssystemen op de verschillen in fototaxis voor het eerste geval (het aandeel in de totale variantie was 10,3%). Voor het tweede geval werd een significante invloed van het interagerende bodemvruchtbaarheids- en bemestingssysteem (53,2%) gevonden.

Drieweganalyse van variantie toonde in het eerste geval een significante invloed van de interactie van alle drie de factoren. Het aandeel in de totale spreiding was 47,9%.

De instantane groeicoëfficiënt werd bestudeerd in verschillende varianten van het experiment 000, 111, 222, 333, 002, 200, 220. De eerste testfase was vóór de toepassing van herbiciden op wintertarwegewassen (april), de tweede fase was na de toepassing van herbiciden (mei) en de laatste was op oogsttijd (juli). Voorlopers - zonnebloem en maïs voor graan.

Het verschijnen van nieuwe bladeren werd waargenomen na een korte lag-fase met een periode van totale verdubbeling van het natte gewicht van 2-4 dagen.

In de controle en in elke variant werd op basis van de verkregen resultaten de coëfficiënt van onmiddellijke populatiegroei r berekend, en vervolgens werd het tijdstip van verdubbeling van het aantal bladeren (t-verdubbeling) berekend.

t verdubbelt \u003d ln2 / r.

De berekening van deze indicatoren gebeurde in dynamica met de analyse van bodemmonsters. Uit analyse van de gegevens bleek dat de verdubbelingstijd van de eendenkroospopulatie voor de grondbewerking het kortst was in vergelijking met de gegevens na de grondbewerking en ten tijde van de oogst. In de dynamiek van waarnemingen is de reactie van de bodem na toepassing van het herbicide en op het moment van oogsten van groter belang. Allereerst de interactie met meststoffen en het vruchtbaarheidsniveau.

Soms kan het krijgen van een directe reactie op de toepassing van chemische preparaten bemoeilijkt worden door de interactie van het preparaat met meststoffen, zowel organische als minerale. De verkregen gegevens maakten het mogelijk om de dynamiek van de respons van de toegepaste preparaten te traceren, in alle varianten met chemische beschermingsmiddelen, waar sprake is van een opschorting van de groei van de indicator.

De gegevens van eenrichtingsvariantieanalyse toonden een significant effect van elke indicator op de groeisnelheid van eendenkroos in de eerste fase. In de tweede fase was het effect van verschillen in bodemvruchtbaarheid 65,0%, in het bemestingssysteem en het gewasbeschermingssysteem elk 65,0%. De factoren lieten significante verschillen zien tussen de variant 222 en de varianten 000, 111, 333, gemiddeld wat betreft de momentane groeicoëfficiënt. In de derde fase was het aandeel in de totale spreiding van de bodemvruchtbaarheid 42,9%, bemestingssystemen en gewasbeschermingsmiddelen systemen - elk 42,9%. Een significant verschil werd opgemerkt in de gemiddelde waarden van opties 000 en 111, opties 333 en 222.

De onderzochte bodemmonsters uit de veldmonitoringopties verschillen van elkaar op het gebied van fototaxis-remming. De invloed van vruchtbaarheidsfactoren werd genoteerd, het bemestingssysteem en gewasbeschermingsmiddelen met aandelen van 30,7 en 39,7% in een enkelvoudige factoranalyse, in tweefactor- en driefactoranalyse werd de gezamenlijke invloed van factoren geregistreerd.

Een analyse van de experimentele resultaten toonde onbeduidende verschillen tussen de bodemhorizons in termen van de fototaxis-remmingsindicator. Verschillen worden gemarkeerd door gemiddelde waarden.

In alle varianten met gewasbeschermingsmiddelen worden veranderingen in de positie van bladgroenkorrels en groeistop van eendenkroos minder waargenomen /6/.

2.4 Influenza veroorzaakt verhoogde productie van histamine

Onderzoekers van het Children's Hospital in Pittsburgh (VS) hebben het eerste bewijs ontvangen dat histaminespiegels toenemen bij acute respiratoire virale infecties. Ondanks het feit dat eerder is gesuggereerd dat histamine een rol speelt bij het ontstaan ​​van symptomen van acute luchtweginfecties van de bovenste luchtwegen.

Wetenschappers waren geïnteresseerd in waarom veel mensen antihistaminica gebruiken, die in veel landen zijn opgenomen in de OTC-categorie, voor zelfbehandeling van "verkoudheid" en verkoudheid. zonder doktersrecept verkrijgbaar.

Het doel van deze studie was om te bepalen of de histamineproductie verhoogd is tijdens een experimentele infectie met het influenza A-virus.

15 gezonde vrijwilligers werden intranasaal geïnjecteerd met het influenza A-virus en vervolgens geobserveerd op de ontwikkeling van de infectie. Tijdens het ziekteverloop werd dagelijks de ochtendportie urine van vrijwilligers verzameld, waarna histamine en zijn metabolieten werden bepaald en de totale hoeveelheid histamine en zijn metabolieten die per dag werden uitgescheiden werd berekend.

De ziekte ontwikkelde zich bij alle 15 vrijwilligers. Variantieanalyse bevestigde een significant hoger histaminegehalte in de urine op dag 2-5 van virale infectie (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

De resultaten van deze studie leveren het eerste directe bewijs dat de histaminespiegels verhoogd zijn bij acute luchtweginfecties /7/.

Analyse van variantie in de chemie

Dispersieanalyse is een reeks methoden voor het bepalen van dispersie, d.w.z. kenmerken van deeltjesgroottes in dispersiesystemen. Dispersieanalyse omvat verschillende methoden voor het bepalen van de grootte van vrije deeltjes in vloeibare en gasvormige media, de grootte van poriekanalen in fijn poreuze lichamen (in dit geval wordt het equivalente concept van porositeit gebruikt in plaats van het concept van dispersie), evenals de specifieke oppervlakte. Sommige methoden van dispersieanalyse maken het mogelijk om een ​​volledig beeld te krijgen van de verdeling van deeltjes naar grootte (volume), terwijl andere slechts een gemiddelde eigenschap van dispersie (porositeit) geven.

De eerste groep omvat bijvoorbeeld methoden voor het bepalen van de grootte van individuele deeltjes door directe meting (zeefanalyse, optische en elektronenmicroscopie) of door indirecte gegevens: de bezinkingssnelheid van deeltjes in een stroperig medium (sedimentatieanalyse in een zwaartekrachtveld en in centrifuges), de grootte van elektrische stroompulsen die voortkomen uit de passage van deeltjes door een gat in een niet-geleidende scheidingswand (conductometrische methode).

De tweede groep methoden combineert de schatting van de gemiddelde grootte van vrije deeltjes en de bepaling van het specifieke oppervlak van poeders en poreuze lichamen. De gemiddelde deeltjesgrootte wordt gevonden door de intensiteit van verstrooid licht (nefelometrie), met behulp van een ultramicroscoop, diffusiemethoden, enz. Het specifieke oppervlak wordt gevonden door de adsorptie van gassen (dampen) of opgeloste stoffen, door gaspermeabiliteit, oplossnelheid, en andere methoden. Hieronder staan ​​de toepasbaarheidsgrenzen van verschillende variantieanalysemethoden (deeltjesgrootte in meters):

Zeefanalyse - 10 -2 -10 -4

Sedimentatieanalyse in een zwaartekrachtveld - 10 -4 -10 -6

Conductometrische methode - 10 -4 -10 -6

Microscopie - 10 -4 -10 -7

Filtratiemethode - 10 -5 -10 -7

Centrifugatie - 10 -6 -10 -8

Ultracentrifugatie - 10 -7 -10 -9

Ultramicroscopie - 10 -7 -10 -9

Nefelometrie - 10 -7 -10 -9

Elektronenmicroscopie - 10 -7 -10 -9

Diffusiemethode - 10 -7 -10 -10

Dispersie-analyse wordt veel gebruikt in verschillende wetenschapsgebieden en industriële productie om de dispersie van systemen (suspensies, emulsies, sols, poeders, adsorbentia, enz.) met deeltjesgroottes van enkele millimeters (10 -3 m) tot enkele nanometers (10 -9 m) /8/.

2.6 Het gebruik van directe opzettelijke suggestie in de waaktoestand bij de methode voor het onderwijzen van fysieke kwaliteiten

Lichamelijke training is de fundamentele kant van sporttraining, omdat het meer dan andere aspecten van training wordt gekenmerkt door fysieke belastingen die de morfologische en functionele eigenschappen van het lichaam beïnvloeden. Het succes van technische training, de inhoud van de tactiek van een atleet, de realisatie van persoonlijke eigenschappen in het proces van training en competitie hangen af ​​van het niveau van fysieke fitheid.

Een van de belangrijkste taken van fysieke training is het aanleren van fysieke kwaliteiten. In dit verband is er behoefte aan de ontwikkeling van pedagogische instrumenten en methoden waarmee rekening kan worden gehouden met de leeftijdskenmerken van jonge atleten die hun gezondheid behouden, geen extra tijd vergen en tegelijkertijd de groei van fysieke kwaliteiten stimuleren en, als een resultaat, sportiviteit. Het gebruik van verbale hetero-invloed in het trainingsproces in primaire trainingsgroepen is een van de veelbelovende onderzoeksgebieden op dit gebied.

Een analyse van de theorie en praktijk van de implementatie van inspirerende verbale hetero-invloed bracht de belangrijkste tegenstrijdigheden aan het licht:

Bewijs van het effectieve gebruik van specifieke methoden van verbale hetero-invloed in het trainingsproces en de praktische onmogelijkheid van het gebruik ervan door een coach;

Erkenning van directe opzettelijke suggestie (hierna DSP genoemd) in de waaktoestand als een van de belangrijkste methoden van verbale hetero-invloed in de pedagogische activiteit van een coach en het ontbreken van een theoretische rechtvaardiging voor de methodologische kenmerken van het gebruik ervan in sporttraining, en in het bijzonder in het proces van het opvoeden van fysieke kwaliteiten.

In verband met de geïdentificeerde tegenstrijdigheden en onvoldoende ontwikkeling, bepaalde het probleem van het gebruik van het systeem van methoden van verbale hetero-invloed in het proces van het onderwijzen van de fysieke kwaliteiten van atleten het doel van het onderzoek - om rationele gerichte methoden van PPV in de waaktoestand te ontwikkelen, bijdragen aan de verbetering van het proces van opvoeding van fysieke kwaliteiten op basis van de beoordeling van de mentale toestand, manifestatie en dynamiek van fysieke kwaliteiten judoisten van elementaire trainingsgroepen.

Om de effectiviteit van de experimentele methoden van PPV bij de ontwikkeling van de fysieke kwaliteiten van judoworstelaars te testen en te bepalen, werd een vergelijkend pedagogisch experiment uitgevoerd, waaraan vier groepen deelnamen - drie experimentele en één controle. In de eerste experimentele groep (EG) werd de PPV M1-techniek gebruikt, in de tweede - de PPV M2-techniek, in de derde - de PPV M3-techniek. In de controlegroep (CG) werden geen PPV-methoden gebruikt.

Om de effectiviteit van de pedagogische impact van de PPV-methoden in het proces van het onderwijzen van fysieke kwaliteiten bij judoka's te bepalen, werd een variantieanalyse met één factor uitgevoerd.

De mate van invloed van de PPV M1-methodiek in het onderwijsproces:

Uithoudingsvermogen:

a) na de derde maand was 11,1%;

Snelheidsmogelijkheden:

a) na de eerste maand - 16,4%;

b) na de tweede - 26,5%;

c) na de derde - 34,8%;

a) na de tweede maand - 26,7%;

b) na de derde - 35,3%;

Flexibiliteit:

a) na de derde maand - 20,8%;

a) na de tweede maand van het belangrijkste pedagogische experiment was de mate van invloed van de methodologie 6,4%;

b) na de derde - 10,2%.

Bijgevolg werden significante veranderingen in de indicatoren van het ontwikkelingsniveau van fysieke kwaliteiten met behulp van de PPV M1-methode gevonden in snelheid en kracht, de mate van invloed van de methode is in dit geval het grootst. De minste invloed van de methodiek werd gevonden in het proces van het aanleren van uithoudingsvermogen, flexibiliteit en coördinatievermogen, wat aanleiding geeft te spreken over de onvoldoende effectiviteit van het gebruik van de PPV M1-methode bij het aanleren van deze kwaliteiten.

De mate van invloed van de PPV M2-methodiek in het onderwijsproces:

Uithoudingsvermogen

a) na de eerste maand van het experiment - 12,6%;

b) na de tweede - 17,8%;

c) na de derde - 20,3%.

Snelheidsmogelijkheden:

a) na de derde maand van trainingssessies - 28%.

a) na de tweede maand - 27,9%;

b) na de derde - 35,9%.

Flexibiliteit:

a) na de derde maand van trainingssessies - 14,9%;

Coördinatievermogen - 13,1%.

Het verkregen resultaat van eenrichtings-ANOVA van deze EG stelt ons in staat te concluderen dat de PPV M2-methode het meest effectief is bij het ontwikkelen van uithoudingsvermogen en kracht. Het is minder effectief bij het ontwikkelen van flexibiliteit, snelheid en coördinatievermogen.

De mate van invloed van de PPV M3-methodiek in het onderwijsproces:

Uithoudingsvermogen:

a) na de eerste maand van het experiment 16,8%;

b) na de tweede - 29,5%;

c) na de derde - 37,6%.

Snelheidsmogelijkheden:

a) na de eerste maand - 26,3%;

b) na de tweede - 31,3%;

c) na de derde - 40,9%.

a) na de eerste maand - 18,7%;

b) na de tweede - 26,7%;

c) na de derde - 32,3%.

Flexibiliteit:

a) na de eerste - er zijn geen wijzigingen;

b) na de tweede - 16,9%;

c) na de derde - 23,5%.

Coördinatie capaciteiten:

a) er zijn geen wijzigingen na de eerste maand;

b) na de tweede - 23,8%;

c) na de derde - 91%.

Zo toonde een eenfactoranalyse van variantie aan dat het gebruik van de PPV M3-methode in de voorbereidende periode het meest effectief is in het proces van het opleiden van fysieke kwaliteiten, aangezien de mate van invloed ervan na elke maand van het pedagogisch experiment toeneemt /9/.

2.7 Verlichting van acute psychotische symptomen bij patiënten met schizofrenie met een atypisch antipsychoticum

Het doel van de studie was om de mogelijkheid te bestuderen om rispolept te gebruiken voor de verlichting van acute psychose bij patiënten met de diagnose schizofrenie (paranoïde type volgens ICD-10) en schizoaffectieve stoornis. Tegelijkertijd werd de indicator van de duur van de persistentie van psychotische symptomen bij farmacotherapie met rispolept (hoofdgroep) en klassieke antipsychotica als het belangrijkste onderzochte criterium gebruikt.

De belangrijkste doelstellingen van het onderzoek waren het bepalen van de indicator van de duur van de psychose (de zogenaamde netpsychose), die werd opgevat als het behoud van productieve psychotische symptomen vanaf het begin van het gebruik van antipsychotica, uitgedrukt in dagen. Deze indicator werd afzonderlijk berekend voor de risperidongroep en afzonderlijk voor de klassieke antipsychoticagroep.

Daarnaast werd de taak gesteld om de proportie van vermindering van productieve symptomen onder invloed van risperidon te bepalen in vergelijking met klassieke antipsychotica bij verschillende therapieperioden.

In totaal werden 89 patiënten (42 mannen en 47 vrouwen) met acute psychotische symptomen binnen de paranoïde vorm van schizofrenie (49 patiënten) en schizoaffectieve stoornis (40 patiënten) onderzocht.

De eerste episode en de ziekteduur tot 1 jaar werden geregistreerd bij 43 patiënten, terwijl in andere gevallen op het moment van de studie volgende episoden van schizofrenie werden opgemerkt met een ziekteduur van meer dan 1 jaar.

Rispoleptom-therapie werd door 29 mensen ontvangen, onder wie 15 patiënten met de zogenaamde eerste episode. Therapie met klassieke neuroleptica werd door 60 mensen ontvangen, van wie 28 mensen met de eerste episode. De dosis rispolept varieerde van 1 tot 6 mg per dag en was gemiddeld 4 ± 0,4 mg/dag. Risperidon werd uitsluitend oraal ingenomen na de maaltijd, eenmaal daags 's avonds.

Therapie met klassieke antipsychotica omvatte het gebruik van trifluoperazine (triftazine) in een dagelijkse dosis van maximaal 30 mg intramusculair, haloperidol in een dagelijkse dosis van maximaal 20 mg intramusculair, triperidol in een dagelijkse dosis van maximaal 10 mg oraal. De overgrote meerderheid van de patiënten nam de eerste twee weken klassieke antipsychotica als monotherapie, waarna ze, indien nodig, (met behoud van waanvoorstellingen, hallucinaties of andere productieve symptomen) overgingen op een combinatie van meerdere klassieke antipsychotica. Tegelijkertijd bleef een neurolepticum met een uitgesproken electief anti-waan- en anti-hallucinatorisch effect (bijvoorbeeld haloperidol of triftazin) als het belangrijkste medicijn, een medicijn met een duidelijk hypnosedatief effect (chloorpromazine, tizercine, chloorprothixeen in doses tot 50-100 mg/dag) werd er 's avonds aan toegevoegd.

In de groep die klassieke antipsychotica gebruikt, was het de bedoeling om anticholinerge correctoren (Parkopan, Cyclodol) in te nemen in doses tot 10-12 mg/dag. Correctors werden voorgeschreven in het geval van het optreden van duidelijke extrapiramidale bijwerkingen in de vorm van acute dystonie, geneesmiddelgeïnduceerd parkinsonisme en acathisie.

Tabel 2.1 geeft gegevens over de duur van psychose bij de behandeling van rispolept en klassieke antipsychotica.

Tabel 2.1 - Duur van psychose ("nettopsychose") bij de behandeling van rispolept en klassieke antipsychotica

Zoals uit de gegevens in de tabel blijkt, is er bij vergelijking van de duur van psychose tijdens therapie met klassieke antipsychotica en risperidon een bijna tweevoudige vermindering van de duur van psychotische symptomen onder invloed van rispolept. Het is veelbetekenend dat noch de factoren van het serienummer van de aanvallen, noch de aard van het beeld van het leidende syndroom deze waarde van de duur van de psychose beïnvloedden. Met andere woorden, de duur van een psychose werd uitsluitend bepaald door de therapiefactor, d.w.z. afhankelijk van het type medicijn dat werd gebruikt, ongeacht het serienummer van de aanval, de duur van de ziekte en de aard van het leidende psychopathologische syndroom.

Om de verkregen regelmatigheden te bevestigen, werd een variantieanalyse met twee factoren uitgevoerd. Tegelijkertijd werd achtereenvolgens rekening gehouden met de interactie van de therapiefactor en het serienummer van de aanval (stadium 1) en de interactie van de therapiefactor en de aard van het leidende syndroom (stadium 2). De resultaten van de variantieanalyse bevestigden de invloed van de therapiefactor op de duur van psychose (F=18,8) bij afwezigheid van de invloed van de factor aanvalsgetal (F=2,5) en de factor psychopathologisch syndroomtype (F=1,7). ). Van belang is dat ook de gezamenlijke invloed van de therapiefactor en het aantal aanvallen op de duur van de psychose afwezig was, evenals de gezamenlijke invloed van de therapiefactor en de psychopathologische syndroomfactor.

De resultaten van de variantieanalyse bevestigden dus de invloed van alleen de factor van het toegepaste antipsychoticum. Rispolept leidde ondubbelzinnig tot een vermindering van de duur van psychotische symptomen in vergelijking met traditionele antipsychotica met ongeveer 2 keer. Het is belangrijk dat dit effect werd bereikt ondanks de orale toediening van rispolept, terwijl klassieke antipsychotica bij de meeste patiënten parenteraal werden gebruikt.

2.8 Kromtrekken van fantasiegaren met roving-effect

De Kostroma State Technological University heeft een nieuw gevormde draadstructuur ontwikkeld met variabele geometrische parameters. In dit opzicht is er een probleem bij het verwerken van fantasiegaren in de voorbereidende productie. Deze studie was gewijd aan het proces van kromtrekken op de volgende punten: de keuze van het type spanner, dat de minimale spreiding van de spanning en de uitlijning van de spanning geeft, draden met verschillende lineaire dichtheden langs de breedte van de kromtrekkende as.

Het onderzoeksobject is een linnenvormige draad van vier varianten van lineaire dichtheid van 140 tot 205 tex. Het werk van spaninrichtingen van drie typen werd bestudeerd: porseleinen ring, NS-1P met twee zones en NS-1P met één zone. Een experimenteel onderzoek naar de spanning van kettingdraden werd uitgevoerd op een kettingmachine SP-140-3L. De kromtreksnelheid, het gewicht van de remschijven kwamen overeen met de technologische parameters van het kromtrekken van het garen.

Om de afhankelijkheid van de spanning van de gevormde draad van de geometrische parameters tijdens het kromtrekken te bestuderen, werd een analyse uitgevoerd voor twee factoren: X 1 - de diameter van het effect, X 2 - de lengte van het effect. De uitgangsparameters zijn spanning Y 1 en spanningsfluctuatie Y 2 .

De resulterende regressievergelijkingen zijn geschikt voor de experimentele gegevens met een significantieniveau van 0,95, aangezien het berekende Fisher-criterium voor alle vergelijkingen kleiner is dan het tabellarische criterium.

Om de mate van invloed van de factoren X 1 en X 2 op de parameters Y 1 en Y 2 te bepalen, is een variantieanalyse uitgevoerd, waaruit bleek dat de diameter van het effect een grotere invloed heeft op de hoogte en fluctuatie van spanning .

Een vergelijkende analyse van de verkregen tensogrammen toonde aan dat de minimale spanningsspreiding tijdens het kromtrekken van dit garen wordt geleverd door een twee-zone spanningsapparaat NS-1P.

Er is vastgesteld dat met een toename van de lineaire dichtheid van 105 naar 205 tex, het NS-1P-apparaat een verhoging van het spanningsniveau met slechts 23% geeft, terwijl de porseleinen ring - met 37%, enkelzone NS-1P - met 53%.

Bij het vormen van kromtrekkende assen, inclusief gevormde en "gladde" draden, is het noodzakelijk om de spanrol individueel af te stellen volgens de traditionele methode /11/.

2.9 Gelijktijdige pathologie met volledig verlies van tanden bij ouderen en seniele mensen

Het epidemiologisch volledig verlies van tanden en de daarmee gepaard gaande pathologie van de oudere bevolking die in verpleeghuizen op het grondgebied van Tsjoevasjië woont, is bestudeerd. Het onderzoek is uitgevoerd door middel van een tandheelkundig onderzoek en het invullen van statistische kaarten van 784 personen. De resultaten van de analyse toonden een hoog percentage volledig verlies van tanden, verergerd door de algemene pathologie van het lichaam. Dit kenmerkt de onderzochte categorie van de bevolking als een groep met verhoogd tandheelkundig risico en vereist een herziening van het gehele systeem van hun tandheelkundige zorg.

Bij ouderen is de incidentie twee keer zo hoog, en op oudere leeftijd zes keer hoger dan bij jongere mensen.

De belangrijkste ziekten van ouderen en seniele mensen zijn ziekten van de bloedsomloop, het zenuwstelsel en de sensorische organen, ademhalingsorganen, spijsverteringsorganen, botten en bewegingsorganen, neoplasmata en verwondingen.

Het doel van het onderzoek is het ontwikkelen en verkrijgen van informatie over comorbiditeiten, de effectiviteit van protheses en de behoefte aan orthopedische behandeling van ouderen en demente mensen met volledig verlies van tanden.

In totaal werden 784 mensen van 45 tot 90 jaar onderzocht. De verhouding tussen vrouwen en mannen is 2,8:1.

Evaluatie van de statistische relatie met behulp van de correlatiecoëfficiënt van Pearson's rangen maakte het mogelijk om de wederzijdse invloed van het ontbreken van tanden op bijkomende morbiditeit vast te stellen met een betrouwbaarheidsniveau van p=0,0005. Oudere patiënten met volledig verlies van tanden lijden aan ziekten die kenmerkend zijn voor ouderdom, namelijk cerebrale atherosclerose en hypertensie.

Variantieanalyse toonde aan dat de specificiteit van de ziekte een beslissende rol speelt onder de onderzochte omstandigheden. De rol van nosologische vormen in verschillende leeftijdsperioden varieert van 52-60%. De grootste statistisch significante impact op het ontbreken van tanden wordt veroorzaakt door ziekten van het spijsverteringsstelsel en diabetes mellitus.

Over het algemeen werd de groep patiënten van 75-89 jaar gekenmerkt door een groot aantal pathologische ziekten.

In deze studie werd een vergelijkende studie uitgevoerd naar de incidentie van comorbiditeit bij patiënten met volledig verlies van tanden van ouderen en seniele leeftijd die in verpleeghuizen wonen. Een hoog percentage ontbrekende tanden bij mensen van deze leeftijdsgroep werd onthuld. Bij patiënten met volledige adentie worden comorbiditeiten waargenomen die kenmerkend zijn voor deze leeftijd. Atherosclerose en hypertensie kwamen het meest voor bij de onderzochte personen. De impact op de toestand van de mondholte van ziekten zoals ziekten van het maagdarmkanaal en diabetes mellitus is statistisch significant, het aandeel van andere nozoologische vormen lag in het bereik van 52-60%. Het gebruik van variantieanalyse bevestigde niet de significante rol van geslacht en woonplaats op indicatoren van de toestand van de mondholte.

Concluderend moet dus worden opgemerkt dat de analyse van de verdeling van bijkomende ziekten bij personen met volledige afwezigheid van tanden bij bejaarden en seniele leeftijden heeft aangetoond dat deze categorie burgers tot een speciale groep van de bevolking behoort die adequate tandheelkundige hulp zou moeten krijgen zorg in het kader van bestaande tandheelkundige systemen /12/ .

3 Variantieanalyse in de context van statistische methoden

Statistische analysemethoden zijn een methode voor het meten van de resultaten van menselijke activiteit, dat wil zeggen het omzetten van kwalitatieve kenmerken in kwantitatieve.

De belangrijkste stappen in de statistische analyse:

Opstellen van een plan voor het verzamelen van initiële gegevens - de waarden van ingangsvariabelen (X 1 ,...,X p), het aantal waarnemingen n. Deze stap wordt uitgevoerd wanneer het experiment actief wordt gepland.

Het verkrijgen van initiële gegevens en het invoeren ervan in een computer. In dit stadium worden reeksen getallen gevormd (x 1i ,..., x pi ; y 1i ,..., y qi), i=1,..., n, waarbij n de steekproefomvang is.

Primaire statistische gegevensverwerking. In dit stadium wordt een statistische beschrijving van de overwogen parameters gevormd:

a) constructie en analyse van statistische afhankelijkheden;

b) correlatieanalyse is bedoeld om de significantie van de invloed van factoren (Xl,...,Xp) op de respons Y te evalueren;

c) variantieanalyse wordt gebruikt om de invloed van niet-kwantitatieve factoren (X 1 ,...,X p) op de respons Y te evalueren om de belangrijkste daarvan te selecteren;

d) regressieanalyse is ontworpen om de analytische afhankelijkheid van de respons Y van kwantitatieve factoren X te bepalen;

Interpretatie van de resultaten in termen van de takenset/13/.

Tabel 3.1 toont de statistische methoden waarmee analytische problemen worden opgelost. De overeenkomstige cellen van de tabel bevatten de frequenties van het toepassen van statistische methoden:

Label "-" - de methode wordt niet toegepast;

Label "+" - de methode wordt toegepast;

Label "++" - de methode wordt veel gebruikt;

Label "+++" - de toepassing van de methode is van bijzonder belang/14/.

Variantieanalyse, zoals Student's t-test, stelt u in staat om verschillen tussen steekproefgemiddelden te evalueren; in tegenstelling tot de t-test heeft deze echter geen beperkingen op het aantal vergeleken middelen. Dus in plaats van te vragen of twee steekproefgemiddelden verschillen, kan men beoordelen of twee, drie, vier, vijf of k gemiddelden verschillen.

ANOVA maakt het mogelijk om gelijktijdig met twee of meer onafhankelijke variabelen (kenmerken, factoren) te werken, waarbij niet alleen het effect van elk van hen afzonderlijk wordt geëvalueerd, maar ook de effecten van de interactie tussen hen /15/.


Tabel 3.1 - Toepassing van statistische methoden bij het oplossen van analytische problemen

Analytische taken die zich voordoen op het gebied van business, finance en management

Beschrijvende statistische methoden

Methoden voor het verifiëren van statistische hypothesen

Regressieanalysemethoden

Methoden voor dispersieanalyse

Methoden voor multivariate analyse

Discriminante analysemethoden

cluster-nogo

Analysemethoden

overlevingsvermogen

Analysemethoden

en voorspelling

tijdreeksen

Taken van horizontale (tijdelijke) analyse

Taken van verticale (structurele) analyse

Taken van trendanalyse en prognose

Taken van analyse van relatieve indicatoren

Taken van vergelijkende (ruimtelijke) analyse

Taken van factoranalyse

Voor de meeste complexe systemen geldt het Pareto-principe, waarbij 20% van de factoren de eigenschappen van het systeem voor 80% bepaalt. Daarom is de primaire taak van de onderzoeker van het simulatiemodel het elimineren van onbeduidende factoren, wat het mogelijk maakt om de dimensie van het modeloptimalisatieprobleem te verkleinen.

Variantieanalyse evalueert de afwijking van waarnemingen van het algemene gemiddelde. Vervolgens wordt de variatie opgesplitst in delen, die elk hun eigen oorzaak hebben. Het resterende deel van de variatie, dat niet kan worden gerelateerd aan de omstandigheden van het experiment, wordt beschouwd als de willekeurige fout. Om de significantie te bevestigen, wordt een speciale test gebruikt - F-statistieken.

Variantieanalyse bepaalt of er een effect is. Met regressieanalyse kunt u de respons (de waarde van de objectieve functie) op een bepaald punt in de parameterruimte voorspellen. De directe taak van regressieanalyse is het schatten van de regressiecoëfficiënten /16/.

Te grote steekproefomvang maakt statistische analyses moeilijk, dus is het zinvol om de steekproefomvang te verkleinen.

Door variantieanalyse toe te passen, is het mogelijk om de significantie van de invloed van verschillende factoren op de onderzochte variabele te identificeren. Als de invloed van een factor onbeduidend blijkt te zijn, kan deze factor worden uitgesloten van verdere verwerking.

Macro-econometristen moeten vier logisch verschillende problemen kunnen oplossen:

Beschrijving van gegevens;

Macro-economische voorspelling;

structurele gevolgtrekking;

Beleids analyse.

Het beschrijven van gegevens betekent het beschrijven van de eigenschappen van een of meer tijdreeksen en het communiceren van deze eigenschappen aan een breed scala aan economen. Macro-economische prognoses zijn het voorspellen van het verloop van de economie, meestal twee tot drie jaar of minder (voornamelijk omdat het te moeilijk is om over langere horizonten te voorspellen). Structurele gevolgtrekking betekent controleren of macro-economische gegevens consistent zijn met een bepaalde economische theorie. De macro-econometrische beleidsanalyse verloopt in verschillende richtingen: enerzijds wordt de impact op de economie van een hypothetische verandering in beleidsinstrumenten (bijvoorbeeld een belastingtarief of korte rente) beoordeeld, anderzijds wordt de impact van een wijziging van de beleidsregels (bijvoorbeeld een overgang naar een nieuw monetairbeleidsregime) wordt beoordeeld. Een empirisch macro-economisch onderzoeksproject kan een of meer van deze vier taken omvatten. Elk probleem moet zo worden opgelost dat er rekening wordt gehouden met correlaties tussen tijdreeksen.

In de jaren zeventig werden deze problemen opgelost met behulp van verschillende methoden, die, beoordeeld vanuit moderne posities, om verschillende redenen ontoereikend waren. Om de dynamiek van een afzonderlijke reeks te beschrijven, was het voldoende om eenvoudig eendimensionale modellen van tijdreeksen te gebruiken, en om de gezamenlijke dynamiek van twee reeksen te beschrijven, was het voldoende om spectrale analyse te gebruiken. Er was echter geen gemeenschappelijke taal die geschikt was voor de systematische beschrijving van de gezamenlijke dynamische eigenschappen van verschillende tijdreeksen. Economische voorspellingen werden gedaan met behulp van vereenvoudigde autoregressief voortschrijdend gemiddelde (ARMA) -modellen of met behulp van grote structurele econometrische modellen die destijds populair waren. Structurele gevolgtrekking was ofwel gebaseerd op kleine modellen met één vergelijking of op grote modellen waarvan de identificatie werd bereikt door middel van ongefundeerde uitsluitingsbeperkingen en die gewoonlijk geen verwachtingen bevatten. De structurele, op modellen gebaseerde beleidsanalyse was afhankelijk van deze identificerende aannames.

Ten slotte werd de prijsstijging in de jaren zeventig door velen gezien als een grote mislukking van de grote modellen die toen werden gebruikt om beleidsaanbevelingen te doen. Dat wil zeggen, het was het juiste moment voor de opkomst van een nieuwe macro-econometrische constructie die deze vele problemen zou kunnen oplossen.

In 1980 werd zo'n constructie gemaakt - vector autoregressies (VAR). Op het eerste gezicht is VAR niets meer dan een generalisatie van univariate autoregressie naar het multivariate geval, en elke vergelijking in VAR is niets meer dan een eenvoudige kleinste-kwadratenregressie van één variabele op de achtergebleven waarden van zichzelf en andere variabelen in VAR. Maar deze schijnbaar eenvoudige tool maakte het mogelijk om systematisch en intern consistent de rijke dynamiek van multivariate tijdreeksen vast te leggen, en de statistische toolkit die bij VAR hoort, bleek handig en, heel belangrijk, gemakkelijk te interpreteren.

Er zijn drie verschillende VAR-modellen:

Verlaagd VAR-formulier;

Recursieve VAR;

Structurele VAR.

Alle drie zijn dynamische lineaire modellen die de huidige en vroegere waarden van de Yt-vector van een n-dimensionale tijdreeks relateren. De gereduceerde vorm en recursieve VAR's zijn statistische modellen die geen andere economische overwegingen gebruiken dan de keuze van variabelen. Deze VAR's worden gebruikt om de gegevens en de prognose te beschrijven. Structurele VAR omvat beperkingen die zijn afgeleid van macro-economische theorie en deze VAR wordt gebruikt voor structurele gevolgtrekkingen en beleidsanalyses.

De bovenstaande vorm van VAR drukt Y t uit als een gedistribueerde lag in het verleden plus een serieel niet-gecorreleerde foutterm, dat wil zeggen, het generaliseert univariate autoregressie naar het geval van vectoren. De wiskundig gereduceerde vorm van het VAR-model is een stelsel van n vergelijkingen dat als volgt in matrixvorm kan worden geschreven:

waarbij  is n l vector van constanten;

A 1 , A 2 , ..., A p zijn n n coëfficiëntmatrices;

 t , is een nulvector van serieel ongecorreleerde fouten, waarvan wordt aangenomen dat ze een gemiddelde van nul en een covariantiematrix hebben.

Fouten  t , in (17) zijn onverwachte dynamieken in Y t , die overblijven nadat rekening is gehouden met de lineaire gedistribueerde vertraging van waarden uit het verleden.

Het schatten van de parameters van het gereduceerde VAR-formulier is eenvoudig. Elk van de vergelijkingen bevat dezelfde regressoren (Y t–1 ,...,Y t–p), en er zijn geen wederzijdse beperkingen tussen de vergelijkingen. Zo wordt de effectieve schatting (maximale waarschijnlijkheidsmethode met volledige informatie) vereenvoudigd tot de gebruikelijke kleinste kwadraten die op elk van de vergelijkingen worden toegepast. De foutcovariantiematrix kan betrouwbaar worden geschat door de steekproefcovariantiematrix die is verkregen uit de LSM-residuen.

De enige subtiliteit is het bepalen van de lag-lengte p, maar dit kan worden gedaan met behulp van een informatiecriterium zoals AIC of BIC.

Op het niveau van matrixvergelijkingen zien recursieve en structurele VAR er hetzelfde uit. Deze twee VAR-modellen houden expliciet rekening met de gelijktijdige interacties tussen de elementen van Y t , wat neerkomt op het toevoegen van een simultane term aan de rechterkant van vergelijking (17). Dienovereenkomstig worden recursieve en structurele VAR beide weergegeven in de volgende algemene vorm:

waarbij  - vector van constanten;

Bo,..., Bp-matrices;

 t - fouten.

De aanwezigheid van de matrix Bo in de vergelijking betekent de mogelijkheid van gelijktijdige interactie tussen n variabelen; dat wil zeggen, met B 0 kunt u ervoor zorgen dat deze variabelen die betrekking hebben op hetzelfde tijdstip, samen worden gedefinieerd.

Recursieve VAR kan op twee manieren worden geschat. De recursieve structuur geeft een reeks recursieve vergelijkingen die kunnen worden geschat met behulp van de kleinste-kwadratenmethode. Een equivalente schattingsmethode is dat de vergelijkingen van de gereduceerde vorm (17), beschouwd als een systeem, van links worden vermenigvuldigd met de onderste driehoekige matrix.

De methode voor het schatten van de structurele VAR hangt af van hoe B 0 precies wordt geïdentificeerd. De partiële informatiebenadering omvat het gebruik van schattingsmethoden met één vergelijking, zoals de kleinste kwadraten in twee stappen. De volledige informatiebenadering omvat het gebruik van schattingsmethoden met meerdere vergelijkingen, zoals de kleinste kwadraten in drie stappen.

Wees je bewust van de vele verschillende soorten VAR's. De gereduceerde vorm van VAR is uniek. Deze volgorde van variabelen in Y t komt overeen met een enkele recursieve VAR, maar er zijn n! dergelijke bestellingen, d.w.z. n! verschillende recursieve VAR's. Het aantal structurele VAR's - dat wil zeggen sets van aannames die gelijktijdige relaties tussen variabelen identificeren - wordt alleen beperkt door de vindingrijkheid van de onderzoeker.

Omdat matrices van geschatte VAR-coëfficiënten moeilijk direct te interpreteren zijn, worden VAR-schattingsresultaten meestal weergegeven door een functie van deze matrices. Om dergelijke statistieken ontleding van voorspellingsfouten.

Uitbreidingen van de prognosefoutvariantie worden voornamelijk berekend voor recursieve of structurele systemen. Deze decompositie van de variantie laat zien hoe belangrijk de fout in de j-de vergelijking is om de onverwachte veranderingen in de i-de variabele te verklaren. Als de VAR-fouten in vergelijking niet-gecorreleerd zijn, kan de variantie van de voorspellingsfout voor h komende perioden worden geschreven als de som van de componenten die het resultaat zijn van elk van deze fouten/17/.

3.2 Factoranalyse

In moderne statistiek wordt factoranalyse opgevat als een reeks methoden die het op basis van real-life relaties van kenmerken (of objecten) mogelijk maken om latente generaliserende kenmerken van de organisatiestructuur en het ontwikkelingsmechanisme van de verschijnselen en processen te identificeren. in studie.

Het concept van latentie in de definitie staat centraal. Het betekent de impliciteit van de kenmerken die worden onthuld met behulp van factoranalysemethoden. Eerst behandelen we een reeks elementaire kenmerken Xj , hun interactie veronderstelt de aanwezigheid van bepaalde oorzaken, speciale omstandigheden, d.w.z. aanwezigheid van enkele verborgen factoren. Deze laatste komen tot stand als gevolg van generalisatie van elementaire kenmerken en fungeren als geïntegreerde kenmerken, of kenmerken, maar van een hoger niveau. Natuurlijk kunnen niet alleen triviale kenmerken X j correleren, maar ook de waargenomen objecten Ni zelf, dus het zoeken naar latente factoren is theoretisch mogelijk zowel door kenmerk- als objectgegevens.

Als objecten worden gekenmerkt door een voldoende groot aantal elementaire kenmerken (m > 3), dan is ook een andere veronderstelling logisch: het bestaan ​​van dichte clusters van punten (kenmerken) in de ruimte van n objecten. Tegelijkertijd generaliseren de nieuwe assen niet de kenmerken van X j , maar respectievelijk de objecten n i en de latente factoren F r worden herkend door de samenstelling van de waargenomen objecten:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N ,

waarbij c i het gewicht is van het object n i in de factor F r .

Afhankelijk van welke van de hierboven overwogen typen correlatie - elementaire kenmerken of waargenomen objecten - wordt bestudeerd in factoranalyse, worden R en Q onderscheiden - technische methoden voor gegevensverwerking.

De naam van de R-techniek is volumetrische data-analyse door m kenmerken, waardoor r lineaire combinaties (groepen) van kenmerken worden verkregen: F r =f(X j), (r=1..m). Analyse volgens de nabijheid (verbinding) van n waargenomen objecten wordt Q-techniek genoemd en stelt je in staat om r lineaire combinaties (groepen) van objecten te bepalen: F=f(n i), (i = l .. N).

Momenteel wordt in de praktijk meer dan 90% van de problemen opgelost met behulp van R-technieken.

De reeks factoranalysemethoden is momenteel vrij groot en omvat tientallen verschillende benaderingen en gegevensverwerkingstechnieken. Om te focussen op de juiste keuze van methoden in onderzoek, is het noodzakelijk om hun kenmerken te presenteren. We verdelen alle methoden van factoranalyse in verschillende classificatiegroepen:

Hoofdcomponent methode. Strikt genomen wordt het niet geclassificeerd als factoranalyse, hoewel het er veel mee gemeen heeft. Specifiek is ten eerste dat in de loop van computationele procedures alle hoofdcomponenten gelijktijdig worden verkregen en dat hun aantal aanvankelijk gelijk is aan het aantal elementaire kenmerken. Ten tweede wordt de mogelijkheid van een volledige ontleding van de dispersie van elementaire kenmerken gepostuleerd, met andere woorden, de volledige verklaring ervan door latente factoren (gegeneraliseerde kenmerken).

Factoranalysemethoden. De variantie van elementaire kenmerken wordt hier niet volledig uitgelegd, er wordt erkend dat een deel van de variantie niet wordt herkend als een kenmerk. Factoren worden meestal achtereenvolgens onderscheiden: de eerste, die het grootste aandeel variatie in elementaire kenmerken verklaart, dan de tweede, die het kleinere deel van de variantie verklaart, de tweede na de eerste latente factor, de derde, enz. Het proces van het extraheren van factoren kan bij elke stap worden onderbroken als een beslissing wordt genomen over de toereikendheid van het aandeel van de verklaarde variantie van elementaire kenmerken of rekening houdend met de interpreteerbaarheid van latente factoren.

Het is raadzaam om de factoranalysemethoden verder in twee klassen op te delen: vereenvoudigde en moderne benaderingsmethoden.

Eenvoudige factoranalysemethoden worden voornamelijk geassocieerd met initiële theoretische ontwikkelingen. Ze hebben beperkte mogelijkheden in het identificeren van latente factoren en het benaderen van factoriële oplossingen. Waaronder:

Een factormodel. Hiermee kunt u slechts één algemene latente en één karakteristieke factor selecteren. Voor eventueel bestaande andere latente factoren wordt een aanname gedaan over hun nietigheid;

bifactorieel model. Houdt rekening met de invloed op de variatie van elementaire kenmerken van niet één, maar meerdere latente factoren (meestal twee) en één karakteristieke factor;

zwaartepunt methode. Daarin worden correlaties tussen variabelen beschouwd als een verzameling vectoren, en de latente factor wordt geometrisch weergegeven als een balancerende vector die door het midden van deze verzameling gaat. : Met de methode kunt u verschillende latente en karakteristieke factoren identificeren, voor het eerst wordt het mogelijk om de beslissing van de faculteit te correleren met de originele gegevens, d.w.z. los het benaderingsprobleem in de eenvoudigste vorm op.

Moderne benaderingsmethoden gaan er vaak van uit dat de eerste, benaderende oplossing al op de een of andere manier is gevonden, en deze oplossing wordt met de volgende stappen geoptimaliseerd. De methoden verschillen in de complexiteit van berekeningen. Deze methoden omvatten:

groeps methode. De oplossing is gebaseerd op groepen elementaire kenmerken die op de een of andere manier zijn voorgeselecteerd;

Methode van de belangrijkste factoren. Het komt het dichtst bij de methode van hoofdcomponenten, het verschil ligt in de aanname van het bestaan ​​van kenmerken;

Maximale waarschijnlijkheid, minimale residuen, a-factoranalyse, canonieke factoranalyse, allemaal optimaliseren.

Deze methoden maken het mogelijk om eerder gevonden oplossingen consistent te verbeteren op basis van het gebruik van statistische technieken voor het schatten van een willekeurige variabele of statistische criteria, en vergen veel tijdrovende berekeningen. De meest veelbelovende en handigste methode voor werk in deze groep is de maximale waarschijnlijkheidsmethode.

De hoofdtaak, die wordt opgelost door verschillende methoden van factoranalyse, waaronder de methode van hoofdcomponenten, is de compressie van informatie, de overgang van de reeks waarden volgens m elementaire kenmerken met de hoeveelheid informatie n x m naar een beperkte verzameling elementen van de factormatrix (m x r) of de matrix van latente waarden factoren voor elk waargenomen object met dimensie n x r, en gewoonlijk r< m.

Factoranalysemethoden maken het ook mogelijk om de structuur van de bestudeerde verschijnselen en processen te visualiseren, wat betekent dat ze hun toestand bepalen en hun ontwikkeling voorspellen. Ten slotte geven de factoranalysegegevens aanleiding tot identificatie van het object, d.w.z. oplossen van het probleem van beeldherkenning.

Factoranalysemethoden hebben eigenschappen die zeer aantrekkelijk zijn voor gebruik als onderdeel van andere statistische methoden, meestal in correlatie-regressieanalyse, clusteranalyse, multivariate schaling, enz. /18/.

3.3 Gepaarde regressie. Probabilistische aard van regressiemodellen.

Als we kijken naar het probleem van het analyseren van voedseluitgaven in groepen met hetzelfde inkomen, bijvoorbeeld $ 10.000 (x), dan is dit een deterministische waarde. Maar Y - het deel van dit geld dat aan voedsel wordt besteed - is willekeurig en kan van jaar tot jaar veranderen. Daarom, voor elk i-de individu:

waarbij ε i - willekeurige fout;

α en β zijn (theoretisch) constanten, hoewel ze van model tot model kunnen verschillen.

Vereisten voor paarsgewijze regressie:

X en Y zijn lineair gerelateerd;

X is een niet-willekeurige variabele met vaste waarden;

- ε - fouten zijn normaal verdeeld N(0,σ 2);

- .

Figuur 3.1 toont een paarsgewijze regressiemodel.

Afbeelding 3.1 - Gepaard regressiemodel

Deze aannames beschrijven het klassieke lineaire regressiemodel.

Als de fout een niet-nulgemiddelde heeft, is het oorspronkelijke model gelijk aan het nieuwe model en andere interceptie, maar met een nulgemiddelde voor de fout.

Als aan de voorwaarden is voldaan, dan zijn de kleinste-kwadratenschatters en efficiënte lineaire onbevooroordeelde schatters

Als we aangeven:

het feit dat de wiskundige verwachting en spreiding van de coëfficiënten als volgt zal zijn:

Covariantie van coëfficiënten:

Als een dan zijn ze ook normaal verdeeld:

Hieruit volgt dat:

De variatie β wordt volledig bepaald door de variatie ε;

Hoe hoger de variantie van X, hoe beter de schatting van β.

De totale spreiding wordt bepaald door de formule:

De variantie van de afwijkingen in deze vorm is een zuivere schatting en wordt de standaardfout van de regressie genoemd. N-2 - kan worden geïnterpreteerd als het aantal vrijheidsgraden.

Analyse van afwijkingen van de regressielijn kan een bruikbare maatstaf zijn voor hoe goed de geschatte regressie de werkelijke gegevens weerspiegelt. Een goede regressie is er een die een aanzienlijk deel van de variantie in Y verklaart, en vice versa, een slechte regressie volgt de meeste fluctuaties in de oorspronkelijke gegevens niet. Het is intuïtief duidelijk dat eventuele aanvullende informatie het model zal verbeteren, dat wil zeggen, het onverklaarde aandeel van variatie Y zal verminderen. Om het regressiemodel te analyseren, wordt de variantie ontleed in componenten en wordt de determinatiecoëfficiënt R2 bepaald.

De verhouding van de twee varianties wordt verdeeld volgens de F-verdeling, d.w.z. als we controleren op statistische significantie van het verschil tussen de variantie van het model en de variantie van de residuen, kunnen we concluderen dat R2 significant is.

Testen van de hypothese over de gelijkheid van de varianties van deze twee steekproeven:

Als de hypothese H 0 (gelijkheid van varianties van meerdere steekproeven) waar is, heeft t een F-verdeling met (m 1 ,m 2)=(n 1 -1,n 2 -1) vrijheidsgraden.

Nadat we de F-ratio hebben berekend als de verhouding van twee dispersies en deze hebben vergeleken met de tabelwaarde, kunnen we concluderen dat R 2 /2/, /19/ statistisch significant is.

Conclusie

Moderne toepassingen van variantieanalyse bestrijken een breed scala aan problemen in economie, biologie en technologie en worden gewoonlijk geïnterpreteerd in termen van de statistische theorie om systematische verschillen aan het licht te brengen tussen de resultaten van directe metingen die onder bepaalde veranderende omstandigheden zijn uitgevoerd.

Dankzij de automatisering van variantieanalyse kan een onderzoeker verschillende statistische onderzoeken uitvoeren met behulp van computers, terwijl hij minder tijd en moeite hoeft te besteden aan gegevensberekeningen. Momenteel zijn er veel softwarepakketten die het apparaat voor dispersieanalyse implementeren. De meest voorkomende softwareproducten zijn:

De meeste statistische methoden zijn geïmplementeerd in moderne statistische softwareproducten. Met de ontwikkeling van algoritmische programmeertalen werd het mogelijk om extra blokken te maken voor het verwerken van statistische gegevens.

ANOVA is een krachtige moderne statistische methode voor het verwerken en analyseren van experimentele gegevens in de psychologie, biologie, geneeskunde en andere wetenschappen. Het hangt nauw samen met de specifieke methodologie voor het plannen en uitvoeren van experimentele studies.

Variantieanalyse wordt gebruikt in alle gebieden van wetenschappelijk onderzoek, waar het nodig is om de invloed van verschillende factoren op de onderzochte variabele te analyseren.

Bibliografie

1 Kremer N.Sh. Kansrekening en wiskundige statistiek. M.: Eenheid - Dana, 2002.-343s.

2 Gmurman VE Kansrekening en wiskundige statistiek. - M.: Hogere School, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infecties.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Dispersie-analyse in de experimentele psychologie. - M.: Educatieve en methodologische verzamelaar "Psychologie", 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru