Βιογραφίες Χαρακτηριστικά Ανάλυση

Διωνυμική συνάρτηση κατανομής. Διωνυμική διακύμανση κατανομής


Φυσικά, κατά τον υπολογισμό της συνάρτησης αθροιστικής κατανομής, θα πρέπει να χρησιμοποιηθεί η αναφερόμενη σχέση μεταξύ της διωνυμικής και της βήτα κατανομής. Αυτή η μέθοδος είναι σίγουρα καλύτερη από την άμεση άθροιση όταν n > 10.

Στα κλασικά εγχειρίδια στατιστικής, για να ληφθούν οι τιμές της διωνυμικής κατανομής, συνιστάται συχνά η χρήση τύπων που βασίζονται σε οριακά θεωρήματα (όπως ο τύπος Moivre-Laplace). πρέπει να σημειωθεί ότι από καθαρά υπολογιστική άποψηη τιμή αυτών των θεωρημάτων είναι κοντά στο μηδέν, ειδικά τώρα, όταν σχεδόν σε κάθε τραπέζι υπάρχει ένας ισχυρός υπολογιστής. Το κύριο μειονέκτημα των παραπάνω προσεγγίσεων είναι η εντελώς ανεπαρκής ακρίβειά τους για τις τιμές του n τυπικές για τις περισσότερες εφαρμογές. Ένα εξίσου μειονέκτημα είναι η απουσία σαφών συστάσεων σχετικά με την εφαρμογή της μιας ή της άλλης προσέγγισης (μόνο ασυμπτωτικές διατυπώσεις δίδονται σε τυπικά κείμενα, δεν συνοδεύονται από εκτιμήσεις ακρίβειας και, επομένως, είναι ελάχιστα χρήσιμα). Θα έλεγα ότι και οι δύο τύποι ισχύουν μόνο για n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Δεν θεωρώ εδώ το πρόβλημα της εύρεσης ποσοστών: για τις διακριτές κατανομές, είναι ασήμαντο, και σε εκείνα τα προβλήματα όπου προκύπτουν τέτοιες κατανομές, κατά κανόνα, δεν είναι σχετικό. Εάν εξακολουθούν να χρειάζονται ποσοστάσια, προτείνω να επαναδιατυπώσετε το πρόβλημα με τέτοιο τρόπο ώστε να λειτουργεί με τιμές p (παρατηρούμενες σημασίες). Ακολουθεί ένα παράδειγμα: κατά την εφαρμογή ορισμένων αλγορίθμων απαρίθμησης, σε κάθε βήμα απαιτείται έλεγχος στατιστική υπόθεσηγια μια διωνυμική τυχαία μεταβλητή. Σύμφωνα με κλασική προσέγγισησε κάθε βήμα, είναι απαραίτητο να υπολογίσετε τα στατιστικά του κριτηρίου και να συγκρίνετε την τιμή του με το όριο του κρίσιμου συνόλου. Επειδή, ωστόσο, ο αλγόριθμος είναι αριθμητικός, είναι απαραίτητο να προσδιορίζεται το όριο του κρίσιμου συνόλου κάθε φορά εκ νέου (εξάλλου, το μέγεθος του δείγματος αλλάζει από βήμα σε βήμα), γεγονός που αυξάνει μη παραγωγικά το κόστος χρόνου. Σύγχρονη προσέγγισησυνιστά τον υπολογισμό της παρατηρούμενης σημασίας και τη σύγκρισή της με επίπεδο αυτοπεποίθησης, εξοικονόμηση στην αναζήτηση για ποσοστάσια.

Επομένως, οι ακόλουθοι κωδικοί δεν υπολογίζουν την αντίστροφη συνάρτηση, αντ' αυτού, δίνεται η συνάρτηση rev_binomialDF, η οποία υπολογίζει την πιθανότητα p επιτυχίας σε μία δοκιμή δεδομένου του αριθμού n των δοκιμών, του αριθμού m των επιτυχιών σε αυτές και της τιμής y της πιθανότητας να πετύχουμε αυτές τις επιτυχίες. Αυτό χρησιμοποιεί την προαναφερθείσα σχέση μεταξύ της διωνυμικής και της βήτα κατανομής.

Στην πραγματικότητα, αυτή η λειτουργία σάς επιτρέπει να λαμβάνετε τα όρια των διαστημάτων εμπιστοσύνης. Πράγματι, ας υποθέσουμε ότι έχουμε m επιτυχίες σε n διωνυμικές δοκιμές. Όπως γνωρίζετε, το αριστερό περίγραμμα μιας διπλής όψης διάστημα εμπιστοσύνηςγια την παράμετρο p με επίπεδο εμπιστοσύνης είναι 0 αν m = 0, και για είναι η λύση της εξίσωσης . Ομοίως, το δεξιό φράγμα είναι 1 αν m = n, και για είναι λύση της εξίσωσης . Αυτό σημαίνει ότι για να βρούμε το αριστερό όριο, πρέπει να λύσουμε την εξίσωση , και για να αναζητήσετε το σωστό - την εξίσωση . Επιλύονται στις συναρτήσεις binom_leftCI και binom_rightCI , οι οποίες επιστρέφουν το άνω και το κάτω όριο του διαστήματος εμπιστοσύνης δύο όψεων, αντίστοιχα.

Θέλω να σημειώσω ότι εάν δεν χρειάζεται απολύτως απίστευτη ακρίβεια, τότε για αρκετά μεγάλα n, μπορείτε να χρησιμοποιήσετε την ακόλουθη προσέγγιση [B.L. van der Waerden, Μαθηματική στατιστική. Μ: IL, 1960, Ch. 2, sec. 7]: , όπου g είναι το μερίδιο κανονική κατανομή. Η τιμή αυτής της προσέγγισης είναι ότι υπάρχουν πολύ απλές προσεγγίσεις που σας επιτρέπουν να υπολογίσετε τα ποσοστά της κανονικής κατανομής (δείτε το κείμενο για τον υπολογισμό της κανονικής κατανομής και την αντίστοιχη ενότητα αυτής της αναφοράς). Στην πρακτική μου (κυρίως για n > 100), αυτή η προσέγγιση έδωσε περίπου 3-4 ψηφία, τα οποία, κατά κανόνα, είναι αρκετά.

Για υπολογισμούς με τους ακόλουθους κωδικούς απαιτούνται τα αρχεία betaDF.h , betaDF.cpp (βλ. ενότητα για τη διανομή beta), καθώς και τα logGamma.h , logGamma.cpp (βλ. παράρτημα A). Μπορείτε επίσης να δείτε ένα παράδειγμα χρήσης συναρτήσεων.

αρχείο binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(διπλές δοκιμές, διπλές επιτυχίες, διπλό p); /* * Ας γίνουν «δοκιμές» ανεξάρτητων παρατηρήσεων * με πιθανότητα «ρ» επιτυχίας σε καθεμία. * Υπολογίστε την πιθανότητα B(επιτυχίες|δοκιμές,p) ότι ο αριθμός * των επιτυχιών είναι μεταξύ 0 και "επιτυχίες" (συμπεριλαμβανομένων). */ double rev_binomialDF(διπλές δοκιμές, διπλές επιτυχίες, διπλό y); /* * Αφήστε την πιθανότητα y τουλάχιστον m επιτυχιών * να είναι γνωστή σε δοκιμές του σχήματος Bernoulli. Η συνάρτηση βρίσκει την πιθανότητα p * επιτυχίας σε μία μόνο δοκιμή. * * Η ακόλουθη σχέση χρησιμοποιείται στους υπολογισμούς * * 1 - p = rev_Beta(δοκιμές-επιτυχίες| επιτυχίες+1, y). */ double binom_leftCI(διπλές δοκιμές, διπλές επιτυχίες, διπλό επίπεδο); /* Ας γίνουν «δοκιμές» ανεξάρτητων παρατηρήσεων * με πιθανότητα «ρ» επιτυχίας σε κάθε * και ο αριθμός των επιτυχιών είναι «επιτυχίες». * Το αριστερό όριο του διαστήματος εμπιστοσύνης δύο όψεων * υπολογίζεται με το επίπεδο σημαντικότητας. */ double binom_rightCI(διπλό n, διπλές επιτυχίες, διπλό επίπεδο); /* Ας γίνουν «δοκιμές» ανεξάρτητων παρατηρήσεων * με πιθανότητα «ρ» επιτυχίας σε κάθε * και ο αριθμός των επιτυχιών είναι «επιτυχίες». * Το δεξιό όριο του διαστήματος εμπιστοσύνης δύο όψεων * υπολογίζεται με το επίπεδο σημαντικότητας. */ #endif /* Τέλος #ifndef __BINOMIAL_H__ */

αρχείο binomialDF.cpp

/**************************************************** **** **********/ /* Διωνυμική κατανομή */ /******************************** **** ****************************/ #περιλαμβάνω #περιλαμβάνω #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Έστω "n" ανεξάρτητες παρατηρήσεις * με πιθανότητα "p" επιτυχίας σε καθεμία. * Υπολογίστε την πιθανότητα B(m|n,p) ότι ο αριθμός των επιτυχιών είναι * μεταξύ 0 και "m" (συμπεριλαμβανομένου), δηλ. * ποσό διωνυμικές πιθανότητεςαπό 0 έως m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Οι υπολογισμοί δεν συνεπάγονται αμβλύ άθροισμα - χρησιμοποιήστε * τον ακόλουθο σύνδεσμο στην κεντρική κατανομή βήτα: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Τα επιχειρήματα πρέπει να είναι θετικά, με 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (σελ<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) επιστροφή 1; αλλιώς επιστροφή BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Αφήστε την πιθανότητα y τουλάχιστον m επιτυχιών * να είναι γνωστή σε n δοκιμές του σχήματος Bernoulli. Η συνάρτηση βρίσκει την πιθανότητα p * επιτυχίας σε μία μόνο δοκιμή. * * Η ακόλουθη σχέση χρησιμοποιείται στους υπολογισμούς * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Εξετάστε τη Διωνυμική κατανομή, υπολογίστε τη μαθηματική προσδοκία, τη διακύμανση, τον τρόπο λειτουργίας της. Χρησιμοποιώντας τη συνάρτηση MS EXCEL BINOM.DIST(), θα σχεδιάσουμε τα γραφήματα της συνάρτησης κατανομής και της πυκνότητας πιθανότητας. Ας υπολογίσουμε την παράμετρο κατανομής p, μαθηματική προσδοκίαδιανομή και τυπική απόκλιση. Εξετάστε επίσης την κατανομή Bernoulli.

Ορισμός. Ας κρατηθούν nτεστ, σε καθένα από τα οποία μπορούν να συμβούν μόνο 2 συμβάντα: το γεγονός «επιτυχία» με πιθανότητα Π ή το συμβάν «αποτυχία» με την πιθανότητα q =1-p (το λεγόμενο Σχέδιο Bernoulli,Μπερνούλιδοκιμές).

Πιθανότητα να πάρει ακριβώς Χ επιτυχία σε αυτά n οι δοκιμές είναι ίσες με:

Αριθμός επιτυχιών στο δείγμα Χ είναι μια τυχαία μεταβλητή που έχει Διωνυμική κατανομή(Αγγλικά) Διωνυμικόςδιανομή) Πκαι nείναι παράμετροι αυτής της κατανομής.

Θυμηθείτε ότι για να κάνετε αίτηση Σχέδια Bernoulliκαι αντίστοιχα διωνυμική κατανομή,πρέπει να πληρούνται οι ακόλουθες προϋποθέσεις:

  • κάθε δοκιμή πρέπει να έχει ακριβώς δύο αποτελέσματα, που ονομάζονται υπό όρους «επιτυχία» και «αποτυχία».
  • το αποτέλεσμα κάθε δοκιμής δεν πρέπει να εξαρτάται από τα αποτελέσματα προηγούμενων δοκιμών (ανεξαρτησία δοκιμής).
  • ποσοστο επιτυχιας Π πρέπει να είναι σταθερή για όλες τις δοκιμές.

Διωνυμική κατανομή στο MS EXCEL

Στο MS EXCEL, ξεκινώντας από την έκδοση 2010, για Διωνυμική κατανομήυπάρχει μια συνάρτηση BINOM.DIST() , Αγγλικός τίτλος- BINOM.DIST(), που σας επιτρέπει να υπολογίσετε την πιθανότητα ότι το δείγμα θα είναι ακριβώς Χ«επιτυχίες» (δηλ. συνάρτηση πυκνότητας πιθανότητας p(x), βλέπε τύπο παραπάνω), και συνάρτηση ολοκληρωμένης διανομής(πιθανότητα να έχει το δείγμα Χή λιγότερες "επιτυχίες", συμπεριλαμβανομένων 0).

Πριν από το MS EXCEL 2010, το EXCEL είχε τη συνάρτηση BINOMDIST(), η οποία σας επιτρέπει επίσης να υπολογίζετε συνάρτηση διανομήςκαι πυκνότητα πιθανότητας p(x). Το BINOMDIST() παραμένει στο MS EXCEL 2010 για συμβατότητα.

Το αρχείο παραδείγματος περιέχει γραφήματα πυκνότητα κατανομής πιθανότηταςκαι .

Διωνυμική κατανομήέχει τον χαρακτηρισμό σι(n; Π) .

Σημείωση: Για δόμηση συνάρτηση ολοκληρωμένης διανομήςτέλειος τύπος γραφήματος Πρόγραμμα, Για πυκνότητα κατανομήςΙστόγραμμα με ομαδοποίηση. Για περισσότερες πληροφορίες σχετικά με τα γραφήματα δόμησης, διαβάστε το άρθρο Οι κύριοι τύποι διαγραμμάτων.

Σημείωση: Για τη διευκόλυνση της εγγραφής τύπων στο αρχείο παραδείγματος, έχουν δημιουργηθεί ονόματα για παραμέτρους Διωνυμική κατανομή: n και p.

Το αρχείο παραδείγματος δείχνει διάφορους υπολογισμούς πιθανοτήτων χρησιμοποιώντας συναρτήσεις MS EXCEL:

Όπως φαίνεται στην παραπάνω εικόνα, υποτίθεται ότι:

  • Ο άπειρος πληθυσμός από τον οποίο γίνεται το δείγμα περιέχει 10% (ή 0,1) καλά στοιχεία (παράμετρος Π, τρίτο όρισμα συνάρτησης =BINOM.DIST() )
  • Να υπολογιστεί η πιθανότητα ότι σε ένα δείγμα 10 στοιχείων (παράμετρος n, το δεύτερο όρισμα της συνάρτησης) θα υπάρχουν ακριβώς 5 έγκυρα στοιχεία (το πρώτο όρισμα), πρέπει να γράψετε τον τύπο: =BINOM.DIST(5, 10, 0,1, FALSE)
  • Το τελευταίο, τέταρτο στοιχείο ορίζεται = FALSE, δηλ. επιστρέφεται η τιμή της συνάρτησης πυκνότητα κατανομής.

Εάν η τιμή του τέταρτου ορίσματος = TRUE, τότε η συνάρτηση BINOM.DIST() επιστρέφει την τιμή συνάρτηση ολοκληρωμένης διανομήςή απλά συνάρτηση διανομής. Σε αυτή την περίπτωση, μπορούμε να υπολογίσουμε την πιθανότητα από την οποία θα προέρχεται ο αριθμός των καλών στοιχείων στο δείγμα ορισμένο εύρος, για παράδειγμα, 2 ή λιγότερο (συμπεριλαμβανομένου του 0).

Για να το κάνετε αυτό, πρέπει να γράψετε τον τύπο:
= BINOM.DIST(2, 10, 0.1, TRUE)

Σημείωση: Για μια μη ακέραια τιμή του x, . Για παράδειγμα, οι ακόλουθοι τύποι θα επιστρέψουν την ίδια τιμή:
=BINOM.DIST( 2 ; δέκα; 0,1; ΑΛΗΘΗΣ)
=BINOM.DIST( 2,9 ; δέκα; 0,1; ΑΛΗΘΗΣ)

Σημείωση: Στο αρχείο παραδείγματος πυκνότητα πιθανότηταςκαι συνάρτηση διανομήςυπολογίζεται επίσης χρησιμοποιώντας τον ορισμό και τη συνάρτηση COMBIN().

Δείκτες διανομής

ΣΤΟ παράδειγμα αρχείου σε φύλλο Παράδειγμαυπάρχουν τύποι για τον υπολογισμό ορισμένων δεικτών διανομής:

  • =n*p;
  • (τετράγωνη τυπική απόκλιση) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Εξάγουμε τον τύπο μαθηματική προσδοκία Διωνυμική κατανομήχρησιμοποιώντας Σχέδιο Bernoulli.

Εξ ορισμού τυχαία τιμήΧ σε Σχέδιο Bernoulli(τυχαία μεταβλητή Bernoulli) έχει συνάρτηση διανομής:

Αυτή η κατανομή ονομάζεται Κατανομή Bernoulli.

Σημείωση: Κατανομή Bernoulliειδική περίπτωση Διωνυμική κατανομήμε παράμετρο n=1.

Ας δημιουργήσουμε 3 πίνακες των 100 αριθμών με διαφορετικές πιθανότητεςεπιτυχία: 0,1; 0,5 και 0,9. Για να το κάνετε αυτό, στο παράθυρο Τυχαία παραγωγή αριθμώνσειρά παρακάτω επιλογέςγια κάθε πιθανότητα p:

Σημείωση: Εάν ορίσετε την επιλογή Τυχαία διασπορά (Τυχαίος σπόρος), τότε μπορείτε να επιλέξετε ένα συγκεκριμένο τυχαίο σύνολοπαραγόμενοι αριθμοί. Για παράδειγμα, ορίζοντας αυτήν την επιλογή =25, μπορείτε να δημιουργήσετε τα ίδια σύνολα τυχαίων αριθμών σε διαφορετικούς υπολογιστές (αν, φυσικά, άλλες παράμετροι διανομής είναι ίδιες). Η τιμή επιλογής μπορεί να πάρει ακέραιες τιμές από 1 έως 32.767. Όνομα επιλογής Τυχαία διασποράμπορεί να μπερδέψει. Θα ήταν καλύτερα να το μεταφράσουμε ως Ορισμός αριθμού με τυχαίους αριθμούς.

Ως αποτέλεσμα, θα έχουμε 3 στήλες των 100 αριθμών, βάσει των οποίων, για παράδειγμα, μπορούμε να εκτιμήσουμε την πιθανότητα επιτυχίας Πσύμφωνα με τον τύπο: Αριθμός επιτυχιών/100(εκ. παράδειγμα φύλλου αρχείου Δημιουργία Bernoulli).

Σημείωση: Για Διανομές Bernoulliμε p=0,5, μπορείτε να χρησιμοποιήσετε τον τύπο =RANDBETWEEN(0;1) , που αντιστοιχεί σε .

Δημιουργία τυχαίων αριθμών. Διωνυμική κατανομή

Ας υποθέσουμε ότι υπάρχουν 7 ελαττωματικά στοιχεία στο δείγμα. Αυτό σημαίνει ότι είναι «πολύ πιθανό» να έχει αλλάξει το ποσοστό των ελαττωματικών προϊόντων. Π, που είναι χαρακτηριστικό της παραγωγικής μας διαδικασίας. Αν και αυτή η κατάσταση είναι «πολύ πιθανή», υπάρχει μια πιθανότητα (άλφα κίνδυνος, σφάλμα τύπου 1, «ψευδής συναγερμός») Ππαρέμεινε αμετάβλητο και ο αυξημένος αριθμός ελαττωματικών προϊόντων οφείλεται σε τυχαία δειγματοληψία.

Όπως φαίνεται στο παρακάτω σχήμα, το 7 είναι ο αριθμός των ελαττωματικών προϊόντων που είναι αποδεκτός για μια διεργασία με p=0,21 στην ίδια τιμή Αλφα. Αυτό δείχνει ότι όταν ξεπεραστεί το όριο των ελαττωματικών στοιχείων σε ένα δείγμα, Π«μάλλον» αυξήθηκε. Η φράση «πιθανότατα» σημαίνει ότι υπάρχει μόνο 10% πιθανότητα (100%-90%) η απόκλιση του ποσοστού των ελαττωματικών προϊόντων πάνω από το όριο να οφείλεται μόνο σε τυχαίες αιτίες.

Έτσι, η υπέρβαση του ορίου του αριθμού των ελαττωματικών προϊόντων στο δείγμα μπορεί να χρησιμεύσει ως σήμα ότι η διαδικασία έχει αναστατωθεί και άρχισε να παράγει β σχετικά μευψηλότερο ποσοστό ελαττωματικών προϊόντων.

Σημείωση: Πριν από το MS EXCEL 2010, το EXCEL είχε μια συνάρτηση CRITBINOM() , η οποία είναι ισοδύναμη με BINOM.INV() . Το CRITBINOM() έχει παραμείνει στο MS EXCEL 2010 και υψηλότερο για συμβατότητα.

Σχέση της διωνυμικής κατανομής με άλλες κατανομές

Εάν η παράμετρος n Διωνυμική κατανομήτείνει στο άπειρο και Πτείνει στο 0, τότε σε αυτή την περίπτωση Διωνυμική κατανομήμπορεί να γίνει κατά προσέγγιση.
Είναι δυνατό να διατυπωθούν συνθήκες όταν η προσέγγιση Κατανομή Poissonλειτουργεί καλά:

  • Π<0,1 (το λιγότερο Πκι αλλα n, τόσο πιο ακριβής είναι η προσέγγιση).
  • Π>0,9 (λαμβάνοντας υπ 'όψιν ότι q=1- Π, οι υπολογισμοί σε αυτή την περίπτωση πρέπει να εκτελούνται χρησιμοποιώντας q(ένα Χπρέπει να αντικατασταθεί με n- Χ). Επομένως, όσο λιγότερο qκι αλλα n, τόσο πιο ακριβής είναι η προσέγγιση).

Στο 0,1<=p<=0,9 и n*p>10 Διωνυμική κατανομήμπορεί να γίνει κατά προσέγγιση.

Με τη σειρά του, Διωνυμική κατανομήμπορεί να χρησιμεύσει ως μια καλή προσέγγιση όταν το μέγεθος του πληθυσμού είναι N Υπεργεωμετρική κατανομήπολύ μεγαλύτερο από το μέγεθος του δείγματος n (δηλαδή, N>>n ή n/N<<1).

Μπορείτε να διαβάσετε περισσότερα για τη σχέση των παραπάνω διανομών στο άρθρο. Δίνονται επίσης παραδείγματα προσέγγισης και εξηγούνται οι συνθήκες πότε είναι δυνατό και με ποια ακρίβεια.

ΣΥΜΒΟΥΛΗ: Μπορείτε να διαβάσετε για άλλες διανομές του MS EXCEL στο άρθρο .

Χαιρετισμούς σε όλους τους αναγνώστες!

Η στατιστική ανάλυση, όπως γνωρίζετε, ασχολείται με τη συλλογή και την επεξεργασία πραγματικών δεδομένων. Είναι χρήσιμο, και συχνά κερδοφόρο, γιατί. τα σωστά συμπεράσματα σάς επιτρέπουν να αποφύγετε λάθη και απώλειες στο μέλλον και μερικές φορές να μαντέψετε σωστά αυτό ακριβώς το μέλλον. Τα δεδομένα που συλλέχθηκαν αντικατοπτρίζουν την κατάσταση κάποιου παρατηρούμενου φαινομένου. Τα δεδομένα είναι συχνά (αλλά όχι πάντα) αριθμητικά και μπορούν να χρησιμοποιηθούν με διάφορους μαθηματικούς χειρισμούς για την εξαγωγή πρόσθετων πληροφοριών.

Ωστόσο, δεν μετρώνται όλα τα φαινόμενα σε ποσοτική κλίμακα όπως 1, 2, 3 ... 100500 ... Όχι πάντα ένα φαινόμενο μπορεί να λάβει άπειρο ή μεγάλο αριθμό διαφορετικών καταστάσεων. Για παράδειγμα, το φύλο ενός ατόμου μπορεί να είναι είτε M είτε F. Ο σκοπευτής είτε χτυπά τον στόχο είτε αστοχεί. Μπορείτε να ψηφίσετε είτε «Υπέρ» ή «Κατά», κ.λπ. και τα λοιπά. Με άλλα λόγια, τέτοια δεδομένα αντικατοπτρίζουν την κατάσταση ενός εναλλακτικού χαρακτηριστικού - είτε "ναι" (το συμβάν έχει συμβεί) είτε "όχι" (το συμβάν δεν έχει συμβεί). Το επερχόμενο γεγονός (θετική έκβαση) ονομάζεται επίσης «επιτυχία». Τέτοια φαινόμενα μπορεί επίσης να είναι μαζικά και τυχαία. Επομένως, μπορούν να μετρηθούν και να εξαχθούν στατιστικά έγκυρα συμπεράσματα.

Τα πειράματα με τέτοια δεδομένα ονομάζονται Σχέδιο Bernoulli, προς τιμήν του διάσημου Ελβετού μαθηματικού που διαπίστωσε ότι με μεγάλο αριθμό δοκιμών, η αναλογία των θετικών αποτελεσμάτων προς τον συνολικό αριθμό των δοκιμών τείνει στην πιθανότητα να συμβεί αυτό το συμβάν.

Εναλλακτική μεταβλητή χαρακτηριστικών

Για να χρησιμοποιηθεί η μαθηματική συσκευή στην ανάλυση, τα αποτελέσματα τέτοιων παρατηρήσεων θα πρέπει να καταγράφονται σε αριθμητική μορφή. Για να γίνει αυτό, σε ένα θετικό αποτέλεσμα εκχωρείται ο αριθμός 1, ένα αρνητικό - 0. Με άλλα λόγια, έχουμε να κάνουμε με μια μεταβλητή που μπορεί να πάρει μόνο δύο τιμές: 0 ή 1.

Τι όφελος μπορεί να αντληθεί από αυτό; Στην πραγματικότητα, όχι λιγότερο από τα συνηθισμένα δεδομένα. Έτσι, είναι εύκολο να μετρήσετε τον αριθμό των θετικών αποτελεσμάτων - αρκεί να συνοψίσετε όλες τις τιμές, δηλ. όλα 1 (επιτυχία). Μπορείτε να προχωρήσετε περαιτέρω, αλλά για αυτό πρέπει να εισάγετε μερικές σημειώσεις.

Το πρώτο πράγμα που πρέπει να σημειωθεί είναι ότι τα θετικά αποτελέσματα (που είναι ίσα με 1) έχουν κάποια πιθανότητα να συμβούν. Για παράδειγμα, η λήψη κεφαλιών σε μια ρίψη νομίσματος είναι ½ ή 0,5. Αυτή η πιθανότητα παραδοσιακά υποδηλώνεται με το λατινικό γράμμα Π. Επομένως, η πιθανότητα να συμβεί ένα εναλλακτικό συμβάν είναι 1-σελ, που συμβολίζεται επίσης με q, αυτό είναι q = 1 – p. Αυτές οι ονομασίες μπορούν να συστηματοποιηθούν οπτικά με τη μορφή μεταβλητής πλάκας διανομής Χ.

Τώρα έχουμε μια λίστα με πιθανές τιμές και τις πιθανότητές τους. Μπορείτε να αρχίσετε να υπολογίζετε τέτοια υπέροχα χαρακτηριστικά μιας τυχαίας μεταβλητής όπως αναμενόμενη αξίακαι διασπορά. Να σας υπενθυμίσω ότι η μαθηματική προσδοκία υπολογίζεται ως το άθροισμα των γινομένων όλων των πιθανών τιμών και των αντίστοιχων πιθανοτήτων τους:

Ας υπολογίσουμε την αναμενόμενη τιμή χρησιμοποιώντας τη σημείωση στους παραπάνω πίνακες.

Αποδεικνύεται ότι η μαθηματική προσδοκία ενός εναλλακτικού σημείου είναι ίση με την πιθανότητα αυτού του γεγονότος - Π.

Τώρα ας ορίσουμε ποια είναι η διακύμανση ενός εναλλακτικού χαρακτηριστικού. Επιτρέψτε μου επίσης να σας υπενθυμίσω ότι η διακύμανση είναι το μέσο τετράγωνο των αποκλίσεων από τη μαθηματική προσδοκία. Ο γενικός τύπος (για διακριτά δεδομένα) είναι:

Εξ ου και η διακύμανση του εναλλακτικού χαρακτηριστικού:

Είναι εύκολο να δούμε ότι αυτή η διασπορά έχει μέγιστο 0,25 (στο p=0,5).

Τυπική απόκλιση - ρίζα της διακύμανσης:

Η μέγιστη τιμή δεν υπερβαίνει το 0,5.

Όπως μπορείτε να δείτε, τόσο η μαθηματική προσδοκία όσο και η διακύμανση του εναλλακτικού ζωδίου έχουν πολύ συμπαγή μορφή.

Διωνυμική κατανομή μιας τυχαίας μεταβλητής

Τώρα εξετάστε την κατάσταση από μια διαφορετική οπτική γωνία. Πράγματι, ποιος νοιάζεται που η μέση απώλεια κεφαλιών σε μία εκτίναξη είναι 0,5; Είναι ακόμη και αδύνατο να φανταστεί κανείς. Είναι πιο ενδιαφέρον να τεθεί το ερώτημα του αριθμού των κεφαλιών που έρχονται για έναν δεδομένο αριθμό ρίψεων.

Με άλλα λόγια, ο ερευνητής ενδιαφέρεται συχνά για την πιθανότητα να συμβεί ένας συγκεκριμένος αριθμός επιτυχημένων γεγονότων. Αυτός μπορεί να είναι ο αριθμός των ελαττωματικών προϊόντων στην δοκιμασμένη παρτίδα (1 - ελαττωματικό, 0 - καλό) ή ο αριθμός των ανακτήσεων (1 - υγιής, 0 - άρρωστος) κ.λπ. Ο αριθμός τέτοιων "επιτυχιών" θα είναι ίσος με το άθροισμα όλων των τιμών της μεταβλητής Χ, δηλ. τον αριθμό των μεμονωμένων αποτελεσμάτων.

Τυχαία τιμή σιονομάζεται διωνυμικό και παίρνει τιμές από 0 έως n(στο σι= 0 - όλα τα μέρη είναι καλά, με σι = n- όλα τα εξαρτήματα είναι ελαττωματικά). Υποτίθεται ότι όλες οι τιμές Χανεξάρτητα μεταξύ τους. Εξετάστε τα κύρια χαρακτηριστικά της διωνυμικής μεταβλητής, δηλαδή θα καθορίσουμε τη μαθηματική προσδοκία, διακύμανση και κατανομή της.

Η προσδοκία μιας διωνυμικής μεταβλητής είναι πολύ εύκολο να ληφθεί. Θυμηθείτε ότι υπάρχει ένα άθροισμα μαθηματικών προσδοκιών για κάθε προστιθέμενη αξία και είναι το ίδιο για όλους, επομένως:

Για παράδειγμα, η προσδοκία του αριθμού των κεφαλιών σε 100 ρίψεις είναι 100 × 0,5 = 50.

Τώρα εξάγουμε τον τύπο για τη διακύμανση της διωνυμικής μεταβλητής. είναι το άθροισμα των διακυμάνσεων. Από εδώ

Τυπική απόκλιση, αντίστοιχα

Για 100 ρίψεις νομισμάτων, η τυπική απόκλιση είναι

Και τέλος, θεωρήστε την κατανομή της διωνυμικής ποσότητας, δηλ. την πιθανότητα ότι η τυχαία μεταβλητή σιθα πάρει διαφορετικές τιμές κ, όπου 0≤k≤n. Για ένα νόμισμα, αυτό το πρόβλημα μπορεί να ακούγεται ως εξής: ποια είναι η πιθανότητα να λάβετε 40 κεφάλια σε 100 ρίψεις;

Για να κατανοήσουμε τη μέθοδο υπολογισμού, ας φανταστούμε ότι το κέρμα πετιέται μόνο 4 φορές. Κάθε πλευρά μπορεί να πέσει έξω κάθε φορά. Αναρωτιόμαστε: ποια είναι η πιθανότητα να πάρουμε 2 κεφάλια από 4 πετάξεις. Κάθε ρίψη είναι ανεξάρτητη η μία από την άλλη. Αυτό σημαίνει ότι η πιθανότητα να επιτευχθεί οποιοσδήποτε συνδυασμός θα είναι ίση με το γινόμενο των πιθανοτήτων ενός δεδομένου αποτελέσματος για κάθε μεμονωμένη ρίψη. Αφήστε το O να είναι κεφάλια και το P να είναι ουρές. Τότε, για παράδειγμα, ένας από τους συνδυασμούς που μας ταιριάζουν μπορεί να μοιάζει με OOPP, δηλαδή:

Η πιθανότητα ενός τέτοιου συνδυασμού είναι ίση με το γινόμενο δύο πιθανοτήτων να ανέβουν κεφαλές και δύο ακόμη πιθανοτήτων να μην ανέβουν κεφαλές (το αντίστροφο γεγονός υπολογίζεται ως 1-σελ), δηλ. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Αυτή είναι η πιθανότητα ενός από τους συνδυασμούς που μας ταιριάζουν. Αλλά η ερώτηση αφορούσε τον συνολικό αριθμό των αετών και όχι για κάποια συγκεκριμένη παραγγελία. Στη συνέχεια, πρέπει να προσθέσετε τις πιθανότητες όλων των συνδυασμών στους οποίους υπάρχουν ακριβώς 2 αετοί. Είναι σαφές ότι είναι όλα τα ίδια (το προϊόν δεν αλλάζει από την αλλαγή των θέσεων των παραγόντων). Επομένως, πρέπει να υπολογίσετε τον αριθμό τους και, στη συνέχεια, να πολλαπλασιάσετε με την πιθανότητα οποιουδήποτε τέτοιου συνδυασμού. Ας μετρήσουμε όλους τους συνδυασμούς των 4 ρίψεων των 2 αετών: RROO, RORO, ROOR, ORRO, OROR, OORR. Μόνο 6 επιλογές.

Επομένως, η επιθυμητή πιθανότητα να πάρει 2 κεφαλιές μετά από 4 βολές είναι 6×0,0625=0,375.

Ωστόσο, το μέτρημα με αυτόν τον τρόπο είναι κουραστικό. Ήδη για 10 νομίσματα, θα είναι πολύ δύσκολο να λάβετε τον συνολικό αριθμό επιλογών με ωμή βία. Επομένως, οι έξυπνοι άνθρωποι επινόησαν έναν τύπο πριν από πολύ καιρό, με τη βοήθεια του οποίου υπολογίζουν τον αριθμό των διαφορετικών συνδυασμών nστοιχεία από κ, όπου nείναι ο συνολικός αριθμός των στοιχείων, κείναι ο αριθμός των στοιχείων των οποίων οι επιλογές διάταξης υπολογίζονται. Συνδυαστική φόρμουλα του nστοιχεία από κείναι:

Παρόμοια πράγματα συμβαίνουν στην ενότητα των συνδυαστικών. Στέλνω όλους όσους θέλουν να βελτιώσουν τις γνώσεις τους εκεί. Ως εκ τούτου, παρεμπιπτόντως, το όνομα της διωνυμικής κατανομής (ο παραπάνω τύπος είναι ο συντελεστής στην επέκταση του διωνύμου του Newton).

Ο τύπος για τον προσδιορισμό της πιθανότητας μπορεί εύκολα να γενικευτεί σε οποιονδήποτε αριθμό nκαι κ. Ως αποτέλεσμα, ο τύπος διωνυμικής κατανομής έχει την ακόλουθη μορφή.

Με άλλα λόγια: πολλαπλασιάστε τον αριθμό των συνδυασμών που ταιριάζουν με την πιθανότητα ενός από αυτούς.

Για πρακτική χρήση, αρκεί απλώς να γνωρίζουμε τον τύπο για τη διωνυμική κατανομή. Και μπορεί να μην γνωρίζετε καν - παρακάτω είναι πώς να προσδιορίσετε την πιθανότητα χρησιμοποιώντας το Excel. Αλλά είναι καλύτερα να γνωρίζουμε.

Ας χρησιμοποιήσουμε αυτόν τον τύπο για να υπολογίσουμε την πιθανότητα να πάρουμε 40 κεφαλές σε 100 ρίψεις:

Ή μόλις 1,08%. Για σύγκριση, η πιθανότητα της μαθηματικής προσδοκίας αυτού του πειράματος, δηλαδή 50 κεφαλές, είναι 7,96%. Η μέγιστη πιθανότητα μιας διωνυμικής τιμής ανήκει στην τιμή που αντιστοιχεί στη μαθηματική προσδοκία.

Υπολογισμός πιθανοτήτων διωνυμικής κατανομής στο Excel

Εάν χρησιμοποιείτε μόνο χαρτί και αριθμομηχανή, τότε οι υπολογισμοί που χρησιμοποιούν τον τύπο διωνυμικής κατανομής, παρά την απουσία ολοκληρωμάτων, είναι αρκετά δύσκολοι. Για παράδειγμα, μια τιμή 100! - έχει περισσότερους από 150 χαρακτήρες. Είναι αδύνατο να υπολογιστεί αυτό με το χέρι. Παλαιότερα, αλλά και τώρα, χρησιμοποιήθηκαν κατά προσέγγιση τύποι για τον υπολογισμό τέτοιων ποσοτήτων. Προς το παρόν, συνιστάται η χρήση ειδικού λογισμικού, όπως το MS Excel. Έτσι, οποιοσδήποτε χρήστης (ακόμα και ανθρωπιστής από εκπαίδευση) μπορεί εύκολα να υπολογίσει την πιθανότητα της τιμής μιας διωνυμικά κατανεμημένης τυχαίας μεταβλητής.

Για να ενοποιήσουμε το υλικό, θα χρησιμοποιήσουμε το Excel για την ώρα ως κανονική αριθμομηχανή, δηλ. Ας κάνουμε έναν υπολογισμό βήμα προς βήμα χρησιμοποιώντας τον τύπο διωνυμικής κατανομής. Ας υπολογίσουμε, για παράδειγμα, την πιθανότητα να πάρουμε 50 κεφάλια. Παρακάτω είναι μια εικόνα με τα βήματα υπολογισμού και το τελικό αποτέλεσμα.

Όπως μπορείτε να δείτε, τα ενδιάμεσα αποτελέσματα είναι τέτοιας κλίμακας που δεν χωρούν σε ένα κελί, αν και απλές συναρτήσεις του τύπου χρησιμοποιούνται παντού: FACTOR (παραγοντικός υπολογισμός), POWER (αύξηση αριθμού σε ισχύ), καθώς και ως τελεστές πολλαπλασιασμού και διαίρεσης. Επιπλέον, αυτός ο υπολογισμός είναι μάλλον επαχθής, σε κάθε περίπτωση δεν είναι συμπαγής, αφού εμπλέκονται πολλά κύτταρα. Και ναι, είναι δύσκολο να το καταλάβεις.

Γενικά, το Excel παρέχει μια έτοιμη συνάρτηση για τον υπολογισμό των πιθανοτήτων της διωνυμικής κατανομής. Η συνάρτηση ονομάζεται BINOM.DIST.

Αριθμός επιτυχιώνείναι ο αριθμός των επιτυχημένων δοκιμών. Έχουμε 50 από αυτούς.

Αριθμός δοκιμών- αριθμός ρίψεων: 100 φορές.

Πιθανότητα Επιτυχίας– η πιθανότητα να πάρει κεφάλια σε μία εκτίναξη είναι 0,5.

Αναπόσπαστο- υποδεικνύεται είτε 1 είτε 0. Εάν 0, τότε υπολογίζεται η πιθανότητα P(B=k); αν 1, τότε υπολογίζεται η διωνυμική συνάρτηση κατανομής, δηλ. άθροισμα όλων των πιθανοτήτων από Β=0πριν Β=κπεριεκτικός.

Πατάμε ΟΚ και παίρνουμε το ίδιο αποτέλεσμα με παραπάνω, μόνο που όλα υπολογίστηκαν από μία συνάρτηση.

Πολύ άνετα. Για χάρη του πειράματος, αντί για την τελευταία παράμετρο 0, βάζουμε 1. Παίρνουμε 0,5398. Αυτό σημαίνει ότι σε 100 πετάξεις νομισμάτων, η πιθανότητα να πάρει κεφάλια μεταξύ 0 και 50 είναι σχεδόν 54%. Και στην αρχή φαινόταν ότι έπρεπε να είναι 50%. Γενικά, οι υπολογισμοί γίνονται εύκολα και γρήγορα.

Ένας πραγματικός αναλυτής πρέπει να καταλάβει πώς συμπεριφέρεται η συνάρτηση (ποια είναι η κατανομή της), οπότε ας υπολογίσουμε τις πιθανότητες για όλες τις τιμές από το 0 έως το 100. Δηλαδή, ας αναρωτηθούμε: ποια είναι η πιθανότητα να μην πέσει ούτε ένας αετός, ότι θα πέσει 1 αετός, 2, 3, 50, 90 ή 100. Ο υπολογισμός φαίνεται στην παρακάτω αυτοκινούμενη εικόνα. Η μπλε γραμμή είναι η ίδια η διωνυμική κατανομή, η κόκκινη τελεία είναι η πιθανότητα για έναν συγκεκριμένο αριθμό επιτυχιών k.

Θα μπορούσε να ρωτήσει κανείς, δεν είναι η διωνυμική κατανομή παρόμοια με... Ναι, πολύ παρόμοια. Ακόμη και ο De Moivre (το 1733) είπε ότι με μεγάλα δείγματα η διωνυμική κατανομή πλησιάζει (δεν ξέρω πώς λεγόταν τότε), αλλά κανείς δεν τον άκουσε. Μόνο ο Gauss, και μετά ο Laplace, 60-70 χρόνια αργότερα, ανακάλυψαν ξανά και μελέτησαν προσεκτικά τον νόμο της κανονικής κατανομής. Το παραπάνω γράφημα δείχνει ξεκάθαρα ότι η μέγιστη πιθανότητα πέφτει στη μαθηματική προσδοκία και καθώς αυτή αποκλίνει από αυτήν, μειώνεται απότομα. Όπως ακριβώς ο κανονικός νόμος.

Η διωνυμική κατανομή έχει μεγάλη πρακτική σημασία, εμφανίζεται αρκετά συχνά. Χρησιμοποιώντας το Excel, οι υπολογισμοί πραγματοποιούνται εύκολα και γρήγορα. Μη διστάσετε λοιπόν να το χρησιμοποιήσετε.

Σε αυτό προτείνω να αποχαιρετήσω μέχρι την επόμενη συνάντηση. Ό,τι καλύτερο, να είστε υγιείς!

Κεφάλαιο 7

Συγκεκριμένοι νόμοι κατανομής τυχαίων μεταβλητών

Τύποι νόμων κατανομής διακριτών τυχαίων μεταβλητών

Αφήστε μια διακριτή τυχαία μεταβλητή να λάβει τις τιμές Χ 1 , Χ 2 , …, x n,…. Οι πιθανότητες αυτών των τιμών μπορούν να υπολογιστούν χρησιμοποιώντας διάφορους τύπους, για παράδειγμα, χρησιμοποιώντας τα βασικά θεωρήματα της θεωρίας πιθανοτήτων, τον τύπο του Bernoulli ή κάποιους άλλους τύπους. Για ορισμένους από αυτούς τους τύπους, ο νόμος διανομής έχει το δικό του όνομα.

Οι πιο συνηθισμένοι νόμοι κατανομής μιας διακριτής τυχαίας μεταβλητής είναι ο διωνυμικός, ο γεωμετρικός, ο υπεργεωμετρικός νόμος κατανομής του Poisson.

Διωνυμικός νόμος κατανομής

Αφήστε το να παραχθεί nανεξάρτητες δοκιμές, σε καθεμία από τις οποίες μπορεί να συμβεί ένα γεγονός ή όχι ΑΛΛΑ. Η πιθανότητα εμφάνισης αυτού του συμβάντος σε κάθε δοκιμή είναι σταθερή, δεν εξαρτάται από τον αριθμό δοκιμής και είναι ίση με R=R(ΑΛΛΑ). Εξ ου και η πιθανότητα να μην συμβεί το γεγονός ΑΛΛΑσε κάθε δοκιμή είναι επίσης σταθερή και ίση με q=1–R. Θεωρήστε μια τυχαία μεταβλητή Χίσο με τον αριθμό των περιστατικών του συμβάντος ΑΛΛΑσε nδοκιμές. Είναι προφανές ότι οι τιμές αυτής της ποσότητας είναι ίσες με

Χ 1 =0 - γεγονός ΑΛΛΑσε nοι δοκιμές δεν εμφανίστηκαν.

Χ 2 =1 – γεγονός ΑΛΛΑσε nδοκιμές εμφανίστηκαν μια φορά?

Χ 3 =2 - εκδήλωση ΑΛΛΑσε nοι δοκιμές εμφανίστηκαν δύο φορές.

…………………………………………………………..

x n +1 = n- Εκδήλωση ΑΛΛΑσε nδοκιμές εμφανίστηκαν τα πάντα nμια φορά.

Οι πιθανότητες αυτών των τιμών μπορούν να υπολογιστούν χρησιμοποιώντας τον τύπο Bernoulli (4.1):

όπου προς την=0, 1, 2, …,n .

Διωνυμικός νόμος κατανομής Χίσο με τον αριθμό των επιτυχιών σε nΔοκιμές Bernoulli, με πιθανότητα επιτυχίας R.

Άρα, μια διακριτή τυχαία μεταβλητή έχει διωνυμική κατανομή (ή κατανέμεται σύμφωνα με τον διωνυμικό νόμο) εάν οι πιθανές τιμές της είναι 0, 1, 2, ..., n, και οι αντίστοιχες πιθανότητες υπολογίζονται με τον τύπο (7.1).

Η διωνυμική κατανομή εξαρτάται από δύο Παράμετροι Rκαι n.

Η σειρά κατανομής μιας τυχαίας μεταβλητής που κατανέμεται σύμφωνα με τον διωνυμικό νόμο έχει τη μορφή:

Χ κ n
R

Παράδειγμα 7.1 . Τρεις ανεξάρτητες βολές εκτοξεύονται στο στόχο. Η πιθανότητα να χτυπήσετε κάθε βολή είναι 0,4. Τυχαία τιμή Χ- τον αριθμό των χτυπημάτων στο στόχο. Κατασκευάστε τη σειρά διανομής του.

Λύση. Πιθανές τιμές μιας τυχαίας μεταβλητής Χείναι Χ 1 =0; Χ 2 =1; Χ 3 =2; Χ 4=3. Βρείτε τις αντίστοιχες πιθανότητες χρησιμοποιώντας τον τύπο Bernoulli. Είναι εύκολο να αποδειχθεί ότι η εφαρμογή αυτού του τύπου εδώ είναι πλήρως δικαιολογημένη. Σημειώστε ότι η πιθανότητα να μην χτυπηθεί ο στόχος με μία βολή θα είναι ίση με 1-0,4=0,6. Παίρνω

Η σειρά διανομής έχει την ακόλουθη μορφή:

Χ
R 0,216 0,432 0,288 0,064

Είναι εύκολο να ελέγξετε ότι το άθροισμα όλων των πιθανοτήτων είναι ίσο με 1. Η ίδια η τυχαία μεταβλητή Χκατανέμεται σύμφωνα με τον διωνυμικό νόμο. ■

Ας βρούμε τη μαθηματική προσδοκία και διακύμανση μιας τυχαίας μεταβλητής που κατανέμεται σύμφωνα με το νόμο του διωνύμου.

Κατά την επίλυση του παραδείγματος 6.5, φάνηκε ότι η μαθηματική προσδοκία του αριθμού των εμφανίσεων ενός γεγονότος ΑΛΛΑσε nανεξάρτητες δοκιμές, εάν η πιθανότητα εμφάνισης ΑΛΛΑσε κάθε δοκιμή είναι σταθερή και ίση R, ίσον n· R

Σε αυτό το παράδειγμα, χρησιμοποιήθηκε μια τυχαία μεταβλητή, κατανεμημένη σύμφωνα με το νόμο του διωνύμου. Επομένως, η λύση του Παραδείγματος 6.5 είναι, στην πραγματικότητα, απόδειξη του παρακάτω θεωρήματος.

Θεώρημα 7.1.Η μαθηματική προσδοκία μιας διακριτής τυχαίας μεταβλητής που κατανέμεται σύμφωνα με τον διωνυμικό νόμο είναι ίση με το γινόμενο του αριθμού των δοκιμών και της πιθανότητας «επιτυχίας», δηλ. Μ(Χ)=n· R.

Θεώρημα 7.2.Η διακύμανση μιας διακριτής τυχαίας μεταβλητής που κατανέμεται σύμφωνα με τον διωνυμικό νόμο είναι ίση με το γινόμενο του αριθμού των δοκιμών με την πιθανότητα «επιτυχίας» και την πιθανότητα «αποτυχίας», δηλ. ρε(Χ)=npq.

Η λοξότητα και η κύρτωση μιας τυχαίας μεταβλητής που κατανέμεται σύμφωνα με τον διωνυμικό νόμο προσδιορίζονται από τους τύπους

Αυτοί οι τύποι μπορούν να ληφθούν χρησιμοποιώντας την έννοια των αρχικών και κεντρικών ροπών.

Ο νόμος της διωνυμικής κατανομής βασίζεται σε πολλές πραγματικές καταστάσεις. Για μεγάλες αξίες nη διωνυμική κατανομή μπορεί να προσεγγιστεί από άλλες κατανομές, ιδιαίτερα την κατανομή Poisson.

Κατανομή Poisson

Ας υπάρχει nΔοκιμές Bernoulli, με τον αριθμό των δοκιμών nαρκετά μεγάλο. Προηγουμένως, είχε αποδειχθεί ότι σε αυτή την περίπτωση (αν, επιπλέον, η πιθανότητα Rεξελίξεις ΑΛΛΑπολύ μικρό) για να βρείτε την πιθανότητα ότι ένα γεγονός ΑΛΛΑνα εμφανιστεί tμία φορά στις δοκιμές, μπορείτε να χρησιμοποιήσετε τον τύπο Poisson (4.9). Αν η τυχαία μεταβλητή Χσημαίνει τον αριθμό των περιστατικών του συμβάντος ΑΛΛΑσε nΔοκιμές Bernoulli, τότε η πιθανότητα ότι Χθα πάρει το νόημα κμπορεί να υπολογιστεί με τον τύπο

, (7.2)

όπου λ = np.

Νόμος διανομής Poissonονομάζεται κατανομή μιας διακριτής τυχαίας μεταβλητής Χ, για τις οποίες οι πιθανές τιμές είναι μη αρνητικοί ακέραιοι και οι πιθανότητες p tαυτές οι τιμές βρίσκονται με τον τύπο (7.2).

αξία λ = npπου ονομάζεται παράμετροςΚατανομή Poisson.

Μια τυχαία μεταβλητή που κατανέμεται σύμφωνα με το νόμο του Poisson μπορεί να λάβει άπειρο αριθμό τιμών. Αφού για αυτή την κατανομή η πιθανότητα Rη εμφάνιση ενός γεγονότος σε κάθε δοκιμή είναι μικρή, τότε αυτή η κατανομή ονομάζεται μερικές φορές νόμος των σπάνιων φαινομένων.

Η σειρά κατανομής μιας τυχαίας μεταβλητής που κατανέμεται σύμφωνα με το νόμο Poisson έχει τη μορφή

Χ t
R

Είναι εύκολο να επαληθεύσουμε ότι το άθροισμα των πιθανοτήτων της δεύτερης σειράς είναι ίσο με 1. Για να γίνει αυτό, πρέπει να θυμόμαστε ότι η συνάρτηση μπορεί να επεκταθεί σε μια σειρά Maclaurin, η οποία συγκλίνει για οποιαδήποτε Χ. Σε αυτή την περίπτωση έχουμε

. (7.3)

Όπως σημειώθηκε, ο νόμος του Poisson σε ορισμένες περιοριστικές περιπτώσεις αντικαθιστά τον διωνυμικό νόμο. Ένα παράδειγμα είναι μια τυχαία μεταβλητή Χ, οι τιμές των οποίων είναι ίσες με τον αριθμό των αστοχιών για ορισμένο χρονικό διάστημα με επαναλαμβανόμενη χρήση τεχνικής συσκευής. Υποτίθεται ότι αυτή η συσκευή είναι υψηλής αξιοπιστίας, δηλ. η πιθανότητα αποτυχίας σε μία εφαρμογή είναι πολύ μικρή.

Εκτός από τέτοιες περιοριστικές περιπτώσεις, στην πράξη υπάρχουν τυχαίες μεταβλητές που κατανέμονται σύμφωνα με το νόμο Poisson, που δεν σχετίζονται με τη διωνυμική κατανομή. Για παράδειγμα, η διανομή Poisson χρησιμοποιείται συχνά όταν ασχολείται με τον αριθμό των γεγονότων που συμβαίνουν σε μια χρονική περίοδο (ο αριθμός των κλήσεων στο τηλεφωνικό κέντρο κατά τη διάρκεια της ώρας, ο αριθμός των αυτοκινήτων που έφτασαν στο πλυντήριο αυτοκινήτων κατά τη διάρκεια της ημέρας, τον αριθμό των στάσεων μηχανής ανά εβδομάδα, κ.λπ. .). Όλα αυτά τα γεγονότα πρέπει να αποτελούν τη λεγόμενη ροή γεγονότων, η οποία είναι μία από τις βασικές έννοιες της θεωρίας ουρών. Παράμετρος λ χαρακτηρίζει τη μέση ένταση της ροής των γεγονότων.

Η διωνυμική κατανομή είναι μια από τις πιο σημαντικές κατανομές πιθανοτήτων για μια διακριτά μεταβαλλόμενη τυχαία μεταβλητή. Η διωνυμική κατανομή είναι η κατανομή πιθανότητας ενός αριθμού ΜΕκδήλωση ΑΛΛΑσε nαμοιβαία ανεξάρτητες παρατηρήσεις. Συχνά ένα γεγονός ΑΛΛΑονομάζεται "επιτυχία" της παρατήρησης και το αντίθετο γεγονός - "αποτυχία", αλλά αυτός ο χαρακτηρισμός είναι πολύ υπό όρους.

Όροι της διωνυμικής κατανομής:

  • πραγματοποιηθεί συνολικά nδοκιμές στις οποίες το γεγονός ΑΛΛΑμπορεί να συμβεί ή όχι.
  • Εκδήλωση ΑΛΛΑσε καθεμία από τις δοκιμές μπορεί να συμβεί με την ίδια πιθανότητα Π;
  • τα τεστ είναι αμοιβαία ανεξάρτητα.

Η πιθανότητα ότι σε nδοκιμαστική εκδήλωση ΑΛΛΑακριβώς Μφορές, μπορεί να υπολογιστεί χρησιμοποιώντας τον τύπο Bernoulli:

,

όπου Π- την πιθανότητα να συμβεί το συμβάν ΑΛΛΑ;

q = 1 - Πείναι η πιθανότητα να συμβεί το αντίθετο γεγονός.

Ας το καταλάβουμε γιατί η διωνυμική κατανομή σχετίζεται με τον τύπο Bernoulli με τον τρόπο που περιγράφηκε παραπάνω . Εκδήλωση - ο αριθμός των επιτυχιών σε nοι δοκιμές χωρίζονται σε έναν αριθμό επιλογών, σε καθεμία από τις οποίες επιτυγχάνεται επιτυχία Μδοκιμές και αποτυχία - μέσα n - Μδοκιμές. Εξετάστε μία από αυτές τις επιλογές - σι1 . Σύμφωνα με τον κανόνα της πρόσθεσης των πιθανοτήτων, πολλαπλασιάζουμε τις πιθανότητες αντίθετων γεγονότων:

,

και αν δηλώνουμε q = 1 - Π, έπειτα

.

Την ίδια πιθανότητα θα έχει οποιαδήποτε άλλη επιλογή στην οποία Μεπιτυχία και n - Μαποτυχίες. Ο αριθμός τέτοιων επιλογών είναι ίσος με τον αριθμό των τρόπων από τους οποίους είναι δυνατή nτεστ πάρε Μεπιτυχία.

Το άθροισμα των πιθανοτήτων όλων Μαριθμός συμβάντος ΑΛΛΑ(αριθμοί από 0 έως n) ισούται με ένα:

όπου κάθε όρος είναι ένας όρος του διωνύμου του Newton. Επομένως, η εξεταζόμενη κατανομή ονομάζεται διωνυμική κατανομή.

Στην πράξη, είναι συχνά απαραίτητος ο υπολογισμός των πιθανοτήτων «το πολύ Μεπιτυχία σε nδοκιμές» ή «τουλάχιστον Μεπιτυχία σε nδοκιμές". Για αυτό χρησιμοποιούνται οι ακόλουθοι τύποι.

Η ολοκληρωτική συνάρτηση, δηλαδή πιθανότητα φά(Μ) αυτο μεσα nεκδήλωση παρατήρησης ΑΛΛΑδεν θα έρθει άλλο Μμια φορά, μπορεί να υπολογιστεί χρησιμοποιώντας τον τύπο:

Με τη σειρά του πιθανότητα φά(≥Μ) αυτο μεσα nεκδήλωση παρατήρησης ΑΛΛΑελάτε τουλάχιστον Μμια φορά, υπολογίζεται με τον τύπο:

Μερικές φορές είναι πιο βολικό να υπολογίσετε την πιθανότητα ότι σε nεκδήλωση παρατήρησης ΑΛΛΑδεν θα έρθει άλλο Μφορές, μέσω της πιθανότητας του αντίθετου συμβάντος:

.

Ποιος από τους τύπους θα χρησιμοποιηθεί εξαρτάται από το ποιος από αυτούς περιέχει λιγότερους όρους.

Τα χαρακτηριστικά της διωνυμικής κατανομής υπολογίζονται χρησιμοποιώντας τους παρακάτω τύπους .

Αναμενόμενη αξία: .

διασπορά: .

Τυπική απόκλιση: .

Διωνυμική κατανομή και υπολογισμοί στο MS Excel

Διωνυμική Πιθανότητα Κατανομής Π n ( Μ) και την τιμή της ολοκληρωτικής συνάρτησης φά(Μ) μπορεί να υπολογιστεί χρησιμοποιώντας τη συνάρτηση MS Excel BINOM.DIST. Το παράθυρο για τον αντίστοιχο υπολογισμό φαίνεται παρακάτω (κάντε κλικ στο αριστερό κουμπί του ποντικιού για μεγέθυνση).


Το MS Excel απαιτεί να εισαγάγετε τα ακόλουθα δεδομένα:

  • αριθμός επιτυχιών·
  • αριθμός δοκιμών·
  • πιθανότητα επιτυχίας?
  • ολοκλήρωμα - λογική τιμή: 0 - εάν πρέπει να υπολογίσετε την πιθανότητα Π n ( Μ) και 1 - εάν η πιθανότητα φά(Μ).

Παράδειγμα 1Ο διευθυντής της εταιρείας συνόψισε πληροφορίες σχετικά με τον αριθμό των καμερών που πωλήθηκαν τις τελευταίες 100 ημέρες. Ο πίνακας συνοψίζει τις πληροφορίες και υπολόγισε τις πιθανότητες να πωλείται ένας συγκεκριμένος αριθμός καμερών ανά ημέρα.

Η μέρα τελειώνει με κέρδος αν πουληθούν 13 ή περισσότερες κάμερες. Η πιθανότητα ότι η ημέρα θα λειτουργήσει με κέρδος:

Η πιθανότητα ότι η ημέρα θα λειτουργήσει χωρίς κέρδος:

Ας είναι σταθερή η πιθανότητα ότι η ημέρα έχει υπολογιστεί με κέρδος και είναι ίση με 0,61 και ο αριθμός των καμερών που πωλούνται ανά ημέρα δεν εξαρτάται από την ημέρα. Στη συνέχεια, μπορείτε να χρησιμοποιήσετε τη διωνυμική κατανομή, όπου το συμβάν ΑΛΛΑ- η μέρα θα λειτουργήσει με κέρδος, - χωρίς κέρδος.

Η πιθανότητα από τις 6 ημέρες να λειτουργήσουν όλες με κέρδος:

.

Λαμβάνουμε το ίδιο αποτέλεσμα χρησιμοποιώντας τη συνάρτηση MS Excel BINOM.DIST (η τιμή της τιμής του ακέραιου είναι 0):

Π 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Η πιθανότητα από τις 6 ημέρες 4 ή περισσότερες ημέρες να λειτουργήσουν με κέρδος:

όπου ,

,

Χρησιμοποιώντας τη συνάρτηση MS Excel BINOM.DIST, υπολογίζουμε την πιθανότητα ότι από τις 6 ημέρες δεν θα συμπληρωθούν περισσότερες από 3 ημέρες με κέρδος (η τιμή της ακέραιης τιμής είναι 1):

Π 6 (≤3 ) = BINOM.DIST(3, 6, 0,61, 1) = 0,435.

Η πιθανότητα από τις 6 ημέρες να λυθούν όλες με απώλειες:

,

Υπολογίζουμε τον ίδιο δείκτη χρησιμοποιώντας τη συνάρτηση MS Excel BINOM.DIST:

Π 6 (0 ) = BINOM.DIST(0; 6; 0.61; 0) = 0.0035.

Λύστε μόνοι σας το πρόβλημα και μετά δείτε τη λύση

Παράδειγμα 2Ένα δοχείο περιέχει 2 άσπρες μπάλες και 3 μαύρες. Μια μπάλα βγαίνει από τη λάρνακα, το χρώμα γίνεται και επανατοποθετείται. Η προσπάθεια επαναλαμβάνεται 5 φορές. Ο αριθμός των εμφανίσεων λευκών σφαιρών είναι μια διακριτή τυχαία μεταβλητή Χ, κατανέμεται σύμφωνα με τον διωνυμικό νόμο. Να συνθέσετε τον νόμο κατανομής μιας τυχαίας μεταβλητής. Προσδιορίστε τον τρόπο λειτουργίας, τη μαθηματική προσδοκία και τη διακύμανση.

Συνεχίζουμε να λύνουμε τα προβλήματα μαζί

Παράδειγμα 3Από την υπηρεσία ταχυμεταφορών πήγε στα αντικείμενα n= 5 ταχυμεταφορείς. Κάθε κούριερ με πιθανότητα Π= 0,3 είναι αργά για το αντικείμενο ανεξάρτητα από τα άλλα. Διακριτή τυχαία μεταβλητή Χ- ο αριθμός των καθυστερημένων ταχυμεταφορών. Κατασκευάστε μια σειρά διανομής αυτής της τυχαίας μεταβλητής. Βρείτε τη μαθηματική προσδοκία, διακύμανση, τυπική απόκλιση. Βρείτε την πιθανότητα ότι τουλάχιστον δύο ταχυμεταφορείς θα καθυστερήσουν στα αντικείμενα.