Biografi Ciri-ciri Analisis

Fungsi taburan empirikal, sifat. Fungsi taburan empirikal Dengan menggunakan sampel ini, bina fungsi taburan empirikal

Seperti yang diketahui, hukum taburan pembolehubah rawak boleh ditentukan dalam pelbagai cara. Pembolehubah rawak diskret boleh ditentukan menggunakan siri taburan atau fungsi kamiran, dan pembolehubah rawak berterusan boleh ditentukan menggunakan sama ada kamiran atau fungsi pembezaan. Mari kita pertimbangkan analog selektif kedua-dua fungsi ini.

Biarkan terdapat satu set sampel nilai bagi beberapa pembolehubah volum rawak dan setiap pilihan daripada set ini dikaitkan dengan kekerapannya. Biar lebih jauh ialah beberapa nombor nyata, dan – bilangan nilai sampel pembolehubah rawak
, lebih kecil .Kemudian nombor ialah kekerapan nilai kuantiti yang diperhatikan dalam sampel X, lebih kecil , mereka. kekerapan kejadian
. Apabila berubah x dalam kes umum, nilai juga akan berubah . Ini bermakna bahawa kekerapan relatif adalah fungsi hujah . Dan kerana fungsi ini didapati daripada data sampel yang diperoleh hasil daripada eksperimen, ia dipanggil selektif atau empirikal.

Definisi 10.15. Fungsi pengedaran empirikal(fungsi taburan pensampelan) ialah fungsi
, menentukan untuk setiap nilai x kekerapan relatif acara itu
.

(10.19)

Berbeza dengan fungsi taburan pensampelan empirikal, fungsi taburan F(x) daripada populasi umum dipanggil fungsi taburan teori. Perbezaan di antara mereka ialah fungsi teori F(x) menentukan kebarangkalian sesuatu kejadian
, dan yang empirikal ialah kekerapan relatif bagi peristiwa yang sama. Daripada teorem Bernoulli ia berikut

,
(10.20)

mereka. pada umumnya kebarangkalian
dan kekerapan relatif acara itu
, iaitu
berbeza sedikit antara satu sama lain. Daripada ini, adalah dinasihatkan untuk menggunakan fungsi taburan empirikal sampel untuk menghampiri fungsi taburan teori (integral) populasi umum.

Fungsi
Dan
mempunyai sifat yang sama. Ini berikutan daripada definisi fungsi.

Hartanah
:


Contoh 10.4. Bina fungsi empirikal berdasarkan taburan sampel yang diberikan:

Pilihan

Kekerapan

Penyelesaian: Mari cari saiz sampel n= 12+18+30=60. Pilihan terkecil
, oleh itu,
di
. Maknanya
, iaitu
diperhatikan 12 kali, oleh itu:

=
di
.

Maknanya x< 10, iaitu
Dan
diperhatikan 12+18=30 kali, oleh itu,
=
di
. Pada

.

Fungsi taburan empirikal yang diperlukan:

=

Jadual
ditunjukkan dalam Rajah. 10.2

R
ialah. 10.2

Soalan keselamatan

1. Apakah masalah utama yang diselesaikan oleh statistik matematik? 2. Populasi am dan sampel? 3. Tentukan saiz sampel. 4. Apakah sampel yang dipanggil wakil? 5. Kesilapan keterwakilan. 6. Kaedah asas persampelan. 7. Konsep kekerapan, kekerapan relatif. 8. Konsep siri statistik. 9. Tuliskan formula Sturges. 10. Merumus konsep julat sampel, median dan mod. 11. Poligon kekerapan, histogram. 12. Konsep anggaran titik populasi sampel. 13. Anggaran mata berat sebelah dan tidak berat sebelah. 14. Merumus konsep purata sampel. 15. Merumus konsep varians sampel. 16. Merumuskan konsep sisihan piawai sampel. 17. Merumuskan konsep pekali variasi sampel. 18. Merumus konsep min geometri sampel.

Penentuan fungsi taburan empirikal

Biarkan $X$ menjadi pembolehubah rawak. $F(x)$ ialah fungsi taburan pembolehubah rawak yang diberikan. Kami akan menjalankan eksperimen $n$ ke atas pembolehubah rawak yang diberikan di bawah keadaan yang sama, bebas antara satu sama lain. Dalam kes ini, kami memperoleh urutan nilai $x_1,\ x_2\ $, ... ,$\ x_n$, yang dipanggil sampel.

Definisi 1

Setiap nilai $x_i$ ($i=1,2\ $, ... ,$ \ n$) dipanggil varian.

Satu anggaran fungsi taburan teori ialah fungsi taburan empirikal.

Definisi 3

Fungsi taburan empirikal $F_n(x)$ ialah fungsi yang menentukan bagi setiap nilai $x$ kekerapan relatif peristiwa $X \

di mana $n_x$ ialah bilangan pilihan kurang daripada $x$, $n$ ialah saiz sampel.

Perbezaan antara fungsi empirikal dan fungsi teori ialah fungsi teori menentukan kebarangkalian kejadian $X

Sifat fungsi taburan empirikal

Mari kita pertimbangkan beberapa sifat asas fungsi taburan.

    Julat fungsi $F_n\left(x\right)$ ialah segmen $$.

    $F_n\left(x\right)$ ialah fungsi tidak menurun.

    $F_n\left(x\right)$ ialah fungsi berterusan kiri.

    $F_n\left(x\right)$ ialah fungsi pemalar sekeping dan hanya meningkat pada titik nilai pembolehubah rawak $X$

    Biarkan $X_1$ menjadi yang terkecil dan $X_n$ varian terbesar. Kemudian $F_n\left(x\right)=0$ untuk $(x\le X)_1$ dan $F_n\left(x\right)=1$ untuk $x\ge X_n$.

Mari kita perkenalkan teorem yang menghubungkan fungsi teori dan empirikal.

Teorem 1

Biarkan $F_n\left(x\right)$ ialah fungsi taburan empirikal, dan $F\left(x\right)$ ialah fungsi taburan teori bagi sampel am. Kemudian kesamaan memegang:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Contoh masalah mencari fungsi taburan empirikal

Contoh 1

Biarkan taburan pensampelan mempunyai data berikut direkodkan menggunakan jadual:

Rajah 1.

Cari saiz sampel, cipta fungsi taburan empirikal dan plotkannya.

Saiz sampel: $n=5+10+15+20=50$.

Mengikut sifat 5, kita mempunyai itu untuk $x\le 1$ $F_n\left(x\right)=0$, dan untuk $x>4$ $F_n\left(x\right)=1$.

nilai $x

nilai $x

nilai $x

Oleh itu kita mendapat:

Rajah 2.

Rajah 3.

Contoh 2

20 bandar dipilih secara rawak dari bandar-bandar di bahagian tengah Rusia, yang mana data berikut mengenai tambang pengangkutan awam diperoleh: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13, 13, 12, 12, 15, 14, 14.

Buat fungsi taburan empirikal untuk sampel ini dan plotkannya.

Mari tuliskan nilai sampel dalam tertib menaik dan hitung kekerapan setiap nilai. Kami mendapat jadual berikut:

Rajah 4.

Saiz sampel: $n=20$.

Mengikut sifat 5, kita mempunyai itu untuk $x\le 12$ $F_n\left(x\right)=0$, dan untuk $x>15$ $F_n\left(x\right)=1$.

nilai $x

nilai $x

nilai $x

Oleh itu kita mendapat:

Rajah 5.

Mari kita plot taburan empirikal:

Rajah 6.

Keaslian: $92.12\%$.

Ketahui apakah formula empirikal itu. Dalam kimia, EP ialah cara paling mudah untuk menerangkan sebatian—pada asasnya senarai unsur yang membentuk sebatian berdasarkan peratusannya. Perlu diingatkan bahawa formula mudah ini tidak menerangkan pesanan atom dalam sebatian, ia hanya menunjukkan unsur-unsur yang terdiri daripadanya. Contohnya:

  • Sebatian yang terdiri daripada 40.92% karbon; 4.58% hidrogen dan 54.5% oksigen akan mempunyai formula empirik C 3 H 4 O 3 (contoh cara mencari EF bagi sebatian ini akan dibincangkan dalam bahagian kedua).
  • Fahami istilah "komposisi peratusan.""Peratusan komposisi" ialah peratusan setiap atom individu dalam keseluruhan sebatian yang dipersoalkan. Untuk mencari formula empirikal sebatian, anda perlu mengetahui peratusan komposisi sebatian itu. Jika anda mencari formula empirikal untuk kerja rumah, maka peratusan kemungkinan besar akan diberikan.

    • Untuk mencari peratusan komposisi sebatian kimia dalam makmal, ia tertakluk kepada beberapa eksperimen fizikal dan kemudian analisis kuantitatif. Melainkan anda berada di makmal, anda tidak perlu melakukan eksperimen ini.
  • Perlu diingat bahawa anda perlu berurusan dengan atom gram. Atom gram ialah jumlah tertentu bahan yang jisimnya sama dengan jisim atomnya. Untuk mencari atom gram, anda perlu menggunakan persamaan berikut: Peratusan unsur dalam sebatian dibahagikan dengan jisim atom unsur itu.

    • Katakan, sebagai contoh, kita mempunyai sebatian yang mengandungi 40.92% karbon. Jisim atom karbon ialah 12, jadi persamaan kita ialah 40.92 / 12 = 3.41.
  • Mengetahui cara mencari nisbah atom. Apabila bekerja dengan sebatian, anda akan mendapat lebih daripada satu atom gram. Selepas menemui semua atom gram sebatian anda, lihat mereka. Untuk mencari nisbah atom, anda perlu memilih nilai gram-atom terkecil yang telah anda kira. Kemudian anda perlu membahagikan semua atom gram kepada atom gram terkecil. Contohnya:

    • Katakan anda bekerja dengan sebatian yang mengandungi tiga atom gram: 1.5; 2 dan 2.5. Yang terkecil daripada nombor ini ialah 1.5. Oleh itu, untuk mencari nisbah atom, anda mesti membahagikan semua nombor dengan 1.5 dan meletakkan tanda nisbah di antara mereka. : .
    • 1.5 / 1.5 = 1. 2 / 1.5 = 1.33. 2.5 / 1.5 = 1.66. Oleh itu, nisbah atom ialah 1: 1,33: 1,66 .
  • Fahami cara menukar nilai nisbah atom kepada integer. Semasa menulis formula empirikal, anda mesti menggunakan nombor bulat. Ini bermakna anda tidak boleh menggunakan nombor seperti 1.33. Selepas anda mencari nisbah atom, anda perlu menukar pecahan (seperti 1.33) kepada nombor bulat (seperti 3). Untuk melakukan ini, anda perlu mencari integer, mendarabkan setiap nombor nisbah atom yang mana anda akan mendapat integer. Contohnya:

    • Cuba 2. Darab nombor nisbah atom (1, 1.33, dan 1.66) dengan 2. Anda mendapat 2, 2.66, dan 3.32. Ini bukan integer, jadi 2 tidak sesuai.
    • Cuba 3. Jika anda darab 1, 1.33 dan 1.66 dengan 3, anda akan mendapat 3, 4 dan 5 masing-masing. Oleh itu, nisbah atom integer mempunyai bentuk 3: 4: 5 .
  • Purata sampel.

    Biarkan sampel bersaiz n diekstrak untuk mengkaji populasi umum mengenai ciri kuantitatif X.

    Min sampel ialah min aritmetik sesuatu ciri dalam populasi sampel.

    Varians sampel.

    Untuk memerhatikan penyebaran ciri kuantitatif nilai sampel di sekitar nilai puratanya, ciri ringkasan diperkenalkan - varians sampel.

    Varians sampel ialah min aritmetik bagi kuasa dua sisihan nilai yang diperhatikan bagi sesuatu ciri daripada nilai min mereka.

    Jika semua nilai ciri sampel berbeza, maka

    Varians diperbetulkan.

    Varians sampel ialah anggaran berat sebelah bagi varians populasi, i.e. jangkaan matematik varians sampel tidak sama dengan anggaran varians umum, tetapi sama dengan

    Untuk membetulkan varians sampel, hanya darabkannya dengan pecahan

    Pekali korelasi sampel didapati oleh formula

    di manakah sisihan piawai sampel bagi nilai dan .

    Pekali korelasi sampel menunjukkan keakraban hubungan linear antara dan : semakin hampir kepada perpaduan, semakin kuat hubungan linear antara dan .

    23. Poligon kekerapan ialah garis putus-putus yang segmennya menghubungkan titik. Untuk membina poligon frekuensi, varian diplot pada paksi absis, dan frekuensi yang sepadan diplot pada paksi ordinat, dan titik disambungkan oleh segmen garis.

    Poligon frekuensi relatif dibina dengan cara yang sama, kecuali frekuensi relatif diplot pada paksi ordinat.

    Histogram frekuensi ialah rajah bertingkat yang terdiri daripada segi empat tepat, tapaknya adalah selang separa panjang h, dan ketinggiannya sama dengan nisbah. Untuk membina histogram kekerapan, selang separa dibentangkan pada paksi absis, dan segmen selari dengan paksi absis pada jarak (ketinggian) dilukis di atasnya. Luas segi empat ke-i adalah sama dengan jumlah frekuensi selang i-o, oleh itu luas histogram frekuensi adalah sama dengan jumlah semua frekuensi, i.e. saiz sampel.

    Fungsi pengedaran empirikal

    di mana n x- bilangan nilai sampel kurang daripada x; n- saiz sampel.

    22Mari kita takrifkan konsep asas statistik matematik

    .Konsep asas statistik matematik. Populasi dan sampel. Siri variasi, siri statistik. Sampel berkumpulan. Siri statistik berkumpulan. Poligon kekerapan. Fungsi pengedaran sampel dan histogram.

    Penduduk– keseluruhan set objek yang tersedia.

    Sampel– satu set objek yang dipilih secara rawak daripada populasi umum.

    Urutan pilihan yang ditulis dalam tertib menaik dipanggil variasi berdekatan, dan senarai pilihan dan frekuensi yang sepadan atau frekuensi relatif - siri statistik: dipilih secara rawak daripada populasi umum.

    Poligon frekuensi dipanggil garis putus-putus, segmen yang menghubungkan titik.

    Histogram kekerapan ialah rajah bertingkat yang terdiri daripada segi empat tepat, tapaknya adalah selang separa panjang h, dan ketinggiannya sama dengan nisbah .

    Fungsi pengedaran sampel (empirikal). panggil fungsi F*(x), menentukan bagi setiap nilai X kekerapan relatif acara itu X< x.

    Jika beberapa ciri berterusan sedang dikaji, maka siri variasi boleh terdiri daripada bilangan nombor yang sangat besar. Dalam kes ini ia lebih mudah digunakan sampel berkumpulan. Untuk mendapatkannya, selang yang mengandungi semua nilai diperhatikan bagi atribut dibahagikan kepada beberapa selang separa panjang yang sama. h, dan kemudian cari untuk setiap selang separa n i– jumlah frekuensi varian yang disertakan dalam i selang ke-.

    20. Hukum nombor besar tidak boleh difahami sebagai mana-mana satu undang-undang am yang dikaitkan dengan nombor besar. Hukum nombor besar adalah nama umum untuk beberapa teorem, dari mana ia mengikuti bahawa dengan peningkatan tanpa had dalam bilangan percubaan, nilai purata cenderung kepada pemalar tertentu.

    Ini termasuk teorem Chebyshev dan Bernoulli. Teorem Chebyshev ialah hukum paling umum bagi nombor besar.

    Bukti teorem, yang disatukan dengan istilah "undang-undang nombor besar," adalah berdasarkan ketidaksamaan Chebyshev, yang menetapkan kebarangkalian sisihan daripada jangkaan matematiknya:

    19Taburan Pearson (chi - kuasa dua) - taburan pembolehubah rawak

    di manakah pembolehubah rawak X 1, X 2,…, X n bebas dan mempunyai pengagihan yang sama N(0,1). Dalam kes ini, bilangan istilah, i.e. n, dipanggil "bilangan darjah kebebasan" taburan khi kuasa dua.

    Taburan khi kuasa dua digunakan apabila menganggar varians (menggunakan selang keyakinan), apabila menguji hipotesis persetujuan, homogeniti, kebebasan,

    Pengagihan t T pelajar ialah taburan pembolehubah rawak

    di manakah pembolehubah rawak U Dan X berdikari, U mempunyai taburan normal piawai N(0.1), dan X– taburan chi – segi empat sama c n darjah kebebasan. Pada masa yang sama n dipanggil "bilangan darjah kebebasan" taburan Pelajar.

    Ia digunakan apabila menganggar jangkaan matematik, nilai ramalan dan ciri-ciri lain menggunakan selang keyakinan, menguji hipotesis tentang nilai jangkaan matematik, pekali regresi,

    Taburan Fisher ialah taburan pembolehubah rawak

    Taburan Fisher digunakan apabila menguji hipotesis tentang kecukupan model dalam analisis regresi, kesamaan varians dan dalam masalah statistik gunaan lain.

    18Regresi linear ialah alat statistik yang digunakan untuk meramalkan harga masa hadapan berdasarkan data lepas, dan biasanya digunakan untuk menentukan apabila harga terlalu panas. Kaedah kuasa dua terkecil digunakan untuk membina garis lurus "paling sesuai" melalui satu siri titik nilai harga. Mata harga yang digunakan sebagai input boleh menjadi mana-mana yang berikut: buka, tutup, tinggi, rendah,

    17. Pembolehubah rawak dua dimensi ialah set tertib dua pembolehubah rawak atau .

    Contoh: Dua dadu dilambung. – bilangan mata yang dilempar pada dadu pertama dan kedua, masing-masing

    Cara universal untuk menentukan hukum taburan pembolehubah rawak dua dimensi ialah fungsi taburan.

    15.m.o Pembolehubah rawak diskret

    Sifat:

    1) M(C) = C, C- malar;

    2) M(CX) = C.M.(X);

    3) M(X 1 + X 2) = M(X 1) + M(X 2), Di mana X 1, X 2- pembolehubah rawak bebas;

    4) M(X 1 X 2) = M(X 1)M(X 2).

    Jangkaan matematik jumlah pembolehubah rawak adalah sama dengan jumlah jangkaan matematiknya, i.e.

    Jangkaan matematik perbezaan antara pembolehubah rawak adalah sama dengan perbezaan jangkaan matematik mereka, i.e.

    Jangkaan matematik hasil darab pembolehubah rawak adalah sama dengan hasil darab jangkaan matematiknya, i.e.

    Jika semua nilai pembolehubah rawak dinaikkan (dikurangkan) dengan nombor C yang sama, maka jangkaan matematiknya akan meningkat (penurunan) dengan nombor yang sama.

    14. Eksponen(eksponen)undang-undang pengedaran X mempunyai hukum taburan eksponen dengan parameter λ >0 jika ketumpatan kebarangkaliannya mempunyai bentuk:

    Jangkaan matematik: .

    Penyerakan: .

    Undang-undang pengedaran eksponen memainkan peranan yang besar dalam teori beratur dan teori kebolehpercayaan.

    13. Hukum taburan normal dicirikan oleh kekerapan kegagalan a (t) atau ketumpatan kebarangkalian kegagalan f (t) dalam bentuk:

    , (5.36)

    di mana σ ialah sisihan piawai SV x;

    m x– jangkaan matematik SV x. Parameter ini sering dipanggil pusat penyebaran atau nilai SV yang paling berkemungkinan X.

    x– pembolehubah rawak, yang boleh diambil sebagai masa, nilai semasa, nilai voltan elektrik dan argumen lain.

    Undang-undang biasa ialah undang-undang dua parameter, untuk menulis yang anda perlu tahu m x dan σ.

    Taburan normal (Taburan Gaussian) digunakan untuk menilai kebolehpercayaan produk yang dipengaruhi oleh beberapa faktor rawak, setiap satunya mempunyai sedikit kesan ke atas kesan yang terhasil.

    12. Undang-undang pengedaran seragam. Pembolehubah rawak berterusan X mempunyai undang-undang pengedaran seragam pada segmen [ a, b], jika ketumpatan kebarangkaliannya adalah malar pada segmen ini dan sama dengan sifar di luarnya, i.e.

    Jawatan: .

    Jangkaan matematik: .

    Penyerakan: .

    Pembolehubah rawak X, diedarkan mengikut undang-undang seragam pada segmen dipanggil nombor rawak dari 0 hingga 1. Ia berfungsi sebagai bahan permulaan untuk mendapatkan pembolehubah rawak dengan mana-mana hukum taburan. Undang-undang taburan seragam digunakan dalam analisis ralat pembundaran semasa menjalankan pengiraan berangka, dalam satu siri masalah beratur, dalam pemodelan statistik pemerhatian tertakluk kepada taburan tertentu.

    11. Definisi. Ketumpatan pengedaran daripada kebarangkalian pembolehubah rawak selanjar X dipanggil fungsi f(x)– terbitan pertama bagi fungsi taburan F(x).

    Ketumpatan pengedaran juga dipanggil fungsi pembezaan. Untuk menerangkan pembolehubah rawak diskret, ketumpatan taburan tidak boleh diterima.

    Maksud ketumpatan taburan ialah ia menunjukkan kekerapan pembolehubah rawak X muncul dalam kejiranan tertentu titik X apabila mengulangi eksperimen.

    Selepas memperkenalkan fungsi taburan dan ketumpatan taburan, takrif pembolehubah rawak selanjar berikut boleh diberikan.

    10. Ketumpatan kebarangkalian, ketumpatan taburan kebarangkalian bagi pembolehubah rawak x, ialah fungsi p(x) supaya

    dan untuk mana-mana a< b вероятность события a < x < b равна
    .

    Jika p(x) adalah selanjar, maka untuk ∆x yang cukup kecil kebarangkalian ketaksamaan x< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями

    dan jika F(x) boleh dibezakan, maka