Data sampel. Persampelan statistik

jenis sampel:

Sebenarnya-rawak;

mekanikal;

tipikal;

bersiri;

digabungkan.

Persampelan rawak sendiri adalah untuk memilih unit daripada penduduk secara rawak atau rawak tanpa sebarang unsur ketekalan. Walau bagaimanapun, sebelum membuat pemilihan rawak yang betul, adalah perlu untuk memastikan bahawa semua unit populasi umum tanpa pengecualian mempunyai peluang yang sama sekali untuk masuk ke dalam sampel, tiada jurang dalam senarai atau senarai, mengabaikan unit individu, dsb. Sempadan yang jelas juga harus diwujudkan untuk penduduk supaya kemasukan atau pengecualian unit individu tidak diragui. Jadi, sebagai contoh, apabila memeriksa pelajar, adalah perlu untuk menunjukkan sama ada orang yang berada di cuti akademik, pelajar universiti bukan negeri, sekolah tentera, dsb.; apabila meninjau pertubuhan komersial, adalah penting untuk menentukan sama ada populasi umum akan termasuk astaka perdagangan, khemah komersial dan objek lain yang serupa. Pemilihan rawak sendiri boleh diulang dan tidak diulang. Untuk pemilihan tidak berulang semasa cabutan lot, lot yang ditarik tidak dikembalikan kepada set asal dan tidak mengambil bahagian dalam pemilihan selanjutnya. Apabila menggunakan jadual nombor rawak pemilihan tidak berulang dicapai dengan melangkau nombor jika ia diulang dalam lajur atau lajur yang dipilih.

Persampelan mekanikal digunakan dalam kes di mana populasi umum entah bagaimana diperintahkan, i.e. terdapat urutan tertentu dalam susunan unit (nombor gaji pekerja, senarai pemilih, nombor telefon responden, bilangan rumah dan pangsapuri, dsb.).

Populasi umum semasa pemilihan mekanikal boleh disusun atau disusun mengikut nilai sifat yang dikaji atau dikaitkan dengannya, yang akan meningkatkan keterwakilan sampel. Walau bagaimanapun, dalam kes ini, risiko ralat sistematik meningkat, dikaitkan dengan anggaran yang rendah terhadap nilai sifat yang dikaji (jika nilai pertama direkodkan dari setiap selang) atau dengan anggaran terlalu tinggi (jika nilai terakhir). Oleh itu, adalah dinasihatkan untuk memulakan pemilihan dari pertengahan selang pertama

pemilihan tipikal. Kaedah pemilihan ini digunakan dalam kes di mana semua unit populasi umum boleh dibahagikan kepada beberapa kumpulan tipikal. Dalam tinjauan penduduk, kumpulan tersebut mungkin, sebagai contoh, daerah, sosial, umur atau kumpulan pendidikan, apabila meninjau perusahaan - industri atau subsektor, bentuk pemilikan, dsb. Pemilihan tipikal melibatkan pemilihan unit daripada setiap kumpulan tipikal secara rawak atau mekanikal semata-mata. Kerana dalam bingkai pensampelan wakil semua kumpulan semestinya jatuh dalam satu bahagian atau bahagian lain, tipifikasi populasi umum memungkinkan untuk mengecualikan pengaruh varians antara kumpulan pada ralat purata sampel, yang dalam kes ini hanya ditentukan oleh variasi intrakumpulan.

Pemilihan unit dalam sampel biasa boleh diatur sama ada mengikut perkadaran dengan volum kumpulan tipikal, atau berkadaran dengan pembezaan intrakumpulan bagi sesuatu sifat.

pemilihan bersiri. Kaedah pemilihan ini adalah mudah dalam kes di mana unit populasi dikumpulkan ke dalam kumpulan kecil atau siri. Oleh itu siri sedemikian, pakej dengan jumlah produk siap tertentu, kumpulan barangan, kumpulan pelajar, briged dan persatuan lain. Intipati persampelan bersiri terletak pada pemilihan siri rawak atau mekanikal sebenar, di mana tinjauan lengkap unit dijalankan.

Ia sering berlaku bahawa perlu untuk menganalisis fenomena sosial tertentu dan mendapatkan maklumat mengenainya. Tugas sedemikian sering timbul dalam statistik dan dalam penyelidikan statistik. Pengesahan fenomena sosial yang ditakrifkan sepenuhnya selalunya mustahil. Sebagai contoh, bagaimana untuk mengetahui pendapat penduduk atau semua penduduk bandar tertentu mengenai sebarang isu? Meminta semua orang hampir mustahil dan sangat susah payah. Dalam kes sedemikian, kami memerlukan sampel. Inilah konsep yang hampir semua penyelidikan dan analisis berasaskan.

Apakah sampel

Apabila menganalisis sesuatu yang spesifik fenomena sosial perlu mendapatkan maklumat mengenainya. Jika kita mengambil sebarang kajian, kita dapat melihat bahawa tidak setiap unit keseluruhan objek kajian tertakluk kepada penyelidikan dan analisis. Hanya sebahagian tertentu daripada keseluruhan ini diambil kira. Proses ini adalah pensampelan: apabila hanya unit tertentu daripada set diperiksa.

Sudah tentu, banyak bergantung pada jenis sampel. Tetapi terdapat juga peraturan asas. Yang utama mengatakan bahawa pemilihan daripada populasi mestilah benar-benar rawak. Unit populasi yang akan digunakan tidak boleh dipilih kerana sebarang kriteria. Secara kasarnya, sekiranya perlu mengumpul populasi daripada populasi bandar tertentu dan memilih lelaki sahaja, maka akan berlaku kesilapan dalam kajian, kerana pemilihan tidak dilakukan secara rawak, tetapi dipilih mengikut jantina. Hampir semua kaedah persampelan adalah berdasarkan peraturan ini.

Peraturan persampelan

Agar set yang dipilih mencerminkan kualiti utama keseluruhan fenomena, ia mesti dibina mengikut undang-undang tertentu, di mana perhatian utama harus diberikan kepada kategori berikut:

sampel (populasi sampel);
Populasi umum;
keterwakilan;
kesilapan perwakilan;
unit penduduk;
kaedah persampelan.

Keanehan pemerhatian terpilih dan persampelan adalah seperti berikut:

Semua keputusan yang diperoleh adalah berdasarkan undang-undang dan peraturan matematik, iaitu, dengan pengendalian kajian yang betul dan dengan pengiraan yang betul, keputusan tidak akan diputarbelitkan secara subjektif.
Ia memungkinkan untuk mendapatkan keputusan dengan lebih pantas dan dengan masa dan sumber yang lebih sedikit, bukan mempelajari keseluruhan rangkaian acara, tetapi hanya sebahagian daripadanya.
Boleh digunakan untuk mengkaji pelbagai objek: daripada isu tertentu, contohnya, umur, jantina kumpulan yang kita minat, untuk belajar pendapat umum atau tahap sokongan material penduduk.

Pemerhatian terpilih

Selektif ialah pemerhatian statistik, yang mana bukan keseluruhan set perkara yang sedang dikaji tertakluk kepada penyelidikan, tetapi hanya sebahagian daripadanya, dipilih dengan cara tertentu, dan hasil kajian bahagian ini digunakan untuk keseluruhan set. Bahagian ini dipanggil kerangka persampelan. ia satu-satunya cara mengkaji pelbagai besar objek kajian.

Tetapi pemerhatian terpilih boleh digunakan hanya dalam kes di mana perlu untuk menyiasat sahaja kumpulan kecil unit. Sebagai contoh, apabila mengkaji nisbah lelaki kepada wanita di dunia, pemerhatian terpilih akan digunakan. Atas sebab yang jelas, adalah mustahil untuk mengambil kira setiap penduduk planet kita.

Tetapi dengan kajian yang sama, tetapi tidak semua penduduk bumi, tetapi kelas 2 "A" tertentu dalam sekolah tertentu, bandar tertentu, negara tertentu, boleh melakukannya tanpa pemerhatian rawak. Lagipun, sangat mungkin untuk menganalisis keseluruhan tatasusunan objek kajian. Ia adalah perlu untuk mengira lelaki dan perempuan kelas ini - itu akan menjadi nisbah.

Sampel dan populasi

Ia sebenarnya tidak sesukar yang didengari. Dalam mana-mana objek kajian terdapat dua sistem: populasi umum dan sampel. Apa itu? Semua unit adalah milik umum. Dan kepada sampel - unit daripada jumlah populasi yang diambil untuk sampel. Sekiranya semuanya dilakukan dengan betul, maka bahagian yang dipilih akan menjadi susun atur yang dikurangkan bagi keseluruhan populasi (umum).

Jika kita bercakap tentang populasi umum, maka kita boleh membezakan hanya dua jenisnya: populasi umum pasti dan tidak tentu. Bergantung kepada sama ada jumlah unit sistem tertentu diketahui atau tidak. Jika ini adalah populasi tertentu, maka persampelan akan menjadi lebih mudah kerana fakta bahawa ia diketahui berapa peratus jumlah unit akan dijadikan sampel.

Momen ini sangat diperlukan dalam penyelidikan. Sebagai contoh, jika perlu untuk menyiasat peratusan produk kuih-muih berkualiti rendah di kilang tertentu. Andaikan bahawa populasi telah ditakrifkan. Adalah diketahui dengan pasti bahawa perusahaan ini menghasilkan 1000 produk kuih-muih setiap tahun. Jika kita membuat sampel 100 produk gula-gula rawak daripada ribu ini dan menghantarnya untuk pemeriksaan, maka ralatnya akan menjadi minimum. Secara kasarnya, 10% daripada semua produk tertakluk kepada penyelidikan, dan berdasarkan keputusan, dengan mengambil kira ralat keterwakilan, kita boleh bercakap tentang kualiti yang tidak baik bagi semua produk.

Dan jika anda mengambil sampel 100 produk kuih-muih daripada populasi umum yang tidak pasti, di mana terdapat sebenarnya, katakan, 1 juta unit, maka keputusan sampel dan kajian itu sendiri akan menjadi sangat tidak masuk akal dan tidak tepat. Rasakan perbezaannya? Oleh itu, kepastian populasi umum dalam kebanyakan kes adalah amat penting dan sangat mempengaruhi hasil kajian.

Keterwakilan penduduk

Jadi, kini salah satu soalan yang paling penting - apakah yang sepatutnya menjadi sampel? Ini yang paling banyak titik utama penyelidikan. Pada peringkat ini, adalah perlu untuk mengira sampel dan memilih unit daripada jumlah nombor ke dalam dia. Populasi dipilih dengan betul jika ciri dan ciri tertentu populasi umum kekal dalam sampel. Ini dipanggil perwakilan.

Dalam erti kata lain, jika, selepas pemilihan, bahagian mengekalkan kecenderungan dan ciri yang sama seperti keseluruhan kuantiti yang diperiksa, maka populasi sedemikian dipanggil perwakilan. Tetapi tidak setiap sampel khusus boleh dipilih daripada populasi yang mewakili. Terdapat juga objek penyelidikan sedemikian, sampel yang tidak boleh mewakili. Di sinilah datangnya konsep kesilapan perwakilan. Tetapi mari kita bercakap tentang ini sedikit lagi.

Cara membuat pemilihan

Jadi, untuk memaksimumkan keterwakilan, terdapat tiga peraturan persampelan asas:

Kesilapan (error) keterwakilan

Ciri utama kualiti sampel yang dipilih ialah konsep "kesilapan keterwakilan". Apa itu? Ini adalah percanggahan tertentu antara penunjuk pemerhatian terpilih dan berterusan. Mengikut penunjuk ralat, keterwakilan dibahagikan kepada boleh dipercayai, biasa dan anggaran. Dalam erti kata lain, sisihan sehingga 3%, dari 3 hingga 10% dan dari 10 hingga 20%, masing-masing, boleh diterima. Walaupun dalam statistik adalah wajar bahawa ralat tidak melebihi 5-6%. Jika tidak, ada sebab untuk bercakap tentang keterwakilan sampel yang tidak mencukupi. Untuk mengira ralat keterwakilan dan cara ia mempengaruhi sampel atau populasi, banyak faktor diambil kira:

Kebarangkalian untuk mendapatkan hasil yang tepat.
Bilangan unit persampelan. Seperti yang dinyatakan sebelum ini, semakin kecil bilangan unit dalam sampel, semakin besar ralat keterwakilan, dan sebaliknya.
Kehomogenan populasi kajian. Lebih heterogen populasi, lebih besar ralat representasi akan berlaku. Keupayaan populasi untuk menjadi perwakilan bergantung kepada kehomogenan semua unit konstituennya.
Kaedah memilih unit dalam populasi sampel.

Dalam konkrit pengajian yang ditugaskan peratusan kesilapan min biasanya ditetapkan oleh pengkaji berdasarkan program pemerhatian dan mengikut data kajian lepas. Sebagai peraturan, ralat pensampelan maksimum (ralat keterwakilan) dalam 3-5% dianggap boleh diterima.

Lebih banyak tidak selalu lebih baik

Perlu diingat juga bahawa perkara utama dalam menganjurkan pemerhatian terpilih adalah untuk membawa jumlahnya ke tahap minimum yang boleh diterima. Pada masa yang sama, seseorang tidak seharusnya berusaha untuk mengurangkan had ralat pensampelan secara berlebihan, kerana ini boleh membawa kepada peningkatan yang tidak wajar dalam jumlah data sampel dan, akibatnya, kepada peningkatan dalam kos pensampelan.

Pada masa yang sama, saiz ralat keterwakilan tidak boleh ditingkatkan secara berlebihan. Lagipun, dalam kes ini, walaupun terdapat pengurangan dalam saiz sampel, ini akan membawa kepada kemerosotan dalam kebolehpercayaan keputusan yang diperolehi.

Apakah soalan yang selalu ditanya oleh pengkaji?

Sebarang penyelidikan, jika dijalankan, adalah untuk tujuan tertentu dan untuk mendapatkan beberapa hasil. Semasa menjalankan sampel kajian biasanya ditetapkan soalan awal:

Kaedah untuk memilih unit penyelidikan dalam sampel

Tidak setiap sampel mewakili. Kadang-kadang satu dan tanda yang sama dinyatakan secara berbeza dalam keseluruhan dan bahagiannya. Untuk mencapai keperluan keterwakilan, adalah dinasihatkan untuk menggunakan pelbagai teknik persampelan. Selain itu, penggunaan satu kaedah atau yang lain bergantung pada keadaan tertentu. Beberapa kaedah persampelan ini termasuk:

pemilihan rawak;
pemilihan mekanikal;
pemilihan biasa;
pemilihan bersiri (bersarang).

Pemilihan rawak ialah sistem aktiviti yang bertujuan untuk pemilihan rawak unit populasi, apabila kebarangkalian untuk dimasukkan ke dalam sampel adalah sama untuk semua unit populasi umum. Teknik ini dinasihatkan untuk digunakan hanya dalam kes kehomogenan dan sebilangan kecil ciri yang wujud. Jika tidak, beberapa sifat perwatakan risiko tidak termasuk dalam sampel. Ciri-ciri pemilihan rawak mendasari semua kaedah pensampelan lain.

Dengan pemilihan mekanikal unit dijalankan pada selang waktu tertentu. Jika perlu untuk membentuk sampel jenayah tertentu, adalah mungkin untuk mengalih keluar setiap kad ke-5, ke-10 atau ke-15 daripada semua rekod statistik jenayah yang direkodkan, bergantung pada jumlah bilangan dan saiz sampel yang tersedia. Kelemahan kaedah ini ialah sebelum pemilihan adalah perlu untuk mempunyai akaun lengkap unit populasi, maka ia perlu untuk menjalankan kedudukan, dan hanya selepas itu adalah mungkin untuk mengambil sampel pada selang waktu tertentu. Kaedah ini mengambil banyak masa, jadi ia tidak kerap digunakan.

Pemilihan biasa (serantau) - sejenis sampel di mana populasi umum dibahagikan kepada kumpulan homogen atas dasar tertentu. Kadangkala penyelidik menggunakan istilah lain dan bukannya "kumpulan": "daerah" dan "zon". Kemudian sebilangan unit dipilih secara rawak daripada setiap kumpulan mengikut kadar graviti tertentu kumpulan dalam populasi umum. Pemilihan tipikal selalunya dijalankan dalam beberapa peringkat.

Persampelan bersiri ialah kaedah di mana pemilihan unit dijalankan secara berkumpulan (siri) dan semua unit kumpulan (siri) yang dipilih tertakluk kepada pemeriksaan. Kelebihan kaedah ini ialah kadang-kadang lebih sukar untuk memilih unit individu daripada siri, contohnya, apabila mengkaji seseorang yang sedang menjalani hukuman. Dalam kawasan yang dipilih, zon, kajian semua unit tanpa pengecualian digunakan, sebagai contoh, kajian semua orang yang menjalani hukuman di institusi tertentu.

Anggaran selang kebarangkalian peristiwa. Formula untuk mengira bilangan sampel dalam kes kaedah pemilihan rawak.

Untuk menentukan kebarangkalian peristiwa yang menarik minat kami, kami menggunakan kaedah pensampelan: kami laksanakan n eksperimen bebas, dalam setiap kejadian A mungkin berlaku (atau tidak berlaku) (kebarangkalian R kejadian peristiwa A dalam setiap eksperimen adalah malar). Kemudian kekerapan relatif p* kejadian kejadian DAN dalam satu siri n ujian diterima sebagai anggaran mata untuk kebarangkalian hlm berlakunya sesuatu peristiwa DAN dalam ujian berasingan. Dalam kes ini, nilai p* dipanggil bahagian sampel kejadian kejadian DAN, dan r - bahagian umum .

Oleh sebab akibat dari pusat teorem had(Teorem Moivre-Laplace) kekerapan relatif sesuatu peristiwa dengan saiz sampel yang besar boleh dianggap taburan normal dengan parameter M(p*)=p dan

Oleh itu, untuk n>30 selang keyakinan untuk bahagian umum boleh dibina menggunakan formula:

di mana u cr ditemui mengikut jadual fungsi Laplace, dengan mengambil kira kebarangkalian keyakinan yang diberikan γ: 2Ф(u cr)=γ.

Dengan saiz sampel yang kecil n≤30, ralat marginal ε ditentukan daripada jadual pengedaran Pelajar:
dengan t cr =t(k; α) dan bilangan darjah kebebasan k=n-1 kebarangkalian α=1-γ (kawasan dua belah).

Formula adalah sah jika pemilihan dilakukan secara rawak secara berulang (populasi umum adalah tidak terhingga), jika tidak, perlu membuat pembetulan untuk pemilihan tidak berulang (jadual).

Ralat pensampelan purata untuk perkadaran umum

Penduduk	tak berkesudahan	isipadu muktamad N
Jenis pilihan	Diulang	tidak berulang
Ralat pensampelan purata

Formula untuk mengira saiz sampel dengan kaedah pemilihan rawak yang betul

Kaedah pemilihan	Formula saiz sampel
	untuk pertengahan	untuk perkongsian
Diulang
tidak berulang

Masalah mengenai bahagian umum

Kepada soalan "Adakah nilai p 0 yang diberikan meliputi selang keyakinan?" - boleh dijawab dengan menyemak hipotesis statistik H 0:p=p 0 . Diandaikan bahawa eksperimen dijalankan mengikut skema ujian Bernoulli (bebas, kebarangkalian hlm berlakunya sesuatu peristiwa DAN tetap). Mengikut sampel volum n tentukan kekerapan relatif p * kejadian A: di mana m- bilangan kejadian acara DAN dalam satu siri n ujian. Untuk menguji hipotesis H 0, statistik digunakan yang, dengan saiz sampel yang cukup besar, mempunyai standard taburan normal(Jadual 1).
Jadual 1 - Hipotesis tentang bahagian umum

Hipotesis	H0:p=p0	H 0:p 1 \u003d p 2
Andaian	Skim ujian Bernoulli	Skim ujian Bernoulli
Anggaran sampel
Perangkaan K
Taburan statistik K		Standard biasa N(0,1)

Contoh #1. Menggunakan pensampelan semula rawak, pengurusan syarikat menjalankan tinjauan rawak terhadap 900 pekerjanya. Terdapat 270 wanita dalam kalangan responden. Plot selang keyakinan yang, dengan kebarangkalian 0.95, meliputi bahagian sebenar wanita dalam keseluruhan pasukan firma.
Keputusan. Mengikut syarat, bahagian sampel wanita adalah (kekerapan relatif wanita di kalangan semua responden). Oleh kerana pemilihan diulang dan saiz sampel adalah besar (n=900), ralat pensampelan marginal ditentukan oleh formula

Nilai u cr didapati daripada jadual fungsi Laplace daripada hubungan 2Ф(u cr)=γ, i.e. Fungsi Laplace (Lampiran 1) mengambil nilai 0.475 pada u cr =1.96. Oleh itu, ralat marginal dan selang keyakinan yang diingini
(p – ε, p + ε) = (0.3 – 0.18; 0.3 + 0.18) = (0.12; 0.48)
Jadi, dengan kebarangkalian 0.95, boleh dijamin bahawa bahagian wanita dalam keseluruhan pasukan firma berada dalam julat dari 0.12 hingga 0.48.

Contoh #2. Pemilik tempat letak kereta menganggap hari itu "bertuah" jika tempat letak kereta melebihi 80% penuh. Pada tahun ini, 40 pemeriksaan tempat letak kereta telah dijalankan, di mana 24 daripadanya "berjaya". Dengan kebarangkalian 0.98, cari selang keyakinan untuk menganggar peratusan sebenar hari "bertuah" sepanjang tahun itu.
Keputusan. Pecahan sampel hari "baik" ialah
Menurut jadual fungsi Laplace, kita dapati nilai u cr untuk sesuatu yang diberikan
tahap keyakinan
Ф(2.23) = 0.49, u cr = 2.33.
Memandangkan pemilihan tidak berulang (iaitu, dua semakan tidak dijalankan pada hari yang sama), kami mendapati ralat marginal:
di mana n=40 , N = 365 (hari). Dari sini
dan selang keyakinan bagi pecahan am: (p – ε, p + ε) = (0.6 – 0.17; 0.6 + 0.17) = (0.43; 0.77)
Dengan kebarangkalian 0.98, boleh dijangkakan bahawa perkadaran hari "baik" sepanjang tahun adalah dalam julat dari 0.43 hingga 0.77.

Contoh #3. Selepas menyemak 2500 item dalam kelompok, mereka mendapati bahawa 400 item adalah gred tertinggi, tetapi n–m tidak. Berapa banyak produk yang anda perlu semak untuk menentukan bahagian gred premium dengan ketepatan 0.01 dengan kepastian 95%?
Kami sedang mencari penyelesaian mengikut formula untuk menentukan saiz sampel untuk pemilihan semula.

Ф(t) = γ/2 = 0.95/2 = 0.475 dan mengikut jadual Laplace nilai ini sepadan dengan t=1.96
Pecahan sampel w = 0.16; ralat pensampelan ε = 0.01

Contoh #4. Satu kelompok produk diterima jika kebarangkalian produk itu akan memenuhi piawaian adalah sekurang-kurangnya 0.97. Di antara 200 produk yang dipilih secara rawak dari lot yang diuji, 193 produk didapati memenuhi piawaian. Adakah mungkin untuk menerima kumpulan pada tahap keertian α=0.02?
Keputusan. Kami merumuskan hipotesis utama dan alternatif.
H 0: p \u003d p 0 \u003d 0.97 - bahagian umum tidak diketahui hlm adalah sama dengan tetapkan nilai p 0 =0.97. Berhubung dengan keadaan - kebarangkalian bahawa bahagian dari lot yang diuji akan mengikut piawaian ialah 0.97; mereka. kumpulan produk boleh diterima.
H1:hlm<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Nilai statistik yang diperhatikan K(jadual) hitung untuk nilai yang diberi p 0 =0.97, n=200, m=193

Nilai kritikal didapati daripada jadual fungsi Laplace daripada kesamaan

Mengikut keadaan α=0.02, maka F(Kcr)=0.48 dan Kcr=2.05. Kawasan kritikal adalah kidal, i.e. ialah selang (-∞;-K kp)= (-∞;-2.05). Nilai yang diperhatikan Kobs = -0.415 tidak tergolong dalam kawasan kritikal, oleh itu, pada tahap keertian ini, tidak ada sebab untuk menolak hipotesis utama. Satu kumpulan produk boleh diterima.

Contoh nombor 5. Dua kilang menghasilkan jenis bahagian yang sama. Untuk menilai kualitinya, sampel telah diambil daripada produk kilang tersebut dan keputusan berikut diperolehi. Antara 200 produk terpilih kilang pertama, 20 rosak, dan antara 300 produk kilang kedua, 15 rosak.
Pada aras keertian 0.025, ketahui jika terdapat perbezaan yang signifikan dalam kualiti bahagian yang dikeluarkan oleh kilang-kilang ini.

Mengikut keadaan α=0.025, maka F(Kcr)=0.4875 dan Kcr=2.24. Dengan alternatif dua sisi, kawasan nilai yang boleh diterima mempunyai bentuk (-2.24; 2.24). Nilai yang diperhatikan Kobs =2.15 berada dalam selang ini, i.e. pada tahap kepentingan ini, tidak ada sebab untuk menolak hipotesis utama. Kilang mengeluarkan produk dengan kualiti yang sama.

Rancang

pengenalan
1. Peranan pensampelan
Kesimpulan
Bibliografi

pengenalan

Statistik ialah sains analisis yang diperlukan untuk semua pakar moden. Pakar moden tidak boleh celik jika dia tidak memiliki metodologi statistik. Statistik adalah alat yang paling penting untuk komunikasi antara perusahaan dan masyarakat. Statistik adalah salah satu disiplin yang paling penting dalam kurikulum semua kepakaran. literasi statistik adalah bahagian penting dalam pendidikan tinggi, dan dari segi bilangan jam yang diperuntukkan dalam kurikulum, ia menduduki salah satu tempat pertama. Bekerja dengan angka, setiap pakar mesti tahu bagaimana data tertentu diperolehi, sifat pengiraannya, seberapa lengkap dan boleh dipercayainya.

1. Peranan pensampelan

Set semua unit populasi yang mempunyai atribut tertentu dan tertakluk kepada kajian dipanggil populasi umum dalam statistik.

Dalam amalan, untuk satu sebab atau yang lain, tidak selalu mungkin atau tidak praktikal untuk mempertimbangkan keseluruhan populasi. Kemudian mereka membatasi diri mereka untuk mengkaji hanya sebahagian daripadanya, matlamat utamanya adalah untuk memanjangkan keputusan yang diperolehi kepada seluruh populasi umum, i.e. menggunakan kaedah persampelan.

Untuk melakukan ini, sebahagian daripada elemen, yang dipanggil sampel, dipilih daripada populasi umum dengan cara yang istimewa, dan hasil pemprosesan data sampel (contohnya, purata aritmetik) digeneralisasikan kepada keseluruhan populasi.

Asas teori kaedah pensampelan ialah hukum nombor besar. Berdasarkan undang-undang ini, dengan serakan terhad ciri dalam populasi umum dan sampel yang cukup besar dengan kebarangkalian hampir dengan kebolehpercayaan penuh, min sampel boleh sewenang-wenangnya hampir dengan min am. Undang-undang ini, yang merangkumi sekumpulan teorem, telah dibuktikan secara matematik. Oleh itu, min aritmetik yang dikira untuk sampel boleh dianggap sebagai penunjuk yang mencirikan populasi umum secara keseluruhan.

2. Kaedah pemilihan probabilistik yang memastikan keterwakilan

Untuk dapat membuat kesimpulan tentang sifat populasi umum daripada sampel, sampel mestilah representatif (representative), i.e. ia mesti mewakili sepenuhnya dan secukupnya sifat-sifat penduduk umum. Keterwakilan sampel hanya boleh dipastikan jika pemilihan data adalah objektif.

Set sampel dibentuk mengikut prinsip proses probabilistik jisim tanpa sebarang pengecualian daripada skim pemilihan yang diterima; adalah perlu untuk memastikan kehomogenan relatif sampel atau pembahagiannya kepada kumpulan unit yang homogen. Apabila membentuk populasi sampel, definisi yang jelas tentang unit persampelan harus diberikan. Kira-kira saiz unit pensampelan yang sama adalah wajar, dan hasilnya akan lebih tepat, lebih kecil unit pensampelan.

Tiga kaedah pemilihan adalah mungkin: pemilihan rawak, pemilihan unit mengikut skema tertentu, gabungan kaedah pertama dan kedua.

Sekiranya pemilihan mengikut skema yang diterima dijalankan dari populasi umum, yang sebelum ini dibahagikan kepada jenis (lapisan atau strata), maka sampel sedemikian dipanggil tipikal (atau berstrata, atau berstrata, atau dizonkan). Satu lagi pembahagian sampel mengikut spesies ditentukan oleh unit persampelan: unit cerapan atau satu siri unit (kadangkala istilah "sarang" digunakan). Dalam kes kedua, sampel dipanggil bersiri atau bersarang. Dalam amalan, gabungan sampel biasa dengan pemilihan siri sering digunakan. Dalam statistik matematik, apabila membincangkan masalah pemilihan data, adalah perlu untuk memperkenalkan pembahagian sampel kepada berulang dan tidak berulang. Yang pertama sepadan dengan skema bola yang boleh dikembalikan, yang kedua - tidak boleh ditarik balik (apabila mempertimbangkan proses memilih data pada contoh memilih bola warna yang berbeza dari guci). Dalam statistik sosio-ekonomi, tidak masuk akal untuk menggunakan pensampelan berulang, oleh itu, sebagai peraturan, pensampelan tidak berulang dimaksudkan.

Memandangkan objek sosio-ekonomi mempunyai struktur yang kompleks, agak sukar untuk menyusun sampel. Sebagai contoh, untuk memilih isi rumah apabila mengkaji penggunaan oleh penduduk bandar besar, lebih mudah untuk memilih sel wilayah, bangunan kediaman, kemudian pangsapuri atau isi rumah, kemudian responden. Sampel sedemikian dipanggil berbilang peringkat. Pada setiap peringkat, unit persampelan yang berbeza digunakan: yang lebih besar pada peringkat awal, pada peringkat terakhir, unit pemilihan bertepatan dengan unit pemerhatian.

Satu lagi jenis pemerhatian sampel ialah persampelan berbilang fasa. Sampel sedemikian termasuk beberapa fasa tertentu, setiap satunya berbeza dalam perincian program pemerhatian. Sebagai contoh, 25% daripada keseluruhan populasi umum ditinjau mengikut program pendek, setiap unit ke-4 daripada sampel ini ditinjau mengikut program yang lebih lengkap, dsb.

Untuk sebarang jenis sampel, pemilihan unit dijalankan dalam tiga cara. Pertimbangkan prosedur pemilihan rawak. Pertama sekali, senarai unit populasi disusun, di mana setiap unit diberikan kod digital (nombor atau label). Kemudian cabutan dibuat. Bola dengan nombor yang sepadan dimasukkan ke dalam dram, ia dicampur dan bola dipilih. Nombor yang telah jatuh sepadan dengan unit dalam sampel; bilangan nombor adalah sama dengan saiz sampel yang dirancang.

Pemilihan secara seri mungkin tertakluk kepada berat sebelah yang disebabkan oleh kelemahan teknikal (kualiti bola, dram) dan sebab lain. Lebih dipercayai dari sudut objektiviti adalah pemilihan dengan jadual nombor rawak. Jadual sedemikian mengandungi satu siri nombor, berselang seli secara rawak, dipilih oleh isyarat elektronik. Oleh kerana kita menggunakan sistem angka perpuluhan 0, 1, 2,., 9, kebarangkalian sebarang digit yang muncul ialah 1/10. Oleh itu, jika perlu mencipta jadual nombor rawak, termasuk 500 aksara, maka kira-kira 50 daripadanya akan menjadi 0, nombor yang sama ialah 1, dan seterusnya.

Pemilihan mengikut beberapa skema (yang dipanggil persampelan terarah) sering digunakan. Skim pemilihan diguna pakai sedemikian rupa untuk mencerminkan sifat utama dan perkadaran populasi umum. Cara paling mudah: mengikut senarai unit populasi umum, disusun sedemikian rupa sehingga susunan unit tidak berkaitan dengan sifat yang sedang dikaji, pemilihan mekanikal unit dijalankan dengan langkah yang sama dengan N: n. Biasanya, pemilihan tidak bermula dari unit pertama, tetapi berundur separuh langkah untuk mengurangkan kemungkinan bias sampel. Kekerapan berlakunya unit yang mempunyai ciri-ciri tertentu, contohnya pelajar yang mempunyai tahap prestasi akademik tertentu, tinggal di asrama, dsb. akan ditentukan oleh struktur yang telah dibangunkan dalam populasi umum.

Untuk lebih pasti bahawa sampel akan mencerminkan struktur populasi, yang terakhir dibahagikan kepada jenis (strata atau kawasan), dan pemilihan rawak atau mekanikal dibuat daripada setiap jenis. Jumlah bilangan unit yang dipilih daripada jenis yang berbeza hendaklah sepadan dengan saiz sampel.

Kesukaran tertentu timbul apabila tiada senarai unit, dan pemilihan mesti dibuat sama ada di lapangan atau daripada sampel produk di gudang produk siap. Dalam kes ini, adalah penting untuk membangunkan secara terperinci skema orientasi untuk rupa bumi dan skema pemilihan dan mengikutinya tanpa membenarkan penyelewengan. Sebagai contoh, meter diarahkan untuk bergerak dari perhentian bas tertentu ke utara di sisi genap jalan dan, selepas mengira dua rumah dari sudut pertama, masuk ke tempat ketiga dan undi setiap kediaman ke-5. Pematuhan ketat kepada skim yang diterima pakai memastikan pemenuhan syarat utama untuk pembentukan sampel perwakilan - objektiviti pemilihan unit.

daripada sampel rawak seseorang harus membezakan antara pemilihan kuota, apabila sampel dibina daripada unit kategori tertentu (kuota), yang mesti diwakili dalam perkadaran tertentu. Sebagai contoh, dalam tinjauan pelanggan gedung membeli-belah, pemilihan 150 responden mungkin dirancang, termasuk 90 wanita, di mana 25 adalah perempuan, 20 adalah wanita muda dengan anak kecil, 35 adalah wanita pertengahan umur berpakaian sut perniagaan, 10 adalah wanita dalam lingkungan 50-an dan lebih tua; selain itu, tinjauan terhadap 70 lelaki telah dirancang, yang mana 25 adalah remaja dan lelaki muda, 20 lelaki muda bersama kanak-kanak, 15 lelaki berpakaian sut, 10 lelaki berpakaian sukan. Untuk menentukan orientasi dan pilihan pengguna, sampel sedemikian mungkin bagus, tetapi jika kita ingin menetapkan jumlah purata pembelian, struktur mereka, kita akan mendapat hasil yang tidak mewakili. Ini kerana persampelan kuota adalah bertujuan untuk memilih kategori tertentu.

Sampel mungkin tidak mewakili, walaupun ia dibentuk mengikut perkadaran populasi umum yang diketahui, tetapi pemilihan dijalankan tanpa sebarang skim - unit diambil dalam apa jua cara, hanya untuk memastikan nisbah kategori mereka dalam perkadaran yang sama seperti dalam populasi umum (contohnya, nisbah lelaki dan wanita, responden berumur lebih muda dan lebih tua daripada yang berkemampuan dan berkemampuan, dsb.).

Kenyataan ini harus memberi amaran kepada anda terhadap pendekatan pensampelan sedemikian dan menekankan semula keperluan untuk pensampelan objektif.

3. Ciri organisasi dan metodologi persampelan rawak, mekanikal, tipikal dan bersiri

Bergantung kepada cara pemilihan elemen populasi dalam sampel dijalankan, terdapat beberapa jenis tinjauan sampel. Pemilihan boleh secara rawak, mekanikal, tipikal dan bersiri.

Pemilihan rawak ialah pemilihan yang mana semua elemen populasi umum mempunyai peluang yang sama untuk dipilih. Dengan kata lain, setiap elemen populasi mempunyai kebarangkalian yang sama untuk dimasukkan ke dalam sampel.

persampelan rawak kebarangkalian statistik

Keperluan pemilihan rawak dicapai dalam amalan dengan bantuan lot atau jadual nombor rawak.

Apabila memilih dengan membuat undian, semua elemen populasi umum dinomborkan terlebih dahulu dan nombor mereka diletakkan pada kad. Selepas mengocok dengan teliti dari pek dalam apa jua cara (berturut-turut atau dalam sebarang susunan lain), bilangan kad yang diperlukan dipilih, sepadan dengan saiz sampel. Dalam kes ini, anda boleh sama ada meletakkan kad yang dipilih diketepikan (dengan itu melakukan apa yang dipanggil pemilihan tidak berulang), atau, mengeluarkan kad, menulis nombornya dan mengembalikannya ke pek, dengan itu memberi peluang untuk muncul. dalam sampel semula (pemilihan berulang). Apabila memilih semula, setiap kali selepas pemulangan kad, pek mesti dikocok dengan teliti.

Kaedah cabutan digunakan dalam kes di mana bilangan elemen keseluruhan populasi yang dikaji adalah kecil. Dengan jumlah populasi umum yang besar, pelaksanaan pemilihan rawak secara loteri menjadi sukar. Lebih dipercayai dan kurang memakan masa dalam kes sejumlah besar data diproses adalah kaedah menggunakan jadual nombor rawak.

Pemilihan mekanikal dijalankan seperti berikut. Jika sampel 10% terbentuk, i.e. satu daripada setiap sepuluh elemen mesti dipilih, kemudian keseluruhan set dibahagikan secara bersyarat kepada bahagian yang sama bagi 10 elemen. Kemudian, satu elemen dipilih secara rawak daripada sepuluh teratas. Sebagai contoh, cabutan menunjukkan nombor kesembilan. Pemilihan unsur-unsur yang tinggal dalam sampel ditentukan sepenuhnya oleh perkadaran pemilihan N yang ditentukan dengan bilangan elemen yang dipilih pertama. Dalam kes yang sedang dipertimbangkan, sampel akan terdiri daripada elemen 9, 19, 29, dsb.

Pemilihan mekanikal harus digunakan dengan berhati-hati, kerana terdapat risiko sebenar yang dipanggil ralat sistematik. Oleh itu, sebelum melakukan persampelan mekanikal, adalah perlu untuk menganalisis populasi yang dikaji. Jika unsur-unsurnya terletak secara rawak, maka sampel yang diperoleh secara mekanikal akan menjadi rawak. Walau bagaimanapun, selalunya unsur-unsur set asal adalah sebahagian atau bahkan sepenuhnya dipesan. Adalah sangat tidak diingini untuk pemilihan mekanikal mempunyai susunan unsur yang mempunyai kebolehulangan yang betul, tempoh yang mungkin bertepatan dengan tempoh pensampelan mekanikal.

Selalunya, unsur-unsur populasi disusun mengikut nilai sifat yang dikaji dalam susunan menurun atau meningkat dan tidak mempunyai periodicity. Pemilihan mekanikal daripada populasi sedemikian memperoleh watak pemilihan terarah, kerana bahagian individu populasi diwakili dalam sampel mengikut nisbah saiznya dalam keseluruhan populasi, i.e. pemilihan adalah bertujuan untuk membuat wakil sampel.

Satu lagi jenis pemilihan arah ialah pemilihan tipikal. Pemilihan tipikal harus dibezakan daripada pemilihan objek tipikal. Pemilihan objek tipikal telah digunakan dalam statistik zemstvo, serta dalam tinjauan belanjawan. Pada masa yang sama, pemilihan "kampung tipikal" atau "ladang tipikal" dijalankan mengikut ciri-ciri ekonomi tertentu, contohnya, mengikut saiz pemilikan tanah setiap isi rumah, mengikut pekerjaan penduduk, dan sebagainya. . Pemilihan jenis ini tidak boleh menjadi asas untuk penggunaan kaedah pensampelan, kerana di sini keperluan utamanya tidak dipenuhi - kerawanan pemilihan.

Dalam pemilihan tipikal sebenar dalam kaedah persampelan, populasi dibahagikan kepada kumpulan yang homogen secara kualitatif, dan kemudian pemilihan rawak dibuat dalam setiap kumpulan. Pemilihan biasa adalah lebih sukar untuk diatur daripada pemilihan rawak itu sendiri, kerana pengetahuan tertentu tentang komposisi dan sifat populasi umum diperlukan, tetapi ia memberikan hasil yang lebih tepat.

Dengan pemilihan bersiri, keseluruhan populasi dibahagikan kepada kumpulan (siri). Kemudian, dengan pemilihan rawak atau mekanikal, bahagian tertentu siri ini diasingkan dan pemprosesan berterusannya dijalankan. Pada dasarnya, pemilihan bersiri ialah pemilihan rawak atau mekanikal yang dijalankan untuk elemen pembesaran populasi asal.

Dari segi teori, persampelan bersiri adalah yang paling tidak sempurna daripada yang dipertimbangkan. Sebagai peraturan, ia tidak digunakan untuk memproses bahan, tetapi ia memberikan kemudahan tertentu dalam menganjurkan tinjauan, terutamanya dalam kajian pertanian. Sebagai contoh, tinjauan sampel tahunan ladang petani pada tahun-tahun sebelum kolektivisasi telah dijalankan dengan kaedah pemilihan bersiri. Ia berguna untuk diketahui oleh ahli sejarah persampelan bersiri kerana dia mungkin bertemu dengan hasil tinjauan tersebut.

Sebagai tambahan kepada kaedah pemilihan klasik yang diterangkan di atas, kaedah lain juga digunakan dalam amalan kaedah persampelan. Mari kita pertimbangkan dua daripadanya.

Populasi yang dikaji mungkin mempunyai struktur berbilang peringkat, ia mungkin terdiri daripada unit peringkat pertama, yang seterusnya, terdiri daripada unit peringkat kedua, dan seterusnya. Sebagai contoh, wilayah termasuk uyezds, uyezds boleh dianggap sebagai koleksi volost, volost terdiri daripada kampung, dan kampung terdiri daripada isi rumah.

Pemilihan pelbagai peringkat boleh digunakan untuk populasi tersebut, i.e. pilih berturut-turut pada setiap peringkat. Oleh itu, daripada satu set wilayah, dengan kaedah mekanikal, tipikal, atau rawak, seseorang boleh memilih daerah (peringkat pertama), kemudian pilih volost (peringkat kedua) menggunakan salah satu kaedah yang ditunjukkan, kemudian pilih kampung (peringkat ketiga) dan, akhirnya, isi rumah (peringkat keempat).

Contoh pemilihan mekanikal dua peringkat ialah pemilihan belanjawan pekerja yang telah lama diamalkan. Pada peringkat pertama, perusahaan dipilih secara mekanikal, pada peringkat kedua - pekerja, yang bajetnya diperiksa.

Kebolehubahan ciri-ciri objek yang dikaji boleh berbeza. Sebagai contoh, penyediaan ladang petani dengan tenaga buruh mereka sendiri turun naik kurang daripada, katakan, saiz tanaman mereka. Oleh itu, sampel bekalan buruh yang lebih kecil akan mewakili sama seperti sampel data saiz tanaman yang lebih besar. Dalam kes ini, daripada sampel yang digunakan untuk menentukan saiz tanaman, adalah mungkin untuk membuat sampel yang cukup mewakili untuk menentukan ketersediaan tenaga buruh, dengan itu menjalankan pemilihan dua fasa. Dalam kes umum, fasa berikut juga boleh ditambah, i.e. daripada subsampel yang terhasil, buat subsampel lain, dan seterusnya. Kaedah pemilihan yang sama digunakan dalam kes di mana objektif kajian memerlukan ketepatan yang berbeza apabila mengira penunjuk yang berbeza.

Tugasan 1. Statistik deskriptif

Pada peperiksaan, 20 pelajar menerima markah berikut (pada skala 100 mata):

1) Bina satu siri taburan frekuensi, frekuensi relatif dan terkumpul untuk 5 selang;

2) Bina poligon, histogram dan poligon terkumpul;

3) Cari min aritmetik, mod, median, kuartil pertama dan ketiga, julat suku tahunan, sisihan piawai dan pekali variasi. Analisis data menggunakan ciri-ciri ini dan nyatakan selang yang merangkumi 50% daripada nilai pusat nilai yang ditentukan.

1) x (min) =53, x (maks) =98

R=x (maks) - x (min) =98-53=45

h=R/1+3.32lgn, dengan n ialah saiz sampel, n=20

h= 45/1+3.32*lg20= 9

a (i) - had bawah selang, b (i) - had atas selang.

a (1) = x (min) - h/2, b (1) = a (1) + h, maka jika b (i) ialah had atas selang ke-i (dan a (i+1) =b (i)), kemudian b (2) = a (2) + h, b (3) = a (3) + h, dsb. Pembinaan selang berterusan sehingga permulaan selang seterusnya dalam susunan adalah sama dengan atau lebih besar daripada x (maks).

a(1) = 47.5 b(1) = 56.5

a(2) = 56.5 b(2) = 65.5

a(3) = 65.5 b(3) = 74.5

a(4) = 74.5 b(4) = 83.5

a(5) = 83.5 b(5) = 92.5

a(6) = 92.5 b(6) = 101.5

Selang, a (i) - b (i)	Pengiraan Kekerapan	Kekerapan, n(i)	Kekerapan terkumpul, n (hi)

2) Untuk memplot graf, kita tuliskan siri taburan variasi (selang dan diskret) frekuensi relatif W (i) = n (i) / n, frekuensi relatif terkumpul W (hi) dan cari nisbah W (i) / h dengan mengisi jadual.

x(i)=a(i)+b(i)/2; W(hi)=n(hi)/n

Siri anggaran pengagihan statistik:

Selang, a (i) - b (i)

Untuk membina histogram frekuensi relatif di sepanjang abscissa, kami mengetepikan selang separa, pada setiap satunya kami membina segi empat tepat, kawasan yang sama dengan frekuensi relatif W (i) selang ke-i yang diberikan. Maka ketinggian segi empat tepat asas hendaklah sama dengan W (i) / h.

Poligon dengan taburan yang sama boleh didapati daripada histogram jika titik tengah tapak atas segi empat tepat disambungkan oleh segmen garis lurus.

Untuk membina terkumpul siri diskret, kami memplotkan nilai ciri di sepanjang paksi absis, dan frekuensi terkumpul relatif W (hi) di sepanjang paksi ordinat. Titik yang terhasil disambungkan oleh segmen garisan. Untuk siri selang sepanjang abscissa, kami mengetepikan sempadan atas kumpulan.

3) Nilai min aritmetik didapati dengan formula:

Mod dikira dengan formula:

Had bawah selang modal; h - lebar selang kumpulan; - kekerapan selang modal; - kekerapan selang sebelum modal; - kekerapan selang mengikut modal. = 23.125.

Mari cari median:

n=20: 53.58.59.59.63.67.68.69.71.73.78.79.85.86.87.89.91.91.98.98

Menggantikan nilai, kita dapat: Q1=65;

Nilai kuartil kedua adalah sama dengan nilai median, jadi Q2=75.5; S3=88.

Julat suku tahunan ialah:

Sisihan punca kuasa dua (standard) didapati dengan formula:

Pekali variasi:

Dari pengiraan ini dapat dilihat bahawa 50% daripada nilai pusat kuantiti yang ditunjukkan termasuk selang 74.5 - 83.5.

Tugasan 2. Ujian statistik hipotesis.

Pilihan sukan untuk lelaki, wanita dan remaja adalah seperti berikut:

Uji hipotesis kebebasan keutamaan daripada jantina dan umur b = 0.05.

1) Menguji hipotesis tentang kebebasan keutamaan dalam sukan.

Pekali Pearsen:

Nilai jadual ujian khi kuasa dua dengan darjah kebebasan 4 pada b \u003d 0.05 adalah sama dengan h 2 jadual \u003d 9.488.

Oleh kerana hipotesis ditolak. Perbezaan dalam keutamaan adalah ketara.

2. Hipotesis pematuhan.

Bola tampar sebagai sukan paling hampir dengan bola keranjang. Mari kita semak surat-menyurat dalam keutamaan untuk lelaki, wanita dan remaja.

Ф 2 = 0.1896+0.1531+0.1624+0.1786+0.1415+0.1533 = 0.979.

Pada aras keertian b = 0.05 dan darjah kebebasan k = 2, nilai jadual h 2 tabl = 9.210.

Sejak Ф 2 >, perbezaan dalam keutamaan adalah ketara.

Tugasan 3. Analisis korelasi dan regresi.

Analisis kemalangan jalan raya menghasilkan statistik berikut mengenai peratusan pemandu bawah 21 tahun dan bilangan kemalangan serius bagi setiap 1,000 pemandu:

Menjalankan analisis data grafik dan korelasi-regresi, ramalkan bilangan kemalangan dengan akibat yang teruk untuk bandar di mana bilangan pemandu di bawah umur 21 tahun adalah bersamaan dengan 20% daripada jumlah bilangan pemandu.

Kami mendapat sampel saiz n = 10.

x ialah peratusan pemandu di bawah umur 21 tahun,

y ialah bilangan kemalangan bagi setiap 1000 pemandu.

Persamaan regresi linear kelihatan seperti:

Kami mengira secara berurutan:

Begitu juga, kita dapati

Pekali regresi sampel

Hubungan antara x, y adalah kuat.

Persamaan regresi linear mengambil bentuk:

hidup angka dibentangkan padang berselerak dan jadual linear regresi . Kita belanja ramalan untuk x n =20 .

Kita mendapatkan y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

Ramalan maksudnya berlaku lebih semua nilai, diserahkan dalam asal meja . ia akibat Untuk pergi, apa korelasi ketagihan lurus dan pekali sama 0,29 cukup besar . hidup setiap unit kenaikan Dx dia memberi kenaikan Dy =0 .3

Senaman 4 . Analisis Sementara pangkat dan peramalan .

menjangkakan nilai indeks untuk minggu hadapan menggunakan:

a) kaedah purata bergerak, memilih data tiga minggu untuk pengiraannya;

b) purata wajaran eksponen, memilih sebagai b = 0.1.

Daripada jadual nombor rawak kita dapati nombor 41, 51, 69, 135, 124, 93, 91, 144, 10, 24.

Kami menyusunnya dalam tertib menaik: 10, 24, 41, 51, 69, 91, 93, 124, 135, 144.

Kami menjalankan penomboran baharu dari 1 hingga 10. Kami mendapat data awal selama sepuluh minggu:

Pelicinan eksponen pada b = 0.1 hanya memberikan satu nilai.

Untuk pertengahan keseluruhan tempoh, kami mendapat tiga ramalan: 12.855; 1309; 12.895.

Terdapat persetujuan antara ramalan ini.

Senaman 5 . indeks analisis.

Syarikat ini terlibat dalam pengangkutan barang. Terdapat data untuk beberapa tahun mengenai jumlah pengangkutan 4 jenis kargo dan kos pengangkutan satu unit kargo.

Tentukan indeks harga, kuantiti dan nilai mudah untuk setiap jenis produk, serta indeks Laspeyres dan Pasche serta indeks nilai. Mengulas keputusan yang diperolehi dengan penuh bermakna.

Keputusan. Mari kita mengira indeks mudah:

Indeks Laspeyres:

Indeks Pasha:

Kos Turki:

Indeks individu menunjukkan perbezaan dalam perubahan harga dan kuantiti bagi barangan A, B, C, D. Indeks agregat menunjukkan arah aliran umum dalam perubahan. Secara amnya, kos pengangkutan barang menurun sebanyak 13%. Sebabnya ialah kargo yang paling mahal telah menurun sebanyak 42% dalam kuantiti, dan tarifnya tidak banyak berubah.

Tahun 16-20 dinomborkan mengikut urutan dari 1 hingga 5. Data awal dalam bentuk:

Pertama, kita mengkaji dinamik jumlah kargo A.

Indeks	Keuntungan mutlak	Kadar pertumbuhan, %	Kadar pertumbuhan, %

Pada ini laju pertumbuhan purata pada formula :

, .

Untuk laju pertumbuhan dalam mana-mana kes T dan lain-lain =T R -1 .

Sekarang pertimbangkan kargo D .

Indeks	Keuntungan mutlak	Kadar pertumbuhan, %	Kadar pertumbuhan, %

Kesimpulan

Purata dan varietinya memainkan peranan penting dalam statistik. Penunjuk purata digunakan secara meluas dalam analisis, kerana di dalamnya terdapat keteraturan. fenomena jisim dan proses dalam masa dan ruang. Jadi, sebagai contoh, corak peningkatan produktiviti buruh mendapati ekspresinya dalam perangkaan pertumbuhan purata keluaran setiap seorang yang bekerja dalam industri, keteraturan pertumbuhan yang stabil dalam tahap kesejahteraan penduduk ditunjukkan dalam penunjuk statistik peningkatan pendapatan purata pekerja dan pekerja, dsb.

Ciri-ciri deskriptif taburan ciri pembolehubah seperti mod dan median digunakan secara meluas. Mereka adalah ciri khusus, maksudnya ialah sebarang pilihan tertentu dalam siri variasi.

Jadi, untuk mencirikan nilai yang paling biasa bagi sesuatu ciri, mod digunakan, dan untuk menunjukkan had kuantitatif nilai ciri pembolehubah, yang dicapai oleh separuh daripada ahli populasi, median ialah digunakan.

Oleh itu, nilai purata membantu untuk mengkaji corak pembangunan industri, industri tertentu, masyarakat dan negara secara keseluruhan.

Bibliografi

1. Teori statistik: Buku Teks / R.A. Shmoylova, V.G. Minashkin, N.A. Sadovnikov, E.B. Shuvalov; Di bawah pengarang R.A. Shmoylova. - ed. ke-4, disemak. dan tambahan - M.: Kewangan dan statistik, 2005. - 656s.

2. Gusarov V.M. Statistik: Tutorial untuk universiti. - M.: UNITI-DANA, 2001.

4. Pengumpulan tugasan mengenai teori statistik: Buku Teks / Ed. prof.V. V. Glinsky dan Ph.D. PhD, Madya L.K. Serga. Ed. Z-e. - M.: INFRA-M; Novosibirsk: Perjanjian Siberia, 2002.

5. Statistik: Buku Teks / Kharchenko L-P., Dolzhenkova V.G., Ionin V.G. dan lain-lain, ed. V.G. Ionina. - Ed.2nd, disemak. dan tambahan - M.: INFRA-M. 2003.

Dokumen Serupa

Statistik deskriptif dan inferens statistik. Kaedah pemilihan yang memastikan keterwakilan sampel. Pengaruh jenis sampel terhadap magnitud ralat. Tugas dalam mengaplikasikan kaedah persampelan. Pengagihan data pemerhatian kepada populasi umum.

ujian, ditambah 02/27/2011

Kaedah persampelan dan peranannya. Pembangunan teori moden pemerhatian terpilih. Tipologi kaedah pemilihan. Cara pelaksanaan praktikal persampelan rawak mudah. Organisasi sampel biasa (berstrata). Saiz sampel dalam pemilihan kuota.

laporan, ditambah 09/03/2011

Tujuan persampelan dan persampelan. Ciri Organisasi pelbagai jenis pemerhatian terpilih. Kesilapan pemilihan terpilih dan kaedah untuk pengiraannya. Penggunaan kaedah pensampelan untuk analisis perusahaan kompleks bahan api dan tenaga.

kertas penggal, ditambah 10/06/2014

Pemerhatian terpilih sebagai kaedah penyelidikan statistik, ciri-cirinya. Pemilihan jenis rawak, mekanikal, tipikal dan bersiri dalam pembentukan set sampel. Konsep dan punca ralat pensampelan, kaedah untuk penentuannya.

abstrak, ditambah 06/04/2010

Konsep dan peranan statistik dalam mekanisme pengurusan ekonomi moden. Pemerhatian statistik berterusan dan tidak berterusan, penerangan kaedah persampelan. Jenis pemilihan semasa pemerhatian terpilih, ralat pensampelan. Penunjuk pengeluaran dan kewangan.

kertas penggal, ditambah 03/17/2011

Mengkaji pelaksanaan rancangan. Tinjauan persampelan rawak 10%. Kos pengeluaran kilang. ralat marginal sampel. Dinamik harga purata dan volum jualan produk. Indeks Harga Komposisi Berubah.

kerja kawalan, ditambah 02/09/2009

Mendapatkan sampel volum taburan n-normal pembolehubah rawak. Mencari ciri berangka sampel. mengumpulkan data dan siri variasi. Histogram kekerapan. Fungsi pengedaran empirikal. Anggaran statistik parameter.

kerja makmal, tambah 03/31/2013

Intipati konsep persampelan dan pemerhatian persampelan, jenis utama dan kategori pemilihan. Penentuan isipadu dan saiz sampel. Penggunaan praktikal Analisis statistik pemerhatian terpilih. Pengiraan ralat dalam pecahan sampel dan min sampel.

kertas penggal, ditambah 17/02/2015

Konsep pemerhatian terpilih. Ralat keterwakilan, pengukuran ralat pensampelan. Menentukan saiz sampel yang diperlukan. Penggunaan kaedah persampelan dan bukannya kaedah berterusan. Sebaran dalam populasi umum dan perbandingan penunjuk.

ujian, ditambah 07/23/2009

Jenis kesilapan pemilihan dan pemerhatian. Kaedah untuk memilih unit dalam populasi sampel. Ciri aktiviti komersial perusahaan. Contoh tinjauan pengguna produk. Pengagihan ciri sampel kepada populasi umum.

Sebahagian daripada objek daripada populasi yang dipilih untuk dikaji untuk membuat kesimpulan tentang keseluruhan populasi. Agar kesimpulan yang diperolehi dengan mengkaji sampel diperluaskan kepada keseluruhan populasi, sampel mestilah mempunyai sifat mewakili.

Kewakilan sampel

Sifat sampel untuk mencerminkan populasi umum dengan betul. Sampel yang sama mungkin atau mungkin tidak mewakili populasi yang berbeza.
Contoh:

Sampel yang terdiri sepenuhnya daripada warga Muscovite yang memiliki kereta tidak mewakili keseluruhan penduduk Moscow.

Sampel perusahaan Rusia dengan sehingga 100 pekerja tidak mewakili semua perusahaan di Rusia.

Sampel Muscovite yang membuat pembelian di pasaran tidak mewakili gelagat pembelian semua Muscovite.

Pada masa yang sama, sampel ini (tertakluk kepada syarat lain) dengan sempurna boleh mewakili pemilik kereta Muscovite, perusahaan kecil dan sederhana Rusia dan pembeli yang membuat pembelian di pasaran, masing-masing.

Adalah penting untuk memahami bahawa keterwakilan sampel dan ralat pensampelan adalah fenomena yang berbeza. Kewakilan, tidak seperti ralat, tidak bergantung pada saiz sampel.

Tidak kira berapa banyak kami meningkatkan bilangan pemilik kereta Muscovite yang ditinjau, kami tidak akan dapat mewakili semua Muscovite dengan sampel ini.

Ralat pensampelan (selang keyakinan)

Sisihan keputusan yang diperolehi dengan bantuan pemerhatian sampel daripada data sebenar populasi umum.

Terdapat dua jenis ralat persampelan: statistik dan sistematik. Ralat statistik bergantung pada saiz sampel. Semakin besar saiz sampel, semakin rendah ia.

Contoh:
Untuk sampel rawak mudah sebanyak 400 unit, ralat statistik maksimum (daripada 95% tahap keyakinan) ialah 5%, untuk sampel 600 unit - 4%, untuk sampel 1100 unit - 3%.Biasanya, apabila mereka bercakap tentang ralat pensampelan, ia bermaksud ralat statistik.

Ralat sistematik bergantung kepada pelbagai faktor yang mempunyai kesan kekal terhadap kajian dan mengalihkan hasil kajian ke arah tertentu.

Contoh:
- Penggunaan mana-mana sampel kebarangkalian meremehkan bahagian orang berpendapatan tinggi memimpin imej aktif kehidupan. Ini berlaku kerana fakta bahawa orang seperti itu lebih sukar ditemui di mana-mana tempat tertentu (contohnya, di rumah).

Masalah responden yang enggan menjawab soalan soal selidik (bahagian "refuseniks" di Moscow, untuk tinjauan yang berbeza, berkisar antara 50% hingga 80%)

Dalam sesetengah kes, apabila pengedaran sebenar diketahui, ralat sistematik boleh disamakan dengan pengenalan kuota atau pemberatan semula data, tetapi dalam kebanyakan kajian sebenar, malah menilai ia boleh menjadi agak bermasalah.

Jenis sampel

Sampel dibahagikan kepada dua jenis:

kebarangkalian

kemustahilan

Sampel kebarangkalian

1.1 Persampelan rawak (pemilihan rawak mudah)

Sampel sedemikian mengandaikan kehomogenan populasi umum, kebarangkalian yang sama bagi ketersediaan semua unsur, kehadiran senarai lengkap semua elemen. Apabila memilih elemen, sebagai peraturan, jadual nombor rawak digunakan.
1.2 Persampelan mekanikal (sistematik).

Sejenis sampel rawak, diisih mengikut beberapa atribut (susun abjad, nombor telefon, tarikh lahir, dsb.). Elemen pertama dipilih secara rawak, kemudian setiap elemen 'k' dipilih dalam kenaikan 'n'. Saiz populasi umum, manakala - N=n*k

1.3 Berstrata (berzon)

Ia digunakan dalam kes heterogenitas populasi umum. Penduduk umum dibahagikan kepada kumpulan (strata). Dalam setiap lapisan, pemilihan dijalankan secara rawak atau mekanikal.

1.4 Persampelan bersiri (bersarang atau berkelompok).

Dengan pensampelan bersiri, unit pemilihan bukanlah objek itu sendiri, tetapi kumpulan (kelompok atau sarang). Kumpulan dipilih secara rawak. Objek dalam kumpulan ditinjau di seluruh.

Sampel Luar Biasa

Pemilihan dalam sampel sedemikian dilakukan bukan mengikut prinsip peluang, tetapi mengikut kriteria subjektif - kebolehcapaian, tipikal, perwakilan yang sama, dll.

persampelan kuota

Pada mulanya, sebilangan kumpulan objek tertentu diperuntukkan (contohnya, lelaki berumur 20-30 tahun, 31-45 tahun dan 46-60 tahun; orang yang berpendapatan sehingga 30 ribu rubel, dengan pendapatan 30 hingga 60 tahun. ribu rubel dan dengan pendapatan lebih daripada 60 ribu rubel ) Bagi setiap kumpulan, bilangan objek yang akan ditinjau ditentukan. Bilangan objek yang sepatutnya termasuk dalam setiap kumpulan ditetapkan, paling kerap, sama ada berkadaran dengan bahagian kumpulan yang diketahui sebelum ini dalam populasi umum, atau sama untuk setiap kumpulan. Dalam kumpulan, objek dipilih secara rawak. Sampel kuota digunakan agak kerap dalam penyelidikan pemasaran.

Kaedah Bola salji

Sampel dibina seperti berikut. Setiap responden, bermula dengan yang pertama, diminta menghubungi rakan, rakan sekerja, kenalannya yang sesuai dengan syarat pemilihan dan boleh mengambil bahagian dalam kajian. Oleh itu, dengan pengecualian langkah pertama, sampel dibentuk dengan penyertaan objek kajian itu sendiri. Kaedah ini sering digunakan apabila perlu mencari dan menemu bual kumpulan responden yang sukar dijangkau (contohnya, responden yang berpendapatan tinggi, responden dalam kumpulan profesional yang sama, responden yang mempunyai beberapa hobi / minat yang sama, dll. )
2.3 Persampelan spontan

Responden yang paling mudah diakses adalah ditinjau. Contoh biasa sampel rawak - tinjauan dalam akhbar / majalah, soal selidik diberikan kepada responden untuk dilengkapkan sendiri, kebanyakan tinjauan Internet. Saiz dan komposisi sampel spontan tidak diketahui terlebih dahulu, dan ditentukan oleh hanya satu parameter - aktiviti responden.
2.4 Contoh kes biasa

Unit populasi umum dipilih yang mempunyai nilai purata (tipikal) atribut. Ini menimbulkan masalah memilih ciri dan menentukan nilai tipikalnya.

Pelaksanaan rancangan penyelidikan

Tahap ini, kami ingat, termasuk pengumpulan maklumat dan analisisnya. Proses melaksanakan pelan penyelidikan pemasaran lazimnya memerlukan penyelidikan yang paling banyak dan merupakan punca ralat terbesar.

Apabila mengumpul data statistik, beberapa kelemahan dan masalah timbul:

pertama, sesetengah responden mungkin tidak berada di tempat yang dipersetujui dan mereka perlu dihubungi semula atau diganti;

kedua, sesetengah responden mungkin tidak bekerjasama atau memberikan jawapan yang berat sebelah, secara sedar palsu.

Terima kasih kepada teknologi pengkomputeran dan telekomunikasi moden, kaedah pengumpulan data berkembang dan bertambah baik.

Sesetengah firma menjalankan tinjauan dari satu pusat. Dalam kes ini, penemuduga profesional duduk di pejabat dan mendail nombor telefon rawak. Jika mereka mendengar jawapan pemanggil, penemuduga meminta orang yang menjawab telefon untuk menjawab beberapa soalan. Yang terakhir dibaca dari skrin monitor komputer dan jawapan responden ditaip pada papan kekunci. Kaedah ini menghapuskan keperluan untuk pemformatan dan pengekodan data, mengurangkan bilangan ralat.