Kaedah statistik analisis data saintifik. Kaedah statistik - apakah itu? Aplikasi kaedah statistik

AGENSI PERSEKUTUAN UNTUK PENDIDIKAN

INSTITUSI PENDIDIKAN NEGERI

PENDIDIKAN PROFESIONAL TINGGI

"UNIVERSITI NEGERI YUGORSK"

INSTITUT PENDIDIKAN TAMBAHAN

PROGRAM LATIHAN SEMULA PROFESIONAL

"PENGURUSAN NEGERI DAN PERBANDARAN"

KARANGAN

Subjek: "Statistik"

"Kaedah penyelidikan statistik"

Dilaksanakan:

Khanty-Mansiysk

pengenalan

1. Kaedah penyelidikan statistik.

1.1. Kaedah pemerhatian statistik

1.4. Siri Variasi

1.5. Kaedah persampelan

1.6. Analisis korelasi dan regresi

1.7. Siri dinamik

1.8. Indeks Statistik

Kesimpulan

Senarai sastera terpakai

Maklumat statistik yang lengkap dan boleh dipercayai adalah asas yang diperlukan di mana proses pengurusan ekonomi berasaskan. Semua maklumat kepentingan ekonomi negara akhirnya diproses dan dianalisis menggunakan statistik.

Ia adalah data statistik yang memungkinkan untuk menentukan jumlah keluaran dalam negara kasar dan pendapatan negara, untuk mengenal pasti arah aliran utama dalam pembangunan sektor ekonomi, untuk menilai tahap inflasi, untuk menganalisis keadaan pasaran kewangan dan komoditi, untuk mengkaji taraf hidup penduduk dan fenomena dan proses sosio-ekonomi yang lain. Menguasai metodologi statistik ialah salah satu syarat untuk memahami keadaan pasaran, mengkaji arah aliran dan ramalan, dan membuat keputusan yang optimum pada semua peringkat aktiviti.

Sains statistik ialah satu cabang ilmu yang mengkaji fenomena kehidupan sosial dari segi kuantitatifnya yang berkait rapat dengan kandungan kualitatifnya dalam keadaan tempat dan masa tertentu. Amalan statistik ialah aktiviti mengumpul, mengumpul, memproses dan menganalisis data digital yang mencirikan semua fenomena dalam kehidupan masyarakat.

Bercakap tentang statistik, perlu diingat bahawa angka dalam statistik bukanlah abstrak, tetapi menyatakan makna ekonomi yang mendalam. Setiap ahli ekonomi mesti boleh menggunakan angka statistik, menganalisisnya, dan boleh menggunakannya untuk mengesahkan kesimpulan mereka.

Undang-undang statistik beroperasi dalam masa dan tempat di mana ia ditemui.

Dunia sekeliling terdiri daripada fenomena massa. Jika fakta individu bergantung kepada undang-undang kebetulan, maka jisim fenomena tertakluk kepada undang-undang. Untuk mengesan corak ini, hukum nombor besar digunakan.

Untuk mendapatkan maklumat statistik, badan perangkaan negeri dan jabatan, serta struktur komersial, menjalankan pelbagai jenis penyelidikan statistik. Proses penyelidikan statistik merangkumi tiga peringkat utama: pengumpulan data, ringkasan dan pengelompokan mereka, analisis dan pengiraan penunjuk generalisasi.

Hasil dan kualiti semua kerja berikutnya sebahagian besarnya bergantung pada cara bahan statistik utama dikumpul, cara ia diproses dan dikumpulkan, dan pada akhirnya, sekiranya berlaku pelanggaran, ia boleh membawa kepada kesimpulan yang benar-benar salah.

Rumit, memakan masa dan bertanggungjawab adalah peringkat akhir, analisis kajian. Pada peringkat ini, penunjuk purata dan penunjuk taburan dikira, struktur populasi dianalisis, dinamik dan hubungan antara fenomena dan proses yang dikaji dikaji.

Pada semua peringkat penyelidikan, statistik menggunakan kaedah yang berbeza. Kaedah statistik adalah prima khas dan kaedah mengkaji fenomena sosial massa.

Pada peringkat pertama kajian, kaedah pemerhatian jisim digunakan, bahan statistik utama dikumpulkan. Syarat utama adalah watak jisim, kerana undang-undang kehidupan sosial dimanifestasikan dalam susunan data yang cukup besar disebabkan oleh operasi undang-undang bilangan besar, i.e. dalam ciri statistik ringkasan, rawak membatalkan satu sama lain.

Pada peringkat kedua kajian, apabila maklumat yang dikumpul tertakluk kepada pemprosesan statistik, kaedah pengumpulan digunakan. Penggunaan kaedah pengelompokan memerlukan syarat yang sangat diperlukan - homogeniti kualitatif populasi.

Pada peringkat ketiga kajian, maklumat statistik dianalisis menggunakan kaedah seperti kaedah generalisasi penunjuk, kaedah jadual dan grafik, kaedah untuk menilai variasi, kaedah imbangan, dan kaedah indeks.

Kerja analisis harus mengandungi unsur-unsur pandangan jauh, menunjukkan kemungkinan akibat daripada situasi yang muncul.

Pengurusan statistik di negara ini dijalankan oleh Jawatankuasa Negeri Persekutuan Rusia mengenai Statistik. Sebagai badan eksekutif persekutuan, ia menjalankan pengurusan am statistik di negara ini, menyediakan maklumat statistik rasmi kepada Presiden, Kerajaan, Perhimpunan Persekutuan, badan eksekutif persekutuan, organisasi awam dan antarabangsa, membangunkan metodologi statistik, menyelaras aktiviti statistik persekutuan. dan organisasi eksekutif serantau, menganalisis maklumat ekonomi dan statistik, merangka akaun negara dan membuat pengiraan baki.

Sistem badan statistik di Persekutuan Rusia dibentuk mengikut bahagian pentadbiran-wilayah negara. Di republik yang merupakan sebahagian daripada Persekutuan Rusia, terdapat jawatankuasa Republikan. Di daerah autonomi, wilayah, wilayah, di Moscow dan St. Petersburg, terdapat Jawatankuasa Statistik Negeri.

Di daerah (bandar) - jabatan (jabatan) statistik negeri. Selain negeri, terdapat juga statistik jabatan (di perusahaan, jabatan, kementerian). Ia menyediakan keperluan dalaman untuk maklumat statistik.

Tujuan kerja ini adalah untuk mempertimbangkan kaedah penyelidikan statistik.

1. Kaedah penyelidikan statistik

Terdapat hubungan rapat antara sains statistik dan amalan: statistik menggunakan data amalan, membuat generalisasi dan membangunkan kaedah untuk menjalankan penyelidikan statistik. Sebaliknya, dalam amalan, peruntukan teori sains statistik digunakan untuk menyelesaikan masalah pengurusan tertentu. Pengetahuan tentang statistik adalah perlu bagi pakar moden untuk membuat keputusan dalam keadaan stokastik (apabila fenomena yang dianalisis dipengaruhi secara kebetulan), untuk menganalisis unsur-unsur ekonomi pasaran, untuk mengumpul maklumat, disebabkan oleh peningkatan dalam bilangan unit ekonomi dan jenisnya, audit, pengurusan kewangan, ramalan.

Untuk mengkaji subjek statistik, teknik khusus telah dibangunkan dan digunakan, yang keseluruhannya membentuk metodologi statistik (kaedah pemerhatian jisim, kumpulan, penunjuk umum, siri masa, kaedah indeks, dll.). Penggunaan kaedah khusus dalam statistik ditentukan terlebih dahulu oleh tugasan yang ditetapkan dan bergantung pada jenis maklumat awal. Pada masa yang sama, statistik adalah berdasarkan kategori dialektik seperti kuantiti dan kualiti, keperluan dan peluang, kausalitas, keteraturan, individu dan jisim, individu dan umum. Kaedah statistik digunakan secara menyeluruh (sistemik). Ini disebabkan oleh kerumitan proses penyelidikan ekonomi dan statistik, yang terdiri daripada tiga peringkat utama: yang pertama ialah pengumpulan maklumat statistik utama; yang kedua - ringkasan statistik dan pemprosesan maklumat utama; yang ketiga ialah generalisasi dan tafsiran maklumat statistik.

Metodologi umum untuk mengkaji populasi statistik adalah menggunakan prinsip asas yang membimbing mana-mana sains. Prinsip-prinsip ini, sebagai sejenis prinsip, termasuk yang berikut:

1. objektiviti fenomena dan proses yang dikaji;

2. mengenal pasti hubungan dan ketekalan di mana kandungan faktor yang dikaji dimanifestasikan;

3. penetapan matlamat, iaitu. pencapaian matlamat yang ditetapkan di pihak penyelidik mengkaji data statistik yang berkaitan.

Ini dinyatakan dalam mendapatkan maklumat tentang trend, corak dan kemungkinan akibat daripada perkembangan proses yang dikaji. Pengetahuan tentang corak pembangunan proses sosio-ekonomi yang menarik minat masyarakat adalah amat penting secara praktikal.

Ciri-ciri analisis data statistik termasuk kaedah pemerhatian jisim, kesahan saintifik kandungan kualitatif kumpulan dan keputusannya, pengiraan dan analisis penunjuk umum dan generalisasi bagi objek yang dikaji.

Bagi kaedah khusus ekonomi, perindustrian atau statistik budaya, penduduk, kekayaan negara, dsb., mungkin terdapat kaedah khusus untuk mengumpul, mengumpulkan dan menganalisis agregat yang sepadan (jumlah fakta).

Dalam perangkaan ekonomi, sebagai contoh, kaedah imbangan digunakan secara meluas sebagai kaedah yang paling biasa untuk menghubungkan penunjuk individu dalam satu sistem hubungan ekonomi dalam pengeluaran sosial. Kaedah yang digunakan dalam statistik ekonomi juga termasuk penyusunan kumpulan, pengiraan penunjuk relatif (nisbah peratusan), perbandingan, pengiraan pelbagai jenis purata, indeks, dll.

Kaedah menyambung pautan terdiri daripada fakta bahawa dua volumetrik, i.e. Penunjuk kuantitatif dibandingkan berdasarkan hubungan yang wujud di antara mereka. Sebagai contoh, produktiviti buruh dari segi fizikal dan jam bekerja, atau jumlah trafik dalam tan dan purata jarak pengangkutan dalam km.

Apabila menganalisis dinamik pembangunan ekonomi negara, kaedah utama untuk mengenal pasti dinamik (pergerakan) ini ialah kaedah indeks, kaedah menganalisis siri masa.

Dalam analisis statistik corak ekonomi utama pembangunan ekonomi negara, kaedah statistik penting ialah pengiraan keakraban hubungan antara penunjuk menggunakan analisis korelasi dan penyebaran, dsb.

Sebagai tambahan kepada kaedah ini, kaedah penyelidikan matematik dan statistik telah meluas, yang semakin berkembang apabila skala penggunaan komputer dan penciptaan sistem automatik bergerak.

Peringkat penyelidikan statistik:

1. Pemerhatian statistik - pengumpulan maklumat primer yang disusun secara saintifik secara besar-besaran tentang unit individu bagi fenomena yang dikaji.

2. Pengumpulan dan ringkasan bahan - generalisasi data pemerhatian untuk mendapatkan nilai mutlak (perakaunan dan penunjuk anggaran) fenomena.

3. Memproses data statistik dan analisis keputusan untuk mendapatkan kesimpulan yang munasabah tentang keadaan fenomena yang dikaji dan corak perkembangannya.

Semua peringkat penyelidikan statistik berkait rapat antara satu sama lain dan adalah sama penting. Kekurangan dan kesilapan yang berlaku pada setiap peringkat mempengaruhi keseluruhan kajian secara keseluruhan. Oleh itu, penggunaan kaedah khas sains statistik yang betul pada setiap peringkat memungkinkan untuk mendapatkan maklumat yang boleh dipercayai hasil daripada penyelidikan statistik.

Kaedah penyelidikan statistik:

1. Pemerhatian statistik

2. Ringkasan dan pengumpulan data

3. Pengiraan penunjuk generalisasi (nilai mutlak, relatif dan purata)

4. Taburan statistik (siri variasi)

5. Kaedah persampelan

6. Analisis korelasi dan regresi

7. Siri dinamik

Tugas statistik ialah pengiraan penunjuk statistik dan analisisnya, terima kasih kepada badan pentadbir menerima penerangan menyeluruh tentang objek yang diuruskan, sama ada keseluruhan ekonomi negara atau sektor individu, perusahaan dan bahagian mereka. Adalah mustahil untuk mengurus sistem sosio-ekonomi tanpa mempunyai maklumat statistik yang beroperasi, boleh dipercayai dan lengkap.

Pemerhatian statistik adalah sistematik, tersusun secara saintifik dan, sebagai peraturan, pengumpulan data sistematik mengenai fenomena kehidupan sosial. Ia dijalankan dengan mendaftarkan ciri-ciri penting yang telah ditetapkan untuk mendapatkan ciri-ciri generalisasi selanjutnya bagi fenomena ini.

Sebagai contoh, semasa menjalankan banci penduduk, maklumat tentang setiap penduduk negara direkodkan tentang jantina, umur, status perkahwinan, pendidikan, dsb., dan kemudian pihak berkuasa statistik menentukan, berdasarkan maklumat ini, populasi negara, umurnya. struktur, lokasi dalam negara, komposisi keluarga dan penunjuk lain.

Keperluan berikut dikenakan ke atas pemerhatian statistik: kesempurnaan liputan populasi yang dikaji, kebolehpercayaan dan ketepatan data, keseragaman dan kebolehbandingannya.

Bentuk, jenis dan kaedah pemerhatian statistik

Pemerhatian statistik dijalankan dalam dua bentuk: pelaporan dan pemerhatian statistik yang dianjurkan khas.

pelaporan dipanggil satu bentuk organisasi pemerhatian statistik, di mana maklumat diterima oleh pihak berkuasa statistik daripada perusahaan, institusi dan organisasi dalam bentuk laporan mandatori mengenai aktiviti mereka.

Pelaporan boleh bersifat nasional dan intrajabatan.

Di seluruh negara - pergi ke pihak atasan dan badan perangkaan negeri. Ia perlu untuk tujuan generalisasi, kawalan, analisis dan ramalan.

Intradepartmental - digunakan di kementerian dan jabatan untuk keperluan operasi.

Pelaporan diluluskan oleh Jawatankuasa Statistik Negeri Persekutuan Rusia. Pelaporan disusun berdasarkan perakaunan utama. Keistimewaan pelaporan ialah ia wajib, didokumenkan dan disahkan secara sah dengan tandatangan ketua.

Pemerhatian statistik yang dianjurkan khas- pemerhatian dianjurkan untuk beberapa tujuan khas untuk mendapatkan maklumat yang tiada dalam pelaporan, atau untuk mengesahkan dan menjelaskan data pelaporan. Ini adalah banci penduduk, ternakan, peralatan, semua jenis rekod sekali. Seperti, sebagai contoh, tinjauan belanjawan isi rumah, tinjauan pendapat, dsb.

Jenis pemerhatian statistik boleh dikumpulkan mengikut dua kriteria: mengikut sifat pendaftaran fakta dan dengan liputan unit penduduk.

Dengan sifat pendaftaran fakta pemerhatian statistik boleh: semasa atau sistematik dan tidak berterusan .

Pemantauan semasa ialah perakaunan berterusan, contohnya, pengeluaran, pelepasan bahan dari gudang, dsb., i.e. pendaftaran dijalankan mengikut fakta yang berlaku.

Pemantauan tidak berterusan boleh berkala, i.e. berulang secara berkala. Contohnya, bancian ternakan pada 1 Januari atau pendaftaran harga pasaran pada 22 haribulan setiap bulan. Pemerhatian satu kali dianjurkan mengikut keperluan, i.e. tanpa mematuhi berkala atau secara umum sekali. Contohnya, kajian pendapat umum.

Dengan liputan unit penduduk Pemerhatian boleh berterusan atau tidak berterusan.

Pada berterusan Semua unit populasi tertakluk kepada pemerhatian. Sebagai contoh, bancian.

Pada tidak berterusan pemerhatian, sebahagian daripada unit populasi diperiksa. Pemerhatian tidak berterusan boleh dibahagikan kepada subspesies: terpilih, monografi, kaedah tatasusunan utama.

Pemerhatian terpilih adalah pemerhatian berdasarkan prinsip pemilihan rawak. Dengan organisasi dan kelakuannya yang betul, pemerhatian terpilih menyediakan data yang boleh dipercayai pada populasi yang dikaji. Dalam beberapa kes, mereka boleh menggantikan perakaunan berterusan, kerana hasil pemerhatian sampel dengan kebarangkalian yang jelas boleh diperluaskan kepada keseluruhan populasi. Contohnya, kawalan kualiti produk, kajian produktiviti ternakan, dsb. Dalam ekonomi pasaran, skop pemerhatian terpilih semakin berkembang.

Pemerhatian monografi- ini adalah kajian terperinci dan mendalam dan penerangan tentang unit populasi yang mempunyai ciri dalam beberapa aspek. Ia dijalankan untuk mengenal pasti trend sedia ada dan yang baru muncul dalam perkembangan fenomena (mengenal pasti kelemahan, mengkaji amalan terbaik, bentuk organisasi baru, dll.)

Kaedah Tatasusunan Utama terdiri daripada fakta bahawa unit terbesar adalah tertakluk kepada tinjauan, yang, secara bersama-sama, mempunyai bahagian utama dalam keseluruhan mengikut ciri utama (ciri) untuk kajian ini. Oleh itu, apabila mengkaji kerja pasaran di bandar-bandar, pasaran bandar-bandar besar diperiksa, di mana 50% daripada jumlah penduduk hidup, dan perolehan pasaran adalah 60% daripada jumlah perolehan.

Mengikut sumber maklumat Bezakan antara pemerhatian langsung, dokumentari dan tinjauan.

langsung dipanggil pemerhatian sedemikian, di mana pendaftar sendiri, dengan mengukur, menimbang atau mengira, mewujudkan fakta dan merekodkannya dalam borang pemerhatian (borang).

Dokumentari- melibatkan merekodkan jawapan berdasarkan dokumen yang berkaitan.

Temuduga- ini adalah pemerhatian di mana jawapan kepada soalan direkodkan daripada kata-kata responden. Sebagai contoh, bancian.

Dalam statistik, maklumat tentang fenomena yang dikaji boleh dikumpulkan dalam pelbagai cara: pelaporan, ekspedisi, pengiraan sendiri, soal selidik, koresponden.

Intipati pelaporan kaedah adalah untuk menyediakan laporan dengan cara yang wajib.

Ekspedisi Kaedah ini terdiri daripada fakta bahawa pekerja yang tertarik dan terlatih merekodkan maklumat dalam borang pemerhatian (bancian penduduk).

Pada pengiraan sendiri Borang (daftar diri) diisi sendiri oleh responden. Kaedah ini digunakan, contohnya, dalam kajian migrasi bandul (pergerakan penduduk dari tempat tinggal ke tempat kerja dan belakang).

soal selidik kaedahnya ialah pengumpulan data statistik menggunakan soal selidik khas (soal selidik) yang dihantar kepada kalangan orang tertentu atau diterbitkan dalam majalah berkala. Kaedah ini digunakan secara meluas terutamanya dalam pelbagai tinjauan sosiologi. Walau bagaimanapun, ia mempunyai bahagian subjektiviti yang besar.

Intipati wartawan Kaedah ini terletak pada fakta bahawa pihak berkuasa statistik bersetuju dengan orang tertentu (wartawan sukarela), yang berjanji untuk memerhati sebarang fenomena dalam jangka masa yang ditetapkan dan melaporkan keputusan kepada pihak berkuasa statistik. Sebagai contoh, penilaian pakar dijalankan ke atas isu-isu khusus pembangunan sosio-ekonomi negara.

1.2. Rumusan dan pengelompokan bahan pemerhatian statistik

Intipati dan tugas ringkasan dan pengelompokan

Ringkasan- ini ialah operasi untuk mencari fakta tunggal khusus yang membentuk satu set dan dikumpulkan hasil pemerhatian. Hasil daripada rumusan, banyak penunjuk individu yang berkaitan dengan setiap unit objek pemerhatian bertukar menjadi sistem jadual statistik dan keputusan, ciri tipikal dan corak fenomena yang dikaji secara keseluruhannya muncul.

Mengikut kedalaman dan ketepatan pemprosesan, ringkasan dibezakan antara mudah dan kompleks.

Ringkasan Mudah- ini ialah operasi untuk mengira jumlah, i.e. dengan set unit pemerhatian.

Ringkasan kompleks- ini adalah kompleks operasi, termasuk pengelompokan unit pemerhatian, pengiraan keputusan untuk setiap kumpulan dan untuk objek secara keseluruhan, dan pembentangan keputusan dalam bentuk jadual statistik.

Proses ringkasan termasuk langkah-langkah berikut:

Pemilihan atribut kumpulan;

Menentukan susunan pembentukan kumpulan;

Pembangunan sistem penunjuk untuk mencirikan kumpulan dan objek secara keseluruhan;

Reka reka letak jadual untuk membentangkan hasil ringkasan.

Dalam bentuk pemprosesan, ringkasannya ialah:

Berpusat (semua bahan utama pergi ke satu organisasi yang lebih tinggi, sebagai contoh, Jawatankuasa Statistik Negeri Persekutuan Rusia, dan diproses sepenuhnya di sana);

Terdesentralisasi (pemprosesan bahan terkumpul berjalan dalam garis menaik, iaitu bahan diringkaskan dan dikumpulkan pada setiap peringkat).

Dalam amalan, kedua-dua bentuk pelaporan biasanya digabungkan. Jadi, sebagai contoh, dalam banci, keputusan awal diperoleh dalam susunan ringkasan terpencar, dan keputusan akhir disatukan diperoleh hasil daripada pembangunan terpusat borang banci.

Mengikut teknik pelaksanaan, ringkasan adalah mekanis dan manual.

berkumpulan dipanggil pembahagian populasi yang dikaji kepada kumpulan homogen mengikut ciri penting tertentu.

Berdasarkan kaedah pengelompokan, tugas utama kajian diselesaikan, dan aplikasi yang betul bagi kaedah analisis statistik dan statistik-matematik yang lain dipastikan.

Kerja berkumpulan adalah rumit dan sukar. Teknik pengelompokan adalah pelbagai, yang disebabkan oleh kepelbagaian ciri pengelompokan dan pelbagai objektif kajian. Tugas utama yang diselesaikan dengan bantuan kumpulan termasuk:

Pengenalpastian jenis sosio-ekonomi;

Kajian struktur penduduk, perubahan struktur di dalamnya;

Mendedahkan kaitan antara fenomena dan saling bergantung.

Jenis pengelompokan

Bergantung pada tugas yang diselesaikan dengan bantuan kumpulan, terdapat 3 jenis kumpulan: tipologi, struktur dan analitik.

Pengelompokan tipologi menyelesaikan masalah mengenal pasti jenis sosioekonomi. Apabila membina kumpulan jenis ini, perhatian utama harus diberikan kepada pengenalpastian jenis dan pilihan atribut kumpulan. Pada masa yang sama, mereka meneruskan dari intipati fenomena yang dikaji. (jadual 2.3).

Pengumpulan struktur menyelesaikan masalah mengkaji komposisi kumpulan tipikal individu atas dasar tertentu. Sebagai contoh, taburan penduduk penduduk mengikut kumpulan umur.

Pengumpulan analisis membolehkan anda mengenal pasti hubungan antara fenomena dan ciri-cirinya, i.e. mengenal pasti pengaruh beberapa tanda (faktorial) pada yang lain (berkesan). Hubungan itu dimanifestasikan dalam fakta bahawa dengan peningkatan dalam atribut faktor, nilai atribut terhasil meningkat atau menurun. Pengumpulan analitik sentiasa berdasarkan faktorial sifat, dan setiap kumpulan dicirikan purata nilai tanda berkesan.

Sebagai contoh, pergantungan jumlah pusing ganti runcit pada saiz ruang runcit kedai. Di sini, tanda faktorial (kumpulan) ialah kawasan jualan, dan tanda terhasil ialah purata pusing ganti setiap kedai.

Mengikut kerumitan, pengelompokan boleh menjadi mudah dan kompleks (bergabung).

AT ringkas kumpulan di pangkalan mempunyai satu tanda, dan masuk kompleks- dua atau lebih dalam kombinasi (dalam gabungan). Dalam kes ini, kumpulan mula-mula dibentuk mengikut satu atribut (utama), dan kemudian setiap daripada mereka dibahagikan kepada subkumpulan mengikut atribut kedua, dan seterusnya.

1.3. Statistik mutlak dan relatif

Statistik mutlak

Bentuk awal, bentuk utama bagi penunjuk statistik ialah nilai mutlak. Nilai mutlak mencirikan saiz fenomena dari segi jisim, luas, isipadu, panjang, masa, dsb.

Penunjuk mutlak individu diperoleh, sebagai peraturan, secara langsung dalam proses pemerhatian sebagai hasil pengukuran, penimbangan, pengiraan, dan penilaian. Dalam sesetengah kes, markah individu mutlak adalah perbezaan.

Ringkasan, penunjuk mutlak isipadu akhir diperolehi hasil daripada rumusan dan pengelompokan.

Penunjuk statistik mutlak sentiasa dinamakan nombor, i.e. mempunyai unit. Terdapat 3 jenis unit ukuran nilai mutlak: semula jadi, buruh dan kos.

unit semula jadi ukuran - nyatakan magnitud fenomena dalam istilah fizikal, i.e. ukuran berat, isipadu, panjang, masa, mengira, i.e. dalam kilogram, meter padu, kilometer, jam, keping, dll.

Pelbagai unit semula jadi adalah unit ukuran semula jadi bersyarat yang digunakan untuk menghimpunkan beberapa jenis nilai kegunaan yang sama. Satu daripadanya diambil sebagai piawai, manakala yang lain ditukar menggunakan pekali khas ke dalam unit ukuran piawaian ini. Jadi, sebagai contoh, sabun dengan kandungan asid lemak yang berbeza ditukar kepada 40% kandungan asid lemak.

Dalam sesetengah kes, satu unit ukuran tidak mencukupi untuk mencirikan fenomena, dan hasil darab dua unit ukuran digunakan.

Contohnya ialah pusing ganti barang dalam tan kilometer, pengeluaran elektrik dalam kilowatt-jam, dsb.

Dalam ekonomi pasaran, yang paling penting ialah kos (monetari) unit ukuran(ruble, dolar, markah, dll.). Mereka membolehkan anda mendapatkan penilaian kewangan bagi sebarang fenomena sosio-ekonomi (jumlah pengeluaran, perolehan, pendapatan negara, dll.). Walau bagaimanapun, harus diingat bahawa dalam keadaan kadar inflasi yang tinggi, penunjuk dari segi monetari menjadi tiada tandingan. Ini harus diambil kira semasa menganalisis penunjuk kos dalam dinamik. Untuk mencapai kebolehbandingan, penunjuk mesti dikira semula ke dalam harga setanding.

Unit ukuran buruh(man-hours, man-days) digunakan untuk menentukan kos buruh dalam pengeluaran produk, untuk prestasi beberapa kerja, dsb.

Kuantiti statistik relatif, intipati dan bentuk ungkapannya

Nilai relatif dalam statistik, kuantiti dipanggil yang menyatakan hubungan kuantitatif antara fenomena kehidupan sosial. Ia diperoleh dengan membahagikan satu nilai dengan yang lain.

Nilai yang membuat perbandingan (penyebut) dipanggil asas, asas perbandingan; dan yang dibandingkan (pembilang) dipanggil nilai perbandingan, pelaporan atau semasa.

Nilai relatif menunjukkan berapa kali nilai perbandingan lebih besar atau kurang daripada nilai asas, atau berapa bahagian yang pertama daripada yang kedua; dan dalam beberapa kes - berapa banyak unit satu kuantiti bagi setiap unit (atau setiap 100, setiap 1000, dsb.) kuantiti lain (asas).

Hasil daripada membandingkan nilai mutlak nama yang sama, nilai relatif abstrak tanpa nama diperoleh, menunjukkan berapa kali nilai yang diberikan lebih besar atau kurang daripada nilai asas. Dalam kes ini, nilai asas diambil sebagai unit (hasilnya ialah pekali).

Sebagai tambahan kepada pekali, bentuk yang digunakan secara meluas untuk menyatakan nilai relatif ialah minat(%). Dalam kes ini, nilai asas diambil sebagai 100 unit.

Nilai relatif boleh dinyatakan dalam ppm (‰), dalam decimille (0 / 000). Dalam kes ini, asas perbandingan diambil masing-masing sebagai 1,000 dan 10,000. Dalam sesetengah kes, asas perbandingan juga boleh diambil sebagai 100,000.

Nilai relatif boleh dinamakan nombor. Namanya adalah gabungan nama penunjuk yang dibandingkan dan asas. Sebagai contoh, kepadatan penduduk setiap persegi. km (berapa ramai orang setiap 1 kilometer persegi).

Jenis nilai relatif

Jenis nilai relatif dibahagikan bergantung pada kandungannya. Ini adalah nilai relatif: tugas rancangan, pemenuhan rancangan, dinamik, struktur, penyelarasan, intensiti dan tahap pembangunan ekonomi, perbandingan.

Nilai relatif sasaran yang dirancang mewakili nisbah nilai penunjuk yang ditetapkan untuk tempoh yang dirancang kepada nilainya yang dicapai oleh tempoh yang dirancang.

Nilai relatif pelaksanaan rancangan nilai yang menyatakan nisbah antara tahap sebenar dan tahap terancang penunjuk dipanggil.

Nilai relatif pembesar suara ialah nisbah tahap penunjuk untuk tempoh tertentu kepada tahap penunjuk yang sama pada masa lalu.

Tiga nilai relatif di atas saling berkaitan, iaitu: nilai relatif dinamik adalah sama dengan hasil nilai relatif tugas yang dirancang dan pelaksanaan rancangan.

Nilai relatif struktur ialah nisbah dimensi bahagian kepada keseluruhan. Ia mencirikan struktur, komposisi set tertentu.

Peratusan yang sama ini dipanggil graviti tentu.

Nilai relatif penyelarasan dipanggil nisbah bahagian-bahagian keseluruhan antara satu sama lain. Akibatnya, mereka mendapat berapa kali bahagian ini lebih besar daripada bahagian asas. Atau berapa peratus daripadanya atau berapa banyak unit bahagian struktur ini jatuh pada 1 unit (100 atau 1000, dsb. unit) bahagian struktur asas.

Nilai relatif keamatan mencirikan perkembangan fenomena atau proses yang dikaji dalam persekitaran lain. Ini adalah hubungan dua fenomena yang saling berkaitan, tetapi berbeza. Ia boleh dinyatakan sebagai peratusan, dan dalam ppm, dan prodecemille, dan dinamakan. Variasi nilai keamatan relatif ialah penunjuk tahap pembangunan ekonomi mencirikan pengeluaran per kapita.

Nilai relatif perbandingan mewakili nisbah penunjuk mutlak nama yang sama untuk objek yang berbeza (perusahaan, daerah, wilayah, negara, dll.). Ia boleh dinyatakan dalam kedua-dua pekali dan sebagai peratusan.

Nilai purata, intipati dan jenisnya

Statistik, seperti yang anda tahu, mengkaji fenomena sosio-ekonomi massa. Setiap fenomena ini boleh mempunyai ungkapan kuantitatif yang berbeza bagi ciri yang sama. Contohnya, gaji profesion pekerja yang sama atau harga di pasaran untuk produk yang sama, dsb.

Untuk mengkaji mana-mana populasi mengikut ciri yang berbeza-beza (berubah secara kuantitatif), statistik menggunakan purata.

nilai purata- ini ialah ciri kuantitatif generalisasi bagi satu set fenomena yang serupa satu demi satu tanda berubah-ubah.

Sifat paling penting bagi nilai purata ialah ia mewakili nilai atribut tertentu dalam keseluruhan populasi sebagai nombor tunggal, walaupun terdapat perbezaan kuantitatif dalam unit individu populasi, dan menyatakan perkara biasa yang wujud dalam semua unit populasi yang dikaji. Oleh itu, melalui ciri satu unit populasi, ia mencirikan keseluruhan populasi secara keseluruhan.

Purata berkaitan dengan hukum bilangan besar. Intipati sambungan ini terletak pada hakikat bahawa apabila purata, sisihan rawak nilai individu, disebabkan oleh operasi undang-undang nombor besar, membatalkan satu sama lain dan secara purata trend pembangunan utama, keperluan, keteraturan didedahkan, bagaimanapun , untuk ini, purata mesti dikira berdasarkan generalisasi jisim fakta.

Nilai purata membenarkan perbandingan penunjuk yang berkaitan dengan populasi dengan bilangan unit yang berbeza.

Syarat yang paling penting untuk penggunaan saintifik purata dalam analisis statistik fenomena sosial ialah kehomogenan populasi yang dikira purata. Purata, yang sama dalam bentuk dan teknik pengiraan, adalah rekaan dalam beberapa keadaan (untuk populasi heterogen), dan sepadan dengan realiti pada orang lain (untuk populasi homogen). Kehomogenan kualitatif populasi ditentukan berdasarkan analisis teori yang komprehensif tentang intipati fenomena. Sebagai contoh, apabila mengira hasil purata, data input dikehendaki merujuk kepada tanaman yang sama (purata hasil gandum) atau kumpulan tanaman (purata hasil bijirin). Anda tidak boleh mengira purata untuk tanaman heterogen.

Teknik matematik yang digunakan dalam pelbagai bahagian statistik berkaitan secara langsung dengan pengiraan purata.

Purata dalam fenomena sosial mempunyai keteguhan relatif, i.e. dalam tempoh masa tertentu, fenomena jenis yang sama dicirikan oleh kira-kira purata yang sama.

Nilai tengah sangat berkait rapat dengan kaedah pengelompokan, kerana untuk mencirikan fenomena, adalah perlu untuk mengira bukan sahaja purata umum (untuk keseluruhan fenomena), tetapi juga purata kumpulan (untuk kumpulan tipikal fenomena ini mengikut sifat yang dikaji).

Jenis-jenis purata

Bentuk di mana data awal untuk mengira nilai purata dibentangkan bergantung pada formula yang akan ditentukan olehnya. Pertimbangkan jenis purata yang paling biasa digunakan dalam statistik:

min aritmetik;

Purata harmonik;

Purata geometri;

Min segi empat sama.

1.4. Siri Variasi

Intipati dan punca variasi

Maklumat tentang tahap purata penunjuk yang dikaji biasanya tidak mencukupi untuk analisis mendalam tentang proses atau fenomena yang dikaji.

Ia juga perlu mengambil kira penyebaran atau variasi dalam nilai unit individu, yang merupakan ciri penting populasi yang dikaji. Setiap nilai individu bagi sesuatu sifat terbentuk di bawah pengaruh gabungan banyak faktor. Fenomena sosio-ekonomi cenderung mempunyai variasi yang besar. Sebab-sebab variasi ini terkandung dalam intipati fenomena.

Ukuran variasi menentukan bagaimana nilai trait dikumpulkan di sekitar min. Ia digunakan untuk mencirikan agregat statistik tersusun: pengelompokan, pengelasan, siri pengedaran. Harga saham, volum penawaran dan permintaan, kadar faedah dalam tempoh yang berbeza dan di tempat yang berbeza tertakluk kepada variasi yang paling besar.

Penunjuk mutlak dan relatif bagi variasi

Mengikut maksud definisi, variasi diukur dengan tahap turun naik pilihan ciri dari tahap nilai puratanya, i.e. sebagai perbezaan xx. Mengenai penggunaan sisihan daripada min, kebanyakan penunjuk yang digunakan dalam statistik untuk mengukur variasi dalam nilai ciri dalam populasi dibina.

Ukuran variasi mutlak yang paling mudah ialah julat variasi R=xmax-xmin . Julat variasi dinyatakan dalam unit yang sama seperti X. Ia bergantung hanya pada dua nilai ekstrem sifat dan, oleh itu, tidak mencirikan turun naik sifat dengan secukupnya.

Kadar variasi mutlak bergantung pada unit ukuran sifat dan menyukarkan untuk membandingkan dua atau lebih siri variasi yang berbeza.

Ukuran relatif variasi dikira sebagai nisbah pelbagai penunjuk mutlak variasi kepada min aritmetik. Yang paling biasa ialah pekali variasi.

Pekali variasi mencirikan turun naik sifat dalam purata. Nilai terbaiknya ialah sehingga 10%, baik sehingga 50%, buruk lebih 50%. Jika pekali variasi tidak melebihi 33%, maka populasi untuk sifat yang dipertimbangkan boleh dianggap homogen.

1.5. Kaedah persampelan

Intipati kaedah persampelan adalah untuk menilai ciri berangka keseluruhan (populasi umum) dengan sifat sebahagian (sampel), oleh kumpulan individu pilihan untuk jumlah populasi mereka, yang kadangkala dianggap sebagai koleksi tanpa had. isipadu. Asas kaedah persampelan ialah hubungan dalaman yang wujud dalam populasi antara individu dan umum, bahagian dan keseluruhan.

Kaedah pensampelan mempunyai kelebihan yang jelas berbanding kajian berterusan populasi umum, kerana ia mengurangkan jumlah kerja (dengan mengurangkan bilangan pemerhatian), membolehkan anda menjimatkan usaha dan wang, mendapatkan maklumat tentang populasi tersebut, tinjauan lengkap yang mana hampir mustahil atau tidak praktikal.

Pengalaman telah menunjukkan bahawa sampel yang dibuat dengan betul mewakili atau mewakili (dari bahasa Latin represento - saya mewakili) struktur dan keadaan populasi umum dengan agak baik. Walau bagaimanapun, sebagai peraturan, tidak ada kebetulan lengkap data sampel dengan data pemprosesan populasi umum. Ini adalah kelemahan kaedah pensampelan, yang mana kelebihan penerangan berterusan populasi umum dapat dilihat.

Memandangkan paparan ciri statistik (parameter) populasi umum yang tidak lengkap oleh sampel, satu tugas penting timbul untuk penyelidik: pertama, untuk mengambil kira dan memerhati keadaan di mana sampel mewakili populasi umum yang terbaik, dan kedua, dalam setiap kes khusus untuk menetapkan dengan pasti, seseorang boleh memindahkan hasil pemerhatian sampel kepada keseluruhan populasi dari mana sampel diambil.

Keterwakilan sampel bergantung pada beberapa syarat dan, di atas semua, pada cara ia dijalankan, sama ada secara sistematik (iaitu, mengikut skim yang telah dirancang sebelumnya), atau dengan pemilihan pilihan yang tidak dirancang daripada populasi umum. Walau apa pun, sampel mestilah tipikal dan objektif sepenuhnya. Keperluan ini mesti dipenuhi dengan ketat sebagai syarat paling penting untuk keterwakilan sampel. Sebelum memproses bahan sampel, ia mesti diperiksa dengan teliti dan sampel dibebaskan daripada segala-galanya yang berlebihan, yang melanggar syarat keterwakilan. Pada masa yang sama, apabila membentuk sampel, adalah mustahil untuk bertindak sewenang-wenangnya, untuk memasukkan dalam komposisinya hanya pilihan yang kelihatan biasa, dan untuk menolak semua yang lain. Sampel jinak hendaklah objektif, iaitu, ia harus dibuat tanpa motif berat sebelah, dengan mengecualikan pengaruh subjektif pada komposisinya. Pemenuhan syarat keterwakilan ini sepadan dengan prinsip rawak (daripada kes rendom Inggeris), atau pemilihan rawak varian daripada populasi umum.

Prinsip ini mendasari teori kaedah pensampelan dan mesti diperhatikan dalam semua kes pembentukan sampel yang mewakili, tidak mengecualikan kes pemilihan yang dirancang atau sengaja.

Terdapat pelbagai kaedah pemilihan. Bergantung pada kaedah pemilihan, jenis sampel berikut dibezakan:

Sampel rawak dengan pulangan;

Persampelan rawak tanpa pulangan;

mekanikal;

tipikal;

bersiri.

Pertimbangkan pembentukan sampel rawak dengan dan tanpa pulangan. Jika sampel dibuat daripada jisim produk (contohnya, dari kotak), maka selepas pencampuran menyeluruh, objek harus diambil secara rawak, iaitu, supaya mereka semua mempunyai kebarangkalian yang sama untuk dimasukkan ke dalam sampel. Selalunya, untuk membentuk sampel rawak, unsur-unsur populasi umum dipranomborkan, dan setiap nombor direkodkan pada kad yang berasingan. Hasilnya ialah satu pek kad, yang bilangannya bertepatan dengan saiz populasi umum. Selepas pencampuran menyeluruh, satu kad diambil dari pek ini. Objek yang mempunyai nombor yang sama dengan kad dianggap sebagai dalam sampel. Dalam kes ini, dua cara asas yang berbeza untuk membentuk populasi sampel adalah mungkin.

Cara pertama - kad yang dikeluarkan selepas menetapkan nombornya dikembalikan ke pek, selepas itu kad dicampur semula dengan teliti. Dengan mengulangi sampel sedemikian pada satu kad, adalah mungkin untuk membentuk sampel dalam sebarang saiz. Set sampel yang terbentuk mengikut skema ini dipanggil sampel rawak dengan pulangan.

Cara kedua - setiap kad dikeluarkan selepas rakamannya tidak dikembalikan. Dengan mengulangi sampel mengikut skema ini untuk satu kad, anda boleh mendapatkan sampel dari mana-mana saiz tertentu. Set sampel yang terbentuk mengikut skema ini dipanggil sampel rawak tanpa pulangan. Sampel rawak tanpa pemulangan terbentuk jika bilangan kad yang diperlukan diambil daripada pek yang dicampur dengan teliti sekali gus.

Walau bagaimanapun, dengan saiz populasi umum yang besar, kaedah membentuk sampel rawak dengan dan tanpa pulangan yang diterangkan di atas ternyata sangat susah payah. Dalam kes ini, jadual nombor rawak digunakan, di mana nombor disusun dalam susunan rawak. Bahagian apa yang akan dipilih, sebagai contoh, 50 objek daripada populasi umum bernombor, buka mana-mana halaman jadual nombor rawak dan tulis 50 nombor rawak berturut-turut; sampel termasuk objek yang nombornya bertepatan dengan nombor rawak yang ditulis, jika nombor rawak jadual ternyata lebih besar daripada isipadu populasi umum, maka nombor tersebut dilangkau.

Ambil perhatian bahawa perbezaan antara sampel rawak dengan dan tanpa pembalikan adalah kabur jika ia adalah sebahagian kecil daripada populasi yang besar.

Dengan kaedah mekanikal untuk membentuk populasi sampel, elemen populasi umum yang akan dikaji dipilih pada selang waktu tertentu. Jadi, sebagai contoh, jika sampel hendaklah 50% daripada populasi umum, maka setiap elemen kedua populasi umum dipilih. Jika sampel adalah sepuluh peratus, maka setiap elemen kesepuluh dipilih, dan seterusnya.

Perlu diingatkan bahawa kadangkala pemilihan mekanikal mungkin tidak memberikan sampel yang representatif. Sebagai contoh, jika setiap penggelek pusing kedua belas dipilih, dan sejurus selepas pemilihan, pemotong diganti, maka semua penggelek yang dipusing dengan pemotong tumpul akan dipilih. Dalam kes ini, adalah perlu untuk menghapuskan kebetulan irama pemilihan dengan irama penggantian pemotong, yang mana sekurang-kurangnya setiap roller kesepuluh daripada dua belas yang bertukar harus dipilih.

Dengan sejumlah besar produk homogen yang dihasilkan, apabila pelbagai mesin dan juga bengkel mengambil bahagian dalam pembuatannya, kaedah pemilihan tipikal digunakan untuk membentuk sampel yang mewakili. Dalam kes ini, populasi umum dibahagikan kepada kumpulan yang tidak bertindih. Kemudian, daripada setiap kumpulan, mengikut skema persampelan rawak dengan atau tanpa pulangan, sebilangan elemen tertentu dipilih. Mereka membentuk set sampel, yang dipanggil tipikal.

Sebagai contoh, mari kita semak secara selektif produk bengkel yang terdapat 10 mesin yang menghasilkan produk yang sama. Menggunakan skim pensampelan rawak dengan atau tanpa pulangan, produk dipilih, pertama daripada produk yang dibuat pada mesin pertama, kemudian pada mesin kedua, dsb. Kaedah pemilihan ini membolehkan anda membentuk sampel biasa.

Kadang-kadang dalam amalan adalah dinasihatkan untuk menggunakan kaedah pemilihan bersiri, ideanya ialah populasi umum dibahagikan kepada beberapa siri tidak bertindih tertentu dan semua elemen hanya siri terpilih dikawal mengikut skema pensampelan rawak dengan atau tanpa pulangan. Sebagai contoh, jika produk dikeluarkan oleh sekumpulan besar mesin automatik, maka produk hanya beberapa mesin tertakluk kepada pemeriksaan berterusan. Pemilihan bersiri digunakan jika sifat yang diperiksa turun naik sedikit dalam siri yang berbeza.

Kaedah pemilihan mana yang harus diutamakan dalam situasi tertentu harus dinilai berdasarkan keperluan tugas dan syarat pengeluaran. Ambil perhatian bahawa dalam amalan, apabila menyusun sampel, beberapa kaedah pemilihan sering digunakan secara serentak dalam gabungan.

1.6. Analisis korelasi dan regresi

Analisis regresi dan korelasi ialah kaedah berkuasa yang membolehkan anda menganalisis sejumlah besar maklumat untuk menyiasat kemungkinan hubungan antara dua atau lebih pembolehubah.

Tugasan analisis korelasi dikurangkan kepada mengukur ketat hubungan yang diketahui antara ciri yang berbeza-beza, menentukan hubungan sebab akibat yang tidak diketahui (sifat sebab akibat yang mesti dijelaskan dengan bantuan analisis teori) dan menilai faktor yang mempunyai pengaruh terbesar ke atas ciri yang terhasil.

tugasan analisis regresi adalah pilihan jenis model (bentuk sambungan), penubuhan tahap pengaruh pembolehubah tidak bersandar pada bersandar dan penentuan nilai pengiraan pembolehubah bersandar (fungsi regresi).

Penyelesaian semua masalah ini membawa kepada keperluan untuk penggunaan bersepadu kaedah ini.

1.7. Siri dinamik

Konsep siri masa dan jenis siri masa

Berhampiran pembesar suara dipanggil satu siri penunjuk statistik masa yang disusun secara berurutan, yang dalam perubahannya mencerminkan perjalanan perkembangan fenomena yang dikaji.

Satu siri dinamik terdiri daripada dua elemen: momen atau tempoh masa, yang merangkumi data dan penunjuk statistik (tahap). Kedua-dua unsur bersama-sama membentuk ahli siri. Tahap siri biasanya dilambangkan dengan "y", dan tempoh masa - dengan "t".

Mengikut tempoh masa, yang termasuk tahap siri, siri dinamik dibahagikan kepada segera dan selang.

AT siri detik setiap peringkat mencirikan fenomena pada satu masa. Sebagai contoh: bilangan deposit penduduk di institusi bank simpanan Persekutuan Rusia, pada akhir tahun.

AT siri selang dinamik, setiap peringkat siri mencirikan fenomena dalam satu tempoh masa. Contohnya: menonton pengeluaran di Rusia mengikut tahun.

Dalam siri dinamik selang, tahap siri boleh disimpulkan dan jumlah nilai untuk satu siri tempoh berturut-turut boleh diperolehi. Dalam siri detik, jumlah ini tidak masuk akal.

Bergantung pada cara menyatakan tahap siri, siri dinamik nilai mutlak, nilai relatif dan nilai purata dibezakan.

Siri masa boleh dengan selang yang sama dan tidak sama. Konsep selang dalam siri momen dan selang adalah berbeza. Selang siri momen ialah tempoh masa dari satu tarikh ke tarikh lain yang mana data diberikan. Jika ini adalah data mengenai jumlah deposit pada akhir tahun, maka selangnya adalah dari akhir satu tahun hingga akhir tahun yang lain. Selang siri selang ialah tempoh masa yang mana data diringkaskan. Jika ini adalah pengeluaran jam tangan mengikut tahun, maka selang masa adalah satu tahun.

Selang siri boleh sama dan tidak sama pada saat dan dalam siri selang dinamik.

Dengan bantuan siri masa, dinamik menentukan kelajuan dan keamatan perkembangan fenomena, mengenal pasti arah aliran utama dalam perkembangannya, menyerlahkan turun naik bermusim, membandingkan perkembangan penunjuk individu di negara yang berbeza dari semasa ke semasa, dan mengenal pasti hubungan antara fenomena yang berkembang dari semasa ke semasa.

1.8. Indeks Statistik

Konsep indeks

Perkataan "indeks" adalah bahasa Latin dan bermaksud "penunjuk", "penunjuk". Dalam statistik, indeks difahami sebagai penunjuk kuantitatif generalisasi yang menyatakan nisbah dua set yang terdiri daripada unsur-unsur yang tidak boleh dijumlahkan secara langsung. Sebagai contoh, jumlah pengeluaran perusahaan dari segi fizikal tidak boleh disimpulkan (kecuali untuk yang homogen), tetapi ini diperlukan untuk ciri umum volum. Adalah mustahil untuk meringkaskan harga untuk jenis produk tertentu, dsb. Indeks digunakan untuk menyamaratakan ciri-ciri agregat tersebut dalam dinamik, dalam ruang dan perbandingan dengan pelan. Sebagai tambahan kepada ciri-ciri ringkasan fenomena, indeks memungkinkan untuk menilai peranan faktor individu dalam mengubah fenomena yang kompleks. Indeks juga digunakan untuk mengenal pasti anjakan struktur dalam ekonomi negara.

Indeks dikira untuk fenomena kompleks (umum atau ringkasan) dan untuk elemen individunya (indeks individu).

Dalam indeks yang mencirikan perubahan dalam fenomena dari semasa ke semasa, perbezaan dibuat antara tempoh asas dan pelaporan (semasa). asas tempoh - ini adalah tempoh masa di mana nilai, yang diambil sebagai asas perbandingan, merujuk. Ia dilambangkan dengan subskrip "0". Pelaporan tempoh ialah tempoh masa di mana nilai yang dibandingkan tergolong. Ia dilambangkan dengan subskrip "1".

individu indeks ialah nilai relatif biasa.

Indeks komposit- mencirikan perubahan dalam keseluruhan populasi kompleks secara keseluruhan, i.e. terdiri daripada unsur tidak boleh rumus. Oleh itu, untuk mengira indeks sedemikian, adalah perlu untuk mengatasi bukan penjumlahan unsur populasi.

Ini dicapai dengan memperkenalkan penunjuk tambahan (komponen). Indeks komposit terdiri daripada dua elemen: nilai diindeks dan berat.

Nilai diindeks ialah penunjuk yang indeks dikira. Berat (ko-meter) ialah penunjuk tambahan yang diperkenalkan untuk tujuan mengukur nilai diindeks. Dalam indeks komposit, pengangka dan penyebut sentiasa set kompleks, dinyatakan sebagai hasil tambah nilai dan berat yang diindeks.

Bergantung kepada objek kajian, kedua-dua indeks umum dan individu dibahagikan kepada indeks penunjuk isipadu (kuantitatif).(isipadu fizikal pengeluaran, kawasan tabur, bilangan pekerja, dsb.) dan indeks kualiti(harga, kos, produktiviti, produktiviti buruh, upah, dll.).

Bergantung pada asas perbandingan, indeks individu dan umum boleh rantai dan asas .

Bergantung pada metodologi pengiraan, indeks umum mempunyai dua bentuk: agregat dan bentuk tengah indeks.

Pengumpulan yang dijalankan dengan betul, analisis data dan pengiraan statistik memungkinkan untuk menyediakan struktur yang berminat dan orang ramai dengan maklumat tentang perkembangan ekonomi, tentang arah perkembangannya, menunjukkan kecekapan penggunaan sumber, mengambil kira pekerjaan. penduduk dan keupayaannya untuk bekerja, menentukan kadar pertumbuhan harga dan kesan perdagangan ke atas pasaran itu sendiri atau diambil secara berasingan sfera.

Senarai sastera terpakai

1. Glinsky V.V., Ionin V.G. Analisis statistik. Buku Teks - M.: FILIN, 1998 - 264 hlm.

2. Eliseeva I.I., Yuzbashev M.M. Teori umum statistik. Buku teks.-

M.: Kewangan dan statistik, 1995 - 368 p.

3. Efimova M.R., Petrova E.V., Rumyantsev V.N. Teori umum statistik. Buku Teks.-M.: INFRA-M, 1996 - 416 hlm.

4. Kostina L.V. Teknik untuk membina graf statistik. Panduan metodologi - Kazan, TISBI, 2000 - 49 p.

5. Kursus statistik sosio-ekonomi: Buku teks / ed. prof. M.G. Nazarova.-M.: Finstatinform, UNITI-DIANA, 2000-771 hlm.

6. Teori umum statistik: metodologi statistik dalam kajian aktiviti komersial: Buku teks / ed. A.A. Spirina, O.E. Bashenoy-M.: Kewangan dan statistik, 1994 - 296 p.

7. Statistik: kursus kuliah / Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. dan lain-lain - Novosibirsk: NGAEiU, M .: INFRA-M, 1997 - 310 p.

8. Kamus statistik / ch.ed. M.A. Korolev.-M.: Kewangan dan statistik, 1989 - 623 p.

9. Teori Perangkaan: Buku Teks / ed. prof. Shmoylova R.A. - M.: Kewangan dan statistik, 1996 - 464 p.

Pemerhatian sebagai peringkat awal kajian dikaitkan dengan pengumpulan data awal terhadap isu yang dikaji. Ia adalah ciri dari banyak sains. Walau bagaimanapun, setiap sains mempunyai spesifiknya sendiri, berbeza dalam pemerhatiannya. Oleh itu, tidak setiap pemerhatian adalah statistik.

Kajian statistik- ini adalah pengumpulan, ringkasan dan analisis data (fakta) mengenai fenomena sosio-ekonomi, demografi dan lain-lain dan proses kehidupan awam di negeri ini, disusun secara saintifik mengikut satu program, dengan pendaftaran ciri-ciri mereka yang paling penting dalam dokumentasi perakaunan .

Ciri-ciri tersendiri (spesifik) penyelidikan statistik ialah: tujuan, organisasi, watak jisim, konsistensi (kerumitan), kebolehbandingan, dokumentasi, kebolehkawalan, kepraktisan.

Secara umum, kajian statistik harus:

Untuk mempunyai matlamat yang berguna secara sosial dan kepentingan (keadaan) sejagat;
Kaitkan dengan keadaan khusus tempat dan masanya;
Nyatakan jenis statistik perakaunan (dan bukan perakaunan dan bukan operasi);
Dijalankan mengikut program yang telah dibangunkan dengan metodologi berasaskan saintifik dan sokongan lain;
Untuk menjalankan pengumpulan data massa (fakta), yang mencerminkan keseluruhan set sebab-akibat dan faktor-faktor lain yang mencirikan fenomena dalam pelbagai cara;
Mendaftar dalam bentuk dokumen perakaunan borang yang ditetapkan;
Menjamin ketiadaan ralat pemerhatian atau mengurangkannya seminimum mungkin;
Menyediakan kriteria kualiti dan cara tertentu untuk mengawal data yang dikumpul, memastikan kebolehpercayaan, kesempurnaan dan kandungannya;
Fokus pada teknologi kos efektif untuk mengumpul dan memproses data;
Menjadi pangkalan maklumat yang boleh dipercayai untuk semua peringkat penyelidikan statistik seterusnya dan semua pengguna maklumat statistik.

Kajian yang tidak memenuhi keperluan ini bukan statistik. Kajian statistik bukan, sebagai contoh, pemerhatian dan kajian: ibu dengan anak bermain (soalan peribadi); penonton di pementasan teater (tiada dokumentasi perakaunan untuk tontonan itu); seorang penyelidik untuk eksperimen fizikal dan kimia dengan ukuran, pengiraan dan pendaftaran dokumentari (bukan data awam massa); seorang doktor untuk pesakit dengan penyelenggaraan kad perubatan (rekod operasi); akauntan untuk pergerakan dana dalam akaun bank perusahaan (perakaunan); wartawan untuk kehidupan awam dan peribadi pegawai kerajaan atau selebriti lain (bukan subjek statistik).

Satu set unit yang mempunyai watak jisim, tipikal, keseragaman kualitatif dan kehadiran variasi.

Populasi statistik terdiri daripada objek sedia ada secara material (Pekerja, perusahaan, negara, wilayah), adalah objek penyelidikan statistik.

Lihat juga:

Pemerhatian statistik adalah peringkat pertama penyelidikan statistik, yang merupakan pengumpulan data yang teratur secara saintifik mengenai fenomena dan proses kehidupan sosial yang dikaji.

Peringkat operasi statistik

Sebarang penyelidikan statistik terdiri daripada enam peringkat.

Peringkat 1. Penyelidikan statistik bermula dengan pembentukan pangkalan maklumat statistik utama untuk set penunjuk yang dipilih.

Memegang.
Penggunaan sumber rasmi negeri dan korporat (berjenama).
Penggunaan penyelidikan statistik saintifik dalam jurnal, akhbar, monograf, dsb.
Penggunaan media elektronik (Internet, CD, cakera liut, dll.).

Peringkat 2. Generalisasi primer dan pengelompokan data statistik.

, terkumpul (), graf taburan kekerapan (frekuensi).
Pembentukan dan analisis utama mereka. Ramalan grafik (dengan konsep "optimis", "pesimis", "realis").
Pengiraan momen urutan ke-K (purata, serakan, ukuran kecondongan, ukuran kurtosis) untuk menentukan penunjuk pusat pengembangan, penunjuk kecondongan (asimetri), penunjuk kurtosis (keterukan).
Pembentukan dan pengiraan utama penunjuk statistik kompleks (relatif, ringkasan berbilang peringkat).
Pembentukan dan pengiraan utama penunjuk indeks.

Peringkat 3. Peringkat seterusnya penyelidikan statistik termasuk tafsiran ekonomi generalisasi primer.

dan penilaian kewangan objek analisis.
Pembentukan kebimbangan (kepuasan) situasi ekonomi dan kewangan.
Amaran tentang menghampiri nilai statistik ambang dalam digunakan, sebagai peraturan, masalah makroekonomi.
Kepelbagaian generalisasi statistik utama hasil gunaan yang diperolehi sepanjang hierarki kuasa, perkongsian, perniagaan.

Peringkat 4. Analisis komputer bagi data statistik lanjutan (volume) primer dan umum.

Analisis Variasi Data Perangkaan Lanjutan.
Analisis dinamik data statistik lanjutan.
Analisis pautan data statistik lanjutan.
Ringkasan dan pengelompokan pelbagai dimensi.

Peringkat 5. Peramalan komputer dalam bidang terpenting yang dipilih.

Kaedah Kuasa Dua Terkecil (LSM).
Purata bergerak.
Analisis teknikal.
Ringkasan analisis dan pandangan pilihan ramalan dengan pengesyoran untuk pengurusan dan pelarasan pelaburan.

Peringkat 6. Analisis umum keputusan yang diperolehi dan menyemaknya untuk kebolehpercayaan mengikut kriteria statistik. Peringkat 7. Peringkat akhir kajian statistik ialah penerimaan.

Terdapat lima jenis analisis statistik utama yang digunakan dalam penyelidikan pemasaran: analisis deskriptif, analisis inferensi, analisis perbezaan, analisis hubungan dan analisis ramalan. Kadangkala jenis analisis ini digunakan secara berasingan, kadangkala bersama-sama.

Analisis deskriptif adalah berdasarkan penggunaan ukuran statistik seperti nilai purata (min), mod, sisihan piawai, julat atau amplitud variasi.

Analisis, yang berdasarkan penggunaan prosedur statistik (contohnya, ujian hipotesis) untuk menyamaratakan keputusan yang diperolehi kepada keseluruhan populasi, dipanggil analisis inferensi.

Analisis perbezaan digunakan untuk membandingkan hasil kajian dua kumpulan (dua segmen pasaran) untuk menentukan tahap perbezaan sebenar dalam tingkah laku mereka, sebagai tindak balas kepada iklan yang sama, dsb.

Analisis perhubungan bertujuan untuk menentukan hubungan sistematik (kearah arah dan kekuatannya) pembolehubah. Sebagai contoh, menentukan bagaimana peningkatan dalam kos pengiklanan mempengaruhi peningkatan dalam jualan.

Analisis ramalan digunakan untuk meramal perkembangan masa hadapan, contohnya melalui analisis siri masa. Kaedah ramalan statistik dibincangkan dalam Bahagian 7.

Alat analisis deskriptif

Untuk menerangkan maklumat yang diperoleh daripada ukuran sampel, dua kumpulan ukuran digunakan secara meluas. Yang pertama termasuk langkah "kecenderungan pusat", atau langkah yang menggambarkan responden biasa atau respons biasa. Yang kedua termasuk ukuran variasi, atau ukuran yang menerangkan sejauh mana responden atau respons serupa atau tidak serupa dengan responden atau respons "biasa".

Terdapat ukuran deskriptif lain, seperti ukuran asimetri (sejauh mana lengkung taburan yang ditemui berbeza daripada lengkung taburan normal). Walau bagaimanapun, ia tidak digunakan sekerap di atas, dan tidak menarik minat pelanggan.

Hanya penerangan ringkas tentang langkah-langkah ini diberikan di bawah. Maklumat yang lebih terperinci boleh diperolehi daripada buku statistik matematik, contohnya,.

Ukuran kecenderungan memusat termasuk mod, median, dan min.

Mod mencirikan nilai ciri yang paling kerap muncul berbanding dengan nilai lain ciri yang diberikan. Fesyen adalah relatif, dan majoriti responden tidak perlu menunjukkan nilai ciri ini dengan tepat.

Median mencirikan nilai atribut, yang menduduki tempat tengah dalam siri nilai tertib atribut ini.

Ukuran ketiga kecenderungan memusat ialah min, yang paling kerap dikira sebagai min aritmetik. Apabila ia dikira, jumlah volum atribut diagihkan sama rata antara semua unit populasi.

Ia boleh dilihat bahawa tahap kandungan maklumat nilai purata adalah lebih besar daripada median, dan median ialah mod.

Walau bagaimanapun, ukuran yang dipertimbangkan tidak mencirikan variasi jawapan kepada soalan tertentu atau, dengan kata lain, ketidaksamaan, perbezaan responden atau ciri yang diukur. Jelas sekali, sebagai tambahan kepada mengetahui nilai-nilai ukuran kecenderungan memusat, adalah penting untuk menentukan seberapa dekat baki anggaran yang diperolehi dengan nilai-nilai ini. Tiga ukuran variasi biasanya digunakan: taburan frekuensi, julat variasi, dan sisihan piawai.

Peruntukan kekerapan mewakili dalam bentuk jadual atau grafik bilangan kejadian setiap nilai ciri (atribut) yang diukur dalam setiap julat nilai yang dipilih. Taburan kekerapan membolehkan anda membuat kesimpulan dengan cepat tentang tahap perincian hasil pengukuran.

Variasi rentang mentakrifkan perbezaan mutlak antara nilai maksimum dan minimum ciri yang diukur. Dalam erti kata lain, ia adalah perbezaan antara titik akhir dalam pengagihan nilai tertib sifat yang diukur. Ukuran ini menentukan selang pengedaran nilai ciri.

Sisihan piawai ialah ciri statistik generalisasi bagi variasi nilai trait. Jika ukuran ini kecil, maka keluk taburan mempunyai bentuk yang sempit dan termampat (hasil pengukuran mempunyai tahap persamaan yang tinggi); jika ukurannya besar, maka keluk taburan mempunyai bentuk yang luas dan terbentang (darjah perbezaan anggaran adalah besar).

Sebelum ini telah dinyatakan bahawa pilihan skala pengukuran, dan oleh itu jenis soalan dalam soal selidik, menentukan terlebih dahulu jumlah maklumat yang diterima. Begitu juga, jumlah maklumat yang diperoleh dengan menggunakan langkah-langkah yang dibincangkan di atas adalah berbeza. Peraturan umum ialah ukuran statistik memungkinkan untuk mendapatkan lebih banyak maklumat apabila menggunakan skala pengukuran yang paling bermaklumat. Pilihan skala ukuran menentukan terlebih dahulu pilihan ukuran statistik. Sebagai contoh, salah satu soalan dalam tinjauan demografi yang menggunakan skala penamaan ialah tentang kewarganegaraan. Orang Rusia diberi kod 1, orang Ukraine - 2, Tatar - 3, dsb. Dalam kes ini, sudah tentu, anda boleh mengira nilai purata. Tetapi bagaimana untuk mentafsirkan purata kewarganegaraan sama dengan, katakan, 5.67? Untuk mengira purata, anda mesti menggunakan skala selang atau skala nisbah. Walau bagaimanapun, dalam contoh kami, anda boleh menggunakan fesyen.

Berkenaan dengan ukuran variasi, skala nominal menggunakan taburan frekuensi, skala tertib taburan kekerapan terkumpul, dan selang dan nisbah menskala sisihan piawai.

inferens statistik

Inferens ialah sejenis analisis logik yang bertujuan untuk mendapatkan kesimpulan umum tentang keseluruhan populasi berdasarkan pemerhatian terhadap sekumpulan kecil unit dalam populasi ini.

Kesimpulan dibuat berdasarkan analisis sebilangan kecil fakta. Sebagai contoh, jika dua orang rakan anda yang mempunyai jenama kereta yang sama mengadu tentang kualitinya, maka anda boleh membuat kesimpulan bahawa kualiti kereta jenama ini secara keseluruhannya adalah rendah.

Inferens statistik adalah berdasarkan analisis statistik hasil kajian sampel dan bertujuan untuk menilai parameter populasi secara keseluruhan. Dalam kes ini, hasil kajian terpilih hanyalah titik permulaan untuk mendapatkan kesimpulan umum.

Sebagai contoh, pembuat kereta menjalankan dua tinjauan bebas untuk mengukur kepuasan pelanggan terhadap kereta mereka. Sampel pertama termasuk 100 pengguna yang membeli model ini dalam tempoh enam bulan lalu. Sampel kedua termasuk 1000 pengguna. Semasa temu bual telefon, responden menjawab soalan: "Adakah anda berpuas hati atau tidak berpuas hati dengan model kereta yang anda beli?" Tinjauan pertama mendedahkan 30% daripada yang tidak berpuas hati, yang kedua - 35%.

Oleh kerana terdapat ralat pensampelan dalam kedua-dua kes pertama dan kedua, kesimpulan berikut boleh dibuat. Untuk kes pertama: kira-kira 30% responden menyatakan rasa tidak puas hati dengan model kereta yang dibeli. Bagi kes kedua, kira-kira 35% responden menyatakan rasa tidak puas hati terhadap model kereta yang dibeli. Apakah kesimpulan umum yang boleh dibuat dalam kes ini? Bagaimana untuk menghilangkan istilah "kira-kira"? Untuk melakukan ini, kami memperkenalkan penunjuk ralat: 30% ± x% dan 35% ± y% dan bandingkan x dan y. Menggunakan analisis logik, kita boleh menyimpulkan bahawa sampel yang besar mengandungi ralat yang lebih kecil dan berdasarkannya adalah mungkin untuk membuat kesimpulan yang lebih tepat tentang pendapat seluruh populasi pengguna. Dapat dilihat bahawa saiz sampel adalah faktor penentu untuk mendapatkan kesimpulan yang betul. Penunjuk ini terdapat dalam semua formula yang menentukan kandungan pelbagai kaedah inferens statistik.

Semasa menjalankan penyelidikan pemasaran, kaedah inferens statistik berikut paling kerap digunakan: anggaran parameter dan ujian hipotesis.

Anggaran Parameter populasi ialah proses menentukan, berdasarkan data sampel, selang di mana salah satu parameter populasi, seperti min, terletak. Untuk melakukan ini, gunakan statistik berikut: nilai purata, ralat piawai dan tahap keyakinan yang diingini (biasanya 95% atau 99%).

Peranan mereka dalam anggaran parameter akan dibincangkan di bawah.

Purata ralat kuasa dua adalah, seperti yang dinyatakan di atas, ukuran variasi dalam taburan sampel di bawah andaian teori bahawa banyak sampel bebas daripada populasi umum yang sama telah dikaji.

Ia ditentukan oleh formula berikut:

Di mana s x - ralat piawai bagi min sampel;

s - sisihan piawai daripada nilai purata dalam sampel;

n - saiz sampel.

Jika ukuran peratusan digunakan yang menyatakan kebolehubahan alternatif bagi sifat kualitatif, maka

di mana s ialah ralat piawai bagi min sampel apabila menggunakan ukuran peratusan;

p ialah peratusan responden dalam sampel yang menyokong alternatif pertama;

q = (100 - q) - peratusan responden dalam sampel yang menyokong

alternatif kedua;

n - saiz sampel.

Dapat dilihat bahawa ralat persampelan min adalah lebih besar, lebih besar variasi, dan lebih kecil, lebih besar saiz sampel.

Oleh kerana sentiasa terdapat ralat pensampelan, adalah perlu untuk menganggarkan sebaran nilai parameter yang dikaji bagi populasi umum. Katakan pengkaji telah memilih tahap keyakinan 99%. Ia mengikuti daripada sifat keluk taburan normal bahawa parameter Z = ± 2.58 sepadan dengannya. Purata untuk populasi umum secara keseluruhan dikira dengan formula

Jika peratusan digunakan, maka

Ini bermakna jika anda mahu julat anggaran pada keyakinan 99% untuk memasukkan anggaran sebenar populasi, anda perlu mendarabkan ralat piawai dengan 2.58 dan menambah hasil itu kepada peratusan p (batas atas). Jika kita menolak produk ini, maka kita dapati anggaran had yang lebih rendah.

Bagaimanakah formula ini berkaitan dengan inferens statistik?

Memandangkan parameter populasi sedang dianggarkan, julat di mana nilai sebenar parameter populasi jatuh ditunjukkan di sini. Untuk tujuan ini, ukuran statistik kecenderungan memusat, magnitud varians dan saiz sampel diambil untuk sampel. Seterusnya, andaian dibuat tentang tahap keyakinan dan julat serakan parameter untuk populasi umum dikira.

Sebagai contoh, bagi ahli sampel (100 pembaca akhbar), didapati purata masa membaca akhbar ialah 45 minit dengan ralat RMS 20 minit. Dengan tahap keyakinan 95%, kita dapat

Pada tahap keyakinan 99%, kami dapat

Dapat dilihat bahawa selang keyakinan adalah lebih luas untuk 99% berbanding tahap keyakinan 95%.

Jika peratusan digunakan dan ternyata daripada sampel 100 orang, 50% responden minum kopi pada waktu pagi, maka pada tahap keyakinan 99% kita mendapat julat anggaran berikut:

Oleh itu, logik inferens statistik bertujuan untuk mendapatkan kesimpulan akhir tentang parameter yang dikaji bagi populasi umum berdasarkan kajian terpilih yang dijalankan mengikut undang-undang statistik matematik. Jika kesimpulan mudah digunakan yang tidak berdasarkan ukuran statistik, maka kesimpulan akhir adalah subjektif dan berdasarkan fakta yang sama, pakar yang berbeza boleh membuat kesimpulan yang berbeza.

Apabila menggunakan inferens statistik, formula digunakan yang bersifat objektif, berdasarkan konsep statistik yang diterima umum. Akibatnya, kesimpulan akhir adalah lebih objektif.

Dalam sesetengah kes, pertimbangan dibuat mengenai beberapa parameter populasi umum (nilai min, varians, sifat taburan, bentuk dan keakraban hubungan antara pembolehubah) hanya berdasarkan beberapa andaian, pantulan, gerak hati, tidak lengkap. pengetahuan. Penghakiman sedemikian dipanggil hipotesis.

Hipotesis statistik ialah andaian tentang sifat populasi yang boleh diuji berdasarkan data sampel.

Di bawah ujian hipotesis merujuk kepada prosedur statistik yang digunakan untuk mengesahkan atau menolak hipotesis berdasarkan hasil kajian sampel. Pengujian hipotesis dijalankan atas dasar mengenal pasti ketekalan data empirikal dengan yang hipotesis. Jika percanggahan antara nilai yang dibandingkan tidak melebihi had ralat rawak, hipotesis diterima. Pada masa yang sama, tiada kesimpulan dibuat tentang ketepatan hipotesis itu sendiri, ia hanya mengenai konsistensi data yang dibandingkan.

Ujian hipotesis dijalankan dalam lima peringkat:

1. Beberapa andaian dibuat tentang beberapa ciri populasi umum, contohnya, mengenai nilai purata parameter tertentu.

2. Sampel rawak dibentuk, kajian terpilih dijalankan dan penunjuk statistik sampel ditentukan.

3. Nilai hipotesis dan statistik bagi ciri yang dikaji dibandingkan.

4. Ia ditentukan sama ada keputusan kajian sampel sepadan atau tidak dengan hipotesis yang diterima.

5. Jika keputusan kajian sampel tidak mengesahkan hipotesis, yang terakhir disemak - ia mesti sepadan dengan data kajian sampel.

Oleh kerana variasi dalam keputusan kajian sampel, adalah mustahil untuk membuat kesimpulan yang benar-benar tepat tentang kebolehpercayaan hipotesis dengan menjalankan perbandingan aritmetik mudah bagi nilai-nilai ciri. Oleh itu, ujian hipotesis statistik termasuk penggunaan: nilai sampel ciri, sisihan piawai, tahap keyakinan yang diingini, dan nilai hipotesis ciri untuk populasi secara keseluruhan.

Formula berikut digunakan untuk menguji hipotesis tentang purata:

Sebagai contoh, apabila mengiklankan program latihan jualan kolej, pengurus program menganggarkan bahawa graduan program tersebut memperoleh purata $1,750 sebulan. Jadi purata populasi hipotesis ialah $1,750. Untuk menguji hipotesis ini, tinjauan telefon ke atas ejen jualan firma yang berbeza telah dijalankan.

Sampel ialah 100 orang, purata sampel ialah $1,800, dan sisihan piawai ialah $350. Timbul persoalan sama ada terdapat perbezaan besar ($50) antara gaji hipotesis dan nilai puratanya untuk sampel. Kami menjalankan pengiraan mengikut formula (4.2):

Dapat dilihat bahawa ralat piawai bagi min ialah $35, dan hasil bagi 50 dibahagikan dengan 45 ialah 1.43 (sisihan ternormal), iaitu kurang daripada ±1.96, nilai yang mencirikan tahap keyakinan 95%. Dalam kes ini, hipotesis yang dicadangkan boleh dianggap boleh dipercayai.

Apabila menggunakan ukuran peratusan, hipotesis diuji seperti berikut. Katakan, berdasarkan pengalamannya sendiri, salah seorang pemandu membuat hipotesis bahawa hanya 10% pemandu menggunakan tali pinggang keledar. Walau bagaimanapun, kajian sampel kebangsaan terhadap 1000 pemandu kenderaan menunjukkan bahawa 80% daripada mereka menggunakan tali pinggang keledar. Pengiraan dalam kes ini dijalankan seperti berikut:

di mana p ialah peratusan kajian sampel;

πH- peratusan hipotesis;

s p - punca ralat min kuasa dua dalam pengiraan dalam peratus.

Dapat dilihat bahawa hipotesis awal berbeza daripada yang didapati 80% dengan nilai 55.3 didarab dengan ralat piawai, i.e. tidak boleh dianggap boleh dipercayai.

Dalam sesetengah kes, adalah dinasihatkan untuk menggunakan hipotesis arah. Hipotesis arah mentakrifkan arah kemungkinan nilai beberapa parameter populasi umum. Sebagai contoh, gaji lebih daripada $1,750. Dalam kes ini, hanya satu sisi lengkung pengedaran digunakan, yang ditunjukkan dalam penggunaan tanda "+" dan "-" dalam formula pengiraan.

Maklumat lebih terperinci mengenai isu ini boleh diperolehi daripada.

Di sini, bagaimanapun, timbul persoalan. Jika anda boleh menjalankan kajian terpilih, maka mengapa mengemukakan hipotesis? Memproses hasil kajian terpilih memungkinkan untuk mendapatkan nilai purata dan ciri statistiknya tanpa mengemukakan sebarang hipotesis. Oleh itu, ujian hipotesis lebih berkemungkinan digunakan dalam kes di mana adalah mustahil atau amat sukar untuk menjalankan kajian berskala penuh dan apabila perlu membandingkan keputusan beberapa kajian (untuk kumpulan responden yang berbeza atau dijalankan pada masa yang berbeza). Masalah seperti ini biasanya timbul dalam statistik sosial. Keamatan buruh penyelidikan statistik dan sosiologi membawa kepada fakta bahawa hampir kesemuanya adalah berdasarkan perakaunan tidak berterusan. Oleh itu, masalah kesimpulan berasaskan bukti dalam statistik sosial adalah sangat akut.

Apabila menggunakan prosedur ujian hipotesis, harus diingat bahawa ia boleh menjamin keputusan dengan kebarangkalian tertentu hanya untuk sampel "tidak berat sebelah", berdasarkan data objektif.

Analisis Perbezaan

Menyemak kepentingan perbezaan terdiri daripada membandingkan jawapan kepada soalan yang sama yang diterima untuk dua atau lebih kumpulan responden bebas. Di samping itu, dalam beberapa kes adalah menarik untuk membandingkan jawapan kepada dua atau lebih soalan bebas untuk sampel yang sama.

Contoh kes pertama ialah kajian soalan: apakah yang lebih suka diminum oleh penduduk wilayah tertentu pada waktu pagi: kopi atau teh. Pada mulanya, 100 responden telah ditemu bual berdasarkan sampel rawak, 60% daripadanya lebih suka kopi; setahun kemudian, kajian itu diulang, dan hanya 40% daripada 300 orang yang dikaji memihak kepada kopi. Bagaimanakah keputusan kedua-dua kajian ini boleh dibandingkan? Perbandingan aritmetik langsung sebanyak 40% dan 60% adalah mustahil kerana ralat pensampelan yang berbeza. Walaupun dalam kes perbezaan besar dalam bilangan, katakan 20 dan 80%, lebih mudah untuk membuat kesimpulan bahawa terdapat perubahan dalam citarasa yang memihak kepada kopi. Walau bagaimanapun, jika terdapat keyakinan bahawa perbezaan besar ini disebabkan terutamanya oleh fakta bahawa dalam kes pertama sampel yang sangat kecil digunakan, maka kesimpulan sedemikian mungkin meragukan. Oleh itu, apabila melakukan perbandingan sedemikian, dua faktor kritikal mesti diambil kira: tahap kepentingan perbezaan antara nilai parameter untuk dua sampel dan ralat min kuasa dua dua sampel, ditentukan oleh jumlahnya.

Hipotesis nol digunakan untuk menguji sama ada perbezaan antara min yang diukur adalah signifikan. Hipotesis nol mengandaikan bahawa dua populasi yang dibandingkan pada satu atau lebih ciri tidak berbeza antara satu sama lain. Dalam kes ini, diandaikan bahawa perbezaan sebenar antara nilai yang dibandingkan adalah sama dengan sifar, dan perbezaan dari sifar yang didedahkan daripada data adalah bersifat rawak , .

Untuk menyemak sama ada perbezaan antara kedua-dua min yang diukur (peratusan) adalah ketara, ia terlebih dahulu dibandingkan, dan kemudian perbezaan yang terhasil ditukar kepada nilai ralat piawai, dan ia ditentukan sejauh mana ia menyimpang daripada nilai sifar hipotesis.

Setelah ralat min kuasa dua ditentukan, kawasan di bawah keluk taburan normal diketahui dan menjadi mungkin untuk membuat kesimpulan tentang kebarangkalian memenuhi hipotesis nol.

Pertimbangkan contoh berikut. Mari cuba jawab soalan: "Adakah terdapat perbezaan dalam pengambilan minuman ringan antara kanak-kanak perempuan dan lelaki?" Tinjauan itu bertanya tentang bilangan tin minuman ringan yang digunakan sepanjang minggu. Statistik deskriptif menunjukkan bahawa, secara purata, kanak-kanak lelaki mengambil 9 dan perempuan 7.5 tin minuman ringan. Purata sisihan kuasa dua ialah 2 dan 1.2, masing-masing. Saiz sampel dalam kedua-dua kes ialah 100 orang. Semakan untuk perbezaan yang signifikan secara statistik dalam anggaran telah dijalankan seperti berikut:

di mana x 1 dan x 2 ialah purata bagi dua sampel;

s 1 dan s 2 - sisihan piawai untuk dua sampel;

n 1 dan n 2 - isipadu sampel pertama dan kedua, masing-masing.

Pengangka formula ini mencirikan perbezaan antara purata. Di samping itu, adalah perlu untuk mengambil kira perbezaan dalam bentuk kedua-dua lengkung pengedaran. Ini dilakukan dalam penyebut formula. Taburan pensampelan kini dianggap sebagai taburan pensampelan perbezaan antara min (ukuran peratusan). Jika hipotesis nol adalah benar, maka taburan perbezaan adalah lengkung normal dengan min sama dengan sifar dan min ralat kuasa dua sama dengan 1.

Dapat dilihat bahawa nilai 6.43 secara signifikan melebihi nilai ±1.96 (95% tahap keyakinan) dan ±2.58 (99% tahap keyakinan). Ini bermakna hipotesis nol adalah tidak benar.

Pada rajah. 4.6 menunjukkan lengkung taburan bagi kedua-dua sampel yang dibandingkan ini dan ralat min kuasa dua bagi lengkung beza. Ralat min kuasa dua bagi lengkung perbezaan purata ialah 0. Disebabkan nilai ralat min kuasa dua yang besar, kebarangkalian kesahihan hipotesis nol bahawa tiada perbezaan antara kedua-dua min adalah kurang daripada 0.001.

Asas analisis data statistik

statistik"biostatistik".

1. nominal;
2. ordinal;
3. selang;

sampel

wakil

bingkai sampel sampel rawak mudah persampelan selang

persampelan berstrata

kelompok dan kuota persampelan

hipotesis nol

hipotesis alternatif kuasa

tahap keyakinan."

Tajuk: Asas analisis data statistik
Penerangan terperinci:

Selepas selesai sebarang penyelidikan saintifik, asas atau eksperimen, analisis statistik data yang diperolehi dijalankan. Agar analisis statistik dapat dijalankan dengan jayanya dan menyelesaikan tugasan, kajian mesti dirancang dengan betul. Oleh itu, tanpa memahami asas statistik, adalah mustahil untuk merancang dan memproses hasil eksperimen saintifik. Walau bagaimanapun, pendidikan perubatan bukan sahaja menyediakan pengetahuan tentang statistik, malah asas matematik yang lebih tinggi. Oleh itu, selalunya seseorang boleh menjumpai pendapat bahawa hanya seorang ahli statistik harus berurusan dengan pemprosesan statistik dalam penyelidikan bioperubatan, dan seorang penyelidik perubatan harus menumpukan pada isu-isu perubatan kerja saintifiknya. Pembahagian kerja sedemikian, membayangkan bantuan dalam analisis data, adalah wajar sepenuhnya. Walau bagaimanapun, pemahaman tentang prinsip statistik adalah perlu sekurang-kurangnya untuk mengelakkan salah menetapkan tugas untuk pakar, komunikasi dengan siapa sebelum permulaan kajian adalah sama pentingnya dengan pada peringkat pemprosesan data.

Sebelum bercakap tentang asas analisis statistik, adalah perlu untuk menjelaskan maksud istilah " statistik". Terdapat banyak definisi, tetapi yang paling lengkap dan ringkas, pada pendapat kami, ialah definisi statistik sebagai "ilmu mengumpul, membentang dan menganalisis data". Sebaliknya, penggunaan statistik dalam aplikasi kepada dunia hidup dipanggil "biometrik" atau " biostatistik".

Perlu diingatkan bahawa selalunya statistik dikurangkan hanya kepada pemprosesan data eksperimen, tanpa memberi perhatian kepada peringkat mendapatkannya. Walau bagaimanapun, pengetahuan statistik sudah diperlukan semasa perancangan eksperimen, supaya penunjuk yang diperoleh semasa ia dapat memberikan penyelidik maklumat yang boleh dipercayai. Oleh itu, kita boleh mengatakan bahawa analisis statistik keputusan eksperimen bermula walaupun sebelum permulaan kajian.

Sudah di peringkat membangunkan rancangan, penyelidik harus memahami dengan jelas jenis pembolehubah yang akan ada dalam kerjanya. Semua pembolehubah boleh dibahagikan kepada dua kelas: kualitatif dan kuantitatif. Apakah julat yang boleh diambil oleh pembolehubah bergantung pada skala pengukuran. Terdapat empat skala utama:

1. nominal;
2. ordinal;
3. selang;
4. rasional (skala perhubungan).

Dalam skala nominal (skala "nama") terdapat hanya simbol untuk menggambarkan beberapa kelas objek, sebagai contoh, "jantina" atau "profesion pesakit". Skala nominal membayangkan bahawa pembolehubah akan mengambil nilai, hubungan kuantitatif antara yang tidak dapat ditentukan. Oleh itu, adalah mustahil untuk mewujudkan hubungan matematik antara jantina lelaki dan perempuan. Penamaan berangka konvensional (wanita - 0, lelaki - 1, atau sebaliknya) diberikan secara sewenang-wenangnya dan hanya bertujuan untuk pemprosesan komputer. Skala nominal adalah kualitatif dalam bentuk paling tulen; kategori individu dalam skala ini dinyatakan dengan frekuensi (bilangan atau bahagian pemerhatian, peratusan).

Skala ordinal (ordinal) memperuntukkan bahawa kategori individu di dalamnya boleh disusun dalam susunan menaik atau menurun. Dalam statistik perubatan, contoh klasik skala ordinal ialah penggredan keparahan penyakit. Dalam kes ini, kita boleh membina keterukan dalam susunan menaik, tetapi masih tidak mempunyai keupayaan untuk menentukan hubungan kuantitatif, iaitu jarak antara nilai yang diukur dalam skala ordinal tidak diketahui atau tidak penting. Adalah mudah untuk menetapkan susunan nilai pembolehubah "keterukan", tetapi adalah mustahil untuk menentukan berapa kali keadaan teruk berbeza daripada keadaan sederhana.

Skala ordinal merujuk kepada jenis data separa kuantitatif, dan penggredannya boleh diterangkan oleh kedua-dua frekuensi (seperti dalam skala kualitatif) dan dengan ukuran nilai pusat, yang akan kita bincangkan di bawah.

Skala selang dan rasional adalah jenis data kuantitatif semata-mata. Dalam skala selang, kita sudah boleh menentukan berapa banyak satu nilai pembolehubah berbeza daripada yang lain. Oleh itu, peningkatan suhu badan sebanyak 1 darjah Celsius sentiasa bermakna peningkatan haba yang dikeluarkan oleh bilangan unit yang tetap. Walau bagaimanapun, skala selang mempunyai nilai positif dan negatif (tiada sifar mutlak). Dalam hal ini, adalah mustahil untuk mengatakan bahawa 20 darjah Celsius adalah dua kali lebih panas daripada 10. Kita hanya boleh menyatakan bahawa 20 darjah adalah lebih panas daripada 10 kerana 30 adalah lebih panas daripada 20.

Skala rasional (skala nisbah) mempunyai satu titik rujukan dan hanya nilai positif. Dalam perubatan, kebanyakan skala rasional adalah kepekatan. Sebagai contoh, tahap glukosa 10 mmol/L adalah dua kali ganda kepekatan berbanding 5 mmol/L. Untuk suhu, skala rasional ialah skala Kelvin, di mana terdapat sifar mutlak (ketiadaan haba).

Perlu ditambah bahawa mana-mana pembolehubah kuantitatif boleh berterusan, seperti dalam kes mengukur suhu badan (ini adalah skala selang berterusan), atau diskret, jika kita mengira bilangan sel darah atau keturunan haiwan makmal (ini adalah skala rasional diskret).

Perbezaan ini adalah penting untuk pemilihan kaedah untuk analisis statistik keputusan eksperimen. Jadi, untuk data nominal, ujian khi kuasa dua adalah terpakai, dan ujian Pelajar yang terkenal memerlukan pembolehubah (selang atau rasional) adalah berterusan.

Selepas persoalan jenis pembolehubah telah diselesaikan, adalah perlu untuk mula membentuk sampel. Sampel ialah sekumpulan kecil objek dari kelas tertentu (dalam bidang perubatan, populasi). Untuk mendapatkan data yang benar-benar tepat, adalah perlu untuk mengkaji semua objek kelas tertentu, bagaimanapun, atas sebab praktikal (selalunya kewangan), hanya sebahagian daripada populasi, yang dipanggil sampel, dikaji. Pada masa hadapan, analisis statistik membolehkan penyelidik memanjangkan corak yang diperolehi kepada seluruh populasi dengan tahap ketepatan tertentu. Malah, semua statistik bioperubatan bertujuan untuk mendapatkan hasil yang paling tepat daripada bilangan pemerhatian yang paling sedikit, kerana apabila menyelidik tentang manusia, isu etika juga penting. Kami tidak mampu untuk meletakkan lebih ramai pesakit berisiko daripada yang diperlukan.

Penciptaan sampel dikawal oleh beberapa keperluan wajib, pelanggaran yang boleh membawa kepada kesimpulan yang salah daripada hasil kajian. Pertama, saiz sampel adalah penting. Ketepatan menganggar parameter yang dikaji bergantung pada saiz sampel. Perkataan "ketepatan" harus diambil kira di sini. Lebih besar saiz kumpulan kajian, lebih tepat (tetapi tidak semestinya betul) keputusan yang diterima saintis. Agar hasil kajian persampelan boleh dipindahkan kepada keseluruhan populasi secara keseluruhan, sampel mestilah wakil. Keterwakilan sampel membayangkan bahawa ia mencerminkan semua sifat penting populasi. Dalam erti kata lain, dalam kumpulan yang dikaji, orang yang berlainan jantina, umur, profesion, status sosial, dll. didapati dengan kekerapan yang sama seperti dalam keseluruhan populasi.

Walau bagaimanapun, sebelum memulakan pemilihan kumpulan kajian, seseorang harus memutuskan keperluan untuk mengkaji populasi tertentu. Contoh populasi boleh menjadi semua pesakit dengan nosologi tertentu atau orang yang berumur bekerja, dsb. Oleh itu, keputusan yang diperoleh untuk populasi orang muda umur tentera hampir tidak boleh diekstrapolasi kepada wanita menopause. Set ciri yang akan dimiliki oleh kumpulan kajian menentukan "kebolehgeneralisasian" data kajian.

Sampel boleh dihasilkan dalam pelbagai cara. Yang paling mudah ialah memilih, menggunakan penjana nombor rawak, bilangan objek yang diperlukan daripada populasi, atau bingkai sampel(bingkai pensampelan). Kaedah ini dipanggil sampel rawak mudah". Jika kita secara rawak memilih titik permulaan dalam bingkai persampelan, dan kemudian mengambil setiap objek saat, kelima atau kesepuluh (bergantung pada saiz kumpulan yang diperlukan dalam kajian), kita mendapat persampelan selang. Pensampelan selang tidak rawak, kerana kemungkinan pengulangan data secara berkala dalam bingkai pensampelan tidak pernah dikecualikan.

Adalah mungkin untuk mencipta apa yang dipanggil " persampelan berstrata”, yang mengandaikan bahawa populasi terdiri daripada beberapa kumpulan yang berbeza dan struktur ini harus dihasilkan semula dalam kumpulan eksperimen. Sebagai contoh, jika nisbah lelaki kepada wanita dalam populasi ialah 30:70, maka dalam sampel berstrata, nisbah mereka hendaklah sama. Dengan pendekatan ini, adalah penting untuk tidak mengimbangi sampel secara berlebihan, iaitu, untuk mengelakkan kehomogenan ciri-cirinya, jika tidak, penyelidik mungkin terlepas peluang untuk mencari perbezaan atau hubungan dalam data.

Sebagai tambahan kepada kaedah yang diterangkan untuk membentuk kumpulan, terdapat juga kelompok dan kuota persampelan. Yang pertama digunakan apabila mendapatkan maklumat lengkap tentang bingkai sampel adalah sukar kerana saiznya. Kemudian sampel terbentuk daripada beberapa kumpulan yang termasuk dalam populasi. Yang kedua - kuota - adalah serupa dengan sampel berstrata, tetapi di sini taburan objek tidak sepadan dengan populasi.

Kembali kepada saiz sampel, harus dikatakan bahawa ia berkait rapat dengan kebarangkalian ralat statistik jenis pertama dan kedua. Kesilapan statistik mungkin disebabkan oleh fakta bahawa kajian itu tidak mengkaji keseluruhan populasi, tetapi sebahagian daripadanya. Ralat jenis I ialah sisihan yang salah hipotesis nol. Sebaliknya, hipotesis nol ialah andaian bahawa semua kumpulan yang dikaji diambil daripada populasi umum yang sama, yang bermaksud bahawa perbezaan atau hubungan antara mereka adalah rawak. Jika kita melukis analogi dengan ujian diagnostik, maka ralat jenis I ialah hasil positif palsu.

Ralat Jenis II ialah sisihan yang salah hipotesis alternatif, maknanya terletak pada hakikat bahawa perbezaan atau hubungan antara kumpulan adalah disebabkan bukan secara kebetulan, tetapi oleh pengaruh faktor yang dikaji. Dan sekali lagi analogi dengan diagnostik: ralat jenis kedua adalah hasil negatif palsu. Berkaitan dengan kesilapan ini ialah tanggapan kuasa, yang memberitahu tentang keberkesanan kaedah statistik tertentu dalam keadaan tertentu, tentang kepekaannya. Kuasa dikira dengan formula: 1-β, di mana β ialah kebarangkalian ralat Jenis II. Penunjuk ini bergantung terutamanya pada saiz sampel. Semakin besar saiz kumpulan, semakin rendah kebarangkalian ralat Jenis II dan semakin tinggi kuasa ujian statistik. Kebergantungan ini sekurang-kurangnya kuadratik, iaitu, mengurangkan saiz sampel sebanyak separuh akan membawa kepada penurunan kuasa sekurang-kurangnya empat kali. Kuasa minimum yang dibenarkan dianggap sebagai 80%, dan tahap ralat maksimum yang dibenarkan bagi jenis pertama ialah 5%. Walau bagaimanapun, perlu sentiasa diingat bahawa sempadan ini adalah sewenang-wenangnya dan mungkin berubah bergantung kepada sifat dan objektif kajian. Sebagai peraturan, perubahan kuasa yang sewenang-wenangnya diiktiraf oleh komuniti saintifik, tetapi dalam kebanyakan kes, tahap kesilapan jenis pertama tidak boleh melebihi 5%.

Semua perkara di atas adalah berkaitan secara langsung dengan peringkat perancangan penyelidikan. Walau bagaimanapun, ramai penyelidik tersilap merujuk kepada pemprosesan data statistik hanya sebagai beberapa jenis manipulasi yang dilakukan selepas selesai bahagian utama kerja. Selalunya, selepas berakhirnya percubaan yang tidak dirancang, terdapat keinginan yang tidak dapat ditolak untuk memerintahkan analisis data statistik di sebelah. Tetapi ia akan menjadi sangat sukar walaupun bagi seorang ahli statistik untuk mengeluarkan hasil yang diharapkan oleh penyelidik daripada "timbunan sampah". Oleh itu, dengan pengetahuan biostatistik yang tidak mencukupi, adalah perlu untuk mendapatkan bantuan dalam analisis statistik walaupun sebelum permulaan eksperimen.

Berbalik kepada prosedur analisis itu sendiri, dua jenis teknik statistik utama harus ditunjukkan: deskriptif dan berasaskan bukti (analitik). Teknik deskriptif merangkumi teknik untuk mempersembahkan data dengan cara yang padat dan mudah difahami. Ini termasuk jadual, graf, frekuensi (mutlak dan relatif), ukuran kecenderungan memusat (min, median, mod) dan ukuran penyebaran data (varian, sisihan piawai, selang antara kuartil, dll.). Dengan kata lain, kaedah deskriptif mencirikan sampel yang dikaji.

Cara paling popular (walaupun sering mengelirukan) untuk menerangkan data kuantitatif yang tersedia adalah dengan mentakrifkan penunjuk berikut:

bilangan pemerhatian dalam sampel atau saiznya;
nilai purata (min aritmetik);
sisihan piawai ialah ukuran sejauh mana nilai pembolehubah berubah.

Adalah penting untuk diingat bahawa min aritmetik dan sisihan piawai ialah ukuran kecenderungan memusat dan serakan dalam bilangan sampel yang agak kecil. Dalam sampel sedemikian, nilai kebanyakan objek menyimpang daripada min dengan kebarangkalian yang sama, dan taburannya membentuk "loceng" simetri (lengkung Gauss atau Gauss-Laplace). Pengagihan sedemikian juga dipanggil "normal", tetapi dalam amalan eksperimen perubatan ia berlaku hanya dalam 30% kes. Jika nilai pembolehubah diedarkan secara tidak simetri mengenai pusat, maka kumpulan diterangkan dengan terbaik menggunakan median dan kuantil (persentil, kuartil, desil).

Setelah menyelesaikan penerangan kumpulan, adalah perlu untuk menjawab soalan tentang hubungan mereka dan kemungkinan menyamaratakan hasil kajian kepada seluruh populasi. Untuk ini, kaedah biostatistik berasaskan bukti digunakan. Ia adalah mengenai mereka yang penyelidik pertama sekali ingat apabila ia berkaitan dengan pemprosesan data statistik. Biasanya peringkat kerja ini dipanggil "menguji hipotesis statistik".

Tugasan ujian hipotesis boleh dibahagikan kepada dua kumpulan besar. Kumpulan pertama menjawab soalan sama ada terdapat perbezaan antara kumpulan dalam tahap beberapa penunjuk, sebagai contoh, perbezaan dalam tahap transaminase hepatik pada pesakit dengan hepatitis dan orang yang sihat. Kumpulan kedua membolehkan anda membuktikan kewujudan hubungan antara dua atau lebih penunjuk, contohnya, fungsi hati dan sistem imun.

Dari segi praktikal, tugasan daripada kumpulan pertama boleh dibahagikan kepada dua subjenis:

perbandingan penunjuk hanya dalam dua kumpulan (sihat dan sakit, lelaki dan wanita);
perbandingan tiga atau lebih kumpulan (kajian dos ubat yang berbeza).

Perlu diambil kira bahawa kaedah statistik berbeza dengan ketara untuk data kualitatif dan kuantitatif.

Dalam keadaan di mana pembolehubah yang dikaji adalah kualitatif dan hanya dua kumpulan yang dibandingkan, ujian khi kuasa dua boleh digunakan. Ini adalah kriteria yang agak berkuasa dan diketahui secara meluas, namun, ia tidak cukup berkesan jika bilangan pemerhatian adalah kecil. Untuk menyelesaikan masalah ini, terdapat beberapa kaedah, seperti pembetulan Yates untuk kesinambungan dan kaedah tepat Fisher.

Jika pembolehubah yang dikaji adalah kuantitatif, maka satu daripada dua jenis ujian statistik boleh digunakan. Kriteria jenis pertama adalah berdasarkan jenis taburan khusus populasi umum dan beroperasi dengan parameter populasi ini. Kriteria sedemikian dipanggil "parametrik", dan ia biasanya berdasarkan andaian taburan normal nilai. Ujian bukan parametrik tidak berdasarkan andaian tentang jenis taburan populasi umum dan tidak menggunakan parameternya. Kadangkala kriteria sedemikian dipanggil "ujian bebas pengedaran". Pada tahap tertentu, ini adalah salah, kerana sebarang ujian bukan parametrik mengandaikan bahawa taburan dalam semua kumpulan yang dibandingkan akan sama, jika tidak, keputusan positif palsu mungkin diperoleh.

Terdapat dua ujian parametrik digunakan pada data yang diambil daripada populasi taburan normal: Ujian-t pelajar untuk membandingkan dua kumpulan dan ujian F Fisher untuk menguji kesamaan varians (aka ANOVA). Terdapat lebih banyak kriteria bukan parametrik. Ujian yang berbeza berbeza antara satu sama lain dalam andaian yang menjadi asasnya, dalam kerumitan pengiraan, dalam kuasa statistik, dll. Walau bagaimanapun, ujian Wilcoxon (untuk kumpulan berkaitan) dan ujian Mann-Whitney, juga dikenali sebagai ujian Wilcoxon untuk sampel bebas. Ujian ini mudah kerana ia tidak memerlukan andaian tentang sifat pengedaran data. Tetapi jika ternyata sampel diambil daripada populasi umum taburan normal, maka kuasa statistik mereka tidak akan berbeza dengan ketara daripada itu untuk ujian Pelajar.

Penerangan lengkap kaedah statistik boleh didapati dalam kesusasteraan khusus, bagaimanapun, perkara utama ialah setiap ujian statistik memerlukan satu set peraturan (andaian) dan syarat untuk penggunaannya, dan penghitungan mekanikal beberapa kaedah untuk mencari "yang dikehendaki" keputusan sama sekali tidak boleh diterima dari sudut pandangan saintifik. . Dalam pengertian ini, ujian statistik adalah serupa dengan ubat - masing-masing mempunyai petunjuk dan kontraindikasi, kesan sampingan dan kemungkinan tidak berkesan. Dan sama berbahayanya adalah penggunaan ujian statistik yang tidak terkawal, kerana hipotesis dan kesimpulan berdasarkannya.

Untuk pemahaman yang lebih lengkap tentang isu ketepatan analisis statistik, adalah perlu untuk menentukan dan menganalisis konsep " tahap keyakinan." Kebarangkalian keyakinan ialah nilai yang diambil sebagai sempadan antara kejadian yang berkemungkinan dan tidak mungkin. Secara tradisinya, ia dilambangkan dengan huruf "p". Bagi kebanyakan penyelidik, satu-satunya tujuan melakukan analisis statistik adalah untuk mengira nilai p yang didambakan, yang nampaknya meletakkan koma dalam frasa terkenal "pelaksanaan tidak boleh diampunkan." Tahap keyakinan maksimum yang dibenarkan ialah 0.05. Harus diingat bahawa tahap keyakinan bukanlah kebarangkalian sesuatu peristiwa, tetapi soal keyakinan. Dengan mendedahkan kebarangkalian keyakinan sebelum memulakan analisis, kami dengan itu menentukan tahap keyakinan dalam hasil penyelidikan kami. Dan, seperti yang anda ketahui, mudah tertipu dan syak wasangka yang berlebihan sama-sama memberi kesan negatif kepada hasil kerja.

Tahap keyakinan menunjukkan kebarangkalian maksimum ralat Jenis I yang pengkaji anggap boleh diterima. Mengurangkan tahap keyakinan, dengan kata lain, mengetatkan syarat untuk menguji hipotesis, meningkatkan kemungkinan ralat jenis II. Oleh itu, pemilihan tahap keyakinan mesti dibuat dengan mengambil kira kemungkinan kerosakan daripada berlakunya kesilapan jenis pertama dan kedua. Sebagai contoh, had ketat yang diterima pakai dalam statistik bioperubatan, yang menentukan bahagian keputusan positif palsu tidak lebih daripada 5%, adalah keperluan yang teruk, kerana rawatan baru diperkenalkan atau ditolak berdasarkan hasil penyelidikan perubatan, dan ini adalah satu masalah kehidupan untuk beribu-ribu orang.

Perlu diingat bahawa nilai p itu sendiri tidak begitu bermaklumat untuk doktor, kerana ia hanya memberitahu tentang kebarangkalian penolakan yang salah terhadap hipotesis nol. Penunjuk ini tidak mengatakan apa-apa, sebagai contoh, tentang saiz kesan terapeutik apabila menggunakan ubat kajian dalam populasi umum. Oleh itu, terdapat pendapat bahawa daripada tahap keyakinan, adalah lebih baik untuk menilai hasil kajian mengikut saiz selang keyakinan. Selang keyakinan ialah julat nilai di mana nilai populasi sebenar (untuk min, median atau kekerapan) terkandung dengan kebarangkalian tertentu. Dalam amalan, adalah lebih mudah untuk memiliki kedua-dua nilai ini, yang memungkinkan untuk menilai dengan lebih yakin kebolehgunaan keputusan yang diperoleh kepada populasi secara keseluruhan.

Kesimpulannya, beberapa perkataan harus dikatakan tentang alat yang digunakan oleh ahli statistik atau penyelidik yang menganalisis data secara bebas. Pengiraan manual sudah lama berlalu. Program komputer statistik yang wujud hari ini memungkinkan untuk menjalankan analisis statistik tanpa mempunyai latar belakang matematik yang serius. Sistem berkuasa seperti SPSS, SAS, R, dll. membolehkan penyelidik menggunakan kaedah statistik yang kompleks dan berkuasa. Walau bagaimanapun, ini tidak selalunya perkara yang baik. Tanpa mengetahui tahap kebolehgunaan ujian statistik yang digunakan untuk data eksperimen tertentu, penyelidik boleh membuat pengiraan dan juga mendapatkan beberapa nombor pada output, tetapi hasilnya akan sangat meragukan. Oleh itu, prasyarat untuk pemprosesan statistik keputusan eksperimen haruslah pengetahuan yang baik tentang asas matematik statistik.

Cukup terperinci dalam kesusasteraan domestik. Dalam amalan perusahaan Rusia, sementara itu, hanya sebahagian daripada mereka yang digunakan. Pertimbangkan seterusnya kaedah pemprosesan statistik.

Maklumat am

Dalam amalan perusahaan domestik, ia adalah perkara biasa kaedah kawalan statistik. Jika kita bercakap tentang peraturan proses teknologi, maka ia diperhatikan sangat jarang. Aplikasi kaedah statistik memperuntukkan bahawa sekumpulan pakar yang mempunyai kelayakan yang sesuai dibentuk di perusahaan.

Maknanya

Menurut ISO ser. 9000, pembekal perlu menentukan keperluan kaedah statistik yang digunakan dalam proses membangun, mengawal selia dan mengesahkan keupayaan proses pengeluaran dan ciri-ciri produk. Kaedah yang digunakan adalah berdasarkan teori kebarangkalian dan pengiraan matematik. Kaedah statistik untuk analisis data boleh dilaksanakan pada mana-mana peringkat kitaran hayat produk. Mereka menyediakan penilaian dan akaun tahap heterogeniti produk atau kebolehubahan sifatnya berbanding dengan denominasi yang ditetapkan atau nilai yang diperlukan, serta kebolehubahan proses penciptaannya. Kaedah statistik ialah kaedah yang memungkinkan untuk menilai keadaan fenomena yang sedang dikaji dengan ketepatan dan kebolehpercayaan yang diberikan. Ia membolehkan anda meramalkan masalah tertentu, membangunkan penyelesaian optimum berdasarkan maklumat fakta, trend dan corak yang dikaji.

Arahan penggunaan

Kawasan utama yang terdapat secara meluas kaedah statistik ialah:

Amalan negara maju

Kaedah statistik ialah asas yang memastikan penciptaan produk dengan ciri pengguna yang tinggi. Teknik ini digunakan secara meluas di negara perindustrian. Kaedah statistik, sebenarnya, menjamin bahawa pengguna menerima produk yang memenuhi keperluan yang ditetapkan. Kesan penggunaannya telah dibuktikan dengan amalan perusahaan industri di Jepun. Merekalah yang menyumbang kepada pencapaian tahap pengeluaran tertinggi di negara ini. Pengalaman jangka panjang negara asing menunjukkan betapa berkesannya teknik ini. Khususnya, diketahui bahawa Hewlelt Packard, menggunakan kaedah statistik, dapat mengurangkan bilangan perkahwinan sebulan daripada 9,000 kepada 45 unit dalam salah satu kes.

Kesukaran pelaksanaan

Dalam amalan domestik, terdapat beberapa halangan yang tidak membenarkan penggunaan kaedah kajian statistik penunjuk. Kesukaran timbul kerana:

Pembangunan program

Harus dikatakan bahawa menentukan keperluan kaedah statistik tertentu dalam bidang kualiti, memilih, menguasai teknik tertentu adalah pekerjaan yang agak rumit dan panjang untuk mana-mana perusahaan domestik. Untuk pelaksanaannya yang berkesan, adalah dinasihatkan untuk membangunkan program jangka panjang khas. Ia harus menyediakan untuk pembentukan perkhidmatan yang tugasnya akan merangkumi organisasi dan panduan metodologi penggunaan kaedah statistik. Dalam rangka program, adalah perlu untuk menyediakan untuk melengkapkan dengan cara teknikal yang sesuai, pakar latihan, dan menentukan komposisi tugas pengeluaran yang harus diselesaikan menggunakan kaedah yang dipilih. Penguasaan disyorkan untuk bermula dengan menggunakan pendekatan yang paling mudah. Sebagai contoh, anda boleh menggunakan pengeluaran asas yang terkenal. Selepas itu, adalah dinasihatkan untuk beralih kepada kaedah lain. Sebagai contoh, ia boleh menjadi analisis varians, pemprosesan maklumat terpilih, pengawalseliaan proses, perancangan penyelidikan dan eksperimen faktorial, dsb.

Pengelasan

Kaedah statistik analisis ekonomi termasuk helah yang berbeza. Tidak perlu dikatakan, terdapat sedikit daripada mereka. Walau bagaimanapun, pakar terkemuka dalam bidang pengurusan kualiti di Jepun, K. Ishikawa, mengesyorkan menggunakan tujuh kaedah asas:

Carta pareto.
Mengelompokkan maklumat mengikut ciri umum.
Kad kawalan.
Gambar rajah sebab dan akibat.
Histogram.
Lembaran kawalan.
Carta taburan.

Berdasarkan pengalamannya sendiri dalam bidang pengurusan, Ishikawa mendakwa bahawa 95% daripada semua isu dan masalah dalam perusahaan boleh diselesaikan menggunakan tujuh pendekatan ini.

Carta pareto

Yang ini adalah berdasarkan nisbah tertentu. Ia telah dipanggil "Prinsip Pareto". Menurutnya, daripada 20% punca, 80% akibat muncul. dalam bentuk visual dan boleh difahami menunjukkan pengaruh relatif setiap keadaan ke atas masalah keseluruhan dalam susunan menurun. Kesan ini boleh disiasat pada bilangan kerugian, kecacatan, yang diprovokasi oleh setiap punca. Pengaruh relatif diilustrasikan oleh bar, pengaruh kumulatif faktor oleh garis lurus terkumpul.

rajah sebab dan akibat

Di atasnya, masalah yang dikaji secara konvensional digambarkan dalam bentuk anak panah lurus mendatar, dan keadaan dan faktor yang mempengaruhinya secara tidak langsung atau langsung adalah dalam bentuk anak panah serong. Apabila membina, walaupun keadaan yang kelihatan tidak penting harus diambil kira. Ini disebabkan oleh fakta bahawa dalam praktiknya terdapat kes-kes di mana penyelesaian masalah dipastikan dengan mengecualikan beberapa faktor yang kelihatan tidak penting. Sebab-sebab yang mempengaruhi keadaan utama (tertib pertama dan seterusnya) digambarkan pada rajah dengan anak panah pendek mendatar. Gambar rajah terperinci akan dalam bentuk rangka ikan.

Mengelompokkan maklumat

ini kaedah ekonomi-statistik digunakan untuk menyusun satu set penunjuk yang diperoleh dengan menilai dan mengukur satu atau lebih parameter objek. Sebagai peraturan, maklumat tersebut dibentangkan dalam bentuk urutan nilai yang tidak teratur. Ini boleh menjadi dimensi linear bahan kerja, takat lebur, kekerasan bahan, bilangan kecacatan, dan sebagainya. Berdasarkan sistem sedemikian, sukar untuk membuat kesimpulan tentang sifat produk atau proses penciptaannya. Pemesanan dilakukan menggunakan graf garis. Mereka jelas menunjukkan perubahan dalam parameter yang diperhatikan dalam tempoh tertentu.

Lembaran kawalan

Sebagai peraturan, ia dibentangkan dalam bentuk jadual pengedaran kekerapan untuk berlakunya nilai terukur parameter objek dalam selang yang sepadan. Senarai semak disusun bergantung kepada tujuan kajian. Julat nilai penunjuk dibahagikan kepada selang yang sama. Nombor mereka biasanya dipilih sama dengan punca kuasa dua bilangan ukuran yang diambil. Borang hendaklah ringkas untuk menghapuskan masalah semasa mengisi, membaca, menyemak.

graf bar

Ia dibentangkan dalam bentuk poligon bertingkat. Ia jelas menggambarkan taburan penunjuk ukuran. Julat nilai set dibahagikan kepada selang yang sama, yang diplot sepanjang paksi-x. Segi empat tepat dibina untuk setiap selang. Ketinggiannya adalah sama dengan kekerapan berlakunya nilai dalam selang yang diberikan.

Plot berselerak

Ia digunakan semasa menguji hipotesis tentang hubungan dua pembolehubah. Model dibina seperti berikut. Nilai satu parameter diplot pada paksi absis, dan nilai penunjuk lain diplot pada ordinat. Akibatnya, satu titik muncul pada graf. Tindakan ini diulang untuk semua nilai pembolehubah. Sekiranya terdapat hubungan, medan korelasi dilanjutkan, dan arahnya tidak akan bertepatan dengan arah paksi-y. Jika tiada kekangan, ia akan selari dengan salah satu paksi atau akan mempunyai bentuk bulatan.

Kad kawalan

Ia digunakan semasa menilai proses dalam tempoh tertentu. Pembentukan carta kawalan adalah berdasarkan peruntukan berikut:

Semua proses menyimpang daripada parameter yang ditetapkan dari semasa ke semasa.
Perjalanan fenomena yang tidak stabil tidak berubah secara kebetulan. Penyimpangan yang melampaui sempadan had yang dijangkakan adalah bukan rawak.
Perubahan individu boleh diramalkan.
Proses yang stabil boleh menyimpang secara rawak dalam had yang dijangkakan.

Gunakan dalam amalan perusahaan Rusia

Harus dikatakan bahawa pengalaman domestik dan asing menunjukkan bahawa kaedah statistik yang paling berkesan untuk menilai kestabilan dan ketepatan peralatan dan proses teknologi ialah penyusunan carta kawalan. Kaedah ini juga digunakan dalam pengawalseliaan kapasiti potensi pengeluaran. Apabila membina peta, adalah perlu untuk memilih parameter yang dikaji dengan betul. Adalah disyorkan untuk memberi keutamaan kepada penunjuk yang berkaitan secara langsung dengan tujuan produk, boleh diukur dengan mudah dan boleh dipengaruhi oleh kawalan proses. Jika pilihan sedemikian sukar atau tidak wajar, adalah mungkin untuk menilai nilai yang berkorelasi (saling berkait) dengan parameter terkawal.

Nuansa

Jika pengukuran penunjuk dengan ketepatan yang diperlukan untuk pemetaan mengikut kriteria kuantitatif tidak mungkin dari segi ekonomi atau teknikal, tanda alternatif digunakan. Istilah seperti "perkahwinan" dan "cacat" dikaitkan dengannya. Yang terakhir ini difahami sebagai setiap ketidakpatuhan berasingan produk dengan keperluan yang ditetapkan. Perkahwinan adalah produk, penyediaannya tidak dibenarkan kepada pengguna, kerana terdapat kecacatan di dalamnya.

Keanehan

Setiap jenis kad mempunyai spesifikasi tersendiri. Ia mesti diambil kira apabila memilihnya untuk kes tertentu. Kad mengikut kriteria kuantitatif dianggap lebih sensitif terhadap perubahan proses daripada yang menggunakan ciri alternatif. Walau bagaimanapun, yang pertama adalah lebih intensif buruh. Mereka digunakan untuk:

Proses penyahpepijatan.
Menilai kemungkinan memperkenalkan teknologi.
Memeriksa ketepatan peralatan.
Definisi toleransi.
Pemetaan beberapa cara yang sah untuk mencipta produk.

Selain itu

Jika gangguan proses dicirikan oleh anjakan parameter terkawal, perlu menggunakan X-maps. Jika terdapat peningkatan dalam serakan nilai, model R atau S harus dipilih. Walau bagaimanapun, adalah perlu untuk mengambil kira beberapa ciri. Khususnya, penggunaan carta-S akan memungkinkan untuk mewujudkan gangguan proses dengan lebih tepat dan cepat daripada model R dengan yang sama. Pada masa yang sama, pembinaan yang terakhir tidak memerlukan pengiraan yang rumit.

Kesimpulan

Dalam ekonomi, adalah mungkin untuk meneroka faktor-faktor yang terdapat dalam perjalanan penilaian kualitatif, dalam ruang dan dinamik. Ia boleh digunakan untuk melakukan pengiraan ramalan. Kaedah statistik analisis ekonomi tidak termasuk kaedah untuk menilai hubungan sebab dan akibat proses dan peristiwa ekonomi, mengenal pasti rizab yang menjanjikan dan belum diterokai untuk meningkatkan prestasi. Dalam erti kata lain, teknik faktorial tidak termasuk dalam pendekatan yang dipertimbangkan.