Biografi Ciri-ciri Analisis

Formula sisihan piawai. Bagaimana untuk mengira sisihan piawai? Penyerakan

Ciri variasi yang paling sempurna ialah sisihan piawai, yang dipanggil piawai (atau sisihan piawai). Sisihan piawai() adalah sama dengan punca kuasa dua bagi min kuasa dua sisihan nilai ciri individu daripada min aritmetik:

Sisihan piawai adalah mudah:

Sisihan piawai berwajaran digunakan untuk data terkumpul:

Di antara min kuasa dua dan min sisihan linear dalam keadaan taburan normal, perhubungan berikut berlaku: ~ 1.25.

Sisihan piawai, sebagai ukuran mutlak utama bagi variasi, digunakan dalam menentukan nilai ordinat lengkung taburan normal, dalam pengiraan yang berkaitan dengan organisasi pemerhatian sampel dan mewujudkan ketepatan ciri sampel, serta dalam menilai sempadan variasi sifat dalam populasi homogen.

Penyerakan, jenisnya, sisihan piawai.

Varians pembolehubah rawak- ukuran sebaran pembolehubah rawak yang diberikan, iaitu sisihan daripada jangkaan matematik. Dalam statistik, sebutan atau sering digunakan. Punca kuasa dua varians dipanggil sisihan piawai, sisihan piawai, atau sebaran piawai.

Jumlah varians (σ2) mengukur variasi sesuatu sifat dalam keseluruhan populasi di bawah pengaruh semua faktor yang menyebabkan variasi ini. Pada masa yang sama, terima kasih kepada kaedah pengelompokan, adalah mungkin untuk mengasingkan dan mengukur variasi disebabkan oleh ciri kumpulan, dan variasi yang berlaku di bawah pengaruh faktor yang tidak diambil kira.

Varians antara kumpulan (σ 2 m.gr) mencirikan variasi sistematik, iaitu, perbezaan dalam magnitud sifat yang dikaji yang timbul di bawah pengaruh sifat - faktor yang mendasari pengelompokan.

sisihan piawai(sinonim: sisihan piawai, sisihan piawai, sisihan piawai; istilah serupa: sisihan piawai, sebaran piawai) - dalam teori dan statistik kebarangkalian, penunjuk paling biasa bagi serakan nilai pembolehubah rawak berbanding jangkaan matematiknya. Dengan tatasusunan sampel nilai yang terhad, bukannya jangkaan matematik, min aritmetik bagi set sampel digunakan.

Sisihan piawai diukur dalam unit pembolehubah rawak itu sendiri dan digunakan dalam mengira ralat piawai min aritmetik, dalam membina selang keyakinan, dalam ujian statistik hipotesis, dan dalam mengukur hubungan linear antara pembolehubah rawak. Ia ditakrifkan sebagai punca kuasa dua bagi varians pembolehubah rawak.


Sisihan piawai:

Sisihan piawai(anggaran sisihan piawai pembolehubah rawak x berbanding jangkaan matematiknya berdasarkan anggaran tidak berat sebelah variansnya):

di manakah penyebaran; — i-elemen sampel ke-; - saiz sampel; - min aritmetik sampel:

Perlu diingatkan bahawa kedua-dua anggaran adalah berat sebelah. Dalam kes umum, adalah mustahil untuk membina anggaran yang tidak berat sebelah. Walau bagaimanapun, anggaran berdasarkan anggaran varians tidak berat sebelah adalah konsisten.

Intipati, skop dan prosedur untuk menentukan mod dan median.

Sebagai tambahan kepada purata undang-undang kuasa dalam statistik, untuk ciri relatif magnitud sifat yang berbeza-beza dan struktur dalaman siri pengedaran, purata struktur digunakan, yang diwakili terutamanya oleh mod dan median.

Fesyen- Ini ialah varian yang paling biasa bagi siri ini. Fesyen digunakan, sebagai contoh, dalam menentukan saiz pakaian, kasut, yang paling mendapat permintaan di kalangan pembeli. Mod untuk siri diskret ialah varian dengan frekuensi tertinggi. Apabila mengira mod untuk siri variasi selang, anda mesti terlebih dahulu menentukan selang modal (mengikut kekerapan maksimum), dan kemudian nilai nilai modal atribut mengikut formula:

- - nilai fesyen

- - had bawah selang modal

- - nilai selang

- - kekerapan selang modal

- - kekerapan selang sebelum modal

- - kekerapan selang mengikut modal

Median - ini ialah nilai ciri yang mendasari siri kedudukan dan membahagikan siri ini kepada dua bahagian yang sama bilangannya.

Untuk menentukan median dalam siri diskret dengan kehadiran frekuensi, mula-mula hitung separuh jumlah frekuensi , dan kemudian tentukan nilai varian yang jatuh padanya. (Jika baris yang diisih mengandungi bilangan ciri ganjil, maka nombor median dikira dengan formula:

M e \u003d (n (bilangan ciri dalam agregat) + 1) / 2,

dalam kes bilangan ciri genap, median akan sama dengan purata dua ciri di tengah baris).

Apabila mengira median untuk siri variasi selang, mula-mula tentukan selang median di mana median terletak, dan kemudian nilai median mengikut formula:

- ialah median yang dikehendaki

- ialah sempadan bawah selang yang mengandungi median

- - nilai selang

- - jumlah frekuensi atau bilangan ahli siri

Jumlah kekerapan terkumpul selang sebelum median

- ialah kekerapan selang median

Contoh. Cari mod dan median.

Penyelesaian:
Dalam contoh ini, selang modal adalah dalam kumpulan umur 25-30 tahun, kerana selang ini menyumbang kepada kekerapan tertinggi (1054).

Mari kita hitung nilai mod:

Ini bermakna umur mod pelajar ialah 27 tahun.

Kira median. Selang median adalah dalam kumpulan umur 25-30 tahun, kerana dalam selang ini terdapat varian yang membahagikan populasi kepada dua bahagian yang sama (Σf i /2 = 3462/2 = 1731). Seterusnya, kami menggantikan data berangka yang diperlukan ke dalam formula dan mendapatkan nilai median:

Ini bermakna separuh daripada pelajar berumur di bawah 27.4 tahun, dan separuh lagi berumur lebih daripada 27.4 tahun.

Sebagai tambahan kepada mod dan median, penunjuk seperti kuartil boleh digunakan, membahagikan siri kedudukan kepada 4 bahagian yang sama, desil- 10 bahagian dan persentil - setiap 100 bahagian.

Konsep pemerhatian terpilih dan skopnya.

Pemerhatian terpilih terpakai apabila menggunakan pemerhatian berterusan mustahil secara fizikal disebabkan oleh sejumlah besar data atau tidak praktikal dari segi ekonomi. Ketidakmungkinan fizikal berlaku, sebagai contoh, apabila mengkaji aliran penumpang, harga pasaran, belanjawan keluarga. Ketidakupayaan ekonomi berlaku apabila menilai kualiti barangan yang berkaitan dengan kemusnahannya, contohnya, mengecap, menguji kekuatan batu bata, dsb.

Unit statistik yang dipilih untuk pemerhatian membentuk sampel atau sampel, dan keseluruhan tatasusunannya - populasi umum (GS). Dalam kes ini, bilangan unit dalam sampel menandakan n, dan dalam keseluruhan HS - N. Sikap n/n dipanggil saiz relatif atau bahagian sampel.

Kualiti keputusan persampelan bergantung pada keterwakilan sampel, iaitu sejauh mana ia mewakili dalam HS. Untuk memastikan keterwakilan sampel, perlu diperhatikan prinsip pemilihan unit secara rawak, yang mengandaikan bahawa kemasukan unit HS dalam sampel tidak boleh dipengaruhi oleh sebarang faktor selain daripada kebetulan.

wujud 4 cara pemilihan rawak untuk sampel:

  1. Sebenarnya rawak pemilihan atau "kaedah lotto", apabila nombor siri diberikan kepada nilai statistik, dimasukkan pada objek tertentu (contohnya, tong), yang kemudiannya dicampur dalam beberapa bekas (contohnya, dalam beg) dan dipilih secara rawak. Dalam amalan, kaedah ini dijalankan menggunakan penjana nombor rawak atau jadual matematik nombor rawak.
  2. mekanikal pemilihan, mengikut mana setiap ( N/n)-nilai populasi umum. Sebagai contoh, jika ia mengandungi 100,000 nilai, dan anda ingin memilih 1,000, maka setiap 100,000 / 1000 = nilai ke-100 akan jatuh ke dalam sampel. Lebih-lebih lagi, jika mereka tidak disenaraikan, maka yang pertama dipilih secara rawak daripada seratus pertama, dan bilangan yang lain akan menjadi seratus lagi. Sebagai contoh, jika nombor unit 19 adalah yang pertama, maka nombor 119 hendaklah seterusnya, kemudian nombor 219, kemudian nombor 319, dan seterusnya. Jika unit populasi disenaraikan, maka #50 dipilih dahulu, kemudian #150, kemudian #250, dan seterusnya.
  3. Pemilihan nilai daripada tatasusunan data heterogen dijalankan berstrata(berstrata), apabila populasi umum sebelum ini dibahagikan kepada kumpulan homogen, yang mana pemilihan rawak atau mekanikal digunakan.
  4. Kaedah persampelan khas ialah bersiri pemilihan, di mana bukan kuantiti individu dipilih secara rawak atau mekanikal, tetapi sirinya (jujukan daripada beberapa nombor kepada beberapa berturut-turut), di mana pemerhatian berterusan dijalankan.

Kualiti pemerhatian sampel juga bergantung kepada jenis pensampelan: berulang atau tidak berulang.

Pada pemilihan semula nilai statistik atau siri mereka yang jatuh ke dalam sampel dikembalikan kepada populasi umum selepas digunakan, mempunyai peluang untuk masuk ke dalam sampel baharu. Pada masa yang sama, semua nilai populasi umum mempunyai kebarangkalian yang sama untuk dimasukkan ke dalam sampel.

Pemilihan tidak berulang bermakna bahawa nilai statistik atau siri mereka yang termasuk dalam sampel tidak dikembalikan kepada populasi umum selepas digunakan, dan oleh itu kebarangkalian untuk masuk ke sampel seterusnya meningkat untuk baki nilai yang terakhir.

Persampelan tidak berulang memberikan hasil yang lebih tepat, jadi ia digunakan lebih kerap. Tetapi terdapat situasi apabila ia tidak boleh digunakan (kajian aliran penumpang, permintaan pengguna, dll.) dan kemudian pemilihan semula dijalankan.

Ralat marginal sampel pemerhatian, ralat purata sampel, susunan di mana ia dikira.

Mari kita pertimbangkan secara terperinci kaedah di atas untuk membentuk populasi sampel dan ralat yang timbul dalam kes ini. keterwakilan .
Sebenarnya-rambang sampel adalah berdasarkan pemilihan unit daripada populasi umum secara rawak tanpa sebarang unsur ketekalan. Secara teknikal, pemilihan rawak yang betul dilakukan dengan membuat undian (contohnya, loteri) atau dengan jadual nombor rawak.

Sebenarnya-pemilihan rawak "dalam bentuk tulennya" dalam amalan pemerhatian terpilih jarang digunakan, tetapi ia adalah pilihan awal antara jenis lain, ia melaksanakan prinsip asas pemerhatian terpilih. Mari kita pertimbangkan beberapa soalan tentang teori kaedah persampelan dan formula ralat untuk sampel rawak mudah.

Ralat pensampelan- ini ialah perbezaan antara nilai parameter dalam populasi umum, dan nilainya dikira daripada hasil pemerhatian sampel. Untuk ciri kuantitatif purata, ralat pensampelan ditentukan oleh

Penunjuk dipanggil ralat pensampelan marginal.
Min sampel ialah pembolehubah rawak yang boleh mengambil nilai yang berbeza bergantung pada unit mana yang terdapat dalam sampel. Oleh itu, ralat pensampelan juga merupakan pembolehubah rawak dan boleh mengambil nilai yang berbeza. Oleh itu, tentukan purata ralat yang mungkin - ralat pensampelan min, yang bergantung kepada:

Saiz sampel: semakin besar bilangannya, semakin kecil ralat purata;

Tahap perubahan sifat yang dikaji: semakin kecil variasi sifat, dan, akibatnya, varians, semakin kecil ralat pensampelan purata.

Pada pemilihan semula secara rawak ralat purata dikira:
.
Dalam amalan, varians am tidak diketahui dengan tepat, tetapi dalam teori kebarangkalian membuktikan itu
.
Oleh kerana nilai untuk n yang cukup besar adalah hampir kepada 1, kita boleh mengandaikan bahawa . Kemudian ralat pensampelan min boleh dikira:
.
Tetapi dalam kes sampel kecil (untuk n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Pada persampelan rawak formula yang diberikan dibetulkan oleh nilai . Maka ralat purata bukan persampelan ialah:
dan .
Kerana sentiasa kurang daripada , maka faktor () sentiasa kurang daripada 1. Ini bermakna ralat purata dalam pemilihan tidak berulang sentiasa kurang daripada pemilihan berulang.
Persampelan mekanikal digunakan apabila populasi umum disusun dalam beberapa cara (contohnya, senarai pemilih dalam susunan abjad, nombor telefon, nombor rumah, pangsapuri). Pemilihan unit dijalankan pada selang waktu tertentu, yang sama dengan timbal balik peratusan sampel. Jadi, dengan sampel 2%, setiap 50 unit = 1 / 0.02 dipilih, dengan 5%, setiap 1 / 0.05 = 20 unit populasi umum.

Asal dipilih dengan cara yang berbeza: secara rawak, dari tengah selang, dengan perubahan dalam asal. Perkara utama adalah untuk mengelakkan kesilapan sistematik. Sebagai contoh, dengan sampel 5%, jika ke-13 dipilih sebagai unit pertama, maka 33, 53, 73, dsb.

Dari segi ketepatan, pemilihan mekanikal hampir dengan persampelan rawak yang betul. Oleh itu, untuk menentukan ralat purata persampelan mekanikal, formula pemilihan rawak yang betul digunakan.

Pada pemilihan tipikal populasi yang dikaji terlebih dahulu dibahagikan kepada kumpulan jenis tunggal yang homogen. Sebagai contoh, apabila meninjau perusahaan, ini boleh menjadi industri, sub-sektor, sambil mengkaji populasi - kawasan, sosial atau kumpulan umur. Kemudian pemilihan bebas dibuat daripada setiap kumpulan secara mekanikal atau rawak yang betul.

Persampelan biasa memberikan hasil yang lebih tepat daripada kaedah lain. Penjenisan populasi umum memastikan perwakilan setiap kumpulan tipologi dalam sampel, yang memungkinkan untuk mengecualikan pengaruh varians antara kumpulan pada ralat sampel purata. Oleh itu, apabila mencari ralat sampel biasa mengikut peraturan penambahan varians (), adalah perlu untuk mengambil kira purata varians kumpulan sahaja. Kemudian ralat pensampelan min ialah:
dalam pemilihan semula
,
dengan pemilihan tidak berulang
,
di mana ialah min bagi varians dalam kumpulan dalam sampel.

Pemilihan bersiri (atau bersarang). digunakan apabila populasi dibahagikan kepada siri atau kumpulan sebelum permulaan tinjauan sampel. Siri ini boleh menjadi pakej produk siap, kumpulan pelajar, pasukan. Siri untuk peperiksaan dipilih secara mekanikal atau rawak, dan dalam siri tinjauan lengkap unit dijalankan. Oleh itu, ralat pensampelan purata hanya bergantung pada varians antara kumpulan (interseri), yang dikira dengan formula:

di mana r ialah bilangan siri yang dipilih;
- purata siri ke-i.

Ralat pensampelan bersiri purata dikira:

apabila dipilih semula:
,
dengan pemilihan tidak berulang:
,
di mana R ialah jumlah bilangan siri.

digabungkan pemilihan adalah gabungan kaedah pemilihan yang dipertimbangkan.

Ralat pensampelan purata untuk mana-mana kaedah pemilihan bergantung terutamanya pada saiz mutlak sampel dan, pada tahap yang lebih rendah, pada peratusan sampel. Katakan 225 pemerhatian dibuat dalam kes pertama daripada populasi 4,500 unit dan dalam kes kedua, daripada 225,000 unit. Varians dalam kedua-dua kes adalah sama dengan 25. Kemudian, dalam kes pertama, dengan pemilihan 5%, ralat pensampelan ialah:

Dalam kes kedua, dengan pemilihan 0.1%, ia akan sama dengan:


Dengan cara ini, dengan penurunan peratusan sampel sebanyak 50 kali, ralat sampel meningkat sedikit, kerana saiz sampel tidak berubah.
Andaikan saiz sampel ditambah kepada 625 cerapan. Dalam kes ini, ralat pensampelan ialah:

Peningkatan sampel sebanyak 2.8 kali dengan saiz populasi umum yang sama mengurangkan saiz ralat pensampelan sebanyak lebih daripada 1.6 kali.

Kaedah dan cara membentuk populasi sampel.

Dalam statistik, pelbagai kaedah membentuk set sampel digunakan, yang ditentukan oleh objektif kajian dan bergantung kepada spesifik objek kajian.

Syarat utama untuk menjalankan tinjauan sampel adalah untuk mengelakkan berlakunya ralat sistematik yang timbul daripada pelanggaran prinsip peluang sama rata bagi setiap unit populasi umum untuk memasuki sampel. Pencegahan kesilapan sistematik dicapai hasil daripada penggunaan kaedah berasaskan saintifik untuk pembentukan populasi sampel.

Terdapat cara berikut untuk memilih unit daripada populasi umum:

1) pemilihan individu - unit individu dipilih dalam sampel;

2) pemilihan kumpulan - kumpulan homogen secara kualitatif atau siri unit yang dikaji jatuh ke dalam sampel;

3) pemilihan gabungan adalah gabungan pemilihan individu dan kumpulan.
Kaedah pemilihan ditentukan oleh peraturan untuk pembentukan populasi persampelan.

Sampel boleh:

  • rawak yang betul terdiri daripada fakta bahawa sampel terbentuk akibat pemilihan rawak (tidak disengajakan) unit individu daripada populasi umum. Dalam kes ini, bilangan unit yang dipilih dalam set sampel biasanya ditentukan berdasarkan perkadaran sampel yang diterima. Bahagian sampel ialah nisbah bilangan unit dalam populasi sampel n kepada bilangan unit dalam populasi umum N, i.e.
  • mekanikal terdiri daripada fakta bahawa pemilihan unit dalam sampel dibuat daripada populasi umum, dibahagikan kepada selang yang sama (kumpulan). Dalam kes ini, saiz selang dalam populasi umum adalah sama dengan timbal balik bahagian sampel. Jadi, dengan sampel 2%, setiap unit ke-50 dipilih (1:0.02), dengan sampel 5%, setiap unit ke-20 (1:0.05), dsb. Oleh itu, mengikut perkadaran pemilihan yang diterima, populasi umum, seolah-olah, dibahagikan secara mekanikal kepada kumpulan yang sama. Hanya satu unit dipilih daripada setiap kumpulan dalam sampel.
  • tipikal - di mana populasi umum mula-mula dibahagikan kepada kumpulan tipikal homogen. Kemudian, daripada setiap kumpulan biasa, pemilihan unit individu ke dalam sampel dibuat oleh sampel rawak atau mekanikal. Ciri penting sampel biasa ialah ia memberikan hasil yang lebih tepat berbanding kaedah lain untuk memilih unit dalam sampel;
  • bersiri- di mana populasi umum dibahagikan kepada kumpulan yang sama saiz - siri. Siri dipilih dalam set sampel. Dalam siri ini, pemerhatian berterusan unit yang jatuh ke dalam siri dijalankan;
  • digabungkan- persampelan boleh menjadi dua peringkat. Dalam kes ini, penduduk umum mula-mula dibahagikan kepada kumpulan. Kemudian kumpulan dipilih, dan dalam kumpulan yang terakhir, unit individu dipilih.

Dalam statistik, kaedah berikut untuk memilih unit dalam sampel dibezakan::

  • satu peringkat sampel - setiap unit yang dipilih serta-merta tertakluk kepada kajian atas dasar tertentu (sebenarnya sampel rawak dan bersiri);
  • berbilang peringkat persampelan - pemilihan dibuat daripada populasi umum kumpulan individu, dan unit individu dipilih daripada kumpulan (sampel tipikal dengan kaedah mekanikal untuk memilih unit dalam populasi sampel).

Selain itu, terdapat:

  • pemilihan semula- mengikut skema bola yang dikembalikan. Dalam kes ini, setiap unit atau siri yang telah jatuh ke dalam sampel dikembalikan kepada populasi umum dan oleh itu mempunyai peluang untuk dimasukkan ke dalam sampel semula;
  • pemilihan tidak berulang- mengikut skema bola yang tidak dipulangkan. Ia mempunyai hasil yang lebih tepat untuk saiz sampel yang sama.

Penentuan saiz sampel yang diperlukan (menggunakan jadual Pelajar).

Salah satu prinsip saintifik dalam teori persampelan ialah memastikan bilangan unit yang mencukupi dipilih. Secara teorinya, keperluan untuk mematuhi prinsip ini dibentangkan dalam bukti teorem had teori kebarangkalian, yang membolehkan anda menentukan bilangan unit yang harus dipilih daripada populasi umum supaya ia mencukupi dan memastikan keterwakilan sampel.

Pengurangan dalam ralat piawai sampel, dan, akibatnya, peningkatan ketepatan anggaran sentiasa dikaitkan dengan peningkatan dalam saiz sampel, oleh itu, sudah pada peringkat menganjurkan pemerhatian sampel, adalah perlu untuk membuat keputusan. apakah saiz sampel yang sepatutnya bagi memastikan ketepatan keputusan pemerhatian yang diperlukan. Pengiraan saiz sampel yang diperlukan dibina menggunakan formula yang diperoleh daripada formula untuk ralat pensampelan marginal (A), sepadan dengan satu atau lain jenis dan kaedah pemilihan. Jadi, untuk saiz sampel berulang rawak (n), kita ada:

Intipati formula ini ialah dengan pemilihan semula secara rawak bagi nombor yang diperlukan, saiz sampel adalah berkadar terus dengan kuasa dua pekali keyakinan (t2) dan varians ciri variasi (?2) dan berkadar songsang dengan kuasa dua ralat pensampelan marginal (?2). Khususnya, dengan menggandakan ralat marginal, saiz sampel yang diperlukan boleh dikurangkan dengan faktor empat. Daripada tiga parameter tersebut, dua (t dan?) ditetapkan oleh pengkaji.

Pada masa yang sama, penyelidik Untuk tujuan tinjauan sampel, persoalan harus diputuskan: dalam kombinasi kuantitatif apakah lebih baik untuk memasukkan parameter ini untuk memberikan varian yang optimum? Dalam satu kes, dia mungkin lebih berpuas hati dengan kebolehpercayaan keputusan yang diperolehi (t) berbanding dengan ukuran ketepatan (?), dalam yang lain - sebaliknya. Adalah lebih sukar untuk menyelesaikan isu berkenaan nilai ralat pensampelan marginal, kerana penyelidik tidak mempunyai penunjuk ini pada peringkat mereka bentuk pemerhatian sampel, oleh itu, dalam amalan, adalah lazim untuk menetapkan ralat pensampelan marginal, sebagai peraturan, dalam lingkungan 10% daripada tahap purata sifat yang dijangkakan. Mewujudkan tahap purata andaian boleh didekati dengan cara yang berbeza: menggunakan data daripada tinjauan sebelumnya yang serupa, atau menggunakan data daripada bingkai pensampelan dan mengambil sampel perintis kecil.

Perkara yang paling sukar untuk ditetapkan semasa mereka bentuk pemerhatian sampel ialah parameter ketiga dalam formula (5.2) - varians populasi sampel. Dalam kes ini, adalah perlu untuk menggunakan semua maklumat yang tersedia untuk penyiasat, yang diperoleh daripada tinjauan serupa dan perintis sebelumnya.

Soalan definisi Saiz sampel yang diperlukan menjadi lebih rumit jika tinjauan sampel melibatkan kajian beberapa ciri unit persampelan. Dalam kes ini, tahap purata bagi setiap ciri dan variasi mereka, sebagai peraturan, adalah berbeza, dan oleh itu adalah mungkin untuk memutuskan penyebaran mana satu ciri yang perlu diberi keutamaan untuk hanya mengambil kira tujuan dan objektif tinjauan itu.

Apabila mereka bentuk pemerhatian sampel, nilai yang telah ditetapkan bagi ralat persampelan yang dibenarkan diandaikan selaras dengan objektif kajian tertentu dan kebarangkalian kesimpulan berdasarkan hasil pemerhatian.

Secara umum, formula untuk ralat marginal nilai min sampel membolehkan anda menentukan:

Besarnya kemungkinan sisihan penunjuk populasi umum daripada penunjuk populasi sampel;

Saiz sampel yang diperlukan, memberikan ketepatan yang diperlukan, di mana had ralat yang mungkin tidak akan melebihi nilai tertentu yang ditentukan;

Kebarangkalian bahawa ralat dalam sampel akan mempunyai had yang diberikan.

Agihan pelajar dalam teori kebarangkalian, ia adalah keluarga satu parameter bagi taburan berterusan mutlak.

Siri dinamik (selang waktu, momen), penutupan siri dinamik.

Siri dinamik- ini adalah nilai penunjuk statistik yang dibentangkan dalam urutan kronologi tertentu.

Setiap siri masa mengandungi dua komponen:

1) penunjuk tempoh masa (tahun, suku tahun, bulan, hari atau tarikh);

2) penunjuk mencirikan objek yang dikaji untuk tempoh masa atau pada tarikh yang sepadan, yang dipanggil tahap siri.

Tahap siri ini dinyatakan nilai mutlak dan purata atau relatif. Bergantung pada sifat penunjuk, siri dinamik nilai mutlak, relatif dan purata dibina. Siri dinamik nilai relatif dan purata dibina berdasarkan siri terbitan nilai mutlak. Terdapat siri selang dan momen dinamik.

Siri selang dinamik mengandungi nilai penunjuk untuk tempoh masa tertentu. Dalam siri selang, tahap boleh disimpulkan, mendapatkan isipadu fenomena untuk tempoh yang lebih lama, atau yang dipanggil jumlah terkumpul.

Siri detik dinamik mencerminkan nilai penunjuk pada masa tertentu (tarikh masa). Dalam siri detik, penyelidik mungkin hanya berminat dengan perbezaan fenomena, mencerminkan perubahan dalam tahap siri antara tarikh tertentu, kerana jumlah tahap di sini tidak mempunyai kandungan sebenar. Jumlah kumulatif tidak dikira di sini.

Syarat yang paling penting untuk pembinaan siri dinamik yang betul ialah kebolehbandingan tahap siri yang berkaitan dengan tempoh yang berbeza. Tahap harus dibentangkan dalam kuantiti homogen, harus ada kesempurnaan liputan yang sama dari pelbagai bahagian fenomena.

Kepada Untuk mengelakkan penyelewengan dinamik sebenar, pengiraan awal dijalankan dalam kajian statistik (penutupan siri masa), yang mendahului analisis statistik siri masa. Penutupan siri masa difahamkan sebagai gabungan dua atau lebih siri menjadi satu siri, tahap yang dikira mengikut metodologi yang berbeza atau tidak sepadan dengan sempadan wilayah, dsb. Penutupan siri dinamik juga mungkin membayangkan pengurangan tahap mutlak siri dinamik kepada asas yang sama, yang menghapuskan ketidakserasian tahap siri dinamik.

Konsep kebolehbandingan siri masa, pekali, pertumbuhan dan kadar pertumbuhan.

Siri dinamik- ini adalah siri penunjuk statistik yang mencirikan perkembangan fenomena semula jadi dan sosial dalam masa. Koleksi statistik yang diterbitkan oleh Jawatankuasa Statistik Negeri Rusia mengandungi sejumlah besar siri masa dalam bentuk jadual. Siri dinamik membolehkan mendedahkan corak perkembangan fenomena yang dikaji.

Siri masa mengandungi dua jenis penunjuk. Penunjuk masa(tahun, suku tahun, bulan, dsb.) atau titik masa (pada awal tahun, pada awal setiap bulan, dsb.). Penunjuk aras baris. Penunjuk tahap siri masa boleh dinyatakan dalam nilai mutlak (pengeluaran produk dalam tan atau rubel), nilai relatif (bahagian penduduk bandar dalam%) dan nilai purata (gaji purata pekerja industri mengikut tahun, dsb.). Dalam bentuk jadual, siri masa mengandungi dua lajur atau dua baris.

Pembinaan siri masa yang betul melibatkan pemenuhan beberapa keperluan:

  1. semua penunjuk bagi satu siri dinamik mestilah dibuktikan secara saintifik, boleh dipercayai;
  2. penunjuk bagi satu siri dinamik harus setanding dalam masa, i.e. mesti dikira untuk tempoh masa yang sama atau pada tarikh yang sama;
  3. penunjuk beberapa dinamik harus setanding di seluruh wilayah;
  4. penunjuk bagi satu siri dinamik hendaklah setanding dalam kandungan, i.e. dikira mengikut metodologi tunggal, dengan cara yang sama;
  5. penunjuk siri dinamik harus setanding merentasi julat ladang yang dipertimbangkan. Semua penunjuk bagi satu siri dinamik hendaklah diberikan dalam unit ukuran yang sama.

Penunjuk statistik boleh mencirikan sama ada hasil proses yang dikaji dalam tempoh masa, atau keadaan fenomena yang dikaji pada masa tertentu, i.e. penunjuk boleh selang (berkala) dan segera. Oleh itu, pada mulanya siri dinamik boleh sama ada selang atau momen. Siri momen dinamik pula boleh dengan selang masa yang sama dan tidak sama.

Siri awal dinamik boleh ditukar kepada satu siri nilai purata dan satu siri nilai relatif (rantai dan asas). Siri masa sedemikian dipanggil siri masa terbitan.

Kaedah pengiraan tahap purata dalam siri dinamik adalah berbeza, disebabkan oleh jenis siri dinamik. Menggunakan contoh, pertimbangkan jenis siri masa dan formula untuk mengira tahap purata.

Keuntungan mutlak (Δy) menunjukkan berapa banyak unit tahap berikutnya siri telah berubah berbanding dengan yang sebelumnya (lajur 3. - kenaikan mutlak rantai) atau dibandingkan dengan tahap awal (lajur 4. - kenaikan mutlak asas). Formula pengiraan boleh ditulis seperti berikut:

Dengan penurunan dalam nilai mutlak siri, akan ada "penurunan", "penurunan", masing-masing.

Petunjuk pertumbuhan mutlak menunjukkan bahawa, sebagai contoh, pada tahun 1998 pengeluaran produk "A" meningkat sebanyak 4,000 tan berbanding tahun 1997, dan sebanyak 34,000 tan berbanding tahun 1994; untuk tahun lain, lihat jadual. 11.5 gr. 3 dan 4.

Faktor pertumbuhan menunjukkan berapa kali tahap siri telah berubah berbanding sebelumnya (lajur 5 - faktor pertumbuhan atau penurunan rantai) atau dibandingkan dengan tahap awal (lajur 6 - faktor pertumbuhan atau penurunan asas). Formula pengiraan boleh ditulis seperti berikut:

Kadar pertumbuhan tunjukkan berapa peratus tahap seterusnya siri dibandingkan dengan yang sebelumnya (lajur 7 - kadar pertumbuhan rantai) atau dibandingkan dengan tahap awal (lajur 8 - kadar pertumbuhan asas). Formula pengiraan boleh ditulis seperti berikut:

Jadi, sebagai contoh, pada tahun 1997, jumlah pengeluaran produk "A" berbanding tahun 1996 ialah 105.5% (

Kadar pertumbuhan menunjukkan berapa peratus tahap tempoh pelaporan meningkat berbanding sebelumnya (lajur 9 - kadar pertumbuhan rantai) atau dibandingkan dengan tahap awal (lajur 10 - kadar pertumbuhan asas). Formula pengiraan boleh ditulis seperti berikut:

T pr \u003d T p - 100% atau T pr \u003d peningkatan / tahap mutlak tempoh sebelumnya * 100%

Jadi, sebagai contoh, pada tahun 1996, berbanding tahun 1995, produk "A" dihasilkan lebih banyak sebanyak 3.8% (103.8% - 100%) atau (8:210) x 100%, dan berbanding dengan 1994. - sebanyak 9% ( 109% - 100%).

Jika tahap mutlak dalam siri menurun, maka kadarnya akan kurang daripada 100% dan, dengan itu, akan ada kadar penurunan (kadar pertumbuhan dengan tanda tolak).

Nilai mutlak peningkatan 1%.(lajur 11) menunjukkan berapa banyak unit mesti dihasilkan dalam tempoh tertentu supaya tahap tempoh sebelumnya meningkat sebanyak 1%. Dalam contoh kami, pada tahun 1995 adalah perlu untuk menghasilkan 2.0 ribu tan, dan pada tahun 1998 - 2.3 ribu tan, i.e. lebih besar.

Terdapat dua cara untuk menentukan magnitud nilai mutlak pertumbuhan 1%:

Bahagikan tahap tempoh sebelumnya dengan 100;

Bahagikan kadar pertumbuhan rantaian mutlak dengan kadar pertumbuhan rantaian yang sepadan.

Nilai mutlak peningkatan 1% =

Dalam dinamik, terutamanya dalam tempoh yang panjang, adalah penting untuk bersama-sama menganalisis kadar pertumbuhan dengan kandungan setiap peningkatan atau penurunan peratusan.

Ambil perhatian bahawa metodologi yang dipertimbangkan untuk menganalisis siri masa adalah terpakai untuk siri masa, tahap yang dinyatakan dalam nilai mutlak (t, ribu rubel, bilangan pekerja, dll.), dan untuk siri masa, tahap yang dinyatakan dalam penunjuk relatif (% sekerap , % kandungan abu arang batu, dsb.) atau nilai purata (purata hasil dalam c/ha, purata upah, dsb.).

Bersama-sama dengan penunjuk analisis yang dipertimbangkan yang dikira untuk setiap tahun berbanding dengan tahap sebelumnya atau awal, apabila menganalisis siri masa, adalah perlu untuk mengira purata penunjuk analisis untuk tempoh tersebut: tahap purata siri, purata peningkatan mutlak tahunan (penurunan) dan purata kadar pertumbuhan tahunan dan kadar pertumbuhan.

Kaedah untuk mengira tahap purata bagi satu siri dinamik telah dibincangkan di atas. Dalam siri selang dinamik yang sedang kita pertimbangkan, tahap purata siri dikira dengan rumus min aritmetik mudah:

Purata keluaran tahunan produk untuk 1994-1998. berjumlah 218.4 ribu tan.

Purata kenaikan mutlak tahunan juga dikira dengan formula min aritmetik mudah:

Kenaikan mutlak tahunan berubah-ubah sepanjang tahun dari 4 hingga 12 ribu tan (lihat gr. 3), dan purata peningkatan tahunan dalam pengeluaran untuk tempoh 1995 - 1998. berjumlah 8.5 ribu tan.

Kaedah untuk mengira kadar pertumbuhan purata dan kadar pertumbuhan purata memerlukan pertimbangan yang lebih terperinci. Mari kita pertimbangkan mereka pada contoh penunjuk tahunan tahap siri yang diberikan dalam jadual.

Tahap pertengahan julat dinamik.

Siri dinamik (atau siri masa)- ini ialah nilai berangka penunjuk statistik tertentu pada momen atau tempoh masa berturut-turut (iaitu disusun dalam susunan kronologi).

Nilai berangka penunjuk statistik tertentu yang membentuk satu siri dinamik dipanggil peringkat sesuatu nombor dan biasanya dilambangkan dengan huruf y. Ahli pertama siri ini y 1 dipanggil awal atau garis dasar, dan yang terakhir y n - muktamad. Detik atau tempoh masa yang dirujuk tahap ditandakan dengan t.

Siri dinamik, sebagai peraturan, dibentangkan dalam bentuk jadual atau graf, dan skala masa dibina di sepanjang paksi-x t, dan sepanjang ordinat - skala tahap siri y.

Penunjuk purata bagi satu siri dinamik

Setiap siri dinamik boleh dianggap sebagai set tertentu n penunjuk perubahan masa yang boleh diringkaskan sebagai purata. Penunjuk umum (purata) sedemikian amat diperlukan apabila membandingkan perubahan dalam satu atau penunjuk lain dalam tempoh yang berbeza, di negara yang berbeza, dsb.

Ciri umum siri dinamik boleh, pertama sekali, tahap baris purata. Kaedah pengiraan aras purata bergantung kepada sama ada siri momen atau siri selang (tempoh).

Bila selang waktu siri, tahap puratanya ditentukan oleh formula min aritmetik mudah tahap siri, i.e.

=
Jika ada seketika baris yang mengandungi n peringkat ( y1, y2, …, yn) dengan selang yang sama antara tarikh (titik masa), maka siri sedemikian boleh dengan mudah ditukar kepada satu siri nilai purata. Pada masa yang sama, penunjuk (tahap) pada permulaan setiap tempoh adalah serentak penunjuk pada akhir tempoh sebelumnya. Kemudian nilai purata penunjuk untuk setiap tempoh (selang antara tarikh) boleh dikira sebagai separuh jumlah nilai di pada awal dan akhir tempoh, i.e. bagaimana . Bilangan purata tersebut ialah . Seperti yang dinyatakan sebelum ini, untuk siri purata, tahap purata dikira daripada purata aritmetik.

Oleh itu, kita boleh menulis:
.
Selepas menukar pengangka, kita dapat:
,

di mana Y1 dan Yn- peringkat pertama dan terakhir siri ini; Yi- peringkat pertengahan.

Purata ini dikenali dalam statistik sebagai purata kronologi untuk siri detik. Dia menerima nama ini daripada perkataan "cronos" (masa, lat.), kerana ia dikira daripada penunjuk yang berubah dari semasa ke semasa.

Dalam kes tidak sama rata selang antara tarikh, purata kronologi untuk siri momen boleh dikira sebagai purata aritmetik bagi nilai purata tahap untuk setiap pasangan momen, ditimbang dengan jarak (selang masa) antara tarikh, i.e.
.
Dalam kes ini diandaikan bahawa dalam selang antara tarikh tahap mengambil nilai yang berbeza, dan kami adalah daripada dua yang diketahui ( yi dan yi+1) kami menentukan purata, daripada mana kami kemudian mengira purata keseluruhan untuk keseluruhan tempoh yang dianalisis.
Jika diandaikan bahawa setiap nilai yi kekal tidak berubah sehingga seterusnya (i+ 1)- detik ke-, i.e. tarikh sebenar perubahan tahap diketahui, maka pengiraan boleh dijalankan menggunakan formula min aritmetik berwajaran:
,

di manakah masa di mana tahap kekal tidak berubah.

Sebagai tambahan kepada tahap purata dalam siri dinamik, penunjuk purata lain juga dikira - purata perubahan dalam tahap siri (kaedah asas dan rantai), kadar purata perubahan.

Garis asas bermaksud perubahan mutlak ialah hasil bagi perubahan mutlak asas terakhir dibahagikan dengan bilangan perubahan. Itu dia

Rantai bermaksud perubahan mutlak peringkat siri ialah hasil bagi membahagikan jumlah semua perubahan mutlak rantaian dengan bilangan perubahan, i.e.

Dengan tanda purata perubahan mutlak, sifat perubahan dalam fenomena juga dinilai secara purata: pertumbuhan, penurunan atau kestabilan.

Daripada peraturan untuk mengawal perubahan mutlak asas dan rantaian, ia mengikut bahawa perubahan asas dan purata rantaian mestilah sama.

Bersama-sama dengan purata perubahan mutlak, purata relatif juga dikira menggunakan kaedah asas dan rantaian.

Perubahan Relatif Purata Garis Dasar ditentukan oleh formula:

Rantai bermaksud perubahan relatif ditentukan oleh formula:

Sememangnya, perubahan relatif asas dan purata rantaian harus sama, dan dengan membandingkannya dengan nilai kriteria 1, kesimpulan dibuat tentang sifat perubahan dalam fenomena secara purata: pertumbuhan, penurunan atau kestabilan.
Dengan menolak 1 daripada asas atau purata rantaian perubahan relatif, yang sepadan kadar purata perubahan, dengan tanda yang mana seseorang juga boleh menilai sifat perubahan dalam fenomena yang dikaji, yang dicerminkan oleh siri dinamik ini.

Turun naik bermusim dan indeks bermusim.

Turun naik bermusim ialah turun naik intra tahunan yang stabil.

Prinsip asas mengurus untuk mendapatkan kesan maksimum ialah memaksimumkan pendapatan dan meminimumkan kos. Dengan mengkaji turun naik bermusim, masalah persamaan maksimum dalam setiap peringkat tahun diselesaikan.

Apabila mengkaji turun naik bermusim, dua tugas yang saling berkaitan diselesaikan:

1. Pengenalpastian spesifik perkembangan fenomena dalam dinamik intra-tahunan;

2. Pengukuran turun naik bermusim dengan pembinaan model gelombang bermusim;

Ayam belanda bermusim biasanya dikira untuk mengukur kemusim. Secara umum, ia ditentukan oleh nisbah persamaan asal bagi satu siri dinamik kepada persamaan teori yang berfungsi sebagai asas untuk perbandingan.

Oleh kerana sisihan rawak ditumpangkan pada turun naik bermusim, indeks bermusim dipuratakan untuk menghapuskannya.

Dalam kes ini, untuk setiap tempoh kitaran tahunan, penunjuk umum ditentukan dalam bentuk purata indeks bermusim:

Indeks purata turun naik bermusim adalah bebas daripada pengaruh sisihan rawak arah aliran pembangunan utama.

Bergantung pada sifat arah aliran, formula untuk indeks purata bermusim boleh mengambil bentuk berikut:

1.Untuk siri dinamik intra-tahunan dengan trend pembangunan utama yang ketara:

2. Untuk siri dinamik intra-tahunan yang tiada aliran menaik atau menurun, atau tidak ketara:

Di manakah purata am;

Kaedah untuk menganalisis arah aliran utama.

Perkembangan fenomena dari semasa ke semasa dipengaruhi oleh faktor yang berbeza sifat dan kekuatan pengaruh. Sebahagian daripada mereka adalah secara rawak, yang lain mempunyai kesan yang hampir berterusan dan membentuk trend pembangunan tertentu dalam siri dinamik.

Tugas penting statistik adalah untuk mengenal pasti arah aliran dalam siri dinamik, dibebaskan daripada tindakan pelbagai faktor rawak. Untuk tujuan ini, siri masa diproses dengan kaedah pembesaran selang, purata bergerak dan penjajaran analitik, dsb.

Kaedah pengasar selang adalah berdasarkan pembesaran tempoh masa, yang merangkumi tahap satu siri dinamik, i.e. ialah penggantian data yang berkaitan dengan tempoh masa yang kecil dengan data dari tempoh yang lebih besar. Ia amat berkesan apabila tahap awal siri adalah untuk jangka masa yang singkat. Contohnya, siri penunjuk yang berkaitan dengan acara harian digantikan dengan siri yang berkaitan dengan mingguan, bulanan, dsb. Ini akan ditunjukkan dengan lebih jelas "Paksi Perkembangan Fenomena". Purata, dikira berdasarkan selang yang diperbesarkan, memungkinkan untuk mengenal pasti arah dan watak (pecutan pertumbuhan atau nyahpecutan) arah aliran pembangunan utama.

kaedah purata bergerak serupa dengan yang sebelumnya, tetapi dalam kes ini, tahap sebenar digantikan dengan tahap purata yang dikira untuk selang pembesaran bergerak (gelongsor) berturut-turut meliputi m peringkat baris.

Sebagai contoh jika diterima m=3, kemudian, pertama, purata tiga peringkat pertama siri dikira, kemudian - dari bilangan tahap yang sama, tetapi bermula dari yang kedua berturut-turut, kemudian - bermula dari yang ketiga, dsb. Oleh itu, purata, seolah-olah, "slaid" sepanjang siri dinamik, bergerak untuk satu tempoh. Dikira daripada m ahli purata bergerak merujuk kepada pertengahan (tengah) setiap selang.

Kaedah ini hanya menghapuskan turun naik rawak. Jika siri ini mempunyai gelombang bermusim, maka ia akan kekal selepas melicinkan dengan kaedah purata bergerak.

Penjajaran analitikal. Untuk menghapuskan turun naik rawak dan mengenal pasti arah aliran, tahap siri itu diselaraskan mengikut formula analitikal (atau penjajaran analitikal). Intipatinya adalah untuk menggantikan tahap empirikal (sebenar) dengan tahap teori, yang dikira mengikut persamaan tertentu, diambil sebagai model matematik trend, di mana tahap teori dianggap sebagai fungsi masa: . Dalam kes ini, setiap tahap sebenar dianggap sebagai jumlah dua komponen: , di mana ialah komponen sistematik dan dinyatakan oleh persamaan tertentu, dan merupakan pembolehubah rawak yang menyebabkan turun naik di sekitar arah aliran.

Tugas penjajaran analisis adalah seperti berikut:

1. Menentukan berdasarkan data sebenar jenis fungsi hipotetikal yang paling mencukupi menggambarkan arah aliran pembangunan penunjuk yang dikaji.

2. Mencari parameter fungsi (persamaan) yang ditentukan daripada data empirikal

3. Pengiraan mengikut persamaan tahap teori (bertingkat) yang ditemui.

Pilihan fungsi tertentu dijalankan, sebagai peraturan, berdasarkan perwakilan grafik data empirikal.

Model-model tersebut ialah persamaan regresi, yang parameternya dikira dengan kaedah kuasa dua terkecil

Di bawah ialah persamaan regresi yang paling biasa digunakan untuk meratakan siri masa, menunjukkan arah aliran pembangunan mana yang paling sesuai untuk dicerminkan.

Untuk mencari parameter persamaan di atas, terdapat algoritma khas dan program komputer. Khususnya, untuk mencari parameter persamaan garis lurus, algoritma berikut boleh digunakan:

Jika tempoh atau detik masa dinomborkan supaya St = 0 diperoleh, maka algoritma di atas akan dipermudahkan dengan ketara dan bertukar menjadi

Tahap sejajar pada carta akan terletak pada satu garis lurus yang melepasi pada jarak terdekat dari tahap sebenar siri dinamik ini. Jumlah sisihan kuasa dua adalah pantulan pengaruh faktor rawak.

Dengan bantuannya, kami mengira ralat purata (standard) persamaan:

Di sini n ialah bilangan cerapan, dan m ialah bilangan parameter dalam persamaan (kita mempunyai dua daripadanya - b 1 dan b 0).

Aliran utama (trend) menunjukkan bagaimana faktor sistematik mempengaruhi tahap satu siri dinamik, dan turun naik tahap di sekeliling arah aliran () berfungsi sebagai ukuran kesan faktor baki.

Untuk menilai kualiti model siri masa yang digunakan, ia juga digunakan Ujian F Fisher. Ia adalah nisbah dua varians, iaitu nisbah varians yang disebabkan oleh regresi, i.e. faktor yang dikaji, kepada penyebaran yang disebabkan oleh sebab rawak, i.e. varians baki:

Dalam bentuk yang diperluaskan, formula untuk kriteria ini boleh diwakili seperti berikut:

di mana n ialah bilangan cerapan, i.e. bilangan peringkat baris,

m ialah bilangan parameter dalam persamaan, y ialah tahap sebenar siri,

Tahap sejajar baris, - tahap purata baris.

Lebih berjaya daripada yang lain, model itu mungkin tidak semestinya cukup memuaskan. Ia boleh diiktiraf sedemikian hanya jika kriteria F untuknya melepasi had kritikal tertentu. Sempadan ini ditetapkan menggunakan jadual taburan F.

Intipati dan klasifikasi indeks.

Indeks dalam statistik difahami sebagai penunjuk relatif yang mencirikan perubahan dalam magnitud fenomena dalam masa, ruang, atau perbandingan dengan mana-mana standard.

Elemen utama perhubungan indeks ialah nilai yang diindeks. Nilai diindeks difahami sebagai nilai tanda populasi statistik, yang mana perubahannya adalah objek kajian.

Indeks mempunyai tiga tujuan utama:

1) penilaian perubahan dalam fenomena yang kompleks;

2) penentuan pengaruh faktor individu terhadap perubahan fenomena yang kompleks;

3) perbandingan magnitud beberapa fenomena dengan magnitud tempoh lalu, magnitud wilayah lain, serta dengan piawaian, rancangan, ramalan.

Indeks dikelaskan mengikut 3 kriteria:

2) mengikut tahap liputan unsur-unsur populasi;

3) dengan kaedah pengiraan indeks am.

Mengikut kandungan daripada nilai diindeks, indeks dibahagikan kepada indeks penunjuk kuantitatif (volumetrik) dan indeks penunjuk kualitatif. Indeks penunjuk kuantitatif - indeks volum fizikal pengeluaran perindustrian, volum fizikal jualan, bilangan, dsb. Indeks penunjuk kualitatif - indeks harga, kos, produktiviti buruh, gaji purata, dsb.

Mengikut tahap liputan unit populasi, indeks dibahagikan kepada dua kelas: individu dan umum. Untuk mencirikan mereka, kami memperkenalkan konvensyen berikut yang diterima pakai dalam amalan menggunakan kaedah indeks:

q- kuantiti (isipadu) mana-mana produk dalam jenis ; R- harga seunit pengeluaran; z- kos unit pengeluaran; t- masa yang dibelanjakan untuk pengeluaran unit output (intensiti buruh) ; w- keluaran pengeluaran dari segi nilai seunit masa; v- output dari segi fizikal setiap unit masa; T- jumlah masa yang dibelanjakan atau bilangan pekerja.

Untuk membezakan tempoh atau objek mana nilai yang diindeks milik, adalah kebiasaan untuk meletakkan subskrip selepas simbol yang sepadan di bahagian bawah sebelah kanan. Jadi, sebagai contoh, dalam indeks dinamik, sebagai peraturan, untuk tempoh perbandingan (semasa, pelaporan), subskrip 1 digunakan dan untuk tempoh perbandingan dibuat,

Indeks individu berfungsi untuk mencirikan perubahan dalam elemen individu bagi fenomena kompleks (contohnya, perubahan dalam volum keluaran satu jenis produk). Mereka mewakili nilai relatif dinamik, pemenuhan kewajipan, perbandingan nilai yang diindeks.

Indeks individu volum fizikal pengeluaran ditentukan

Dari sudut analisis, indeks dinamik individu yang diberikan adalah serupa dengan pekali (kadar) pertumbuhan dan mencirikan perubahan dalam nilai diindeks dalam tempoh semasa berbanding dengan asas satu, iaitu menunjukkan berapa kali ia telah meningkat (menurun). ) atau berapa peratus ia adalah pertumbuhan (penurunan). Nilai indeks dinyatakan dalam pekali atau peratusan.

Indeks umum (komposit). mencerminkan perubahan dalam semua elemen fenomena yang kompleks.

Indeks agregat ialah bentuk asas indeks. Ia dipanggil agregat kerana pengangka dan penyebutnya ialah satu set "agregat"

Indeks purata, definisi mereka.

Sebagai tambahan kepada indeks agregat, bentuk lain daripadanya digunakan dalam statistik - indeks purata wajaran. Pengiraan mereka digunakan apabila maklumat yang tersedia tidak membenarkan pengiraan indeks agregat am. Jadi, jika tiada data tentang harga, tetapi terdapat maklumat mengenai kos produk dalam tempoh semasa dan indeks harga individu untuk setiap produk diketahui, maka indeks harga umum tidak boleh ditentukan sebagai satu agregat, tetapi mungkin untuk mengiranya sebagai purata individu. Dengan cara yang sama, jika kuantiti produk individu yang dihasilkan tidak diketahui, tetapi indeks individu dan kos pengeluaran tempoh asas diketahui, maka indeks keseluruhan volum fizikal pengeluaran boleh ditentukan sebagai purata wajaran.

Indeks purata - ini adalah indeks yang dikira sebagai purata indeks individu. Indeks agregat ialah bentuk asas indeks umum, jadi indeks purata mestilah sama dengan indeks agregat. Apabila mengira indeks purata, dua bentuk purata digunakan: aritmetik dan harmonik.

Indeks min aritmetik adalah sama dengan indeks agregat jika pemberat indeks individu adalah sebutan penyebut indeks agregat. Hanya dalam kes ini nilai indeks yang dikira oleh formula min aritmetik akan sama dengan indeks agregat.

Ia ditakrifkan sebagai ciri umum saiz variasi sifat dalam agregat. Ia sama dengan punca kuasa dua kuasa dua purata sisihan nilai individu ciri daripada min aritmetik, i.e. punca dan boleh didapati seperti ini:

1. Untuk baris utama:

2. Untuk siri variasi:

Transformasi formula sisihan piawai membawanya kepada bentuk yang lebih mudah untuk pengiraan praktikal:

Sisihan piawai menentukan berapa banyak, secara purata, pilihan tertentu menyimpang daripada nilai purata mereka, dan selain itu, ia adalah ukuran mutlak turun naik sifat dan dinyatakan dalam unit yang sama dengan pilihan, dan oleh itu ditafsirkan dengan baik.

Contoh mencari sisihan piawai: ,

Untuk ciri alternatif, formula sisihan piawai kelihatan seperti ini:

di mana p ialah bahagian unit dalam populasi yang mempunyai atribut tertentu;

q - bahagian unit yang tidak mempunyai ciri ini.

Konsep sisihan linear min

Sisihan linear purata ditakrifkan sebagai min aritmetik bagi nilai mutlak sisihan pilihan individu daripada .

1. Untuk baris utama:

2. Untuk siri variasi:

di mana hasil tambah n ialah jumlah frekuensi siri variasi.

Contoh mencari sisihan linear purata:

Kelebihan sisihan mutlak min sebagai ukuran serakan ke atas julat variasi adalah jelas, kerana ukuran ini berdasarkan mengambil kira semua sisihan yang mungkin. Tetapi penunjuk ini mempunyai kelemahan yang ketara. Penolakan sewenang-wenangnya tanda-tanda sisihan algebra boleh membawa kepada fakta bahawa sifat matematik penunjuk ini jauh dari asas. Ini sangat merumitkan penggunaan sisihan mutlak min dalam menyelesaikan masalah yang berkaitan dengan pengiraan kebarangkalian.

Oleh itu, sisihan linear purata sebagai ukuran variasi ciri jarang digunakan dalam amalan statistik, iaitu apabila penjumlahan penunjuk tanpa mengambil kira tanda-tanda masuk akal ekonomi. Dengan bantuannya, sebagai contoh, perolehan perdagangan asing, komposisi pekerja, irama pengeluaran, dan lain-lain dianalisis.

punca purata kuasa dua

RMS digunakan, sebagai contoh, untuk mengira saiz purata sisi n bahagian persegi, diameter purata batang, paip, dll. Ia dibahagikan kepada dua jenis.

Purata min kuasa dua adalah mudah. Jika, apabila menggantikan nilai individu sifat dengan nilai purata, adalah perlu untuk mengekalkan jumlah kuasa dua nilai asal tidak berubah, maka purata akan menjadi purata kuadratik.

Ia ialah punca kuasa dua hasil bagi jumlah kuasa dua nilai ciri individu dibahagikan dengan nombornya:

Purata berwajaran kuasa dua dikira dengan formula:

di mana f ialah tanda berat.

Purata kubik

Purata kubik digunakan, sebagai contoh, apabila menentukan purata panjang sisi dan kiub. Ia terbahagi kepada dua jenis.
Purata kubik ringkas:

Apabila mengira nilai min dan serakan dalam siri taburan selang, nilai sebenar atribut digantikan dengan nilai pusat selang, yang berbeza daripada min aritmetik bagi nilai yang disertakan dalam selang waktu. Ini membawa kepada ralat sistematik dalam pengiraan varians. V.F. Sheppard menentukannya ralat dalam pengiraan varians, disebabkan oleh penggunaan data terkumpul, ialah 1/12 kuasa dua nilai selang, kedua-dua ke atas dan ke bawah dalam magnitud varians.

Pindaan Sheppard harus digunakan jika taburan hampir kepada normal, merujuk kepada ciri dengan sifat variasi berterusan, dibina di atas sejumlah besar data awal (n> 500). Walau bagaimanapun, berdasarkan fakta bahawa dalam beberapa kes kedua-dua kesilapan, bertindak dalam arah yang berbeza, mengimbangi satu sama lain, kadang-kadang mungkin untuk menolak untuk memperkenalkan pindaan.

Lebih kecil varians dan sisihan piawai, lebih homogen populasi dan lebih tipikal puratanya.
Dalam amalan statistik, sering kali menjadi perlu untuk membandingkan variasi pelbagai ciri. Sebagai contoh, adalah sangat menarik untuk membandingkan variasi dalam umur pekerja dan kelayakan mereka, tempoh perkhidmatan dan gaji, kos dan keuntungan, tempoh perkhidmatan dan produktiviti buruh, dsb. Untuk perbandingan sedemikian, penunjuk kebolehubahan mutlak ciri adalah tidak sesuai: adalah mustahil untuk membandingkan kebolehubahan pengalaman kerja, dinyatakan dalam tahun, dengan variasi upah, dinyatakan dalam rubel.

Untuk menjalankan perbandingan sedemikian, serta perbandingan turun naik atribut yang sama dalam beberapa populasi dengan min aritmetik yang berbeza, penunjuk relatif variasi digunakan - pekali variasi.

Purata struktur

Untuk mencirikan arah aliran pusat dalam pengagihan statistik, selalunya rasional untuk menggunakan, bersama-sama dengan min aritmetik, nilai tertentu atribut X, yang, disebabkan ciri tertentu lokasinya dalam siri pengedaran, boleh mencirikan tahapnya.

Ini amat penting apabila nilai ekstrem ciri dalam siri pengedaran mempunyai sempadan kabur. Dalam hal ini, penentuan tepat min aritmetik, sebagai peraturan, adalah mustahil atau sangat sukar. Dalam kes sedemikian, tahap purata boleh ditentukan dengan mengambil, sebagai contoh, nilai ciri yang terletak di tengah-tengah siri frekuensi atau yang paling kerap berlaku dalam siri semasa.

Nilai sedemikian hanya bergantung pada sifat frekuensi, iaitu, pada struktur taburan. Ia adalah tipikal dari segi lokasi dalam siri frekuensi, oleh itu nilai tersebut dianggap sebagai ciri pusat pengedaran dan oleh itu telah ditakrifkan sebagai purata struktur. Ia digunakan untuk mengkaji struktur dalaman dan struktur siri taburan nilai atribut. Penunjuk ini termasuk .

Sisihan piawai ialah penunjuk klasik kebolehubahan daripada statistik deskriptif.

Sisihan piawai, sisihan piawai, RMS, sisihan piawai sampel (Sisihan piawai Bahasa Inggeris, STD, STDev) ialah ukuran serakan yang sangat biasa dalam statistik deskriptif. Tapi sebab analisis teknikal adalah serupa dengan statistik, penunjuk ini boleh (dan harus) digunakan dalam analisis teknikal untuk mengesan tahap serakan harga instrumen yang dianalisis dari semasa ke semasa. Ditandakan dengan simbol Yunani Sigma "σ".

Terima kasih kepada Karl Gauss dan Pearson kerana kami mempunyai peluang untuk menggunakan sisihan piawai.

menggunakan sisihan piawai dalam analisis teknikal, kita pusingkan ini "indeks serakan"dalam "penunjuk turun naik“Menyimpan maksud tetapi mengubah istilah.

Apakah Sisihan Piawai

Tetapi sebagai tambahan kepada pengiraan tambahan perantaraan, sisihan piawai agak boleh diterima untuk pengiraan sendiri dan aplikasi dalam analisis teknikal. Seperti yang dinyatakan oleh pembaca aktif burdock majalah kami, " Saya masih tidak faham mengapa RMS tidak termasuk dalam set penunjuk standard pusat urusan domestik«.

sungguh, sisihan piawai boleh dengan cara klasik dan "tulen" mengukur kebolehubahan sesuatu instrumen. Tetapi malangnya, penunjuk ini tidak begitu biasa dalam analisis sekuriti.

Menggunakan Sisihan Piawai

Pengiraan sisihan piawai secara manual tidak begitu menarik. tetapi berguna untuk pengalaman. Sisihan piawai boleh dinyatakan formula STD=√[(∑(x-x ) 2)/n] , yang berbunyi seperti jumlah punca perbezaan kuasa dua antara item sampel dan min, dibahagikan dengan bilangan item dalam sampel.

Jika bilangan elemen dalam sampel melebihi 30, maka penyebut pecahan di bawah punca mengambil nilai n-1. Jika tidak, n digunakan.

langkah demi langkah pengiraan sisihan piawai:

  1. kirakan min aritmetik bagi sampel data
  2. tolak purata ini daripada setiap elemen sampel
  3. semua perbezaan yang terhasil adalah kuasa dua
  4. jumlah semua petak yang terhasil
  5. bahagikan jumlah yang terhasil dengan bilangan unsur dalam sampel (atau dengan n-1 jika n>30)
  6. hitung punca kuasa dua bagi hasil bahagi (dipanggil penyebaran)

Untuk mengira min geometri mudah, formula digunakan:

berwajaran geometri

Untuk menentukan purata wajaran geometri, formula digunakan:

Purata diameter roda, paip, sisi purata segi empat sama ditentukan menggunakan kuasa dua min punca.

Nilai RMS digunakan untuk mengira beberapa penunjuk, seperti pekali variasi, yang mencirikan irama output. Di sini, sisihan piawai daripada keluaran yang dirancang untuk tempoh tertentu ditentukan oleh formula berikut:

Nilai-nilai ini dengan tepat mencirikan perubahan dalam penunjuk ekonomi berbanding dengan nilai asasnya, diambil dalam nilai puratanya.

Kuadratik mudah

Purata kuadrat mudah dikira dengan formula:

Wajaran kuadratik

Purata berwajaran min kuasa dua ialah:

22. Ukuran mutlak variasi termasuk:

julat variasi

min sisihan linear

penyebaran

sisihan piawai

Julat variasi (r)

Variasi rentang ialah perbezaan antara nilai maksimum dan minimum atribut

Ia menunjukkan had di mana nilai atribut berubah dalam populasi yang dikaji.

Pengalaman kerja lima pemohon dalam pekerjaan terdahulu ialah: 2,3,4,7 dan 9 tahun. Penyelesaian: julat variasi = 9 - 2 = 7 tahun.

Untuk ciri umum perbezaan dalam nilai atribut, penunjuk variasi purata dikira berdasarkan peruntukan bagi sisihan daripada min aritmetik. Perbezaan itu diambil sebagai sisihan daripada min.

Pada masa yang sama, untuk mengelakkan daripada bertukar menjadi sifar jumlah sisihan pilihan ciri daripada min (sifat sifar min), seseorang itu perlu sama ada mengabaikan tanda-tanda sisihan, iaitu, mengambil modulo jumlah ini. , atau kuasa duakan nilai sisihan

Min sisihan linear dan segi empat sama

Sisihan linear purata ialah min aritmetik bagi sisihan mutlak nilai individu atribut daripada min.

Sisihan linear purata adalah mudah:

Pengalaman kerja lima pemohon dalam pekerjaan terdahulu ialah: 2,3,4,7 dan 9 tahun.

Dalam contoh kami: tahun;

Jawapan: 2.4 tahun.

Wajaran sisihan linear purata digunakan untuk data terkumpul:

Purata sisihan linear, disebabkan oleh konvensionalnya, digunakan agak jarang dalam amalan (khususnya, untuk mencirikan pemenuhan kewajipan kontrak dari segi keseragaman penghantaran; dalam analisis kualiti produk, dengan mengambil kira ciri teknologi pengeluaran ).

Sisihan piawai

Ciri variasi yang paling sempurna ialah sisihan piawai, yang dipanggil piawai (atau sisihan piawai). Sisihan piawai() adalah sama dengan punca kuasa dua bagi purata kuasa dua sisihan nilai individu ciri daripada min aritmetik:

Sisihan piawai adalah mudah:

Sisihan piawai berwajaran digunakan untuk data terkumpul:

Di antara min kuasa dua dan min sisihan linear dalam keadaan taburan normal, perhubungan berikut berlaku: ~ 1.25.

Sisihan piawai, sebagai ukuran mutlak utama bagi variasi, digunakan dalam menentukan nilai ordinat lengkung taburan normal, dalam pengiraan yang berkaitan dengan organisasi pemerhatian sampel dan mewujudkan ketepatan ciri sampel, serta dalam menilai sempadan variasi sifat dalam populasi homogen.

Apabila ujian statistik hipotesis, apabila mengukur hubungan linear antara pembolehubah rawak.

Sisihan piawai:

Sisihan piawai(anggaran sisihan piawai pembolehubah rawak Lantai, dinding di sekeliling kita dan siling, x berbanding jangkaan matematiknya berdasarkan anggaran tidak berat sebelah variansnya):

di mana - varians; - Lantai, dinding di sekeliling kita dan siling, i-elemen sampel ke-; - saiz sampel; - min aritmetik sampel:

Perlu diingatkan bahawa kedua-dua anggaran adalah berat sebelah. Dalam kes umum, adalah mustahil untuk membina anggaran yang tidak berat sebelah. Walau bagaimanapun, anggaran berdasarkan anggaran varians tidak berat sebelah adalah konsisten.

peraturan tiga sigma

peraturan tiga sigma() - hampir semua nilai pembolehubah rawak taburan normal terletak pada selang . Lebih tegas - dengan kepastian tidak kurang daripada 99.7%, nilai pembolehubah rawak yang diedarkan secara normal terletak pada selang yang ditentukan (dengan syarat nilai itu benar, dan tidak diperoleh hasil daripada pemprosesan sampel).

Jika nilai sebenar tidak diketahui, maka anda harus menggunakan bukan, tetapi lantai, dinding di sekeliling kita dan siling, s. Oleh itu, peraturan tiga sigma diterjemahkan ke dalam peraturan tiga Tingkat, dinding di sekeliling kita dan siling, s .

Tafsiran nilai sisihan piawai

Nilai sisihan piawai yang besar menunjukkan sebaran nilai yang besar dalam set yang dibentangkan dengan nilai purata set; nilai yang kecil, masing-masing, menunjukkan bahawa nilai dalam set dikumpulkan di sekitar nilai purata.

Sebagai contoh, kita mempunyai tiga set nombor: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga-tiga set mempunyai nilai min 7 dan sisihan piawai masing-masing 7, 5, dan 1. Set terakhir mempunyai sisihan piawai yang kecil kerana nilai dalam set itu dikelompokkan di sekeliling min; set pertama mempunyai nilai sisihan piawai terbesar - nilai dalam set sangat menyimpang daripada nilai purata.

Dalam pengertian umum, sisihan piawai boleh dianggap sebagai ukuran ketidakpastian. Sebagai contoh, dalam fizik, sisihan piawai digunakan untuk menentukan ralat siri pengukuran berturut-turut bagi beberapa kuantiti. Nilai ini sangat penting untuk menentukan kebolehpercayaan fenomena yang dikaji berbanding dengan nilai yang diramalkan oleh teori: jika nilai min pengukuran sangat berbeza daripada nilai yang diramalkan oleh teori (sisihan piawai yang besar), maka nilai yang diperolehi atau kaedah mendapatkannya hendaklah disemak semula.

Penggunaan praktikal

Dalam amalan, sisihan piawai membolehkan anda menentukan berapa banyak nilai dalam set boleh berbeza daripada nilai purata.

iklim

Katakan terdapat dua bandar dengan purata suhu maksimum harian yang sama, tetapi satu terletak di pantai dan satu lagi di pedalaman. Bandar pantai diketahui mempunyai banyak suhu maksimum harian yang berbeza kurang daripada bandar pedalaman. Oleh itu, sisihan piawai suhu harian maksimum di bandar pantai akan kurang daripada di bandar kedua, walaupun pada hakikatnya mereka mempunyai nilai purata yang sama nilai ini, yang dalam amalan bermakna kebarangkalian bahawa suhu udara maksimum setiap hari tertentu dalam tahun akan menjadi lebih kuat berbeza daripada nilai purata, lebih tinggi untuk bandar yang terletak di dalam benua itu.

Sukan

Mari kita andaikan bahawa terdapat beberapa pasukan bola sepak yang disenaraikan mengikut beberapa set parameter, contohnya, jumlah gol yang dijaringkan dan dibolosi, peluang menjaringkan, dll. Kemungkinan besar pasukan terbaik dalam kumpulan ini akan mempunyai nilai terbaik. dalam lebih banyak parameter. Lebih kecil sisihan piawai pasukan untuk setiap parameter yang dibentangkan, lebih boleh diramal keputusan pasukan, pasukan tersebut seimbang. Sebaliknya, pasukan yang mempunyai sisihan piawai yang besar mempunyai masa yang sukar untuk meramalkan keputusan, yang seterusnya dijelaskan oleh ketidakseimbangan, contohnya, pertahanan yang kuat tetapi serangan yang lemah.

Penggunaan sisihan piawai bagi parameter pasukan membolehkan seseorang meramalkan keputusan perlawanan antara dua pasukan sedikit sebanyak, menilai kekuatan dan kelemahan pasukan, dan seterusnya kaedah perjuangan yang dipilih.

Analisis teknikal

lihat juga

kesusasteraan

* Borovikov, V. STATISTIK. Seni analisis data komputer: Untuk profesional / V. Borovikov. - St Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.