السير الذاتية صفات التحليلات

سلسلة التوزيع الإحصائي. سلسلة إحصائية منفصلة

إن أبسط طريقة لتعميم المواد الإحصائية هي بناء السلاسل. يمكن أن تكون نتيجة ملخص الدراسة الإحصائية سلسلة توزيع.

بعد تحديد خاصية التجميع ، عدد المجموعات وفترات التجميع ، يتم تقديم بيانات الملخص والتجميع في شكل سلسلة توزيع ويتم تقديمها في شكل جداول إحصائية.

سلسلة التوزيع هي نوع واحد من التجميع.

قرب التوزيع في الإحصاء يسمى التوزيع المنظم للوحدات السكانية إلى مجموعات وفقًا لأي سمة واحدة: نوعيًا أو كميًا.

  1. أنواع سلاسل التوزيع

اعتمادًا على السمة الكامنة وراء تكوين سلسلة التوزيع ، يتم تمييز سلسلة التوزيع المنسوب والتباين:

    سلسلة التوزيع المبنية على أسس نوعية ؛

    تسمى سلسلة التوزيع متغيرة ، مبنية بترتيب تصاعدي أو تنازلي لقيم سمة كمية.

تتكون سلسلة التباينات للتوزيع من عمودين. يحتوي العمود الأول على القيم الكمية للخاصية المتغيرة ، والتي تسمى المتغيرات ويتم الإشارة إليها. متغير منفصل - معبراً عنه بعدد صحيح. يقع خيار الفاصل الزمني في النطاق من و إلى. اعتمادًا على نوع المتغيرات ، من الممكن إنشاء سلسلة متغيرة منفصلة أو متسلسلة. يحتوي العمود الثاني على عدد المتغيرات المحددة المعبر عنها من حيث الترددات أو الترددات:

    الترددات هي أرقام مطلقة تبين عدد المرات التي تحدث فيها قيمة خاصية معينة في المجموع ؛ يجب أن يكون مجموع جميع الترددات مساويًا لعدد وحدات السكان بالكامل ؛

    الترددات هي الترددات المعبر عنها كنسبة مئوية من الإجمالي ؛ يجب أن يساوي مجموع كل الترددات المعبر عنها كنسبة مئوية 100٪ في كسور واحد.

سلسلة التباين يتميز بعنصرين: المتغير (X) والتردد (f). المتغير هو قيمة منفصلة لعلامة وحدة منفصلة أو مجموعة من السكان. الرقم الذي يوضح عدد المرات التي يتم فيها استدعاء قيمة ميزة معينة تكرر. إذا تم التعبير عن التردد كرقم نسبي ، فإنه يسمى التردد.

يمكن أن تكون سلسلة التباين:

    الفاصل الزمني ، عندما يتم تحديد الحدود "من" و "إلى" ، يمكن تمثيل سلسلة التوزيع الفاصل بيانياً في شكل مدرج تكراري ؛

    منفصل ، عندما تتميز السمة قيد الدراسة بعدد معين.

  1. تمثيل رسومي لسلسلة التوزيع

يتم تصور سلسلة التوزيع باستخدام الصور الرسومية.

يتم عرض سلسلة التوزيع على النحو التالي:

    المضلع.

    الرسوم البيانية.

    يتراكم.

عند البناء مكب النفايات على المحور الأفقي (الإحداثي) يتم رسم قيم السمة المتغيرة ، وعلى المحور الرأسي (المحور الصادي) - الترددات أو الترددات.

للبناء الرسوم البيانية يشير محور الإحداثي إلى قيم حدود الفواصل الزمنية ، وعلى أساسها ، يتم بناء المستطيلات ، والتي يتناسب ارتفاعها مع الترددات (أو الترددات).

يتم تصوير توزيع سمة في سلسلة متغيرة وفقًا للترددات المتراكمة (الترددات) باستخدام التجميع.

اجمع أو المنحنى التراكمي ، على عكس المضلع ، مبني على الترددات أو الترددات المتراكمة. في هذه الحالة ، يتم وضع القيم المميزة على محور الإحداثي ، ويتم وضع الترددات أو الترددات المتراكمة على المحور الإحداثي.

أوجيفا تم تصميمه بشكل مشابه للتراكم مع الاختلاف الوحيد الذي يتم من خلاله وضع الترددات المتراكمة على محور الإحداثي ، ويتم وضع قيم الميزة على المحور الإحداثي.

الاختلاف في التراكم هو منحنى التركيز أو مخطط لورنز. لرسم منحنى التركيز ، يتم قياس كلا محوري نظام إحداثيات مستطيل كنسبة مئوية من 0 إلى 100. في هذه الحالة ، تشير محاور الإحداثي إلى الترددات المتراكمة ، وتوضح المحاور التنسيقية القيم المتراكمة للحصة (في في المئة) من حجم الميزة.

الموضوع 9. سلسلة التوزيع

سلسلة التوزيع الإحصائي- هذه هي الخاصية الأساسية لمجتمع الإحصاء الكتلي ، وهو تحلل منظم لوحدات المجتمع المدروس إلى مجموعات وفقًا لمعيار التجميع. تتكون أي سلسلة توزيع إحصائي من عنصرين:

1) القيم الفردية للسمة المتغيرة ( والخيارات );

2) القيم التي توضح عدد المرات التي يتم فيها تكرار متغير معين ( الترددات ).

ملحوظة. يتم استدعاء الترددات المعبر عنها ككسور من وحدة أو كنسبة مئوية من الإجمالي الترددات ؛ هو رقم سلسلة التوزيع المعبر عنها كـ مجموع الترددات.

إذا تم أخذ سمة نوعية كأساس للتجميع ، فسيتم استدعاء سلسلة التوزيع هذه عزوي(التوزيع حسب أنواع العمل ، والجنس ، والمهنة ، والدين ، والجنسية ، وما إلى ذلك). إذا تم بناء سلسلة التوزيع على أساس كمي ، فسيتم استدعاء هذه السلسلة متغير. يعني بناء سلسلة متغيرة ترتيب التوزيع الكمي للوحدات السكانية وفقًا لقيم السمة ، ثم عد عدد الوحدات السكانية بهذه القيم (بناء جدول مجموعة).

تخصيص ثلاثة أشكال من سلسلة التباين:

1) صف في المرتبة- هذا هو توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للسمة قيد الدراسة ؛ يجعل الترتيب من السهل تقسيم البيانات الكمية إلى مجموعات ، والكشف الفوري عن القيم الأصغر والأكبر للميزة ، وتسليط الضوء على القيم التي يتم تكرارها في أغلب الأحيان ؛ أشكال أخرى من سلسلة التباين - جداول المجموعة، مجمعة وفقًا لطبيعة اختلاف قيم السمة المدروسة ؛

2) سلسلة منفصلة- هذه سلسلة متغيرة ، يعتمد بناؤها على علامات مع تغيير متقطع ، لا توجد بينها قيم وسيطة (علامات منفصلة - فئة التعريفة ، عدد الأطفال في الأسرة ، عدد الموظفين في المؤسسة ، وما إلى ذلك) ؛ يمكن أن تأخذ هذه العلامات عددًا محدودًا من القيم المعينة ؛

سلسلة منفصلة يمثل جدول المجموعة، والتي تتكون من عمودين: العمود الأول يشير إلى القيمة المحددة للسمة ، والثاني - عدد وحدات السكان ذات قيمة معينة للسمة ؛

3) إذا كانت السمة تحتوي على تغيير مستمر (مقدار الدخل ، ومدة الخدمة ، وتكلفة الأصول الثابتة للمؤسسة ، وما إلى ذلك ، والتي يمكن أن تأخذ أي قيمة ضمن حدود معينة) ، فمن الضروري بناء هذه السمة سلسلة فاصلة (بفواصل متساوية أو غير متساوية).

جدول المجموعةيوجد هنا أيضًا عمودين. يشير الأول إلى قيمة الميزة في الفاصل الزمني "من - إلى" (خيارات) ، والثاني - عدد الوحدات المدرجة في الفاصل الزمني (التردد). في كثير من الأحيان ، يُستكمل الجدول بعمود يتم فيه حساب الترددات المتراكمة S ، والذي يوضح عدد وحدات المجتمع التي لها قيمة ميزة لا تزيد عن هذه القيمة. يمكن استبدال ترددات السلسلة f بتفاصيل ث، معبراً عنها بأرقام نسبية (حصص أو نسب مئوية). هي نسب الترددات لكل فترة زمنية إلى مجموعها الإجمالي (9.1):



(9.1)

عند إنشاء سلسلة متغيرة بقيم فاصلة ، أولاً وقبل كل شيء ، من الضروري تحديد قيمة الفاصل الزمني i ، والذي يتم تعريفه على أنه نسبة نطاق التباين R إلى عدد المجموعات n (9.2):

حيث R = x max - x min ؛ ن = 1 + 3.322 lgN ( صيغة Sturgess) ؛ N هو العدد الإجمالي للوحدات السكانية.

يمكن أيضًا إنشاء سلسلة تباينات الفاصل الزمني للميزات ذات التباين المنفصل. غالبًا ما يكون من غير المناسب الإشارة إلى قيمة منفصلة لميزة منفصلة في دراسة إحصائية ، لأن هذا ، كقاعدة عامة ، يجعل من الصعب النظر في تباين السمة. لذلك ، يتم توزيع القيم المنفصلة المحتملة للسمة في مجموعات ويتم حساب الترددات المقابلة (التفاصيل). عند إنشاء سلسلة فاصلة بناءً على ميزة منفصلة ، لا تتكرر حدود الفواصل الزمنية المتجاورة: يبدأ الفاصل الزمني التالي من القيمة المنفصلة للميزة بالترتيب (بعد القيمة العليا للفاصل الزمني السابق).

عند مقارنة ترددات سلسلة بفواصل زمنية غير متكافئة ، يتم حساب كثافة التوزيع لتوصيف امتلائها. متوسط ​​الكثافة في الفترةهو حاصل قسمة التردد وخاصة على حجم الفترة. في الحالة الأولى ، تكون الكثافة مطلقة ، في الحالة الثانية - نسبية. يُظهر متوسط ​​الكثافة عدد الوحدات أو النسب المئوية لكل وحدة قياس من الخيارات. التردد والخصوصية والكثافة والتردد التراكمي هي وظائف مختلفة لحجم المتغيرات.

فى المعالجة تحليل البيانات الإحصائية، ممثلة بسلسلة التوزيع ، بالإضافة إلى المعرفة حول طبيعة التوزيع (أو هيكل السكان) ، يمكن حساب المؤشرات الإحصائية المختلفة (الخصائص العددية) ، والتي في شكل معمم تعكس ميزات توزيع المادة المدروسة مميزات. يمكن تقسيم هذه الخصائص (المؤشرات) إلى 3 مجموعات رئيسية

1) خصائص مركز التوزيع(يعني ، الوضع ، الوسيط) ؛

2) درجة خصائص التباين(مدى التباين ، متوسط ​​الانحراف الخطي ، التباين ، الانحراف المعياري ، معامل الاختلاف) ؛

3) خصائص شكل (نوع) التوزيع(مؤشرات التفرطح وعدم التناسق ، خصائص الترتيب ، منحنيات التوزيع).

الطريقة الأكثر موثوقية لتحديد أنماط التوزيع هي كما يلي:
1) زيادة عدد الحالات الملاحظة (وفقًا لقانون الأعداد الكبيرة ، في مثل هذه السلسلة ، ستؤدي الانحرافات العشوائية عن النمط العام للقيم الفردية إلى إلغاء بعضها البعض) ؛

2) قسّم المجموعة مبدئيًا إلى أكبر عدد ممكن من المجموعات ، ثم قلّل عدد المجموعات تدريجيًا ، وحسّن التجميع من حيث تحديد أنماط التوزيع.

عند تنفيذ هذا النهج ، ستصبح سمة النمط لهذا التوزيع أكثر وضوحًا ، وسيقترب الخط المكسور الذي يصور المضلع من بعض الخطوط المتجانسة ، وفي النهاية ، يجب أن يتحول إلى خط منحني.

دع عينة تؤخذ من عامة السكان ، و X 1 لوحظ ص 1 مرة، X 2 - ص 2 مرات، س ك - ص لمرات وحجم العينة. القيم المرصودة X 1 تسمى المتغيرات ، وتسلسل المتغيرات ، مكتوبة بترتيب تصاعدي - سلسلة التباين .

يسمى عدد ملاحظات المتغيرات التردد ، وتسمى نسبته إلى حجم العينة التردد النسبي.

تعريف. القانون الإحصائي (التجريبي) لتوزيع العينات ، أو ببساطة التوزيع الإحصائي للعينةاستدعاء متغير التسلسل والترددات المقابلة لها ن أناأو الترددات النسبية.

يتم تمثيل التوزيع الإحصائي للعينة بشكل ملائم في شكل جدول توزيع تردد يسمى سلسلة التوزيع الإحصائي المنفصل:

(مجموع كل الترددات النسبية يساوي واحدًا).

مثال 1. عند القياس في مجموعات متجانسة من الموضوعات ، تم الحصول على العينات التالية: 71 ، 72 ، 74 ، 70 ، 70 ، 72 ، 71 ، 74 ، 71 ، 72 ، 71 ، 73 ، 72 ، 72 ، 72 ، 74 ، 72 ، 73 ، 72.74 (معدل ضربات القلب). بناءً على هذه النتائج ، قم بتجميع سلسلة إحصائية لتوزيع التردد والترددات النسبية.

المحلول. 1) السلسلة الإحصائية لتوزيع التردد:

التحكم: 0.1 + 0.2 + 0.4 + 0.1 + 0.2 = 1.

تردد المضلعيسمى الخط المكسور ، المقاطع التي تربط النقاط لبناء مضلع من الترددات على محور الإحداثي ، استبعد الخيارات X 2 ، وعلى المحور ص - الترددات المقابلة ص ط.النقاط متصلة بواسطة مقاطع وتتلقى مضلع الترددات.

مضلع التردد النسبييسمى الخط المتقطع ، الأجزاء التي تربط النقاط. لبناء مضلع من الترددات النسبية على الإحداثي ، استبعد الخيارات Xأنا ، وعلى المحور ص الترددات المقابلة ثأنا . ترتبط النقاط بمقاطع وتحصل على مضلع للترددات النسبية

مثال 2أنشئ مضلع تردد ومضلع تردد نسبي وفقًا للبيانات الواردة في المثال 1.

المحلول:باستخدام سلسلة توزيع إحصائية منفصلة تم تجميعها في المثال 1 ، نقوم ببناء مضلع تردد ومضلع تردد نسبي:


2. سلسلة التوزيع الإحصائي الفاصل. شريط الرسم البياني.

عادةً ما يتم استخدام سلسلة إحصائية منفصلة (أو دالة توزيع تجريبي) عندما لا يكون هناك الكثير من الخيارات المختلفة في العينة ، أو عندما يكون التمييز ضروريًا للباحث لسبب أو لآخر. إذا كانت خاصية عامة السكان X التي تهمنا يتم توزيعها باستمرار أو إذا كان تقديرك غير عملي (أو مستحيل) في الاعتبار ، فسيتم تجميع الخيارات في فترات زمنية.


يمكن أيضًا تحديد التوزيع الإحصائي كسلسلة من الفواصل الزمنية والترددات المقابلة لها (يتم أخذ التردد المقابل للفاصل الزمني كمجموع للترددات ضمن هذه الفترة).

1. R (النطاق) = X max -X ​​min

2. ك-عدد المجموعات

3. (صيغة ستورجس)

4. أ = س دقيقة ، ب = س ماكس

من الملائم تمثيل التجميع الناتج في شكل جدول تكراري يسمى سلسلة توزيع الفاصل الإحصائي:

فترات التجمعات ...
الترددات ...

يمكن تشكيل جدول مماثل عن طريق استبدال الترددات ن أناالترددات النسبية.

إن أهم مرحلة في دراسة الظواهر والعمليات الاجتماعية والاقتصادية هي تنظيم البيانات الأولية ، وعلى هذا الأساس ، الحصول على خاصية موجزة للكائن بأكمله باستخدام مؤشرات التعميم ، والتي تتحقق من خلال تلخيص وتجميع المواد الإحصائية الأولية.

ملخص إحصائي - هذه مجموعة معقدة من العمليات المتسلسلة لتعميم حقائق فردية محددة تشكل مجموعة ، لتحديد السمات والأنماط النموذجية المتأصلة في الظاهرة قيد الدراسة ككل. إجراء ملخص إحصائي يتضمن الخطوات التالية :

  • اختيار ميزة التجميع ؛
  • تحديد ترتيب تشكيل المجموعات ؛
  • تطوير نظام من المؤشرات الإحصائية لتوصيف المجموعات والهدف ككل ؛
  • تطوير مخططات للجداول الإحصائية لتقديم نتائج موجزة.

التجميع الإحصائي يسمى تقسيم وحدات السكان المدروسين إلى مجموعات متجانسة وفقًا لخصائص معينة ضرورية لهم. التجميع هو أهم طريقة إحصائية لتلخيص البيانات الإحصائية ، وأساس الحساب الصحيح للمؤشرات الإحصائية.

هناك الأنواع التالية من التجمعات: تصنيفية ، هيكلية ، تحليلية. تتحد كل هذه المجموعات من خلال حقيقة أن وحدات الكائن مقسمة إلى مجموعات وفقًا لبعض السمات.

علامة التجمع تسمى العلامة التي تقسم بها وحدات السكان إلى مجموعات منفصلة. تعتمد استنتاجات الدراسة الإحصائية على الاختيار الصحيح لسمة التجميع. كأساس للتجميع ، من الضروري استخدام ميزات مهمة ومثبتة نظريًا (كمية أو نوعية).

العلامات الكمية للتجميع لها تعبير رقمي (حجم التداول ، عمر الشخص ، دخل الأسرة ، إلخ) ، و السمات النوعية للتجمع تعكس حالة الوحدة السكانية (الجنس ، الحالة الاجتماعية ، الانتماء الصناعي للمؤسسة ، شكل ملكيتها ، إلخ).

بعد تحديد أساس التجميع ، يجب تحديد مسألة عدد المجموعات التي ينبغي تقسيم مجتمع الدراسة إليها. يعتمد عدد المجموعات على أهداف الدراسة ونوع المؤشر الذي يقوم عليه التجميع ، وحجم السكان ، ودرجة تباين السمة.

على سبيل المثال ، يأخذ تجميع المؤسسات وفقًا لأشكال الملكية في الاعتبار البلدية والفيدرالية وممتلكات رعايا الاتحاد. إذا تم التجميع وفقًا لسمة كمية ، فمن الضروري إيلاء اهتمام خاص لعدد وحدات الكائن قيد الدراسة ودرجة تذبذب سمة التجميع.

عندما يتم تحديد عدد المجموعات ، يجب تحديد فترات التجميع. فترة - هذه هي قيم خاصية متغيرة تقع ضمن حدود معينة. كل فترة لها قيمتها الخاصة ، والحدود العليا والسفلى ، أو واحد منها على الأقل.

الحد الأدنى للفترة تسمى أصغر قيمة للسمة في الفاصل الزمني ، و الحد الاعلى - أكبر قيمة للسمة في الفترة الزمنية. قيمة الفاصل الزمني هي الفرق بين الحدين العلوي والسفلي.

فترات التجميع ، حسب حجمها ، هي: متساوية وغير متساوية. إذا ظهر تباين السمة في حدود ضيقة نسبيًا وكان التوزيع موحدًا ، فسيتم إنشاء مجموعة بفواصل زمنية متساوية. يتم تحديد قيمة الفاصل الزمني المتساوي من خلال الصيغة التالية :

حيث Xmax ، Xmin - الحد الأقصى والحد الأدنى لقيم السمة في المجموع ؛ n هو عدد المجموعات.

أبسط تجميع ، حيث تتميز كل مجموعة محددة بمؤشر واحد ، هي سلسلة توزيع.

سلسلة التوزيع الإحصائي - هذا توزيع منظم للوحدات السكانية إلى مجموعات وفقًا لسمة معينة. اعتمادًا على السمة الكامنة وراء تكوين سلسلة التوزيع ، يتم تمييز سلسلة التوزيع المنسوب والتباين.

عزوي يسمون سلسلة التوزيع المبنية وفقًا للخصائص النوعية ، أي العلامات التي ليس لها تعبير عددي (التوزيع حسب نوع العمل ، حسب الجنس ، حسب المهنة ، إلخ). تصف سلسلة توزيع السمات تكوين السكان وفقًا لميزة أساسية واحدة أو أخرى. تسمح لنا هذه البيانات ، المأخوذة على مدى عدة فترات ، بدراسة التغيير في الهيكل.

صفوف التنويعات تسمى سلسلة التوزيع المبنية على أساس كمي. تتكون أي سلسلة متغيرة من عنصرين: المتغيرات والترددات. خيارات يتم استدعاء القيم الفردية للسمة التي تأخذها في سلسلة التباين ، أي القيمة المحددة لسمة المتغير.

الترددات يسمى عدد المتغيرات الفردية أو كل مجموعة من سلسلة التباين ، أي ، هذه هي الأرقام التي توضح عدد المرات التي تحدث فيها متغيرات معينة في سلسلة التوزيع. يحدد مجموع كل الترددات حجم المجتمع بأكمله وحجمه. الترددات يتم استدعاء الترددات ، معبراً عنها في كسور من وحدة أو كنسبة مئوية من الإجمالي. وعليه فإن مجموع الترددات يساوي 1 أو 100٪.

اعتمادًا على طبيعة تباين السمة ، يتم تمييز ثلاثة أشكال من سلسلة التباينات: سلسلة مرتبة ، وسلسلة منفصلة ، وسلسلة فاصلة.

سلسلة التباينات المصنفة - هذا هو توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للسمة قيد الدراسة. يجعل الترتيب من السهل تقسيم البيانات الكمية إلى مجموعات ، والكشف الفوري عن القيم الأصغر والأكبر للميزة ، وتسليط الضوء على القيم التي يتم تكرارها في أغلب الأحيان.

سلسلة الاختلافات المنفصلة يميز توزيع الوحدات السكانية وفقًا لسمة منفصلة تأخذ قيمًا صحيحة فقط. على سبيل المثال ، فئة التعريفة ، عدد الأطفال في الأسرة ، عدد الموظفين في المؤسسة ، إلخ.

إذا كان للعلامة تغيير مستمر ، والذي ضمن حدود معينة يمكن أن يأخذ أي قيم ("من - إلى") ، إذن لهذه العلامة تحتاج إلى بناء سلسلة التباين الفاصل . على سبيل المثال ، مقدار الدخل وخبرة العمل وتكلفة الأصول الثابتة للمؤسسة وما إلى ذلك.

أمثلة على حل المشكلات المتعلقة بموضوع "الملخص الإحصائي والتجميع"

مهمة 1 . هناك معلومات عن عدد الكتب التي تلقاها الطلاب عن طريق الاشتراك للعام الدراسي الماضي.

قم ببناء سلسلة توزيع متباينة متباينة ومتباعدة تشير إلى عناصر السلسلة.

المحلول

هذه المجموعة عبارة عن مجموعة من الخيارات لعدد الكتب التي يتلقاها الطلاب. دعونا نحسب عدد هذه المتغيرات ونرتبها في شكل سلسلة توزيع منفصلة مرتبة ومتغيرة.

المهمة 2 . توجد بيانات عن قيمة الأصول الثابتة لـ 50 مؤسسة ألف روبل.

بناء سلسلة توزيع ، وتسليط الضوء على 5 مجموعات من الشركات (على فترات متساوية).

المحلول

بالنسبة للحل ، نختار أكبر وأصغر قيم تكلفة الأصول الثابتة للمؤسسات. هذه 30.0 و 10.2 ألف روبل.

أوجد حجم الفاصل الزمني: h \ u003d (30.0-10.2): 5 \ u003d 3.96 ألف روبل.

ثم ستشمل المجموعة الأولى الشركات ، التي يبلغ حجم الأصول الثابتة منها 10.2 ألف روبل. ما يصل إلى 10.2 + 3.96 = 14.16 ألف روبل. وستكون هناك 9 شركات من هذا القبيل ، وستشمل المجموعة الثانية مؤسسات ، سيكون حجم أصولها الثابتة من 14.16 ألف روبل. ما يصل إلى 14.16 + 3.96 = 18.12 ألف روبل. سيكون هناك 16 مؤسسة من هذا القبيل ، وبالمثل نجد عدد الشركات المدرجة في المجموعات الثالثة والرابعة والخامسة.

يتم وضع سلسلة التوزيع الناتجة في الجدول.

المهمة 3 . بالنسبة لعدد من مؤسسات الصناعة الخفيفة ، تم الحصول على البيانات التالية:

قم بتجميع المؤسسات حسب عدد العمال ، وتشكيل 6 مجموعات على فترات متساوية. عد لكل مجموعة:

1. عدد المؤسسات
2. عدد العمال
3. حجم المنتجات المصنعة سنويا
4. متوسط ​​الإنتاج الفعلي لكل عامل
5. مبلغ الأصول الثابتة
6. متوسط ​​حجم الأصول الثابتة لمشروع واحد
7. متوسط ​​قيمة المنتجات المصنعة من قبل مؤسسة واحدة

سجل نتائج الحساب في الجداول. ارسم استنتاجاتك الخاصة.

المحلول

بالنسبة للحل ، نختار القيم الأكبر والأصغر لمتوسط ​​عدد العاملين في المؤسسة. هذه هي 43 و 256.

أوجد حجم الفترة الزمنية: h = (256-43): 6 = 35.5

ثم ستشمل المجموعة الأولى الشركات التي يتراوح متوسط ​​عدد العمال فيها من 43 إلى 43 + 35.5 = 78.5 شخصًا. وستكون هناك 5 شركات من هذا القبيل ، وستشمل المجموعة الثانية الشركات ، وسيتراوح متوسط ​​عدد العاملين فيها من 78.5 إلى 78.5 + 35.5 = 114 شخصًا. سيكون هناك 12 مؤسسة ، وبالمثل نجد عدد الشركات المدرجة في المجموعات الثالثة والرابعة والخامسة والسادسة.

نضع سلسلة التوزيع الناتجة في جدول ونحسب المؤشرات اللازمة لكل مجموعة:

استنتاج : كما يتضح من الجدول ، فإن المجموعة الثانية من الشركات هي الأكثر عددًا. تضم 12 شركة. أصغر المجموعات الخامسة والسادسة (شركتان لكل منهما). هذه هي أكبر المؤسسات (من حيث عدد العمال).

نظرًا لأن المجموعة الثانية هي الأكثر عددًا ، فإن حجم الإنتاج السنوي لمؤسسات هذه المجموعة وحجم الأصول الثابتة أعلى بكثير من غيرها. في الوقت نفسه ، فإن متوسط ​​الإنتاج الفعلي لعامل واحد في مؤسسات هذه المجموعة ليس هو الأعلى. شركات المجموعة الرابعة في الصدارة هنا. هذه المجموعة تمثل أيضًا كمية كبيرة إلى حد ما من الأصول الثابتة.

في الختام ، نلاحظ أن متوسط ​​حجم الأصول الثابتة ومتوسط ​​قيمة ناتج مؤسسة واحدة يتناسبان بشكل مباشر مع حجم المؤسسة (من حيث عدد العمال).

التجمع- هذا هو تقسيم السكان إلى مجموعات متجانسة بطريقة ما.

مهمة الخدمة. باستخدام الآلة الحاسبة عبر الإنترنت ، يمكنك:

  • بناء سلسلة متباينةوبناء مدرج تكراري ومضلع ؛
  • العثور على مؤشرات التباين (المتوسط ​​، والوضع (بما في ذلك الرسم البياني) ، والوسيط ، ومدى التباين ، والربيع ، والعشري ، والمعامل الربعي للتمايز ، ومعامل التباين ، ومؤشرات أخرى) ؛

تعليمات. لتجميع سلسلة ، يجب تحديد نوع سلسلة التباينات الناتجة (منفصلة أو فاصل زمني) وتحديد مقدار البيانات (عدد الصفوف). يتم حفظ الحل الناتج في ملف Word (انظر مثال تجميع البيانات الإحصائية).

عدد بيانات الإدخال
",0);">

إذا تم التجميع بالفعل و سلسلة الاختلافات المنفصلةأو سلسلة فاصلة، فأنت بحاجة إلى استخدام مؤشرات التغيير في الآلة الحاسبة عبر الإنترنت. اختبار الفرضية حول نوع التوزيعأنتجت باستخدام خدمة دراسة شكل التوزيع.

أنواع التجمعات الإحصائية

سلسلة التباين. في حالة ملاحظات متغير عشوائي منفصل ، يمكن مواجهة نفس القيمة عدة مرات. يتم تسجيل قيم المتغير العشوائي x i للإشارة إلى n i عدد المرات التي يظهر فيها في n من الملاحظات ، وهذا هو تكرار هذه القيمة.
في حالة المتغير العشوائي المستمر ، يتم استخدام التجميع في الممارسة.
  1. التجميع التصنيفي- هذا هو تقسيم السكان غير المتجانسين نوعياً المدروسين إلى طبقات وأنواع اجتماعية واقتصادية ومجموعات متجانسة من الوحدات. لبناء هذا التجميع ، استخدم معلمة المتسلسلة المتغيرة المنفصلة.
  2. التجمع الهيكلي يسمى، حيث ينقسم السكان المتجانسون إلى مجموعات تميز هيكلها وفقًا لبعض السمات المتغيرة. لإنشاء هذا التجميع ، استخدم معلمة سلسلة الفاصل الزمني.
  3. يسمى التجمع الذي يكشف العلاقة بين الظواهر المدروسة وخصائصها مجموعة تحليلية(انظر التجميع التحليلي للسلسلة).

مبادئ بناء التجمعات الإحصائية

تسمى سلسلة الملاحظات المرتبة بترتيب تصاعدي سلسلة التباين. علامة التجمعهي العلامة التي ينقسم بها السكان إلى مجموعات منفصلة. يطلق عليه قاعدة المجموعة. يمكن أن يعتمد التجميع على الخصائص الكمية والنوعية.
بعد تحديد أساس التجميع ، يجب تحديد مسألة عدد المجموعات التي ينبغي تقسيم مجتمع الدراسة إليها.

عند استخدام أجهزة الكمبيوتر الشخصية لمعالجة البيانات الإحصائية ، يتم تجميع وحدات الكائن باستخدام الإجراءات القياسية.
يعتمد أحد هذه الإجراءات على استخدام صيغة Sturgess لتحديد العدد الأمثل للمجموعات:

ك = 1 + 3.322 * lg (N)

حيث k هو عدد المجموعات ، N هو عدد الوحدات السكانية.

يتم حساب طول الفترات الجزئية على النحو h = (x max -x min) / k

ثم احسب عدد مرات الدخول إلى الملاحظات في هذه الفواصل الزمنية ، والتي تؤخذ على أنها ترددات n i. ترددات قليلة ، تكون قيمها أقل من 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
نقاط المنتصف للفترات x i = (c i-1 + c i) / 2 تؤخذ كقيم جديدة.