السير الذاتية صفات تحليل

بناء سلسلة الاختلاف الفاصل. سلسلة التوزيع

يتم تقديمها في شكل سلسلة توزيع ويتم تقديمها في النموذج.

سلسلة التوزيع هي أحد أنواع المجموعات.

نطاق التوزيع- يمثل توزيعًا منظمًا لوحدات السكان التي تتم دراستها إلى مجموعات وفقًا لخصائص مختلفة معينة.

اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، يتم تمييزها المنسوبة والمتغيرةصفوف التوزيع:

  • عزوي- تسمى سلاسل التوزيع التي تم إنشاؤها وفقًا للخصائص النوعية.
  • تسمى سلاسل التوزيع المبنية بترتيب تصاعدي أو تنازلي لقيم الخاصية الكمية متغير.
تتكون سلسلة تباين التوزيع من عمودين:

يحتوي العمود الأول القيم الكميةسمة متغيرة، والتي تسمى خياراتويتم تعيينها. خيار منفصل - يتم التعبير عنه كعدد صحيح. يتراوح خيار الفاصل الزمني من وإلى. اعتمادًا على نوع الخيارات، يمكنك إنشاء سلسلة تباينات منفصلة أو بفاصل زمني.
ويحتوي العمود الثاني عدد الخيارات المحددة، معبراً عنها بالترددات أو الترددات:

الترددات- هذا أرقام مطلقة، يوضح عدد مرات حدوثها بشكل تراكمي قيمة معينةالعلامات التي تدل . يجب أن يكون مجموع جميع التكرارات مساوياً لعدد الوحدات في إجمالي عدد السكان.

الترددات() يتم التعبير عن التكرارات كنسبة مئوية من الإجمالي. يجب أن يكون مجموع جميع التكرارات المعبر عنها كنسب مئوية مساوياً لـ 100% في كسور الواحد.

التمثيل البياني لسلسلة التوزيع

يتم عرض سلسلة التوزيع بشكل مرئي باستخدام الصور الرسومية.

يتم تصوير سلسلة التوزيع على النحو التالي:
  • مضلع
  • الرسوم البيانية
  • يتراكم
  • الزيتون

مضلع

عند إنشاء مضلع، يتم رسم قيم الخاصية المتغيرة على المحور الأفقي (محور الإحداثي السيني)، وعلى محور رأسي(المحور الصادي) - الترددات أو الترددات.

المضلع في الشكل 6.1 يعتمد على بيانات التعداد الجزئي لسكان روسيا في عام 1994.

6.1. توزيع حجم الأسرة

حالة: تتوفر بيانات عن توزيع 25 عاملاً بإحدى المنشآت حسب فئات التعرفة:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
مهمة: إنشاء سلسلة تباينات منفصلة وتصويرها بيانياً كمضلع توزيع.
حل:
في في هذا المثالالخيارات هي فئة تعريفة الموظف. لتحديد الترددات، من الضروري حساب عدد الموظفين ذوي فئة التعريفة المقابلة.

يتم استخدام المضلع لسلسلة التباين المنفصلة.

لإنشاء مضلع التوزيع (الشكل 1)، نرسم القيم الكمية للخصائص المتغيرة - الخيارات - على محور الإحداثي السيني (X)، والترددات أو الترددات على المحور الإحداثي.

إذا تم التعبير عن قيم الخاصية في شكل فواصل زمنية، فإن هذه السلسلة تسمى الفاصل الزمني.
سلسلة الفاصلةيتم تصوير التوزيعات بيانياً على شكل رسم بياني أو تراكمي أو ogive.

الجدول الإحصائي

حالة: البيانات المتعلقة بحجم الودائع مذكورة بـ 20 فرادىفي بنك واحد (ألف روبل) 60؛ 25؛ 12؛ 10؛ 68؛ 35؛ 2؛ 17؛ 51؛ 9؛ 3؛ 130؛ 24؛ 85؛ 100؛ 152؛ 6؛ 18؛ 7؛ 42.
مهمة: إنشاء سلسلة تباين الفاصل الزمني مع على فترات متساوية.
حل:

  1. يتكون السكان الأولي من 20 وحدة (ن = 20).
  2. باستخدام صيغة Sturgess، نحدد المبلغ المطلوبالمجموعات المستخدمة: n=1+3,322*lg20=5
  3. لنحسب قيمة الفترة المتساوية: i=(152 - 2) /5 = 30 ألف روبل
  4. دعونا نقسم السكان الأوليين إلى 5 مجموعات بفاصل 30 ألف روبل.
  5. نعرض نتائج التجميع في الجدول:

مع مثل هذا التسجيل للخاصية المستمرة، عندما تحدث نفس القيمة مرتين (كالحد الأعلى لفاصل زمني واحد والحد الأدنى لفاصل زمني آخر)، فإن هذه القيمة تنتمي إلى المجموعة التي تعمل فيها هذه القيمة كحد أعلى.

شريط الرسم البياني

لإنشاء رسم بياني، تتم الإشارة إلى قيم حدود الفواصل الزمنية على طول محور الإحداثي السيني، وبناءً عليها، يتم إنشاء مستطيلات يتناسب ارتفاعها مع الترددات (أو الترددات).

في التين. 6.2. يُظهر رسمًا بيانيًا لتوزيع السكان الروس في عام 1997 حسب الفئة العمرية.

أرز. 6.2. توزيع السكان الروس حسب الفئات العمرية

حالة: يتم توزيع 30 موظف بالشركة على الراتب الشهري

مهمة: عرض سلسلة تباين الفاصل الزمني بيانياً على شكل رسم بياني وتراكمي.
حل:

  1. يتم تحديد الحدود غير المعروفة للفاصل الزمني المفتوح (الأول) بقيمة الفاصل الزمني الثاني: 7000 - 5000 = 2000 روبل. وبنفس القيمة نجد الحد الأدنى للفاصل الزمني الأول: 5000 - 2000 = 3000 روبل.
  2. لإنشاء رسم بياني في نظام إحداثي مستطيل، نرسم على طول محور الإحداثي السيني المقاطع التي تتوافق قيمها مع فترات سلسلة الدوالي.
    تعمل هذه الأجزاء كقاعدة سفلية، ويكون التردد المقابل (التردد) بمثابة ارتفاع المستطيلات المشكلة.
  3. دعونا نبني الرسم البياني:

لبناء التراكمات، من الضروري حساب الترددات المتراكمة (الترددات). يتم تحديدها من خلال الجمع التسلسلي للترددات (الترددات) للفترات السابقة ويتم تحديدها بـ S. توضح الترددات المتراكمة عدد وحدات السكان التي لها قيمة مميزة لا تزيد عن تلك قيد النظر.

يتراكم

يتم تصوير توزيع الخاصية في سلسلة التباين على الترددات المتراكمة (الترددات) باستخدام التراكم.

يتراكمأو يتم إنشاء منحنى تراكمي، على عكس المضلع، من الترددات أو الترددات المتراكمة. في هذه الحالة، يتم وضع قيم الخاصية على محور الإحداثي، ويتم وضع الترددات أو الترددات المتراكمة على المحور الإحداثي (الشكل 6.3).

أرز. 6.3. يتراكم توزيع حجم الأسرة

4. دعونا نحسب التكرارات المتراكمة:
يتم حساب التكرار التراكمي للفاصل الأول على النحو التالي: 0 + 4 = 4، للثاني: 4 + 12 = 16؛ والثالث: 4 + 12 + 8 = 24، إلخ.

عند إنشاء تراكم، يتم تعيين التردد (التردد) المتراكم للفاصل الزمني المقابل إلى الحد الأعلى:

أوجيفا

أوجيفاتم إنشاؤه بشكل مشابه للتراكم مع الاختلاف الوحيد وهو أن الترددات المتراكمة يتم وضعها على محور الإحداثي، ويتم وضع القيم المميزة على المحور الإحداثي.

أحد أنواع التراكمات هو منحنى التركيز أو مخطط لورنتز. رسم منحنى التركيز على كلا المحورين نظام مستطيلالإحداثيات، يتم رسم مقياس مقياس كنسبة مئوية من 0 إلى 100. في هذه الحالة، تتم الإشارة إلى التكرارات المتراكمة على محور الإحداثي، ويتم الإشارة إلى القيم المتراكمة للحصة (بالنسبة المئوية) حسب حجم الخاصية المحور الإحداثي.

يتوافق التوزيع الموحد للخاصية مع قطري المربع على الرسم البياني (الشكل 6.4). وفي حالة التوزيع غير المتساوي، يمثل الرسم البياني منحنى مقعرًا اعتمادًا على مستوى تركيز السمة.

6.4. منحنى التركيز

إن أهم مرحلة في دراسة الظواهر والعمليات الاجتماعية والاقتصادية هي تنظيم البيانات الأولية، وعلى هذا الأساس، الحصول على ملخص موجز للكائن بأكمله باستخدام المؤشرات العامة، والذي يتم تحقيقه من خلال تلخيص وتجميع المواد الإحصائية الأولية.

ملخص إحصائي - هي مجموعة من العمليات المتتابعة لتعميم محدد حقائق معزولة، تشكيل مجموعة، لتحديد ميزات نموذجيةوالأنماط المتأصلة في الظاهرة محل الدراسة ككل. يتضمن إجراء ملخص إحصائي الخطوات التالية :

  • اختيار خصائص التجميع؛
  • تحديد ترتيب تشكيل المجموعة؛
  • تطوير النظام المؤشرات الإحصائيةلتوصيف المجموعات والكائن ككل؛
  • تطوير تخطيطات الجدول الإحصائي لتقديم نتائج موجزة.

التجمع الإحصائي يسمى تقسيم وحدات السكان محل الدراسة مجموعات متجانسةوفقا لخصائص معينة ضرورية لهم. المجموعات هي الأكثر أهمية الطريقة الإحصائيةالتعميمات بيانات احصائيةأساس الحساب الصحيح للمؤشرات الإحصائية.

يميز الأنواع التاليةالمجموعات: النموذجية والهيكلية والتحليلية. وتتحد كل هذه التجمعات من خلال حقيقة أن وحدات الكائن تنقسم إلى مجموعات حسب بعض الخصائص.

ميزة التجميع هي الخاصية التي يتم من خلالها تقسيم وحدات السكان إلى مجموعات منفصلة. من الاختيار الصحيحخاصية التجميع تعتمد على الاستنتاجات البحوث الإحصائية. كأساس للتجميع، من الضروري استخدام خصائص هامة ذات أساس نظري (كمية أو نوعية).

الخصائص الكمية للتجميع لها تعبير رقمي (حجم التداول، عمر الشخص، دخل الأسرة، وما إلى ذلك)، و العلامات النوعية للتجمع تعكس حالة الوحدة السكانية (الجنس، الوضع العائلي، الانتماء الصناعي للمؤسسة، شكل ملكيتها، وما إلى ذلك).

بعد تحديد أساس التجميع، يجب تحديد مسألة عدد المجموعات التي ينبغي تقسيم السكان قيد الدراسة إليها. ويعتمد عدد المجموعات على أهداف الدراسة ونوع المؤشر الذي يقوم عليه التجميع، وحجم السكان، ودرجة الاختلاف في الخاصية.

على سبيل المثال، فإن تجميع المؤسسات حسب نوع الملكية يأخذ في الاعتبار الممتلكات الخاضعة للبلديات والفدرالية والفدرالية. إذا تم التجميع بواسطة خاصية كمية، فمن الضروري عكس ذلك انتباه خاصعلى عدد وحدات الكائن قيد الدراسة ودرجة التباين في خاصية التجميع.

بمجرد تحديد عدد المجموعات، يجب تحديد فترات التجميع. فاصلة - هذه هي قيم الخصائص المتغيرة التي تقع ضمن حدود معينة. كل فاصل له قيمته الخاصة، والحدود العليا والسفلى، أو على الأقل واحد منهم.

الحد الأدنى للفاصل الزمني تسمى أصغر قيمة للخاصية في الفترة و الحد الأعلى - أعلى قيمة للخاصية في الفترة. قيمة الفاصل الزمني هي الفرق بين الحدود العلوية والسفلية.

فترات التجميع، حسب حجمها، هي: متساوية وغير متساوية. إذا ظهر تباين الخاصية ضمن حدود ضيقة نسبيًا وكان التوزيع منتظمًا، فسيتم بناء المجموعة على فترات متساوية. يتم تحديد قيمة الفاصل الزمني المتساوي بالصيغة التالية :

حيث Xmax، Xmin هي القيم القصوى والدنيا للخاصية في المجموع؛ ن - عدد المجموعات.

إن أبسط تجميع تتميز فيه كل مجموعة مختارة بمؤشر واحد يمثل سلسلة توزيع.

السلسلة الإحصائيةتوزيع - هذا توزيع منظم للوحدات السكانية إلى مجموعات حسب خاصية معينة. اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، يتم التمييز بين سلسلة التوزيع السمة والمتغيرة.

عزوي تسمى سلسلة التوزيع التي تم إنشاؤها وفقًا لـ الميزات النوعية، أي العلامات التي لا تملك التعبير العددي(التوزيع حسب نوع العمل، حسب الجنس، حسب المهنة، الخ). تميز سلسلة التوزيع السمة تكوين السكان وفقًا لبعض الخصائص الأساسية. تتيح هذه البيانات، المأخوذة على عدة فترات، دراسة التغيرات في البنية.

سلسلة متغيرة تسمى سلسلة التوزيع المبنية على أساس كمي. تتكون أي سلسلة متغيرة من عنصرين: الخيارات والترددات. خيارات وتسمى القيم الفرديةالخصائص التي تتخذها في سلسلة التباين، أي القيمة المحددة للخاصية المتغيرة.

الترددات يسمى أرقام المتغيرات الفردية أو كل مجموعة سلسلة الاختلافأي أن هذه أرقام توضح عدد مرات ظهور خيارات معينة في سلسلة التوزيع. يحدد مجموع جميع الترددات حجم السكان بأكمله وحجمهم. الترددات تسمى الترددات المعبر عنها بكسور الوحدة أو كنسبة مئوية من الإجمالي. وبناء على ذلك، فإن مجموع الترددات يساوي 1 أو 100٪.

اعتمادًا على طبيعة تباين الخاصية، يتم التمييز بين ثلاثة أشكال من سلاسل التباين: السلسلة المرتبة، والسلسلة المنفصلة، ​​والسلسلة المنفصلة. سلسلة الفاصلة.

سلسلة الاختلافات المرتبة - هذا هو توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للخاصية قيد الدراسة. يتيح لك الترتيب تقسيم البيانات الكمية بسهولة إلى مجموعات، والكشف الفوري عن أصغرها و أعلى قيمةمميزة، وتسليط الضوء على القيم التي تتكرر في أغلب الأحيان.

سلسلة الاختلاف المنفصلة يصف توزيع الوحدات السكانية وفقًا لخاصية منفصلة تأخذ قيمًا صحيحة فقط. على سبيل المثال، فئة التعريفة، عدد الأطفال في الأسرة، عدد الموظفين في المؤسسة، إلخ.

إذا كانت السمة لها تغيير مستمر، والتي ضمن حدود معينة يمكن أن تأخذ أي قيم ("من - إلى")، فمن الضروري بناء هذه الخاصية سلسلة الاختلافات الفاصلة . على سبيل المثال، مقدار الدخل، ومدة الخدمة، وتكلفة الأصول الثابتة للمؤسسة، وما إلى ذلك.

أمثلة على حل المشكلات في موضوع "الملخص الإحصائي والتجميع"

المشكلة 1 . هناك معلومات حول عدد الكتب التي حصل عليها الطلاب من خلال الاشتراكات خلال العام الدراسي الماضي.

إنشاء سلسلة توزيع تباين مرتبة ومنفصلة، ​​مع تحديد عناصر السلسلة.

حل

هذه المجموعةيمثل العديد من الخيارات لعدد الكتب التي يتلقاها الطلاب. دعونا نحسب عدد هذه الخيارات ونرتبها في شكل سلسلة توزيع متباينة ومرتبة متباينة.

المشكلة 2 . توجد بيانات عن تكلفة الأصول الثابتة لـ 50 مؤسسة بألف روبل.

إنشاء سلسلة توزيع، مع تسليط الضوء على 5 مجموعات من المؤسسات (على فترات متساوية).

حل

لحلها، نختار الأكبر و أصغر قيمةقيمة الأصول الثابتة للمؤسسات. هذه هي 30.0 و 10.2 ألف روبل.

لنجد حجم الفاصل الزمني: h = (30.0-10.2):5= 3.96 ألف روبل.

ثم ستشمل المجموعة الأولى الشركات التي تبلغ أصولها الثابتة 10.2 ألف روبل. ما يصل إلى 10.2+3.96=14.16 ألف روبل. سيكون هناك 9 شركات من هذا القبيل، وستضم المجموعة الثانية الشركات التي تبلغ أصولها الثابتة 14.16 ألف روبل. ما يصل إلى 14.16+3.96=18.12 ألف روبل. وسيكون هناك 16 شركة من هذا القبيل دعونا نجد الرقمالشركات المدرجة في المجموعات الثالثة والرابعة والخامسة.

نضع سلسلة التوزيع الناتجة في الجدول.

المشكلة 3 . تم الحصول على البيانات التالية لعدد من مؤسسات الصناعة الخفيفة:

قم بتجميع المؤسسات حسب عدد العمال، وتشكيل 6 مجموعات على فترات متساوية. احسب لكل مجموعة:

1. عدد المؤسسات
2. عدد العاملين
3. حجم المنتجات المنتجة سنوياً
4. متوسط ​​الإنتاج الفعلي لكل عامل
5. حجم الأصول الثابتة
6. متوسط ​​الحجمالأصول الثابتة لمؤسسة واحدة
7. متوسط ​​قيمة المنتجات التي تنتجها المؤسسة الواحدة

تقديم نتائج الحساب في الجداول. استخلاص النتائج.

حل

لحل هذه المشكلة، سنختار القيم الأكبر والأصغر لمتوسط ​​عدد العاملين في المؤسسة. هذه هي 43 و 256.

لنجد حجم الفاصل الزمني: h = (256-43):6 = 35.5

ثم ستشمل المجموعة الأولى المؤسسات التي يتراوح متوسط ​​عدد العاملين فيها من 43 إلى 43 + 35.5 = 78.5 شخصًا. سيكون هناك 5 مؤسسات من هذا القبيل، وستضم المجموعة الثانية المؤسسات التي يتراوح متوسط ​​عدد العاملين فيها من 78.5 إلى 78.5 + 35.5 = 114 شخصًا. وسيكون عدد هذه المنشآت 12، وكذلك نجد عدد المنشآت المدرجة في المجموعات الثالثة والرابعة والخامسة والسادسة.

نضع سلسلة التوزيع الناتجة في جدول ونحسب المؤشرات اللازمة لكل مجموعة:

خاتمة : كما يتبين من الجدول، المجموعة الثانية من المؤسسات هي الأكثر عددا. وتضم 12 مؤسسة. أصغر المجموعات هي المجموعتان الخامسة والسادسة (مؤسستان لكل منهما). هذه هي أكبر الشركات (من حيث عدد العمال).

وبما أن المجموعة الثانية هي الأكبر، فإن حجم المنتجات التي تنتجها مؤسسات هذه المجموعة سنويا وحجم الأصول الثابتة أعلى بكثير من غيرها. وفي الوقت نفسه، فإن متوسط ​​الإنتاج الفعلي لكل عامل في مؤسسات هذه المجموعة ليس هو الأكبر. شركات المجموعة الرابعة تقود هنا. تمثل هذه المجموعة أيضًا حجمًا كبيرًا إلى حد ما من الأصول الثابتة.

في الختام، نلاحظ أن متوسط ​​حجم الأصول الثابتة ومتوسط ​​كمية الإنتاج التي تنتجها مؤسسة واحدة يتناسب طرديا مع حجم المؤسسة (من حيث عدد العمال).

عدد المجموعات (الفترات)يتم تحديده تقريبًا بواسطة صيغة Sturgess:

م = 1 + 3.322 × سجل (ن)

حيث ن - الرقم الإجماليوحدات المراقبة (إجمالي عدد العناصر في المجموع، وما إلى ذلك)، السجل (ن) – اللوغاريتم العشريمن ن.

تلقى وفقًا لصيغة Sturgess، يتم عادةً تقريب القيمة إلى أقرب رقم صحيحأرقام، حيث أن عدد المجموعات لا يمكن أن يكون رقمًا كسريًا.

إذا كانت سلسلة فواصل زمنية تحتوي على العديد من المجموعات غير مرضية لبعض المعايير، فيمكنك إنشاء سلسلة فواصل زمنية أخرى عن طريق التقريب معلى العموم عدد أصغرواختيار الأنسب من بين صفين.

- ألا يزيد عدد المجموعات عن 15.

يمكنك أيضًا استخدام الجدول التالي إذا لم يكن من الممكن حساب اللوغاريتم العشري على الإطلاق.

    تحديد عرض الفاصل الزمني

عرض الفاصل الزمنيلسلسلة تباين الفاصل الزمني بفواصل زمنية متساوية يتم تحديدها بواسطة الصيغة:

حيث X max هو الحد الأقصى لقيم x i، X min هو الحد الأدنى لقيم x i؛ م - عدد المجموعات (الفترات).

حجم الفاصل (أنا ) يتم تقريبه عادةً إلى أقرب رقم صحيح،والاستثناءات الوحيدة هي الحالات التي تتم فيها دراسة أدنى تقلبات في إحدى الخصائص (على سبيل المثال، عند تجميع الأجزاء وفقًا لحجم الانحرافات عن القيمة الاسمية، والتي يتم قياسها بكسور المليمتر).

غالبًا ما يتم استخدام القاعدة التالية:

عدد المنازل العشرية

عدد من الرموز بعد الفاصلة

مثال على عرض الفاصل الزمني باستخدام الصيغة

إلى أي علامة نلتف؟

مثال على عرض التباعد الدائري

    تحديد حدود الفترات

الحد الأدنى الفاصل الزمني الأوليتم أخذها مساوية للحد الأدنى لقيمة السمة (في أغلب الأحيان يتم تقريبها أولاً إلى رقم صحيح أصغر بنفس رتبة عرض الفاصل الزمني). على سبيل المثال، x min = 15، i = 130، x n للفاصل الزمني الأول = 10.

س ن1 ≈ س دقيقة

الحد الأعلىالفاصل الزمني الأول يتوافق مع القيمة (Xmin + أنا).

الحد الأدنى للفترة الثانية يساوي دائمًا الحد الأعلى للفترة الأولى. بالنسبة للمجموعات اللاحقة، يتم تحديد الحدود بالمثل، أي تتم إضافة قيمة الفاصل الزمني على التوالي.

س الخامس أنا = س ن أنا + أنا

س ن أنا = س الخامس أنا-1

    تحديد ترددات الفترات.

نحن نحسب عدد القيم التي تقع في كل فترة. وفي الوقت نفسه، نتذكر أنه إذا كانت الوحدة لها قيمة مميزة تساوي قيمة الحد الأعلى للفاصل الزمني، فيجب تعيينها للفاصل الزمني التالي.

    نقوم ببناء سلسلة فواصل على شكل جدول.

    تحديد نقاط منتصف الفواصل الزمنية.

لمزيد من التحليل لسلسلة الفاصل الزمني، سوف تحتاج إلى تحديد قيمة مميزة لكل فاصل زمني. ستكون قيمة السمة هذه مشتركة بين جميع وحدات المراقبة الواقعة ضمن هذه الفترة. أولئك. "تفقد" العناصر الفردية قيم سماتها الفردية ويتم تعيين قيمة سمة مشتركة واحدة لها. لذا معنى عاميكون منتصف الفاصل، وهو ما يشار إليه س" أنا .

باستخدام مثال نمو الأطفال، دعونا ننظر في كيفية بناء سلسلة فواصل زمنية متساوية.

البيانات الأولية متاحة

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

إذا كان المتغير العشوائي قيد الدراسة مستمرا، فإن ترتيب وتجميع القيم المرصودة غالبا لا يسمح بتحديده الصفات الشخصيةتختلف قيمها. ويفسر ذلك حقيقة أن القيم الفردية متغير عشوائييمكن أن تختلف عن بعضها البعض قليلاً حسب الرغبة، وبالتالي، في مجمل البيانات المرصودة، يمكن أن تحدث قيم متطابقة من حيث الحجم نادرًا، وتختلف ترددات المتغيرات قليلاً عن بعضها البعض.

كما أنه من غير المناسب البناء سلسلة منفصلةلمتغير عشوائي متقطع يكون عدد قيمه الممكنة كبيرا. في مثل هذه الحالات، يجب عليك البناء سلسلة الاختلافات الفاصلة توزيعات.

لبناء مثل هذه السلسلة، يتم تقسيم الفاصل الزمني الكامل لتغير القيم المرصودة للمتغير العشوائي إلى سلسلة فترات جزئية وحساب تكرار حدوث قيم القيمة في كل فترة جزئية.

فاصلة سلسلة الاختلاف استدعاء مجموعة مرتبة من الفواصل الزمنية ذات القيم المتغيرة لمتغير عشوائي مع الترددات المقابلة أو الترددات النسبية لقيم المتغير التي تقع في كل منها.

لبناء سلسلة فاصلة تحتاج إلى:

  1. يُعرِّف مقاس فترات جزئية
  2. يُعرِّف عرض فترات؛
  3. اضبطه لكل فاصل زمني قمة و الحد الأدنى ;
  4. تجميع نتائج المراقبة.

1 . يجب تحديد مسألة اختيار عدد وعرض فترات التجميع في كل حالة محددة بناءً على ذلك الأهداف بحث، مقدار عينات و درجة الاختلاف المميزة في العينة.

عدد الفواصل الزمنية تقريبًا ك ويمكن تقديرها على أساس حجم العينة فقط ن واحد من الطرق التالية:

  • وفقا للصيغة ستورجيس : ك = 1 + 3.32 سجل ن ;
  • باستخدام الجدول 1.

الجدول 1

2 . يفضل بشكل عام المساحات ذات العرض المتساوي. لتحديد عرض الفواصل الزمنية ح احسب:

  • نطاق التباين R - قيم العينة: R = س ماكس - س دقيقة ,

أين xmax و xmin - خيارات أخذ العينات القصوى والدنيا؛

  • عرض كل فاصل زمني ح تحددها الصيغة التالية: ح = ص / ك .

3 . الحد الأدنى الفاصل الزمني الأول × ح1 تم تحديده بحيث يكون خيار العينة الأدنى xmin سقطت تقريبًا في منتصف هذه الفترة: س ح1 = س دقيقة - 0.5 ح .

فترات متوسطةتم الحصول عليها عن طريق إضافة طول الفاصل الجزئي إلى نهاية الفاصل الزمني السابق ح :

س مرحبا = س مرحبا-1 +ح.

يستمر إنشاء مقياس الفاصل الزمني بناءً على حساب حدود الفاصل الزمني حتى القيمة × مرحبا يرضي العلاقة:

× مرحبا< x max + 0,5·h .

4 . وفقا لمقياس الفاصل الزمني، يتم تجميع القيم المميزة - لكل فاصل جزئي يتم حساب مجموع الترددات ن ط الخيار المتضمن في أنا الفاصل الزمني. وفي هذه الحالة تتضمن الفترة قيم المتغير العشوائي التي تكون أكبر من أو تساوي الحد الأدنى وأقل من الحد الأعلى للفترة.

المضلع والرسم البياني

من أجل الوضوح، يتم إنشاء الرسوم البيانية التوزيعية الإحصائية المختلفة.

بناءً على بيانات سلسلة التباين المنفصلة، ​​قاموا بالبناء مضلع الترددات أو الترددات النسبية.

تردد المضلع × 1 ; ن 1 ), (× 2 ; ن 2 ), ..., (س ك ; ن ك ). لإنشاء مضلع ترددي، يتم رسم الخيارات على محور الإحداثي السيني. × ط وعلى الإحداثي - الترددات المقابلة ن ط . النقاط ( × ط ; ن ط ) متصلة بأجزاء مستقيمة ويتم الحصول على مضلع تردد (الشكل 1).

مضلع الترددات النسبيةيسمى الخط المتقطع الذي تربط أجزائه النقاط ( × 1 ; ث 1 ), (× 2 ; ث 2 ), ..., (س ك ; أسبوع ). لبناء مضلع من الترددات النسبية، يتم رسم الخيارات على محور الإحداثي السيني × ط وعلى الإحداثي - الترددات النسبية المقابلة دبليو اي . النقاط ( × ط ; دبليو اي ) متصلة بقطاعات مستقيمة ويتم الحصول على مضلع الترددات النسبية.

متى علامة مستمرة من المستحسن البناء الرسم البياني .

الرسم البياني للتردديسمى الشكل المتدرج المكون من مستطيلات، قواعدها عبارة عن فترات جزئية من الطول ح ، والارتفاعات تساوي النسبة ن ط / ح (كثافة التردد).

لإنشاء رسم بياني ترددي، يتم وضع فترات جزئية على محور الإحداثي السيني، ويتم رسم قطاعات موازية لمحور الإحداثي السيني فوقها على مسافة ن ط / ح .

عادة ما يتم عرض نتائج تجميع البيانات الإحصائية المجمعة في شكل سلسلة توزيع. سلسلة التوزيع هي توزيع مرتب للوحدات السكانية إلى مجموعات حسب الخاصية التي تتم دراستها.

تنقسم سلاسل التوزيع إلى نسبية ومتغيرة، اعتمادًا على الخاصية التي تشكل أساس التجميع. إذا كانت السمة نوعية، فإن سلسلة التوزيع تسمى سمة. مثال سلسلة منسوبةهو توزيع المنشآت والمنظمات حسب نوع الملكية (انظر الجدول 3.1).

إذا كانت الخاصية التي بنيت بها سلسلة التوزيع كمية، فإن السلسلة تسمى متغيرة.

تتكون السلسلة المتغيرة للتوزيع دائمًا من جزأين: المتغير والترددات المقابلة (أو الترددات). المتغير هو القيمة التي يمكن أن تأخذها الخاصية في الوحدات السكانية، في حين أن التكرار هو عدد وحدات المراقبة التي لها قيمة معينة للخاصية. مجموع الترددات يساوي دائمًا حجم السكان. في بعض الأحيان، بدلاً من التكرارات، يتم حساب التكرارات - وهي ترددات يتم التعبير عنها إما ككسور من الوحدة (عندها يكون مجموع كل التكرارات يساوي 1)، أو كنسبة مئوية من حجم السكان (مجموع التكرارات سيكون تكون مساوية لـ 100%).

سلسلة التباين منفصلة وفاصلة. بالنسبة للسلاسل المنفصلة (الجدول 3.7)، يتم التعبير عن الخيارات أرقام محددة، في أغلب الأحيان كاملة.

الجدول 3.8. توزيع العاملين حسب مدة العمل في شركة التأمين
الوقت الذي يقضيه في العمل في الشركة سنوات كاملة(خيارات) عدد الموظفين
الرجل (الترددات) في المائة من الإجمالي (التكرار)
تصل إلى سنة 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
المجموع 129 100,0

في سلسلة الفواصل الزمنية (انظر الجدول 3.2)، يتم تحديد قيم المؤشر في شكل فترات زمنية. للفترات حدان: السفلي والعلوي. يمكن أن تكون الفترات مفتوحة أو مغلقة. المفتوحة ليس لها أحد الحدود، كما هو الحال في الجدول. 3.2 الفترة الأولى ليس لها حد أدنى، والأخيرة ليس لها حدود عليا. عند إنشاء سلسلة فواصل زمنية، اعتمادًا على طبيعة تشتت قيم السمات، يتم استخدام فترات متساوية وغير متساوية (يوضح الجدول 3.2 سلسلة تباين بفواصل زمنية متساوية).

إذا أخذت الخاصية عددًا محدودًا من القيم، عادةً لا يزيد عن 10، يتم إنشاء سلسلة توزيع منفصلة. إذا كان الخيار أكبر، فإن السلسلة المنفصلة تفقد وضوحها؛ وفي هذه الحالة، يُنصح باستخدام صيغة الفاصل الزمني لسلسلة التباين. مع الاختلاف المستمر للخاصية، عندما تختلف قيمها ضمن حدود معينة عن بعضها البعض بمقدار صغير بشكل تعسفي، يتم أيضًا إنشاء سلسلة توزيع فاصلة.

3.3.1. بناء سلسلة الاختلاف المنفصلة

دعونا نفكر في منهجية إنشاء سلسلة تباين منفصلة باستخدام مثال.

مثال 3.2. تتوفر البيانات التالية عن التكوين الكمي لـ 60 عائلة:

ومن أجل الحصول على فكرة عن توزيع الأسر حسب عدد أفرادها، ينبغي بناء سلسلة التنويعات. وبما أن الإشارة تأخذ عددًا محدودًا من القيم الصحيحة، فإننا نبني سلسلة تباين منفصلة. للقيام بذلك، يوصى أولاً بكتابة جميع قيم السمة (عدد أفراد الأسرة) بترتيب تصاعدي (أي ترتيب البيانات الإحصائية):

ثم تحتاج إلى حساب عدد العائلات التي لها نفس التركيبة. عدد أفراد الأسرة (قيمة الخاصية المتغيرة) عبارة عن متغيرات (سنشير إليها بـ x)، وعدد العائلات التي لها نفس التركيبة عبارة عن ترددات (سنشير إليها بـ f). نقدم نتائج التجميع في شكل سلسلة التوزيع المتباينة المنفصلة التالية:

الجدول 3.11.
عدد أفراد الأسرة (x) عدد العائلات (ذ)
1 8
2 14
3 20
4 9
5 5
6 4
المجموع 60

3.3.2. بناء سلسلة الاختلاف الفاصل

دعونا نوضح منهجية بناء سلسلة توزيع التباين الفاصل باستخدام المثال التالي.

مثال 3.3. نتيجة ل المراقبة الإحصائيةتم استلام البيانات التالية حول متوسطأسعار الفائدة لـ 50 بنكًا تجاريًا (٪):

الجدول 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

كما نرى، فإن عرض مثل هذه المجموعة من البيانات أمر غير مريح للغاية؛ بالإضافة إلى ذلك، لا تظهر أي أنماط من التغييرات في المؤشر. دعونا نبني سلسلة التوزيع الفاصلة.

  1. دعونا نحدد عدد الفواصل الزمنية.

    غالبًا ما يتم تحديد عدد الفواصل الزمنية في الممارسة من قبل الباحث نفسه بناءً على أهداف كل ملاحظة محددة. وفي الوقت نفسه، يمكن أيضًا حسابها رياضيًا باستخدام صيغة Sturgess

    ن = 1 + 3.322 لتر،

    حيث n هو عدد الفواصل الزمنية؛

    N هو حجم السكان (عدد وحدات المراقبة).

    في مثالنا نحصل على: n = 1 + 3.322lgN = 1 + 3.322lg50 = 6.6"7.

  2. دعونا نحدد حجم الفترات (i) باستخدام الصيغة

    حيث × ماكس - القيمة القصوىلافتة؛

    x دقيقة - الحد الأدنى لقيمة السمة.

    على سبيل المثال لدينا

    تكون فترات سلسلة التباين واضحة إذا كانت حدودها لها قيم "مستديرة"، لذلك دعونا نقرب قيمة الفترة من 1.9 إلى 2، والحد الأدنى لقيمة الخاصية 12.3 إلى 12.0.

  3. دعونا نحدد حدود الفواصل الزمنية.

    تتم كتابة الفترات، كقاعدة عامة، بحيث يكون الحد الأعلى لفاصل زمني واحد هو أيضًا الحد الأدنى للفاصل الزمني التالي. لذلك، في مثالنا نحصل على: 12.0-14.0؛ 14.0-16.0؛ 16.0-18.0؛ 18.0-20.0؛ 20.0-22.0؛ 22.0-24.0؛ 24.0-26.0.

    مثل هذا الإدخال يعني أن السمة مستمرة. إذا تم قبول متغيرات العلامة بشكل صارم قيم معينةعلى سبيل المثال، الأعداد الصحيحة فقط، ولكن عددها كبير جدًا بحيث لا يمكن إنشاء سلسلة منفصلة، ​​ثم يمكنك إنشاء سلسلة فاصل زمني، حيث لن يتطابق الحد الأدنى للفاصل الزمني مع الحد العلوي للفاصل الزمني التالي (وهذا يعني أن الميزة منفصلة). على سبيل المثال، في توزيع موظفي المؤسسة حسب العمر، يمكنك إنشاء مجموعات الفواصل الزمنية التالية من السنوات: 18-25، 26-33، 34-41، 42-49، 50-57، 58-65، 66 وأكثر.

    بالإضافة إلى ذلك، في مثالنا، يمكننا أن نجعل الفواصل الزمنية الأولى والأخيرة مفتوحة، وما إلى ذلك. الكتابة: ما يصل إلى 14.0؛ 24.0 وما فوق.

  4. استنادا إلى البيانات الأولية، سوف نقوم ببناء سلسلة مرتبة. للقيام بذلك، نكتب بترتيب تصاعدي القيم التي تأخذها العلامة. ونعرض النتائج في الجدول: الجدول 3.13. سلسلة مرتبة من أسعار الفائدة للبنوك التجارية
    سعر البنك % (خيارات)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. دعونا نحسب الترددات.

    عند حساب الترددات، قد ينشأ موقف عندما تقع قيمة الخاصية على حدود فترة ما. في هذه الحالة، يمكنك الاسترشاد بالقاعدة: يتم تعيين وحدة معينة للفاصل الزمني الذي تكون قيمته هي الحد الأعلى. لذا، فإن القيمة 16.0 في مثالنا ستشير إلى الفترة الثانية.

سيتم عرض نتائج التجميع التي تم الحصول عليها في مثالنا في جدول.

الجدول 3.14. توزيع البنوك التجارية حسب سعر الإقراض
معدل قصير،٪ عدد البنوك والوحدات (الترددات) الترددات المتراكمة
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
المجموع 50 -

يعرض العمود الأخير من الجدول التكرارات المتراكمة، والتي يتم الحصول عليها عن طريق جمع التكرارات بشكل تسلسلي بدءًا من الأول (على سبيل المثال، للفاصل الزمني الأول - 5، للفاصل الزمني الثاني 5 + 9 = 14، للفاصل الزمني الثالث 5 + 9 + 4 = 18، الخ.). يظهر التكرار المتراكم، على سبيل المثال، 33، أن 33 بنكًا لديها معدل قرض لا يتجاوز 20٪ (الحد الأعلى للفترة المقابلة).

في عملية تجميع البيانات عند إنشاء سلسلة التباين، يتم أحيانًا استخدام فترات غير متساوية. ينطبق هذا على الحالات التي تكون فيها القيم المميزة خاضعة للحساب أو المتوالية الهندسيةأو عندما يؤدي تطبيق معادلة Sturgess إلى ظهور مجموعات فواصل "فارغة" لا تحتوي على وحدة مراقبة واحدة. ومن ثم يتم تحديد حدود الفترات بشكل تعسفي من قبل الباحث نفسه بناء على ذلك الفطرة السليمةوأهداف المسح أو استخدام الصيغ. لذلك، لتغيير البيانات في المتوالية العددية، يتم حساب حجم الفواصل الزمنية على النحو التالي.