tiểu sử thông số kỹ thuật Phân tích

Chuỗi phân phối thống kê. Chuỗi thống kê rời rạc

Cách đơn giản nhất để khái quát hóa tài liệu thống kê là xây dựng chuỗi. Kết quả của một bản tóm tắt của một nghiên cứu thống kê có thể là chuỗi phân phối.

Sau khi xác định đặc điểm phân nhóm, số lượng nhóm và khoảng cách phân nhóm, dữ liệu tóm tắt và phân nhóm được trình bày dưới dạng chuỗi phân phối và được trình bày dưới dạng bảng thống kê.

Một loạt phân phối là một loại nhóm.

Gần phân phối trong thống kê được gọi là sự phân bố có thứ tự của các đơn vị dân số thành các nhóm theo bất kỳ một thuộc tính nào: định tính hoặc định lượng.

  1. Các loại chuỗi phân phối

Tùy thuộc vào đặc điểm cơ bản hình thành chuỗi phân phối, chuỗi phân phối thuộc tính và biến thể được phân biệt:

    thuộc tính được gọi là chuỗi phân phối được xây dựng trên cơ sở định tính;

    chuỗi phân phối được gọi là biến thể, được xây dựng theo thứ tự tăng dần hoặc giảm dần của các giá trị của một đặc điểm số lượng.

Chuỗi biến thể của phân phối bao gồm hai cột. Cột đầu tiên chứa các giá trị định lượng của đặc tính biến, được gọi là biến thể và được ký hiệu. Biến thể rời rạc - được biểu thị dưới dạng số nguyên. Tùy chọn khoảng thời gian nằm trong phạm vi từ và đến. Tùy thuộc vào loại biến thể, có thể xây dựng một chuỗi biến thể rời rạc hoặc gián đoạn. Cột thứ hai chứa số biến thể cụ thể được biểu thị dưới dạng tần số hoặc tần suất:

    tần suất là số tuyệt đối cho biết số lần một giá trị tính năng nhất định xuất hiện trong tổng hợp; tổng của tất cả các tần số phải bằng số đơn vị của toàn bộ dân số;

    tần số là tần suất được biểu thị bằng phần trăm của tổng số; tổng của tất cả các tần số được biểu thị dưới dạng phần trăm phải bằng 100% theo phân số của một.

loạt biến thể được đặc trưng bởi hai yếu tố: biến thể (X) và tần suất (f). Một biến thể là một giá trị riêng biệt của một dấu hiệu của một đơn vị hoặc nhóm dân số riêng biệt. Số hiển thị số lần xuất hiện của một giá trị tính năng cụ thể được gọi là tần số. Nếu tần số được biểu thị dưới dạng một số tương đối, thì nó được gọi là tần số.

Chuỗi biến thể có thể là:

    khoảng, khi các ranh giới "từ" và "đến" được xác định, chuỗi phân phối khoảng có thể được biểu diễn bằng đồ họa dưới dạng biểu đồ;

    rời rạc, khi đặc điểm đang nghiên cứu được đặc trưng bởi một số nhất định.

  1. Biểu diễn đồ họa của chuỗi phân phối

Chuỗi phân phối được hiển thị bằng hình ảnh đồ họa.

Chuỗi phân phối được hiển thị dưới dạng:

    đa giác;

    biểu đồ;

    tích lũy;

Khi xây dựng bãi rác trên trục hoành (abscissa), các giá trị của thuộc tính thay đổi được vẽ và trên trục tung (trục y) - tần số hoặc tần suất.

để xây dựng biểu đồ trục hoành biểu thị các giá trị của ranh giới của các khoảng và trên cơ sở của chúng, các hình chữ nhật được xây dựng, chiều cao của chúng tỷ lệ thuận với tần số (hoặc tần số).

Sự phân bố của một đặc điểm trong một chuỗi biến thiên theo tần số tích lũy (tần số) được mô tả bằng cách sử dụng tích lũy.

tích lũy hoặc đường cong tích lũy, trái ngược với đa giác, được xây dựng trên các tần số hoặc tần số tích lũy. Trong trường hợp này, các giá trị đặc trưng được đặt trên trục hoành và các tần số hoặc tần số tích lũy được đặt trên trục tọa độ.

Ogiva được xây dựng tương tự như tích lũy với sự khác biệt duy nhất là các tần số tích lũy được đặt trên trục hoành và các giá trị tính năng được đặt trên trục tung độ.

Một biến thể của tích lũy là đường cong nồng độ hoặc biểu đồ Lorenz. Để vẽ đường cong nồng độ, cả hai trục của hệ tọa độ hình chữ nhật được chia tỷ lệ phần trăm từ 0 đến 100. Trong trường hợp này, trục hoành biểu thị tần số tích lũy và trục tọa độ hiển thị giá trị tích lũy của phần (trong phần trăm) theo khối lượng của tính năng.

Chủ đề 9. Chuỗi phân phối

Chuỗi phân phối thống kê- đây là đặc điểm chính của dân số thống kê đại chúng, một sự phân tách có thứ tự các đơn vị của dân số được nghiên cứu thành các nhóm theo tiêu chí nhóm. Bất kỳ chuỗi phân phối thống kê nào cũng bao gồm hai yếu tố:

1) các giá trị riêng lẻ của thuộc tính biến ( tùy chọn );

2) các giá trị cho biết số lần một biến thể nhất định được lặp lại ( tần số ).

Ghi chú. Các tần số được biểu thị dưới dạng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số được gọi là tần số ; là số của chuỗi phân phối được biểu thị bằng tổng các tần số.

Nếu một đặc điểm định tính được lấy làm cơ sở để phân nhóm, thì chuỗi phân phối như vậy được gọi là thuộc tính(phân bổ theo loại hình công việc, theo giới tính, theo nghề nghiệp, theo tôn giáo, quốc tịch, v.v.). Nếu chuỗi phân phối được xây dựng trên cơ sở định lượng, thì chuỗi đó được gọi là đa dạng. Để xây dựng một chuỗi biến thiên có nghĩa là sắp xếp thứ tự phân phối định lượng của các đơn vị dân số theo các giá trị của thuộc tính, sau đó đếm số đơn vị dân số có các giá trị này (xây dựng bảng nhóm).

Chỉ định ba dạng chuỗi biến thiên:

1) hàng xếp- đây là sự phân bố của các đơn vị dân số riêng lẻ theo thứ tự tăng dần hoặc giảm dần của tính trạng đang nghiên cứu; xếp hạng giúp dễ dàng phân chia dữ liệu định lượng thành các nhóm, phát hiện ngay các giá trị nhỏ nhất và lớn nhất của một tính năng, làm nổi bật các giá trị thường được lặp lại nhất; các dạng khác của chuỗi biến thể - bảng nhóm, được biên soạn theo tính chất biến thiên của các giá trị của tính trạng nghiên cứu;

2) chuỗi rời rạc- đây là một chuỗi biến thể, việc xây dựng dựa trên các dấu hiệu có sự thay đổi không liên tục, giữa chúng không có giá trị trung gian (các dấu hiệu riêng biệt - danh mục thuế quan, số lượng trẻ em trong gia đình, số lượng nhân viên trong doanh nghiệp…); những dấu hiệu này chỉ có thể nhận một số hữu hạn các giá trị nhất định;

Chuỗi rời rạc đại diện bảng nhóm, bao gồm hai cột: cột đầu tiên biểu thị giá trị cụ thể của thuộc tính và cột thứ hai - số lượng đơn vị dân số có giá trị nhất định của thuộc tính;

3) nếu thuộc tính có sự thay đổi liên tục (số lượng thu nhập, thời gian làm việc, nguyên giá tài sản cố định của doanh nghiệp, v.v., có thể lấy bất kỳ giá trị nào trong giới hạn nhất định), thì đối với thuộc tính này, cần phải xây dựng chuỗi khoảng thời gian (với các khoảng bằng nhau hoặc không bằng nhau).

bảng nhómở đây cũng có hai cột. Cái đầu tiên cho biết giá trị của tính năng trong khoảng "từ - đến" (tùy chọn), cái thứ hai - số lượng đơn vị được bao gồm trong khoảng (tần số). Rất thường xuyên, bảng được bổ sung một cột trong đó tần số tích lũy S được tính toán, cho biết có bao nhiêu đơn vị dân số có giá trị đặc trưng không lớn hơn giá trị này. Tần số của chuỗi f có thể được thay thế bằng các chi tiết cụ thể w, được biểu thị bằng số tương đối (cổ phần hoặc tỷ lệ phần trăm). Chúng là tỷ số giữa các tần số của mỗi khoảng trên tổng của chúng (9.1):



(9.1)

Khi xây dựng một dãy biến thiên với các giá trị khoảng, trước hết cần xác lập giá trị của khoảng i, được định nghĩa là tỷ số của khoảng biến thiên R với số nhóm n (9.2):

trong đó R = x max - x min; n = 1 + 3,322 lgN( công thức cá tầm); N là tổng số đơn vị dân cư.

Chuỗi biến thiên theo khoảng cũng có thể được xây dựng cho các đối tượng có biến thể rời rạc. Việc chỉ ra một giá trị riêng biệt của một đặc điểm rời rạc trong một nghiên cứu thống kê thường không phù hợp, bởi vì điều này, như một quy luật, gây khó khăn cho việc xem xét sự biến đổi của tính trạng. Do đó, các giá trị rời rạc có thể có của thuộc tính được phân phối thành các nhóm và các tần số tương ứng (chi tiết cụ thể) được tính toán. Khi xây dựng một chuỗi khoảng dựa trên một tính năng rời rạc, ranh giới của các khoảng liền kề không lặp lại nhau: khoảng tiếp theo bắt đầu từ khoảng tiếp theo theo thứ tự (sau giá trị trên của khoảng trước đó) giá trị rời rạc của tính năng.

Khi so sánh tần số của một chuỗi với các khoảng không bằng nhau, mật độ phân bố được tính để đặc trưng cho độ đầy đủ của chúng. Mật độ trung bình trong khoảng là thương số chia tần số và đặc biệt cho kích thước của khoảng thời gian. Trong trường hợp đầu tiên, mật độ là tuyệt đối, trong trường hợp thứ hai - tương đối. Mật độ trung bình cho biết có bao nhiêu đơn vị hoặc tỷ lệ phần trăm của chúng trên mỗi đơn vị tùy chọn đo lường. Tần suất, tính đặc hiệu, mật độ và tần suất tích lũy là các hàm khác nhau về độ lớn của các biến thể.

Trong quá trình phân tích dữ liệu thống kê, được biểu thị bằng chuỗi phân phối, ngoài kiến ​​​​thức về bản chất của phân phối (hoặc cấu trúc của dân số), có thể tính toán các chỉ số thống kê khác nhau (đặc điểm số), ở dạng tổng quát phản ánh các đặc điểm của phân phối được nghiên cứu đặc trưng. Có thể chia các đặc điểm (chỉ số) này thành 3 nhóm chính

1) đặc điểm trung tâm phân phối(trung bình, chế độ, trung bình);

2) mức độ của các đặc điểm biến đổi(khoảng biến thiên, độ lệch tuyến tính trung bình, phương sai, độ lệch chuẩn, hệ số biến thiên);

3) đặc điểm của hình thức (kiểu) phân phối(các chỉ số về độ nhọn và độ bất đối xứng, đặc điểm cấp bậc, đường cong phân phối).

Cách đáng tin cậy nhất để xác định các mẫu phân phối như sau:
1) tăng số trường hợp được quan sát (theo quy luật số lớn, trong chuỗi như vậy, các sai lệch ngẫu nhiên so với mẫu chung đối với các giá trị riêng lẻ sẽ triệt tiêu lẫn nhau);

2) ban đầu chia tập hợp thành số lượng nhóm tối đa có thể, sau đó, giảm dần số lượng nhóm, tối ưu hóa việc phân nhóm theo cách xác định các mẫu phân phối.

Khi thực hiện phương pháp này, đặc điểm mẫu của phân bố này sẽ ngày càng rõ ràng hơn và đường đứt đoạn mô tả đa giác sẽ tiến tới một số đường trơn và trong giới hạn, sẽ biến thành một đường cong.

Hãy để một mẫu được lấy từ dân số nói chung, và X 1 quan sát P 1 lần, X 2 - P 2 lần, xk - p đến lần và là cỡ mẫu. Giá trị quan sát được X 1 được gọi là các biến thể và chuỗi các biến thể, được viết theo thứ tự tăng dần - loạt biến thể .

Số lượng quan sát của các biến thể được gọi là tần số và tỷ lệ của nó so với kích thước mẫu được gọi là tần số tương đối.

Sự định nghĩa. Luật thống kê (thực nghiệm) về phân phối mẫu, hoặc đơn giản phân phối thống kê của mẫu gọi biến thể trình tự và tần số tương ứng của chúng n tôi hoặc tần số tương đối.

Phân phối thống kê của một mẫu được biểu diễn thuận tiện dưới dạng bảng phân phối tần số được gọi là chuỗi phân phối rời rạc thống kê:

(tổng của tất cả các tần số tương đối bằng một).

ví dụ 1. Khi đo ở các nhóm đối tượng đồng nhất thu được các mẫu sau: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 ( nhịp tim). Dựa trên những kết quả này, biên soạn một chuỗi thống kê về phân bố tần suất và tần suất tương đối.

Phán quyết. 1) Chuỗi thống kê phân bố tần suất:

Kiểm soát: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Đa giác tần sốđược gọi là đường đứt đoạn, các đoạn nối các điểm Để xây dựng một đa giác tần số trên trục hoành, loại bỏ các tùy chọn X 2 và trên trục y - tần số tương ứng số Pi . Các điểm được kết nối bởi các phân đoạn và nhận được một đa giác tần số.

Đa giác tần số tương đốiđược gọi là một đường đứt đoạn, các phân đoạn kết nối các điểm. Để xây dựng một đa giác có tần số tương đối trên trục hoành, hãy loại bỏ các tùy chọn X i và trên trục y các tần số tương ứng w tôi . Các điểm được kết nối bởi các phân đoạn và nhận được một đa giác có tần số tương đối

ví dụ 2 Xây dựng đa giác tần số và đa giác tần số tương đối theo dữ liệu trong Ví dụ 1.

Phán quyết: Sử dụng chuỗi phân phối thống kê rời rạc được tổng hợp trong ví dụ 1, chúng tôi xây dựng đa giác tần số và đa giác tần số tương đối:


2. Chuỗi phân phối khoảng thống kê. thanh biểu đồ.

Một chuỗi rời rạc thống kê (hoặc một hàm phân bố theo kinh nghiệm) thường được sử dụng khi không có quá nhiều lựa chọn khác nhau trong mẫu hoặc khi sự rời rạc là cần thiết đối với nhà nghiên cứu vì lý do này hay lý do khác. Nếu đặc điểm của dân số chung X mà chúng ta quan tâm được phân phối liên tục hoặc tính rời rạc của nó là không thực tế (hoặc không thể) tính đến, thì các tùy chọn được nhóm thành các khoảng.


Phân phối thống kê cũng có thể được chỉ định dưới dạng một chuỗi các khoảng và tần số tương ứng của chúng (tần suất tương ứng với khoảng được lấy bằng tổng các tần số trong khoảng này).

1. R(phạm vi) = X max -X ​​min

2. k- số nhóm

3. (Công thức Sturges)

4. a = x min, b = x max

Thật thuận tiện khi biểu diễn nhóm kết quả dưới dạng bảng tần số, được gọi là chuỗi phân phối khoảng thống kê:

khoảng thời gian nhóm ...
Tần suất ...

Một bảng tương tự có thể được hình thành bằng cách thay thế các tần số n tôi tần số tương đối.

Giai đoạn quan trọng nhất trong nghiên cứu các hiện tượng và quá trình kinh tế - xã hội là hệ thống hóa dữ liệu sơ cấp và trên cơ sở đó, thu được đặc điểm tóm tắt của toàn bộ đối tượng bằng cách sử dụng các chỉ số khái quát hóa, đạt được bằng cách tóm tắt và nhóm tài liệu thống kê sơ cấp.

tổng hợp thống kê - đây là một phức hợp các thao tác tuần tự để khái quát hóa các sự kiện đơn lẻ cụ thể tạo thành một tập hợp, để xác định các đặc điểm và mô hình điển hình vốn có trong toàn bộ hiện tượng đang nghiên cứu. Tiến hành tổng hợp thống kê bao gồm các bước sau :

  • lựa chọn tính năng nhóm;
  • xác định thứ tự thành lập các nhóm;
  • xây dựng hệ thống chỉ tiêu thống kê đặc trưng cho các nhóm và đối tượng nói chung;
  • phát triển bố cục của các bảng thống kê để trình bày kết quả tóm tắt.

nhóm thống kê được gọi là sự phân chia các đơn vị dân số được nghiên cứu thành các nhóm đồng nhất theo các đặc điểm nhất định cần thiết cho chúng. Nhóm là phương pháp thống kê quan trọng nhất để tổng hợp số liệu thống kê, là cơ sở để tính toán chính xác các chỉ tiêu thống kê.

Có các loại nhóm sau: kiểu chữ, cấu trúc, phân tích. Tất cả các nhóm này được thống nhất bởi thực tế là các đơn vị của đối tượng được chia thành các nhóm theo một số thuộc tính.

biển báo nhóm được gọi là dấu hiệu mà các đơn vị dân số được chia thành các nhóm riêng biệt. Các kết luận của một nghiên cứu thống kê phụ thuộc vào sự lựa chọn chính xác của một thuộc tính nhóm. Để làm cơ sở cho việc phân nhóm, cần sử dụng các đặc điểm quan trọng, đã được chứng minh về mặt lý thuyết (định lượng hoặc định tính).

Dấu hiệu định lượng của nhóm có một biểu thức số (khối lượng giao dịch, tuổi của một người, thu nhập gia đình, v.v.) và đặc điểm chất lượng của nhóm phản ánh tình trạng của đơn vị dân cư (giới tính, tình trạng hôn nhân, ngành nghề kinh doanh của doanh nghiệp, hình thức sở hữu, v.v.).

Sau khi cơ sở của việc phân nhóm được xác định, câu hỏi về số lượng nhóm mà dân số nghiên cứu nên được chia sẽ được quyết định. Số lượng các nhóm phụ thuộc vào mục tiêu của nghiên cứu và loại chỉ số làm cơ sở cho việc phân nhóm, khối lượng quần thể, mức độ biến đổi của tính trạng.

Ví dụ, việc nhóm các doanh nghiệp theo hình thức sở hữu có tính đến tài sản của thành phố, liên bang và tài sản của các chủ thể của liên đoàn. Nếu việc phân nhóm được thực hiện theo một thuộc tính định lượng, thì cần đặc biệt chú ý đến số lượng đơn vị của đối tượng đang nghiên cứu và mức độ dao động của thuộc tính nhóm.

Khi số lượng nhóm được xác định, thì khoảng thời gian nhóm sẽ được xác định. khoảng thời gian - đó là những giá trị của một đặc tính biến thiên nằm trong những giới hạn nhất định. Mỗi khoảng có giá trị riêng, giới hạn trên và dưới hoặc ít nhất một trong số chúng.

Giới hạn dưới của khoảng được gọi là giá trị nhỏ nhất của thuộc tính trong khoảng và giới hạn trên - giá trị lớn nhất của thuộc tính trong khoảng. Giá trị khoảng là sự khác biệt giữa giới hạn trên và dưới.

Khoảng cách nhóm, tùy thuộc vào kích thước của chúng, là: bằng nhau và không bằng nhau. Nếu sự biến đổi của tính trạng biểu hiện ở những ranh giới tương đối hẹp và sự phân bố đều thì người ta xây dựng được sự phân nhóm với những khoảng cách đều nhau. Giá trị của một khoảng bằng được xác định theo công thức sau :

trong đó Xmax, Xmin - giá trị lớn nhất và nhỏ nhất của thuộc tính trong tổng hợp; n là số nhóm.

Nhóm đơn giản nhất, trong đó mỗi nhóm được chọn được đặc trưng bởi một chỉ số, là một chuỗi phân phối.

Chuỗi phân phối thống kê - đây là sự phân bố có thứ tự của các đơn vị dân số thành các nhóm theo một thuộc tính nhất định. Tùy thuộc vào đặc điểm cơ bản hình thành chuỗi phân phối, chuỗi phân phối thuộc tính và biến thể được phân biệt.

thuộc tính họ gọi chuỗi phân phối được xây dựng theo các đặc điểm định tính, tức là các dấu hiệu không có biểu thức bằng số (phân phối theo loại lao động, theo giới tính, theo nghề nghiệp, v.v.). Chuỗi phân phối thuộc tính đặc trưng cho thành phần của dân số theo một hoặc một tính năng thiết yếu khác. Được thực hiện trong nhiều giai đoạn, những dữ liệu này cho phép chúng tôi nghiên cứu sự thay đổi trong cấu trúc.

hàng biến thể được gọi là chuỗi phân phối được xây dựng trên cơ sở định lượng. Bất kỳ chuỗi biến thể nào cũng bao gồm hai yếu tố: biến thể và tần số. Tùy chọn các giá trị riêng của thuộc tính mà nó nhận trong chuỗi biến thiên được gọi, tức là giá trị cụ thể của thuộc tính biến đổi.

Tần suất được gọi là số lượng biến thể riêng lẻ hoặc từng nhóm của chuỗi biến thể, nghĩa là đây là những con số cho biết tần suất xuất hiện của một số biến thể nhất định trong chuỗi phân phối. Tổng của tất cả các tần số xác định kích thước của toàn bộ dân số, khối lượng của nó. Tần suất tần số được gọi, được biểu thị bằng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số. Theo đó, tổng các tần số bằng 1 hoặc 100%.

Tùy thuộc vào bản chất biến dị của tính trạng, người ta phân biệt ba dạng biến dị của chuỗi: chuỗi biến dị, chuỗi rời rạc và chuỗi biến dị.

Chuỗi biến thể được xếp hạng - đây là sự phân bố của các đơn vị dân số riêng lẻ theo thứ tự tăng dần hoặc giảm dần của tính trạng đang nghiên cứu. Xếp hạng giúp dễ dàng phân chia dữ liệu định lượng thành các nhóm, phát hiện ngay các giá trị nhỏ nhất và lớn nhất của một tính năng, làm nổi bật các giá trị thường lặp lại nhất.

Chuỗi biến thể rời rạc đặc trưng cho sự phân bố của các đơn vị dân cư theo một thuộc tính rời rạc chỉ nhận giá trị nguyên. Ví dụ: danh mục thuế quan, số trẻ em trong gia đình, số lượng nhân viên trong doanh nghiệp, v.v.

Nếu một dấu hiệu có sự thay đổi liên tục, trong những giới hạn nhất định có thể nhận bất kỳ giá trị nào ("từ - đến"), thì đối với dấu hiệu này, bạn cần xây dựng chuỗi biến thiên khoảng . Ví dụ như mức thu nhập, kinh nghiệm làm việc, nguyên giá tài sản cố định của doanh nghiệp, v.v.

Ví dụ về giải quyết các vấn đề về chủ đề "Tóm tắt và nhóm thống kê"

Nhiệm vụ 1 . Có thông tin về số lượng sách mà sinh viên nhận được theo đăng ký trong năm học vừa qua.

Xây dựng một chuỗi phân phối biến phân xa và rời rạc, biểu thị các phần tử của chuỗi.

Phán quyết

Bộ này là một bộ tùy chọn cho số lượng sách học sinh nhận được. Hãy để chúng tôi đếm số lượng các biến thể như vậy và sắp xếp chúng dưới dạng một chuỗi phân phối rời rạc được xếp hạng và biến thể.

Nhiệm vụ 2 . Có dữ liệu về giá trị tài sản cố định của 50 doanh nghiệp, nghìn rúp.

Xây dựng chuỗi phân phối, đánh dấu 5 nhóm doanh nghiệp (ở các khoảng cách đều nhau).

Phán quyết

Đối với lời giải ta chọn các giá trị lớn nhất và nhỏ nhất của nguyên giá tài sản cố định của doanh nghiệp. Đây là 30,0 và 10,2 nghìn rúp.

Tìm kích thước của khoảng: h \u003d (30,0-10,2): 5 \u003d 3,96 nghìn rúp.

Sau đó, nhóm đầu tiên sẽ bao gồm các doanh nghiệp có số lượng tài sản cố định từ 10,2 nghìn rúp. lên tới 10,2 + 3,96 = 14,16 nghìn rúp. Sẽ có 9 doanh nghiệp như vậy, nhóm thứ hai sẽ bao gồm các doanh nghiệp có số lượng tài sản cố định từ 14,16 nghìn rúp. lên tới 14,16 + 3,96 = 18,12 nghìn rúp. Sẽ có 16 doanh nghiệp như vậy Tương tự ta tìm được số doanh nghiệp thuộc các nhóm thứ ba, thứ tư và thứ năm.

Chuỗi phân phối kết quả được đặt trong bảng.

nhiệm vụ 3 . Đối với một số doanh nghiệp công nghiệp nhẹ, dữ liệu sau đây đã thu được:

Chia nhóm doanh nghiệp theo số lượng công nhân, tạo thành 6 nhóm cách nhau bằng nhau. Đếm cho mỗi nhóm:

1. số doanh nghiệp
2. số lượng công nhân
3. khối lượng sản phẩm sản xuất trong năm
4. Sản lượng thực tế bình quân/công nhân
5. số lượng tài sản cố định
6. Quy mô TSCĐ bình quân của một doanh nghiệp
7. Giá trị sản phẩm sản xuất bình quân của một doanh nghiệp

Ghi kết quả phép tính vào bảng. Rút ra kết luận của riêng bạn.

Phán quyết

Đối với lời giải ta chọn giá trị lớn nhất và nhỏ nhất của số công nhân bình quân trong doanh nghiệp. Đây là 43 và 256.

Tìm độ lớn của khoảng: h = (256-43): 6 = 35,5

Khi đó nhóm thứ nhất sẽ bao gồm các doanh nghiệp có số lao động bình quân từ 43 đến 43 + 35,5 = 78,5 người. Sẽ có 5 doanh nghiệp như vậy Nhóm thứ hai sẽ bao gồm các doanh nghiệp có số lao động bình quân trong đó sẽ từ 78,5 đến 78,5 + 35,5 = 114 người. Sẽ có 12 doanh nghiệp như vậy Tương tự ta tìm được số doanh nghiệp thuộc nhóm 3, 4, 5 và 6.

Chúng tôi đặt chuỗi phân phối kết quả trong một bảng và tính toán các chỉ số cần thiết cho từng nhóm:

đầu ra : Qua bảng có thể thấy, nhóm doanh nghiệp thứ hai là đông nhất. Nó bao gồm 12 doanh nghiệp. Nhỏ nhất là nhóm thứ năm và thứ sáu (mỗi nhóm hai doanh nghiệp). Đây là những doanh nghiệp lớn nhất (về số lượng công nhân).

Do nhóm thứ hai có số lượng nhiều nhất nên khối lượng sản lượng hàng năm của các doanh nghiệp thuộc nhóm này và khối lượng tài sản cố định cao hơn nhiều so với các nhóm khác. Đồng thời, sản lượng thực tế bình quân của một lao động tại các doanh nghiệp thuộc nhóm này chưa phải là cao nhất. Các doanh nghiệp của nhóm thứ tư đang dẫn đầu ở đây. Nhóm này cũng chiếm một lượng khá lớn trong tài sản cố định.

Tóm lại, chúng tôi lưu ý rằng quy mô bình quân của tài sản cố định và giá trị sản lượng bình quân của một doanh nghiệp tỷ lệ thuận với quy mô của doanh nghiệp (về số lượng công nhân).

phân nhóm- đây là sự phân chia dân số thành các nhóm đồng nhất theo một cách nào đó.

phân công dịch vụ. Với máy tính trực tuyến, bạn có thể:

  • xây dựng một chuỗi biến thể, xây dựng biểu đồ và đa giác;
  • tìm các chỉ số biến thiên (giá trị trung bình, chế độ (bao gồm cả đồ họa), trung vị, phạm vi biến thiên, tứ phân vị, thập phân vị, hệ số phân biệt tứ phân vị, hệ số biến thiên và các chỉ số khác);

Hướng dẫn. Để nhóm một chuỗi, bạn phải chọn loại chuỗi biến thể kết quả (rời rạc hoặc khoảng thời gian) và chỉ định lượng dữ liệu (số lượng hàng). Giải pháp kết quả được lưu trong tệp Word (xem ví dụ về nhóm dữ liệu thống kê).

Số lượng dữ liệu đầu vào
",0);">

Nếu việc phân nhóm đã được thực hiện và chuỗi biến thể rời rạc hoặc chuỗi khoảng thời gian, thì bạn cần sử dụng máy tính trực tuyến Các chỉ báo biến thiên. Kiểm định giả thuyết về kiểu phân phối sản xuất bằng cách sử dụng dịch vụ Nghiên cứu hình thức phân phối.

Các loại nhóm thống kê

loạt biến thể. Trong trường hợp quan sát một biến ngẫu nhiên rời rạc, có thể gặp cùng một giá trị nhiều lần. Các giá trị như vậy của một biến ngẫu nhiên x i được ghi lại cho biết n i số lần nó xuất hiện trong n lần quan sát, đây là tần suất của giá trị này.
Trong trường hợp biến ngẫu nhiên liên tục, việc phân nhóm được sử dụng trong thực tế.
  1. nhóm kiểu chữ- đây là sự phân chia dân số không đồng nhất về chất được nghiên cứu thành các giai cấp, loại hình kinh tế xã hội, các nhóm đơn vị đồng nhất. Để tạo nhóm này, hãy sử dụng tham số chuỗi biến phân rời rạc.
  2. Nhóm cấu trúc được gọi là, trong đó một quần thể đồng nhất được chia thành các nhóm đặc trưng cho cấu trúc của nó theo một số tính năng khác nhau. Để tạo nhóm này, hãy sử dụng tham số Chuỗi khoảng thời gian.
  3. Một nhóm tiết lộ mối quan hệ giữa các hiện tượng được nghiên cứu và các đặc điểm của chúng được gọi là nhóm phân tích(xem phân nhóm chuỗi).

Nguyên tắc xây dựng nhóm thống kê

Dãy quan sát được sắp xếp theo thứ tự tăng dần được gọi là dãy biến thiên. biển báo nhóm là dấu hiệu mà dân số được chia thành các nhóm riêng biệt. Nó được gọi là cơ sở của nhóm. Việc phân nhóm có thể dựa trên cả đặc điểm định lượng và định tính.
Sau khi xác định cơ sở của việc phân nhóm, câu hỏi về số lượng nhóm mà dân số nghiên cứu nên được chia sẽ được quyết định.

Khi sử dụng máy tính cá nhân để xử lý dữ liệu thống kê, việc nhóm các đơn vị của một đối tượng được thực hiện bằng các quy trình tiêu chuẩn.
Một quy trình như vậy dựa trên việc sử dụng công thức Sturgess để xác định số nhóm tối ưu:

k = 1+3.322*lg(N)

Trong đó k là số nhóm, N là số đơn vị dân số.

Độ dài của các khoảng từng phần được tính là h=(x max -x min)/k

Sau đó đếm số lần quan sát trong các khoảng thời gian này, được coi là tần số n i . Ít tần số, giá trị của chúng nhỏ hơn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Trung điểm của các khoảng x i =(c i-1 +c i)/2 được lấy làm giá trị mới.