Tiểu sử Đặc trưng Phân tích

Phương pháp thống kê phân tích dữ liệu khoa học. Phương pháp thống kê - nó là gì? Áp dụng các phương pháp thống kê

CƠ QUAN LIÊN BANG VỀ GIÁO DỤC

CÁCH MẠNG GIÁO DỤC NHÀ NƯỚC

GIÁO DỤC CHUYÊN NGHIỆP CAO HƠN

"ĐẠI HỌC YUGORSK STATE"

VIỆN GIÁO DỤC BỔ SUNG

CHƯƠNG TRÌNH RÚT LẠI CHUYÊN NGHIỆP

"QUẢN LÝ NHÀ NƯỚC VÀ MUNICIPAL"

BÀI VĂN

Chủ đề: "Thống kê"

"Phương pháp nghiên cứu thống kê"

Đã thực hiện:

Khanty-Mansiysk

Giới thiệu

1. Phương pháp nghiên cứu thống kê.

1.1. Phương pháp quan sát thống kê

1.4. Dòng biến thể

1.5. Phương pháp lấy mẫu

1.6. Phân tích tương quan và hồi quy

1.7. Loạt động lực học

1.8. Chỉ số thống kê

Sự kết luận

Danh sách tài liệu đã sử dụng


Thông tin thống kê đầy đủ và đáng tin cậy là cơ sở cần thiết cho quá trình quản lý kinh tế. Tất cả các thông tin có ý nghĩa kinh tế quốc gia cuối cùng đều được xử lý và phân tích bằng cách sử dụng số liệu thống kê.

Dữ liệu thống kê giúp xác định khối lượng tổng sản phẩm quốc nội và thu nhập quốc dân, xác định các xu hướng chính trong sự phát triển của các ngành kinh tế, đánh giá mức độ lạm phát, phân tích tình trạng thị trường tài chính và hàng hóa, nghiên cứu mức sống của dân cư và các hiện tượng, quá trình kinh tế - xã hội khác. Nắm vững phương pháp luận thống kê là một trong những điều kiện để hiểu điều kiện thị trường, nghiên cứu xu hướng và dự báo, đưa ra quyết định tối ưu ở mọi cấp độ hoạt động.

Khoa học thống kê là ngành tri thức nghiên cứu các hiện tượng của đời sống xã hội từ mặt định lượng gắn bó chặt chẽ với nội dung định tính của chúng trong những điều kiện địa điểm và thời gian cụ thể. Thực hành thống kê là hoạt động thu thập, tích lũy, xử lý và phân tích dữ liệu số đặc trưng cho mọi hiện tượng trong đời sống xã hội.

Nói về số liệu thống kê, cần nhớ rằng những con số trong thống kê không trừu tượng, mà nó thể hiện một ý nghĩa kinh tế sâu sắc. Mọi nhà kinh tế phải có khả năng sử dụng các số liệu thống kê, phân tích chúng và có thể sử dụng chúng để chứng minh các kết luận của họ.

Luật thống kê hoạt động trong thời gian và địa điểm mà chúng được tìm thấy.

Thế giới xung quanh bao gồm các hiện tượng khối lượng. Nếu một thực tế riêng lẻ phụ thuộc vào các quy luật may rủi, thì khối lượng của các hiện tượng là đối tượng của các quy luật. Để phát hiện những mẫu này, luật số lớn được sử dụng.

Để có được thông tin thống kê, các cơ quan thống kê của tiểu bang và bộ, cũng như các cơ cấu thương mại, tiến hành nhiều loại nghiên cứu thống kê khác nhau. Quá trình nghiên cứu thống kê bao gồm ba giai đoạn chính: thu thập dữ liệu, tổng hợp và phân nhóm của chúng, phân tích và tính toán các chỉ tiêu tổng quát hóa.

Kết quả và chất lượng của tất cả các công việc tiếp theo phần lớn phụ thuộc vào cách thu thập tài liệu thống kê ban đầu, cách xử lý và phân nhóm, và cuối cùng, trong trường hợp vi phạm, nó có thể dẫn đến kết luận hoàn toàn sai lầm.

Phức tạp, tốn thời gian và trách nhiệm là giai đoạn phân tích cuối cùng của nghiên cứu. Ở giai đoạn này, các chỉ tiêu bình quân và chỉ tiêu phân bố được tính toán, cơ cấu dân số được phân tích, động thái và mối quan hệ giữa các hiện tượng và quá trình được nghiên cứu.

Ở tất cả các giai đoạn nghiên cứu, thống kê sử dụng các phương pháp khác nhau. Phương pháp thống kê là những phương pháp đặc biệt và là phương pháp nghiên cứu các hiện tượng xã hội đại chúng.

Ở giai đoạn đầu của nghiên cứu, phương pháp quan sát khối lượng được áp dụng, tài liệu thống kê sơ cấp được thu thập. Điều kiện chính là nhân vật đại chúng, bởi vì các quy luật của đời sống xã hội được biểu hiện trong một mảng dữ liệu đủ lớn do sự vận hành của quy luật số lớn, tức là trong đặc điểm thống kê tóm tắt, tính ngẫu nhiên loại bỏ nhau.

Ở giai đoạn thứ hai của nghiên cứu, khi thông tin thu thập được qua xử lý thống kê, phương pháp phân nhóm được sử dụng. Việc sử dụng phương pháp phân nhóm đòi hỏi một điều kiện không thể thiếu - sự đồng nhất về chất của quần thể.

Ở giai đoạn thứ ba của nghiên cứu, thông tin thống kê được phân tích bằng các phương pháp như phương pháp tổng hợp các chỉ tiêu, phương pháp bảng và đồ thị, phương pháp đánh giá sự biến động, phương pháp số dư và phương pháp chỉ số.

Công việc phân tích cần có các yếu tố về tầm nhìn xa, chỉ ra những hậu quả có thể xảy ra của các tình huống mới nảy sinh.

Việc quản lý số liệu thống kê trong nước do Ủy ban Nhà nước về Thống kê của Liên bang Nga thực hiện. Là cơ quan hành pháp liên bang, cơ quan này thực hiện quản lý chung về thống kê trong nước, cung cấp thông tin thống kê chính thức cho Tổng thống, Chính phủ, Quốc hội liên bang, các cơ quan hành pháp liên bang, các tổ chức công và quốc tế, phát triển phương pháp thống kê, điều phối các hoạt động thống kê của liên bang. và các tổ chức điều hành khu vực, và phân tích thông tin kinh tế và thống kê, lập các tài khoản quốc gia và tính toán số dư.

Hệ thống cơ quan thống kê ở Liên bang Nga được hình thành phù hợp với sự phân chia hành chính - lãnh thổ của đất nước. Ở các nước cộng hòa là một phần của Liên bang Nga, có các ủy ban của Đảng Cộng hòa. Ở các quận, vùng lãnh thổ, vùng tự trị, ở Mátxcơva và Xanh Pê-téc-bua đều có các Ủy ban Thống kê Nhà nước.

Tại huyện (thành phố) - sở (ban) thống kê nhà nước. Ngoài nhà nước còn có thống kê cấp cục (tại doanh nghiệp, ban, bộ, ngành). Nó cung cấp nhu cầu nội bộ về thông tin thống kê.

Mục đích của công việc này là xem xét các phương pháp nghiên cứu thống kê.

1. Phương pháp nghiên cứu thống kê

Giữa khoa học thống kê và thực tiễn có mối quan hệ chặt chẽ: thống kê sử dụng dữ liệu thực tiễn, khái quát và phát triển các phương pháp thực hiện nghiên cứu thống kê. Đổi lại, trong thực tế, các quy định lý thuyết của khoa học thống kê được áp dụng để giải quyết các vấn đề quản lý cụ thể. Kiến thức về thống kê là cần thiết cho một chuyên gia hiện đại để đưa ra quyết định trong điều kiện ngẫu nhiên (khi các hiện tượng được phân tích chịu ảnh hưởng của cơ hội), phân tích các yếu tố của nền kinh tế thị trường, thu thập thông tin, do sự gia tăng số lượng doanh nghiệp. các đơn vị và các loại hình của chúng, kiểm toán, quản lý tài chính, dự báo.

Để nghiên cứu môn học thống kê, các kỹ thuật cụ thể đã được phát triển và áp dụng, tổng thể của các kỹ thuật đó hình thành phương pháp luận thống kê (phương pháp quan sát khối lượng, phân nhóm, chỉ tiêu tổng quát, chuỗi thời gian, phương pháp chỉ số, v.v.). Việc sử dụng các phương pháp cụ thể trong thống kê được xác định trước bởi các nhiệm vụ đặt ra và phụ thuộc vào bản chất của thông tin ban đầu. Đồng thời, thống kê dựa trên các phạm trù biện chứng như số lượng và chất lượng, tính tất yếu và thời cơ, tính nhân quả, tính thường xuyên, cá thể và quần chúng, cá biệt và chung. Phương pháp thống kê được sử dụng một cách toàn diện (có hệ thống). Điều này là do sự phức tạp của quá trình nghiên cứu kinh tế và thống kê, bao gồm ba giai đoạn chính: thứ nhất là thu thập thông tin thống kê sơ cấp; thứ hai - tóm tắt thống kê và xử lý thông tin sơ cấp; thứ ba là khái quát hóa và giải thích thông tin thống kê.

Phương pháp luận chung để nghiên cứu dân số thống kê là sử dụng các nguyên tắc cơ bản hướng dẫn bất kỳ ngành khoa học nào. Những nguyên tắc này, như một loại nguyên tắc, bao gồm những điều sau:

1. tính khách quan của các hiện tượng và quá trình được nghiên cứu;

2. xác định mối quan hệ và tính nhất quán trong đó biểu hiện nội dung của các yếu tố được nghiên cứu;

3. thiết lập mục tiêu, tức là việc nhà nghiên cứu đạt được các mục tiêu đã đặt ra khi nghiên cứu các dữ liệu thống kê liên quan.

Điều này được thể hiện trong việc thu thập thông tin về các xu hướng, mô hình và các hệ quả có thể có của sự phát triển của các quá trình đang nghiên cứu. Kiến thức về các mô hình phát triển của các quá trình kinh tế - xã hội được xã hội quan tâm có tầm quan trọng thực tế rất lớn.

Trong số các đặc điểm của phân tích dữ liệu thống kê là phương pháp quan sát khối lượng, giá trị khoa học của nội dung định tính của các nhóm và kết quả của nó, tính toán và phân tích các chỉ tiêu tổng hợp và khái quát hóa của các đối tượng được nghiên cứu.

Đối với các phương pháp cụ thể về kinh tế, công nghiệp hoặc thống kê về văn hóa, dân số, của cải quốc gia, v.v., có thể có các phương pháp cụ thể để thu thập, phân nhóm và phân tích các tổng hợp tương ứng (tổng dữ kiện).

Ví dụ, trong thống kê kinh tế, phương pháp cân đối được sử dụng rộng rãi như một phương pháp phổ biến nhất để liên kết các chỉ tiêu riêng lẻ trong một hệ thống các quan hệ kinh tế duy nhất trong nền sản xuất xã hội. Các phương pháp được sử dụng trong thống kê kinh tế cũng bao gồm việc tổng hợp các nhóm, tính toán các chỉ tiêu tương đối (tỷ lệ phần trăm), so sánh, tính toán các loại số liệu trung bình, chỉ số, v.v.

Phương pháp kết nối các liên kết trong thực tế là hai tích, tức là Các chỉ tiêu định lượng được so sánh trên cơ sở mối quan hệ tồn tại giữa chúng. Ví dụ, năng suất lao động tính bằng vật chất và số giờ làm việc, hoặc khối lượng giao thông tính bằng tấn và quãng đường vận chuyển trung bình tính bằng km.

Khi phân tích động lực phát triển của nền kinh tế quốc dân, phương pháp chủ yếu để xác định động lực (vận động) này là phương pháp chỉ số, phương pháp phân tích chuỗi thời gian.

Trong phân tích thống kê các mô hình kinh tế chính của sự phát triển nền kinh tế quốc dân, một phương pháp thống kê quan trọng là tính toán mức độ chặt chẽ của các mối quan hệ giữa các chỉ tiêu bằng cách sử dụng phân tích tương quan và phân tán, v.v.

Ngoài các phương pháp này, các phương pháp nghiên cứu toán học và thống kê đã trở nên phổ biến, ngày càng mở rộng khi quy mô sử dụng máy tính và sự ra đời của các hệ thống tự động.

Các giai đoạn của nghiên cứu thống kê:

1. Quan sát thống kê - thu thập thông tin cơ bản được tổ chức một cách khoa học về các đơn vị riêng lẻ của hiện tượng đang nghiên cứu.

2. Phân nhóm và tóm tắt tư liệu - khái quát các dữ liệu quan sát để thu được các giá trị tuyệt đối (các chỉ tiêu kế toán và ước tính) của hiện tượng.

3. Xử lý dữ liệu thống kê và phân tích kết quả để có được kết luận hợp lý về trạng thái của hiện tượng đang nghiên cứu và các mô hình phát triển của nó.

Tất cả các giai đoạn của nghiên cứu thống kê đều có quan hệ mật thiết với nhau và đều quan trọng như nhau. Những thiếu sót và sai sót xảy ra ở mỗi giai đoạn ảnh hưởng đến toàn bộ nghiên cứu. Do đó, việc sử dụng đúng các phương pháp đặc biệt của khoa học thống kê ở mỗi giai đoạn giúp thu được thông tin đáng tin cậy là kết quả của nghiên cứu thống kê.

Phương pháp nghiên cứu thống kê:

1. Quan sát thống kê

2. Tóm tắt và nhóm dữ liệu

3. Tính toán các chỉ tiêu tổng hợp (giá trị tuyệt đối, tương đối và trung bình)

4. Phân phối thống kê (chuỗi biến thể)

5. Phương pháp lấy mẫu

6. Phân tích tương quan và hồi quy

7. Chuỗi động lực học

Nhiệm vụ của thống kê là tính toán các chỉ tiêu thống kê và phân tích chúng, nhờ đó các cơ quan quản lý nhận được mô tả toàn diện về đối tượng quản lý, đó là toàn bộ nền kinh tế quốc dân hay từng ngành, doanh nghiệp và bộ phận của nó. Không thể quản lý các hệ thống kinh tế - xã hội nếu không có thông tin thống kê hoạt động, đáng tin cậy và đầy đủ.


Quan sát thống kê là tập hợp có hệ thống, được tổ chức một cách khoa học và theo quy luật, có hệ thống các dữ liệu về các hiện tượng của đời sống xã hội. Nó được thực hiện bằng cách đăng ký các đặc điểm thiết yếu được xác định trước để có được các đặc điểm khái quát hơn của các hiện tượng này.

Ví dụ, khi tiến hành tổng điều tra dân số, thông tin về mỗi người dân trong nước được ghi lại về giới tính, tuổi, tình trạng hôn nhân, trình độ học vấn, v.v., sau đó cơ quan thống kê xác định, dựa trên thông tin này, dân số, tuổi của người đó. cơ cấu, vị trí trong nước, thành phần gia đình. và các chỉ số khác.

Các yêu cầu sau đây được đặt ra đối với quan sát thống kê: mức độ bao phủ đầy đủ của dân số được nghiên cứu, độ tin cậy và độ chính xác của dữ liệu, tính đồng nhất và khả năng so sánh của chúng.

Hình thức, kiểu và phương pháp quan sát thống kê

Quan sát thống kê được thực hiện dưới hai hình thức: báo cáo và quan sát thống kê có tổ chức đặc biệt.

Báo cáođược gọi là hình thức tổ chức quan sát thống kê, trong đó cơ quan thống kê nhận được thông tin từ các doanh nghiệp, cơ quan và tổ chức dưới dạng các báo cáo bắt buộc về hoạt động của họ.

Báo cáo có thể là quốc gia và nội bộ.

Toàn quốc - gửi đến các cơ quan có thẩm quyền cấp trên và các cơ quan thống kê của nhà nước. Nó cần thiết cho các mục đích tổng quát hóa, kiểm soát, phân tích và dự báo.

Intradepartmental - được sử dụng trong các bộ và ban ngành cho các nhu cầu hoạt động.

Báo cáo được phê duyệt bởi Ủy ban Thống kê Nhà nước của Liên bang Nga. Báo cáo được lập trên cơ sở kế toán chính. Đặc thù của báo cáo là bắt buộc phải lập, lập thành văn bản và xác nhận hợp pháp bằng chữ ký của người đứng đầu.

Quan sát thống kê được tổ chức đặc biệt- tổ chức quan sát cho một số mục đích đặc biệt nhằm thu được thông tin không có trong báo cáo, hoặc để xác minh và làm rõ dữ liệu báo cáo. Đây là tổng điều tra dân số, vật nuôi, trang thiết bị, các loại hồ sơ một lần. Ví dụ như khảo sát ngân sách hộ gia đình, thăm dò dư luận, v.v.

Các loại quan sát thống kê có thể được phân nhóm theo hai tiêu chí: theo bản chất của sự kiện đăng ký và theo mức độ bao phủ của các đơn vị dân số.

Theo bản chất của đăng ký sự kiện quan sát thống kê có thể là: hiện hành hoặc có hệ thống và không liên tục .

Giám sát hiện tại là một kế toán liên tục, ví dụ, về sản xuất, xuất kho vật liệu, v.v., tức là đăng ký được thực hiện như thực tế xảy ra.

Giám sát liên tục có thể là định kỳ, tức là lặp lại đều đặn. Ví dụ, tổng điều tra chăn nuôi vào ngày 1 tháng 1 hoặc đăng ký giá thị trường vào ngày 22 hàng tháng. Việc quan sát một lần được tổ chức khi cần thiết, tức là mà không tuân theo định kỳ hoặc nói chung một lần. Ví dụ, nghiên cứu về dư luận xã hội.

Theo mức độ bao phủ của các đơn vị dân số Quan sát có thể liên tục hoặc không liên tục.

Tại tiếp diễn Tất cả các đơn vị của dân số đều là đối tượng quan sát. Ví dụ, cuộc điều tra dân số.

Tại không liên tục quan sát, một phần của các đơn vị của dân số được kiểm tra. Quan sát không liên tục có thể được chia thành các phân loài: chọn lọc, đơn tính, phương pháp của mảng chính.

Quan sát có chọn lọc là quan sát dựa trên nguyên tắc chọn lọc ngẫu nhiên. Với cách thức tổ chức và tiến hành phù hợp, quan sát có chọn lọc cung cấp dữ liệu đủ tin cậy về dân số đang nghiên cứu. Trong một số trường hợp, chúng có thể thay thế kế toán liên tục, bởi vì kết quả của một quan sát mẫu với một xác suất xác định rõ có thể được mở rộng cho toàn bộ dân số. Ví dụ, kiểm tra chất lượng sản phẩm, nghiên cứu năng suất vật nuôi, v.v. Trong nền kinh tế thị trường, phạm vi quan sát có chọn lọc ngày càng mở rộng.

Quan sát chuyên đề- đây là một nghiên cứu chi tiết, chuyên sâu và mô tả các đơn vị dân số đặc trưng ở một khía cạnh nào đó. Nó được thực hiện nhằm xác định các xu hướng hiện có và đang nổi lên trong sự phát triển của hiện tượng (xác định các thiếu sót, nghiên cứu các phương pháp hay nhất, các hình thức tổ chức mới, v.v.)

Phương pháp mảng chính bao gồm thực tế là các đơn vị lớn nhất là đối tượng của cuộc khảo sát, được lấy cùng nhau, có tỷ trọng chủ yếu trong tổng thể theo đặc điểm chính (các tính năng) của nghiên cứu này. Vì vậy, khi nghiên cứu hoạt động của thị trường ở các thành phố, người ta xem xét thị trường của các thành phố lớn, nơi có 50% tổng dân số sinh sống, và doanh thu của các chợ là 60% tổng doanh thu.

Theo nguồn thông tin Phân biệt giữa quan sát trực tiếp, tư liệu và khảo sát.

trực tiếpđược gọi là một quan sát như vậy, trong đó chính các đăng ký viên, bằng cách đo, cân hoặc đếm, xác lập dữ kiện và ghi lại nó trong biểu mẫu (biểu mẫu) quan sát.

Phim tài liệu- liên quan đến việc ghi lại các câu trả lời trên cơ sở các tài liệu liên quan.

Thăm dò ý kiến- đây là một quan sát trong đó câu trả lời cho các câu hỏi được ghi lại từ lời của người trả lời. Ví dụ, cuộc điều tra dân số.

Trong thống kê, thông tin về hiện tượng đang nghiên cứu có thể được thu thập bằng nhiều cách khác nhau: báo cáo, thám hiểm, tự tính toán, bảng câu hỏi, phóng viên.

Nước hoa Báo cáo phương pháp là cung cấp các báo cáo theo cách thức bắt buộc nghiêm ngặt.

Viễn chinh Phương pháp này bao gồm thực tế là những người lao động được thu hút và đào tạo đặc biệt ghi lại thông tin dưới dạng quan sát (điều tra dân số).

Tại tự tính toán Các mẫu đơn (tự đăng ký) do người trả lời tự điền vào. Ví dụ, phương pháp này được sử dụng trong nghiên cứu sự di chuyển của con lắc (sự di chuyển của quần thể từ nơi ở đến nơi làm việc và quay trở lại).

Bảng câu hỏi phương pháp này là thu thập dữ liệu thống kê bằng cách sử dụng bảng câu hỏi đặc biệt (bảng câu hỏi) được gửi đến một nhóm người nhất định hoặc đăng trên báo chí định kỳ. Phương pháp này được sử dụng rất rộng rãi, đặc biệt là trong các cuộc điều tra xã hội học khác nhau. Tuy nhiên, nó có một phần lớn tính chủ quan.

Nước hoa phóng viên Phương pháp này nằm ở chỗ cơ quan thống kê đồng ý với một số người nhất định (phóng viên tự nguyện), những người cam kết quan sát bất kỳ hiện tượng nào trong khung thời gian đã thiết lập và báo cáo kết quả cho cơ quan thống kê. Ví dụ, đánh giá của chuyên gia được thực hiện về các vấn đề cụ thể của sự phát triển kinh tế xã hội của đất nước.

1.2. Tóm tắt và phân nhóm các tài liệu quan sát thống kê

Bản chất và nhiệm vụ của tóm tắt và phân nhóm

Tóm lược- đây là một hoạt động để tìm ra các dữ kiện đơn lẻ cụ thể tạo thành một tập hợp và được thu thập do kết quả của quan sát. Kết quả của quá trình tổng kết, nhiều chỉ tiêu riêng lẻ liên quan đến từng đơn vị của đối tượng quan sát biến thành một hệ thống bảng và kết quả thống kê, các đặc điểm, kiểu mẫu tiêu biểu của hiện tượng đang nghiên cứu tổng thể xuất hiện.

Theo độ sâu và độ chính xác của quá trình xử lý, một bản tóm tắt được phân biệt giữa đơn giản và phức tạp.

Tóm tắt đơn giản- đây là một phép toán để tính tổng, tức là bởi tập hợp các đơn vị quan sát.

Tóm tắt phức tạp- đây là một hoạt động phức tạp, bao gồm nhóm các đơn vị quan sát, tính toán kết quả cho từng nhóm và cho toàn bộ đối tượng, và trình bày kết quả dưới dạng bảng thống kê.

Quá trình tóm tắt bao gồm các bước sau:

Lựa chọn một thuộc tính nhóm;

Xác định thứ tự thành lập nhóm;

Xây dựng hệ thống chỉ tiêu để mô tả đặc điểm của các nhóm và đối tượng nói chung;

Thiết kế bố cục bảng để trình bày kết quả tóm tắt.

Về hình thức xử lý, tóm tắt là:

Tập trung (tất cả tài liệu chính được chuyển đến một tổ chức cao hơn, ví dụ, Ủy ban Thống kê Nhà nước của Liên bang Nga, và được xử lý hoàn toàn ở đó);

Phi tập trung (quá trình xử lý tài liệu thu thập được diễn ra theo chiều tăng dần, tức là tài liệu được tóm tắt và nhóm lại ở mỗi giai đoạn).

Trong thực tế, cả hai hình thức báo cáo thường được kết hợp. Vì vậy, ví dụ, trong một cuộc tổng điều tra, các kết quả sơ bộ thu được theo thứ tự của một bản tóm tắt phi tập trung và các kết quả cuối cùng tổng hợp thu được là kết quả của sự phát triển tập trung các hình thức điều tra dân số.

Theo kỹ thuật thực hiện, bản tóm tắt được cơ giới hóa và thủ công.

nhóm lạiđược gọi là sự phân chia dân số nghiên cứu thành các nhóm đồng nhất theo những đặc điểm thiết yếu nhất định.

Trên cơ sở phương pháp phân nhóm, các nhiệm vụ trọng tâm của nghiên cứu được giải quyết, đồng thời đảm bảo áp dụng đúng các phương pháp phân tích thống kê và toán học thống kê khác.

Công việc phân nhóm rất phức tạp và khó khăn. Các kỹ thuật phân nhóm rất đa dạng, đó là do sự đa dạng của các đặc điểm phân nhóm và các mục tiêu nghiên cứu khác nhau. Các nhiệm vụ chính được giải quyết với sự trợ giúp của các nhóm bao gồm:

Xác định các loại hình kinh tế - xã hội;

Việc nghiên cứu cấu trúc của dân số, những thay đổi cấu trúc trong đó;

Bộc lộ mối liên hệ giữa các hiện tượng và sự phụ thuộc lẫn nhau.

Nhóm các loại

Tùy thuộc vào các nhiệm vụ được giải quyết với sự trợ giúp của phân nhóm, có 3 loại phân nhóm: phân loại, cấu trúc và phân tích.

Phân nhóm theo kiểu phân loại giải quyết vấn đề xác định các loại hình kinh tế - xã hội. Khi xây dựng một nhóm kiểu này, cần chú ý chính đến việc xác định các kiểu và lựa chọn một thuộc tính phân nhóm. Đồng thời, họ tiến hành từ bản chất của hiện tượng đang nghiên cứu. (bảng 2.3).

Phân nhóm cấu trúc giải quyết vấn đề nghiên cứu thành phần của các nhóm điển hình riêng lẻ trên cơ sở nào đó. Ví dụ, sự phân bố dân cư theo nhóm tuổi.

Phân nhóm cho phép bạn xác định mối quan hệ giữa các hiện tượng và các đặc điểm của chúng, tức là xác định ảnh hưởng của một số dấu hiệu (giai thừa) đối với những dấu hiệu khác (hiệu quả). Mối quan hệ được biểu hiện ở chỗ khi thuộc tính nhân tố tăng lên thì giá trị của thuộc tính kết quả tăng hoặc giảm. Nhóm phân tích luôn dựa trên yếu tốđặc điểm, và mỗi nhóm được đặc trưng trung bình các giá trị của dấu hiệu.

Ví dụ, sự phụ thuộc của khối lượng doanh thu bán lẻ vào quy mô mặt bằng bán lẻ của cửa hàng. Ở đây, dấu hiệu giai thừa (phân nhóm) là khu vực bán hàng và dấu hiệu kết quả là doanh thu trung bình trên mỗi cửa hàng.

Theo mức độ phức tạp, việc phân nhóm có thể đơn giản và phức tạp (kết hợp).

TẠI giản dị nhóm ở cơ sở có một dấu hiệu, và trong khó- hai hoặc nhiều trong sự kết hợp (trong sự kết hợp). Trong trường hợp này, đầu tiên các nhóm được hình thành theo một thuộc tính (chính), sau đó mỗi nhóm được chia thành các nhóm con theo thuộc tính thứ hai, v.v.

1.3. Thống kê tuyệt đối và tương đối

Thống kê tuyệt đối

Dạng biểu hiện ban đầu, chủ yếu của các chỉ tiêu thống kê là các giá trị tuyệt đối. Giá trị tuyệt đốiđặc trưng cho quy mô của sự vật hiện tượng về khối lượng, diện tích, thể tích, độ dài, thời gian, v.v.

Theo quy luật, các chỉ số tuyệt đối riêng lẻ thu được trực tiếp trong quá trình quan sát do kết quả của phép đo, cân, đếm và đánh giá. Trong một số trường hợp, điểm số tuyệt đối của từng cá nhân là sự khác biệt.

Tóm tắt, các chỉ số tuyệt đối về thể tích cuối cùng thu được do tổng hợp và phân nhóm.

Các chỉ số thống kê tuyệt đối luôn là những con số được đặt tên, tức là có đơn vị. Có 3 loại đơn vị đo giá trị tuyệt đối: tự nhiên, lao động và chi phí.

đơn vị tự nhiên các phép đo - biểu thị mức độ của hiện tượng về mặt vật lý, tức là các phép đo trọng lượng, thể tích, chiều dài, thời gian, số đếm, tức là tính bằng kilôgam, mét khối, ki lô mét, giờ, miếng, v.v.

Một loạt các đơn vị tự nhiên là đơn vị đo lường tự nhiên có điều kiệnđược sử dụng để tập hợp một số giống cây có cùng giá trị sử dụng. Một trong số chúng được lấy làm tiêu chuẩn, trong khi số khác được chuyển đổi bằng cách sử dụng các hệ số đặc biệt thành các đơn vị đo lường của tiêu chuẩn này. Vì vậy, ví dụ, xà phòng có hàm lượng axit béo khác nhau được chuyển đổi thành hàm lượng 40% axit béo.

Trong một số trường hợp, một đơn vị đo không đủ để mô tả một hiện tượng, và tích của hai đơn vị đo được sử dụng.

Một ví dụ là doanh thu vận chuyển hàng hóa tính bằng tấn-km, sản xuất điện tính bằng kilowatt-giờ, v.v.

Trong nền kinh tế thị trường, điều quan trọng nhất là đơn vị đo lường chi phí (tiền tệ)(đồng rúp, đô la, đồng mark, v.v.). Chúng cho phép bạn đánh giá bằng tiền về bất kỳ hiện tượng kinh tế xã hội nào (khối lượng sản xuất, doanh thu, thu nhập quốc dân, v.v.). Tuy nhiên, cần nhớ rằng trong điều kiện tỷ lệ lạm phát cao, các chỉ tiêu về tiền tệ trở nên không thể so sánh được. Điều này cần được tính đến khi phân tích các chỉ số chi phí trong động thái. Để đạt được khả năng so sánh, các chỉ số phải được tính toán lại thành giá có thể so sánh được.

Đơn vị đo lường lao động(giờ công, ngày công) được sử dụng để xác định chi phí lao động trong quá trình sản xuất sản phẩm, để thực hiện một số công việc, v.v.

Các đại lượng thống kê tương đối, bản chất và hình thức biểu thị của chúng

Giá trị tương đối trong thống kê, các đại lượng được gọi là đại lượng thể hiện mối quan hệ định lượng giữa các hiện tượng của đời sống xã hội. Chúng có được bằng cách chia giá trị này cho giá trị khác.

Giá trị mà phép so sánh được thực hiện (mẫu số) được gọi là cơ số, cơ sở của phép so sánh; và giá trị được so sánh (tử số) được gọi là giá trị so sánh, báo cáo hoặc giá trị hiện tại.

Giá trị tương đối cho biết giá trị được so sánh lớn hơn hoặc nhỏ hơn giá trị cơ bản bao nhiêu lần hoặc giá trị đầu tiên so với giá trị thứ hai theo tỷ lệ nào; và trong một số trường hợp - có bao nhiêu đơn vị của một đại lượng trên mỗi đơn vị (hoặc trên 100, trên 1000, v.v.) của một đại lượng (cơ bản) khác.

Kết quả của việc so sánh các giá trị tuyệt đối của cùng một tên, sẽ thu được các giá trị tương đối không có tên trừu tượng, cho biết giá trị đã cho lớn hơn hoặc nhỏ hơn giá trị cơ sở bao nhiêu lần. Trong trường hợp này, giá trị cơ sở được coi là một đơn vị (kết quả là hệ số).

Ngoài hệ số, một hình thức biểu thị giá trị tương đối được sử dụng rộng rãi là quan tâm(%). Trong trường hợp này, giá trị cơ sở được lấy là 100 đơn vị.

Giá trị tương đối có thể được biểu thị bằng ppm (‰), bằng decimille (0/000). Trong những trường hợp này, cơ sở so sánh được lấy tương ứng là 1.000 và 10.000, Trong một số trường hợp, cơ sở so sánh cũng có thể được lấy là 100.000.

Giá trị tương đối có thể được đặt tên là số. Tên của nó là sự kết hợp giữa tên của các chỉ số được so sánh và cơ bản. Ví dụ, mật độ dân số trên mỗi sq. km (bao nhiêu người trên 1 km vuông).

Các loại giá trị tương đối

Các loại giá trị tương đối được chia nhỏ tùy thuộc vào nội dung của chúng. Đó là các giá trị tương đối: nhiệm vụ kế hoạch, mức độ hoàn thành kế hoạch, động lực, cơ cấu, sự phối hợp, cường độ và trình độ phát triển kinh tế, so sánh.

Giá trị tương đối nhiệm vụ kế hoạch thể hiện tỷ lệ giữa giá trị chỉ tiêu được xác lập cho kỳ kế hoạch với giá trị chỉ tiêu đạt được của kỳ kế hoạch.

Giá trị tương đối kế hoạch thực hiện Giá trị thể hiện tỷ lệ giữa mức thực tế và mức kế hoạch của chỉ tiêu được gọi là.

Giá trị tương đối diễn giả là tỷ số giữa mức của một chỉ tiêu trong một thời kỳ nhất định với mức của cùng một chỉ tiêu trong quá khứ.

Ba giá trị tương đối trên có mối liên hệ với nhau, đó là: giá trị tương đối của động lực bằng tích của các giá trị tương đối của nhiệm vụ kế hoạch và việc thực hiện kế hoạch.

Giá trị tương đối cấu trúc là tỷ lệ giữa các kích thước của bộ phận với tổng thể. Nó đặc trưng cho cấu trúc, thành phần của một tập hợp cụ thể.

Những phần trăm tương tự này được gọi là trọng lượng riêng.

Giá trị tương đối sự phối hợp gọi là tỉ số giữa các phần của tổng thể với nhau. Kết quả là họ nhận được phần này lớn hơn phần cơ sở bao nhiêu lần. Hoặc bao nhiêu phần trăm của nó hoặc bao nhiêu đơn vị của phần cấu trúc này rơi vào 1 đơn vị (100 hoặc 1000, v.v. đơn vị) của phần cấu trúc cơ bản.

Giá trị tương đối cường độđặc trưng cho sự phát triển của hiện tượng hoặc quá trình được nghiên cứu trong môi trường khác. Đây là mối quan hệ của hai sự vật hiện tượng tương hỗ với nhau, nhưng khác nhau. Nó có thể được biểu thị dưới dạng phần trăm, và theo ppm, và prodecemille, và được đặt tên. Một biến thể của giá trị cường độ tương đối là chỉ số trình độ phát triển kinh tếđặc điểm của sản xuất bình quân đầu người.

Giá trị tương đối sự so sánh thể hiện tỷ lệ của các chỉ tiêu tuyệt đối cùng tên cho các đối tượng khác nhau (doanh nghiệp, quận, huyện, vùng, quốc gia, v.v.). Nó có thể được biểu thị bằng cả hệ số và phần trăm.

Giá trị trung bình, bản chất và loại của chúng

Thống kê, như bạn đã biết, nghiên cứu các hiện tượng kinh tế xã hội hàng loạt. Mỗi hiện tượng này có thể có một biểu thức định lượng khác nhau về cùng một tính năng. Ví dụ, tiền lương của cùng một nghề của công nhân hoặc giá cả trên thị trường cho cùng một sản phẩm, v.v.

Để nghiên cứu bất kỳ dân số nào theo các đặc điểm khác nhau (thay đổi về lượng), thống kê sử dụng số trung bình.

giá trị trung bình- đây là đặc trưng định lượng tổng quát của một tập hợp các hiện tượng tương tự từng cái một dấu biến.

Thuộc tính quan trọng nhất của giá trị trung bình là nó đại diện cho giá trị của một thuộc tính nhất định trong toàn bộ tổng thể dưới dạng một số duy nhất, bất chấp sự khác biệt về lượng của nó trong các đơn vị riêng lẻ của tổng thể, và thể hiện điểm chung vốn có trong tất cả các đơn vị của dân số đang nghiên cứu. Như vậy, thông qua đặc trưng của một đơn vị quần thể, nó biểu thị đặc trưng của toàn bộ quần thể.

Giá trị trung bình có liên quan đến quy luật số lớn. Bản chất của mối liên hệ này nằm ở chỗ, khi lấy trung bình các sai lệch ngẫu nhiên của các giá trị riêng lẻ, do vận hành của quy luật số lớn, chúng triệt tiêu lẫn nhau và trong xu hướng phát triển chính, tính tất yếu, tính thường xuyên được bộc lộ, tuy nhiên. Vì vậy, giá trị trung bình phải được tính toán trên cơ sở tổng quát của khối lượng dữ kiện.

Giá trị trung bình cho phép so sánh các chỉ tiêu liên quan đến quần thể với số lượng đơn vị khác nhau.

Điều kiện quan trọng nhất để sử dụng khoa học số bình quân trong phân tích thống kê các hiện tượng xã hội là đồng nhất dân số mà giá trị trung bình được tính. Giá trị trung bình giống hệt nhau về hình thức và kỹ thuật tính toán, là hư cấu trong một số điều kiện (đối với dân số không đồng nhất) và tương ứng với thực tế ở các điều kiện khác (đối với dân số đồng nhất). Tính đồng nhất về chất của quần thể được xác định trên cơ sở phân tích lý luận toàn diện về thực chất của hiện tượng. Ví dụ, khi tính toán năng suất trung bình, dữ liệu đầu vào phải đề cập đến cùng một loại cây trồng (năng suất lúa mì trung bình) hoặc nhóm cây trồng (năng suất ngũ cốc trung bình). Bạn không thể tính giá trị trung bình cho các loại cây trồng không đồng nhất.

Các kỹ thuật toán học được sử dụng trong các phần khác nhau của thống kê có liên quan trực tiếp đến việc tính toán số trung bình.

Giá trị trung bình trong các hiện tượng xã hội có một hằng số tương đối, tức là trong một khoảng thời gian nhất định, các hiện tượng cùng loại được đặc trưng bởi các giá trị trung bình xấp xỉ nhau.

Các giá trị giữa có liên quan rất chặt chẽ với phương pháp nhóm, vì Để mô tả đặc điểm của hiện tượng, không chỉ cần tính giá trị trung bình chung (cho toàn bộ hiện tượng) mà còn tính trung bình nhóm (đối với các nhóm điển hình của hiện tượng này theo đặc điểm đang nghiên cứu).

Các loại trung bình

Hình thức trình bày dữ liệu ban đầu để tính giá trị trung bình phụ thuộc vào công thức nó sẽ được xác định bằng công thức nào. Hãy xem xét các loại giá trị trung bình thường được sử dụng nhất trong thống kê:

trung bình cộng;

Sóng hài trung bình;

Hình học trung bình;

Hình vuông có nghĩa.

1.4. Dòng biến thể

Thực chất và nguyên nhân của sự biến đổi

Thông tin về mức độ trung bình của các chỉ số được nghiên cứu thường không đủ để phân tích sâu về quá trình hoặc hiện tượng đang được nghiên cứu.

Cũng cần phải tính đến sự lan truyền hoặc biến động trong các giá trị của các đơn vị riêng lẻ, đây là một đặc điểm quan trọng của quần thể nghiên cứu. Mỗi giá trị riêng của một tính trạng được hình thành dưới tác động tổng hợp của nhiều yếu tố. Các hiện tượng kinh tế - xã hội có xu hướng biến động lớn. Các lý do cho sự biến đổi này nằm trong bản chất của hiện tượng.

Các phép đo biến đổi xác định cách các giá trị đặc điểm được nhóm xung quanh giá trị trung bình. Chúng được sử dụng để mô tả các tổng hợp thống kê có thứ tự: nhóm, phân loại, chuỗi phân phối. Giá cổ phiếu, khối lượng cung và cầu, lãi suất trong các thời kỳ khác nhau và ở những nơi khác nhau có thể chịu sự biến động lớn nhất.

Các chỉ báo tuyệt đối và tương đối của sự thay đổi

Theo ý nghĩa của định nghĩa, sự biến đổi được đo lường bằng mức độ biến động của các lựa chọn tính trạng từ mức giá trị trung bình của chúng, tức là như sự khác biệt xx. Về việc sử dụng độ lệch so với giá trị trung bình, hầu hết các chỉ số được sử dụng trong thống kê để đo lường các biến thể về giá trị của một đối tượng địa lý trong tổng thể được xây dựng.

Phép đo biến thiên tuyệt đối đơn giản nhất là phạm vi biến đổi R = xmax-xmin. Biên độ dao động được biểu thị bằng cùng đơn vị đo X. Nó chỉ phụ thuộc vào hai giá trị cực trị của tính trạng và do đó không đủ đặc trưng cho sự dao động của tính trạng.

Tỷ lệ biến dị tuyệt đối phụ thuộc vào đơn vị đo của tính trạng và khó so sánh hai hay nhiều chuỗi biến dị khác nhau.

Các biện pháp tương đối của sự thay đổiđược tính bằng tỷ số của các chỉ số biến thiên tuyệt đối khác nhau so với giá trị trung bình số học. Phổ biến nhất trong số này là hệ số biến thiên.

Hệ số biến động đặc trưng cho sự biến động của tính trạng trong số trung bình cộng. Giá trị tốt nhất của nó lên đến 10%, tốt lên đến 50%, xấu trên 50%. Nếu hệ số biến dị không vượt quá 33% thì quần thể có tính trạng đang xét có thể được coi là đồng nhất.

1.5. Phương pháp lấy mẫu

Bản chất của phương pháp chọn mẫu là đánh giá các đặc điểm số lượng của tổng thể (tổng thể chung) theo các thuộc tính của một phần (mẫu), theo các nhóm tùy chọn riêng lẻ cho tổng dân số của chúng, đôi khi được coi là tập hợp của một số vô hạn khối lượng lớn. Cơ sở của phương pháp chọn mẫu là mối liên hệ bên trong tồn tại trong quần thể giữa cái riêng và cái chung, bộ phận và tổng thể.

Phương pháp chọn mẫu có những ưu điểm rõ ràng so với nghiên cứu liên tục về dân số chung, vì nó làm giảm khối lượng công việc (bằng cách giảm số lượng quan sát), cho phép bạn tiết kiệm công sức và tiền bạc, có được thông tin về các quần thể đó, kiểm tra toàn bộ thực tế là không thể hoặc không thực tế.

Kinh nghiệm cho thấy rằng một mẫu được thực hiện chính xác thể hiện hoặc đại diện (từ tiếng Latinh đại diện - tôi đại diện) cơ cấu và trạng thái của dân số nói chung khá tốt. Tuy nhiên, theo quy luật, không có sự trùng hợp hoàn toàn giữa dữ liệu mẫu với dữ liệu xử lý tổng thể chung. Đây là nhược điểm của phương pháp chọn mẫu, nó có thể thấy được ưu điểm của việc mô tả liên tục tổng thể chung.

Do việc mẫu hiển thị không đầy đủ các đặc điểm thống kê (các tham số) của tổng thể chung, một nhiệm vụ quan trọng đặt ra cho nhà nghiên cứu: trước hết, phải tính đến và quan sát các điều kiện mà mẫu đại diện tốt nhất cho tổng thể chung, và thứ hai, trong từng trường hợp cụ thể để xác định điều gì Một cách chắc chắn, người ta có thể chuyển kết quả quan sát mẫu cho toàn bộ dân số mà từ đó mẫu được lấy.

Tính đại diện của mẫu phụ thuộc vào một số điều kiện và trên hết là vào cách nó được thực hiện, hoặc một cách có hệ thống (tức là theo một kế hoạch trước), hoặc bằng cách lựa chọn không có kế hoạch một phương án từ dân số chung. Trong mọi trường hợp, mẫu phải là điển hình và hoàn toàn khách quan. Các yêu cầu này phải được đáp ứng nghiêm ngặt như là điều kiện thiết yếu nhất cho tính đại diện của mẫu. Trước khi xử lý vật liệu mẫu, nó phải được kiểm tra cẩn thận và mẫu được giải phóng khỏi mọi thứ thừa vi phạm các điều kiện về tính đại diện. Đồng thời, khi thành lập một mẫu, không thể hành động tùy tiện, chỉ đưa vào thành phần của nó những phương án có vẻ điển hình, và loại bỏ tất cả những phần còn lại. Một mẫu lành tính phải khách quan, nghĩa là, nó phải được tạo ra không có động cơ thiên vị, loại trừ các ảnh hưởng chủ quan đến thành phần của nó. Việc đáp ứng điều kiện về tính đại diện này tương ứng với nguyên tắc ngẫu nhiên hóa (từ trường hợp kết xuất tiếng Anh), hoặc lựa chọn ngẫu nhiên một biến thể từ tổng thể chung.

Nguyên tắc này làm nền tảng cho lý thuyết về phương pháp chọn mẫu và phải được tuân thủ trong mọi trường hợp hình thành mẫu đại diện, không loại trừ các trường hợp lựa chọn có kế hoạch hoặc có chủ ý.

Có nhiều phương pháp lựa chọn khác nhau. Tùy thuộc vào phương pháp lựa chọn, các loại mẫu sau được phân biệt:

Mẫu ngẫu nhiên có trả lại;

Lấy mẫu ngẫu nhiên không trả lại;

Cơ khí;

đặc trưng;

Nối tiếp.

Xem xét sự hình thành của các mẫu ngẫu nhiên có và không có trả lại. Nếu mẫu được làm từ một khối lượng sản phẩm (ví dụ, từ một hộp), thì sau khi trộn kỹ, các đối tượng phải được lấy ngẫu nhiên, nghĩa là, tất cả chúng đều có cùng xác suất được đưa vào mẫu. Thông thường, để tạo thành một mẫu ngẫu nhiên, các phần tử của tổng thể chung được đánh số trước, và mỗi số được ghi vào một thẻ riêng biệt. Kết quả là một gói thẻ, số thẻ trùng với kích thước của dân số chung. Sau khi trộn kỹ, một thẻ được lấy từ gói này. Đối tượng có cùng số với thẻ được coi là có trong mẫu. Trong trường hợp này, có thể có hai cách khác nhau về cơ bản để hình thành một tổng thể mẫu.

Cách đầu tiên - thẻ được lấy ra sau khi sửa số của nó được trả lại trong gói, sau đó các thẻ được trộn kỹ một lần nữa. Bằng cách lặp lại các mẫu như vậy trên một thẻ, có thể tạo thành một mẫu ở bất kỳ kích thước nào. Tập hợp mẫu được hình thành theo lược đồ này được gọi là mẫu ngẫu nhiên có trả về.

Cách thứ hai - mỗi thẻ được lấy ra sau khi ghi không được trả lại. Bằng cách lặp lại mẫu theo sơ đồ này cho một thẻ, bạn có thể nhận được mẫu có kích thước nhất định. Tập mẫu được hình thành theo lược đồ này được gọi là mẫu ngẫu nhiên không có hồi kết. Một mẫu ngẫu nhiên không trả lại được hình thành nếu số lượng thẻ cần thiết được lấy từ một gói đã trộn kỹ cùng một lúc.

Tuy nhiên, với quy mô dân số chung lớn, phương pháp tạo mẫu ngẫu nhiên có và không có trả về được mô tả ở trên hóa ra rất tốn công sức. Trong trường hợp này, các bảng số ngẫu nhiên được sử dụng, trong đó các số được sắp xếp theo thứ tự ngẫu nhiên. Phần sẽ được chọn, ví dụ, 50 đối tượng từ một tổng thể chung được đánh số, hãy mở bất kỳ trang nào của bảng các số ngẫu nhiên và viết ra 50 số ngẫu nhiên liên tiếp; mẫu bao gồm những đối tượng có số trùng với số ngẫu nhiên được viết ra, nếu số ngẫu nhiên của bảng lớn hơn khối lượng của tổng thể chung thì số đó bị bỏ qua.

Lưu ý rằng sự phân biệt giữa các mẫu ngẫu nhiên có và không có đảo ngược sẽ bị mờ nếu chúng là một phần không đáng kể của một tổng thể lớn.

Với phương pháp cơ học là hình thành tổng thể mẫu, các phần tử của tổng thể cần điều tra được chọn ở một khoảng nhất định. Vì vậy, ví dụ, nếu mẫu phải là 50% của tổng thể chung, thì mỗi phần tử thứ hai của tổng thể chung được chọn. Nếu mẫu là mười phần trăm, thì mọi phần tử thứ mười sẽ được chọn, v.v.

Cần lưu ý rằng đôi khi lựa chọn cơ học có thể không cung cấp mẫu đại diện. Ví dụ: nếu mọi con lăn quay thứ mười hai được chọn và ngay sau khi chọn, máy cắt được thay thế, thì tất cả các con lăn được quay bằng máy cắt cùn sẽ được chọn. Trong trường hợp này, cần phải loại bỏ sự trùng hợp giữa nhịp lựa chọn với nhịp thay thế máy cắt, trong đó ít nhất mỗi con lăn thứ mười trong số mười hai con quay phải được chọn.

Với một số lượng lớn các sản phẩm đồng nhất được sản xuất, khi nhiều máy móc và thậm chí các phân xưởng khác nhau tham gia vào quá trình sản xuất nó, phương pháp lựa chọn điển hình được sử dụng để tạo thành mẫu đại diện. Trong trường hợp này, dân số chung được chia sơ bộ thành các nhóm không chồng chéo. Sau đó, từ mỗi nhóm, theo sơ đồ lấy mẫu ngẫu nhiên có hoặc không có trả lại, một số phần tử nhất định được chọn. Chúng tạo thành một tập hợp mẫu, được gọi là điển hình.

Ví dụ, hãy kiểm tra có chọn lọc các sản phẩm của một phân xưởng trong đó có 10 máy sản xuất các sản phẩm giống nhau. Sử dụng sơ đồ lấy mẫu ngẫu nhiên có hoặc không trả lại, các sản phẩm được chọn, trước tiên từ các sản phẩm được làm trên máy thứ nhất, sau đó trên máy thứ hai, v.v. Phương pháp lựa chọn này cho phép bạn tạo thành một mẫu điển hình.

Đôi khi trong thực tế, nên sử dụng phương pháp chọn nối tiếp, ý tưởng của nó là tổng thể chung được chia thành một số nhất định của chuỗi không trùng lặp và tất cả các phần tử của chỉ chuỗi được chọn được kiểm soát theo sơ đồ lấy mẫu ngẫu nhiên. có hoặc không có trả lại. Ví dụ, nếu sản phẩm được sản xuất bởi một nhóm lớn máy móc tự động, thì sản phẩm của một số máy chỉ được kiểm tra liên tục. Lựa chọn nối tiếp được sử dụng nếu tính trạng được kiểm tra dao động nhẹ trong các loạt khác nhau.

Việc lựa chọn phương pháp nào được ưu tiên trong một tình huống nhất định cần được đánh giá trên cơ sở yêu cầu của nhiệm vụ và điều kiện sản xuất. Lưu ý rằng trong thực tế, khi biên soạn một mẫu, một số phương pháp lựa chọn thường được sử dụng đồng thời kết hợp với nhau.

1.6. Phân tích tương quan và hồi quy

Phân tích hồi quy và tương quan là những phương pháp mạnh mẽ cho phép bạn phân tích một lượng lớn thông tin để điều tra mối quan hệ có thể xảy ra giữa hai hoặc nhiều biến.

Nhiệm vụ phân tích tương quanđược giảm xuống để đo lường mức độ chặt chẽ của mối quan hệ đã biết giữa các đối tượng địa lý khác nhau, xác định mối quan hệ nhân quả chưa biết (bản chất nhân quả của chúng phải được làm rõ với sự trợ giúp của phân tích lý thuyết) và đánh giá các yếu tố có ảnh hưởng lớn nhất đến đối tượng địa lý kết quả.

nhiệm vụ Phân tích hồi quy là sự lựa chọn loại mô hình (dạng kết nối), xác lập mức độ ảnh hưởng của các biến độc lập đến biến phụ thuộc và xác định các giá trị tính toán của biến phụ thuộc (các hàm hồi quy).

Giải pháp của tất cả những vấn đề này dẫn đến nhu cầu sử dụng tổng hợp các phương pháp này.

1.7. Loạt động lực học

Khái niệm về chuỗi thời gian và các loại chuỗi thời gian

Loa gầnđược gọi là một chuỗi các chỉ tiêu thống kê thời gian được sắp xếp tuần tự, mà sự thay đổi của chúng phản ánh quá trình phát triển của hiện tượng đang nghiên cứu.

Một loạt các động lực bao gồm hai yếu tố: thời điểm hoặc khoảng thời gian, bao gồm dữ liệu và chỉ số thống kê (cấp độ). Cả hai yếu tố cùng nhau tạo thành thành viên của bộ truyện. Các cấp độ của chuỗi thường được ký hiệu bằng "y" và khoảng thời gian - bằng "t".

Theo khoảng thời gian, bao gồm các cấp độ của chuỗi, chuỗi động lực được chia thành tức thời và khoảng thời gian.

TẠI chuỗi khoảnh khắc mỗi cấp độ đặc trưng cho các hiện tượng tại một thời điểm. Ví dụ: số lượng tiền gửi của dân cư vào các tổ chức của ngân hàng tiết kiệm của Liên bang Nga, vào cuối năm.

TẠI chuỗi khoảng thời gianđộng lực học, mỗi mức của dãy đặc trưng cho hiện tượng trong một khoảng thời gian. Ví dụ: sản xuất đồng hồ ở Nga theo năm.

Trong chuỗi động lực theo khoảng thời gian, các mức của chuỗi có thể được cộng lại và có thể thu được tổng giá trị của chuỗi chu kỳ liên tiếp. Trong chuỗi thời điểm, tổng này không có ý nghĩa.

Tùy theo cách thể hiện các mức của dãy số mà người ta phân biệt dãy số động của giá trị tuyệt đối, giá trị tương đối và giá trị trung bình.

Chuỗi thời gian có thể có các khoảng thời gian bằng nhau và không bằng nhau. Khái niệm về khoảng trong thời điểm và chuỗi khoảng là khác nhau. Khoảng thời gian của chuỗi thời điểm là khoảng thời gian từ ngày này đến ngày khác mà dữ liệu được cung cấp. Nếu đây là dữ liệu về số lượng tiền gửi vào cuối năm, thì khoảng thời gian từ cuối năm này đến cuối năm khác. Khoảng thời gian của chuỗi khoảng thời gian là khoảng thời gian mà dữ liệu được tóm tắt. Nếu đây là sản xuất đồng hồ theo năm, thì khoảng thời gian là một năm.

Khoảng của chuỗi có thể bằng nhau và không bằng nhau cả trong thời điểm và trong chuỗi khoảng của động lực học.

Với sự trợ giúp của chuỗi thời gian, các động lực xác định tốc độ và cường độ phát triển của các hiện tượng, xác định xu hướng chính trong sự phát triển của chúng, làm nổi bật các biến động theo mùa, so sánh sự phát triển của các chỉ số riêng lẻ ở các quốc gia khác nhau theo thời gian và xác định mối quan hệ giữa các hiện tượng phát triển theo thời gian.

1.8. Chỉ số thống kê

Khái niệm về chỉ số

Từ "index" là tiếng Latinh và có nghĩa là "chỉ báo", "con trỏ". Trong thống kê, chỉ số được hiểu là một chỉ tiêu định lượng tổng quát thể hiện tỷ lệ của hai tập hợp bao gồm các yếu tố không thể tổng hợp trực tiếp được. Ví dụ, khối lượng sản xuất của một doanh nghiệp về mặt vật chất không thể được tổng hợp (trừ một khối đồng nhất), nhưng điều này cần thiết cho một đặc điểm khái quát của khối lượng. Không thể tóm tắt giá cho một số loại sản phẩm, v.v. Các chỉ số được sử dụng để khái quát các đặc điểm của các tập hợp đó trong động lực học, trong không gian và so với kế hoạch. Ngoài các đặc điểm tóm tắt của hiện tượng, các chỉ số giúp đánh giá vai trò của các yếu tố riêng lẻ trong việc thay đổi một hiện tượng phức tạp. Chỉ số cũng được sử dụng để xác định sự chuyển dịch cơ cấu trong nền kinh tế quốc dân.

Các chỉ số được tính toán cho cả một hiện tượng phức tạp (tổng quát hoặc tóm tắt) và cho các yếu tố riêng lẻ của nó (các chỉ số riêng lẻ).

Trong các chỉ số mô tả sự thay đổi của một hiện tượng theo thời gian, có sự phân biệt giữa giai đoạn gốc và giai đoạn báo cáo (hiện tại). Nền tảng Khoảng thời gian - đây là khoảng thời gian mà giá trị, được lấy làm cơ sở so sánh, đề cập đến. Nó được biểu thị bằng chỉ số phụ "0". Báo cáo khoảng thời gian là khoảng thời gian mà giá trị được so sánh thuộc về. Nó được biểu thị bằng một chỉ số con "1".

Cá nhân chỉ số là giá trị tương đối thông thường.

Chỉ mục tổng hợp- đặc trưng cho sự thay đổi trong toàn bộ tổng thể phức hợp, tức là bao gồm các phần tử không thể tổng hợp được. Vì vậy, để tính được một chỉ số như vậy, cần khắc phục tình trạng không tổng hợp các phần tử của quần thể.

Điều này đạt được bằng cách giới thiệu một chỉ số (thành phần) bổ sung. Chỉ số tổng hợp bao gồm hai yếu tố: giá trị được lập chỉ mục và trọng số.

Giá trị được lập chỉ mục là chỉ số mà chỉ số được tính toán. Trọng lượng (đồng hồ đo) là một chỉ số bổ sung được giới thiệu nhằm mục đích đo giá trị được lập chỉ mục. Trong chỉ số tổng hợp, tử số và mẫu số luôn là một tập hợp phức tạp, được biểu thị bằng tổng các tích của giá trị và trọng số được lập chỉ mục.

Tùy theo đối tượng nghiên cứu, cả chỉ số chung và chỉ số riêng được chia thành các chỉ số chỉ số thể tích (định lượng)(khối lượng sản xuất vật chất, diện tích gieo hạt, số lượng công nhân, v.v.) và chỉ số chất lượng(giá cả, chi phí, năng suất, năng suất lao động, tiền lương, v.v.).

Tùy thuộc vào cơ sở so sánh, các chỉ số riêng lẻ và chỉ số chung có thể xíchnền tảng .

Tùy thuộc vào phương pháp tính toán, các chỉ số chung có hai dạng: tổng hợp lạihình dạng giữa mục lục.

Việc thu thập, phân tích dữ liệu và tính toán thống kê được thực hiện đúng cách có thể cung cấp cho các cơ cấu quan tâm và công chúng thông tin về sự phát triển của nền kinh tế, về hướng phát triển của nó, cho thấy hiệu quả của việc sử dụng tài nguyên, có tính đến việc làm của người dân. và khả năng hoạt động của nó, xác định tốc độ tăng giá và tác động của thương mại đối với thị trường hoặc phạm vi được thực hiện riêng.

Danh sách tài liệu đã sử dụng

1. Glinsky V.V., Ionin V.G. Phân tích thống kê. Sách giáo khoa. - M.: FILIN, 1998 - 264 tr.

2. Eliseeva I.I., Yuzbashev M.M. Lý thuyết chung về thống kê. Sách giáo khoa.-

M.: Tài chính và thống kê, 1995 - 368 tr.

3. Efimova M.R., Petrova E.V., Rumyantsev V.N. Lý thuyết chung về thống kê. Sách giáo khoa.-M.: INFRA-M, 1996 - 416 tr.

4. Kostina L.V. Kỹ thuật xây dựng đồ thị thống kê. Hướng dẫn phương pháp. - Kazan, TISBI, 2000 - 49 tr.

5. Giáo trình thống kê kinh tế - xã hội: Textbook / ed. hồ sơ M.G. Nazarova.-M.: Finstatinform, UNITI-DIANA, 2000-771 tr.

6. Lý thuyết chung về thống kê: phương pháp luận thống kê trong nghiên cứu hoạt động thương mại: Textbook / ed. A.A. Spirina, O.E. Bashenoy-M.: Tài chính và thống kê, 1994 - 296 tr.

7. Thống kê: một khóa học của các bài giảng / Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. và những người khác - Novosibirsk: NGAEiU, M .: INFRA-M, 1997 - 310 tr.

8. Từ điển thống kê / ch.ed. M.A. Korolev.-M.: Tài chính và thống kê, 1989 - 623 tr.

9. Lý thuyết về Thống kê: Sách giáo khoa / ed. hồ sơ Shmoylova R.A. - M.: Tài chính và thống kê, 1996 - 464 tr.

Quan sát là giai đoạn đầu của nghiên cứu gắn liền với việc thu thập dữ liệu ban đầu về vấn đề đang nghiên cứu. Nó là đặc trưng của nhiều ngành khoa học. Tuy nhiên, mỗi ngành khoa học có những chi tiết cụ thể, khác nhau về quan sát của nó. Do đó, không phải mọi quan sát đều là thống kê.

Nghiên cứu thống kê- đây là tập hợp, tóm tắt và phân tích các số liệu (dữ kiện) về kinh tế - xã hội, nhân khẩu học và các hiện tượng, quá trình khác của đời sống công cộng ở nhà nước, được tổ chức khoa học theo một chương trình duy nhất, có đăng ký các đặc điểm quan trọng nhất của chúng trong tài liệu kế toán .

Các đặc điểm riêng biệt (cụ thể) của nghiên cứu thống kê là: tính mục đích, tính tổ chức, tính đại chúng, tính nhất quán (tính phức tạp), tính so sánh được, tính tài liệu, tính kiểm soát được, tính thực tiễn.

Nói chung, một nghiên cứu thống kê nên:

  • Để có một mục tiêu hữu ích cho xã hội và ý nghĩa phổ quát (nhà nước);
  • Liên quan đến các điều kiện cụ thể về địa điểm và thời gian của nó;
  • Thể hiện loại hình kế toán thống kê (và không phải kế toán và không hoạt động);
  • Được thực hiện theo một chương trình được phát triển trước với các phương pháp luận dựa trên cơ sở khoa học và các hỗ trợ khác;
  • Thực hiện việc thu thập dữ liệu khối lượng (sự kiện), phản ánh toàn bộ tập hợp các yếu tố nhân quả và các yếu tố khác đặc trưng cho hiện tượng theo nhiều cách;
  • Đăng ký theo mẫu chứng từ kế toán mẫu đã lập;
  • Đảm bảo không có sai sót quan sát hoặc giảm chúng đến mức thấp nhất có thể;
  • Đưa ra các tiêu chí chất lượng nhất định và các cách thức để kiểm soát dữ liệu được thu thập, đảm bảo độ tin cậy, tính đầy đủ và nội dung của chúng;
  • Tập trung vào công nghệ thu thập và xử lý dữ liệu hiệu quả về chi phí;
  • Là cơ sở thông tin đáng tin cậy cho tất cả các giai đoạn nghiên cứu thống kê tiếp theo và cho tất cả những người sử dụng thông tin thống kê.

Các nghiên cứu không đáp ứng các yêu cầu này không phải là thống kê. Các nghiên cứu thống kê, ví dụ, không phải là các quan sát và nghiên cứu: các bà mẹ có con đang chơi (câu hỏi cá nhân); khán giả tại một sân khấu sản xuất (không có tài liệu kế toán cho buổi biểu diễn); một nhà nghiên cứu cho các thí nghiệm vật lý và hóa học với các phép đo, tính toán và đăng ký tài liệu của họ (không phải dữ liệu đại chúng); một bác sĩ cho bệnh nhân với việc duy trì thẻ y tế (hồ sơ hoạt động); kế toán sự luân chuyển của các quỹ trong tài khoản ngân hàng của doanh nghiệp (kế toán); các nhà báo về cuộc sống công và đời tư của các quan chức chính phủ hoặc những người nổi tiếng khác (không phải là đối tượng của thống kê).

Một tập hợp các đơn vị có tính chất khối lượng, tính điển hình, tính đồng nhất về chất lượng và sự hiện diện của biến thể.

Dân số thống kê bao gồm các đối tượng vật chất hiện có (Người lao động, doanh nghiệp, quốc gia, khu vực), là đối tượng của nghiên cứu thống kê.

Xem thêm:

Quan sát thống kê là khâu đầu tiên của nghiên cứu thống kê, là hoạt động thu thập dữ liệu được tổ chức một cách khoa học về các hiện tượng và quá trình đã được nghiên cứu của đời sống xã hội.

Các giai đoạn của hoạt động thống kê

Bất kỳ nghiên cứu thống kê nào cũng bao gồm sáu giai đoạn.

Giai đoạn 1. Nghiên cứu thống kê bắt đầu với việc hình thành cơ sở thông tin thống kê sơ cấp cho bộ chỉ tiêu đã chọn.
  • Giữ.
  • Sử dụng các nguồn chính thức của nhà nước và công ty (có thương hiệu).
  • Sử dụng các nghiên cứu thống kê khoa học trên các tạp chí, báo, sách chuyên khảo, v.v.
  • Sử dụng các phương tiện điện tử (Internet, CD, đĩa mềm, v.v.).
Giai đoạn 2. Tổng quát hóa sơ cấp và phân nhóm dữ liệu thống kê.
  • , tích lũy (), đồ thị phân bố tần số (tần số).
  • Sự hình thành và phân tích chính của chúng. Dự báo đồ họa (với khái niệm "người lạc quan", "người bi quan", "người thực tế").
  • Tính toán các khoảnh khắc của bậc K (trung bình, độ phân tán, số đo độ lệch, phép đo độ lệch) để xác định các chỉ số của tâm giãn nở, các chỉ số về độ lệch (không đối xứng), chỉ số của độ lệch (độ nhọn).
  • Hình thành và tính toán sơ cấp các chỉ tiêu thống kê phức tạp (tương đối, đa cấp tóm tắt).
  • Hình thành và tính toán chính của các chỉ số chỉ số.
Giai đoạn 3. Giai đoạn tiếp theo của nghiên cứu thống kê bao gồm việc giải thích kinh tế của khái quát sơ cấp.
  • và đánh giá tài chính của đối tượng phân tích.
  • Hình thành sự lo lắng (hài lòng) về các tình huống kinh tế và tài chính.
  • Cảnh báo về việc tiếp cận các giá trị thống kê ngưỡng được áp dụng, như một quy luật, các vấn đề kinh tế vĩ mô.
  • Đa dạng hóa tổng quát hóa thống kê sơ cấp của các kết quả ứng dụng thu được dọc theo hệ thống phân cấp quyền lực, quan hệ đối tác, kinh doanh.
Giai đoạn 4. Máy tính phân tích dữ liệu thống kê mở rộng (thể tích) sơ cấp và tổng quát.
  • Phân tích sự biến đổi của dữ liệu thống kê mở rộng.
  • Phân tích động lực của dữ liệu thống kê mở rộng.
  • Phân tích các liên kết dữ liệu thống kê mở rộng.
  • Tóm tắt đa chiều và phân nhóm.
Giai đoạn 5. Dự báo máy tính trong các lĩnh vực quan trọng nhất đã chọn.
  • Phương pháp bình phương nhỏ nhất (LSM).
  • Đường trung bình động.
  • Phân tích kỹ thuật.
  • Phân tích tổng hợp và dự báo các quan điểm lựa chọn với các khuyến nghị điều chỉnh quản lý và đầu tư.
Giai đoạn 6. Phân tích khái quát các kết quả thu được và kiểm tra độ tin cậy của chúng theo các tiêu chí thống kê. Giai đoạn 7. Giai đoạn cuối cùng của nghiên cứu thống kê là thông qua.

Có năm loại phân tích thống kê chính được sử dụng trong nghiên cứu marketing: phân tích mô tả, phân tích suy diễn, phân tích sự khác biệt, phân tích mối quan hệ và phân tích dự đoán. Đôi khi những loại phân tích này được sử dụng riêng biệt, đôi khi cùng nhau.

Phân tích mô tả dựa trên việc sử dụng các thước đo thống kê như giá trị trung bình (giá trị trung bình), chế độ, độ lệch chuẩn, phạm vi hoặc biên độ của sự thay đổi.

Phân tích, dựa trên việc sử dụng các thủ tục thống kê (ví dụ, kiểm tra giả thuyết) để tổng quát hóa các kết quả thu được cho toàn bộ tổng thể, được gọi là phân tích suy diễn.

Phân tích sự khác biệt được sử dụng để so sánh kết quả của một nghiên cứu về hai nhóm (hai phân khúc thị trường) nhằm xác định mức độ khác biệt thực sự trong hành vi của họ, đối với cùng một quảng cáo, v.v.

Phân tích mối quan hệ nhằm xác định các mối quan hệ hệ thống (tính hướng và độ mạnh của chúng) của các biến. Ví dụ, xác định mức tăng chi phí quảng cáo ảnh hưởng như thế nào đến việc tăng doanh số bán hàng.

Phân tích dự đoán được sử dụng để dự đoán các diễn biến trong tương lai, ví dụ thông qua phân tích chuỗi thời gian. Các phương pháp dự báo thống kê được thảo luận trong Phần 7.

Các công cụ phân tích mô tả

Để mô tả thông tin thu được từ các phép đo mẫu, hai nhóm thước đo được sử dụng rộng rãi. Loại thứ nhất bao gồm các biện pháp "xu hướng trung tâm", hoặc các biện pháp mô tả một người trả lời điển hình hoặc một phản ứng điển hình. Phương pháp thứ hai bao gồm các thước đo về sự thay đổi, hoặc các thước đo mô tả mức độ mà người trả lời hoặc câu trả lời tương tự hoặc khác với người trả lời hoặc câu trả lời "điển hình".

Có các thước đo mô tả khác, chẳng hạn như các thước đo bất đối xứng (các đường cong phân phối tìm được khác với đường cong phân phối chuẩn như thế nào). Tuy nhiên, chúng không được sử dụng thường xuyên như ở trên và không được khách hàng quan tâm đặc biệt.

Dưới đây chỉ mô tả ngắn gọn về các biện pháp này. Thông tin chi tiết hơn có thể được lấy từ các sách về thống kê toán học, chẳng hạn,.

Các thước đo về xu hướng trung tâm bao gồm chế độ, trung vị và trung bình.

Chế độ đặc trưng cho giá trị của đối tượng xuất hiện thường xuyên nhất so với các giá trị khác của đối tượng đã cho. Thời trang là tương đối và đa số người được hỏi không cần thiết phải chỉ ra chính xác giá trị này của tính năng.

Giá trị trung bình đặc trưng cho giá trị của thuộc tính, giá trị này chiếm vị trí chính giữa trong chuỗi giá trị có thứ tự của thuộc tính này.

Thước đo thứ ba của xu hướng trung tâm là giá trị trung bình, thường được tính là giá trị trung bình cộng. Khi nó được tính toán, tổng khối lượng của thuộc tính được phân bổ đều cho tất cả các đơn vị của dân số.

Có thể thấy rằng mức độ hàm lượng thông tin của giá trị trung bình lớn hơn trung vị, và trung vị là chế độ.

Tuy nhiên, các thước đo được xem xét không đặc trưng cho sự thay đổi của các câu trả lời cho một câu hỏi nhất định, hay nói cách khác là sự không giống nhau, khác biệt của những người trả lời hoặc các đặc điểm được đo lường. Rõ ràng, ngoài việc biết các giá trị của các thước đo của xu hướng trung tâm, điều quan trọng là phải thiết lập phần còn lại của các ước tính thu được gần với các giá trị này như thế nào. Ba thước đo biến thiên thường được sử dụng: phân bố tần số, phạm vi biến thiên và độ lệch chuẩn.

Phân bổ tần số biểu thị dưới dạng bảng hoặc đồ thị số lần xuất hiện của mỗi giá trị của đặc tính (thuộc tính) được đo trong mỗi phạm vi giá trị đã chọn của nó. Sự phân bố tần số cho phép bạn nhanh chóng đưa ra kết luận về mức độ chi tiết của kết quả đo.

Biến thể nhịp xác định sự khác biệt tuyệt đối giữa các giá trị lớn nhất và nhỏ nhất của đối tượng được đo. Nói cách khác, nó là sự khác biệt giữa các điểm cuối trong sự phân bố các giá trị theo thứ tự của đặc điểm đo được. Phép đo này xác định khoảng phân bố của các giá trị đặc trưng.

Độ lệch chuẩn là một đặc trưng thống kê tổng quát về sự biến đổi của các giá trị tính trạng. Nếu số đo này nhỏ thì đường cong phân bố có dạng nén, hẹp (kết quả đo có độ giống nhau cao); nếu số đo lớn, thì đường cong phân phối có dạng rộng, kéo dài (mức độ chênh lệch trong ước lượng lớn).

Trước đây, người ta đã lưu ý rằng việc lựa chọn thang đo lường, và do đó loại câu hỏi trong bảng câu hỏi, xác định trước lượng thông tin nhận được. Tương tự, lượng thông tin thu được bằng cách sử dụng các biện pháp đã thảo luận ở trên là khác nhau. Nguyên tắc chung là các thước đo thống kê giúp bạn có thể thu được nhiều thông tin hơn khi sử dụng các thang đo lường có nhiều thông tin nhất. Việc lựa chọn thang đo lường xác định trước sự lựa chọn các thước đo thống kê. Ví dụ: một trong những câu hỏi trong cuộc khảo sát nhân khẩu học sử dụng thang điểm đặt tên là về quốc tịch. Người Nga được gán mã số 1, người Ukraine - 2, người Tatars - 3, v.v. Trong trường hợp này, tất nhiên, bạn có thể tính giá trị trung bình. Nhưng làm thế nào để giải thích quốc tịch trung bình bằng, ví dụ, 5,67? Để tính giá trị trung bình, bạn phải sử dụng thang đo khoảng thời gian hoặc thang tỷ lệ. Tuy nhiên, trong ví dụ của chúng tôi, bạn có thể sử dụng thời trang.

Đối với các phép đo độ biến thiên, thang đo danh nghĩa áp dụng phân bố tần số, thang đo thứ tự sử dụng phân phối tần số tích lũy, thang đo khoảng và tỷ lệ áp dụng độ lệch chuẩn.

suy luận thống kê

Suy luận là một loại phân tích logic nhằm đưa ra kết luận chung về toàn bộ dân số dựa trên quan sát của một nhóm nhỏ các đơn vị trong tổng thể này.

Kết luận được rút ra trên cơ sở phân tích một số lượng nhỏ các sự kiện. Ví dụ, nếu hai người bạn của bạn có cùng một nhãn hiệu ô tô phàn nàn về chất lượng của nó, thì bạn có thể kết luận rằng chất lượng của nhãn hiệu ô tô nói chung là thấp.

Suy luận thống kê dựa trên phân tích thống kê kết quả của các nghiên cứu mẫu và nhằm đánh giá các tham số của tổng thể. Trong trường hợp này, kết quả của các nghiên cứu chọn lọc chỉ là điểm khởi đầu để có được các kết luận chung.

Ví dụ, một nhà sản xuất ô tô đã thực hiện hai cuộc khảo sát độc lập để đo lường mức độ hài lòng của khách hàng đối với ô tô của họ. Mẫu đầu tiên bao gồm 100 người tiêu dùng đã mua mẫu này trong vòng sáu tháng qua. Mẫu thứ hai bao gồm 1000 người tiêu dùng. Trong các cuộc phỏng vấn qua điện thoại, người được hỏi trả lời câu hỏi: "Bạn hài lòng hay không hài lòng với mẫu xe bạn đã mua?" Cuộc khảo sát đầu tiên cho thấy 30% không hài lòng, cuộc khảo sát thứ hai - 35%.

Vì có sai số lấy mẫu trong cả trường hợp thứ nhất và thứ hai, nên kết luận sau có thể được rút ra. Đối với trường hợp thứ nhất: khoảng 30% người được hỏi tỏ ra không hài lòng với mẫu xe đã mua. Đối với trường hợp thứ hai, khoảng 35% người được hỏi bày tỏ sự không hài lòng với mẫu xe đã mua. Có thể rút ra kết luận chung nào trong trường hợp này? Làm thế nào để loại bỏ thuật ngữ "về"? Để làm điều này, chúng tôi giới thiệu một chỉ báo lỗi: 30% ± x% và 35% ± y% và so sánh x và y. Sử dụng phân tích lôgic, chúng ta có thể kết luận rằng một mẫu lớn có sai số nhỏ hơn và trên cơ sở đó có thể đưa ra kết luận đúng đắn hơn về ý kiến ​​của toàn bộ người tiêu dùng. Có thể thấy rằng cỡ mẫu là yếu tố quyết định để có được kết luận chính xác. Chỉ số này có mặt trong tất cả các công thức xác định nội dung của các phương pháp suy luận thống kê khác nhau.

Khi tiến hành nghiên cứu marketing, các phương pháp suy luận thống kê sau đây thường được sử dụng nhất: ước lượng tham số và kiểm định giả thuyết.

Ước tính tham số dân số là quá trình xác định, dựa trên dữ liệu mẫu, khoảng thời gian mà một trong các tham số của tổng thể, chẳng hạn như giá trị trung bình, nằm ở vị trí nào. Để thực hiện việc này, hãy sử dụng các thống kê sau: giá trị trung bình, sai số chuẩn và mức độ tin cậy mong muốn (thường là 95% hoặc 99%).

Vai trò của chúng trong ước lượng tham số sẽ được thảo luận dưới đây.

Sai số bình phương trung bình, như đã nói ở trên, là một thước đo sự thay đổi trong phân bố mẫu theo giả định lý thuyết rằng nhiều mẫu độc lập của cùng một tổng thể chung đã được nghiên cứu.

Nó được xác định theo công thức sau:

Nơi s x - sai số chuẩn của trung bình mẫu;

s - độ lệch chuẩn so với giá trị trung bình trong mẫu;

n - kích thước mẫu.

Nếu các thước đo tỷ lệ phần trăm được sử dụng để thể hiện sự biến đổi thay thế của các tính trạng chất lượng, thì

trong đó s là sai số chuẩn của giá trị trung bình của mẫu khi sử dụng các phép đo phần trăm;

p là phần trăm số người được hỏi trong mẫu đã ủng hộ phương án đầu tiên;

q = (100 - q) - phần trăm số người được hỏi trong mẫu đã ủng hộ

thay thế thứ hai;

n - kích thước mẫu.

Có thể thấy rằng sai số lấy mẫu trung bình càng lớn thì độ biến thiên càng lớn và càng nhỏ thì cỡ mẫu càng lớn.

Vì luôn có sai số lấy mẫu, nên cần phải ước lượng mức độ lan truyền các giá trị của tham số nghiên cứu của tổng thể chung. Giả sử nhà nghiên cứu đã chọn mức tin cậy là 99%. Theo các đặc tính của đường cong phân phối chuẩn, tham số Z = ± 2,58 tương ứng với nó. Giá trị trung bình của toàn bộ dân số nói chung được tính bằng công thức

Nếu tỷ lệ phần trăm được sử dụng, thì

Điều này có nghĩa là nếu bạn muốn phạm vi ước tính có độ tin cậy 99% bao gồm ước tính thực cho tổng thể, thì bạn cần nhân sai số chuẩn với 2,58 và cộng kết quả đó với phần trăm p (giới hạn trên). Nếu chúng tôi trừ sản phẩm này, thì chúng tôi tìm thấy ước tính giới hạn dưới.

Làm thế nào để những công thức này liên quan đến suy luận thống kê?

Vì tham số tổng thể đang được ước tính, nên phạm vi mà giá trị thực của tham số tổng thể rơi vào được chỉ ra ở đây. Với mục đích này, một thước đo thống kê về xu hướng trung tâm, độ lớn của phương sai và kích thước mẫu được thực hiện cho mẫu. Tiếp theo, một giả định được đưa ra về mức độ tin cậy và phạm vi phân tán của tham số đối với dân số chung được tính toán.

Ví dụ, đối với thành viên mẫu (100 người đọc một tờ báo), người ta thấy rằng thời gian đọc trung bình của một tờ báo là 45 phút với sai số RMS là 20 phút. Với mức độ tin cậy là 95%, chúng tôi nhận được

Ở mức độ tin cậy 99%, chúng tôi nhận được

Có thể thấy rằng khoảng tin cậy rộng hơn cho 99% so với mức tin cậy 95%.

Nếu tỷ lệ phần trăm được sử dụng và hóa ra trong số mẫu 100 người, 50% số người được hỏi uống cà phê vào buổi sáng, thì ở mức tin cậy 99%, chúng tôi nhận được khoảng ước tính sau:

Do đó, logic của suy luận thống kê nhằm đưa ra kết luận cuối cùng về tham số được nghiên cứu của tổng thể nói chung trên cơ sở một nghiên cứu chọn lọc được thực hiện theo quy luật thống kê toán học. Nếu một kết luận đơn giản được sử dụng không dựa trên các phép đo thống kê, thì các kết luận cuối cùng là chủ quan và dựa trên các dữ kiện giống nhau, các chuyên gia khác nhau có thể đưa ra các kết luận khác nhau.

Khi sử dụng suy luận thống kê, các công thức được sử dụng có bản chất khách quan, dựa trên các khái niệm thống kê được chấp nhận chung. Nhờ vậy, những kết luận cuối cùng khách quan hơn rất nhiều.

Trong một số trường hợp, các phán đoán được đưa ra liên quan đến một số tham số của tổng thể chung (giá trị của giá trị trung bình, phương sai, bản chất của phân phối, dạng và mức độ gần gũi của mối quan hệ giữa các biến) chỉ dựa trên một số giả định, phản ánh, trực giác, không đầy đủ kiến thức. Những phán đoán như vậy được gọi là giả thuyết.

Giả thuyết thống kê là một giả định về một thuộc tính của tổng thể có thể được kiểm tra dựa trên dữ liệu mẫu.

Ở dưới kiểm tra giả thuyếtđề cập đến thủ tục thống kê được sử dụng để xác nhận hoặc bác bỏ một giả thuyết dựa trên kết quả của các nghiên cứu mẫu. Kiểm định giả thuyết được thực hiện trên cơ sở xác định tính nhất quán của dữ liệu thực nghiệm với dữ liệu giả thuyết. Nếu sự khác biệt giữa các giá trị được so sánh không vượt quá giới hạn của sai số ngẫu nhiên thì giả thuyết được chấp nhận. Đồng thời, không có kết luận nào được đưa ra về tính đúng đắn của bản thân giả thuyết, nó chỉ là về tính nhất quán của dữ liệu được so sánh.

Kiểm tra giả thuyết được thực hiện trong năm giai đoạn:

1. Một số giả định được đưa ra về một số đặc tính của tổng thể chung, ví dụ, về giá trị trung bình của một tham số nhất định.

2. Mẫu ngẫu nhiên được hình thành, nghiên cứu chọn lọc được thực hiện và xác định các chỉ tiêu thống kê của mẫu.

3. Các giá trị giả định và thống kê của đặc tính được nghiên cứu được so sánh.

4. Nó được xác định xem kết quả của nghiên cứu mẫu có tương ứng với giả thuyết đã được chấp nhận hay không.

5. Nếu kết quả của nghiên cứu mẫu không xác nhận giả thuyết, thì giả thuyết sau sẽ được sửa đổi - nó phải tương ứng với dữ liệu của nghiên cứu mẫu.

Do sự thay đổi trong kết quả của các nghiên cứu mẫu, không thể đưa ra kết luận chính xác tuyệt đối về độ tin cậy của giả thuyết bằng cách tiến hành so sánh số học đơn giản các giá trị của các đặc trưng. Do đó, kiểm định giả thuyết thống kê liên quan đến việc sử dụng: giá trị mẫu của đặc trưng, ​​độ lệch chuẩn, mức độ tin cậy mong muốn và giá trị giả định của đặc trưng cho tổng thể.

Công thức sau được sử dụng để kiểm tra các giả thuyết về giá trị trung bình:

Ví dụ: khi quảng cáo một chương trình đào tạo bán hàng đại học, người quản lý chương trình ước tính rằng sinh viên tốt nghiệp chương trình đang kiếm được trung bình 1.750 đô la mỗi tháng. Vì vậy, trung bình dân số giả định là $ 1,750. Để kiểm tra giả thuyết này, một cuộc khảo sát qua điện thoại đối với các đại lý bán hàng của các hãng khác nhau đã được thực hiện.

Mẫu là 100 người, giá trị trung bình của mẫu là 1.800 đô la và độ lệch chuẩn là 350 đô la. Câu hỏi đặt ra là liệu có sự khác biệt lớn (50 đô la) giữa mức lương giả định và giá trị trung bình của nó đối với mẫu hay không. Chúng tôi thực hiện tính toán theo công thức (4.2):

Có thể thấy rằng sai số bình phương trung bình của giá trị trung bình là 35 đô la, và thương số của 50 chia cho 45 là 1,43 (độ lệch chuẩn hóa), nhỏ hơn ± 1,96, một giá trị đặc trưng cho mức độ tin cậy 95%. Trong trường hợp này, giả thuyết được đề xuất có thể được coi là đáng tin cậy.

Khi sử dụng thước đo phần trăm, giả thuyết được kiểm tra như sau. Giả sử rằng, dựa trên kinh nghiệm của bản thân, một trong những người lái xe đã đưa ra giả thuyết rằng chỉ có 10% người lái xe sử dụng dây an toàn. Tuy nhiên, các nghiên cứu mẫu quốc gia trên 1000 người lái xe ô tô cho thấy 80% trong số họ sử dụng dây an toàn. Các tính toán trong trường hợp này được thực hiện như sau:

trong đó p là tỷ lệ phần trăm của các nghiên cứu mẫu;

πH- tỷ lệ phần trăm của giả thuyết;

s p - căn bậc hai sai số trung bình trong các phép tính theo phần trăm.

Có thể thấy rằng giả thuyết ban đầu khác với giá trị được tìm thấy 80% bởi giá trị của 55,3 nhân với sai số chuẩn, tức là không thể được coi là đáng tin cậy.

Trong một số trường hợp, nên sử dụng các giả thuyết định hướng. Các giả thuyết định hướng xác định các hướng của các giá trị có thể có của một số tham số của tổng thể chung. Ví dụ, mức lương là hơn $ 1,750. Trong trường hợp này, chỉ một mặt của đường cong phân phối được sử dụng, điều này được phản ánh trong việc sử dụng các dấu "+" và "-" trong công thức tính toán.

Thông tin chi tiết hơn về vấn đề này có thể được lấy từ.

Tuy nhiên, ở đây, một câu hỏi được đặt ra. Nếu bạn có thể tiến hành các nghiên cứu có chọn lọc, thì tại sao lại đưa ra các giả thuyết? Việc xử lý kết quả của các nghiên cứu chọn lọc giúp có thể thu được các giá trị trung bình và các đặc điểm thống kê của chúng mà không cần đưa ra bất kỳ giả thuyết nào. Do đó, kiểm định giả thuyết có nhiều khả năng được sử dụng trong trường hợp không thể hoặc cực kỳ khó thực hiện các nghiên cứu toàn diện và khi cần so sánh kết quả của một số nghiên cứu (đối với các nhóm người trả lời khác nhau hoặc được tiến hành vào các thời điểm khác nhau). Những vấn đề kiểu này thường nảy sinh trong thống kê xã hội. Cường độ lao động của nghiên cứu thống kê và xã hội học dẫn đến thực tế là hầu hết tất cả chúng đều dựa trên kế toán không liên tục. Do đó, vấn đề kết luận dựa trên bằng chứng trong thống kê xã hội đặc biệt gay gắt.

Khi áp dụng quy trình kiểm tra giả thuyết, cần nhớ rằng nó có thể đảm bảo kết quả với một xác suất nhất định chỉ đối với các mẫu “không thiên vị”, dựa trên dữ liệu khách quan.

Phân tích sự khác biệt

Kiểm tra tầm quan trọng của sự khác biệt bao gồm so sánh các câu trả lời cho cùng một câu hỏi nhận được cho hai hoặc nhiều nhóm người trả lời độc lập. Ngoài ra, trong một số trường hợp, việc so sánh các câu trả lời cho hai hoặc nhiều câu hỏi độc lập cho cùng một mẫu được quan tâm.

Một ví dụ của trường hợp đầu tiên là nghiên cứu câu hỏi: cư dân của một vùng nhất định thích uống gì vào buổi sáng: cà phê hay trà. Ban đầu, 100 người được hỏi được phỏng vấn trên cơ sở một mẫu ngẫu nhiên, 60% trong số họ thích cà phê; một năm sau, nghiên cứu được lặp lại và chỉ 40% trong số 300 người được khảo sát ủng hộ cà phê. Kết quả của hai nghiên cứu này có thể được so sánh như thế nào? Việc so sánh số học trực tiếp giữa 40% và 60% là không thể do sai số lấy mẫu khác nhau. Mặc dù trong trường hợp có sự khác biệt lớn về số lượng, chẳng hạn như 20 và 80%, sẽ dễ dàng kết luận rằng có sự thay đổi về thị hiếu đối với cà phê. Tuy nhiên, nếu tin chắc rằng sự khác biệt lớn này chủ yếu là do trong trường hợp đầu tiên, một mẫu rất nhỏ đã được sử dụng, thì kết luận như vậy có thể bị nghi ngờ. Vì vậy, khi tiến hành so sánh như vậy, phải tính đến hai yếu tố quan trọng: mức độ ý nghĩa của sự khác biệt giữa các giá trị tham số của hai mẫu và sai số bình phương trung bình của hai mẫu, được xác định bởi thể tích của chúng.

Giả thuyết rỗng được sử dụng để kiểm tra xem liệu sự khác biệt giữa các phương tiện được đo có đáng kể hay không. Giả thuyết vô hiệu cho rằng hai quần thể được so sánh về một hoặc nhiều đặc điểm không khác biệt với nhau. Trong trường hợp này, giả định rằng sự khác biệt thực tế giữa các giá trị được so sánh bằng 0 và sự khác biệt so với 0 được tiết lộ từ dữ liệu có tính chất ngẫu nhiên ,.

Để kiểm tra xem sự khác biệt giữa hai phương tiện đo lường (tỷ lệ phần trăm) có đáng kể hay không, trước tiên chúng được so sánh và sau đó sự khác biệt kết quả được chuyển đổi thành giá trị của sai số chuẩn và nó được xác định xem chúng lệch bao xa so với giá trị 0 giả định.

Khi các sai số chuẩn được xác định, diện tích dưới đường cong phân phối chuẩn được biết đến và có thể rút ra kết luận về xác suất hoàn thành giả thuyết rỗng.

Hãy xem xét ví dụ sau. Chúng ta hãy thử trả lời câu hỏi: "Có sự khác biệt trong việc tiêu thụ nước ngọt giữa trẻ em gái và trẻ em trai?" Cuộc khảo sát hỏi về số lượng lon nước ngọt được tiêu thụ trong tuần. Thống kê mô tả cho thấy, trung bình trẻ em trai tiêu thụ 9 lon nước ngọt và trẻ em gái 7,5 lon nước ngọt. Độ lệch bình phương trung bình lần lượt là 2 và 1,2. Cỡ mẫu trong cả hai trường hợp là 100 người. Việc kiểm tra sự khác biệt có ý nghĩa thống kê trong các ước tính được thực hiện như sau:

trong đó x 1 và x 2 là giá trị trung bình của hai mẫu;

s 1 và s 2 - độ lệch chuẩn của hai mẫu;

n 1 và n 2 - thể tích của mẫu thứ nhất và thứ hai tương ứng.

Tử số của công thức này đặc trưng cho sự khác biệt giữa các giá trị trung bình. Ngoài ra, cần phải tính đến sự khác biệt về hình dạng của hai đường cong phân phối. Điều này được thực hiện ở mẫu số của công thức. Phân phối lấy mẫu bây giờ được coi là phân phối lấy mẫu của sự khác biệt giữa các phương tiện (số đo phần trăm). Nếu giả thuyết rỗng là đúng, thì phân phối của sự khác biệt là một đường cong chuẩn với giá trị trung bình bằng 0 và sai số bình phương trung bình bằng 1.

Có thể thấy rằng giá trị 6,43 vượt quá đáng kể giá trị ± 1,96 (độ tin cậy 95%) và ± 2,58 (độ tin cậy 99%). Điều này có nghĩa là giả thuyết vô hiệu là không đúng.

Trên hình. 4.6 cho thấy các đường cong phân phối của hai mẫu được so sánh này và sai số bình phương trung bình của đường cong chênh lệch. Sai số bình phương trung bình của đường cong chênh lệch trung bình là 0. Do giá trị lớn của sai số bình phương trung bình, xác suất hợp lệ của giả thuyết rỗng rằng không có sự khác biệt giữa hai giá trị trung bình là nhỏ hơn 0,001.

Các nguyên tắc cơ bản của phân tích dữ liệu thống kê

số liệu thống kê"thống kê sinh học ".

1. danh nghĩa;
2. thứ tự;
3. khoảng thời gian;

mẫu

Tiêu biểu

Khung mẫu mẫu ngẫu nhiên đơn giản lấy mẫu khoảng thời gian

lấy mẫu phân tầng

cụmhạn ngạch lấy mẫu

giả thuyết vô hiệu

giả thuyết thay thế sức mạnh

mức độ tin cậy. "


Title: Các nguyên tắc cơ bản về phân tích dữ liệu thống kê
Miêu tả cụ thể:

Sau khi hoàn thành bất kỳ nghiên cứu khoa học nào, cơ bản hay thử nghiệm, một phân tích thống kê về dữ liệu thu được sẽ được thực hiện. Để phân tích thống kê được thực hiện thành công và giải quyết các nhiệm vụ, nghiên cứu phải được lập kế hoạch thích hợp. Do đó, nếu không hiểu những kiến ​​thức cơ bản về thống kê thì không thể lập kế hoạch và xử lý các kết quả của một thí nghiệm khoa học. Tuy nhiên, giáo dục y tế không chỉ cung cấp kiến ​​thức về thống kê, mà thậm chí cả những kiến ​​thức cơ bản của toán học cao hơn. Do đó, người ta thường có ý kiến ​​rằng chỉ một nhà thống kê mới nên xử lý thống kê trong nghiên cứu y sinh, và một nhà nghiên cứu y học nên tập trung vào các vấn đề y tế trong công trình khoa học của mình. Sự phân công lao động như vậy, ngụ ý hỗ trợ phân tích dữ liệu, là hoàn toàn chính đáng. Tuy nhiên, hiểu biết về các nguyên tắc thống kê ít nhất là cần thiết để tránh việc đặt vấn đề sai cho một chuyên gia, việc trao đổi với ai trước khi bắt đầu nghiên cứu cũng quan trọng như ở giai đoạn xử lý dữ liệu.

Trước khi nói về những vấn đề cơ bản của phân tích thống kê, cần phải làm rõ ý nghĩa của thuật ngữ " số liệu thống kê". Có nhiều định nghĩa, nhưng theo chúng tôi, đầy đủ và ngắn gọn nhất là định nghĩa thống kê là “khoa học thu thập, trình bày và phân tích dữ liệu”. Đổi lại, việc sử dụng số liệu thống kê trong các ứng dụng vào thế giới sống được gọi là "sinh trắc học" hoặc " thống kê sinh học ".

Cần lưu ý rằng các số liệu thống kê rất thường chỉ tập trung vào việc xử lý dữ liệu thực nghiệm mà không chú ý đến giai đoạn thu thập chúng. Tuy nhiên, kiến ​​thức thống kê là cần thiết trong quá trình lập kế hoạch thử nghiệm, để các chỉ số thu được trong quá trình đó có thể cung cấp cho nhà nghiên cứu thông tin đáng tin cậy. Do đó, chúng ta có thể nói rằng việc phân tích thống kê các kết quả của thí nghiệm bắt đầu ngay cả trước khi bắt đầu nghiên cứu.

Đã ở giai đoạn phát triển kế hoạch, nhà nghiên cứu nên hiểu rõ ràng loại biến nào sẽ có trong công việc của mình. Tất cả các biến có thể được chia thành hai lớp: định tính và định lượng. Phạm vi mà một biến có thể thực hiện tùy thuộc vào quy mô đo lường. Có bốn thang đo chính:

1. danh nghĩa;
2. thứ tự;
3. khoảng thời gian;
4. hợp lý (quy mô quan hệ).

Trong thang đo danh nghĩa (thang đo “tên”) chỉ có các ký hiệu để mô tả một số loại đối tượng, ví dụ, “giới tính” hoặc “nghề nghiệp của bệnh nhân”. Thang đo danh nghĩa ngụ ý rằng biến sẽ nhận các giá trị, các mối quan hệ định lượng giữa các giá trị này không thể xác định được. Do đó, không thể thiết lập mối quan hệ toán học giữa hai giới nam và nữ. Các ký hiệu số thông thường (nữ - 0, nam - 1, hoặc ngược lại) được đưa ra hoàn toàn tùy ý và chỉ nhằm mục đích xử lý trên máy tính. Thang đo danh nghĩa là định tính ở dạng tinh khiết nhất của nó; các danh mục riêng lẻ trong thang này được biểu thị bằng tần số (số lượng hoặc tỷ lệ quan sát, tỷ lệ phần trăm).

Thang đo thứ tự (ordinal) cung cấp rằng các danh mục riêng lẻ trong nó có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Trong thống kê y tế, một ví dụ cổ điển về thang thứ tự là phân loại mức độ nghiêm trọng của một căn bệnh. Trong trường hợp này, chúng ta có thể xây dựng mức độ nghiêm trọng theo thứ tự tăng dần, nhưng vẫn không có khả năng chỉ định các mối quan hệ định lượng, tức là khoảng cách giữa các giá trị được đo trong thang thứ tự là không xác định hoặc không quan trọng. Dễ dàng thiết lập thứ tự các giá trị của biến “mức độ nghiêm trọng”, nhưng không thể xác định được tình trạng nghiêm trọng khác với tình trạng trung bình bao nhiêu lần.

Thang đo thứ tự đề cập đến các kiểu dữ liệu bán định lượng và sự phân cấp của nó có thể được mô tả bằng cả tần số (như trong thang định tính) và bằng các thước đo giá trị trung tâm, mà chúng ta sẽ thảo luận bên dưới.

Thang đo khoảng thời gian và thang đo hợp lý hoàn toàn là các kiểu dữ liệu định lượng. Trong thang đo khoảng thời gian, chúng ta đã có thể xác định giá trị của một biến khác với giá trị khác bao nhiêu. Do đó, nhiệt độ cơ thể tăng thêm 1 độ C luôn có nghĩa là nhiệt lượng tỏa ra tăng lên một số đơn vị cố định. Tuy nhiên, thang đo khoảng có cả giá trị âm và dương (không có độ không tuyệt đối). Về vấn đề này, không thể nói rằng 20 độ C ấm gấp đôi 10. Chúng ta chỉ có thể nói rằng 20 độ ấm hơn nhiều so với 10 vì 30 là ấm hơn 20.

Thang đo hợp lý (thang tỷ lệ) có một điểm tham chiếu và chỉ các giá trị dương. Trong y học, hầu hết các thang đo hợp lý là nồng độ. Ví dụ, mức glucose 10 mmol / L là gấp đôi nồng độ so với 5 mmol / L. Đối với nhiệt độ, thang đo hợp lý là thang Kelvin, nơi có độ không tuyệt đối (không có nhiệt).

Cần nói thêm rằng bất kỳ biến định lượng nào cũng có thể liên tục, như trong trường hợp đo nhiệt độ cơ thể (đây là thang đo khoảng thời gian liên tục), hoặc rời rạc, nếu chúng ta đếm số lượng tế bào máu hoặc con của động vật thí nghiệm (đây là tỷ lệ hợp lý rời rạc).

Những khác biệt này có tầm quan trọng quyết định đối với việc lựa chọn phương pháp phân tích thống kê các kết quả thực nghiệm. Vì vậy, đối với dữ liệu danh nghĩa, kiểm tra chi bình phương có thể áp dụng và kiểm tra Student's nổi tiếng yêu cầu biến (khoảng hoặc hữu tỷ) phải liên tục.

Sau khi câu hỏi về loại biến đã được giải quyết, cần bắt đầu hình thành mẫu. Mẫu là một nhóm nhỏ các đối tượng thuộc một tầng lớp nhất định (trong y học, một quần thể). Để có được dữ liệu chính xác tuyệt đối, cần phải nghiên cứu tất cả các đối tượng của một lớp nhất định, tuy nhiên, vì lý do thực tế (thường là tài chính), chỉ một phần của dân số, được gọi là mẫu, được nghiên cứu. Trong tương lai, phân tích thống kê cho phép nhà nghiên cứu mở rộng các mẫu thu được cho toàn bộ dân số với một mức độ chính xác nhất định. Trên thực tế, tất cả các thống kê y sinh đều nhằm mục đích thu được kết quả chính xác nhất từ ​​số lần quan sát ít nhất có thể, bởi vì trong nghiên cứu con người, vấn đề đạo đức cũng rất quan trọng. Chúng tôi không thể để nhiều bệnh nhân gặp rủi ro hơn mức cần thiết.

Việc tạo mẫu được quy định bởi một số yêu cầu bắt buộc, vi phạm có thể dẫn đến kết luận sai lầm từ kết quả nghiên cứu. Đầu tiên, kích thước mẫu là quan trọng. Độ chính xác của việc ước lượng các thông số được nghiên cứu phụ thuộc vào cỡ mẫu. Từ "độ chính xác" nên được tính đến ở đây. Quy mô của các nhóm nghiên cứu càng lớn thì kết quả nhà khoa học nhận được càng chính xác (nhưng không nhất thiết phải đúng). Để kết quả của các nghiên cứu lấy mẫu có thể được chuyển giao cho toàn bộ dân số nói chung, mẫu phải được Tiêu biểu. Tính đại diện của mẫu có nghĩa là nó phản ánh tất cả các thuộc tính thiết yếu của tổng thể. Nói cách khác, trong các nhóm được nghiên cứu, những người khác giới tính, tuổi tác, nghề nghiệp, địa vị xã hội, v.v. được tìm thấy với tần suất như trong toàn bộ dân số.

Tuy nhiên, trước khi bắt đầu lựa chọn nhóm nghiên cứu, người ta nên quyết định sự cần thiết của việc nghiên cứu một nhóm dân số cụ thể. Một ví dụ về dân số có thể là tất cả các bệnh nhân có một số bệnh lý nhất định hoặc những người trong độ tuổi lao động, ... Do đó, kết quả thu được đối với nhóm dân số trẻ trong độ tuổi quân đội khó có thể ngoại suy cho phụ nữ sau mãn kinh. Tập hợp các đặc điểm mà nhóm nghiên cứu sẽ có xác định tính "khái quát hóa" của dữ liệu nghiên cứu.

Có thể tạo mẫu theo nhiều cách khác nhau. Đơn giản nhất trong số đó là chọn, sử dụng trình tạo số ngẫu nhiên, số lượng đối tượng cần thiết từ một tập hợp, hoặc Khung mẫu(khung lấy mẫu). Phương pháp này được gọi là mẫu ngẫu nhiên đơn giản". Nếu bạn chọn ngẫu nhiên một điểm bắt đầu trong khung lấy mẫu và sau đó lấy mỗi đối tượng thứ hai, thứ năm hoặc thứ mười (tùy thuộc vào kích thước nhóm được yêu cầu trong nghiên cứu), bạn sẽ lấy mẫu khoảng thời gian. Lấy mẫu theo khoảng thời gian không phải là ngẫu nhiên, vì khả năng lặp lại định kỳ của dữ liệu trong khung lấy mẫu không bao giờ bị loại trừ.

Có thể tạo ra cái gọi là " lấy mẫu phân tầng”, Giả định rằng quần thể bao gồm một số nhóm khác nhau và cấu trúc này nên được tái tạo trong nhóm thực nghiệm. Ví dụ, nếu tỷ lệ nam và nữ trong dân số là 30:70, thì trong một mẫu phân tầng, tỷ lệ của họ phải giống nhau. Với cách tiếp cận này, điều quan trọng là không được cân bằng mẫu quá mức, nghĩa là tránh sự đồng nhất của các đặc tính của nó, nếu không nhà nghiên cứu có thể bỏ lỡ cơ hội tìm thấy sự khác biệt hoặc mối quan hệ trong dữ liệu.

Ngoài các phương pháp thành lập nhóm được mô tả, còn có cụmhạn ngạch lấy mẫu. Cái đầu tiên được sử dụng khi khó có được thông tin đầy đủ về khung mẫu do kích thước của nó. Sau đó, mẫu được hình thành từ một số nhóm được bao gồm trong quần thể. Thứ hai - hạn ngạch - tương tự như một mẫu phân tầng, nhưng ở đây sự phân bố của các đối tượng không tương ứng với sự phân bố của các đối tượng trong tổng thể.

Trở lại với cỡ mẫu, cần phải nói rằng nó liên quan mật thiết đến xác suất sai số thống kê của loại thứ nhất và thứ hai. Sai số thống kê có thể là do nghiên cứu không nghiên cứu toàn bộ dân số mà là một phần của nó. Lỗi loại I là sai lệch sai giả thuyết vô hiệu. Ngược lại, giả thuyết vô hiệu là giả thiết rằng tất cả các nhóm được nghiên cứu được lấy từ cùng một quần thể chung, có nghĩa là sự khác biệt hoặc mối quan hệ giữa chúng là ngẫu nhiên. Nếu chúng ta lấy một phép tương tự với các xét nghiệm chẩn đoán, thì lỗi loại I là kết quả dương tính giả.

Lỗi loại II là sai lệch không chính xác giả thuyết thay thế, ý nghĩa của điều này nằm ở chỗ, sự khác biệt hoặc mối quan hệ giữa các nhóm không phải do ngẫu nhiên ngẫu nhiên mà do ảnh hưởng của các yếu tố được nghiên cứu. Và một lần nữa tương tự với chẩn đoán: lỗi thuộc loại thứ hai là kết quả âm tính giả. Liên quan đến lỗi này là khái niệm sức mạnh, cho biết mức độ hiệu quả của một phương pháp thống kê nhất định trong các điều kiện nhất định, về độ nhạy của nó. Công suất được tính theo công thức: 1-β, trong đó β là xác suất của lỗi Loại II. Chỉ tiêu này phụ thuộc chủ yếu vào cỡ mẫu. Kích thước nhóm càng lớn, xác suất của lỗi Loại II càng thấp và sức mạnh của các bài kiểm tra thống kê càng cao. Sự phụ thuộc này ít nhất là bậc hai, tức là, giảm một nửa kích thước mẫu sẽ dẫn đến giảm công suất ít nhất bốn lần. Công suất tối thiểu cho phép được coi là 80% và mức sai số tối đa cho phép của loại thứ nhất là 5%. Tuy nhiên, cần luôn nhớ rằng những ranh giới này là tùy ý và có thể thay đổi tùy thuộc vào bản chất và mục tiêu của nghiên cứu. Theo quy định, giới khoa học thừa nhận sự thay đổi quyền lực một cách tùy tiện, nhưng trong phần lớn các trường hợp, mức độ sai sót của loại thứ nhất không được vượt quá 5%.

Tất cả những điều trên đều liên quan trực tiếp đến giai đoạn lập kế hoạch nghiên cứu. Tuy nhiên, nhiều nhà nghiên cứu nhầm lẫn khi coi xử lý dữ liệu thống kê chỉ là một số loại thao tác được thực hiện sau khi hoàn thành phần chính của công việc. Thông thường, sau khi kết thúc một thử nghiệm ngoài kế hoạch, có một mong muốn không thể cưỡng lại là đặt hàng phân tích dữ liệu thống kê ở bên cạnh. Nhưng sẽ rất khó ngay cả đối với một nhà thống kê để trích xuất kết quả mà nhà nghiên cứu mong đợi từ “đống rác”. Do đó, nếu không có đủ kiến ​​thức về thống kê sinh học, cần phải tìm kiếm sự trợ giúp trong phân tích thống kê ngay cả trước khi bắt đầu thử nghiệm.

Chuyển sang bản thân quy trình phân tích, cần chỉ ra hai loại kỹ thuật thống kê chính: mô tả và dựa trên bằng chứng (phân tích). Các kỹ thuật mô tả bao gồm các kỹ thuật trình bày dữ liệu một cách cô đọng và dễ hiểu. Chúng bao gồm bảng, đồ thị, tần số (tuyệt đối và tương đối), các phép đo xu hướng trung tâm (giá trị trung bình, trung vị, chế độ) và các phép đo độ lan truyền dữ liệu (phương sai, độ lệch chuẩn, khoảng giữa các phần tư, v.v.). Nói cách khác, phương pháp mô tả đặc trưng cho các mẫu nghiên cứu.

Cách phổ biến nhất (mặc dù thường gây hiểu lầm) để mô tả dữ liệu định lượng sẵn có là xác định các chỉ số sau:

  • số lượng quan sát trong mẫu hoặc kích thước của nó;
  • giá trị trung bình (trung bình cộng);
  • độ lệch chuẩn là thước đo mức độ thay đổi của các giá trị của các biến.

Điều quan trọng cần nhớ là giá trị trung bình số học và độ lệch chuẩn là các thước đo xu hướng trung tâm và phân tán trong một số lượng khá nhỏ mẫu. Trong các mẫu như vậy, giá trị của hầu hết các đối tượng đều lệch khỏi giá trị trung bình với xác suất bằng nhau, và phân bố của chúng tạo thành một “cái chuông” đối xứng (đường cong Gaussian hoặc Gauss-Laplace). Sự phân bố như vậy cũng được gọi là "bình thường", nhưng trong thực tế của một thí nghiệm y tế, nó chỉ xảy ra trong 30% trường hợp. Nếu các giá trị của biến được phân phối không đối xứng về tâm, thì các nhóm được mô tả tốt nhất bằng cách sử dụng trung vị và lượng tử (phần trăm, phần tư, phần thập phân).

Sau khi hoàn thành việc mô tả các nhóm, cần phải trả lời câu hỏi về mối quan hệ của chúng và khả năng khái quát kết quả của nghiên cứu cho toàn bộ dân số. Đối với điều này, các phương pháp thống kê sinh học dựa trên bằng chứng được sử dụng. Đó là điều mà các nhà nghiên cứu trước hết phải nhớ đến khi nói đến xử lý dữ liệu thống kê. Thông thường giai đoạn công việc này được gọi là "thử nghiệm các giả thuyết thống kê".

Các nhiệm vụ kiểm tra giả thuyết có thể được chia thành hai nhóm lớn. Nhóm thứ nhất trả lời câu hỏi liệu có sự khác biệt giữa các nhóm về mức độ của một số chỉ số, ví dụ, sự khác biệt về mức độ transaminase gan ở bệnh nhân viêm gan và người khỏe mạnh. Nhóm thứ hai cho phép bạn chứng minh sự tồn tại của mối quan hệ giữa hai hoặc nhiều chỉ số, ví dụ, chức năng của gan và hệ thống miễn dịch.

Về mặt thực tế, các nhiệm vụ từ nhóm đầu tiên có thể được chia thành hai loại phụ:

  • so sánh các chỉ số chỉ trong hai nhóm (khỏe mạnh và ốm yếu, nam giới và phụ nữ);
  • so sánh của ba hoặc nhiều nhóm (nghiên cứu các liều lượng khác nhau của thuốc).

Cần lưu ý rằng các phương pháp thống kê có sự khác biệt đáng kể đối với dữ liệu định tính và định lượng.

Trong tình huống mà biến đang được nghiên cứu là định tính và chỉ có hai nhóm đang được so sánh, có thể sử dụng kiểm định chi-square. Đây là một tiêu chí khá mạnh mẽ và được biết đến rộng rãi, tuy nhiên, nó không đủ hiệu quả nếu số lượng quan sát ít. Để giải quyết vấn đề này, có một số phương pháp, chẳng hạn như phương pháp hiệu chỉnh Yates cho tính liên tục và phương pháp chính xác của Fisher.

Nếu biến đang nghiên cứu là định lượng thì có thể sử dụng một trong hai loại kiểm định thống kê. Tiêu chí của loại thứ nhất dựa trên một kiểu phân bố cụ thể của dân số chung và vận hành với các tham số của dân số này. Các tiêu chí như vậy được gọi là "tham số", và chúng thường dựa trên giả định về phân phối chuẩn của các giá trị. Các phép thử phi tham số không dựa trên giả định về kiểu phân bố của dân số chung và không sử dụng các tham số của nó. Đôi khi các tiêu chí như vậy được gọi là "thử nghiệm không phân phối". Ở một mức độ nhất định, điều này là sai, vì bất kỳ phép thử phi tham số nào cũng giả định rằng sự phân bố trong tất cả các nhóm được so sánh sẽ giống nhau, nếu không có thể thu được kết quả dương tính giả.

Có hai bài kiểm tra tham số được áp dụng cho dữ liệu được rút ra từ một tập hợp có phân phối chuẩn: Kiểm định t của học sinh để so sánh hai nhóm và kiểm định F của Fisher để kiểm tra sự bình đẳng của các phương sai (hay còn gọi là ANOVA). Có nhiều tiêu chí phi tham số hơn. Các bài kiểm tra khác nhau khác nhau ở các giả định mà chúng dựa trên đó, về độ phức tạp của tính toán, sức mạnh thống kê, v.v. Tuy nhiên, kiểm định Wilcoxon (cho các nhóm liên quan) và kiểm tra Mann-Whitney, còn được gọi là kiểm tra Wilcoxon cho các mẫu độc lập. Các thử nghiệm này thuận tiện ở chỗ chúng không yêu cầu các giả định về bản chất của việc phân phối dữ liệu. Nhưng nếu hóa ra các mẫu được lấy từ một tổng thể chung được phân phối chuẩn, thì sức mạnh thống kê của chúng sẽ không khác biệt đáng kể so với bài kiểm tra của Học sinh.

Có thể tìm thấy mô tả đầy đủ về các phương pháp thống kê trong các tài liệu chuyên ngành, tuy nhiên, điểm mấu chốt là mỗi thử nghiệm thống kê yêu cầu một tập hợp các quy tắc (giả định) và điều kiện để sử dụng nó, đồng thời liệt kê máy móc một số phương pháp để tìm ra “mong muốn” kết quả là hoàn toàn không thể chấp nhận được từ quan điểm khoa học. Theo nghĩa này, các thử nghiệm thống kê tương tự như thuốc - mỗi loại đều có chỉ định và chống chỉ định, tác dụng phụ và khả năng mất tác dụng. Và cũng nguy hiểm không kém là việc sử dụng không kiểm soát các thử nghiệm thống kê, bởi vì các giả thuyết và kết luận đều dựa trên chúng.

Để hiểu đầy đủ hơn về vấn đề độ chính xác của phân tích thống kê, cần định nghĩa và phân tích khái niệm " mức độ tin cậy. " Xác suất tin cậy là một giá trị được lấy làm ranh giới giữa các sự kiện có thể xảy ra và không thể xảy ra. Theo truyền thống, nó được ký hiệu bằng chữ "p". Đối với nhiều nhà nghiên cứu, mục đích duy nhất của việc thực hiện phân tích thống kê là để tính toán giá trị p mong muốn, điều này dường như bỏ dấu phẩy trong cụm từ nổi tiếng “việc thực thi không thể được tha thứ”. Mức tin cậy cho phép tối đa là 0,05. Cần nhớ rằng mức độ tin cậy không phải là xác suất của một sự kiện nào đó, mà là một vấn đề của sự tự tin. Bằng cách xác định xác suất tin cậy trước khi bắt đầu phân tích, chúng tôi từ đó xác định mức độ tin cậy trong kết quả nghiên cứu của mình. Và, như bạn biết, cả tin quá mức và nghi ngờ quá mức đều ảnh hưởng tiêu cực đến kết quả của bất kỳ công việc nào.

Mức độ tin cậy cho biết xác suất tối đa của lỗi Loại I mà nhà nghiên cứu cho là có thể chấp nhận được. Giảm mức độ tin cậy, hay nói cách khác là thắt chặt các điều kiện để kiểm tra giả thuyết, làm tăng khả năng mắc lỗi loại II. Do đó, việc lựa chọn mức độ tin cậy phải được thực hiện có tính đến thiệt hại có thể xảy ra do lỗi của loại thứ nhất và thứ hai. Ví dụ, các giới hạn nghiêm ngặt được áp dụng trong thống kê y sinh, xác định tỷ lệ kết quả dương tính giả không quá 5%, là một điều cần thiết nghiêm trọng, bởi vì các phương pháp điều trị mới được đưa ra hoặc bị từ chối dựa trên kết quả nghiên cứu y tế, và đây là một vấn đề của cuộc sống cho hàng ngàn người.

Cần lưu ý rằng bản thân giá trị p không mang nhiều thông tin cho bác sĩ, vì nó chỉ cho biết về xác suất bác bỏ sai giả thuyết vô hiệu. Chỉ số này không nói lên điều gì, ví dụ, về quy mô của hiệu quả điều trị khi sử dụng thuốc nghiên cứu trong dân số chung. Do đó, có ý kiến ​​cho rằng thay vì mức độ tin cậy, sẽ tốt hơn nếu đánh giá kết quả nghiên cứu bằng độ lớn của khoảng tin cậy. Khoảng tin cậy là một phạm vi giá trị trong đó giá trị tổng thể thực (đối với giá trị trung bình, trung bình hoặc tần suất) được chứa với một xác suất nhất định. Trên thực tế, sẽ thuận tiện hơn nếu có cả hai giá trị này, điều này giúp bạn có thể tự tin hơn khi đánh giá khả năng áp dụng của các kết quả thu được cho toàn bộ dân số.

Tóm lại, nên nói một vài từ về các công cụ được sử dụng bởi một nhà thống kê hoặc một nhà nghiên cứu phân tích dữ liệu một cách độc lập. Tính toán thủ công đã biến mất từ ​​lâu. Các chương trình máy tính thống kê tồn tại ngày nay làm cho nó có thể thực hiện phân tích thống kê mà không cần phải có một nền tảng toán học nghiêm túc. Các hệ thống mạnh mẽ như SPSS, SAS, R, v.v. cho phép nhà nghiên cứu sử dụng các phương pháp thống kê phức tạp và mạnh mẽ. Tuy nhiên, đây không phải lúc nào cũng là điều tốt. Nếu không biết mức độ áp dụng của các thử nghiệm thống kê được sử dụng cho dữ liệu thực nghiệm cụ thể, nhà nghiên cứu có thể thực hiện các phép tính và thậm chí lấy một số con số ở đầu ra, nhưng kết quả sẽ rất đáng ngờ. Do đó, điều kiện tiên quyết để xử lý thống kê các kết quả của thí nghiệm cần phải có kiến ​​thức tốt về các cơ sở toán học của thống kê.


Đầy đủ chi tiết trong tài liệu trong nước. Trong khi đó, trong thực tế của các doanh nghiệp Nga, chỉ một số trong số chúng được sử dụng. Hãy xem xét một số tiếp theo các phương pháp xử lý thống kê.

Thông tin chung

Trong thực tế của các doanh nghiệp trong nước, chủ yếu là phương pháp kiểm soát thống kê. Nếu chúng ta nói về quy định của quá trình công nghệ, thì nó được ghi nhận là cực kỳ hiếm. Áp dụng các phương pháp thống kê với điều kiện là một nhóm các chuyên gia có trình độ chuyên môn phù hợp được hình thành tại doanh nghiệp.

Nghĩa

Theo ISO ser. 9000, nhà cung cấp cần xác định sự cần thiết của các phương pháp thống kê được áp dụng trong quá trình phát triển, quy định và xác minh khả năng của quá trình sản xuất và các đặc tính của sản phẩm. Các phương pháp được sử dụng dựa trên lý thuyết xác suất và các phép tính toán học. Phương pháp thống kê để phân tích dữ liệu có thể được thực hiện ở bất kỳ giai đoạn nào của vòng đời sản phẩm. Chúng cung cấp đánh giá và giải trình về mức độ không đồng nhất của sản phẩm hoặc sự thay đổi của các đặc tính của chúng so với giá trị danh nghĩa đã thiết lập hoặc giá trị yêu cầu, cũng như sự thay đổi của quá trình tạo ra sản phẩm. Phương pháp thống kê là các phương pháp để có thể đánh giá trạng thái của các hiện tượng đang được nghiên cứu với độ chính xác và độ tin cậy nhất định. Chúng cho phép bạn dự đoán các vấn đề nhất định, phát triển các giải pháp tối ưu dựa trên thông tin, xu hướng và mô hình thực tế đã được nghiên cứu.

Hướng dẫn sử dụng

Các lĩnh vực chính trong đó có phương pháp thống kê là:


Thực tiễn của các nước phát triển

Phương pháp thống kê là là cơ sở đảm bảo tạo ra những sản phẩm có tính tiêu dùng cao. Các kỹ thuật này được sử dụng rộng rãi ở các nước công nghiệp phát triển. Trên thực tế, các phương pháp thống kê đảm bảo rằng người tiêu dùng nhận được các sản phẩm đáp ứng các yêu cầu đã thiết lập. Hiệu quả của việc sử dụng chúng đã được chứng minh bằng thực tế của các doanh nghiệp công nghiệp ở Nhật Bản. Chính họ đã góp phần tạo nên mức sản xuất cao nhất ở đất nước này. Kinh nghiệm lâu năm của nước ngoài cho thấy hiệu quả của các kỹ thuật này. Đặc biệt, được biết Hewlelt Packard, bằng cách sử dụng các phương pháp thống kê, đã có thể giảm số lượng các cuộc hôn nhân mỗi tháng từ 9.000 xuống 45 đơn vị trong một trong các trường hợp.

Khó khăn khi thực hiện

Trong thực tế trong nước, có một số trở ngại không cho phép sử dụng phương pháp nghiên cứu thống kê các chỉ số. Khó khăn nảy sinh do:


Phát triển chương trình

Phải nói rằng việc xác định sự cần thiết của các phương pháp thống kê nhất định trong lĩnh vực chất lượng, lựa chọn, nắm vững các kỹ thuật cụ thể là một công việc khá phức tạp và lâu dài đối với bất kỳ doanh nghiệp trong nước. Để thực hiện hiệu quả, nên xây dựng một chương trình dài hạn đặc biệt. Nó phải cung cấp cho việc hình thành một dịch vụ mà nhiệm vụ của nó sẽ bao gồm việc tổ chức và hướng dẫn phương pháp luận về việc áp dụng các phương pháp thống kê. Trong khuôn khổ chương trình, cần trang bị phương tiện kỹ thuật thích hợp, đào tạo chuyên gia và xác định thành phần của các nhiệm vụ sản xuất cần được giải quyết bằng các phương pháp đã chọn. Việc làm chủ được khuyến khích bắt đầu bằng cách sử dụng các cách tiếp cận đơn giản nhất. Ví dụ, bạn có thể sử dụng sản xuất sơ cấp nổi tiếng. Sau đó, nên chuyển sang các phương pháp khác. Ví dụ, nó có thể là phân tích phương sai, xử lý chọn lọc thông tin, quy định các quá trình, lập kế hoạch nghiên cứu giai thừa và thí nghiệm, v.v.

Phân loại

Các phương pháp thống kê phân tích kinh tế bao gồm các thủ thuật khác nhau. Không cần phải nói, có khá nhiều người trong số họ. Tuy nhiên, chuyên gia hàng đầu trong lĩnh vực quản lý chất lượng tại Nhật Bản, K. Ishikawa, khuyến nghị sử dụng bảy phương pháp cơ bản:

  1. Biểu đồ Pareto.
  2. Phân nhóm thông tin theo đặc điểm chung.
  3. Các thẻ kiểm soát.
  4. Sơ đồ nhân quả.
  5. Biểu đồ.
  6. Các bảng điều khiển.
  7. Biểu đồ phân tán.

Dựa trên kinh nghiệm của bản thân trong lĩnh vực quản lý, Ishikawa khẳng định rằng 95% mọi vấn đề trong doanh nghiệp đều có thể được giải quyết bằng cách sử dụng bảy cách tiếp cận này.

Biểu đồ Pareto

Cái này dựa trên một tỷ lệ nhất định. Nó đã được gọi là "Nguyên tắc Pareto". Theo ông, trong 20% ​​nguyên nhân thì 80% hậu quả xuất hiện. dưới dạng trực quan và dễ hiểu cho thấy mức độ ảnh hưởng tương đối của từng hoàn cảnh đến vấn đề tổng thể theo thứ tự giảm dần. Tác động này có thể được xem xét trên số lượng tổn thất, khuyết tật do từng nguyên nhân gây ra. Ảnh hưởng tương đối được minh họa bằng các thanh, ảnh hưởng tích lũy của các yếu tố bằng một đường thẳng tích lũy.

sơ đồ nhân quả

Trên đó, vấn đề đang nghiên cứu được mô tả theo quy ước dưới dạng một mũi tên thẳng nằm ngang, và các điều kiện và yếu tố ảnh hưởng gián tiếp hoặc trực tiếp đến nó ở dạng mũi tên xiên. Khi xây dựng, ngay cả những trường hợp dường như không đáng kể cũng nên được tính đến. Điều này là do trong thực tế, có khá nhiều trường hợp trong đó giải pháp của vấn đề được đảm bảo bằng cách loại trừ một số yếu tố dường như không quan trọng. Các lý do ảnh hưởng đến các tình huống chính (của đơn đặt hàng đầu tiên và tiếp theo) được mô tả trên sơ đồ bằng các mũi tên ngắn ngang. Sơ đồ chi tiết sẽ có dạng một bộ xương cá.

Nhóm thông tin

Cái này phương pháp kinh tế - thống kêđược sử dụng để tổ chức một tập hợp các chỉ số thu được bằng cách đánh giá và đo lường một hoặc nhiều thông số của một đối tượng. Theo quy luật, thông tin đó được trình bày dưới dạng một chuỗi giá trị không có thứ tự. Đây có thể là kích thước tuyến tính của phôi, điểm nóng chảy, độ cứng của vật liệu, số lượng khuyết tật, v.v. Dựa trên một hệ thống như vậy, rất khó để đưa ra kết luận về các thuộc tính của sản phẩm hoặc các quá trình tạo ra nó. Đặt hàng được thực hiện bằng cách sử dụng đồ thị đường. Chúng thể hiện rõ ràng những thay đổi trong các thông số quan sát được trong một khoảng thời gian nhất định.

Bảng kiểm soát

Theo quy luật, nó được trình bày dưới dạng một bảng phân phối tần số cho sự xuất hiện của các giá trị đo được của các tham số của đối tượng trong các khoảng thời gian tương ứng. Danh sách kiểm tra được biên soạn tùy thuộc vào mục đích của nghiên cứu. Phạm vi của các giá trị chỉ thị được chia thành các khoảng thời gian bằng nhau. Số của chúng thường được chọn bằng căn bậc hai của số phép đo được thực hiện. Biểu mẫu phải đơn giản để loại bỏ các vấn đề khi điền, đọc, kiểm tra.

thanh biểu đồ

Nó được trình bày dưới dạng một đa giác bậc. Nó minh họa rõ ràng sự phân bố của các chỉ số đo lường. Phạm vi của các giá trị đã đặt được chia thành các khoảng bằng nhau, được vẽ dọc theo trục x. Một hình chữ nhật được xây dựng cho mỗi khoảng. Chiều cao của nó bằng tần số xuất hiện của giá trị trong khoảng thời gian đã cho.

Điểm phân tán

Chúng được sử dụng khi kiểm tra một giả thuyết về mối quan hệ của hai biến số. Mô hình được xây dựng như sau. Giá trị của một tham số được vẽ trên trục abscissa và giá trị của một chỉ số khác được vẽ trên tọa độ. Kết quả là một dấu chấm xuất hiện trên biểu đồ. Các hành động này được lặp lại cho tất cả các giá trị của các biến. Nếu có một mối quan hệ, trường tương quan được mở rộng và hướng sẽ không trùng với hướng của trục y. Nếu không có ràng buộc, nó sẽ song song với một trong các trục hoặc sẽ có dạng là một hình tròn.

Thẻ kiểm soát

Chúng được sử dụng khi đánh giá một quá trình trong một khoảng thời gian cụ thể. Việc hình thành các biểu đồ kiểm soát dựa trên các quy định sau:

  1. Tất cả các quy trình đều sai lệch so với các thông số đã thiết lập theo thời gian.
  2. Quá trình không ổn định của hiện tượng không thay đổi một cách ngẫu nhiên. Những sai lệch vượt ra ngoài ranh giới của các giới hạn mong đợi là không ngẫu nhiên.
  3. Những thay đổi riêng lẻ có thể được dự đoán.
  4. Một quy trình ổn định có thể sai lệch ngẫu nhiên trong giới hạn dự kiến.

Sử dụng trong thực tế của các doanh nghiệp Nga

Cần phải nói rằng, kinh nghiệm trong và ngoài nước cho thấy, phương pháp thống kê hiệu quả nhất để đánh giá độ ổn định và độ chính xác của thiết bị và quy trình công nghệ là lập các biểu đồ kiểm soát. Phương pháp này cũng được sử dụng để điều chỉnh khả năng sản xuất. Khi xây dựng bản đồ cần phải lựa chọn chính xác các thông số đang nghiên cứu. Nên ưu tiên các chỉ số liên quan trực tiếp đến mục đích sử dụng của sản phẩm, có thể dễ dàng đo lường và có thể bị ảnh hưởng bởi việc kiểm soát quá trình. Nếu sự lựa chọn như vậy là khó hoặc không hợp lý, thì có thể đánh giá các giá trị tương quan (tương quan) với thông số được kiểm soát.

Sắc thái

Nếu việc đo lường các chỉ số với độ chính xác cần thiết để lập bản đồ theo một tiêu chí định lượng là không khả thi về mặt kinh tế hoặc kỹ thuật, thì một dấu hiệu thay thế được sử dụng. Các thuật ngữ như "hôn nhân" và "khiếm khuyết" được liên kết với nó. Sau này được hiểu là từng sự không tuân thủ riêng biệt của sản phẩm với các yêu cầu đã thiết lập. Hôn nhân là một sản phẩm, việc cung cấp không được phép cho người tiêu dùng, do sự hiện diện của những khiếm khuyết trong đó.

Đặc thù

Mỗi loại thẻ đều có những đặc điểm riêng. Nó phải được tính đến khi chọn chúng cho một trường hợp cụ thể. Thẻ theo tiêu chí định lượng được coi là nhạy cảm hơn với những thay đổi trong quy trình so với những thẻ sử dụng một tính năng thay thế. Tuy nhiên, những thứ trước đây thường sử dụng nhiều lao động hơn. Chúng được sử dụng cho:

  1. Xử lý gỡ lỗi.
  2. Đánh giá khả năng giới thiệu công nghệ.
  3. Kiểm tra độ chính xác của thiết bị.
  4. Các định nghĩa về dung sai.
  5. Ánh xạ một số cách hợp lệ để tạo ra một sản phẩm.

Ngoài ra

Nếu sự rối loạn của quá trình khác với sự dịch chuyển của tham số được kiểm soát, thì cần phải sử dụng bản đồ X. Nếu có sự gia tăng sự phân tán của các giá trị, nên chọn mô hình R hoặc S. Tuy nhiên, cần phải tính đến một số tính năng. Đặc biệt, việc sử dụng biểu đồ S sẽ giúp xác lập chính xác và nhanh chóng sự rối loạn của quá trình hơn so với các mô hình R. Đồng thời, việc xây dựng biểu đồ sau không đòi hỏi tính toán phức tạp.

Sự kết luận

Trong kinh tế học, có thể khám phá các yếu tố được tìm thấy trong quá trình đánh giá định tính, trong không gian và động lực học. Chúng có thể được sử dụng để thực hiện các phép tính dự đoán. Phương pháp thống kê phân tích kinh tế không bao gồm các phương pháp đánh giá mối quan hệ nguyên nhân và kết quả của các quá trình và sự kiện kinh tế, xác định nguồn dự trữ có triển vọng và chưa được khai thác để cải thiện hiệu suất. Nói cách khác, các kỹ thuật giai thừa không được bao gồm trong các cách tiếp cận được xem xét.