ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

กฎของจำนวนมากและทฤษฎีบทจำกัด กฎของตัวเลขขนาดใหญ่

เลมมา เชบีเชฟ. ถ้าตัวแปรสุ่ม Xซึ่งมีการคาดหมายทางคณิตศาสตร์ เอ็ม[x] รับได้เฉพาะค่าที่ไม่เป็นลบ จากนั้นสำหรับจำนวนบวกใดๆ เราจะมีความไม่เท่ากัน

ความไม่เท่าเทียมกันของ Chebyshevถ้า Xเป็นตัวแปรสุ่มที่มีความคาดหวังทางคณิตศาสตร์ เอ็ม[x] และการกระจายตัว ดี[x] ดังนั้นสำหรับ e บวกใดๆ เราก็มีความไม่เท่าเทียมกัน

. (2)

ทฤษฎีบทของเชบีเชฟ(กฎของตัวเลขมาก). อนุญาต X 1 , X 2 , …, x น,… - ลำดับของตัวแปรสุ่มอิสระที่มีความคาดหวังทางคณิตศาสตร์เหมือนกัน และความแปรปรวนจำกัดด้วยค่าคงที่เดียวกัน กับ

. (3)

การพิสูจน์ทฤษฎีบทอยู่บนพื้นฐานของความไม่เท่าเทียมกัน

, (4)

ตามมาจากความไม่เท่าเทียมกันของ Chebyshev จากทฤษฎีบท Chebyshev เป็นผลพลอยได้

ทฤษฎีบทของเบอร์นูลลีปล่อยให้มันผลิต การทดลองอิสระ โดยแต่ละครั้งมีความน่าจะเป็น Rเหตุการณ์บางอย่างอาจเกิดขึ้น แต่, ปล่อยมันไป วีนเป็นตัวแปรสุ่มเท่ากับจำนวนเหตุการณ์ที่เกิดขึ้น แต่ในสิ่งเหล่านี้ การทดลอง จากนั้นสำหรับ e > 0 เรามีความเท่าเทียมกัน

. (5)

โปรดทราบว่าความไม่เท่าเทียมกัน (4) ที่ใช้กับเงื่อนไขของทฤษฎีบทเบอร์นูลลีให้:

. (6)

ทฤษฎีบทของ Chebyshev สามารถกำหนดได้ในรูปแบบที่ค่อนข้างทั่วไป:

ทฤษฎีบททั่วไปของเชบีเชฟอนุญาต x 1, x2, …, x น,… - ลำดับของตัวแปรสุ่มอิสระพร้อมความคาดหวังทางคณิตศาสตร์ เอ็ม[x 1 ] = ม. 1 , ม[x2] = ม.2 ,…และการกระจายถูกจำกัดด้วยค่าคงที่เดียวกัน กับ. จากนั้นสำหรับจำนวนบวก e เรามีความเท่าเทียมกัน

. (7)

ให้ x เป็นจำนวนครั้งที่เกิด 6 แต้มในการโยน 3600 ครั้ง แล้วเอ็ม[ x] = 3600 = 600 ตอนนี้ให้เราใช้ความไม่เท่าเทียมกัน (1) สำหรับ a = 900: .

เราใช้ความไม่เท่าเทียมกัน (6) สำหรับ n = 10000, p = , q = แล้ว

ตัวอย่าง.

ความน่าจะเป็นที่จะเกิดเหตุการณ์ A ในแต่ละการทดลองอิสระ 1,000 ครั้งคือ 0.8 ค้นหาความน่าจะเป็นที่จำนวนของเหตุการณ์ A ในการทดลอง 1,000 ครั้งนี้จะเบี่ยงเบนไปจากความคาดหวังทางคณิตศาสตร์ในค่าสัมบูรณ์โดยน้อยกว่า 50

ให้ x เป็นจำนวนครั้งของเหตุการณ์ A ในการทดสอบ 1,000 รายการที่ระบุ แล้วเอ็ม[ x] = 1,000 × 0.8 = 800 และ D[ x] = 1000 × 0.8 × 0.2 = 160 ตอนนี้อสมการ (2) ให้:


ตัวอย่าง.

ความแปรปรวนของตัวแปรสุ่มอิสระ 1,000 ตัว x k (k = 1, 2,..., 1000) คือ 4 ประมาณความน่าจะเป็นที่ค่าเบี่ยงเบนของค่าเฉลี่ยเลขคณิตของตัวแปรเหล่านี้จากค่าเฉลี่ยเลขคณิตของความคาดหวังทางคณิตศาสตร์ในค่าสัมบูรณ์ จะไม่เกิน 0.1

ตามความไม่เท่าเทียมกัน (4) สำหรับ c = 4 และ e = 0.1 เรามี

วางแผน:

1. แนวคิดของทฤษฎีบทขีด จำกัด กลาง (ทฤษฎีบทของ Lyapunov)

2. กฎของจำนวนมหาศาล ความน่าจะเป็น และความถี่ (ทฤษฎีบทของ Chebyshev และ Bernoulli)

1. แนวคิดของทฤษฎีบทขีด จำกัด กลาง

การแจกแจงความน่าจะเป็นแบบปกติมีความสำคัญอย่างยิ่งในทฤษฎีความน่าจะเป็น กฎปกติเชื่อฟังความน่าจะเป็นเมื่อยิงไปที่เป้าหมาย ในการวัด ฯลฯ โดยเฉพาะอย่างยิ่ง ปรากฎว่ากฎการกระจายสำหรับผลรวมของตัวแปรสุ่มอิสระจำนวนมากเพียงพอที่มีกฎการกระจายตามอำเภอใจนั้นใกล้เคียงกับการแจกแจงแบบปกติ ความจริงข้อนี้เรียกว่าทฤษฎีขีด จำกัด กลางหรือทฤษฎีบทของเลียปุนอฟ

เป็นที่ทราบกันดีอยู่แล้วว่าตัวแปรสุ่มแบบกระจายตามปกตินั้นใช้กันอย่างแพร่หลายในทางปฏิบัติ อะไรอธิบายเรื่องนี้? คำถามนี้ได้รับคำตอบแล้ว

ทฤษฎีบทขีด จำกัด กลางหากตัวแปรสุ่ม X คือผลรวมของตัวแปรสุ่มที่เป็นอิสระร่วมกันจำนวนมาก อิทธิพลของตัวแปรแต่ละตัวที่มีต่อผลรวมทั้งหมดนั้นไม่สำคัญ ดังนั้น X จะมีการกระจายที่ใกล้เคียงกับการแจกแจงแบบปกติ

ตัวอย่าง.ให้วัดปริมาณทางกายภาพบางส่วน การวัดใดๆ จะให้ค่าโดยประมาณของปริมาณที่วัดได้เท่านั้น เนื่องจากปัจจัยสุ่มที่เป็นอิสระหลายอย่าง (อุณหภูมิ ความผันผวนของเครื่องมือ ความชื้น ฯลฯ) ส่งผลต่อผลการวัด แต่ละปัจจัยเหล่านี้สร้าง "ข้อผิดพลาดบางส่วน" เล็กน้อย อย่างไรก็ตาม เนื่องจากปัจจัยเหล่านี้มีจำนวนมาก ผลสะสมจึงสร้าง "ข้อผิดพลาดทั้งหมด" ที่เห็นได้ชัดเจนอยู่แล้ว

เมื่อพิจารณาข้อผิดพลาดทั้งหมดเป็นผลรวมของข้อผิดพลาดบางส่วนที่ไม่ขึ้นต่อกันจำนวนมาก เราสามารถสรุปได้ว่าข้อผิดพลาดทั้งหมดมีการแจกแจงที่ใกล้เคียงกับการแจกแจงแบบปกติ ประสบการณ์ยืนยันความถูกต้องของข้อสรุปนี้

พิจารณาเงื่อนไขที่เป็นไปตาม "ทฤษฎีบทขีด จำกัด กลาง"

x1,X2, ..., Xเป็นลำดับของตัวแปรสุ่มอิสระ

เอ็ม(X1),เอ็ม(X2), ...,เอ็ม(X) เป็นความคาดหวังทางคณิตศาสตร์สุดท้ายของปริมาณเหล่านี้ตามลำดับเท่ากับ ม(Xk)= ak

ดี (X1),ดี(X2), ...,ดี(X) - ความแปรปรวนสุดท้ายตามลำดับเท่ากับ ดี(X k)= bk2

เราแนะนำสัญกรณ์: S= X1+X2 + ...+Xn;

ก= X1+X2 + ...+Xn=; B2=D (X1)+ดี(X2)+ ...+ดี(X) =

เราเขียนฟังก์ชันการกระจายของผลรวมที่ทำให้เป็นมาตรฐาน:

พวกเขาพูดตามลำดับ x1,X2, ..., Xทฤษฎีบทขีด จำกัด กลางจะใช้ได้ถ้าสำหรับใดๆ xฟังก์ชันการกระจายของผลรวมที่ทำให้เป็นมาตรฐานเป็น n ® ¥ มีแนวโน้มที่จะเป็นฟังก์ชันการแจกแจงแบบปกติ:

Right "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

พิจารณาตัวแปรสุ่มแบบไม่ต่อเนื่อง X, กำหนดโดยตารางการแจกจ่าย:

ให้เรากำหนดภารกิจในการประมาณความน่าจะเป็นที่ค่าเบี่ยงเบนของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์ไม่เกินค่าสัมบูรณ์เป็นจำนวนบวก ε

ถ้า ε น้อยพอ เราจะประมาณความน่าจะเป็นที่ Xจะนำค่ามาใกล้เคียงกับความคาดหวังทางคณิตศาสตร์ของมัน พิสูจน์ความไม่เท่าเทียมกันที่ช่วยให้เราสามารถให้ค่าประมาณความสนใจแก่เราได้

เลมมา เชบีเชฟให้ตัวแปรสุ่ม X ที่รับเฉพาะค่าที่ไม่เป็นลบกับความคาดหวัง M(X) สำหรับตัวเลข α>0 ใดๆ นิพจน์จะเกิดขึ้น:

ความไม่เท่าเทียมกันของ Chebyshevความน่าจะเป็นที่ค่าเบี่ยงเบนของตัวแปรสุ่ม X จากการคาดหมายทางคณิตศาสตร์ในค่าสัมบูรณ์มีค่าน้อยกว่าจำนวนบวก ε , ไม่น้อยกว่า 1 – D(X) / ε 2:

P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

ความคิดเห็นความไม่เท่าเทียมกันของ Chebyshev นั้นมีค่าในทางปฏิบัติที่จำกัด เนื่องจากมันมักจะให้ค่าประมาณคร่าวๆ

ความสำคัญทางทฤษฎีของความไม่เท่าเทียมกันของ Chebyshev นั้นใหญ่มาก ด้านล่างเราจะใช้ความไม่เท่าเทียมกันนี้เพื่อหาทฤษฎีบท Chebyshev

2.2. ทฤษฎีบทของเชบีเชฟ

ถ้า X1, X2, ..., Xn.. เป็นตัวแปรสุ่มอิสระแบบคู่ และความแปรปรวนของพวกมันถูกจำกัดอย่างสม่ำเสมอ (ไม่เกินค่าคงที่ C) ดังนั้น ไม่ว่าจำนวนบวกจะน้อยเพียงใด ε , ความน่าจะเป็นของความไม่เท่าเทียมกัน

÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

จะเข้าใกล้เอกภาพโดยพลการหากจำนวนตัวแปรสุ่มมีมากเพียงพอ

P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

ทฤษฎีบทของ Chebyshev กล่าวว่า:

1. เราพิจารณาตัวแปรสุ่มอิสระจำนวนมากโดยมีความแปรปรวนจำกัด

เมื่อกำหนดทฤษฎีบทของ Chebyshev เราถือว่าตัวแปรสุ่มมีความคาดหวังทางคณิตศาสตร์ต่างกัน ในทางปฏิบัติ มักเกิดขึ้นที่ตัวแปรสุ่มมีความคาดหวังทางคณิตศาสตร์เหมือนกัน แน่นอน หากเราคิดอีกครั้งว่าการกระจายตัวของปริมาณเหล่านี้มีจำกัด ทฤษฎีบทของ Chebyshev ก็จะนำมาใช้กับพวกมันได้

ให้เราแสดงถึงความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแต่ละตัวผ่าน ก;

ในกรณีที่อยู่ระหว่างการพิจารณา ค่าเฉลี่ยเลขคณิตของความคาดหวังทางคณิตศาสตร์ที่มองเห็นได้ง่ายก็เท่ากับ ก.

หนึ่งสามารถกำหนดทฤษฎีบทของ Chebyshev สำหรับกรณีเฉพาะที่อยู่ระหว่างการพิจารณา

"ถ้า X1, X2, ..., Xn.. เป็นตัวแปรสุ่มอิสระแบบคู่ซึ่งมีความคาดหวังทางคณิตศาสตร์เหมือนกัน a และหากการกระจายของตัวแปรเหล่านี้มี จำกัด สม่ำเสมอไม่ว่าตัวเลขจะน้อยเพียงใด ε > โอ้ ความน่าจะเป็นของความไม่เท่าเทียมกัน

÷ (X1+X2 + ...+Xn) / n - เอ | < ε

จะเข้าใกล้เอกภาพโดยพลการถ้าจำนวนตัวแปรสุ่มมากเพียงพอ" .

กล่าวอีกนัยหนึ่งภายใต้เงื่อนไขของทฤษฎีบท

P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

2.3. สาระสำคัญของทฤษฎีบทของ Chebyshev

แม้ว่าตัวแปรสุ่มอิสระแต่ละตัวอาจใช้ค่าที่อยู่ไกลจากความคาดหวังทางคณิตศาสตร์ แต่ค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มจำนวนมากเพียงพอและมีความเป็นไปได้สูงจะใช้ค่าที่ใกล้เคียงกับค่าคงที่จำนวนหนึ่ง กล่าวคือ ตัวเลข

(ม(Xj) + เอ็ม (X2)+... + ม (Xn))/nหรือไปที่หมายเลข และในกรณีเฉพาะ

กล่าวอีกนัยหนึ่ง ตัวแปรสุ่มแต่ละตัวสามารถมีการแพร่กระจายที่มีนัยสำคัญ และค่าเฉลี่ยเลขคณิตของพวกมันกระจัดกระจายเล็กน้อย

ดังนั้น เราจึงไม่สามารถคาดเดาได้อย่างมั่นใจว่าตัวแปรสุ่มแต่ละตัวจะใช้ค่าใดได้ แต่เราสามารถคาดการณ์ได้ว่าค่าเฉลี่ยเลขคณิตของพวกเขาจะใช้ค่าใด

ดังนั้น ค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มอิสระจำนวนมากเพียงพอ (ความแปรปรวนที่ถูกจำกัดอย่างเท่ากัน) จะสูญเสียลักษณะของตัวแปรสุ่ม

สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าการเบี่ยงเบนของปริมาณแต่ละค่าจากความคาดหวังทางคณิตศาสตร์อาจเป็นได้ทั้งทางบวกและทางลบ และในค่าเฉลี่ยเลขคณิต พวกมันจะตัดกันออกจากกัน

ทฤษฎีบทของ Chebyshev นั้นใช้ได้ไม่เพียงแต่แบบแยกส่วนเท่านั้น แต่สำหรับตัวแปรสุ่มแบบต่อเนื่องด้วย เป็นตัวอย่างยืนยันความถูกต้องของหลักคำสอนเรื่องความเชื่อมโยงระหว่างโอกาสและความจำเป็น

2.4. ความสำคัญของทฤษฎีบทของ Chebyshev สำหรับการปฏิบัติ

ให้เรายกตัวอย่างการประยุกต์ใช้ทฤษฎีบท Chebyshev เพื่อแก้ปัญหาในทางปฏิบัติ

โดยปกติ ในการวัดปริมาณทางกายภาพบางอย่าง จะมีการวัดหลายครั้งและใช้ค่าเฉลี่ยเลขคณิตเป็นขนาดที่ต้องการ วิธีการวัดนี้ถือว่าถูกต้องภายใต้เงื่อนไขใดบ้าง คำตอบสำหรับคำถามนี้มาจากทฤษฎีบทของ Chebyshev (เป็นกรณีพิเศษ)

อันที่จริง ให้พิจารณาผลลัพธ์ของการวัดแต่ละครั้งเป็นตัวแปรสุ่ม

X1, X2, ..., Xn

สำหรับปริมาณเหล่านี้ ทฤษฎีบท Chebyshev สามารถใช้ได้หาก:

1) พวกเขาเป็นอิสระเป็นคู่

2) มีความคาดหวังทางคณิตศาสตร์เหมือนกัน

3) การกระจายของพวกมันถูก จำกัด อย่างสม่ำเสมอ

เป็นไปตามข้อกำหนดแรกหากผลลัพธ์ของการวัดแต่ละครั้งไม่ขึ้นอยู่กับผลลัพธ์ของการวัดอื่นๆ

ตรงตามข้อกำหนดที่สอง หากการวัดทำโดยไม่มีข้อผิดพลาดอย่างเป็นระบบ (สัญญาณเดียว) ในกรณีนี้ ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มทั้งหมดจะเท่ากันและเท่ากับขนาดจริง ก.

ตรงตามข้อกำหนดที่สามหากอุปกรณ์มีความแม่นยำในการวัด แม้ว่าผลลัพธ์ของการวัดแต่ละครั้งจะแตกต่างกัน แต่การกระเจิงนั้นก็มีจำกัด

หากตรงตามข้อกำหนดเหล่านี้ เรามีสิทธิ์นำทฤษฎีบท Chebyshev ไปใช้กับผลการวัด: สำหรับขนาดใหญ่เพียงพอ พีความน่าจะเป็นของความไม่เท่าเทียมกัน

| (X1 + Xa+...+Xn)/n - a |< ε ใกล้กับความสามัคคีโดยพลการ

กล่าวอีกนัยหนึ่ง ด้วยการวัดจำนวนมากเพียงพอ เกือบจะแน่ใจว่าค่าเฉลี่ยเลขคณิตแตกต่างจากมูลค่าที่แท้จริงของปริมาณที่วัดได้เพียงเล็กน้อยโดยพลการ

ทฤษฎีบทของ Chebyshev ระบุเงื่อนไขที่สามารถใช้วิธีการวัดที่อธิบายไว้ได้ อย่างไรก็ตาม เป็นความผิดพลาดที่จะคิดว่า การเพิ่มจำนวนการวัดจะทำให้ได้ความแม่นยำสูงตามอำเภอใจ ความจริงก็คือตัวอุปกรณ์เองให้การอ่านค่าที่มีความแม่นยำ ± α เท่านั้น ดังนั้นผลการวัดแต่ละรายการและค่าเฉลี่ยเลขคณิตจะได้มาโดยมีความแม่นยำไม่เกินความแม่นยำของอุปกรณ์เท่านั้น

วิธีการสุ่มตัวอย่างที่ใช้กันอย่างแพร่หลายในสถิติขึ้นอยู่กับทฤษฎีบทของ Chebyshev ซึ่งมีสาระสำคัญคือใช้กลุ่มตัวอย่างสุ่มที่มีขนาดค่อนข้างเล็กเพื่อตัดสินประชากรทั้งหมด (ประชากรทั่วไป) ของวัตถุที่อยู่ระหว่างการศึกษา

ตัวอย่างเช่น คุณภาพของก้อนฝ้ายจะพิจารณาจากมัดเล็กๆ ที่ประกอบด้วยเส้นใยที่สุ่มเลือกจากส่วนต่างๆ ของก้อนฝ้าย แม้ว่าจำนวนของเส้นใยในกลุ่มจะน้อยกว่าในมัด แต่ตัวมัดเองก็มีเส้นใยจำนวนมากพอสมควร โดยมีจำนวนเป็นร้อย

อีกตัวอย่างหนึ่งสามารถชี้ไปที่การกำหนดคุณภาพของเมล็ดพืชจากตัวอย่างเล็กๆ และในกรณีนี้ จำนวนเมล็ดพืชที่สุ่มเลือกจะมีน้อยเมื่อเทียบกับมวลทั้งหมดของเมล็ดพืช แต่ในตัวมันเองนั้นค่อนข้างมาก

จากตัวอย่างที่อ้างถึง เราสามารถสรุปได้ว่าสำหรับภาคปฏิบัติ ทฤษฎีบทของ Chebyshev มีความสำคัญอย่างยิ่งยวด

2.5. ทฤษฎีบทเบอร์นูลลี

ผลิต พีการทดสอบอิสระ (ไม่ใช่เหตุการณ์ แต่เป็นการทดสอบ) ในแต่ละรายการความน่าจะเป็นของเหตุการณ์ อาเท่ากับ ร.

เกิดคำถามว่าความถี่สัมพัทธ์ของเหตุการณ์จะเป็นอย่างไร? คำถามนี้ตอบโดยทฤษฎีบทที่พิสูจน์โดย Bernoulli ซึ่งเรียกว่า "กฎของจำนวนมาก" และวางรากฐานสำหรับทฤษฎีความน่าจะเป็นเป็นวิทยาศาสตร์

ทฤษฎีบทของเบอร์นูลลีถ้าในแต่ละ พีความน่าจะเป็นในการทดสอบอิสระ Rการเกิดเหตุการณ์ แต่เป็นค่าคงที่ แล้วความน่าจะเป็นที่ความเบี่ยงเบนของความถี่สัมพัทธ์จากความน่าจะเป็น Rจะมีค่าสัมบูรณ์เล็กน้อยตามอำเภอใจหากจำนวนการทดลองมีมากเพียงพอ

กล่าวอีกนัยหนึ่งถ้า ε >0 เป็นจำนวนน้อยโดยพลการภายใต้เงื่อนไขของทฤษฎีบทเราจะมีความเท่าเทียมกัน

พี(| / n - p|< ε)= 1

ความคิดเห็นหากใช้ทฤษฎีบทของเบอร์นูลลีจะถือว่าผิด หากจะสรุปว่าด้วยจำนวนการทดลองที่เพิ่มขึ้น ความถี่สัมพัทธ์มีแนวโน้มสูงขึ้นเรื่อยๆ อาร์;กล่าวอีกนัยหนึ่ง ทฤษฎีบทของเบอร์นูลลีไม่ได้หมายความถึงความเท่าเทียมกัน (t/n) = พี,

ที่ทฤษฎีบทเกี่ยวข้องกับความน่าจะเป็นที่มีการทดลองจำนวนมากเพียงพอ ความถี่สัมพัทธ์จะแตกต่างกันเล็กน้อยตามอำเภอใจจากความน่าจะเป็นคงที่ของเหตุการณ์ที่เกิดขึ้นในการทดลองแต่ละครั้ง

งานที่ 7-1

1. ประมาณความน่าจะเป็นที่หลังจากการขว้างลูกเต๋า 3600 ครั้ง จำนวนครั้ง 6 ครั้งจะเป็นอย่างน้อย 900 ครั้ง

วิธีการแก้.ให้ x เป็นจำนวนครั้งที่เกิด 6 แต้มในการโยนเหรียญ 3600 ครั้ง ความน่าจะเป็นที่จะได้ 6 แต้มในการโยนครั้งเดียวคือ p=1/6 จากนั้น M(x)=3600 1/6=600 เราใช้ความไม่เท่าเทียมกันของ Chebyshev (บทแทรก) สำหรับ α = 900 . ที่กำหนด

= พี(x³ 900) £ 600 / 900 =2 / 3

ตอบ 2 / 3.

2. ทำการทดสอบอิสระ 1,000 ครั้ง p=0.8 ค้นหาความน่าจะเป็นของจำนวนครั้งของเหตุการณ์ A ในการทดสอบเหล่านี้เบี่ยงเบนไปจากโมดูโลการคาดหมายทางคณิตศาสตร์ที่น้อยกว่า 50

วิธีการแก้. x คือจำนวนครั้งของเหตุการณ์ A ในการทดลอง n - 1,000 ครั้ง

M (X) \u003d 1,000 0.8 \u003d 800 D(x)=100 0.8 0.2=160

เราใช้อสมการ Chebyshev สำหรับ ε = 50 . ที่กำหนด

P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

ตอบ. 0,936

3. ใช้อสมการเชบีเชฟ ประมาณความน่าจะเป็นที่ |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

4. ให้: P(|X- เอ็ม(X)\< ε) ³ 0.9; ดี (X)= 0.004. ใช้อสมการ Chebyshev หา ε . ตอบ. 0,2.

ควบคุมคำถามและงาน

1. วัตถุประสงค์ของทฤษฎีบทขีด จำกัด กลาง

2. เงื่อนไขสำหรับการบังคับใช้ทฤษฎีบทของ Lyapunov

3. ความแตกต่างระหว่างบทแทรกและทฤษฎีบทของ Chebyshev

4. เงื่อนไขสำหรับการบังคับใช้ทฤษฎีบท Chebyshev

5. เงื่อนไขการบังคับใช้ทฤษฎีบทของเบอร์นูลลี (กฎจำนวนมาก)

ข้อกำหนดสำหรับความรู้และทักษะ

นักเรียนต้องรู้สูตรความหมายทั่วไปของทฤษฎีบทขีดจำกัดกลาง สามารถกำหนดทฤษฎีบทบางส่วนสำหรับตัวแปรสุ่มแบบกระจายที่เหมือนกันอย่างอิสระ ทำความเข้าใจความไม่เท่าเทียมกันของ Chebyshev และกฎของตัวเลขจำนวนมากในรูปแบบ Chebyshev มีความคิดเกี่ยวกับความถี่ของเหตุการณ์ ความสัมพันธ์ระหว่างแนวคิดของ "ความน่าจะเป็น" และ "ความถี่" มีความเข้าใจกฎหมายจำนวนมากในรูปของเบอร์นูลลี

(1857-1918) นักคณิตศาสตร์ชาวรัสเซียที่โดดเด่น

ในตอนต้นของหลักสูตร เราได้พูดไปแล้วว่ากฎทางคณิตศาสตร์ของทฤษฎีความน่าจะเป็นนั้นได้มาจากการสรุปความสม่ำเสมอทางสถิติที่แท้จริงซึ่งมีอยู่ในปรากฏการณ์สุ่มจำนวนมาก การมีอยู่ของรูปแบบเหล่านี้สัมพันธ์กันอย่างแม่นยำกับธรรมชาติของมวลของปรากฏการณ์ กล่าวคือ ด้วยการทดลองที่เป็นเนื้อเดียวกันจำนวนมากหรือด้วยเอฟเฟกต์สุ่มจำนวนมากที่สร้างตัวแปรสุ่มภายใต้กฎที่กำหนดไว้อย่างดี มนุษย์รู้จักคุณสมบัติความคงตัวของปรากฏการณ์สุ่มมวลตั้งแต่สมัยโบราณ ในทุกด้านที่มันแสดงออก แก่นแท้ของมันจะลดลงดังต่อไปนี้: ลักษณะเฉพาะของปรากฏการณ์สุ่มแต่ละรายการแทบไม่มีผลกระทบต่อผลลัพธ์โดยเฉลี่ยของมวลและปรากฏการณ์ดังกล่าว การเบี่ยงเบนแบบสุ่มจากค่าเฉลี่ยที่หลีกเลี่ยงไม่ได้ในแต่ละปรากฏการณ์ในมวลจะถูกยกเลิกร่วมกันปรับระดับออก นี่คือความเสถียรของค่าเฉลี่ยที่เป็นเนื้อหาทางกายภาพของ "กฎของจำนวนมาก" ที่เข้าใจในความหมายกว้างของคำ: ด้วยปรากฏการณ์สุ่มจำนวนมาก ผลลัพธ์โดยเฉลี่ยของพวกมันจะหยุดสุ่มและสามารถคาดเดาได้ ด้วยความมั่นใจอย่างสูง

ในความหมายที่แคบของคำว่า "กฎจำนวนมาก" ในทฤษฎีความน่าจะเป็นถูกเข้าใจว่าเป็นทฤษฎีบททางคณิตศาสตร์จำนวนหนึ่ง ซึ่งในแต่ละเงื่อนไข ข้อเท็จจริงของการประมาณลักษณะเฉลี่ยของการทดลองจำนวนมาก ถึงค่าคงที่เฉพาะบางค่าที่กำหนดไว้

ใน 2.3 เราได้กำหนดทฤษฎีบทที่ง่ายที่สุดแล้ว นั่นคือทฤษฎีบทของ J. Bernoulli เธออ้างว่าด้วยการทดลองจำนวนมาก ความถี่ของเหตุการณ์ใกล้เข้ามา (อย่างแม่นยำมากขึ้น มาบรรจบกันในความน่าจะเป็น) กับความน่าจะเป็นของเหตุการณ์นี้ บทนี้จะกล่าวถึงรูปแบบทั่วไปอื่นๆ ของกฎจำนวนมากในบทนี้ ทั้งหมดกำหนดข้อเท็จจริงและเงื่อนไขสำหรับการลู่เข้าในความน่าจะเป็นของตัวแปรสุ่มบางตัวเป็นตัวแปรคงที่และไม่สุ่ม

กฎของตัวเลขจำนวนมากมีบทบาทสำคัญในการประยุกต์ใช้ทฤษฎีความน่าจะเป็นในทางปฏิบัติ คุณสมบัติของตัวแปรสุ่มภายใต้เงื่อนไขบางประการที่ปฏิบัติได้จริงเสมือนเป็นตัวแปรสุ่มช่วยให้เราดำเนินการกับปริมาณเหล่านี้ได้อย่างมั่นใจ เพื่อทำนายผลลัพธ์ของปรากฏการณ์สุ่มมวลด้วยความแน่นอนเกือบสมบูรณ์

ความเป็นไปได้ของการคาดคะเนดังกล่าวในด้านปรากฏการณ์สุ่มมวลจะขยายออกไปอีกโดยการมีอยู่ของทฤษฎีบทลิมิตอีกกลุ่มหนึ่ง ซึ่งไม่เกี่ยวข้องกับค่าลิมิตของตัวแปรสุ่มอีกต่อไป แต่เป็นการจำกัดกฎหมายการแจกแจง นี่คือกลุ่มของทฤษฎีบทที่เรียกว่า "ทฤษฎีบทขีดจำกัดกลาง" เราได้กล่าวไปแล้วว่าเมื่อรวมตัวแปรสุ่มจำนวนมากเพียงพอ กฎการแจกแจงของผลรวมจะเข้าใกล้ตัวแปรปกติอย่างไม่มีกำหนด หากเป็นไปตามเงื่อนไขบางประการ เงื่อนไขเหล่านี้ ซึ่งสามารถกำหนดสูตรทางคณิตศาสตร์ได้หลายวิธี - ในรูปแบบทั่วไปไม่มากก็น้อย - โดยพื้นฐานแล้วต้องพิจารณาถึงข้อกำหนดที่อิทธิพลต่อผลรวมของคำศัพท์แต่ละคำมีขนาดเล็กเท่ากัน กล่าวคือ ผลรวมไม่ควรรวมคำศัพท์ที่ชัดเจน เหนือกว่าชุดที่เหลือโดยมีอิทธิพลต่อการกระจายของปริมาณ รูปแบบต่างๆ ของทฤษฎีบทขีดจำกัดกลางต่างกันในเงื่อนไขที่กำหนดคุณสมบัติของผลรวมของตัวแปรสุ่ม

รูปแบบต่างๆ ของกฎจำนวนมาก ร่วมกับรูปแบบต่างๆ ของทฤษฎีบทขีดจำกัดกลาง ก่อให้เกิดชุดของทฤษฎีบทลิมิตของทฤษฎีความน่าจะเป็นที่เรียกว่า ทฤษฎีบทจำกัดทำให้ไม่เพียงแต่คาดการณ์ทางวิทยาศาสตร์ในด้านปรากฏการณ์สุ่มเท่านั้น แต่ยังประเมินความถูกต้องของการพยากรณ์เหล่านี้ด้วย

ในบทนี้ เราจะพิจารณาเฉพาะรูปแบบที่ง่ายที่สุดของทฤษฎีบทลิมิตบางรูปแบบเท่านั้น อันดับแรก ทฤษฎีบทที่เกี่ยวข้องกับกลุ่ม "กฎหมายจำนวนมาก" จะได้รับการพิจารณา จากนั้น - ทฤษฎีบทที่เกี่ยวข้องกับกลุ่ม "ทฤษฎีบทขีดจำกัดกลาง"

1. /PB-MS-theory/Lectures-1(4с.).doc
2. /PB-MS-theory/Lectures-2(4с.).doc
3. /PB-MS-theory/Lectures-3(4с.).doc
4. /PB-MS-theory/Lectures-4(4s.).doc
5. /PB-MS-theory/Contents.doc
บรรยาย 1
การบรรยาย 19. การทดสอบทางสถิติของสมมติฐานทางสถิติ. หลักการทั่วไปสำหรับการทดสอบสมมติฐาน แนวคิดของสมมติฐานทางสถิติ (แบบง่ายและซับซ้อน) เป็นโมฆะและสมมติฐานที่แข่งขันกัน
กฎของตัวเลขจำนวนมาก ความไม่เท่าเทียมกันของ Chebyshev ทฤษฎีบท Chebyshev และ Bernoulli
การบรรยาย ลักษณะเชิงตัวเลขพื้นฐานของตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง: การคาดหมายทางคณิตศาสตร์ ความแปรปรวน และค่าเบี่ยงเบนมาตรฐาน คุณสมบัติและตัวอย่างของพวกเขา
การบรรยาย เรื่องทฤษฎีความน่าจะเป็น เหตุการณ์สุ่ม พีชคณิตของเหตุการณ์ ความถี่สัมพัทธ์และความน่าจะเป็นของเหตุการณ์สุ่ม กลุ่มกิจกรรมที่สมบูรณ์ ความหมายคลาสสิกของความน่าจะเป็น คุณสมบัติพื้นฐานของความน่าจะเป็น สูตรพื้นฐานของ combinatorics

บทเรียนที่ 13

กฎของตัวเลขจำนวนมาก ความไม่เท่าเทียมกันของ Chebyshev ทฤษฎีบทของ Chebyshev และ Bernoulli
การศึกษาความสม่ำเสมอทางสถิติทำให้สามารถระบุได้ว่าภายใต้เงื่อนไขบางประการ พฤติกรรมทั้งหมดของตัวแปรสุ่มจำนวนมากเกือบจะสูญเสียลักษณะสุ่มและกลายเป็นปกติ (กล่าวอีกนัยหนึ่ง การเบี่ยงเบนแบบสุ่มจากพฤติกรรมเฉลี่ยบางอย่างจะยกเลิกกันและกัน) . โดยเฉพาะอย่างยิ่ง หากอิทธิพลต่อผลรวมของพจน์แต่ละพจน์มีขนาดเล็กเท่ากัน กฎการกระจายของผลรวมจะเข้าใกล้ปกติ สูตรทางคณิตศาสตร์ของข้อความนี้อยู่ในกลุ่มของทฤษฎีบทที่เรียกว่า กฎของตัวเลขจำนวนมาก.

ความไม่เท่าเทียมกันของ Chebyshev
ความไม่เท่าเทียมกันของ Chebyshev ซึ่งใช้ในการพิสูจน์ทฤษฎีบทเพิ่มเติมนั้นใช้ได้กับตัวแปรสุ่มทั้งแบบต่อเนื่องและแบบไม่ต่อเนื่อง ให้เราพิสูจน์มันสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง
ทฤษฎีบท 13.1 (ความไม่เท่าเทียมกันของ Chebyshev) พี( | Xเอ็ม(X)| ด( X) / ε². (13.1)

การพิสูจน์. อนุญาต Xกำหนดโดยหมายเลขการแจกจ่าย


X

X 1

X 2



X พี

R

R 1

R 2



R พี

ตั้งแต่เหตุการณ์ | Xเอ็ม(X)| X เอ็ม(X)| ≥ ε อยู่ตรงข้าม แล้ว R (|Xเอ็ม(X)| พี(| Xเอ็ม(X)| ≥ε) = 1 ดังนั้น R (|Xเอ็ม(X)| พี(| Xเอ็ม(X)| ≥ ε) มาหากัน R (|Xเอ็ม(X)| ≥ ε).

ดี(X) = (x 1 – เอ็ม(X))² พี 1 + (x 2 – เอ็ม(X))² พี 2 + … + (x เอ็ม(X))² พี . เราไม่รวมเงื่อนไขเหล่านี้ซึ่ง | Xเอ็ม(X)| k เงื่อนไข แล้ว

ดี(X) ≥ (x k + 1 – เอ็ม(X))² พี k + 1 + (x k + 2 – เอ็ม(X))² พี k +2 + … + (x เอ็ม(X))² พี ≥ ε² ( พี k + 1 + พี k + 2 + … + พี ).

สังเกตว่า พี k + 1 + พี k + 2 + … + พี มีความเป็นไปได้ว่า | Xเอ็ม(X)| ≥ ε เนื่องจากนี่คือผลรวมของความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมด Xซึ่งความไม่เท่าเทียมกันนี้เป็นความจริง เพราะเหตุนี้, ดี(X) ≥ ε² R(|Xเอ็ม(X)| ≥ ε) หรือ R (|Xเอ็ม(X)| ≥ ε) ≤ ดี(X) / ε². แล้วความน่าจะเป็นของเหตุการณ์ตรงกันข้าม พี( | Xเอ็ม(X)| ด( X) / ε² ซึ่งต้องพิสูจน์
ทฤษฎีบทของ Chebyshev และ Bernoulli

ทฤษฎีบท 13.2 (ทฤษฎีบทของเชบีเชฟ) ถ้า X 1 , X 2 ,…, X พีเป็นตัวแปรสุ่มอิสระแบบคู่ที่มีความแปรปรวนมีขอบเขตสม่ำเสมอ ( ดี(X ผม) ≤ ) จากนั้นสำหรับจำนวนน้อยโดยพลการ ε ความน่าจะเป็นของอสมการ

จะเข้าใกล้ 1 โดยพลการถ้าจำนวนของตัวแปรสุ่มมีขนาดใหญ่เพียงพอ

ความคิดเห็นกล่าวอีกนัยหนึ่งหากตรงตามเงื่อนไขเหล่านี้

การพิสูจน์. พิจารณาตัวแปรสุ่มใหม่
และค้นหาความคาดหวังทางคณิตศาสตร์ของมัน โดยใช้คุณสมบัติของการคาดหมายทางคณิตศาสตร์ เราได้สิ่งนั้น ใช้ได้กับ ความไม่เท่าเทียมกันของ Chebyshev: เนื่องจากตัวแปรสุ่มที่พิจารณานั้นเป็นอิสระ ดังนั้น เมื่อพิจารณาถึงเงื่อนไขของทฤษฎีบท เราจึงมี: การใช้ผลลัพธ์นี้ เราแสดงความไม่เท่าเทียมกันก่อนหน้าในรูปแบบ:

ให้เราก้าวข้ามขีดจำกัดที่
: เนื่องจากความน่าจะเป็นต้องไม่มากกว่า 1 จึงสรุปได้ว่า

ทฤษฎีบทได้รับการพิสูจน์แล้ว
ผลที่ตามมา

ถ้า X 1 , X 2 , …, X พี- ตัวแปรสุ่มอิสระแบบคู่โดยมีความแปรปรวนจำกัดสม่ำเสมอ มีความคาดหวังทางคณิตศาสตร์เหมือนกันเท่ากับ เอดังนั้นสำหรับ ε > 0 เล็กน้อยตามอำเภอใจของความน่าจะเป็นของอสมการ
จะเข้าใกล้ 1 โดยพลการถ้าจำนวนของตัวแปรสุ่มมีขนาดใหญ่เพียงพอ กล่าวอีกนัยหนึ่ง
.

บทสรุป:ค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มจำนวนมากเพียงพอจะใช้ค่าที่ใกล้เคียงกับผลรวมของความคาดหวังทางคณิตศาสตร์ กล่าวคือ สูญเสียลักษณะของตัวแปรสุ่ม ตัวอย่างเช่น ถ้าชุดของการวัดปริมาณทางกายภาพใดๆ ถูกดำเนินการ และ: ก) ผลลัพธ์ของการวัดแต่ละครั้งไม่ได้ขึ้นอยู่กับผลลัพธ์ของการวัดอื่นๆ นั่นคือ ผลลัพธ์ทั้งหมดเป็นตัวแปรสุ่มอิสระแบบคู่ b) การวัดทำโดยไม่มีข้อผิดพลาดอย่างเป็นระบบ (ความคาดหวังทางคณิตศาสตร์ของพวกเขามีค่าเท่ากันและเท่ากับมูลค่าที่แท้จริง เอค่าที่วัดได้); c) รับรองความถูกต้องของการวัดที่แน่นอน ดังนั้นการกระจายตัวของตัวแปรสุ่มที่พิจารณาจึงถูกจำกัดอย่างสม่ำเสมอ จากนั้นสำหรับการวัดจำนวนมากเพียงพอ ค่าเฉลี่ยเลขคณิตของพวกมันจะใกล้เคียงกับค่าจริงของปริมาณที่วัดได้ตามอำเภอใจ
ทฤษฎีบทของเบอร์นูลลี
ทฤษฎีบท 13.3 (ทฤษฎีบทของเบอร์นูลลี). ถ้าในแต่ละ พีความน่าจะเป็นของประสบการณ์อิสระ Rการเกิดเหตุการณ์ แต่มีค่าคงที่ จากนั้นด้วยการทดสอบจำนวนมากพอสมควร ความน่าจะเป็นที่โมดูลัสของการเบี่ยงเบนของความถี่สัมพัทธ์ของการเกิดขึ้น แต่ใน พีประสบการณ์จาก Rจะเล็กตามอำเภอใจใกล้กับ 1:

(13.2)

การพิสูจน์. เราแนะนำตัวแปรสุ่ม X 1 , X 2 , …, X พี, ที่ไหน X ผม จำนวนนัด แต่ใน ผม-m ประสบการณ์ โดยที่ X ผม สามารถรับได้เพียงสองค่า: 1 (ด้วยความน่าจะเป็น R) และ 0 (ด้วยความน่าจะเป็น q = 1 – พี). นอกจากนี้ ตัวแปรสุ่มที่พิจารณาแล้วจะไม่ขึ้นกับคู่ และความแปรปรวนของตัวแปรเหล่านี้มีขอบเขตเท่ากัน (ตั้งแต่ ดี(X ผม) = pq, พี + q = 1 จากไหน pq ≤ ¼) ดังนั้น ทฤษฎีบทของ Chebyshev จึงสามารถนำมาประยุกต์ใช้กับมันได้ เอ็ม ผม = พี:

.

แต่
, เพราะ X ผม รับค่า 1 เมื่อ แต่ในการทดลองนี้ และมีค่าเท่ากับ 0 if แต่ไม่ได้เกิดขึ้น ทางนี้,

คิวอีดี
ความคิดเห็นจากทฤษฎีบทของเบอร์นูลลี มันไม่เป็นไปตาม, อะไร
มันก็แค่ประมาณ ความน่าจะเป็นว่าความแตกต่างระหว่างความถี่สัมพัทธ์และโมดูโลความน่าจะเป็นนั้นอาจมีน้อยตามอำเภอใจ ความแตกต่างมีดังนี้: ด้วยการบรรจบกันตามปกติที่พิจารณาในการวิเคราะห์ทางคณิตศาสตร์ สำหรับทุกคน พี, เริ่มจากค่าบางอย่าง, ความไม่เท่าเทียมกัน
ถูกประหารชีวิตเสมอ ในกรณีของเราอาจมีค่าดังกล่าว พีซึ่งความไม่เท่าเทียมกันนี้เป็นเท็จ การบรรจบกันแบบนี้เรียกว่า การบรรจบกันของความน่าจะเป็น.

บรรยาย 14

ทฤษฎีบทขีด จำกัด กลางของ Lyapunov ทฤษฎีบทจำกัด Moivre-Laplace
กฎของตัวเลขจำนวนมากไม่ได้ตรวจสอบรูปแบบของกฎหมายการแจกแจงขีดจำกัดสำหรับผลรวมของตัวแปรสุ่ม คำถามนี้จัดอยู่ในกลุ่มของทฤษฎีบทที่เรียกว่า ทฤษฎีบทขีด จำกัด กลางพวกเขาโต้แย้งว่ากฎการแจกแจงของผลรวมของตัวแปรสุ่ม ซึ่งแต่ละตัวอาจมีการแจกแจงต่างกัน เข้าใกล้ค่าปกติด้วยจำนวนพจน์ที่มากพอ สิ่งนี้อธิบายถึงความสำคัญของกฎหมายปกติสำหรับการใช้งานจริง
ฟังก์ชันลักษณะเฉพาะ

วิธีการของฟังก์ชันคุณลักษณะใช้เพื่อพิสูจน์ทฤษฎีบทขีดจำกัดกลาง
คำจำกัดความ 14.1ฟังก์ชันลักษณะเฉพาะ ตัวแปรสุ่ม Xเรียกว่าฟังก์ชัน

g(t) = เอ็ม (อี itX ) (14.1)

ทางนี้, g (t) เป็นค่าคาดหมายทางคณิตศาสตร์ของตัวแปรสุ่มที่ซับซ้อนบางตัว ยู = อี itXที่เกี่ยวข้องกับค่า X. โดยเฉพาะถ้า Xเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่กำหนดโดยอนุกรมการแจกแจง ดังนั้น

. (14.2)

สำหรับตัวแปรสุ่มต่อเนื่องที่มีความหนาแน่นของการแจกแจง (x)

(14.3)

ตัวอย่างที่ 1 ให้ X- จำนวนดรอป 6 แต้มด้วยการโยนลูกเต๋าหนึ่งครั้ง จากนั้นตามสูตร (14.2) g(t) =

ตัวอย่างที่ 2 ค้นหาฟังก์ชันคุณลักษณะสำหรับตัวแปรสุ่มต่อเนื่องที่ทำให้เป็นมาตรฐานซึ่งกระจายตามกฎปกติ
. ตามสูตร (14.3) (เราใช้สูตร
และอะไร ผม² = -1).

คุณสมบัติของฟังก์ชันลักษณะเฉพาะ
1. ฟังก์ชัน (x) สามารถพบได้จากฟังก์ชันที่รู้จัก g(t) ตามสูตร

(14.4)

(การแปลงร่าง (14.3) เรียกว่า การแปลงฟูริเยร์และการแปลง (14.4) คือ การแปลงฟูเรียร์ผกผัน).

2. ถ้าตัวแปรสุ่ม Xและ Yสัมพันธ์กันด้วยอัตราส่วน Y = ขวาน, จากนั้นหน้าที่คุณลักษณะของพวกมันสัมพันธ์กันโดยความสัมพันธ์

g y (t) = g x (ที่). (14.5)

3. ฟังก์ชันคุณลักษณะของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลคูณของฟังก์ชันคุณลักษณะของเงื่อนไข: for

(14.6)
ทฤษฎีบท 14.1 (ทฤษฎีบทขีด จำกัด กลางสำหรับเงื่อนไขที่แจกแจงเหมือนกัน) ถ้า X 1 , X 2 ,…, X พี,… - ตัวแปรสุ่มอิสระที่มีกฎการแจกแจงแบบเดียวกัน การคาดหมายทางคณิตศาสตร์ tและการกระจายตัว σ 2 แล้วด้วยการเพิ่มขึ้นอย่างไม่จำกัด พีกฎหมายว่าด้วยการกระจายผลรวม
เข้าสู่ภาวะปกติอย่างไม่มีกำหนด

การพิสูจน์.

ให้เราพิสูจน์ทฤษฎีบทสำหรับตัวแปรสุ่มอย่างต่อเนื่อง X 1 , X 2 ,…, X พี(หลักฐานสำหรับปริมาณที่ไม่ต่อเนื่องมีความคล้ายคลึงกัน) ตามเงื่อนไขของทฤษฎีบท ฟังก์ชันคุณลักษณะของเงื่อนไขจะเหมือนกัน:
จากนั้นโดยคุณสมบัติ 3 ฟังก์ชันคุณลักษณะของผลรวม Y จะ
ขยายฟังก์ชัน g x (t) ในซีรีส์ Maclaurin:

, ที่ไหน
ที่
.

ถ้าสมมุติว่า t= 0 (นั่นคือ ย้ายต้นทางไปยังจุด t), แล้ว
.

(เพราะ t= 0). แทนที่ผลลัพธ์ที่ได้ลงในสูตร Maclaurin เราพบว่า

.

พิจารณาตัวแปรสุ่มใหม่
, แตกต่างจาก Y ความจริงที่ว่ามันกระจายไปสำหรับใดๆ พีเท่ากับ 0 ตั้งแต่ Y และ Z สัมพันธ์กันเชิงเส้นก็พอจะพิสูจน์ได้ว่า Z กระจายตามกฎปกติหรืออะไรที่เหมือนกันว่าฟังก์ชันคุณลักษณะของมันเข้าใกล้ฟังก์ชันคุณลักษณะของกฎปกติ (ดูตัวอย่างที่ 2) โดยคุณสมบัติของฟังก์ชันลักษณะเฉพาะ

เราใช้ลอการิทึมของนิพจน์ผลลัพธ์:

ที่ไหน

มาย่อยสลาย
ในแถวที่ พี→ ∞ จำกัด ตัวเราไว้สองเงื่อนไขการขยายจากนั้น ln(1 - k) ≈ - k. จากที่นี่

โดยที่ขีด จำกัด ล่าสุดคือ 0 เพราะ ที่ . เพราะเหตุนี้,
, นั่นคือ
เป็นฟังก์ชันคุณลักษณะของการแจกแจงแบบปกติ ดังนั้น ด้วยจำนวนพจน์ที่เพิ่มขึ้นอย่างไม่จำกัด ฟังก์ชันคุณลักษณะของปริมาณ Z เข้าใกล้ฟังก์ชันคุณลักษณะของกฎปกติอย่างไม่มีกำหนด ดังนั้นกฎหมายว่าด้วยการกระจายสินค้า Z (และ Y ) เข้าใกล้ค่าปกติอย่างไม่มีกำหนด ทฤษฎีบทได้รับการพิสูจน์แล้ว

A.M. Lyapunov พิสูจน์ทฤษฎีบทขีด จำกัด กลางสำหรับเงื่อนไขทั่วไปเพิ่มเติม:
ทฤษฎีบท 14.2 (ทฤษฎีบทของ Lyapunov) ถ้าตัวแปรสุ่ม Xคือผลรวมของตัวแปรสุ่มที่เป็นอิสระร่วมกันจำนวนมากซึ่งเป็นไปตามเงื่อนไขต่อไปนี้:

, (14.7)

ที่ไหน k เป็นโมเมนต์ศูนย์กลางสัมบูรณ์ที่สามของปริมาณ X ถึง, แ ดี kคือความแปรปรวนของมัน แล้ว Xมีการแจกแจงที่ใกล้เคียงปกติ (เงื่อนไข Lyapunov หมายความว่าอิทธิพลของแต่ละเทอมที่มีต่อผลรวมนั้นเล็กน้อย)
ในทางปฏิบัติ มันเป็นไปได้ที่จะใช้ทฤษฎีบทขีดจำกัดกลางที่มีเงื่อนไขจำนวนน้อยเพียงพอ เนื่องจากการคำนวณความน่าจะเป็นต้องการความแม่นยำที่ค่อนข้างต่ำ ประสบการณ์แสดงให้เห็นว่าสำหรับผลรวมของคำศัพท์แม้แต่สิบหรือน้อยกว่า กฎของการแจกแจงของกฎนั้นสามารถแทนที่ด้วยกฎปกติได้

กรณีพิเศษของทฤษฎีบทขีดจำกัดกลางสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องคือทฤษฎีบทเดอมอยฟร์-ลาปลาซ

ทฤษฎีบท 14.3 (ทฤษฎีบท Moivre-Laplace) ถ้าผลิต พีการทดลองอิสระ ในแต่ละเหตุการณ์ แต่ปรากฏด้วยความน่าจะเป็น Rความสัมพันธ์นั้นถูกต้อง:

(14.8)

ที่ไหน Y – จำนวนครั้งของเหตุการณ์ แต่ใน พีการทดลอง q = 1 – พี.

การพิสูจน์.

เราจะถือว่า
, ที่ไหน X ผม– จำนวนครั้งของเหตุการณ์ แต่ใน ผม-m ประสบการณ์ จากนั้นตัวแปรสุ่ม
(ดูทฤษฎีบท 14.1) สามารถสันนิษฐานได้ว่ากระจายตามกฎปกติและทำให้เป็นมาตรฐาน ดังนั้น ความน่าจะเป็นที่ตกลงไปในช่วง (α, β) สามารถหาได้จากสูตร

เพราะว่า Yมีการแจกแจงทวินาม, . แล้ว
. แทนที่นิพจน์นี้ในสูตรก่อนหน้า เราจะได้ความเท่าเทียมกัน (14.8)

ผลที่ตามมา

ภายใต้เงื่อนไขของทฤษฎีบท Moivre-Laplace ความน่าจะเป็น
ว่าเหตุการณ์ แต่จะปรากฏใน พีการทดลองนั่นเอง kครั้งด้วยการทดลองจำนวนมากสามารถหาได้จากสูตร:

(14.9)

ที่ไหน
, แ
(ค่าของฟังก์ชันนี้มีให้ในตารางพิเศษ)

ตัวอย่างที่ 3 ค้นหาความน่าจะเป็นที่หลังจากการโยนเหรียญ 100 ครั้ง จำนวนเสื้อแขนจะลดลงในช่วง 40 ถึง 60

เราใช้สูตร (14.8) โดยคำนึงว่า พี= 0.5. แล้ว ฯลฯ= 100 0.5 = 50 แล้วถ้า
เพราะเหตุนี้,

ตัวอย่างที่ 4 ภายใต้เงื่อนไขของตัวอย่างก่อนหน้านี้ ให้หาความน่าจะเป็นที่เสื้อคลุมแขน 45 อันจะหลุดออกมา

มาหากัน
, แล้ว

บรรยาย 15

แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ ประชากรทั่วไปและกลุ่มตัวอย่าง ชุดตัวแปร ชุดสถิติ การเลือกแบบกลุ่ม ชุดสถิติที่จัดกลุ่ม รูปหลายเหลี่ยมความถี่ ฟังก์ชันการกระจายตัวอย่างและฮิสโตแกรม
สถิติทางคณิตศาสตร์เกี่ยวข้องกับการสร้างความสม่ำเสมอซึ่งอยู่ภายใต้ปรากฏการณ์สุ่มจำนวนมาก โดยพิจารณาจากการประมวลผลข้อมูลทางสถิติที่ได้รับจากการสังเกต งานหลักสองประการของสถิติทางคณิตศาสตร์คือ:

กำหนดวิธีการรวบรวมและจัดกลุ่มสถิติเหล่านี้

การพัฒนาวิธีการวิเคราะห์ข้อมูลที่ได้รับขึ้นอยู่กับวัตถุประสงค์ของการศึกษาซึ่งรวมถึง:

ก) การประมาณความน่าจะเป็นของเหตุการณ์ที่ไม่ทราบสาเหตุ การประมาณค่าฟังก์ชันการกระจายที่ไม่รู้จัก การประมาณค่าพารามิเตอร์การแจกแจงรูปแบบที่ทราบ การประเมินการพึ่งพาตัวแปรสุ่มอื่นๆ เป็นต้น

b) การทดสอบสมมติฐานทางสถิติเกี่ยวกับรูปแบบของการแจกแจงที่ไม่รู้จักหรือเกี่ยวกับค่าของพารามิเตอร์ของการแจกแจงที่ทราบ

ในการแก้ปัญหาเหล่านี้ จำเป็นต้องเลือกวัตถุจำนวนจำกัดจากชุดวัตถุที่เป็นเนื้อเดียวกันจำนวนมาก โดยพิจารณาจากผลการศึกษาซึ่งเป็นไปได้ที่จะทำการทำนายเกี่ยวกับคุณลักษณะที่ศึกษาของวัตถุเหล่านี้

ให้เรากำหนดแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์

ประชากร - ชุดของวัตถุที่มีอยู่ทั้งหมด

ตัวอย่าง- ชุดของวัตถุที่สุ่มเลือกจากประชากรทั่วไป

ขนาดของประชากรทั่วไปนู๋ และขนาดตัวอย่าง - จำนวนสิ่งของในชุดที่พิจารณา

ประเภทตัวอย่าง:

ซ้ำแล้วซ้ำเล่า- แต่ละออบเจ็กต์ที่เลือกจะถูกส่งกลับไปยังประชากรทั่วไปก่อนที่จะเลือกออบเจ็กต์ถัดไป

ไม่ซ้ำ- วัตถุที่เลือกจะไม่ถูกส่งคืนให้กับประชากรทั่วไป
ความคิดเห็นเพื่อให้การศึกษากลุ่มตัวอย่างสามารถสรุปเกี่ยวกับพฤติกรรมของคุณลักษณะของประชากรทั่วไปที่เราสนใจได้ จำเป็นที่กลุ่มตัวอย่างจะต้องแสดงสัดส่วนของประชากรทั่วไปอย่างถูกต้อง กล่าวคือ ตัวแทน(ตัวแทน). เมื่อพิจารณาจากกฎของตัวเลขจำนวนมาก เราสามารถโต้แย้งได้ว่าเงื่อนไขนี้จะเป็นไปตามเงื่อนไขหากแต่ละวัตถุถูกสุ่มเลือก และสำหรับวัตถุใดๆ ความน่าจะเป็นที่จะรวมอยู่ในกลุ่มตัวอย่างจะเท่ากัน
การประมวลผลผลลัพธ์เบื้องต้น

ให้ตัวแปรสุ่มที่เราสนใจ Xรับค่าในตัวอย่าง X 1 พี 1 ครั้ง, X 2 – พี 2 ครั้ง, …, X ถึง - พี ถึงครั้งและ
ที่ไหน พีคือขนาดตัวอย่าง จากนั้นค่าที่สังเกตได้ของตัวแปรสุ่ม X 1 , X 2 ,…, X ถึง เรียกว่า ตัวเลือก, แ พี 1 , พี 2 ,…, พี ถึงความถี่. ถ้าเราหารแต่ละความถี่ด้วยขนาดกลุ่มตัวอย่าง เราจะได้ ความถี่สัมพัทธ์
ลำดับของตัวเลือกที่เขียนในลำดับจากน้อยไปมากเรียกว่า ผันแปรเคียงข้างกัน และรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ - ชุดสถิติ:


x ผม

x 1

x 2



x k

ผม

1

2



k

w ผม

w 1

w 2



w k

เมื่อทอยลูกเต๋า 10 ชุด จำนวน 20 ชุด จำนวน 6 แต้ม หลุดออกมาคือ 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2 ,3 ,4,1. มาสร้างชุดรูปแบบกัน: 0,1,2,3,4,5. ชุดสถิติสำหรับความถี่สัมบูรณ์และความถี่สัมพัทธ์มีรูปแบบดังนี้


x ผม

0

1

2

3

4

5

ผม

3

6

5

3

2

1

w ผม

0,15

0,3

0,25

0,15

0,1

0,05

หากกำลังตรวจสอบคุณลักษณะต่อเนื่องบางอย่าง อนุกรมที่แปรผันอาจประกอบด้วยตัวเลขจำนวนมาก ในกรณีนี้จะสะดวกกว่าในการใช้งาน กลุ่มตัวอย่าง. เพื่อให้ได้มา ช่วงเวลาซึ่งประกอบด้วยค่าที่สังเกตทั้งหมดของคุณลักษณะ จะถูกแบ่งออกเป็นช่วงความยาวบางส่วนที่เท่ากันหลายช่วง ชม.แล้วหาแต่ละช่วงบางส่วน ผมคือผลรวมของความถี่ของตัวแปรที่ตกลงไปใน ผม- ช่วงที่ ตารางที่รวบรวมจากผลลัพธ์เหล่านี้เรียกว่า ชุดสถิติแบบจัดกลุ่ม:

รูปหลายเหลี่ยมความถี่ ฟังก์ชันการกระจายตัวอย่างและฮิสโตแกรม
สำหรับการแสดงภาพพฤติกรรมของตัวแปรสุ่มภายใต้การศึกษาในกลุ่มตัวอย่าง สามารถสร้างกราฟต่างๆ ได้ หนึ่งในนั้น - รูปหลายเหลี่ยมความถี่: เส้นรูปหลายเหลี่ยมที่มีส่วนเชื่อมต่อจุดด้วยพิกัด ( x 1 , 1), (x 2 , 2),…, (x k , k), ที่ไหน x ผม ถูกพล็อตบนแกน x และ ผม - บนแกน y หากบนแกน y เราพล็อตแบบไม่สัมบูรณ์ ( ผม) และญาติ ( w ผม) ความถี่ แล้วเราจะได้ รูปหลายเหลี่ยมความถี่สัมพัทธ์(รูปที่ 1) . ข้าว. หนึ่ง.

โดยการเปรียบเทียบกับฟังก์ชันการกระจายของตัวแปรสุ่ม คุณสามารถตั้งค่าฟังก์ชันบางอย่าง ความถี่สัมพัทธ์ของเหตุการณ์ X x.

คำจำกัดความ 15.1.ฟังก์ชันการกระจายตัวอย่าง (เชิงประจักษ์)เรียกใช้ฟังก์ชัน F* (x) ซึ่งกำหนดสำหรับแต่ละค่า Xความถี่สัมพัทธ์ของเหตุการณ์ X x. ทางนี้,

, (15.1)

ที่ไหน พี X– จำนวนตัวเลือก เล็กลง X, พีคือขนาดตัวอย่าง
ความคิดเห็นแตกต่างจากฟังก์ชันการแจกแจงเชิงประจักษ์ที่พบในเชิงประจักษ์ ฟังก์ชันการกระจาย F(x) ของประชากรทั่วไปเรียกว่า ฟังก์ชันการกระจายทางทฤษฎี. F(x) กำหนดความน่าจะเป็นของเหตุการณ์ X x, แ F* (x) คือความถี่สัมพัทธ์ สำหรับขนาดใหญ่เพียงพอ พีจากทฤษฎีบทเบอร์นูลลี ดังนี้ F* (x) มีแนวโน้มที่จะ F(x).

จากนิยามของฟังก์ชันการแจกแจงเชิงประจักษ์จะเห็นได้ว่าคุณสมบัติของมันตรงกับคุณสมบัติ F(x) กล่าวคือ:


  1. 0 ≤F* (x) ≤ 1.

  2. F* (x) เป็นฟังก์ชันที่ไม่ลดลง

  3. ถ้า X 1 คือตัวเลือกที่เล็กที่สุดแล้ว F* (x) = 0 สำหรับ XXหนึ่ง ; ถ้า X ถึง เป็นตัวเลือกที่ใหญ่ที่สุดแล้ว F* (x) = 1 สำหรับ X> X ถึง .
สำหรับคุณสมบัติต่อเนื่อง ภาพประกอบกราฟิกคือ แผนภูมิแท่งนั่นคือ รูปขั้นบันไดที่ประกอบด้วยสี่เหลี่ยมที่มีฐานเป็นช่วงระยะเวลาบางส่วน ชม.และส่วนสูง ส่วนความยาว ผม / ชม.(ฮิสโตแกรมความถี่) หรือ w ผม / ชม. (ฮิสโตแกรมของความถี่สัมพัทธ์) ในกรณีแรก พื้นที่ของฮิสโตแกรมจะเท่ากับขนาดตัวอย่าง ในกรณีที่สอง จะเท่ากับหนึ่ง (รูปที่ 2) รูปที่ 2

บรรยาย 16

ลักษณะเชิงตัวเลขของการแจกแจงทางสถิติ: ค่าเฉลี่ยตัวอย่าง การประมาณค่าความแปรปรวน การประมาณแบบโหมดและค่ามัธยฐาน การประมาณโมเมนต์เริ่มต้นและโมเมนต์ศูนย์กลาง คำอธิบายทางสถิติและการคำนวณค่าประมาณสำหรับพารามิเตอร์ของเวกเตอร์สุ่มสองมิติ
งานหนึ่งของสถิติทางคณิตศาสตร์คือการประมาณค่าของลักษณะเชิงตัวเลขของตัวแปรสุ่มภายใต้การศึกษาตามตัวอย่างที่มีอยู่

คำจำกัดความ 16.1ค่าเฉลี่ยตัวอย่างเรียกว่า ค่าเฉลี่ยเลขคณิตของค่าตัวแปรสุ่มที่ถ่ายในตัวอย่าง:

, (16.1)

ที่ไหน x ผม- ตัวเลือก, ผม- ความถี่

ความคิดเห็นค่าเฉลี่ยตัวอย่างใช้เพื่อประมาณการคาดหมายทางคณิตศาสตร์ของตัวแปรสุ่มที่กำลังศึกษา คำถามที่ว่าการประมาณการดังกล่าวจะแม่นยำเพียงใดในภายหลัง

คำจำกัดความ 16.2ความแปรปรวนตัวอย่างเรียกว่า

, (16.2)

เอ ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

(16.3)

เช่นเดียวกับในทฤษฎีตัวแปรสุ่ม เราสามารถพิสูจน์ได้ว่าสูตรต่อไปนี้ใช้ได้สำหรับการคำนวณความแปรปรวนตัวอย่าง:

. (16.4)

ตัวอย่างที่ 1 ลองหาคุณสมบัติเชิงตัวเลขของตัวอย่างที่กำหนดโดยอนุกรมทางสถิติ


x ผม

2

5

7

8

ผม

3

8

7

2

ลักษณะอื่นๆ ของชุดรูปแบบแปรผันคือ:

- แฟชั่นเอ็ม 0 - ตัวแปรที่มีความถี่สูงสุด (ในตัวอย่างที่แล้ว เอ็ม 0 = 5).

- ค่ามัธยฐานt อี - ตัวแปรที่แบ่งชุดการเปลี่ยนแปลงออกเป็นสองส่วนเท่ากับจำนวนตัวแปร หากตัวเลือกตัวเลขเป็นเลขคี่ ( = 2k+ 1) จากนั้น อี = x k + 1 และแม้กระทั่ง = 2k
. โดยเฉพาะในตัวอย่าง 1

ค่าประมาณของโมเมนต์เริ่มต้นและโมเมนต์ศูนย์กลาง (โมเมนต์เชิงประจักษ์ที่เรียกว่าโมเมนต์) ถูกกำหนดในทำนองเดียวกันกับโมเมนต์เชิงทฤษฎีที่เกี่ยวข้องกัน:

- ช่วงเวลาเชิงประจักษ์เริ่มต้นของการสั่งซื้อk เรียกว่า

. (16.5)

โดยเฉพาะอย่างยิ่ง,
นั่นคือ โมเมนต์เชิงประจักษ์เริ่มต้นของคำสั่งแรกเท่ากับค่าเฉลี่ยตัวอย่าง

- โมเมนต์เชิงประจักษ์กลางของการสั่งซื้อk เรียกว่า

. (16.6)

โดยเฉพาะอย่างยิ่ง,
นั่นคือ โมเมนต์เชิงประจักษ์จากส่วนกลางอันดับสอง เท่ากับความแปรปรวนตัวอย่าง
คำอธิบายทางสถิติและการคำนวณคุณสมบัติ

เวกเตอร์สุ่มสองมิติ
ในการศึกษาทางสถิติของตัวแปรสุ่มสองมิติ งานหลักมักจะระบุความสัมพันธ์ระหว่างส่วนประกอบ

ตัวอย่างสองมิติคือชุดของค่าเวกเตอร์สุ่ม: ( X 1 , ที่ 1), (X 2 , ที่ 2), …, (X พี , y พี). สำหรับมัน คุณสามารถกำหนดค่าเฉลี่ยตัวอย่างของส่วนประกอบได้:

และความแปรปรวนตัวอย่างที่สอดคล้องกันและส่วนเบี่ยงเบนมาตรฐาน นอกจากนี้ยังสามารถคำนวณ ค่าเฉลี่ยตามเงื่อนไข: - ค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ Yที่สอดคล้องกัน X = x, และ - ค่าเฉลี่ยของค่าที่สังเกตได้ Xที่สอดคล้องกัน Y = y.

หากมีการพึ่งพาอาศัยกันระหว่างองค์ประกอบของตัวแปรสุ่มสองมิติก็อาจมีรูปแบบที่แตกต่างกัน: การพึ่งพาอาศัยกันตามหน้าที่ ถ้าแต่ละค่าที่เป็นไปได้ Xตรงกับหนึ่งค่า Yและทางสถิติซึ่งการเปลี่ยนแปลงในปริมาณหนึ่งนำไปสู่การเปลี่ยนแปลงในการกระจายของอีกปริมาณหนึ่ง หากในเวลาเดียวกัน อันเป็นผลมาจากการเปลี่ยนแปลงในค่าหนึ่ง ค่าเฉลี่ยของการเปลี่ยนแปลงอื่นๆ การขึ้นต่อกันทางสถิติระหว่างค่าทั้งสองจะเรียกว่าสหสัมพันธ์

บรรยาย 17

คุณสมบัติหลักของลักษณะทางสถิติของพารามิเตอร์การกระจาย: ความเป็นกลาง, ความสม่ำเสมอ, ประสิทธิภาพ ความเป็นกลางและความสม่ำเสมอของค่าเฉลี่ยกลุ่มตัวอย่างเป็นค่าประมาณการคาดหมายทางคณิตศาสตร์ ตัวอย่างอคติความแปรปรวน ตัวอย่างของการประมาณค่าความแปรปรวนที่ไม่เอนเอียง การประมาณการที่ไม่เอนเอียงแบบไม่แสดงอาการ วิธีการสร้างประมาณการ: วิธีความน่าจะเป็นสูงสุด วิธีโมเมนต์ วิธีควอนไทล์ วิธีกำลังสองน้อยที่สุด วิธีเบย์เซียนเพื่อให้ได้ค่าประมาณ
เมื่อได้รับค่าประมาณทางสถิติของพารามิเตอร์การกระจาย (ค่าเฉลี่ยตัวอย่าง ความแปรปรวนตัวอย่าง ฯลฯ) คุณต้องตรวจสอบให้แน่ใจว่าพารามิเตอร์เหล่านี้ทำหน้าที่เป็นค่าประมาณของลักษณะที่เกี่ยวข้องของประชากรทั่วไปอย่างเพียงพอ เรากำหนดข้อกำหนดที่ต้องปฏิบัติตามในกรณีนี้

ให้ Θ* เป็นค่าประมาณทางสถิติของพารามิเตอร์ที่ไม่รู้จัก Θ ของการแจกแจงทางทฤษฎี เราแยกตัวอย่างจากประชากรทั่วไปหลายตัวอย่างที่มีขนาดเท่ากัน พีและคำนวณค่าประมาณของพารามิเตอร์ Θ สำหรับแต่ละรายการ:
จากนั้นค่าประมาณ Θ* ก็ถือได้ว่าเป็นตัวแปรสุ่มที่ใช้ค่าที่เป็นไปได้ เอ็ม(Θ*) >Θ และมีข้อเสียถ้า เอ็ม(Θ*) M (Θ*) = Θ
คำจำกัดความ 17.2ค่าประมาณทางสถิติ Θ* เรียกว่า ไม่ลำเอียงหากการคาดหมายทางคณิตศาสตร์เท่ากับพารามิเตอร์โดยประมาณ Θ สำหรับขนาดตัวอย่างใดๆ:

เอ็ม(Θ*) = Θ (17.1)

พลัดถิ่นเรียกว่าการประมาณการ การคาดหมายทางคณิตศาสตร์ซึ่งไม่เท่ากับค่าพารามิเตอร์ที่ประมาณการไว้

อย่างไรก็ตาม ความเป็นกลางไม่ใช่เงื่อนไขเพียงพอสำหรับการประมาณค่าจริงของพารามิเตอร์ที่ประมาณไว้ได้ดี หากในกรณีนี้ ค่าที่เป็นไปได้ของ Θ* อาจเบี่ยงเบนไปจากค่าเฉลี่ยอย่างมีนัยสำคัญ กล่าวคือ ความแปรปรวนของ Θ* มีขนาดใหญ่ ค่าที่พบจากข้อมูลของกลุ่มตัวอย่างหนึ่งอาจแตกต่างอย่างมากจากค่าพารามิเตอร์โดยประมาณ . ดังนั้นจึงจำเป็นต้องกำหนดข้อจำกัดเกี่ยวกับความแปรปรวน
คำจำกัดความ 17.2การประเมินทางสถิติเรียกว่า มีประสิทธิภาพหากเป็นขนาดตัวอย่างที่กำหนด พีมีความแปรปรวนน้อยที่สุด
เมื่อพิจารณาตัวอย่างที่มีปริมาณมาก การประมาณการทางสถิติก็ขึ้นอยู่กับข้อกำหนดของความสม่ำเสมอด้วย
คำจำกัดความ 17.3ร่ำรวยเรียกว่าประมาณการทางสถิติซึ่ง พี→∞มีแนวโน้มความน่าจะเป็นต่อพารามิเตอร์โดยประมาณ (หากการประมาณนี้ไม่เอนเอียงก็จะสอดคล้องกันหาก พี→∞ ความแปรปรวนมีแนวโน้มเป็น 0)
รับรองว่า เป็นการประมาณการที่เป็นกลางของความคาดหวัง เอ็ม(X).

เราจะพิจารณาว่าเป็นตัวแปรสุ่มและ X 1 , X 2 ,…, X พีกล่าวคือ ค่าของตัวแปรสุ่มภายใต้การศึกษาที่ประกอบขึ้นเป็นกลุ่มตัวอย่าง – เป็นตัวแปรสุ่มที่กระจายอย่างอิสระและเหมือนกัน X 1 , X 2 ,…, X พี, มีความคาดหวังทางคณิตศาสตร์ เอ. จากคุณสมบัติของการคาดหมายทางคณิตศาสตร์ว่า

แต่เนื่องจากแต่ละปริมาณ X 1 , X 2 ,…, X พี มีการกระจายตัวแบบเดียวกับประชากรทั่วไป เอ = เอ็ม(X), นั่นคือ เอ็ม(
) = เอ็ม(X) ซึ่งต้องพิสูจน์ ค่าเฉลี่ยตัวอย่างไม่ได้เป็นเพียงค่ากลางเท่านั้น แต่ยังเป็นการประมาณการคาดหมายทางคณิตศาสตร์ที่สอดคล้องกันอีกด้วย ถ้าสมมุติว่า X 1 , X 2 ,…, X พีมีความแปรปรวน จำกัด จากนั้นจากทฤษฎีบท Chebyshev ที่ค่าเฉลี่ยเลขคณิตของพวกเขานั่นคือด้วยการเพิ่มขึ้น พีมีแนวโน้มที่จะเป็นความคาดหวังทางคณิตศาสตร์ เอแต่ละค่าของพวกเขา นั่นคือ ถึง เอ็ม(X). ดังนั้น ค่าเฉลี่ยของกลุ่มตัวอย่างจึงเป็นค่าประมาณการคาดหมายทางคณิตศาสตร์ที่สอดคล้องกัน

ไม่เหมือนกับค่าเฉลี่ยตัวอย่าง ความแปรปรวนตัวอย่างเป็นการประมาณค่าความแปรปรวนของประชากรแบบเอนเอียง สามารถพิสูจน์ได้ว่า

, (17.2)

ที่ไหน ดี G คือค่าที่แท้จริงของความแปรปรวนประชากร เราสามารถเสนอค่าความแปรปรวนอื่นได้โดยประมาณ - แก้ไขความแปรปรวน ² คำนวณโดยสูตร

. (17.3)

การประมาณการดังกล่าวจะเป็นกลาง มันสอดคล้องกับ แก้ไขค่าเบี่ยงเบนมาตรฐาน

. (17.4)

คำจำกัดความ 17.4ค่าประมาณของคุณสมบัติบางอย่างเรียกว่า ไม่เอนเอียงอย่างไม่มีอาการ, ถ้าสำหรับตัวอย่าง X 1 , X 2 , …, X พี

, (17.5)

ที่ไหน Xคือมูลค่าที่แท้จริงของปริมาณที่ตรวจสอบ
วิธีการสร้างประมาณการ
1. วิธีความน่าจะเป็นสูงสุด
อนุญาต Xเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งส่งผลให้ พีการทดสอบเอาค่า X 1 , X 2 , …, X พี. สมมติว่าเรารู้กฎการกระจายของปริมาณนี้ ซึ่งกำหนดโดยพารามิเตอร์ Θ แต่ไม่ทราบค่าตัวเลขของพารามิเตอร์นี้ ให้เราหาค่าประมาณจุดของมัน

อนุญาต R(X ผม, Θ) คือความน่าจะเป็นที่ค่า Xจะรับเอาความหมาย X ผม. โทรมาเลย ฟังก์ชันความน่าจะเป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง Xหน้าที่ของอาร์กิวเมนต์ Θ กำหนดโดยสูตร:

หลี่ (X 1 , X 2 , …, X พี ; Θ) = พี(x 1 ,Θ) พี(x 2 ,Θ)… พี(x ,Θ).

จากนั้น จากการประมาณค่าจุดของพารามิเตอร์ Θ ค่าของ Θ* = Θ( X 1 , X 2 , …, X พี) ซึ่งฟังก์ชันความน่าจะเป็นถึงค่าสูงสุด ค่าประมาณ Θ* เรียกว่า ค่าประมาณความน่าจะเป็นสูงสุด.

ตั้งแต่หน้าที่ หลี่และ ln หลี่ถึงค่าสูงสุดที่ค่าเดียวกันของ Θ จะสะดวกกว่าในการค้นหาค่า ln . สูงสุด หลี่ฟังก์ชันบันทึกความเป็นไปได้. สำหรับสิ่งนี้คุณต้อง:


ข้อดีของวิธีความน่าจะเป็นสูงสุด: ค่าประมาณที่ได้รับมีความสอดคล้องกัน (แม้ว่าจะสามารถมีความเอนเอียงได้) การกระจายแบบไม่มีซีมโทติคตามปกติสำหรับค่าขนาดใหญ่ พีและมีค่าความแปรปรวนน้อยที่สุดเมื่อเทียบกับค่าประมาณปกติที่ไม่มีซีมโทติคอื่นๆ หากพารามิเตอร์โดยประมาณ Θ มีการประมาณการที่มีประสิทธิภาพ Θ* สมการความน่าจะเป็นจะมีคำตอบเฉพาะ Θ*; วิธีการนี้ใช้ข้อมูลตัวอย่างได้อย่างสมบูรณ์ที่สุด และดังนั้นจึงมีประโยชน์อย่างยิ่งในกรณีของตัวอย่างขนาดเล็ก

ข้อเสียของวิธีความเป็นไปได้สูงสุด: ความซับซ้อนของการคำนวณ
สำหรับตัวแปรสุ่มต่อเนื่องที่มีความหนาแน่นของการแจกแจงที่รู้จัก (x) และพารามิเตอร์ที่ไม่รู้จัก Θ ฟังก์ชันความน่าจะเป็นมีรูปแบบ:

หลี่ (X 1 , X 2 , …, X พี ; Θ) = (x 1 ,Θ) (x 2 ,Θ)… (x ,Θ).

การประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์ที่ไม่รู้จักจะดำเนินการในลักษณะเดียวกับตัวแปรสุ่มแบบไม่ต่อเนื่อง
2. วิธีการของช่วงเวลา
วิธีการของโมเมนต์ขึ้นอยู่กับข้อเท็จจริงที่ว่าโมเมนต์เชิงประจักษ์เริ่มต้นและกลางเป็นค่าประมาณที่สอดคล้องกันของโมเมนต์เชิงทฤษฎีเริ่มต้นและกลางตามลำดับ ดังนั้น เราสามารถเทียบโมเมนต์เชิงทฤษฎีกับโมเมนต์เชิงประจักษ์ที่สอดคล้องกันของลำดับเดียวกันได้

หากระบุประเภทของความหนาแน่นของการกระจาย (x, Θ) กำหนดโดยพารามิเตอร์ที่ไม่รู้จักหนึ่งตัว Θ จากนั้นประมาณค่าพารามิเตอร์นี้ ก็เพียงพอแล้วที่จะมีสมการเดียว ตัวอย่างเช่น เราสามารถเทียบช่วงเวลาเริ่มต้นของลำดับแรกได้:

,

จึงได้สมการในการหา Θ คำตอบของ Θ* จะเป็นค่าประมาณจุดของพารามิเตอร์ ซึ่งเป็นฟังก์ชันของค่าเฉลี่ยตัวอย่างและด้วยเหตุนี้ของตัวอย่าง:

Θ = ψ ( X 1 , X 2 , …, X พี).

ถ้าทราบรูปแบบความหนาแน่นการกระจาย (x, Θ 1 , Θ 2) ถูกกำหนดโดยพารามิเตอร์ที่ไม่รู้จักสองตัว Θ 1 และ Θ 2 จากนั้นจึงต้องใช้สองสมการ เช่น

วี 1 = เอ็ม 1 , μ 2 = t 2 .

จากที่นี่
- ระบบสมการสองสมการที่ไม่ทราบค่าสองตัว Θ 1 และ Θ 2 . การแก้ปัญหาคือการประมาณการแบบจุด Θ 1 * และ Θ 2 * - ฟังก์ชันของตัวเลือกการสุ่มตัวอย่าง:

Θ 1 = ψ 1 ( X 1 , X 2 , …, X พี),

Θ 2 = ψ 2 ( X 1 , X 2 , …, X พี).
3. วิธีการกำลังสองน้อยที่สุด

หากจำเป็นต้องประเมินการพึ่งพาปริมาณ ที่และ Xและรูปแบบของฟังก์ชันที่เชื่อมต่อกันนั้นเป็นที่รู้จัก แต่ค่าของสัมประสิทธิ์ที่รวมอยู่ในนั้นไม่เป็นที่รู้จัก ค่าของพวกมันสามารถประมาณได้จากตัวอย่างที่มีอยู่โดยใช้วิธีกำลังสองน้อยที่สุด สำหรับฟังก์ชั่นนี้ ที่ = φ ( X) ถูกเลือกเพื่อให้ผลรวมของค่าเบี่ยงเบนกำลังสองของค่าที่สังเกตได้ ที่ 1 , ที่ 2 ,…, ที่ พีจาก φ( X ผม) น้อยที่สุด:

ในกรณีนี้ จำเป็นต้องหาจุดคงที่ของฟังก์ชัน φ( x; เอ, , ) นั่นคือแก้ระบบ:

(แน่นอนว่าการแก้ปัญหาเป็นไปได้เฉพาะในกรณีที่ทราบรูปแบบเฉพาะของฟังก์ชัน φ)

พิจารณาตัวอย่าง การเลือกพารามิเตอร์ของฟังก์ชันเชิงเส้นโดยวิธีกำลังสองน้อยที่สุด

เพื่อประเมินค่าพารามิเตอร์ เอและ ในการทำงาน y = ขวาน + , หา
แล้ว
. จากที่นี่
. หารสมการผลลัพธ์ทั้งสองด้วย พีและจำคำจำกัดความของโมเมนต์เชิงประจักษ์ เราสามารถได้รับสำนวนสำหรับ เอและ เช่น:

. ดังนั้นความสัมพันธ์ระหว่าง Xและ ที่สามารถกำหนดได้ในรูปแบบ:


4. แนวทางเบย์เซียนในการรับค่าประมาณ
อนุญาต ( Y, X) เป็นเวกเตอร์สุ่มที่ทราบความหนาแน่น R(ที่|x) การกระจายแบบมีเงื่อนไข Yทุกค่า X = x. หากเป็นผลจากการทดลองเพียงค่า Yและค่าที่สอดคล้องกัน Xไม่ทราบ แล้วจึงประมาณค่าฟังก์ชันที่กำหนด φ( X) เป็นค่าโดยประมาณ เสนอให้มองหาการคาดหมายทางคณิตศาสตร์แบบมีเงื่อนไข เอ็ม (φ‌‌( X)‌‌‌‌‌‌|Y) คำนวณโดยสูตร:

, ที่ไหน , R(X X, q(y) คือความหนาแน่นของการแจกแจงแบบไม่มีเงื่อนไข Y. ปัญหาแก้ได้ก็ต่อเมื่อรู้แล้ว R(X). อย่างไรก็ตาม บางครั้ง เป็นไปได้ที่จะสร้างค่าประมาณที่สอดคล้องกันสำหรับ q(y) ซึ่งขึ้นอยู่กับค่าที่ได้รับในตัวอย่างเท่านั้น Y.

บรรยาย 18

การประมาณค่าช่วงเวลาของพารามิเตอร์ที่ไม่รู้จัก ความแม่นยำในการประมาณค่า ความน่าจะเป็นของความมั่นใจ (ความน่าเชื่อถือ) ช่วงความเชื่อมั่น การสร้างช่วงความเชื่อมั่นสำหรับการประมาณการคาดหมายทางคณิตศาสตร์ของการแจกแจงแบบปกติที่มีความแปรปรวนที่ทราบและไม่ทราบ ช่วงความเชื่อมั่นสำหรับการประมาณค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติ
เมื่อสุ่มตัวอย่างในปริมาณน้อย การประมาณแบบจุดอาจแตกต่างอย่างมากจากพารามิเตอร์ที่ประมาณการ ซึ่งนำไปสู่ข้อผิดพลาดโดยรวม ดังนั้นในกรณีนี้จึงควรใช้ ประมาณการตามช่วงเวลากล่าวคือระบุช่วงเวลาที่ค่าที่แท้จริงของพารามิเตอร์โดยประมาณตกอยู่กับความน่าจะเป็นที่กำหนด แน่นอนว่า ยิ่งช่วงเวลานี้สั้นลงเท่าใด การประมาณค่าพารามิเตอร์ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น ดังนั้น หากค่าประมาณ Θ* ของพารามิเตอร์บางตัว Θ ตรงกับความไม่เท่าเทียมกัน | Θ* - Θ | 0 ลักษณะ ความแม่นยำในการประมาณค่า(ยิ่ง δ เล็กลง การประมาณการที่แม่นยำยิ่งขึ้น) แต่วิธีการทางสถิติทำให้เราพูดได้เพียงว่าความไม่เท่าเทียมกันนี้มีความพอใจกับความน่าจะเป็นที่แน่นอน

คำจำกัดความ 18.1.ความน่าเชื่อถือ (ความน่าจะเป็นของความมั่นใจ) ค่าประมาณ Θ* ของพารามิเตอร์ Θ คือความน่าจะเป็น γ ที่อสมการ | Θ* - Θ |
พี (Θ* - δ
ดังนั้น γ คือความน่าจะเป็นที่ Θ อยู่ในช่วง (Θ* - δ, Θ* + δ)

คำจำกัดความ 18.2ที่เชื่อถือคือช่วงเวลาที่พารามิเตอร์ที่ไม่รู้จักตกอยู่กับความเชื่อถือได้ที่กำหนด γ
การสร้างช่วงความเชื่อมั่น
1. ช่วงความเชื่อมั่นสำหรับการประมาณการคาดหมายทางคณิตศาสตร์ของการแจกแจงแบบปกติที่มีความแปรปรวนที่ทราบ

ให้ตัวแปรสุ่มภายใต้การศึกษา Xกระจายตามกฎปกติที่มีค่าเฉลี่ยกำลังสอง σ และจำเป็นต้องประมาณการคาดหมายทางคณิตศาสตร์ด้วยค่าของค่าเฉลี่ยตัวอย่าง เอ. เราจะพิจารณาค่าเฉลี่ยตัวอย่างเป็นตัวแปรสุ่ม และค่าตัวแปรตัวอย่าง X 1 , X 2 ,…, X พีเป็นตัวแปรสุ่มอิสระแบบกระจายเท่าๆ กัน X 1 , X 2 ,…, X พีซึ่งแต่ละอันมีความคาดหวังทางคณิตศาสตร์ เอและค่าเบี่ยงเบนมาตรฐาน σ โดยที่ เอ็ม() = เอ,
(เราใช้คุณสมบัติของการคาดหมายทางคณิตศาสตร์และความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระ) ให้เราประมาณความน่าจะเป็นของการเติมเต็มความไม่เท่าเทียมกัน
. เราใช้สูตรสำหรับความน่าจะเป็นของตัวแปรสุ่มแบบกระจายตามปกติซึ่งอยู่ในช่วงที่กำหนด:

R (
) = 2Ф
. แล้วคำนึงถึงความจริงที่ว่า R() = 2Ф
=

2F( t), ที่ไหน
. จากที่นี่
และความเท่าเทียมกันก่อนหน้านี้สามารถเขียนใหม่เป็น:

. (18.1)

ดังนั้น ค่าของความคาดหวังทางคณิตศาสตร์ เอด้วยความน่าจะเป็น (ความน่าเชื่อถือ) γ ตกอยู่ในช่วงเวลา
โดยที่ค่า tถูกกำหนดจากตารางสำหรับฟังก์ชัน Laplace เพื่อให้ความเท่าเทียมกัน 2F( t) = γ.
ตัวอย่าง. หาช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบกระจายปกติถ้าขนาดกลุ่มตัวอย่าง พี = 49,
σ = 1.4 และระดับความเชื่อมั่น γ = 0.9

มากำหนดกัน tโดยที่ F( t) = 0,9:2 = 0,45: t= 1.645. แล้ว

หรือ 2.471 a ที่มีความน่าเชื่อถือ 0.9
2. ช่วงความเชื่อมั่นสำหรับการประมาณการคาดหมายทางคณิตศาสตร์ของการแจกแจงแบบปกติโดยมีค่าความแปรปรวนที่ไม่ทราบค่า

ถ้ารู้ว่าตัวแปรสุ่มภายใต้การศึกษา Xกระจายตามกฎปกติโดยมีค่าเบี่ยงเบนมาตรฐานที่ไม่รู้จัก จากนั้นเพื่อหาช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ เราจะสร้างตัวแปรสุ่มใหม่

, (18.2)

ที่ไหน - ค่าเฉลี่ยตัวอย่าง คือความแปรปรวนที่แก้ไขแล้ว พีคือขนาดตัวอย่าง ตัวแปรสุ่มนี้ ค่าที่เป็นไปได้จะแสดงแทน t, มีการแจกจ่ายนักเรียน (ดูบทที่ 12) กับ k = - 1 องศาอิสระ

เนื่องจากความหนาแน่นของการกระจายตัวของนักเรียน
, ที่ไหน
, ไม่ได้ขึ้นอยู่กับ .อย่างชัดเจน เอและ σ คุณสามารถตั้งค่าความน่าจะเป็นที่จะตกในช่วงเวลาหนึ่งได้ (- t γ , t γ ) โดยคำนึงถึงความสม่ำเสมอของความหนาแน่นของการกระจายดังนี้
. จากที่นี่เราได้รับ:

(18.3)

ดังนั้น ช่วงความเชื่อมั่นสำหรับ เอ, ที่ไหน t γ สามารถพบได้ในตารางที่สอดคล้องกันสำหรับให้ พีและกรัม

ตัวอย่าง. ให้ขนาดตัวอย่าง พี = 25, = 3, = 1.5. หาช่วงความเชื่อมั่นสำหรับ เอที่ γ = 0.99 จากตารางจะพบว่า t γ (พี= 25, γ = 0.99) = 2.797 แล้ว
หรือ 2.161a ด้วยความน่าจะเป็น 0.99
3. ช่วงความเชื่อมั่นในการประมาณค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติ

สำหรับค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มแบบกระจายปกติ เราจะมองหาช่วงความเชื่อมั่นของแบบฟอร์ม ( – δ, ), ที่ไหน คือค่าเบี่ยงเบนมาตรฐานของตัวอย่างที่แก้ไขแล้ว และสำหรับ δ จะเป็นไปตามเงื่อนไขต่อไปนี้: พี (|σ – |
เราเขียนความไม่เท่าเทียมกันนี้ในรูปแบบ:
หรือหมายถึง
,

พิจารณาตัวแปรสุ่ม χ ที่กำหนดโดยสูตร

,

ซึ่งแจกจ่ายตามกฎหมายไคสแควร์ด้วย พี-1 องศาอิสระ (ดูการบรรยาย 12) ความหนาแน่นของการกระจาย

ไม่ขึ้นกับค่าพารามิเตอร์โดยประมาณ σ แต่ขึ้นกับขนาดกลุ่มตัวอย่างเท่านั้น พี. ให้เราแปลงความไม่เท่าเทียมกัน (18.4) ให้อยู่ในรูป χ 1 เราถือว่า q

,

หรือหลังจากคูณด้วย
,
. เพราะเหตุนี้,
. แล้ว
มีตารางสำหรับการแจกแจงไคสแควร์จากที่หาได้ qตามที่ให้ไว้ พีและ γ โดยไม่แก้สมการนี้ ดังนั้น เมื่อคำนวณจากค่าตัวอย่างแล้ว ค่า และกำหนดจากตารางค่า qสามารถหาช่วงความเชื่อมั่น (18.4) ซึ่งค่า σ ตกอยู่กับความน่าจะเป็น γ
ความคิดเห็นถ้า q> 1 ดังนั้น เมื่อคำนึงถึงเงื่อนไข σ > 0 ช่วงความเชื่อมั่นสำหรับ σ จะมีขอบเขต

. (18.5)

อนุญาต พี = 20, = 1.3. ให้เราหาช่วงความเชื่อมั่นสำหรับ σ สำหรับความเชื่อถือได้ที่กำหนด γ = 0.95 จากตารางที่เกี่ยวข้องเราพบว่า q (= 20, γ = 0.95) = 0.37 ดังนั้น ขอบเขตของช่วงความเชื่อมั่น: 1.3(1-0.37) = 0.819 และ 1.3(1+0.37) = 1.781 ดังนั้น 0.819

เราดำเนินการพิสูจน์นี้ในสองขั้นตอน ก่อนอื่นให้เราถือว่ามี และสังเกตว่าในกรณีนี้ D(Sn) โดยทฤษฎีการกระจายผลรวม ตามความไม่เท่าเทียมกันของ Chebyshev สำหรับ t > 0 . ใด ๆ

สำหรับ t > n ด้านซ้ายจะน้อยกว่า และค่าหลังมีแนวโน้มเป็นศูนย์ เสร็จสิ้นส่วนแรกของการพิสูจน์

ตอนนี้เราละทิ้งเงื่อนไขจำกัดสำหรับการมีอยู่ของ D() กรณีนี้ลดลงเป็นกรณีก่อนหน้าโดยการตัดทอน

เรากำหนดตัวแปรสุ่มใหม่สองชุดขึ้นอยู่กับดังนี้:

คุณ k =, V k =0, ถ้า (2.2)

คุณ k =0, V k = if

ที่นี่ k=1,… , n และได้รับการแก้ไข แล้ว

สำหรับเคทั้งหมด

ให้ (f(j)) เป็นการกระจายความน่าจะเป็นของตัวแปรสุ่ม (เหมือนกันสำหรับ j ทั้งหมด) เราได้สันนิษฐานว่า = M() มีอยู่ ดังนั้นผลรวม

จำกัด แล้วมี

โดยที่ผลรวมจะถูกดำเนินการกับ j ทั้งหมดนั้น โปรดทราบว่าถึงแม้ว่ามันจะขึ้นอยู่กับ n แต่ก็เหมือนกันสำหรับ

คุณ 1 , คุณ 2, ..., คุณ n . นอกจากนี้, สำหรับและ, ด้วยเหตุนี้, สำหรับโดยพลการ > 0 และทั้งหมดมีขนาดใหญ่เพียงพอ n

U k มีความเป็นอิสระซึ่งกันและกัน และด้วยผลรวม U 1 +U 2 +…+U n คุณสามารถทำได้เหมือนกับ X k ในกรณีของความแปรปรวนจำกัด โดยใช้อสมการ Chebyshev เราจะได้ (2.1)


เนื่องจาก (2.6) นี่หมายความว่า

เนื่องจากอนุกรม (2.4) มาบรรจบกัน ผลรวมสุดท้ายมีแนวโน้มที่จะเป็นศูนย์เมื่อ n เพิ่มขึ้น ดังนั้นสำหรับ n . ที่มีขนาดใหญ่เพียงพอ

และดังนั้นจึง

P(V 1 +…+V n 0). (2.12)

แต่จาก (2.9) และ (2.12) เราได้รับ

เนื่องจากและเป็นแบบอำเภอใจ ด้านขวามือจึงทำให้มีขนาดเล็กตามอำเภอใจได้ ซึ่งทำให้การพิสูจน์สมบูรณ์

ทฤษฎีเกม "ไร้อันตราย"

ในการวิเคราะห์เพิ่มเติมเกี่ยวกับแก่นแท้ของกฎหมายจำนวนมาก เราจะใช้คำศัพท์ดั้งเดิมของผู้เล่น แม้ว่าการพิจารณาของเรายอมรับการใช้งานที่จริงจังกว่าเท่าๆ กัน และสมมติฐานหลักสองข้อของเรานั้นเป็นจริงในสถิติและฟิสิกส์มากกว่าในการพนัน ขั้นแรก สมมติว่าผู้เล่นมีทุนไม่จำกัด ดังนั้นจึงไม่มีการสูญเสียใดที่จะทำให้เกมจบลงได้ (การละทิ้งข้อสันนิษฐานนี้นำไปสู่ปัญหาความหายนะของผู้เล่น ซึ่งมักจะทำให้นักเรียนสนใจเรื่องความน่าจะเป็น) ประการที่สอง สมมติว่าผู้เล่นไม่มีสิทธิ์ที่จะขัดจังหวะเกมตามที่เขาพอใจ: จำนวน n ของการทดลองจะต้องได้รับการแก้ไขล่วงหน้าและ จะต้องไม่ขึ้นอยู่กับการย้ายเกมส์ มิฉะนั้น ผู้เล่นที่พอใจกับทุนไม่จำกัด จะรอความสำเร็จเป็นชุดและจะหยุดเกมในเวลาที่เหมาะสม ผู้เล่นดังกล่าวไม่สนใจความผันผวนที่น่าจะเป็นในช่วงเวลาที่กำหนด แต่ในความผันผวนสูงสุดในเกมชุดยาวซึ่งอธิบายโดยกฎของลอการิทึมแบบวนซ้ำมากกว่ากฎของตัวเลขจำนวนมาก

เราแนะนำตัวแปรสุ่ม k เป็นผลตอบแทน (บวกหรือลบ) สำหรับการทำซ้ำครั้งที่ k ของเกม จากนั้นผลรวม S n = 1 +…+ k คือผลตอบแทนทั้งหมดสำหรับการทำซ้ำ n เกม หากก่อนการทำซ้ำแต่ละครั้งผู้เล่นจ่ายค่าธรรมเนียม (ไม่จำเป็นต้องเป็นบวก) สำหรับสิทธิ์ในการเข้าร่วมในเกม ดังนั้น n คือค่าธรรมเนียมทั้งหมดที่จ่ายโดยเขา และ S n คือ n จำนวนเงินที่ชนะสุทธิทั้งหมด กฎของตัวเลขจำนวนมากใช้หากมี p=M(k) โดยรวม n มีความเป็นไปได้ค่อนข้างมากที่ความแตกต่าง S n -- จะดูเล็กน้อยเมื่อเทียบกับ n ดังนั้น ถ้าน้อยกว่า p ดังนั้นสำหรับ n มาก ผู้เล่นอาจมีลำดับของผลตอบแทน ด้วยเหตุผลเดียวกัน การบริจาคเกือบจะส่งผลให้เกิดการสูญเสียอย่างแน่นอน ในระยะสั้นโอกาสเป็นสิ่งที่ดีสำหรับผู้เล่นและโอกาสที่ไม่ดี

โปรดทราบว่าเรายังไม่ได้พูดอะไรเกี่ยวกับคดีนี้ ในกรณีนี้ ข้อสรุปที่เป็นไปได้เพียงอย่างเดียวคือสำหรับขนาดใหญ่เพียงพอ กำไรหรือขาดทุนรวมของ S n -- n จะมีโอกาสน้อยมากเมื่อเทียบกับ n แต่ไม่ทราบว่า S n -- n เป็นค่าบวกหรือค่าลบ กล่าวคือ ไม่ว่าเกมจะทำกำไรหรือเสียหาย สิ่งนี้ไม่ได้นำมาพิจารณาโดยทฤษฎีคลาสสิกซึ่งเรียกว่าราคาที่ไม่เป็นอันตรายและเกมที่มี "ความไม่เป็นอันตราย" คุณต้องเข้าใจว่าเกมที่ "ไม่เป็นอันตราย" สามารถทำกำไรได้อย่างชัดเจนและเสียหาย

เป็นที่ชัดเจนว่าใน "กรณีปกติ" นั้นไม่ได้มีแค่ M(k) แต่ยังมี D(k) ด้วย ในกรณีนี้ กฎของตัวเลขจำนวนมากเสริมด้วยทฤษฎีบทขีด จำกัด กลาง และอย่างหลังกล่าวอย่างน่าเชื่อถือว่าในเกมที่ "ไม่เป็นอันตราย" ผลตอบแทนสุทธิอันเป็นผลมาจากเกมยาว S n -- n จะเป็น ของลำดับของ n 1/2 และสำหรับจำนวนที่มากพอ n ผลตอบแทนนี้จะเป็นบวกหรือลบโดยมีโอกาสเท่ากันโดยประมาณ ดังนั้นหากใช้ทฤษฎีบทขีด จำกัด กลาง คำว่า "ไม่เป็นอันตราย" กลายเป็นเกมที่สมเหตุสมผลแม้ว่าในกรณีนี้เราจะจัดการกับทฤษฎีบท จำกัด ซึ่งเน้นโดยคำว่า "อันเป็นผลมาจากเกมยาว ." การวิเคราะห์อย่างระมัดระวังแสดงให้เห็นว่าการลู่เข้าใน (1.3) แย่ลงเมื่อความแปรปรวนเพิ่มขึ้น ถ้ามีขนาดใหญ่ การประมาณปกติจะมีผลกับ n ที่มีขนาดใหญ่มากเท่านั้น

เพื่อความชัดเจน ลองจินตนาการถึงเครื่องจักรที่โดยการลดรูเบิล ผู้เล่นสามารถชนะรูเบิล (10 - 1) โดยมีโอกาสเป็น 10 และในกรณีอื่น ๆ เขาสูญเสียรูเบิลที่ต่ำกว่า เรามีการทดลองเล่นของ Bernoulli และเกมนี้ "ไม่เป็นอันตราย" หลังจากทำการทดสอบมาแล้วนับล้านครั้ง ผู้เล่นจะต้องจ่ายเงินเป็นล้านรูเบิลสำหรับมัน ในช่วงเวลานี้ เขาสามารถชนะ 0, 1,2,... ครั้ง จากการประมาณแบบปัวซองสำหรับการแจกแจงทวินาม จนถึงทศนิยมสองสามตำแหน่ง ความน่าจะเป็นที่จะชนะ k ครั้งพอดีๆ จะเท่ากับ e -1 /k! ดังนั้น ด้วยความน่าจะเป็น 0.368 . . . ผู้เล่นจะสูญเสียหนึ่งล้านและด้วยความน่าจะเป็นเท่ากันเขาจะชดใช้ค่าใช้จ่ายของเขาเท่านั้น เขามีความน่าจะเป็นที่ 0.184... ที่จะได้รับหนึ่งล้านอย่างแน่นอน และต่อๆ ไป ในที่นี้ การทดลอง 10 6 ครั้งนั้นเทียบเท่ากับการทดลองหนึ่งครั้งในเกมการจ่ายผลตอบแทนปัวซอง

เห็นได้ชัดว่าการใช้กฎหมายจำนวนมากในสถานการณ์เช่นนี้ไม่มีประโยชน์ โครงการนี้รวมถึงการประกันภัยอัคคีภัย อุบัติเหตุทางรถยนต์ ฯลฯ มีความเสี่ยงจำนวนมาก แต่ความน่าจะเป็นที่เกี่ยวข้องกันนั้นน้อยมาก อย่างไรก็ตาม โดยปกติแล้วจะมีการทดลองหนึ่งครั้งต่อปี ดังนั้นจำนวนการทดลอง n ครั้งจะไม่มาก สำหรับผู้เอาประกันภัย เกมดังกล่าวไม่จำเป็นต้อง "ไม่เป็นอันตราย" เสมอไป แม้ว่าเกมจะทำกำไรได้ค่อนข้างดีในเชิงเศรษฐกิจ กฎของตัวเลขจำนวนมากไม่มีส่วนเกี่ยวข้องกับมัน สำหรับบริษัทประกันภัยนั้น มีเกมจำนวนมาก แต่เนื่องจากความแปรปรวนที่มาก ความผันผวนแบบสุ่มจึงยังคงปรากฏขึ้น ต้องกำหนดเบี้ยประกันเพื่อป้องกันการสูญเสียจำนวนมากในแต่ละปี ดังนั้น บริษัทจึงสนใจปัญหาความพังพินาศมากกว่ากฎหมายจำนวนมาก

เมื่อความแปรปรวนไม่มีที่สิ้นสุด คำว่า "ไม่เป็นอันตราย" กลายเป็นเกมไร้ความหมาย ไม่มีเหตุผลที่จะเชื่อได้ว่ากำไรสุทธิทั้งหมด S n -- n ผันผวนประมาณศูนย์ จริงๆ. มีตัวอย่างของเกมที่ "ไม่เป็นอันตราย" ซึ่งความน่าจะเป็นที่ผู้เล่นจะได้รับการสูญเสียสุทธิเป็นผลให้มีแนวโน้มหนึ่ง กฎของตัวเลขจำนวนมากระบุเพียงว่าการสูญเสียนี้จะมีลำดับความสำคัญน้อยกว่า n อย่างไรก็ตาม ไม่มีอะไรสามารถพูดได้มากกว่านี้ หาก n สร้างลำดับโดยพลการและ n / n0 คุณสามารถจัดเกมที่ "ไม่เป็นอันตราย" ซึ่งความน่าจะเป็นที่การสูญเสียสุทธิทั้งหมดเป็นผลมาจากการซ้ำซ้อนของเกม n ครั้งเกินกว่า n มีแนวโน้มที่จะเป็นหนึ่ง