ตัวแปรสุ่มอิสระ การดำเนินการกับตัวแปรสุ่ม

ในการแก้ปัญหาในทางปฏิบัติจำนวนมาก จำเป็นต้องทราบชุดของเงื่อนไข เนื่องจากผลของปัจจัยสุ่มจำนวนมากรวมกันนั้นเกือบจะไม่ขึ้นกับกรณีใดๆ เงื่อนไขเหล่านี้ได้อธิบายไว้ในหลายทฤษฎีบท ซึ่งเรียกรวมกันว่ากฎของตัวเลขจำนวนมาก โดยที่ตัวแปรสุ่ม k มีค่าเท่ากับ 1 หรือ 0 ขึ้นอยู่กับว่าผลของการทดลองครั้งที่ k นั้นสำเร็จหรือล้มเหลว ดังนั้น Sn คือผลรวมของตัวแปรสุ่มที่เป็นอิสระร่วมกัน n ตัว ซึ่งแต่ละตัวใช้ค่า 1 และ 0 ด้วยความน่าจะเป็น p และ q

รูปแบบที่ง่ายที่สุดของกฎจำนวนมากคือทฤษฎีบทของเบอร์นูลลี ซึ่งระบุว่าหากความน่าจะเป็นของเหตุการณ์เท่ากันในการทดลองทั้งหมด เมื่อจำนวนการทดลองเพิ่มขึ้น ความถี่ของเหตุการณ์ก็มีแนวโน้มที่จะมีความน่าจะเป็นของเหตุการณ์และ สิ้นสุดที่จะสุ่ม

ทฤษฎีบทปัวซองระบุว่าความถี่ของเหตุการณ์ในชุดของการทดลองอิสระมีแนวโน้มที่จะเป็นค่าเฉลี่ยเลขคณิตของความน่าจะเป็นและสิ้นสุดที่จะสุ่ม

ทฤษฎีบทจำกัดของทฤษฎีความน่าจะเป็น ทฤษฎีบทของ Moivre-Laplace อธิบายธรรมชาติของความเสถียรของความถี่ของการเกิดเหตุการณ์ ลักษณะนี้ประกอบด้วยการจำกัดการกระจายของจำนวนครั้งของเหตุการณ์ที่มีการเพิ่มจำนวนการทดลองอย่างไม่จำกัด (หากความน่าจะเป็นของเหตุการณ์ในการทดลองทั้งหมดเท่ากัน) เป็นการแจกแจงแบบปกติ

ทฤษฎีบทขีด จำกัด กลางอธิบายการกระจายอย่างแพร่หลายของการแจกแจงแบบปกติ ทฤษฎีบทระบุว่าเมื่อใดก็ตามที่ตัวแปรสุ่มถูกสร้างขึ้นจากการเพิ่มตัวแปรสุ่มอิสระจำนวนมากที่มีความแปรปรวนจำกัด กฎการกระจายตัวของตัวแปรสุ่มนี้จะกลายเป็นกฎปกติในทางปฏิบัติ

ทฤษฎีบทของยาปูนอฟอธิบายการกระจายกว้างของกฎการแจกแจงแบบปกติและอธิบายกลไกของการก่อตัว ทฤษฎีบทนี้ช่วยให้เราสามารถยืนยันว่าเมื่อใดก็ตามที่ตัวแปรสุ่มถูกสร้างขึ้นจากการเพิ่มตัวแปรสุ่มอิสระจำนวนมาก ความแปรปรวนของค่าความแปรปรวนนั้นน้อยเมื่อเทียบกับความแปรปรวนของผลรวม กฎการกระจายตัวของตัวแปรสุ่มนี้ปรากฎ ให้เป็นกฎหมายปกติในทางปฏิบัติ และเนื่องจากตัวแปรสุ่มถูกสร้างขึ้นจากสาเหตุจำนวนไม่สิ้นสุดเสมอ และส่วนใหญ่มักไม่มีตัวแปรใดที่มีความแปรปรวนเทียบเท่ากับความแปรปรวนของตัวแปรสุ่มเอง ตัวแปรสุ่มส่วนใหญ่ที่พบในทางปฏิบัติจึงอยู่ภายใต้กฎหมายการแจกแจงแบบปกติ

งบเชิงคุณภาพและเชิงปริมาณของกฎหมายจำนวนมากขึ้นอยู่กับ ความไม่เท่าเทียมกันของ Chebyshev. มันกำหนดขอบเขตบนของความน่าจะเป็นที่ค่าเบี่ยงเบนของค่าของตัวแปรสุ่มจากการคาดหมายทางคณิตศาสตร์นั้นมากกว่าจำนวนที่กำหนด เป็นเรื่องน่าทึ่งที่อสมการ Chebyshev ให้ค่าประมาณความน่าจะเป็นของเหตุการณ์สำหรับตัวแปรสุ่มที่ไม่ทราบการแจกแจง ทราบเฉพาะความคาดหวังทางคณิตศาสตร์และความแปรปรวนเท่านั้นที่ทราบ

ความไม่เท่าเทียมกันของ Chebyshev. หากตัวแปรสุ่ม x มีความแปรปรวน ดังนั้นสำหรับ x > 0 ใด ๆ อสมการต่อไปนี้จะคงอยู่ โดยที่ เอ็ม x และ ดี x - ความคาดหวังทางคณิตศาสตร์และความแปรปรวนของตัวแปรสุ่ม x

ทฤษฎีบทเบอร์นูลลี. ให้ x n เป็นจำนวนความสำเร็จในการทดลอง n Bernoulli และ p ความน่าจะเป็นของความสำเร็จในการทดลองครั้งเดียว ดังนั้นสำหรับ s > 0 ใดๆ จะเป็นจริง

ทฤษฎีบทของยาปูนอฟ. ให้ s 1 , s 2 , …, s n , … เป็นลำดับไม่ จำกัด ของตัวแปรสุ่มอิสระที่มีความคาดหวังทางคณิตศาสตร์ m 1 , m 2 , …, m n , … และความแปรปรวน s 1 2 , s 2 2 , …, s n 2 … แสดงว่า

จากนั้น = Ф(b) - Ф(a) สำหรับจำนวนจริง a และ b โดยที่ Ф(x) คือฟังก์ชันการกระจายของกฎปกติ

ให้ตัวแปรสุ่มแบบไม่ต่อเนื่องได้รับ พิจารณาการพึ่งพาจำนวนความสำเร็จ Sn กับจำนวนการทดลอง n ในการทดลองแต่ละครั้ง Sn จะเพิ่มขึ้น 1 หรือ 0 ข้อความนี้สามารถเขียนได้ดังนี้:

Sn = 1 +…+ น . (1.1)

กฎของตัวเลขขนาดใหญ่. ให้ ( k ) เป็นลำดับของตัวแปรสุ่มที่เป็นอิสระร่วมกันซึ่งมีการแจกแจงเหมือนกัน หากมีความคาดหวังทางคณิตศาสตร์ = M(k) ดังนั้นสำหรับค่าใดๆ > 0 สำหรับ n

กล่าวอีกนัยหนึ่ง ความน่าจะเป็นที่ค่าเฉลี่ย S n /n แตกต่างจากการคาดหมายทางคณิตศาสตร์น้อยกว่าค่าที่กำหนดโดยพลการมีแนวโน้มเป็นหนึ่ง

ทฤษฎีบทขีด จำกัด กลางให้ ( k ) เป็นลำดับของตัวแปรสุ่มที่เป็นอิสระร่วมกันซึ่งมีการแจกแจงเหมือนกัน สมมติว่ามีและมีอยู่ ให้ Sn = 1 +…+ n จากนั้นสำหรับค่าคงที่ใด ๆ

Ф () - เอฟ () (1.3)

โดยที่ Φ(x) คือฟังก์ชันการแจกแจงแบบปกติ ทฤษฎีบทนี้ถูกกำหนดและพิสูจน์โดย Linlberg Lyapunov และผู้เขียนคนอื่น ๆ ได้พิสูจน์ก่อนหน้านี้ภายใต้เงื่อนไขที่เข้มงวดมากขึ้น ต้องจินตนาการว่าทฤษฎีบทที่กำหนดไว้ข้างต้นเป็นเพียงกรณีพิเศษของทฤษฎีบทที่กว้างกว่ามากเท่านั้น ซึ่งในทางกลับกันก็มีความเกี่ยวข้องอย่างใกล้ชิดกับทฤษฎีบทลิมิตอื่นๆ อีกมากมาย โปรดทราบว่า (1.3) นั้นแข็งแกร่งกว่า (1.2) มาก เนื่องจาก (1.3) ให้ค่าประมาณความน่าจะเป็นที่ส่วนต่างมากกว่า ในทางกลับกัน กฎของตัวเลขจำนวนมาก (1.2) เป็นจริงแม้ว่าตัวแปรสุ่ม k จะไม่มีความแปรปรวนจำกัด ดังนั้นจึงใช้กับกรณีทั่วไปมากกว่าทฤษฎีบทขีดจำกัดกลาง (1.3) เราแสดงสองทฤษฎีบทสุดท้ายพร้อมตัวอย่าง

ตัวอย่าง.ก) พิจารณาลำดับของการขว้างอย่างอิสระของการดายสมมาตร ให้ k เป็นจำนวนแต้มในการทอยครั้งที่ k แล้ว

M(k)=(1+2+3+4+5+6)/6=3.5,

a D(k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3.5) 2 =35/12 และ S n /n

คือจำนวนคะแนนเฉลี่ยที่เกิดจาก n ม้วน

กฎของจำนวนมากระบุว่าเป็นไปได้ว่าสำหรับจำนวนมาก n ค่าเฉลี่ยนี้จะใกล้เคียงกับ 3.5 ทฤษฎีบทขีดจำกัดกลางกำหนดความน่าจะเป็นที่ |Sn -- 3.5n |< (35n/12) 1/2 близка к Ф() -- Ф(-). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф(0)-- Ф(-- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

ข) ตัวอย่าง สมมุติว่าในประชากรทั่วไป

ประกอบด้วยครอบครัว N ครอบครัว Nk มีลูก k อย่างแน่นอน

(k = 0, 1 ...; Nk = N) หากสุ่มเลือกครอบครัว จำนวนเด็กในนั้นจะเป็นตัวแปรสุ่มที่ใช้ค่าที่มีความน่าจะเป็น p = N/N ด้วยการเลือกแบบเรียกซ้ำ เราสามารถพิจารณาตัวอย่างขนาด n เป็นชุดของตัวแปรสุ่มอิสระ n ตัวหรือ "การสังเกต" 1 , ..., n ที่ทั้งหมดมีการแจกแจงแบบเดียวกัน S n /n คือค่าเฉลี่ยตัวอย่าง กฎของตัวเลขจำนวนมากระบุว่าสำหรับกลุ่มตัวอย่างแบบสุ่มที่มีจำนวนมากเพียงพอ ค่าเฉลี่ยของตัวอย่างนั้นน่าจะใกล้เคียงกัน กล่าวคือ ค่าเฉลี่ยประชากร ทฤษฎีบทขีดจำกัดกลางทำให้คุณสามารถประมาณจำนวนที่น่าจะมีความคลาดเคลื่อนระหว่างวิธีการเหล่านี้ และกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการประมาณการที่เชื่อถือได้ ในทางปฏิบัติและมักจะไม่เป็นที่รู้จัก อย่างไรก็ตาม ในกรณีส่วนใหญ่ การขอรับการประมาณการเบื้องต้นเป็นเรื่องง่ายและสามารถอยู่ในขอบเขตที่เชื่อถือได้เสมอ หากเราต้องการให้ค่าเฉลี่ยตัวอย่าง S n /n แตกต่างจากค่าเฉลี่ยประชากรที่ไม่ทราบค่าน้อยกว่า 1/10 โดยมีความน่าจะเป็น 0.99 ขึ้นไป ควรใช้ขนาดกลุ่มตัวอย่างในลักษณะที่

ราก x ของสมการ Ф(х) - Ф(-- x) = 0.99 เท่ากับ x = 2.57 ... และดังนั้น n จะต้องเท่ากับ 2.57 หรือ n > 660 การประมาณค่าล่วงหน้าอย่างระมัดระวังทำให้สามารถค้นหาขนาดตัวอย่างที่ต้องการได้

c) การกระจายปัวซอง

สมมติว่าตัวแปรสุ่ม k มีการแจกแจงแบบปัวซอง (p(k;)) จากนั้น Sn มีการแจกแจงแบบปัวซองโดยมีค่าเฉลี่ยและความแปรปรวนเท่ากับ n

เขียนแทน n เราสรุปได้ว่าสำหรับ n

การหาผลบวกกับ k ทั้งหมดตั้งแต่ 0 ถึง F-la (1.5) ก็เกิดขึ้นโดยพลการเช่นกัน

ให้ทราบค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มหลายตัวที่ไม่ขึ้นต่อกัน จะหาค่าเบี่ยงเบนมาตรฐานของผลรวมของปริมาณเหล่านี้ได้อย่างไร คำตอบสำหรับคำถามนี้มาจากทฤษฎีบทต่อไปนี้

ทฤษฎีบท. ค่าเบี่ยงเบนมาตรฐานของผลรวมของจำนวนจำกัดของตัวแปรสุ่มที่เป็นอิสระร่วมกันจะเท่ากับสแควร์รูทของผลรวมของค่าเบี่ยงเบนมาตรฐานกำลังสองของตัวแปรเหล่านี้

การพิสูจน์. แสดงโดย Xผลรวมของปริมาณที่พิจารณาโดยอิสระร่วมกัน:

ความแปรปรวนของผลรวมของตัวแปรสุ่มที่เป็นอิสระร่วมกันหลายตัวเท่ากับผลรวมของความแปรปรวนของเงื่อนไข (ดู § 5 ข้อที่ 1) ดังนั้น

หรือสุดท้าย

กระจายตัวแปรสุ่มที่เป็นอิสระซึ่งกันและกันอย่างเท่าเทียมกัน

เป็นที่ทราบกันดีอยู่แล้วว่าตามกฎการแจกแจง เราสามารถค้นหาลักษณะเชิงตัวเลขของตัวแปรสุ่มได้ ตามมาด้วยว่าถ้าตัวแปรสุ่มหลายตัวมีการแจกแจงเหมือนกัน แสดงว่าคุณสมบัติเชิงตัวเลขของตัวแปรนั้นเหมือนกัน

พิจารณา พีตัวแปรสุ่มที่เป็นอิสระร่วมกัน X v X v ..., เอ็กซ์ ฟิ ,ซึ่งมีการแจกแจงเหมือนกันและด้วยเหตุนี้จึงมีลักษณะเหมือนกัน (การคาดหมายทางคณิตศาสตร์ ความแปรปรวน ฯลฯ) สิ่งที่น่าสนใจที่สุดคือการศึกษาคุณลักษณะเชิงตัวเลขของค่าเฉลี่ยเลขคณิตของปริมาณเหล่านี้ ซึ่งเราจะทำในส่วนนี้

ให้เราแสดงค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มที่พิจารณาเป็น X:

บทบัญญัติสามข้อต่อไปนี้กำหนดความสัมพันธ์ระหว่างลักษณะเชิงตัวเลขของค่าเฉลี่ยเลขคณิต Xและลักษณะที่สอดคล้องกันของแต่ละปริมาณ

1. ความคาดหวังทางคณิตศาสตร์ของค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มที่เป็นอิสระซึ่งกันและกันที่มีการกระจายอย่างเหมือนกัน เท่ากับการคาดหมายทางคณิตศาสตร์ a ของตัวแปรแต่ละตัว:

การพิสูจน์. โดยใช้คุณสมบัติของการคาดหมายทางคณิตศาสตร์ (ตัวประกอบคงที่สามารถนำออกจากเครื่องหมายของการคาดหมายทางคณิตศาสตร์;

โดยคำนึงว่าการคาดหมายทางคณิตศาสตร์ของแต่ละปริมาณโดยเงื่อนไขมีค่าเท่ากับ เอ, เราได้รับ

2. ความแปรปรวนของค่าเฉลี่ยเลขคณิตของ n ตัวแปรสุ่มที่เป็นอิสระต่อกันซึ่งมีการกระจายอย่างเหมือนกันคือ n ครั้งน้อยกว่าความแปรปรวน D ของตัวแปรแต่ละตัว:

การพิสูจน์. โดยใช้คุณสมบัติของความแปรปรวน (ตัวประกอบคงที่สามารถนำออกจากเครื่องหมายความแปรปรวนได้โดยการยกกำลังสองมัน; ความแปรปรวนของผลรวมของตัวแปรอิสระเท่ากับผลรวมของความแปรปรวนของเงื่อนไข) เรามี

§ 9 กระจายตัวแปรสุ่มที่เป็นอิสระซึ่งกันและกันอย่างเท่าเทียมกัน 97

โดยคำนึงว่าความแปรปรวนของแต่ละปริมาณมีเงื่อนไขเท่ากับ D เราได้รับ

3. ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยเลขคณิตของ n ที่แจกแจงกันอย่างอิสระซึ่งกันและกันแบบสุ่ม

ค่าน้อยกว่าค่าเบี่ยงเบนมาตรฐาน a ของแต่ละค่า 4n เท่า:

การพิสูจน์. เพราะ D(X .)) = ด/นแล้วค่าเบี่ยงเบนมาตรฐาน Xเท่ากับ

ข้อสรุปทั่วไปจากสูตร (*) และ (**): จำได้ว่าความแปรปรวนและค่าเบี่ยงเบนมาตรฐานทำหน้าที่เป็นตัววัดการกระจายตัวของตัวแปรสุ่ม เราสรุปได้ว่าค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มที่ไม่ขึ้นต่อกันจำนวนมากเพียงพอมี

กระจัดกระจายน้อยกว่าแต่ละค่ามาก

ให้เราอธิบายโดยตัวอย่างความสำคัญของข้อสรุปนี้สำหรับการปฏิบัติ

ตัวอย่าง. โดยปกติ ในการวัดปริมาณทางกายภาพบางอย่าง จะมีการวัดหลายครั้ง จากนั้นหาค่าเฉลี่ยเลขคณิตของตัวเลขที่ได้รับ ซึ่งนำมาเป็นค่าโดยประมาณของปริมาณที่วัดได้ สมมติว่าการวัดทำภายใต้เงื่อนไขเดียวกันให้พิสูจน์:

ก) ค่าเฉลี่ยเลขคณิตให้ผลลัพธ์ที่น่าเชื่อถือมากกว่าการวัดเดี่ยว
b) ด้วยจำนวนการวัดที่เพิ่มขึ้น ความน่าเชื่อถือของผลลัพธ์นี้จะเพิ่มขึ้น

วิธีแก้ปัญหา ก) เป็นที่ทราบกันดีว่าการวัดแต่ละครั้งให้ค่าที่แตกต่างกันของปริมาณที่วัดได้ ผลลัพธ์ของการวัดแต่ละครั้งขึ้นอยู่กับปัจจัยสุ่มหลายอย่าง (การเปลี่ยนแปลงของอุณหภูมิ ความผันผวนของอุปกรณ์ ฯลฯ) ซึ่งไม่สามารถนำมาพิจารณาล่วงหน้าได้ทั้งหมด

ดังนั้นเราจึงมีสิทธิ์พิจารณาผลลัพธ์ที่เป็นไปได้ พีการวัดแต่ละตัวเป็นตัวแปรสุ่ม X v X 2,..., X p(ดัชนีระบุจำนวนการวัด) ปริมาณเหล่านี้มีการแจกแจงความน่าจะเป็นเหมือนกัน (การวัดทำโดยใช้เทคนิคเดียวกันและเครื่องมือเดียวกัน) และด้วยเหตุนี้จึงมีลักษณะเชิงตัวเลขเหมือนกัน นอกจากนี้ ยังเป็นอิสระจากกัน (ผลของการวัดแต่ละรายการไม่ขึ้นอยู่กับการวัดอื่นๆ)

เรารู้แล้วว่าค่าเฉลี่ยเลขคณิตของค่าดังกล่าวมีการกระจายตัวน้อยกว่าค่าแต่ละค่า กล่าวอีกนัยหนึ่ง ค่าเฉลี่ยเลขคณิตนั้นใกล้เคียงกับค่าจริงของค่าที่วัดได้มากกว่าผลลัพธ์ของการวัดครั้งเดียว ซึ่งหมายความว่าค่าเฉลี่ยเลขคณิตของการวัดหลายรายการให้ผลลัพธ์เป็นกรณีมากกว่าการวัดครั้งเดียว

b) เราทราบแล้วว่าเมื่อจำนวนตัวแปรสุ่มแต่ละตัวเพิ่มขึ้น การแพร่กระจายของค่าเฉลี่ยเลขคณิตก็ลดลง ซึ่งหมายความว่าด้วยจำนวนการวัดที่เพิ่มขึ้น ค่าเฉลี่ยเลขคณิตของการวัดหลายรายการจะแตกต่างจากมูลค่าที่แท้จริงของปริมาณที่วัดได้น้อยลง ดังนั้น โดยการเพิ่มจำนวนการวัด ได้ผลลัพธ์ที่น่าเชื่อถือมากขึ้น

ตัวอย่างเช่น หากค่าเบี่ยงเบนมาตรฐานของการวัดครั้งเดียวคือ a = 6 m และผลรวม พี= 36 การวัด ดังนั้นค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยเลขคณิตของการวัดเหล่านี้คือ 1 ม. อันที่จริง

เราเห็นว่าค่าเฉลี่ยเลขคณิตของการวัดหลายอย่างตามที่คาดไว้นั้นใกล้เคียงกับค่าที่แท้จริงของปริมาณที่วัดได้มากกว่าผลลัพธ์ของการวัดครั้งเดียว

หลักสูตรการทำงาน

ในหัวข้อ "กฎหมายจำนวนมาก"

กระจายตัวแปรสุ่มอย่างเท่าเทียมกัน

ทฤษฎีบทของปัวซองระบุว่าความถี่ของเหตุการณ์ในชุดของการทดลองอิสระมีแนวโน้มที่จะเป็นค่าเฉลี่ยเลขคณิตของความน่าจะเป็นและสิ้นสุดที่จะสุ่ม

ทฤษฎีบทขีดจำกัดกลางอธิบายการใช้กฎการแจกแจงแบบปกติอย่างแพร่หลาย ทฤษฎีบทระบุว่าเมื่อใดก็ตามที่ตัวแปรสุ่มถูกสร้างขึ้นจากการเพิ่มตัวแปรสุ่มอิสระจำนวนมากที่มีความแปรปรวนจำกัด กฎการกระจายตัวของตัวแปรสุ่มนี้จะกลายเป็นกฎปกติในทางปฏิบัติ

ทฤษฎีบทของ Lyapunov อธิบายการแจกแจงแบบกว้างของกฎการแจกแจงแบบปกติและอธิบายกลไกของการก่อตัว ทฤษฎีบทนี้ช่วยให้เราสามารถยืนยันว่าเมื่อใดก็ตามที่ตัวแปรสุ่มถูกสร้างขึ้นจากการเพิ่มตัวแปรสุ่มอิสระจำนวนมาก ความแปรปรวนของค่าความแปรปรวนนั้นน้อยเมื่อเทียบกับความแปรปรวนของผลรวม กฎการกระจายตัวของตัวแปรสุ่มนี้ปรากฎ ให้เป็นกฎหมายปกติในทางปฏิบัติ และเนื่องจากตัวแปรสุ่มถูกสร้างขึ้นจากสาเหตุจำนวนไม่สิ้นสุดเสมอ และส่วนใหญ่มักไม่มีตัวแปรใดที่มีความแปรปรวนเทียบเท่ากับความแปรปรวนของตัวแปรสุ่มเอง ตัวแปรสุ่มส่วนใหญ่ที่พบในทางปฏิบัติจึงอยู่ภายใต้กฎหมายการแจกแจงแบบปกติ

ความไม่เท่าเทียมกันของ Chebyshev หากตัวแปรสุ่ม x มีความแปรปรวน ดังนั้นสำหรับ x > 0 ใด ๆ อสมการจะเป็นจริง โดยที่ เอ็ม x และ ดี x - ความคาดหวังทางคณิตศาสตร์และความแปรปรวนของตัวแปรสุ่ม x

ทฤษฎีบทของเบอร์นูลลี ให้ x n เป็นจำนวนความสำเร็จในการทดลอง n Bernoulli และ p ความน่าจะเป็นของความสำเร็จในการทดลองครั้งเดียว จากนั้นสำหรับ s > 0, ใดๆ

ทฤษฎีบทของยาปูนอฟ ให้ s 1 , s 2 , …, s n , … เป็นลำดับไม่ จำกัด ของตัวแปรสุ่มอิสระที่มีความคาดหวังทางคณิตศาสตร์ m 1 , m 2 , …, m n , … และความแปรปรวน s 1 2 , s 2 2 , …, s n 2 … แสดงว่า , , , .

Sn = 1 +…+ น . (1.1)

กฎของตัวเลขจำนวนมาก ให้ ( k ) เป็นลำดับของตัวแปรสุ่มที่เป็นอิสระร่วมกันซึ่งมีการแจกแจงเหมือนกัน หากมีความคาดหวังทางคณิตศาสตร์ = M(k) ดังนั้นสำหรับค่าใดๆ > 0 สำหรับ n

กล่าวอีกนัยหนึ่ง ความน่าจะเป็นที่ค่าเฉลี่ย S n /n แตกต่างจากการคาดหมายทางคณิตศาสตร์โดยน้อยกว่าที่กำหนดโดยพลการมีแนวโน้มเป็นหนึ่ง

ทฤษฎีบทขีด จำกัด กลาง ให้ ( k ) เป็นลำดับของตัวแปรสุ่มที่เป็นอิสระร่วมกันซึ่งมีการแจกแจงเหมือนกัน สมมติว่ามีและมีอยู่ ให้ Sn = 1 +…+ n จากนั้นสำหรับค่าคงที่ใด ๆ

F () - F () (1.3)

โดยที่ Φ(x) คือฟังก์ชันการแจกแจงแบบปกติ ทฤษฎีบทนี้ถูกกำหนดและพิสูจน์โดย Linlberg Lyapunov และผู้เขียนคนอื่น ๆ ได้พิสูจน์ก่อนหน้านี้ภายใต้เงื่อนไขที่เข้มงวดมากขึ้น ต้องจินตนาการว่าทฤษฎีบทที่กำหนดไว้ข้างต้นเป็นเพียงกรณีพิเศษของทฤษฎีบทที่กว้างกว่ามากเท่านั้น ซึ่งในทางกลับกันก็มีความเกี่ยวข้องอย่างใกล้ชิดกับทฤษฎีบทลิมิตอื่นๆ อีกมากมาย โปรดทราบว่า (1.3) แข็งแกร่งกว่า (1.2) มาก เนื่องจาก (1.3) ให้ค่าประมาณความน่าจะเป็นที่ความแตกต่างมากกว่า ในทางกลับกัน กฎของตัวเลขจำนวนมาก (1.2) เป็นจริงแม้ว่าตัวแปรสุ่ม k จะไม่มีความแปรปรวนจำกัด ดังนั้นจึงใช้กับกรณีทั่วไปมากกว่าทฤษฎีบทขีดจำกัดกลาง (1.3) เราแสดงสองทฤษฎีบทสุดท้ายพร้อมตัวอย่าง

ตัวอย่าง.ก) พิจารณาลำดับของการขว้างอย่างอิสระของการดายสมมาตร ให้ k เป็นจำนวนคะแนนในการโยนครั้งที่ k แล้ว

M( k)=(1+2+3+4+5+6)/6=3.5,

a D( k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3.5) 2 =35/12 และ S n /n

คือจำนวนคะแนนเฉลี่ยที่เกิดจาก n ม้วน

กฎของจำนวนมากระบุว่าเป็นไปได้ว่าสำหรับจำนวนมาก n ค่าเฉลี่ยนี้จะใกล้เคียงกับ 3.5 ทฤษฎีบทขีด จำกัด กลาง กำหนดความน่าจะเป็นที่ |Sn - 3.5n |< (35n/12) 1/2 близка к Ф() - Ф(- ). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф( 0)- Ф(- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

ข) ตัวอย่าง สมมุติว่าในประชากรทั่วไป

ประกอบด้วยครอบครัว N ครอบครัว Nk มีลูก k อย่างแน่นอน

(k = 0, 1 ...; Nk = N) หากสุ่มเลือกครอบครัว จำนวนเด็กในนั้นจะเป็นตัวแปรสุ่มที่ใช้ค่าที่มีความน่าจะเป็น p = N /N ด้วยการเลือกแบบเรียกซ้ำ เราสามารถพิจารณาตัวอย่างขนาด n เป็นชุดของตัวแปรสุ่มอิสระ n ตัวหรือ "การสังเกต" 1 , ..., n ที่ทั้งหมดมีการแจกแจงแบบเดียวกัน S n /n คือค่าเฉลี่ยตัวอย่าง กฎของตัวเลขจำนวนมากระบุว่าสำหรับกลุ่มตัวอย่างแบบสุ่มที่มีจำนวนมากเพียงพอ ค่าเฉลี่ยของตัวอย่างนั้นน่าจะใกล้เคียงกับ นั่นคือ ค่าเฉลี่ยของประชากร ทฤษฎีบทขีดจำกัดกลางทำให้คุณสามารถประมาณจำนวนที่น่าจะมีความคลาดเคลื่อนระหว่างวิธีการเหล่านี้ และกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการประมาณการที่เชื่อถือได้ ในทางปฏิบัติและมักจะไม่เป็นที่รู้จัก อย่างไรก็ตาม ในกรณีส่วนใหญ่ การขอรับการประมาณการเบื้องต้นเป็นเรื่องง่ายและสามารถอยู่ในขอบเขตที่เชื่อถือได้เสมอ หากเราต้องการให้ค่าเฉลี่ยตัวอย่าง S n /n แตกต่างจากค่าเฉลี่ยประชากรที่ไม่ทราบค่าน้อยกว่า 1/10 โดยมีความน่าจะเป็น 0.99 ขึ้นไป ควรใช้ขนาดกลุ่มตัวอย่างในลักษณะที่

ราก x ของสมการ Ф(х) - Ф(- x) = 0.99 เท่ากับ x = 2.57 ... และดังนั้น n จะต้องเท่ากับ 2.57 หรือ n > 660 การประมาณค่าล่วงหน้าอย่างระมัดระวังทำให้สามารถค้นหาขนาดตัวอย่างที่ต้องการได้

c) การกระจายปัวซอง

สมมติว่าตัวแปรสุ่ม k มีการแจกแจงแบบปัวซอง (p(k; )) จากนั้น Sn มีการแจกแจงแบบปัวซองโดยมีค่าเฉลี่ยและความแปรปรวนเท่ากับ n

เขียนแทน n เราสรุปได้ว่าสำหรับ n

ผลรวมจะดำเนินการกับ k ทั้งหมดตั้งแต่ 0 ถึง F-la (1.5) ก็เกิดขึ้นโดยพลการเช่นกัน

ข้างต้น เราพิจารณาคำถามในการค้นหา PDF สำหรับผลรวมของตัวแปรสุ่มที่ไม่ขึ้นกับทางสถิติ ในส่วนนี้ เราจะพิจารณาผลรวมของตัวแปรอิสระทางสถิติอีกครั้ง แต่วิธีการของเราจะแตกต่างออกไปและไม่ขึ้นอยู่กับ PDF บางส่วนของตัวแปรสุ่มในผลรวม โดยเฉพาะอย่างยิ่ง สมมติว่าเงื่อนไขของผลรวมมีความเป็นอิสระทางสถิติและตัวแปรสุ่มแบบกระจายอย่างเหมือนกัน ซึ่งแต่ละตัวมีค่าเฉลี่ยแบบมีขอบเขตและความแปรปรวนแบบมีขอบเขต

ให้ กำหนดให้เป็นผลรวมปกติที่เรียกว่าค่าเฉลี่ยตัวอย่าง

อันดับแรก เรากำหนดขอบเขตบนของความน่าจะเป็นของก้อย จากนั้นเราพิสูจน์ทฤษฎีบทที่สำคัญมากซึ่งกำหนด PDF ในขีดจำกัดเมื่อมีแนวโน้มเป็นอนันต์

ตัวแปรสุ่มที่กำหนดไว้ (2.1.187) มักเกิดขึ้นเมื่อประมาณค่าค่าเฉลี่ยของตัวแปรสุ่มในชุดการสังเกต กล่าวอีกนัยหนึ่ง ถือได้ว่าเป็นการรับรู้ตัวอย่างที่เป็นอิสระจากการแจกแจง และเป็นค่าประมาณของค่าเฉลี่ย

ความคาดหวังทางคณิตศาสตร์คือ

การกระจายตัวคือ

หากพิจารณาเป็นค่าประมาณของค่าเฉลี่ย เราจะเห็นว่าการคาดหมายทางคณิตศาสตร์เท่ากับ และความแปรปรวนจะลดลงตามขนาดกลุ่มตัวอย่างที่เพิ่มขึ้น ถ้ามันเพิ่มขึ้นอย่างไม่มีกำหนด ความแปรปรวนมีแนวโน้มที่จะเป็นศูนย์ ค่าประมาณของพารามิเตอร์ (ในกรณีนี้คือ ) ที่ตรงตามเงื่อนไขที่การคาดหมายทางคณิตศาสตร์มีแนวโน้มที่จะเป็นค่าที่แท้จริงของพารามิเตอร์ และความแปรปรวนเป็นศูนย์อย่างเคร่งครัด เรียกว่าค่าประมาณที่สม่ำเสมอ

ความน่าจะเป็นหางของตัวแปรสุ่มสามารถประมาณได้จากด้านบนโดยใช้ขอบเขตที่กำหนดในวินาที 2.1.5. ความไม่เท่าเทียมกันของ Chebyshev ตามที่ใช้กับมีรูปแบบ

. (2.1.188)

ในขีด จำกัด เมื่อ , จาก (2.1.188) มันตามมา

. (2.1.189)

ดังนั้น ความน่าจะเป็นที่ค่าประมาณของค่าเฉลี่ยแตกต่างจากค่าจริงมากกว่า มีแนวโน้มเป็นศูนย์หากเพิ่มขึ้นอย่างไม่มีกำหนด บทบัญญัตินี้เป็นรูปแบบของกฎหมายจำนวนมาก เนื่องจากขอบเขตบนมาบรรจบกันเป็นศูนย์ค่อนข้างช้า กล่าวคือ ผกผัน. นิพจน์ (2.1.188) เรียกว่า กฎหมายที่อ่อนแอของจำนวนมาก.

หากเราใช้ขอบเขตเชอร์นอฟที่มีการขึ้นต่อกันแบบเอ็กซ์โพเนนเชียลกับตัวแปรสุ่ม เราก็จะได้ขอบเขตบนที่หนาแน่นสำหรับความน่าจะเป็นของหนึ่งหาง ตามขั้นตอนที่ระบุไว้ในนิกาย 2.1.5 เราพบว่าความน่าจะเป็นของหางนั้นกำหนดโดย

ที่ไหน และ . แต่มีความเป็นอิสระทางสถิติและมีการกระจายอย่างเท่าเทียมกัน เพราะเหตุนี้,

หนึ่งในปริมาณอยู่ที่ไหน พารามิเตอร์ ซึ่งให้ขอบเขตบนที่แม่นยำที่สุด ได้มาจากการแยกความแตกต่าง (2.1.191) และตั้งค่าอนุพันธ์ให้เป็นศูนย์ สิ่งนี้นำไปสู่สมการ

(2.1.192)

แสดงถึงวิธีแก้ปัญหา (2.1.192) โดย. จากนั้นขอบเขตของความน่าจะเป็นของหางบน

, . (2.1.193)

ในทำนองเดียวกัน เราจะพบว่าความน่าจะเป็นหางล่างมีขอบเขต

, . (2.1.194)

ตัวอย่าง 2.1.7. อนุญาต เป็นชุดของตัวแปรสุ่มอิสระทางสถิติที่กำหนดดังนี้:

เราต้องการกำหนดขอบเขตบนที่แน่นหนาบนความน่าจะเป็นที่ผลรวมของมากกว่าศูนย์ เนื่องจาก ผลรวมจะมีค่าลบสำหรับความคาดหวังทางคณิตศาสตร์ (ค่าเฉลี่ย) ดังนั้น เราจะมองหาความน่าจะเป็นของหางบน สำหรับใน (2.1.193) เรามี

, (2.1.195)

คำตอบของสมการอยู่ที่ไหน

เพราะเหตุนี้,

. (2.1.197)

ดังนั้น สำหรับขอบเขตใน (2.1.195) เราได้รับ

เราเห็นว่าขอบเขตบนลดลงแบบทวีคูณจาก ตามที่คาดไว้ ในทางตรงกันข้าม ตามขอบเขตของ Chebyshev ความน่าจะเป็นหางจะลดลงผกผันกับ

ทฤษฎีบทขีด จำกัด กลาง ในส่วนนี้ เราพิจารณาทฤษฎีบทที่มีประโยชน์อย่างยิ่งเกี่ยวกับ IGF ของผลรวมของตัวแปรสุ่มในขีดจำกัด เมื่อจำนวนพจน์ในผลรวมเพิ่มขึ้นโดยไม่มีขอบเขต ทฤษฎีบทนี้มีหลายเวอร์ชัน ให้เราพิสูจน์ทฤษฎีบทสำหรับกรณีที่ตัวแปรสุ่มผลรวม , , เป็นอิสระทางสถิติและกระจายเหมือนกัน แต่ละตัวมีค่าเฉลี่ยจำกัดและความแปรปรวนจำกัด

เพื่อความสะดวก เรากำหนดตัวแปรสุ่มที่ทำให้เป็นมาตรฐาน

ดังนั้นจึงมีค่าเฉลี่ยและความแปรปรวนหน่วยเป็นศูนย์

ตอนนี้ให้

เนื่องจากแต่ละเทอมของผลรวมมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนของหน่วย ค่านอร์มัลไลซ์ (โดยตัวประกอบ ) จึงมีค่าเฉลี่ยและความแปรปรวนของหน่วยเป็นศูนย์ เราต้องการกำหนด IDF สำหรับในขีด จำกัด เมื่อ.

ฟังก์ชันลักษณะเฉพาะคือ

, (2.1.200).

หรือเทียบเท่า

. (2.1.206)

แต่นี่เป็นเพียงฟังก์ชันคุณลักษณะของตัวแปรสุ่มแบบเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนของหน่วย ดังนั้นเราจึงมีผลลัพธ์ที่สำคัญ PDF ของผลรวมของตัวแปรสุ่มที่เป็นอิสระทางสถิติและกระจายเหมือนกันโดยมีค่าเฉลี่ยและความแปรปรวนจำกัดเข้าใกล้ค่า Gaussian ที่ ผลลัพธ์นี้เรียกว่า ทฤษฎีบทขีด จำกัด กลาง.

แม้ว่าเราจะสันนิษฐานว่าตัวแปรสุ่มในผลรวมมีการกระจายเท่าๆ กัน แต่สมมติฐานนี้สามารถลดลงได้หากยังคงมีข้อจำกัดเพิ่มเติมบางประการเกี่ยวกับคุณสมบัติของตัวแปรสุ่มสุ่ม มีทฤษฎีบทหนึ่งรุ่น ตัวอย่างเช่น เมื่อสมมติฐานของการแจกแจงตัวแปรสุ่มแบบเดียวกันถูกยกเลิก เพื่อสนับสนุนเงื่อนไขที่กำหนดในช่วงเวลาสัมบูรณ์ที่สามของตัวแปรสุ่มของผลรวม สำหรับการอภิปรายเรื่องนี้และเวอร์ชันอื่นๆ ของทฤษฎีบทขีดจำกัดกลาง ผู้อ่านจะอ้างถึงแครมเมอร์ (1946)

ทฤษฎีบทขีดจำกัดกลางเป็นกลุ่มของทฤษฎีบทที่อุทิศให้กับการสร้างเงื่อนไขภายใต้กฎการแจกแจงแบบปกติ และการละเมิดซึ่งนำไปสู่การแจกแจงแบบอื่นที่ไม่ใช่แบบปกติ รูปแบบที่แตกต่างกันของทฤษฎีบทขีด จำกัด กลางต่างกันไปตามเงื่อนไขที่กำหนดในการแจกแจงเงื่อนไขแบบสุ่มที่สร้างผลรวม ให้เราพิสูจน์รูปแบบที่ง่ายที่สุดรูปแบบหนึ่งของทฤษฎีบทนี้ กล่าวคือ ทฤษฎีบทขีดจำกัดกลางสำหรับเงื่อนไขที่แจกแจงอย่างอิสระเหมือนกัน

พิจารณาลำดับของตัวแปรสุ่มที่แจกแจงอย่างอิสระเหมือนกันพร้อมการคาดหมายทางคณิตศาสตร์ สมมุติว่ามีความแปรปรวน มาแนะนำสัญกรณ์กัน กฎของตัวเลขจำนวนมากสำหรับลำดับนี้สามารถแสดงในรูปแบบต่อไปนี้:

โดยที่การบรรจบกันสามารถเข้าใจได้ทั้งในแง่ของการบรรจบกันในความน่าจะเป็น (กฎที่อ่อนแอของจำนวนมาก) และในแง่ของการบรรจบกันด้วยความน่าจะเป็นเท่ากับหนึ่ง (กฎที่แข็งแกร่งของตัวเลขจำนวนมาก)

ทฤษฎีบท (ทฤษฎีบทขีดจำกัดกลางสำหรับตัวแปรสุ่มแบบกระจายอิสระที่เหมือนกัน) อนุญาต เป็นลำดับของตัวแปรสุ่มแบบกระจายอย่างอิสระเหมือนกัน, . แล้วมีเครื่องแบบเกี่ยวกับ () บรรจบกัน