ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

การแจกแจงแบบทวินาม คุณสมบัติและคุณลักษณะเชิงตัวเลข คุณสมบัติของการกระจายทวินาม

สวัสดี! เรารู้แล้วว่าการกระจายความน่าจะเป็นคืออะไร อาจเป็นแบบไม่ต่อเนื่องหรือต่อเนื่องก็ได้ และเราได้เรียนรู้ว่ามันเรียกว่าการแจกแจงความหนาแน่นของความน่าจะเป็น ตอนนี้มาสำรวจการแจกแจงทั่วไปอีกสองสามรายการ สมมุติว่าฉันมีเหรียญอยู่หนึ่งเหรียญ และเหรียญที่ถูกต้อง ฉันจะพลิกมัน 5 ครั้ง ฉันจะกำหนดตัวแปรสุ่ม X เพื่อแสดงด้วย ตัวพิมพ์ใหญ่ X จะเท่ากับจำนวน "นกอินทรี" ในการโยน 5 ครั้ง บางทีฉันมีเหรียญ 5 เหรียญ ฉันจะโยนมันทั้งหมดพร้อมกันแล้วนับจำนวนหัวที่ฉันได้ หรือผมจะมีเหรียญเดียวก็พลิกได้ 5 ครั้งแล้วนับว่าออกหัวกี่ครั้ง มันไม่สำคัญจริงๆ แต่สมมุติว่าผมมีเหรียญ 1 เหรียญและผมพลิกมัน 5 ครั้ง แล้วเราจะไม่มีความแน่นอน นี่คือคำจำกัดความของฉัน ตัวแปรสุ่ม. ดังที่เราทราบ ตัวแปรสุ่มแตกต่างจากตัวแปรปกติเล็กน้อย มันเหมือนกับฟังก์ชันมากกว่า มันกำหนดค่าบางอย่างให้กับการทดสอบ และตัวแปรสุ่มนี้ค่อนข้างง่าย เราแค่นับจำนวนครั้งที่ "นกอินทรี" ตกลงมาหลังจากโยน 5 ครั้ง - นี่คือตัวแปรสุ่มของเรา X ลองคิดดูสิว่าความน่าจะเป็นคืออะไร ค่าที่แตกต่างกันในกรณีของเรา? แล้วความน่าจะเป็นที่ X (ตัวพิมพ์ใหญ่ X) เป็น 0 คืออะไร? เหล่านั้น. ความน่าจะเป็นที่หลังจากการโยน 5 ครั้งจะไม่ออกหัวเป็นเท่าใด อันที่จริงแล้ว นี่ก็เหมือนกับความน่าจะเป็นที่จะได้ "ก้อย" (ถูกต้องแล้ว เป็นภาพรวมเล็กๆ ของทฤษฎีความน่าจะเป็น) คุณควรได้รับ "หาง" บ้าง ความน่าจะเป็นของ "หาง" แต่ละอันคืออะไร? นี่คือ 1/2 เหล่านั้น. มันควรจะเป็น 1/2 คูณ 1/2, 1/2, 1/2 และ 1/2 อีกครั้ง เหล่านั้น. (1/2)⁵. 1⁵=1 หารด้วย 2⁵ เช่น ที่ 32 ค่อนข้างมีเหตุผล ดังนั้น... ฉันจะพูดซ้ำถึงสิ่งที่เราทำเกี่ยวกับทฤษฎีความน่าจะเป็น นี่เป็นสิ่งสำคัญในการทำความเข้าใจว่าตอนนี้เรากำลังเคลื่อนตัวไปที่ใด และแท้จริงแล้วเป็นอย่างไร การกระจายแบบไม่ต่อเนื่อง ความน่าจะเป็น แล้วความน่าจะเป็นที่เราออกหัวครั้งเดียวเป็นเท่าไหร่? อาจจะหัวขึ้นมาในการโยนครั้งแรก เหล่านั้น. อาจเป็นเช่นนี้: "อินทรี", "หาง", "หาง", "หาง", "หาง" หรือหัวจะขึ้นมาในการโยนครั้งที่สอง เหล่านั้น. อาจมีชุดค่าผสมดังกล่าว: "หาง", "หัว", "หาง", "หาง", "หาง" และอื่น ๆ "นกอินทรี" หนึ่งตัวอาจตกลงมาหลังจากการโยนใดๆ ใน 5 ครั้ง ความน่าจะเป็นของแต่ละสถานการณ์เป็นเท่าใด ความน่าจะเป็นที่จะออกหัวคือ 1/2 จากนั้นความน่าจะเป็นที่จะได้ "ก้อย" เท่ากับ 1/2 คูณด้วย 1/2, 1/2, 1/2 เหล่านั้น. ความน่าจะเป็นของแต่ละสถานการณ์เหล่านี้คือ 1/32 เช่นเดียวกับความน่าจะเป็นของสถานการณ์ที่ X=0 ในความเป็นจริง ความน่าจะเป็นของลำดับพิเศษของหัวและก้อยจะเป็น 1/32 ความน่าจะเป็นคือ 1/32 และความน่าจะเป็นของสิ่งนี้คือ 1/32 และสถานการณ์เช่นนี้เกิดขึ้นเพราะ “อินทรี” สามารถตกลงบนการโยนใด ๆ ใน 5 ครั้ง ดังนั้นความน่าจะเป็นที่ "นกอินทรี" หนึ่งตัวจะตกลงมาเท่ากับ 5 * 1/32 นั่นคือ 5/32 ค่อนข้างมีเหตุผล ตอนนี้สิ่งที่น่าสนใจเริ่มต้นขึ้น ความน่าจะเป็นคืออะไร… (ฉันจะเขียนแต่ละตัวอย่างด้วยสีที่ต่างกัน)… ความน่าจะเป็นที่ตัวแปรสุ่มของฉันคือ 2 คืออะไร เหล่านั้น. ฉันจะโยนเหรียญ 5 ครั้ง และความน่าจะเป็นที่เหรียญจะออกหัว 2 ครั้งเป็นเท่าใด นี่น่าสนใจกว่าใช่ไหม? สามารถผสมอะไรได้บ้าง? อาจเป็นหัว หัว หาง ก้อย ก้อย อาจเป็นหัว หาง หัว หาง ก้อยก็ได้ และถ้าคุณคิดว่า "นกอินทรี" สองตัวนี้สามารถยืนอยู่ในที่ต่างๆ ของชุดค่าผสมได้ คุณอาจจะสับสนเล็กน้อย คุณไม่สามารถคิดเกี่ยวกับตำแหน่งในแบบที่เราทำไว้ข้างต้นได้อีกต่อไป แม้ว่า ... คุณทำได้ แต่คุณเสี่ยงที่จะสับสน คุณต้องเข้าใจสิ่งหนึ่ง สำหรับแต่ละชุดค่าผสมเหล่านี้ ความน่าจะเป็นคือ 1/32 ½*½*½*½*½. เหล่านั้น. ความน่าจะเป็นของชุดค่าผสมแต่ละชุดคือ 1/32 และเราควรคิดว่ามีชุดค่าผสมดังกล่าวกี่ชุดที่ตรงตามเงื่อนไขของเรา (2 "นกอินทรี")? เหล่านั้น. ในความเป็นจริงคุณต้องจินตนาการว่ามีการโยนเหรียญ 5 ครั้งและคุณต้องเลือก 2 อันที่ "นกอินทรี" ตกลงมา สมมติว่าการโยน 5 ครั้งของเราเป็นวงกลม และจินตนาการว่าเรามีเก้าอี้แค่ 2 ตัว และเราพูดว่า:“ โอเคคุณคนไหนจะนั่งบนเก้าอี้เหล่านี้สำหรับนกอินทรี? เหล่านั้น. คุณจะเป็น "อินทรี" คนไหน? และเราไม่สนใจลำดับที่พวกเขานั่งลง ฉันยกตัวอย่างดังกล่าวโดยหวังว่าจะชัดเจนยิ่งขึ้นสำหรับคุณ และคุณอาจต้องการดูบทเรียนเกี่ยวกับทฤษฎีความน่าจะเป็นในหัวข้อนี้ เมื่อฉันพูดถึงทวินามของนิวตัน เพราะที่นั่นฉันจะเจาะลึกรายละเอียดทั้งหมดนี้ แต่ถ้าคุณให้เหตุผลแบบนี้ คุณจะเข้าใจอะไร ค่าสัมประสิทธิ์ทวินาม. เพราะถ้าคุณคิดแบบนี้ โอเค ฉันมีทอย 5 ครั้ง ทอยไหนจะออกหัวก่อน? นี่คือ 5 นั่น ซึ่งการโยนติดต่อกัน "นกอินทรี" ตัวแรกจะตกลงมา และมีโอกาสกี่ครั้งสำหรับ "นกอินทรี" ตัวที่สอง? การโยนครั้งแรกที่เราใช้ไปนั้นทำให้โอกาสออกหัวหายไป 1 ครั้ง เหล่านั้น. ตำแหน่งศีรษะหนึ่งตำแหน่งในคอมโบถูกครอบครองโดยหนึ่งในทอย ตอนนี้เหลือการโยน 4 ครั้ง ซึ่งหมายความว่า "นกอินทรี" ตัวที่สองสามารถล้มหนึ่งใน 4 การโยนได้ และคุณเห็นมันที่นี่ ฉันเลือกที่จะออกหัวในการโยนครั้งที่ 1 และสันนิษฐานว่าในการโยน 1 ใน 4 ครั้งที่เหลือ หัวควรจะขึ้นมาด้วย ดังนั้นจึงมีความเป็นไปได้เพียง 4 ประการที่นี่ ทั้งหมดที่ฉันพูดก็คือสำหรับหัวแรกคุณมี 5 ตำแหน่งที่แตกต่างกันซึ่งสามารถลงจอดได้ และสำหรับตำแหน่งที่สองเหลือเพียง 4 ตำแหน่ง ลองคิดดูสิ เมื่อเราคำนวณเช่นนี้ คำสั่งซื้อจะถูกนำมาพิจารณา แต่สำหรับเราตอนนี้ไม่สำคัญว่า "หัว" และ "ก้อย" จะตกลงมาในลำดับใด เราไม่ได้บอกว่าเป็น "อินทรี 1" หรือเรียกว่า "อินทรี 2" ในทั้งสองกรณีเป็นเพียง "นกอินทรี" เราถือว่านี่คือหัว 1 และนี่คือหัว 2 หรืออาจเป็นอีกทางหนึ่ง: อาจเป็น "นกอินทรี" ตัวที่สอง และนี่คือ "ตัวแรก" และฉันพูดเช่นนี้เพราะสิ่งสำคัญคือต้องเข้าใจว่าจะใช้ตำแหน่งใดและตำแหน่งใดควรใช้ชุดค่าผสม เราไม่สนใจลำดับ แท้จริงแล้วที่มาของงานของเรามีเพียง 2 ทางเท่านั้น ลองหารมันด้วย 2 แล้วคุณจะเห็นว่ามันคือ 2! ที่มาของการจัดงานของเรา ถ้ามี 3 หัว ก็จะมี 3 หัว! แล้วฉันจะแสดงให้ดูว่าทำไม นั่นคือ... 5*4=20 หารด้วย 2 ได้ 10 ดังนั้นจึงมีชุดค่าผสมที่แตกต่างกัน 10 ชุดจากทั้งหมด 32 ชุดที่คุณจะมี 2 หัวอย่างแน่นอน แล้ว 10*(1/32) เท่ากับ 10/32 นั่นเท่ากับอะไร? 5/16 ฉันจะเขียนผ่านค่าสัมประสิทธิ์ทวินาม นี่คือค่าตรงนี้ด้านบน ถ้าลองคิดดู มันก็เหมือนกับ 5! หารด้วย ... 5 * 4 นี่แปลว่าอะไร? 5! คือ 5*4*3*2*1 เหล่านั้น. ถ้าฉันต้องการแค่ 5 * 4 ที่นี่ ฉันหาร 5 ได้! สำหรับ 3! นี่เท่ากับ 5*4*3*2*1 หารด้วย 3*2*1 และเหลือเพียง 5 * 4 มันจึงเหมือนกับตัวเศษนี้ แล้วเพราะ เราไม่สนใจลำดับ เราต้องการ 2 ตรงนี้ ที่จริง 2!. คูณด้วย 1/32 นี่จะเป็นความน่าจะเป็นที่เราจะโดน 2 หัวพอดี ความน่าจะเป็นที่เราออกหัว 3 ครั้งเป็นเท่าไหร่? เหล่านั้น. ความน่าจะเป็นที่ x=3 ดังนั้น ด้วยตรรกะเดียวกัน การเกิดหัวครั้งแรกอาจเกิดขึ้นได้ในการพลิก 1 ครั้งจาก 5 ครั้ง การเกิดหัวครั้งที่สองอาจเกิดขึ้นจากการโยน 1 ใน 4 ครั้งที่เหลือ และอาจเกิดหัวครั้งที่สามบน 1 ใน 3 การโยนที่เหลือ มีกี่ตัว วิธีต่างๆจัด 3 โยน? โดยทั่วไปมีกี่วิธีในการจัดเรียงวัตถุ 3 ชิ้นให้เข้าที่ ตี 3! และคุณสามารถเข้าใจได้ หรือคุณอาจต้องการทบทวนบทช่วยสอนที่ฉันอธิบายอย่างละเอียดอีกครั้ง แต่ถ้าคุณใช้ตัวอักษร A, B และ C เป็นต้น มี 6 วิธีที่คุณสามารถจัดเรียงได้ คุณสามารถคิดว่าสิ่งเหล่านี้เป็นหัวข้อ นี่อาจเป็น ACB, CAB อาจเป็น BAC, BCA และ... อะไรนะ ตัวเลือกสุดท้ายที่ฉันไม่ได้เอ่ยชื่อ? พธม. มี 6 วิธีในการจัดเรียง 3 รายการที่แตกต่างกัน เราหารด้วย 6 เพราะเราไม่ต้องการนับ 6 ใหม่ วิธีทางที่แตกต่างเพราะเราถือว่าพวกเขาเท่าเทียมกัน ที่นี่เราไม่สนใจว่าการโยนจะได้หัวเป็นจำนวนเท่าใด 5*4*3… สามารถเขียนใหม่เป็น 5!/2! แล้วหารด้วย 3 ต่อ!. นี่คือสิ่งที่เขาเป็น 3! เท่ากับ 3*2*1 ทั้งสามกำลังหดตัว นี่กลายเป็น 2 นี่กลายเป็น 1 อีกครั้ง 5*2 นั่นคือ คือ 10 แต่ละสถานการณ์มีความน่าจะเป็นเป็น 1/32 ดังนั้นนี่คือ 5/16 อีกครั้ง และมันน่าสนใจ ความน่าจะเป็นที่คุณจะได้ 3 หัวคือ ความน่าจะเป็นของคุณมีนกอินทรี 2 ตัว และเหตุผลนั้น... ก็มีหลายสาเหตุที่มันเกิดขึ้น แต่ถ้าคุณลองคิดดู ความน่าจะเป็นที่จะได้หัว 3 ตัวก็เท่ากับความน่าจะเป็นที่จะได้ก้อย 2 ตัว และความน่าจะเป็นที่จะได้ 3 หางควรจะเท่ากับความน่าจะเป็นที่จะออก 2 หัว และเป็นเรื่องดีที่ค่าทำงานเช่นนี้ ดี. ความน่าจะเป็นที่ X=4 คืออะไร? เราสามารถใช้สูตรเดิมที่เราเคยใช้ อาจเป็น 5*4*3*2 ในที่นี้เราเขียน 5 * 4 * 3 * 2 ... การจัดเรียงวัตถุ 4 ชิ้นมีกี่วิธี? ตี 4!. สี่! - อันที่จริงแล้ว ส่วนนี้ ตรงนี้ นี่คือ 4*3*2*1 นี่จึงตัดออกเหลือ 5 จากนั้นแต่ละชุดจะมีโอกาสเป็น 1/32 เหล่านั้น. นี่เท่ากับ 5/32 โปรดทราบว่าความน่าจะเป็นที่จะออกหัว 4 ครั้งจะเท่ากับความน่าจะเป็นที่จะออกหัว 1 ครั้ง และนี่ก็สมเหตุสมผลเพราะ 4 หัวเท่ากับ 1 ก้อย คุณจะพูดว่า: อืมแล้ว "หาง" ตัวนี้จะหลุดออกมาจากการโยนแบบไหน? ใช่ มี 5 ชุดค่าผสมที่แตกต่างกันสำหรับสิ่งนั้น และแต่ละตัวมีความน่าจะเป็น 1/32 และสุดท้าย ความน่าจะเป็นที่ X=5 เป็นเท่าใด เหล่านั้น. ขึ้นหัว 5 ครั้งติดต่อกัน ควรเป็นดังนี้: "นกอินทรี", "นกอินทรี", "นกอินทรี", "นกอินทรี", "นกอินทรี" แต่ละหัวมีความน่าจะเป็น 1/2 คุณคูณพวกมันแล้วได้ 1/32 คุณสามารถไปทางอื่น หากมี 32 วิธีที่คุณจะได้หัวและก้อยในการทดลองเหล่านี้ นี่ก็เป็นเพียงหนึ่งในนั้น มี 5 จาก 32 วิธีดังกล่าว ที่นี่ - 10 จาก 32 อย่างไรก็ตามเราได้ทำการคำนวณแล้วและตอนนี้เราพร้อมที่จะวาดการกระจายความน่าจะเป็น แต่เวลาของฉันหมดแล้ว ให้ฉันดำเนินการต่อในบทเรียนถัดไป และถ้าคุณอยู่ในอารมณ์ก็อาจจะวาดก่อนที่จะดูบทเรียนต่อไป? แล้วพบกันใหม่!

บทที่ 7

กฎเฉพาะของการแจกแจงของตัวแปรสุ่ม

ประเภทของกฎการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่อง

ให้ตัวแปรสุ่มแยกรับค่า เอ็กซ์ 1 , เอ็กซ์ 2 , …, x n, …. ความน่าจะเป็นของค่าเหล่านี้สามารถคำนวณได้โดยใช้สูตรต่างๆ เช่น โดยใช้ทฤษฎีบทพื้นฐานของทฤษฎีความน่าจะเป็น สูตรของ Bernoulli หรือสูตรอื่นๆ สำหรับสูตรเหล่านี้บางสูตร กฎการกระจายมีชื่อของมันเอง

กฎทั่วไปของการแจกแจงของตัวแปรสุ่มแบบไม่ต่อเนื่อง ได้แก่ กฎการแจกแจงแบบทวินาม เรขาคณิต ไฮเปอร์จีโอเมตริก กฎการกระจายของปัวซอง

กฎการกระจายทวินาม

ปล่อยให้มันผลิต การพิจารณาคดีโดยอิสระ ซึ่งในแต่ละกรณีอาจมีเหตุการณ์เกิดขึ้นหรือไม่ก็ได้ แต่. ความน่าจะเป็นที่จะเกิดเหตุการณ์นี้ในการทดลองแต่ละครั้งมีค่าคงที่ ไม่ขึ้นกับจำนวนการทดลอง และมีค่าเท่ากับ =(แต่). ดังนั้น ความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น แต่ในการทดสอบแต่ละครั้งก็จะคงที่และเท่ากันด้วย ถาม=1–. พิจารณาตัวแปรสุ่ม เอ็กซ์เท่ากับจำนวนครั้งที่เกิดเหตุการณ์ แต่ใน การทดสอบ เห็นได้ชัดว่าค่าของปริมาณนี้เท่ากับ

เอ็กซ์ 1 = 0 - เหตุการณ์ แต่ใน ไม่ปรากฏการทดสอบ

เอ็กซ์ 2 = 1 – เหตุการณ์ แต่ใน การทดลองปรากฏขึ้นครั้งเดียว

เอ็กซ์ 3 = 2 - เหตุการณ์ แต่ใน การทดลองปรากฏขึ้นสองครั้ง

…………………………………………………………..

x n +1 = - เหตุการณ์ แต่ใน การทดสอบปรากฏทุกอย่าง ครั้งหนึ่ง.

ความน่าจะเป็นของค่าเหล่านี้สามารถคำนวณได้โดยใช้สูตร Bernoulli (4.1):

ที่ไหน ถึง=0, 1, 2, …, .

กฎการกระจายทวินาม เอ็กซ์, เท่ากับจำนวนความสำเร็จใน การทดลองของ Bernoulli มีโอกาสสำเร็จ .

ดังนั้น ตัวแปรสุ่มแบบไม่ต่อเนื่องมีการแจกแจงทวินาม (หรือกระจายตามกฎทวินาม) หากค่าที่เป็นไปได้คือ 0, 1, 2, …, และความน่าจะเป็นที่สอดคล้องกันคำนวณโดยสูตร (7.1)

การกระจายทวินามขึ้นอยู่กับสอง พารามิเตอร์ และ .

ชุดการกระจายของตัวแปรสุ่มที่กระจายตามกฎทวินามมีรูปแบบ:

เอ็กซ์ เค

ตัวอย่าง 7.1 . กระสุนสามนัดถูกยิงไปที่เป้าหมาย ความน่าจะเป็นในการยิงแต่ละครั้งคือ 0.4 ค่าสุ่ม เอ็กซ์- จำนวนการโจมตีเป้าหมาย สร้างชุดการกระจาย

วิธีการแก้. ค่าที่เป็นไปได้ของตัวแปรสุ่ม เอ็กซ์เป็น เอ็กซ์ 1 =0; เอ็กซ์ 2 =1; เอ็กซ์ 3 =2; เอ็กซ์ 4=3. ค้นหาความน่าจะเป็นที่สอดคล้องกันโดยใช้สูตรเบอร์นูลลี เป็นการง่ายที่จะแสดงว่าการใช้สูตรนี้ถูกต้องสมบูรณ์ โปรดทราบว่าความน่าจะเป็นที่จะไม่โดนเป้าหมายด้วยการยิงหนึ่งครั้งจะเท่ากับ 1-0.4=0.6 รับ

ชุดจำหน่ายมี มุมมองถัดไป:

เอ็กซ์
0,216 0,432 0,288 0,064

ง่ายต่อการตรวจสอบว่าผลรวมของความน่าจะเป็นทั้งหมดเท่ากับ 1 ตัวแปรสุ่มนั้นเอง เอ็กซ์กระจายตามกฎทวินาม ■

หากัน มูลค่าที่คาดหวังและความแปรปรวนของตัวแปรสุ่มที่กระจายตามกฎทวินาม

เมื่อแก้ตัวอย่างที่ 6.5 แสดงให้เห็นว่าการคาดคะเนทางคณิตศาสตร์ของจำนวนเหตุการณ์ที่เกิดขึ้น แต่ใน การทดสอบอิสระหากความน่าจะเป็นเกิดขึ้น แต่ในการทดสอบแต่ละครั้งมีค่าคงที่และเท่ากัน เท่ากับ ·

ในตัวอย่างนี้ ตัวแปรสุ่มถูกใช้โดยกระจายตามกฎทวินาม ดังนั้นคำตอบของตัวอย่างที่ 6.5 จึงเป็นการพิสูจน์ทฤษฎีบทต่อไปนี้

ทฤษฎีบท 7.1ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มแบบไม่ต่อเนื่องที่กระจายตามกฎทวินามจะเท่ากับผลคูณของจำนวนการทดลองและความน่าจะเป็นของ "ความสำเร็จ" เช่น (เอ็กซ์)=· ร.

ทฤษฎีบท 7.2ความแปรปรวนของตัวแปรสุ่มแบบไม่ต่อเนื่องที่กระจายตามกฎทวินามจะเท่ากับผลคูณของจำนวนการทดลองโดยความน่าจะเป็นของ "ความสำเร็จ" และความน่าจะเป็นของ "ความล้มเหลว" เช่น (เอ็กซ์)=npq

ความเบ้และความโด่งของตัวแปรสุ่มที่กระจายตามกฎทวินามถูกกำหนดโดยสูตร

สูตรเหล่านี้สามารถรับได้โดยใช้แนวคิดของช่วงเวลาเริ่มต้นและจุดศูนย์กลาง

กฎการกระจายทวินามรองรับหลายข้อ สถานการณ์จริง. ที่ ค่ามาก การแจกแจงแบบทวินามสามารถประมาณได้โดยการแจกแจงแบบอื่น โดยเฉพาะอย่างยิ่งการแจกแจงแบบปัวซอง

การกระจายปัวซอง

ปล่อยให้มี การทดลองแบร์นูลลีด้วยจำนวนการทดลอง ใหญ่พอ. ก่อนหน้านี้แสดงให้เห็นว่าในกรณีนี้ (ถ้านอกจากนี้ความน่าจะเป็น การพัฒนา แต่น้อยมาก) เพื่อหาความน่าจะเป็นของเหตุการณ์ แต่ที่จะปรากฏ ทีในการทดสอบคุณสามารถใช้สูตรปัวซอง (4.9) ถ้าตัวแปรสุ่ม เอ็กซ์หมายถึง จำนวนครั้งของเหตุการณ์ที่เกิดขึ้น แต่ใน การทดลองของ Bernoulli แล้วความน่าจะเป็นนั้น เอ็กซ์จะเอาความหมาย เคสามารถคำนวณได้ด้วยสูตร

, (7.2)

ที่ไหน λ = หมายเลข.

กฎการกระจายของปัวซองเรียกว่าการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่อง เอ็กซ์ซึ่งค่าที่เป็นไปได้คือจำนวนเต็มที่ไม่เป็นลบและความน่าจะเป็น พี ทีค่าเหล่านี้พบได้จากสูตร (7.2)

ค่า λ = หมายเลขเรียกว่า พารามิเตอร์การกระจายปัวซอง

ตัวแปรสุ่มที่กระจายตามกฎหมายปัวซองสามารถรับได้ ชุดที่ไม่มีที่สิ้นสุดค่า เนื่องจากสำหรับการแจกแจงความน่าจะเป็นนี้ การเกิดขึ้นของเหตุการณ์ในแต่ละการทดลองมีขนาดเล็ก ดังนั้นการแจกแจงนี้บางครั้งเรียกว่ากฎของปรากฏการณ์ที่หายาก

ชุดการกระจายของตัวแปรสุ่มที่กระจายตามกฎปัวซองมีรูปแบบ

เอ็กซ์ ที

เป็นการง่ายที่จะตรวจสอบว่าผลรวมของความน่าจะเป็นของแถวที่สองเท่ากับ 1 ในการทำเช่นนี้ เราต้องจำไว้ว่าสามารถขยายฟังก์ชันได้ในอนุกรม Maclaurin ซึ่งจะลู่เข้าหากัน เอ็กซ์. ที่ กรณีนี้เรามี

. (7.3)

ตามที่ระบุไว้ กฎของปัวซองในบางกรณีจะแทนที่กฎทวินาม ตัวอย่างคือตัวแปรสุ่ม เอ็กซ์ค่าที่เท่ากับจำนวนความล้มเหลวในช่วงเวลาหนึ่งโดยใช้อุปกรณ์ทางเทคนิคซ้ำ ๆ สันนิษฐานว่าอุปกรณ์นี้มีความน่าเชื่อถือสูงเช่น ความน่าจะเป็นของความล้มเหลวในแอปพลิเคชันเดียวนั้นน้อยมาก

นอกเหนือจากกรณีที่จำกัดดังกล่าวแล้ว ในทางปฏิบัติยังมีตัวแปรสุ่มที่แจกแจงตามกฎหมายปัวซอง ซึ่งไม่เกี่ยวข้องกับการแจกแจงแบบทวินาม ตัวอย่างเช่น การแจกแจงแบบปัวซองมักใช้เมื่อต้องจัดการกับจำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาหนึ่ง (จำนวนการโทรไปยังชุมสายโทรศัพท์ระหว่างชั่วโมง จำนวนรถที่มาถึงร้านล้างรถในระหว่างวัน จำนวนเครื่องหยุดต่อสัปดาห์ ฯลฯ .) เหตุการณ์ทั้งหมดเหล่านี้ต้องก่อให้เกิดสิ่งที่เรียกว่าการไหลของเหตุการณ์ ซึ่งเป็นหนึ่งในแนวคิดพื้นฐานของทฤษฎี เข้าคิว. พารามิเตอร์ λ แสดงลักษณะความเข้มเฉลี่ยของการไหลของเหตุการณ์


แน่นอน เมื่อคำนวณฟังก์ชันการแจกแจงแบบสะสม เราควรใช้ความสัมพันธ์ที่กล่าวถึงระหว่างการแจกแจงแบบทวินามและการแจกแจงแบบเบต้า วิธีนี้ดีกว่าการบวกโดยตรงเมื่อ n > 10

ในตำราคลาสสิกเกี่ยวกับสถิติ เพื่อให้ได้ค่าของการแจกแจงแบบทวินาม มักแนะนำให้ใช้สูตรตามทฤษฎีบทจำกัด (เช่น สูตร Moivre-Laplace) ควรสังเกตว่า จากมุมมองการคำนวณอย่างหมดจดค่าของทฤษฎีบทเหล่านี้มีค่าใกล้เคียงกับศูนย์ โดยเฉพาะอย่างยิ่งในปัจจุบัน เมื่อมีคอมพิวเตอร์ที่มีประสิทธิภาพในเกือบทุกโต๊ะ ข้อเสียเปรียบหลักของการประมาณข้างต้นคือความแม่นยำไม่เพียงพออย่างสมบูรณ์สำหรับค่า n ทั่วไปสำหรับแอปพลิเคชันส่วนใหญ่ ข้อเสียไม่น้อยไปกว่ากันคือการไม่มีคำแนะนำที่ชัดเจนเกี่ยวกับการบังคับใช้ของการประมาณหนึ่งหรืออย่างอื่น (เฉพาะสูตรซีมโทติคเท่านั้นที่มีให้ในข้อความมาตรฐาน ไม่ได้มาพร้อมกับการประมาณค่าที่แม่นยำ ดังนั้นจึงมีประโยชน์น้อย) ฉันจะบอกว่าทั้งสองสูตรใช้ได้กับ n เท่านั้น< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

ฉันไม่พิจารณาปัญหาในการค้นหาควอนไทล์ที่นี่: สำหรับการแจกแจงแบบไม่ต่อเนื่องมันเป็นเรื่องเล็กน้อยและในปัญหาเหล่านั้นที่การแจกแจงดังกล่าวเกิดขึ้นตามกฎแล้วจะไม่เกี่ยวข้องกัน หากยังต้องการปริมาณ ฉันแนะนำให้จัดรูปแบบปัญหาในลักษณะที่ทำงานกับค่า p (ความสำคัญที่สังเกตได้) นี่คือตัวอย่าง: เมื่อใช้อัลกอริธึมการแจงนับ ในแต่ละขั้นตอนจำเป็นต้องตรวจสอบ สมมติฐานทางสถิติเกี่ยวกับตัวแปรสุ่มทวินาม ตาม วิธีการแบบคลาสสิกในแต่ละขั้นตอนจำเป็นต้องคำนวณสถิติเกณฑ์และเปรียบเทียบค่ากับขอบเขตของชุดวิกฤต อย่างไรก็ตาม เนื่องจากอัลกอริทึมเป็นแบบแจกแจง จึงจำเป็นต้องกำหนดขอบเขตของชุดวิกฤตในแต่ละครั้งใหม่ (หลังจากนั้น ขนาดตัวอย่างจะเปลี่ยนจากขั้นหนึ่งไปอีกขั้นหนึ่ง) ซึ่งเพิ่มต้นทุนด้านเวลาอย่างไม่เกิดผล วิธีการที่ทันสมัยแนะนำให้คำนวณนัยสำคัญที่สังเกตได้และเปรียบเทียบกับ ระดับความเชื่อมั่นประหยัดในการค้นหาควอนไทล์

ดังนั้น โค้ดต่อไปนี้จะไม่คำนวณฟังก์ชันผกผัน แต่ให้ฟังก์ชัน rev_binomialDF แทน ซึ่งจะคำนวณความน่าจะเป็น p ของความสำเร็จในการทดลองครั้งเดียวโดยพิจารณาจากจำนวน n ของการทดลอง จำนวน m ของความสำเร็จในการทดลองเหล่านั้น และค่า y ของความน่าจะเป็นที่จะประสบความสำเร็จเหล่านี้ สิ่งนี้ใช้ความสัมพันธ์ดังกล่าวข้างต้นระหว่างการแจกแจงทวินามและเบต้า

ในความเป็นจริง ฟังก์ชันนี้ช่วยให้คุณได้รับขอบเขตของช่วงความเชื่อมั่น อันที่จริง สมมติว่าเราประสบความสำเร็จในการทดลองทวินาม n ครั้ง อย่างที่คุณทราบขอบซ้ายของสองด้าน ช่วงความมั่นใจสำหรับพารามิเตอร์ p ที่มีระดับความเชื่อมั่นเป็น 0 ถ้า m = 0 และ for คือคำตอบของสมการ . ในทำนองเดียวกัน ขอบเขตด้านขวาคือ 1 ถ้า m = n และ for คือคำตอบของสมการ . นี่ก็หมายความว่าเพื่อที่จะหาขอบเขตด้านซ้าย เราต้องแก้สมการ และเพื่อค้นหาสมการที่ถูกต้อง . ซึ่งแก้ไขได้ในฟังก์ชัน binom_leftCI และ binom_rightCI ซึ่งจะคืนค่าขอบเขตบนและล่างของช่วงความเชื่อมั่นสองด้านตามลำดับ

ฉันต้องการทราบว่าหากไม่ต้องการความแม่นยำอย่างเหลือเชื่อสำหรับ n ที่ใหญ่เพียงพอคุณสามารถใช้ค่าประมาณต่อไปนี้ [B.L. van der Waerden สถิติทางคณิตศาสตร์ M: IL, 1960, ช. 2 วินาที 7]: โดยที่ g คือควอไทล์ การแจกแจงแบบปกติ. ค่าของการประมาณนี้คือมีการประมาณแบบง่ายๆ ที่ให้คุณคำนวณปริมาณของการแจกแจงแบบปกติ (ดูข้อความเกี่ยวกับการคำนวณการแจกแจงแบบปกติและส่วนที่เกี่ยวข้องของข้อมูลอ้างอิงนี้) ในทางปฏิบัติของฉัน (ส่วนใหญ่สำหรับ n > 100) การประมาณนี้ให้ตัวเลขประมาณ 3-4 หลักซึ่งตามกฎแล้วค่อนข้างเพียงพอ

การคำนวณด้วยรหัสต่อไปนี้ต้องใช้ไฟล์ betaDF.h , betaDF.cpp (ดูหัวข้อการแจกแจงเบต้า) รวมทั้ง logGamma.h , logGamma.cpp (ดูภาคผนวก A) คุณยังสามารถดูตัวอย่างการใช้ฟังก์ชัน

ไฟล์ binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(การทดลองสองครั้ง ความสำเร็จสองครั้ง double p); /* * ให้มี "การทดลอง" ของการสังเกตอิสระ * ด้วยความน่าจะเป็น "p" ของความสำเร็จในแต่ละข้อ * คำนวณความน่าจะเป็น B(successes|trials,p) ที่จำนวน * ของความสำเร็จอยู่ระหว่าง 0 และ "สำเร็จ" (รวม) */ double rev_binomialDF(การทดลองสองครั้ง, สำเร็จสองครั้ง, double y); /* * ให้ความน่าจะเป็น y ของความสำเร็จอย่างน้อย m * เป็นที่รู้จักในการทดลองของโครงการ Bernoulli ฟังก์ชันค้นหาความน่าจะเป็น p * ของความสำเร็จในการทดลองครั้งเดียว * * ความสัมพันธ์ต่อไปนี้ใช้ในการคำนวณ * * 1 - p = rev_Beta(การทดลอง-ความสำเร็จ| ความสำเร็จ+1, y) */ double binom_leftCI(การทดลองสองครั้ง ความสำเร็จสองครั้ง ระดับสองเท่า); /* ให้มี "การทดลอง" ของการสังเกตอิสระ * โดยมีความน่าจะเป็น "p" ของความสำเร็จในแต่ละ * และจำนวนของความสำเร็จคือ "ความสำเร็จ" * ขอบเขตด้านซ้ายของช่วงความเชื่อมั่นสองด้าน * คำนวณด้วยระดับระดับนัยสำคัญ */ double binom_rightCI(double n, double สำเร็จ, double level); /* ให้มี "การทดลอง" ของการสังเกตอิสระ * โดยมีความน่าจะเป็น "p" ของความสำเร็จในแต่ละ * และจำนวนของความสำเร็จคือ "ความสำเร็จ" * ขอบเขตด้านขวาของช่วงความเชื่อมั่นสองด้าน * คำนวณด้วยระดับระดับนัยสำคัญ */ #endif /* สิ้นสุด #ifndef __BINOMIAL_H__ */

ไฟล์ binomialDF.cpp

/************************************************ **** **********/ /* การกระจายทวินาม */ /**************************** **** ***************************/ #ได้แก่ #รวม #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * ปล่อยให้มี "n" การสังเกตอิสระ * ด้วยความน่าจะเป็น "p" ของความสำเร็จในแต่ละรายการ * คำนวณความน่าจะเป็น B(m|n,p) ที่จำนวนความสำเร็จคือ * ระหว่าง 0 ถึง "m" (รวม) เช่น * ผลรวมของความน่าจะเป็นแบบทวินามตั้งแต่ 0 ถึง m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * การคำนวณไม่ได้หมายความถึงการบวกที่เป็นใบ้ - * ใช้ความสัมพันธ์ต่อไปนี้กับการแจกแจงเบต้าส่วนกลาง: * * B(m|n,p) = Beta(1-p|n-m,m+1) * * อาร์กิวเมนต์ต้องเป็นค่าบวก โดยมี 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (หน้า<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) กลับ 1; มิฉะนั้นจะส่งคืน BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * ให้ความน่าจะเป็น y ของความสำเร็จอย่างน้อย m * เป็นที่รู้จักในการทดลอง n ครั้งของแผน Bernoulli ฟังก์ชันค้นหาความน่าจะเป็น p * ของความสำเร็จในการทดลองครั้งเดียว * * ใช้ความสัมพันธ์ต่อไปนี้ในการคำนวณ * * 1 - p = rev_Beta(y|n-m,m+1) */ ( ยืนยัน((n > 0) && (m >= 0) && (ม<= n) && (y >= 0) && (ย<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (ม. >= 0) && (ม<= n) && (y >= 0.5) && (ย< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (ม. >= 0) && (ม<= n) && (y >= 0.5) && (ย< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

การแจกแจงความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่อง การกระจายทวินาม การกระจายปัวซอง การกระจายทางเรขาคณิต ฟังก์ชั่นการสร้าง

6. การแจกแจงความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่อง

6.1. การกระจายทวินาม

ปล่อยให้มันผลิต การทดลองที่เป็นอิสระซึ่งในแต่ละเหตุการณ์ อาจปรากฏหรือไม่ปรากฏก็ได้ ความน่าจะเป็น หน้าเกิดเหตุการณ์ ในการทดสอบทั้งหมดจะคงที่และไม่เปลี่ยนแปลงจากการทดสอบหนึ่งไปอีกการทดสอบหนึ่ง พิจารณาเป็นตัวแปรสุ่ม X จำนวนเหตุการณ์ที่เกิดขึ้น ในการทดสอบเหล่านี้ สูตรหาความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้น เรียบ เคครั้งหนึ่ง การทดสอบตามที่ทราบมีการอธิบายไว้ สูตรเบอร์นูลลี

การแจกแจงความน่าจะเป็นที่กำหนดโดยสูตร Bernoulli เรียกว่า ทวินาม .

กฎนี้เรียกว่า "ทวินาม" เพราะด้านขวาถือได้ว่าเป็นคำทั่วไปในการขยายทวินามของนิวตัน

เราเขียนกฎทวินามในรูปแบบของตาราง

หน้า

–1 ถาม

ถาม

ให้เราค้นหาลักษณะเชิงตัวเลขของการแจกแจงนี้

ตามคำจำกัดความของความคาดหวังทางคณิตศาสตร์สำหรับ DSW เรามี

.

ให้เราเขียนความเท่าเทียมกัน ซึ่งก็คือถังนิวตัน

.

และแยกความแตกต่างด้วยความเคารพต่อ p เป็นผลให้เราได้รับ

.

คูณทางซ้ายและ ด้านขวาบน หน้า:

.

กำหนดว่า หน้า+ ถาม=1 เรามี

(6.2)

ดังนั้น, การคาดการณ์ทางคณิตศาสตร์ของจำนวนเหตุการณ์ที่เกิดขึ้นในการทดลองอิสระจะเท่ากับผลคูณของจำนวนการทดลองบนความน่าจะเป็นหน้าการเกิดเหตุการณ์ในแต่ละคดี.

เราคำนวณการกระจายตามสูตร

.

สำหรับสิ่งนี้เราพบว่า

.

ขั้นแรก เราแยกความแตกต่างของสูตรทวินามของนิวตันสองครั้งด้วยความเคารพ หน้า:

แล้วคูณทั้งสองข้างของสมการด้วย หน้า 2:

เพราะเหตุนี้,

ความแปรปรวนของการแจกแจงแบบทวินามคือ

. (6.3)

ผลลัพธ์เหล่านี้สามารถหาได้จากการให้เหตุผลเชิงคุณภาพอย่างหมดจด จำนวนเหตุการณ์ A ที่เกิดขึ้นทั้งหมด X ในการทดลองทั้งหมดจะเพิ่มเข้ากับจำนวนเหตุการณ์ที่เกิดขึ้นในแต่ละการทดลอง ดังนั้น ถ้า X 1 เป็นจำนวนครั้งของเหตุการณ์ในการทดลองครั้งแรก X 2 ในครั้งที่สอง เป็นต้น ดังนั้น จำนวนทั้งหมดการเกิดเหตุการณ์ A ในการทดลองทั้งหมดเท่ากับ X=X 1 +X 2 +…+X . ตามคุณสมบัติของความคาดหวังทางคณิตศาสตร์:

แต่ละเงื่อนไขทางด้านขวาของความเท่าเทียมกันคือความคาดหวังทางคณิตศาสตร์ของจำนวนเหตุการณ์ในการทดสอบหนึ่ง ซึ่งเท่ากับความน่าจะเป็นของเหตุการณ์ ทางนี้,

ตามคุณสมบัติการกระจาย:

ตั้งแต่ และความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม ซึ่งรับได้เพียง 2 ค่า คือ 1 2 กับความน่าจะเป็น หน้าและ 0 2 ด้วยความน่าจะเป็น ถาม, แล้ว
. ทางนี้,
เป็นผลให้เราได้รับ

การใช้แนวคิดของช่วงเวลาเริ่มต้นและจุดศูนย์กลาง เราจะได้สูตรสำหรับความเบ้และความโด่ง:

. (6.4)

ข้าว. 6.1

รูปหลายเหลี่ยมของการแจกแจงทวินามมีรูปแบบดังต่อไปนี้ (ดูรูปที่ 6.1) ความน่าจะเป็น P (เค) เพิ่มขึ้นเป็นครั้งแรกด้วยการเพิ่มขึ้น เค, ถึง ค่าที่ยิ่งใหญ่ที่สุดแล้วก็เริ่มน้อยลง การแจกแจงแบบทวินามเบ้ ยกเว้นกรณี หน้า=0.5 โปรดทราบว่าเมื่อ จำนวนมากการทดสอบ การกระจายทวินามนั้นใกล้เคียงกับปกติมาก (การให้เหตุผลสำหรับข้อเสนอนี้เกี่ยวข้องกับทฤษฎีบท Moivre-Laplace ในท้องถิ่น)

ตัวเลข 0 เรียกว่าเหตุการณ์ที่เกิดขึ้นเป็นไปได้มากที่สุด ถ้าความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นตามจำนวนครั้งที่กำหนดในชุดการทดลองนี้มีค่ามากที่สุด (ค่าสูงสุดในรูปหลายเหลี่ยมการกระจาย). สำหรับการแจกแจงแบบทวินาม

ความคิดเห็น ความไม่เท่าเทียมกันนี้สามารถพิสูจน์ได้โดยใช้ สูตรที่เกิดซ้ำสำหรับความน่าจะเป็นทวินาม:

(6.6)

ตัวอย่าง 6.1ส่วนแบ่งของผลิตภัณฑ์ระดับพรีเมียมในองค์กรนี้คือ 31% ค่าเฉลี่ยและความแปรปรวนคืออะไร และจำนวนรายการพรีเมียมที่เป็นไปได้มากที่สุดในกลุ่มรายการ 75 รายการที่สุ่มเลือกคืออะไร

วิธีการแก้. เพราะว่า หน้า=0,31, ถาม=0,69, =75 แล้ว

ม[ เอ็กซ์] = = 750.31 = 23.25; ง[ เอ็กซ์] = npq = 750,310,69 = 16,04.

เพื่อหาจำนวนที่เป็นไปได้มากที่สุด 0 เราสร้างอสมการสองเท่า

มันจึงเป็นไปตามนั้น 0 = 23.