ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

วิธีคำนวณค่าเฉลี่ยในตัวอย่าง excel จะทำคะแนนเฉลี่ยใน excel ได้อย่างไร? วิธีการคำนวณมาตรฐาน

วิธีคำนวณค่าเฉลี่ยของตัวเลขใน Excel

หาค่าเฉลี่ย เลขคณิตใน Excel คุณสามารถใช้นามสกุล .

ไวยากรณ์ AVERAGE

=เฉลี่ย(หมายเลข1,[หมายเลข2],…) - เวอร์ชั่นรัสเซีย

อาร์กิวเมนต์ AVERAGE

  • หมายเลข1- ตัวเลขหรือช่วงแรกสำหรับการคำนวณค่าเฉลี่ยเลขคณิต
  • หมายเลข2(ไม่บังคับ) – ตัวเลขที่สองหรือช่วงของตัวเลขเพื่อคำนวณค่าเฉลี่ยเลขคณิต จำนวนเงินสูงสุดอาร์กิวเมนต์ของฟังก์ชัน - 255

ในการคำนวณ ให้ทำตามขั้นตอนต่อไปนี้:

  • เลือกเซลล์ใดก็ได้
  • เขียนสูตรลงไป =เฉลี่ย(
  • เลือกช่วงของเซลล์ที่คุณต้องการคำนวณ
  • กดปุ่ม "Enter" บนแป้นพิมพ์

ฟังก์ชันจะคำนวณค่าเฉลี่ยในช่วงที่ระบุในเซลล์ที่มีตัวเลข

วิธีหาค่าเฉลี่ยที่ให้ข้อความ

หากมีบรรทัดหรือข้อความว่างในช่วงข้อมูล ฟังก์ชันจะถือว่าเป็น "ศูนย์" หากข้อมูลมี นิพจน์บูลีน FALSE หรือ TRUE จากนั้นฟังก์ชันจะถือว่า FALSE เป็น "ศูนย์" และ TRUE เป็น "1"

วิธีหาค่าเฉลี่ยเลขคณิตตามเงื่อนไข

ฟังก์ชันนี้ใช้เพื่อคำนวณค่าเฉลี่ยตามเงื่อนไขหรือเกณฑ์ ตัวอย่างเช่น สมมติว่าเรามีข้อมูลการขายผลิตภัณฑ์:

งานของเราคือการคำนวณยอดขายเฉลี่ยของปากกา ในการทำเช่นนี้ เราจะทำตามขั้นตอนต่อไปนี้:

  • ในเซลล์ A13เขียนชื่อผลิตภัณฑ์ "ปากกา";
  • ในเซลล์ B13มาใส่สูตรกัน:

=ค่าเฉลี่ย(A2:A10,A13,B2:B10)

ช่วงเซลล์ “ A2:A10” ชี้ไปที่รายการผลิตภัณฑ์ที่เราจะค้นหาคำว่า “ปากกา” การโต้แย้ง A13นี่คือลิงก์ไปยังเซลล์ที่มีข้อความที่เราจะค้นหาจากรายชื่อผลิตภัณฑ์ทั้งหมด ช่วงเซลล์ “ B2:B10” คือช่วงที่มีข้อมูลการขายผลิตภัณฑ์ โดยฟังก์ชันจะค้นหา “ปากกา” และคำนวณค่าเฉลี่ย


ในกรณีส่วนใหญ่ ข้อมูลจะกระจุกตัวอยู่ที่จุดศูนย์กลางบางส่วน ดังนั้น เพื่ออธิบายชุดข้อมูลใดๆ การระบุค่าเฉลี่ยก็เพียงพอแล้ว มาดูสามตัวกันดีกว่า ลักษณะเชิงตัวเลขซึ่งใช้ในการประมาณค่าเฉลี่ยของการแจกแจง: ค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และโหมด

เฉลี่ย

ค่าเฉลี่ยเลขคณิต (มักเรียกง่ายๆ ว่า ค่าเฉลี่ย) คือค่าประมาณทั่วไปของค่าเฉลี่ยของการแจกแจง เป็นผลจากการหารผลรวมของสิ่งที่สังเกตได้ทั้งหมด ค่าตัวเลขสำหรับจำนวนของพวกเขา สำหรับตัวอย่างตัวเลข X 1, X 2, ..., X, ค่าเฉลี่ยตัวอย่าง (แสดงด้วยสัญลักษณ์ ) เท่ากับ \u003d (X 1 + X 2 + ... + X) / , หรือ

ค่าเฉลี่ยตัวอย่างอยู่ที่ไหน - ขนาดตัวอย่าง, Xผมองค์ประกอบที่ iตัวอย่าง

ดาวน์โหลดบันทึกในรูปแบบหรือรูปแบบ ตัวอย่างในรูปแบบ

พิจารณาการคำนวณค่าเฉลี่ย ค่าเลขคณิตผลตอบแทนประจำปีเฉลี่ย 5 ปีของกองทุนรวม 15 กองทุนด้วยมาก ระดับสูงความเสี่ยง (รูปที่ 1).

ข้าว. 1. ผลตอบแทนเฉลี่ยต่อปีของ 15 กองทุนรวมที่มีความเสี่ยงสูงมาก

ค่าเฉลี่ยตัวอย่างคำนวณได้ดังนี้:

นี่เป็นผลตอบแทนที่ดี โดยเฉพาะอย่างยิ่งเมื่อเทียบกับผลตอบแทน 3-4% ที่ธนาคารหรือผู้ฝากเครดิตยูเนี่ยนได้รับในช่วงเวลาเดียวกัน หากคุณจัดเรียงมูลค่าที่ส่งคืน จะเห็นได้ง่ายว่ากองทุนแปดกองทุนมีผลตอบแทนที่สูงกว่า และเจ็ดกองทุนต่ำกว่าค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตทำหน้าที่เป็นจุดสมดุล เพื่อให้กองทุนที่มีรายได้ต่ำสร้างสมดุลให้กับกองทุนที่มีรายได้สูง องค์ประกอบทั้งหมดของตัวอย่างมีส่วนร่วมในการคำนวณค่าเฉลี่ย ไม่มีตัวประมาณค่าอื่นๆ ของค่าเฉลี่ยการกระจายมีคุณสมบัตินี้

เมื่อคำนวณค่าเฉลี่ยเลขคณิตเนื่องจากค่าเฉลี่ยเลขคณิตขึ้นอยู่กับองค์ประกอบทั้งหมดของตัวอย่าง การมีค่ามากจึงส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ ในสถานการณ์เช่นนี้ ค่าเฉลี่ยเลขคณิตสามารถบิดเบือนความหมายของข้อมูลตัวเลขได้ ดังนั้น เมื่ออธิบายชุดข้อมูลที่มีค่าสุดขั้ว จำเป็นต้องระบุค่ามัธยฐานหรือค่าเฉลี่ยเลขคณิตและค่ามัธยฐาน ตัวอย่างเช่น หากนำผลตอบแทนของกองทุน RS Emerging Growth ออกจากกลุ่มตัวอย่าง ค่าเฉลี่ยตัวอย่างของผลตอบแทนของกองทุน 14 กองทุนจะลดลงเกือบ 1% เป็น 5.19%

ค่ามัธยฐาน

ค่ามัธยฐานคือค่ากลางของอาร์เรย์ตัวเลข หากอาร์เรย์ไม่มีตัวเลขซ้ำกัน องค์ประกอบครึ่งหนึ่งจะน้อยกว่าค่ามัธยฐานครึ่งหนึ่ง หากตัวอย่างมีค่ามาก ควรใช้ค่ามัธยฐานมากกว่าค่าเฉลี่ยเลขคณิตในการประมาณค่าเฉลี่ย ในการคำนวณค่ามัธยฐานของตัวอย่าง จะต้องเรียงลำดับก่อน

สูตรนี้คลุมเครือ ผลลัพธ์ขึ้นอยู่กับว่าตัวเลขเป็นคู่หรือคี่ :

  • หากตัวอย่างมีจำนวนรายการคี่ ค่ามัธยฐานคือ (n+1)/2-องค์ประกอบที่
  • หากตัวอย่างมีองค์ประกอบเป็นจำนวนคู่ ค่ามัธยฐานจะอยู่ระหว่างองค์ประกอบตรงกลางทั้งสองของตัวอย่างและเท่ากับค่าเฉลี่ยเลขคณิตที่คำนวณจากองค์ประกอบทั้งสองนี้

ในการคำนวณค่ามัธยฐานสำหรับกลุ่มตัวอย่าง 15 กองทุนที่มีความเสี่ยงสูงมาก อันดับแรก เราต้องเรียงลำดับข้อมูลดิบ (ภาพที่ 2) จากนั้นค่ามัธยฐานจะอยู่ตรงข้ามกับจำนวนองค์ประกอบตรงกลางของกลุ่มตัวอย่าง ในตัวอย่างหมายเลข 8 ของเรา Excel มีฟังก์ชันพิเศษ =MEDIAN() ที่ทำงานกับอาร์เรย์ที่ไม่เรียงลำดับเช่นกัน

ข้าว. 2. ค่ามัธยฐาน 15 กองทุน

ดังนั้น ค่ามัธยฐานคือ 6.5 ซึ่งหมายความว่าครึ่งหนึ่งของกองทุนที่มีความเสี่ยงสูงมากไม่เกิน 6.5 ในขณะที่อีกครึ่งหนึ่งทำเช่นนั้น โปรดทราบว่าค่ามัธยฐานของ 6.5 นั้นมากกว่าค่ามัธยฐานของ 6.08 เล็กน้อย

หากเราลบความสามารถในการทำกำไรของกองทุน RS Emerging Growth ออกจากกลุ่มตัวอย่าง ค่ามัธยฐานของกองทุนที่เหลือ 14 กองทุนจะลดลงเหลือ 6.2% นั่นคือไม่เท่ากับค่าเฉลี่ยเลขคณิต (รูปที่ 3)

ข้าว. 3. ค่ามัธยฐาน 14 กองทุน

แฟชั่น

คำนี้ถูกนำมาใช้ครั้งแรกโดยเพียร์สันในปี พ.ศ. 2437 แฟชั่นเป็นตัวเลขที่เกิดขึ้นบ่อยที่สุดในกลุ่มตัวอย่าง (ทันสมัยที่สุด) แฟชั่นอธิบายได้ดี ตัวอย่างเช่น ปฏิกิริยาทั่วไปของผู้ขับขี่ต่อสัญญาณไฟจราจรเพื่อหยุดการจราจร ตัวอย่างคลาสสิกการใช้แฟชั่น - การเลือกขนาดของรองเท้าที่ผลิตหรือสีของวอลล์เปเปอร์ หากการกระจายมีหลายโหมด จะเรียกว่าต่อเนื่องหลายรูปแบบหรือหลายรูปแบบ (มี "จุดสูงสุด" สองจุดขึ้นไป) การกระจายหลายรูปแบบให้ ข้อมูลสำคัญเกี่ยวกับธรรมชาติของตัวแปรที่กำลังศึกษา ตัวอย่างเช่น ในการสำรวจทางสังคมวิทยา หากตัวแปรแสดงถึงความชอบหรือทัศนคติต่อบางสิ่งบางอย่าง ความหลายหลากอาจหมายความว่ามีความคิดเห็นที่แตกต่างกันหลายประการอย่างชัดเจน หลายรูปแบบยังเป็นตัวบ่งชี้ว่าตัวอย่างไม่เป็นเนื้อเดียวกันและการสังเกตอาจถูกสร้างขึ้นโดยการแจกแจงแบบ "คาบเกี่ยวกัน" สองครั้งหรือมากกว่า ไม่เหมือนกับค่าเฉลี่ยเลขคณิต ค่าผิดปกติจะไม่ส่งผลต่อโหมด สำหรับตัวแปรสุ่มแบบกระจายอย่างต่อเนื่อง เช่น ผลตอบแทนเฉลี่ยต่อปีของกองทุนรวม บางครั้งโหมดนี้ไม่มีอยู่เลย (หรือไม่สมเหตุสมผล) เนื่องจากตัวบ่งชี้เหล่านี้สามารถรับค่าต่างๆ ได้ ค่าที่เกิดซ้ำจึงหายากมาก

ควอร์ไทล์

ควอร์ไทล์เป็นหน่วยวัดที่ใช้บ่อยที่สุดในการประเมินการกระจายข้อมูลเมื่ออธิบายคุณสมบัติของตัวอย่างที่เป็นตัวเลขขนาดใหญ่ ในขณะที่ค่ามัธยฐานแบ่งอาร์เรย์ที่เรียงลำดับออกเป็นครึ่งหนึ่ง (50% ขององค์ประกอบอาร์เรย์มีค่าน้อยกว่าค่ามัธยฐานและมากกว่า 50%) ควอร์ไทล์จะแบ่งชุดข้อมูลที่สั่งซื้อออกเป็นสี่ส่วน ค่า Q 1 ค่ามัธยฐานและ Q 3 คือเปอร์เซ็นไทล์ที่ 25, 50 และ 75 ตามลำดับ ควอร์ไทล์แรก Q 1 เป็นตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วน: 25% ขององค์ประกอบน้อยกว่าและ 75% เป็น มากกว่าครั้งแรกควอร์ไทล์

ควอร์ไทล์ที่สาม Q 3 เป็นตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วนด้วย: 75% ขององค์ประกอบน้อยกว่าและ 25% มากกว่าควอร์ไทล์ที่สาม

ในการคำนวณควอไทล์ใน Excel เวอร์ชันก่อนปี 2550 จะใช้ฟังก์ชัน =QUARTILE(array, part) เริ่มต้นด้วย Excel 2010 สองฟังก์ชันที่ใช้:

  • =QUARTILE.ON(อาร์เรย์ ส่วนหนึ่ง)
  • =QUARTILE.EXC(อาร์เรย์ ส่วน)

ฟังก์ชันทั้งสองนี้ให้ประโยชน์เล็กน้อย ความหมายต่างๆ(รูปที่ 4). ตัวอย่างเช่น เมื่อคำนวณควอร์ไทล์ของกลุ่มตัวอย่างที่มีข้อมูลผลตอบแทนประจำปีเฉลี่ยของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน Q 1 = 1.8 หรือ -0.7 สำหรับ QUARTILE.INC และ QUARTILE.EXC ตามลำดับ อย่างไรก็ตาม ฟังก์ชัน QUARTILE ที่ใช้ก่อนหน้านี้สอดคล้องกับ ฟังก์ชั่นที่ทันสมัย QUARTILE ON ในการคำนวณควอร์ไทล์ใน Excel โดยใช้สูตรข้างต้น อาร์เรย์ข้อมูลสามารถปล่อยไว้แบบไม่เรียงลำดับได้

ข้าว. 4. คำนวณควอร์ไทล์ใน Excel

มาเน้นย้ำกันอีกครั้ง Excel สามารถคำนวณควอไทล์สำหรับ univariate ซีรีส์ไม่ต่อเนื่อง ซึ่งประกอบด้วยค่า ตัวแปรสุ่ม. การคำนวณควอไทล์สำหรับการแจกแจงตามความถี่แสดงไว้ในส่วนด้านล่าง

เฉลี่ยเรขาคณิต

ไม่เหมือนกับค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยเรขาคณิตจะวัดว่าตัวแปรเปลี่ยนแปลงไปมากเพียงใดในช่วงเวลาหนึ่ง ค่าเฉลี่ยเรขาคณิตคือรูต th องศาจากผลิตภัณฑ์ ค่า (ใน Excel ใช้ฟังก์ชัน = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

พารามิเตอร์ที่คล้ายกันคือค่าเฉลี่ย ค่าเรขาคณิตอัตราผลตอบแทนถูกกำหนดโดยสูตร:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

ที่ไหน อาร์ ไอ- อัตราผลตอบแทน ผม- ช่วงเวลาที่.

ตัวอย่างเช่น สมมติว่าเงินลงทุนเริ่มแรกคือ 100,000 ดอลลาร์ เมื่อสิ้นสุดปีแรก จะลดลงเหลือ 50,000 ดอลลาร์ และภายในสิ้นปีที่สอง จะกู้คืนเป็น 100,000 ดอลลาร์เดิม อัตราผลตอบแทนจากการลงทุนนี้มากกว่าสอง ระยะเวลาปีเท่ากับ 0 เนื่องจากจำนวนเงินเริ่มต้นและขั้นสุดท้ายเท่ากัน อย่างไรก็ตาม ค่าเฉลี่ยเลขคณิต อัตรารายปีกำไรคือ = (-0.5 + 1) / 2 = 0.25 หรือ 25% เนื่องจากอัตราผลตอบแทนในปีแรก R 1 = (50,000 - 100,000) / 100,000 = -0.5 และในวินาที R 2 = (100,000 – 50,000) / 50,000 = 1 ในขณะเดียวกันค่าเฉลี่ยเรขาคณิตของอัตราผลตอบแทนสำหรับสองปีคือ: G = [(1–0.5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0 ดังนั้น ค่าเฉลี่ยเรขาคณิตสะท้อนการเปลี่ยนแปลงได้แม่นยำยิ่งขึ้น (แม่นยำกว่า คือ ไม่มีการเปลี่ยนแปลง) ในปริมาณการลงทุนในช่วงครึ่งปีมากกว่าค่าเฉลี่ยเลขคณิต

ข้อเท็จจริงที่น่าสนใจ.อย่างแรก ค่าเฉลี่ยเรขาคณิตจะน้อยกว่าค่าเฉลี่ยเลขคณิตของตัวเลขเดียวกันเสมอ ยกเว้นกรณีที่ตัวเลขที่นำมาทั้งหมดมีค่าเท่ากัน ประการที่สอง พิจารณาคุณสมบัติ สามเหลี่ยมมุมฉากคุณสามารถเข้าใจได้ว่าทำไมค่าเฉลี่ยจึงเรียกว่าเรขาคณิต ความสูงของสามเหลี่ยมมุมฉากที่ลดลงถึงด้านตรงข้ามมุมฉากเป็นสัดส่วนเฉลี่ยระหว่างการฉายภาพของขาบนด้านตรงข้ามมุมฉาก และขาแต่ละข้างเป็นสัดส่วนเฉลี่ยระหว่างด้านตรงข้ามมุมฉากกับการฉายภาพบนด้านตรงข้ามมุมฉาก (รูปที่ 5) นี่เป็นวิธีทางเรขาคณิตในการสร้างค่าเฉลี่ยเรขาคณิตของสองส่วน (ความยาว) คุณต้องสร้างวงกลมบนผลรวมของทั้งสองส่วนนี้เป็นเส้นผ่านศูนย์กลาง จากนั้นจึงเพิ่มความสูงจากจุดเชื่อมต่อไปยังจุดตัดด้วย วงกลมจะให้ค่าที่ต้องการ:

ข้าว. 5. ลักษณะทางเรขาคณิตของค่าเฉลี่ยเรขาคณิต (รูปจาก Wikipedia)

ที่สอง ทรัพย์สินที่สำคัญข้อมูลตัวเลข - พวกเขา รูปแบบต่างๆระบุระดับการกระจายตัวของข้อมูล ตัวอย่างที่แตกต่างกันสองตัวอย่างสามารถแตกต่างกันได้ทั้งในค่าเฉลี่ยและในรูปแบบต่างๆ อย่างไรก็ตาม ดังแสดงในรูปที่ 6 และ 7 ตัวอย่างสองตัวอย่างสามารถมีความผันแปรเหมือนกัน แต่มีค่าเฉลี่ยต่างกัน หรือค่าเฉลี่ยเดียวกันและรูปแบบต่างกันโดยสิ้นเชิง ข้อมูลที่สอดคล้องกับรูปหลายเหลี่ยม B ในรูปที่ 7 เปลี่ยนแปลงน้อยกว่าข้อมูลที่สร้างรูปหลายเหลี่ยม A มาก

ข้าว. 6. การแจกแจงรูประฆังแบบสมมาตรสองชุดโดยมีค่าสเปรดเท่ากันและค่าเฉลี่ยต่างกัน

ข้าว. 7. การแจกแจงรูประฆังสมมาตรสองชุดที่มีค่าเฉลี่ยเท่ากันและการกระจายต่างกัน

ค่าประมาณการแปรผันของข้อมูลมีห้าค่า:

ขอบเขต

พิสัยคือความแตกต่างระหว่างองค์ประกอบที่ใหญ่ที่สุดและเล็กที่สุดของกลุ่มตัวอย่าง:

รูด = XMax-Xนาที

ช่วงของกลุ่มตัวอย่างที่มีผลตอบแทนเฉลี่ยต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุนสามารถคำนวณได้โดยใช้อาร์เรย์ที่สั่งซื้อ (ดูรูปที่ 4): ช่วง = 18.5 - (-6.1) = 24.6 ซึ่งหมายความว่าความแตกต่างระหว่างผลตอบแทนรายปีเฉลี่ยสูงสุดและต่ำสุดสำหรับกองทุนที่มีความเสี่ยงสูงมากคือ 24.6%

ช่วงการวัดการแพร่กระจายโดยรวมของข้อมูล แม้ว่าช่วงตัวอย่างจะเป็นการประมาณการอย่างง่ายของการกระจายข้อมูลทั้งหมด แต่จุดอ่อนของมันคือไม่คำนึงถึงวิธีการกระจายข้อมูลระหว่างองค์ประกอบต่ำสุดและสูงสุด เอฟเฟกต์นี้เห็นได้ชัดเจนในรูปที่ 8 ซึ่งแสดงตัวอย่างที่มีช่วงเดียวกัน มาตราส่วน B แสดงว่าถ้าตัวอย่างมีค่าสุดขั้วอย่างน้อยหนึ่งค่า ช่วงตัวอย่างจะเป็นค่าประมาณการกระจายของข้อมูลที่ไม่ถูกต้องแม่นยำมาก

ข้าว. 8. การเปรียบเทียบตัวอย่างสามตัวอย่างที่มีช่วงเดียวกัน สามเหลี่ยมเป็นสัญลักษณ์ของการสนับสนุนความสมดุลและตำแหน่งของมันสอดคล้องกับค่าเฉลี่ยของกลุ่มตัวอย่าง

ช่วงระหว่างควอไทล์

ช่วงระหว่างควอไทล์หรือค่าเฉลี่ยคือความแตกต่างระหว่างควอไทล์ที่สามและควอไทล์แรกของตัวอย่าง:

ช่วงระหว่างควอไทล์ \u003d Q 3 - Q 1

ค่านี้ทำให้สามารถประมาณการการแพร่กระจายขององค์ประกอบ 50% และไม่คำนึงถึงอิทธิพลขององค์ประกอบที่รุนแรง ช่วงระหว่างควอไทล์สำหรับตัวอย่างที่มีข้อมูลเกี่ยวกับผลตอบแทนประจำปีเฉลี่ยของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน สามารถคำนวณได้โดยใช้ข้อมูลในรูปที่ 4 (ตัวอย่างเช่น สำหรับฟังก์ชัน QUARTILE.EXC): ช่วงระหว่างควอไทล์ = 9.8 - (-0.7) = 10.5 ช่วงเวลาระหว่าง 9.8 ถึง -0.7 มักเรียกว่าครึ่งกลาง

ควรสังเกตว่าค่า Q 1 และ Q 3 และด้วยเหตุนี้ช่วงระหว่างควอไทล์ไม่ขึ้นอยู่กับการมีอยู่ของค่าผิดปกติ เนื่องจากการคำนวณไม่คำนึงถึงค่าใดๆ ที่จะน้อยกว่า Q 1 หรือมากกว่า Q 3 . ทั้งหมด ลักษณะเชิงปริมาณเช่น ค่ามัธยฐาน ควอร์ไทล์ที่หนึ่งและสาม และพิสัยระหว่างควอร์ไทล์ซึ่งไม่ได้รับผลกระทบจากค่าผิดปกติ จะเรียกว่าการวัดที่แข็งแกร่ง

แม้ว่าพิสัยและพิสัยระหว่างควอไทล์จะให้ค่าประมาณการกระจัดกระจายรวมและค่าเฉลี่ยของกลุ่มตัวอย่าง ตามลำดับ การประมาณการเหล่านี้ไม่ได้คำนึงถึงวิธีการกระจายข้อมูลอย่างแน่นอน ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานปราศจากข้อบกพร่องนี้ ตัวชี้วัดเหล่านี้ช่วยให้คุณประเมินระดับความผันผวนของข้อมูลรอบค่าเฉลี่ยได้ ความแปรปรวนตัวอย่างเป็นการประมาณของค่าเฉลี่ยเลขคณิตที่คำนวณจากผลต่างกำลังสองระหว่างแต่ละองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง สำหรับตัวอย่าง X 1 , X 2 , ... X n ความแปรปรวนตัวอย่าง (แสดงด้วยสัญลักษณ์ S 2 ถูกกำหนดโดยสูตรต่อไปนี้:

ที่ กรณีทั่วไปความแปรปรวนตัวอย่างคือผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง หารด้วยค่าที่เท่ากับขนาดกลุ่มตัวอย่างลบหนึ่ง:

ที่ไหน - ค่าเฉลี่ยเลขคณิต - ขนาดตัวอย่าง, X ฉัน - ผม-th องค์ประกอบตัวอย่าง X. ใน Excel ก่อนเวอร์ชัน 2007 สำหรับการคำนวณ ความแปรปรวนตัวอย่างฟังก์ชัน =VAR() ถูกใช้ เนื่องจากเวอร์ชัน 2010 จะใช้ฟังก์ชัน =VAR.B()

ค่าประมาณการกระจายข้อมูลที่ใช้ได้จริงและเป็นที่ยอมรับกันมากที่สุดคือ มาตรฐาน ส่วนเบี่ยงเบนที่เลือก . ตัวบ่งชี้นี้แสดงด้วยสัญลักษณ์ S และเท่ากับ รากที่สองจากความแปรปรวนตัวอย่าง:

ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =STDEV() ถูกใช้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐาน จากเวอร์ชัน 2010 จะใช้ฟังก์ชัน =STDEV.V() ในการคำนวณฟังก์ชันเหล่านี้ อาร์เรย์ข้อมูลสามารถเรียงลำดับได้

ความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่างไม่สามารถเป็นค่าลบได้ สถานการณ์เดียวที่ตัวบ่งชี้ S 2 และ S สามารถเป็นศูนย์ได้คือถ้าองค์ประกอบทั้งหมดของตัวอย่างเท่ากัน ในนี้อย่างสมบูรณ์ คดีเหลือเชื่อพิสัยและพิสัยระหว่างควอไทล์ก็เป็นศูนย์เช่นกัน

ข้อมูลตัวเลขมีความผันผวนโดยเนื้อแท้ ตัวแปรใดๆ ก็สามารถใช้กับเซตได้ ค่านิยมที่แตกต่างกัน. ตัวอย่างเช่น กองทุนรวมต่าง ๆ มีอัตราผลตอบแทนและการสูญเสียที่แตกต่างกัน เนื่องจากความแปรปรวนของข้อมูลตัวเลข สิ่งสำคัญมากคือการศึกษาไม่เพียงแต่ค่าประมาณของค่าเฉลี่ยซึ่งเป็นผลรวมตามธรรมชาติเท่านั้น แต่ยังรวมถึงการประมาณค่าความแปรปรวนซึ่งแสดงลักษณะการกระจายของข้อมูลด้วย

ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานทำให้เราสามารถประมาณการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ย หรืออีกนัยหนึ่งคือ เพื่อกำหนดจำนวนองค์ประกอบในกลุ่มตัวอย่างที่น้อยกว่าค่าเฉลี่ย และจำนวนที่มากกว่า การกระจายตัวมีค่าบางอย่าง คุณสมบัติทางคณิตศาสตร์. อย่างไรก็ตาม ค่าของมันคือกำลังสองของหน่วยวัด - เปอร์เซ็นต์กำลังสอง ตารางดอลลาร์ ตารางนิ้ว ฯลฯ ดังนั้น การประมาณค่าความแปรปรวนตามธรรมชาติจึงเป็นค่าเบี่ยงเบนมาตรฐาน ซึ่งแสดงในหน่วยการวัดปกติ - เปอร์เซ็นต์ของรายได้ ดอลลาร์ หรือนิ้ว

ค่าเบี่ยงเบนมาตรฐานทำให้คุณสามารถประมาณปริมาณความผันผวนขององค์ประกอบตัวอย่างรอบๆ ค่าเฉลี่ยได้ ในเกือบทุกสถานการณ์ ค่าที่สังเกตได้ส่วนใหญ่อยู่ภายในค่าบวกหรือลบหนึ่งค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ดังนั้น เมื่อทราบค่าเฉลี่ยเลขคณิตขององค์ประกอบตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่างแล้ว จึงสามารถกำหนดช่วงเวลาของข้อมูลจำนวนมากได้

ค่าเบี่ยงเบนมาตรฐานของผลตอบแทนจากกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน คือ 6.6 (ภาพที่ 9) ซึ่งหมายความว่าความสามารถในการทำกำไรของกองทุนจำนวนมากแตกต่างจากมูลค่าเฉลี่ยไม่เกิน 6.6% (กล่าวคือ มีความผันผวนอยู่ในช่วงตั้งแต่ – ส= 6.2 – 6.6 = –0.4 ถึง +เ= 12.8) อันที่จริง ช่วงเวลานี้มีผลตอบแทนประจำปีเฉลี่ย 5 ปีที่ 53.3% (8 จาก 15) ของเงินทุน

ข้าว. 9. ส่วนเบี่ยงเบนมาตรฐาน

โปรดทราบว่าในกระบวนการหาผลต่างกำลังสอง สิ่งของที่อยู่ไกลจากค่าเฉลี่ยจะมีน้ำหนักมากกว่าสิ่งของที่อยู่ใกล้ คุณสมบัตินี้เป็นเหตุผลหลักว่าทำไมค่าเฉลี่ยเลขคณิตจึงมักใช้ในการประมาณค่าเฉลี่ยของการแจกแจง

ค่าสัมประสิทธิ์การแปรผัน

ค่าสัมประสิทธิ์การแปรผันเป็นค่าประมาณสัมพัทธ์ซึ่งแตกต่างจากการประมาณการแบบกระจายครั้งก่อน มันถูกวัดเป็นเปอร์เซ็นต์เสมอ ไม่ใช่ในหน่วยข้อมูลดั้งเดิม ค่าสัมประสิทธิ์การแปรผันซึ่งแสดงด้วยสัญลักษณ์ CV วัดการกระจายของข้อมูลรอบค่าเฉลี่ย ค่าสัมประสิทธิ์การแปรผันเท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยค่าเฉลี่ยเลขคณิตและคูณด้วย 100%:

ที่ไหน - ส่วนเบี่ยงเบนตัวอย่างมาตรฐาน - ค่าเฉลี่ยตัวอย่าง

ค่าสัมประสิทธิ์การแปรผันทำให้คุณสามารถเปรียบเทียบตัวอย่างสองตัวอย่าง ซึ่งองค์ประกอบต่างๆ จะแสดงในหน่วยการวัดที่ต่างกัน ตัวอย่างเช่น ผู้จัดการบริการจัดส่งทางไปรษณีย์ตั้งใจที่จะอัพเกรดกองรถบรรทุก เมื่อโหลดหีบห่อ มีข้อจำกัดสองประเภทที่ต้องพิจารณา: น้ำหนัก (เป็นปอนด์) และปริมาตร (เป็นลูกบาศก์ฟุต) ของแต่ละบรรจุภัณฑ์ สมมติว่าในตัวอย่าง 200 ถุง น้ำหนักเฉลี่ย 26.0 ปอนด์ ส่วนเบี่ยงเบนมาตรฐานของน้ำหนัก 3.9 ปอนด์ ปริมาตรบรรจุภัณฑ์เฉลี่ย 8.8 ลูกบาศก์ฟุต และค่าเบี่ยงเบนมาตรฐานของปริมาตรคือ 2.2 ลูกบาศก์ฟุต จะเปรียบเทียบการกระจายน้ำหนักและปริมาตรของบรรจุภัณฑ์ได้อย่างไร?

เนื่องจากหน่วยวัดน้ำหนักและปริมาตรต่างกัน ผู้จัดการต้องเปรียบเทียบการกระจายแบบสัมพัทธ์ของค่าเหล่านี้ ค่าสัมประสิทธิ์การแปรผันของน้ำหนักคือ CV W = 3.9 / 26.0 * 100% = 15% และค่าสัมประสิทธิ์การแปรผันของปริมาตร CV V = 2.2 / 8.8 * 100% = 25% . ดังนั้นการกระจายแบบสัมพัทธ์ของปริมาณแพ็กเก็ตจึงมากกว่าการกระจายแบบสัมพัทธ์ของน้ำหนัก

แบบฟอร์มการจัดจำหน่าย

คุณสมบัติที่สำคัญประการที่สามของกลุ่มตัวอย่างคือรูปแบบของการกระจาย การกระจายนี้สามารถเป็นแบบสมมาตรหรือไม่สมมาตรก็ได้ เพื่ออธิบายรูปร่างของการแจกแจง จำเป็นต้องคำนวณค่าเฉลี่ยและค่ามัธยฐาน หากการวัดทั้งสองนี้เหมือนกัน ตัวแปรจะถูกกล่าวว่ามีการกระจายแบบสมมาตร หากค่าเฉลี่ยของตัวแปรมากกว่าค่ามัธยฐาน การแจกแจงจะมีความเบ้เป็นบวก (รูปที่ 10) ถ้าค่ามัธยฐานมากกว่าค่าเฉลี่ย การแจกแจงของตัวแปรจะเบ้ในเชิงลบ ความเบ้เชิงบวกเกิดขึ้นเมื่อค่าเฉลี่ยเพิ่มขึ้นเป็นค่าผิดปกติ ค่านิยมสูง. ความเบ้เชิงลบเกิดขึ้นเมื่อค่าเฉลี่ยลดลงเป็นค่าที่เล็กผิดปกติ ตัวแปรมีการกระจายแบบสมมาตรถ้าไม่ใช้ค่าสุดโต่งใด ๆ ในทิศทางใดทิศทางหนึ่ง เช่น ค่าขนาดใหญ่และค่าเล็กของตัวแปรจะหักล้างกัน

ข้าว. 10. การแจกแจงสามประเภท

ข้อมูลที่ปรากฎในระดับ A มีความเบ้เป็นลบ รูปนี้แสดงหางยาวและเอียงซ้ายที่เกิดจากค่าเล็กน้อยผิดปกติ ค่าที่น้อยมากเหล่านี้จะเปลี่ยนค่าเฉลี่ยไปทางซ้าย และค่านี้จะน้อยกว่าค่ามัธยฐาน ข้อมูลที่แสดงในมาตราส่วน B มีการกระจายแบบสมมาตร แบ่งครึ่งซ้ายและขวาของการกระจายเป็นของตัวเอง เงาสะท้อน. ค่าขนาดใหญ่และค่าน้อยสมดุลกันและค่าเฉลี่ยและค่ามัธยฐานเท่ากัน ข้อมูลที่แสดงในระดับ B มีความเบ้เป็นบวก รูปนี้แสดงหางยาวและเอียงไปทางขวา เกิดจากการมีค่าสูงผิดปกติ ค่าที่มากเกินไปเหล่านี้จะเปลี่ยนค่าเฉลี่ยไปทางขวา และค่าจะมากกว่าค่ามัธยฐาน

ใน Excel สามารถรับสถิติเชิงพรรณนาได้โดยใช้ add-in แพ็คเกจการวิเคราะห์. ผ่านเมนู ข้อมูลการวิเคราะห์ข้อมูลในหน้าต่างที่เปิดขึ้น ให้เลือกบรรทัด สถิติเชิงพรรณนาและคลิก ตกลง. ในหน้าต่าง สถิติเชิงพรรณนาให้แน่ใจว่าได้ระบุ ช่วงเวลาอินพุต(รูปที่ 11). หากคุณต้องการดูสถิติเชิงพรรณนาในชีตเดียวกันกับข้อมูลเดิม ให้เลือกปุ่มตัวเลือก ช่วงเอาต์พุตและระบุเซลล์ที่คุณต้องการวางด้านซ้าย มุมบนสถิติการส่งออก (ในตัวอย่างของเรา $C$1) หากต้องการส่งข้อมูลไปที่ ใบใหม่หรือใน หนังสือเล่มใหม่เพียงเลือกปุ่มตัวเลือกที่เหมาะสม ทำเครื่องหมายที่ช่องถัดจาก สถิติสุดท้าย. หรือคุณสามารถเลือก ระดับความยาก,k-th เล็กที่สุดและใหญ่เป็นอันดับ k.

ถ้าฝาก ข้อมูลในพื้นที่ การวิเคราะห์คุณไม่เห็นไอคอน การวิเคราะห์ข้อมูลคุณต้องติดตั้งส่วนเสริมก่อน แพ็คเกจการวิเคราะห์(ดูตัวอย่าง)

ข้าว. 11. สถิติเชิงพรรณนาผลตอบแทนประจำปีเฉลี่ย 5 ปีของกองทุนที่มีความเสี่ยงสูงมาก คำนวณโดยใช้ส่วนเสริม การวิเคราะห์ข้อมูลโปรแกรม Excel

Excel คำนวณ ทั้งสายสถิติที่กล่าวถึงข้างต้น: ค่าเฉลี่ย ค่ามัธยฐาน โหมด ค่าเบี่ยงเบนมาตรฐาน ความแปรปรวน ช่วง ( ช่วงเวลา) ขนาดต่ำสุด สูงสุด และขนาดตัวอย่าง ( ตรวจสอบ). นอกจากนี้ Excel ยังคำนวณสถิติใหม่ๆ ให้เราด้วย เช่น ข้อผิดพลาดมาตรฐาน ความโด่ง และความเบ้ มาตรฐานบกพร่อง เท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยสแควร์รูทของขนาดกลุ่มตัวอย่าง ไม่สมมาตรกำหนดลักษณะการเบี่ยงเบนจากสมมาตรของการกระจายและเป็นฟังก์ชันที่ขึ้นอยู่กับลูกบาศก์ของความแตกต่างระหว่างองค์ประกอบของตัวอย่างและค่าเฉลี่ย Kurtosis เป็นการวัดความเข้มข้นสัมพัทธ์ของข้อมูลรอบๆ ค่าเฉลี่ยเทียบกับส่วนท้ายของการกระจาย และขึ้นอยู่กับความแตกต่างระหว่างตัวอย่างกับค่าเฉลี่ยที่ยกกำลังสี่

การคำนวณ สถิติเชิงพรรณนาสำหรับ ประชากร

ค่าเฉลี่ย การกระจาย และรูปร่างของการแจกแจงที่กล่าวถึงข้างต้นเป็นคุณลักษณะตามตัวอย่าง อย่างไรก็ตาม หากชุดข้อมูลประกอบด้วยการวัดเชิงตัวเลขของประชากรทั้งหมด พารามิเตอร์ของชุดข้อมูลก็สามารถคำนวณได้ พารามิเตอร์เหล่านี้รวมถึงค่าเฉลี่ย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานของประชากร

มูลค่าที่คาดหวังเท่ากับผลรวมของค่าทั้งหมดของประชากรทั่วไปหารด้วยปริมาตรของประชากรทั่วไป:

ที่ไหน µ - มูลค่าที่คาดหวัง Xผม- ผม- การสังเกตตัวแปรที่ X, นู๋- ปริมาณประชากรทั่วไป ใน Excel เพื่อคำนวณ ความคาดหวังทางคณิตศาสตร์ใช้ฟังก์ชันเดียวกันกับค่าเฉลี่ยเลขคณิต: =AVERAGE()

ความแปรปรวนของประชากรเท่ากับผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบของประชากรทั่วไปและเสื่อ ความคาดหวังหารด้วยขนาดของประชากร:

ที่ไหน σ2คือความแปรปรวนของประชากรทั่วไป Excel ก่อนเวอร์ชัน 2007 ใช้ฟังก์ชัน =VAR() เพื่อคำนวณความแปรปรวนของประชากร โดยเริ่มด้วยเวอร์ชัน 2010 =VAR.G()

ส่วนเบี่ยงเบนมาตรฐานของประชากรเท่ากับรากที่สองของความแปรปรวนประชากร:

Excel ก่อนเวอร์ชัน 2007 ใช้ =STDEV() ในการคำนวณค่าเบี่ยงเบนมาตรฐานของประชากร โดยเริ่มจากเวอร์ชัน 2010 =STDEV.Y() โปรดทราบว่าสูตรสำหรับความแปรปรวนประชากรและส่วนเบี่ยงเบนมาตรฐานจะแตกต่างจากสูตรสำหรับความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐาน เมื่อคำนวณ สถิติตัวอย่าง S2และ ตัวส่วนของเศษส่วนคือ น - 1และเมื่อคำนวณพารามิเตอร์ σ2และ σ - ปริมาณประชากรทั่วไป นู๋.

หลักการง่ายๆ

ในสถานการณ์ส่วนใหญ่ การสังเกตส่วนใหญ่กระจุกตัวอยู่รอบๆ ค่ามัธยฐาน ก่อตัวเป็นกระจุก ในชุดข้อมูลที่มีความเบ้เป็นบวก คลัสเตอร์นี้จะตั้งอยู่ทางด้านซ้าย (เช่น ด้านล่าง) ของการคาดหมายทางคณิตศาสตร์ และในชุดข้อมูลที่มีความเบ้เป็นลบ คลัสเตอร์นี้จะตั้งอยู่ทางด้านขวา (กล่าวคือ ด้านบน) ของการคาดหมายทางคณิตศาสตร์ ข้อมูลสมมาตรมีค่าเฉลี่ยและค่ามัธยฐานเดียวกัน และกลุ่มการสังเกตรอบๆ ค่าเฉลี่ย ทำให้เกิดการกระจายรูประฆัง หากการแจกแจงไม่มีความเบ้เด่นชัด และข้อมูลกระจุกตัวอยู่รอบจุดศูนย์ถ่วงที่แน่นอน สามารถใช้กฎทั่วไปในการประมาณความแปรปรวนได้ ซึ่งระบุว่า: หากข้อมูลมีการกระจายรูประฆัง แล้วประมาณ 68% ของการสังเกตมีค่าน้อยกว่าหนึ่งค่าเบี่ยงเบนมาตรฐานจากการคาดหมายทางคณิตศาสตร์ ประมาณ 95% ของการสังเกตอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าที่คาดหวัง และ 99.7% ของการสังเกตอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าที่คาดหวัง

ดังนั้น ค่าเบี่ยงเบนมาตรฐาน ซึ่งเป็นค่าประมาณของความผันผวนเฉลี่ยรอบการคาดหมายทางคณิตศาสตร์ ช่วยให้เข้าใจว่าการสังเกตมีการกระจายอย่างไร และเพื่อระบุค่าผิดปกติ มันเป็นไปตามหลักทั่วไปที่ว่าสำหรับการแจกแจงรูประฆัง มีเพียงค่าเดียวในยี่สิบค่าที่แตกต่างจากการคาดหมายทางคณิตศาสตร์โดยมีค่าเบี่ยงเบนมาตรฐานมากกว่าสองค่า ดังนั้นค่านอกช่วงเวลา µ ± 2σสามารถถือเป็นค่าผิดปกติได้ นอกจากนี้ การสังเกตเพียงสามใน 1,000 ครั้งเท่านั้นที่แตกต่างจากการคาดหมายทางคณิตศาสตร์โดยมีค่าเบี่ยงเบนมาตรฐานมากกว่าสามค่า ดังนั้นค่านอกช่วง µ ± 3σมักจะเป็นค่าผิดปกติ สำหรับการแจกแจงที่เบ้สูงหรือไม่ใช่รูประฆัง สามารถใช้กฎง่ายๆ ของ Biename-Chebyshev ได้

กว่าร้อยปีที่แล้วนักคณิตศาสตร์ Bienamay และ Chebyshev ค้นพบโดยอิสระ คุณสมบัติที่มีประโยชน์ส่วนเบี่ยงเบนมาตรฐาน. พบว่าชุดข้อมูลใด ๆ โดยไม่คำนึงถึงรูปร่างของการกระจาย ร้อยละของการสังเกตที่อยู่ในระยะไม่เกิน kค่าเบี่ยงเบนมาตรฐานจากการคาดหมายทางคณิตศาสตร์ ไม่น้อย (1 – 1/ 2)*100%.

ตัวอย่างเช่น if k= 2 กฎ Biename-Chebyshev ระบุว่าอย่างน้อย (1 - (1/2) 2) x 100% = 75% ของการสังเกตต้องอยู่ในช่วงเวลา µ ± 2σ. กฎนี้เป็นจริงสำหรับทุกคน kเกินหนึ่ง กฎของ Biename-Chebyshev นั้นดีมาก ลักษณะทั่วไปและใช้ได้สำหรับการแจกจ่ายใด ๆ แสดงว่า จำนวนเงินขั้นต่ำการสังเกตระยะทางจากความคาดหวังทางคณิตศาสตร์ไม่เกิน ตั้งค่า. อย่างไรก็ตาม หากการกระจายเป็นรูประฆัง กฎทั่วไปจะประมาณความเข้มข้นของข้อมูลรอบค่าเฉลี่ยได้แม่นยำยิ่งขึ้น

การคำนวณสถิติเชิงพรรณนาสำหรับการกระจายตามความถี่

หากไม่มีข้อมูลเดิม การกระจายความถี่จะกลายเป็นแหล่งข้อมูลเพียงแหล่งเดียว ในสถานการณ์เช่นนี้ คุณสามารถคำนวณค่าโดยประมาณของตัวบ่งชี้เชิงปริมาณของการแจกแจงได้ เช่น ค่าเฉลี่ยเลขคณิต ส่วนเบี่ยงเบนมาตรฐาน ควอร์ไทล์

หากข้อมูลตัวอย่างถูกนำเสนอเป็นการแจกแจงความถี่ ค่าโดยประมาณของค่าเฉลี่ยเลขคณิตสามารถคำนวณได้ โดยสมมติว่าค่าทั้งหมดในแต่ละคลาสจะกระจุกตัวที่จุดกึ่งกลางของคลาส:

ที่ไหน - ค่าเฉลี่ยตัวอย่าง - จำนวนการสังเกตหรือขนาดกลุ่มตัวอย่าง กับ- จำนวนคลาสในการกระจายความถี่ mj- จุดกลาง เจ- ชั้น, เจ- ความถี่ที่สอดคล้องกับ เจ-ชั้น.

ในการคำนวณค่าเบี่ยงเบนมาตรฐานจากการแจกแจงความถี่ จะถือว่าค่าทั้งหมดภายในแต่ละคลาสกระจุกตัวอยู่ที่จุดกึ่งกลางของคลาส

เพื่อให้เข้าใจว่าควอร์ไทล์ของซีรีส์ถูกกำหนดตามความถี่อย่างไร ให้เราพิจารณาการคำนวณควอไทล์ล่างตามข้อมูลสำหรับปี 2556 เกี่ยวกับการกระจายของประชากรรัสเซียตามรายได้เงินสดเฉลี่ยต่อหัว (รูปที่ 12)

ข้าว. 12. ส่วนแบ่งของประชากรรัสเซียที่มีรายได้ทางการเงินต่อหัวโดยเฉลี่ยต่อเดือน rubles

ในการคำนวณควอร์ไทล์แรกของช่วงเวลา ซีรีส์รูปแบบต่างๆคุณสามารถใช้สูตร:

โดยที่ Q1 คือค่าของควอร์ไทล์แรก xQ1 คือขีดจำกัดล่างของช่วงที่มีควอร์ไทล์แรก (ช่วงจะถูกกำหนดโดยความถี่สะสม ครั้งแรกที่เกิน 25%) i คือค่าของช่วงเวลา Σf คือผลรวมของความถี่ของกลุ่มตัวอย่างทั้งหมด อาจเท่ากับ 100% เสมอ SQ1–1 คือความถี่สะสมของช่วงก่อนหน้าช่วงที่มีควอร์ไทล์ต่ำกว่า fQ1 คือความถี่ของช่วงที่มีควอร์ไทล์ต่ำกว่า สูตรสำหรับควอร์ไทล์ที่สามนั้นแตกต่างกันไปในทุกที่ แทนที่จะเป็น Q1 คุณต้องใช้ Q3 และแทนที่ ¾ แทน ¼

ในตัวอย่างของเรา (รูปที่ 12) ควอไทล์ล่างอยู่ในช่วง 7000.1 - 10,000 ความถี่สะสมซึ่งเท่ากับ 26.4% ขีด จำกัด ล่างของช่วงเวลานี้คือ 7000 รูเบิล ค่าของช่วงเวลาคือ 3000 รูเบิล ความถี่สะสมของช่วงเวลาก่อนหน้าช่วงเวลาที่มีควอร์ไทล์ต่ำกว่าคือ 13.4% ความถี่ของช่วงเวลาที่มีควอร์ไทล์ต่ำกว่าคือ 13.0% ดังนั้น: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13.4) / 13 \u003d 9677 rubles

ข้อผิดพลาดที่เกี่ยวข้องกับสถิติเชิงพรรณนา

ในบันทึกนี้ เราได้ศึกษาวิธีอธิบายชุดข้อมูลโดยใช้สถิติต่างๆ ที่ประมาณค่าค่าเฉลี่ย การกระจาย และการแจกแจงของชุดข้อมูล ขั้นตอนต่อไปคือการวิเคราะห์และตีความข้อมูล จนถึงตอนนี้ เราได้ศึกษาคุณสมบัติวัตถุประสงค์ของข้อมูลแล้ว และตอนนี้เราหันไปใช้การตีความตามอัตวิสัย ข้อผิดพลาดสองประการกำลังรอผู้วิจัยอยู่: หัวข้อการวิเคราะห์ที่เลือกไม่ถูกต้องและการตีความผลลัพธ์ที่ไม่ถูกต้อง

การวิเคราะห์ผลการดำเนินงานของ 15 กองทุนรวมที่มีความเสี่ยงสูงมากนั้นค่อนข้างเป็นกลาง เขานำไปสู่ข้อสรุปที่เป็นรูปธรรมโดยสมบูรณ์: กองทุนรวมทั้งหมดมีผลตอบแทนที่แตกต่างกัน สเปรดของผลตอบแทนของกองทุนอยู่ในช่วงตั้งแต่ -6.1 ถึง 18.5 และผลตอบแทนเฉลี่ยอยู่ที่ 6.08 มั่นใจความเที่ยงธรรมของการวิเคราะห์ข้อมูล ทางเลือกที่เหมาะสมตัวชี้วัดเชิงปริมาณรวมของการกระจาย มีการพิจารณาวิธีการประมาณค่าค่าเฉลี่ยและการกระจายข้อมูลหลายวิธี และระบุข้อดีและข้อเสีย จะเลือกสถิติที่เหมาะสมซึ่งให้การวิเคราะห์ที่เป็นกลางและเป็นกลางได้อย่างไร หากการกระจายข้อมูลเอียงเล็กน้อย ควรเลือกค่ามัธยฐานเหนือค่าเฉลี่ยเลขคณิตหรือไม่ ตัวบ่งชี้ใดที่อธิบายลักษณะการกระจายของข้อมูลได้แม่นยำกว่า: ส่วนเบี่ยงเบนมาตรฐานหรือช่วง ควรระบุความเบ้เชิงบวกของการกระจายหรือไม่

ในทางกลับกัน การตีความข้อมูลเป็นกระบวนการเชิงอัตนัย ผู้คนที่หลากหลายได้ข้อสรุปต่างกัน ตีความผลลัพธ์เดียวกัน ทุกคนมีมุมมองของตัวเอง มีคนมองว่าผลตอบแทนรวมประจำปีของกองทุน 15 กองทุนที่มีความเสี่ยงสูงมากนั้นดีและค่อนข้างพอใจกับรายได้ที่ได้รับ คนอื่นอาจคิดว่ากองทุนเหล่านี้มีผลตอบแทนต่ำเกินไป ดังนั้น อัตวิสัยควรได้รับการชดเชยด้วยความซื่อสัตย์ เป็นกลาง และความชัดเจนของข้อสรุป

ประเด็นด้านจริยธรรม

การวิเคราะห์ข้อมูลเชื่อมโยงกับประเด็นทางจริยธรรมอย่างแยกไม่ออก ควรวิจารณ์ข้อมูลที่เผยแพร่ทางหนังสือพิมพ์ วิทยุ โทรทัศน์ และอินเทอร์เน็ต เมื่อเวลาผ่านไป คุณจะได้เรียนรู้ที่จะสงสัยไม่เพียงเกี่ยวกับผลลัพธ์ แต่ยังเกี่ยวกับเป้าหมาย หัวเรื่อง และความเที่ยงธรรมของการวิจัยด้วย Benjamin Disraeli นักการเมืองชื่อดังชาวอังกฤษกล่าวว่า "การโกหกมีอยู่สามประเภท: การโกหก การโกหกที่สาปแช่ง และสถิติ"

ตามที่ระบุในหมายเหตุ ประเด็นทางจริยธรรมเกิดขึ้นเมื่อเลือกผลลัพธ์ที่ควรนำเสนอในรายงาน ทั้งบวกและ ผลลัพธ์เชิงลบ. นอกจากนี้ ในการจัดทำรายงานหรือรายงานเป็นลายลักษณ์อักษร จะต้องนำเสนอผลงานอย่างตรงไปตรงมา เป็นกลาง และเป็นกลาง แยกแยะระหว่างการนำเสนอที่ไม่ดีและไม่ซื่อสัตย์ ในการทำเช่นนี้ จำเป็นต้องกำหนดว่าผู้พูดมีเจตนาอย่างไร บางครั้งผู้พูดละเว้นข้อมูลสำคัญด้วยความไม่รู้ และบางครั้งจงใจ (เช่น หากเขาใช้ค่าเฉลี่ยเลขคณิตเพื่อประมาณค่าเฉลี่ยของข้อมูลเบ้อย่างชัดเจนเพื่อให้ได้มา ผลลัพธ์ที่ต้องการ). การระงับผลที่ไม่ตรงกับมุมมองของผู้วิจัยถือเป็นการทุจริต

วัสดุจากหนังสือ Levin et al. ใช้สถิติสำหรับผู้จัดการ - ม.: วิลเลียมส์, 2547. - หน้า. 178–209

ปล่อยให้ฟังก์ชัน QUARTILE รวมกับ more รุ่นแรกๆเก่ง

สมมติว่าคุณต้องหาจำนวนวันโดยเฉลี่ยสำหรับงานที่พนักงานแต่ละคนจะเสร็จสิ้น หรือต้องการคำนวณช่วงเวลา 10 ปี อุณหภูมิเฉลี่ยในวันใดวันหนึ่ง การคำนวณค่าเฉลี่ยของชุดตัวเลขได้หลายวิธี

ค่าเฉลี่ยเป็นฟังก์ชันของการวัดแนวโน้มศูนย์กลาง ซึ่งจุดศูนย์กลางของชุดตัวเลขใน การกระจายทางสถิติ. สามเสียงส่วนใหญ่ เกณฑ์ทั่วไปแนวโน้มจากส่วนกลางโดดเด่น

    เฉลี่ยค่าเฉลี่ยเลขคณิตคำนวณโดยการบวกชุดตัวเลขแล้วหารจำนวนตัวเลขเหล่านั้น ตัวอย่างเช่น ค่าเฉลี่ยของ 2, 3, 3, 5, 7 และ 10 มี 30 หารด้วย 6, 5;

    ค่ามัธยฐานจำนวนตรงกลางของชุดตัวเลข ครึ่งหนึ่งของตัวเลขมีค่าที่มากกว่าค่ามัธยฐานและครึ่งหนึ่งของตัวเลขมีค่าที่น้อยกว่าค่ามัธยฐาน ตัวอย่างเช่น ค่ามัธยฐานของ 2, 3, 3, 5, 7 และ 10 คือ 4

    โหมดจำนวนที่เกิดขึ้นบ่อยที่สุดในกลุ่มตัวเลข เช่น โหมด 2, 3, 3, 5, 7 และ 10 - 3

การวัดแนวโน้มศูนย์กลางของการกระจายตัวแบบสมมาตรของชุดตัวเลขทั้งสามนี้เป็นค่าเดียวกัน ในการแจกแจงตัวเลขจำนวนหนึ่งแบบอสมมาตร พวกมันสามารถแตกต่างกันได้

คำนวณค่าเฉลี่ยของเซลล์ที่อยู่อย่างต่อเนื่องในหนึ่งแถวหรือหนึ่งคอลัมน์

ทำดังต่อไปนี้

การคำนวณหาค่าเฉลี่ยของเซลล์ที่กระจัดกระจาย

เพื่อให้งานนี้สำเร็จ ให้ใช้ฟังก์ชัน เฉลี่ย. คัดลอกตารางด้านล่างลงในแผ่นเปล่า

การคำนวนถัวเฉลี่ยถ่วงน้ำหนัก

SUMPRODUCTและ จำนวนเงิน. ตัวอย่าง vThis คำนวณ ราคาเฉลี่ยหน่วยวัดที่จ่ายในการซื้อสามครั้ง โดยการซื้อแต่ละครั้งเป็นหน่วยวัดที่แตกต่างกันในราคาที่แตกต่างกันต่อหน่วย

คัดลอกตารางด้านล่างลงในแผ่นเปล่า

การคำนวณค่าเฉลี่ยของตัวเลขโดยไม่คำนึงถึง ค่าศูนย์

เพื่อให้งานนี้สำเร็จ ให้ใช้ฟังก์ชัน เฉลี่ยและ ถ้า. คัดลอกตารางด้านล่างและจำไว้ว่าในตัวอย่างนี้ เพื่อให้เข้าใจง่ายขึ้น ให้คัดลอกลงในแผ่นเปล่า

ค่าเฉลี่ยเลขคณิตใน excel สเปรดชีต Excelเหมาะที่สุดสำหรับการคำนวณใดๆ เมื่อเรียน Excel แล้ว คุณจะสามารถแก้ปัญหาในด้านเคมี ฟิสิกส์ คณิตศาสตร์ เรขาคณิต ชีววิทยา สถิติ เศรษฐศาสตร์ และอื่นๆ อีกมากมาย เราไม่ได้คิดถึงเครื่องมือที่ทรงพลังในคอมพิวเตอร์ของเรา ซึ่งหมายความว่าเราไม่ได้ใช้มันอย่างเต็มศักยภาพ ผู้ปกครองหลายคนคิดว่าคอมพิวเตอร์เป็นเพียงของเล่นราคาแพง แต่เปล่าประโยชน์! แน่นอน เพื่อให้เด็กได้ศึกษาเรื่องนี้จริงๆ คุณเองต้องเรียนรู้วิธีการทำงานนั้นแล้วจึงสอนเด็ก นี่เป็นอีกหัวข้อหนึ่ง แต่วันนี้ฉันต้องการคุยกับคุณเกี่ยวกับวิธีหาค่าเฉลี่ยเลขคณิตใน Excel

วิธีหาค่าเฉลี่ยเลขคณิตใน Excel

เราได้พูดถึงความรวดเร็วใน Excel แล้ว และวันนี้เราจะมาพูดถึงค่าเฉลี่ยเลขคณิต

เลือกเซลล์ C12และด้วยความช่วยเหลือ ตัวช่วยสร้างฟังก์ชัน เขียนสูตรคำนวณค่าเฉลี่ยเลขคณิตลงไป เมื่อต้องการทำสิ่งนี้ บนแถบเครื่องมือมาตรฐาน ให้คลิกที่ปุ่ม - การแทรกฟังก์ชัน −fx (ในภาพด้านบน ลูกศรสีแดงอยู่ด้านบน) กล่องโต้ตอบจะเปิดขึ้น ฟังก์ชั่นมาสเตอร์ .

  • เลือกในช่อง หมวดหมู่สถิติ ;
  • ในสนาม เลือกฟังก์ชั่น: เฉลี่ย ;
  • คลิกที่ปุ่ม ตกลง .

หน้าต่างต่อไปนี้จะเปิดขึ้น อาร์กิวเมนต์และฟังก์ชัน .

ในสนาม นัมเบอร์1คุณจะเห็นรายการ S2:S11- โปรแกรมเองกำหนดช่วงของเซลล์ที่จำเป็น หาค่าเฉลี่ยเลขคณิต

คลิกที่ปุ่ม ตกลงและในเซลล์ C12ค่าเฉลี่ยเลขคณิตของคะแนนจะปรากฏขึ้น

ปรากฎว่าการคำนวณค่าเฉลี่ยเลขคณิตใน excel นั้นไม่ยากเลย และฉันก็กลัวสูตรต่างๆ อยู่เสมอ เอ่อ ไม่ใช่ตอนนั้นที่เราเรียน

นี้ ตัวประมวลผลสเปรดชีตรับมือกับการคำนวณเกือบทั้งหมด เหมาะสำหรับ การบัญชี. สำหรับการคำนวณมีเครื่องมือพิเศษ - สูตร สามารถใช้กับช่วงหรือแต่ละเซลล์ได้ หากต้องการทราบจำนวนต่ำสุดหรือสูงสุดในกลุ่มเซลล์ ไม่จำเป็นต้องค้นหาด้วยตนเอง เป็นการดีกว่าถ้าใช้ตัวเลือกที่มีให้สำหรับสิ่งนี้ นอกจากนี้ยังเป็นประโยชน์ในการหาวิธีคำนวณค่าเฉลี่ยใน Excel

โดยเฉพาะอย่างยิ่งในตารางที่มีข้อมูลจำนวนมาก หากคอลัมน์ประกอบด้วยราคาสินค้า ศูนย์การค้า. และคุณต้องค้นหาว่าผลิตภัณฑ์ใดที่ถูกที่สุด หากคุณค้นหา "ด้วยตนเอง" จะต้องใช้เวลามาก แต่ใน Excel สามารถทำได้ด้วยการคลิกเพียงไม่กี่ครั้ง ยูทิลิตี้ยังคำนวณค่าเฉลี่ยเลขคณิต ท้ายที่สุด นี่เป็นการดำเนินการง่ายๆ สองอย่าง: การบวกและการหาร

สูงสุดและต่ำสุด

นี่คือวิธีการค้นหา มูลค่าสูงสุดใน excel:

  1. วางเคอร์เซอร์เซลล์ไว้ที่ใดก็ได้
  2. ไปที่เมนู "สูตร"
  3. คลิกแทรกฟังก์ชัน
  4. เลือก "MAX" จากรายการ หรือเขียนคำนี้ในช่อง "ค้นหา" แล้วคลิก "ค้นหา"
  5. ในหน้าต่างอาร์กิวเมนต์ ให้ป้อนที่อยู่ของช่วงที่มีค่าสูงสุดที่คุณต้องการทราบ ใน Excel ชื่อเซลล์ประกอบด้วยตัวอักษรและตัวเลข ("B1", "F15", "W34") และชื่อของช่วงคือเซลล์แรกและเซลล์สุดท้ายที่รวมอยู่ในนั้น
  6. แทนที่จะเขียนที่อยู่ คุณสามารถเขียนตัวเลขได้หลายตัว จากนั้นระบบจะแสดงผลที่ใหญ่ที่สุด
  7. คลิกตกลง ผลลัพธ์จะปรากฏในเซลล์ที่เคอร์เซอร์อยู่

ขั้นตอนต่อไปคือการระบุช่วงของค่า

ตอนนี้ การหาค่าต่ำสุดใน Excel จะง่ายขึ้น อัลกอริทึมของการกระทำเหมือนกันทั้งหมด เพียงเลือก "MIN" แทน "MAX"

เฉลี่ย

ค่าเฉลี่ยเลขคณิตคำนวณดังนี้: บวกตัวเลขทั้งหมดจากเซตแล้วหารด้วยตัวเลข ใน Excel คุณสามารถคำนวณผลรวม ค้นหาจำนวนเซลล์ที่อยู่ในแถว และอื่นๆ แต่มันซับซ้อนและยาวเกินไป ต้องใช้เยอะ ฟังก์ชั่นต่างๆ. เก็บข้อมูลไว้ในใจ หรือแม้แต่เขียนบางอย่างลงบนกระดาษ แต่อัลกอริธึมสามารถทำให้ง่ายขึ้นได้

วิธีหาค่าเฉลี่ยใน Excel มีดังนี้

  1. ย้ายเคอร์เซอร์เซลล์ไปที่ any ที่ว่างตาราง
  2. ไปที่แท็บ "สูตร"
  3. คลิกที่ "แทรกฟังก์ชัน"
  4. เลือกเฉลี่ย
  5. หากรายการนี้ไม่อยู่ในรายการ ให้เปิดโดยใช้ตัวเลือก "ค้นหา"
  6. ในพื้นที่ Number1 ให้ป้อนที่อยู่ของช่วง หรือเขียนตัวเลขหลายตัวในช่องต่างๆ "Number2", "Number3"
  7. คลิกตกลง ค่าที่ต้องการจะปรากฏในเซลล์

ดังนั้นคุณจึงสามารถคำนวณได้ไม่เฉพาะกับตำแหน่งในตารางเท่านั้น แต่ยังสามารถคำนวณด้วยชุดคำสั่งต่างๆ ได้ด้วย อันที่จริง Excel มีบทบาทเป็นเครื่องคิดเลขขั้นสูง

วิธีอื่นๆ

ค่าสูงสุด ค่าต่ำสุด และค่าเฉลี่ยสามารถดูได้ด้วยวิธีอื่น

  1. ค้นหาแถบฟังก์ชันที่ระบุว่า "Fx" อยู่เหนือพื้นที่ทำงานหลักของโต๊ะ
  2. วางเคอร์เซอร์ในเซลล์ใดก็ได้
  3. ป้อนอาร์กิวเมนต์ในช่อง "Fx" มันเริ่มต้นด้วยเครื่องหมายเท่ากับ จากนั้นสูตรและที่อยู่ของช่วง/เซลล์ก็มาถึง
  4. คุณควรได้บางอย่างเช่น "=MAX(B8:B11)" (สูงสุด), "=MIN(F7:V11)" (ขั้นต่ำ), "=AVERAGE(D14:W15)" (โดยเฉลี่ย)
  5. คลิกที่ "ติ๊ก" ถัดจากฟิลด์ฟังก์ชัน หรือเพียงแค่กด Enter ค่าที่ต้องการจะปรากฏในเซลล์ที่เลือก
  6. สามารถคัดลอกสูตรลงในเซลล์ได้โดยตรง ผลจะเหมือนกัน

Excel-tool "Autofunctions" จะช่วยในการค้นหาและคำนวณ

  1. วางเคอร์เซอร์ในเซลล์
  2. ค้นหาปุ่มที่มีชื่อขึ้นต้นด้วย "อัตโนมัติ" ขึ้นอยู่กับตัวเลือกเริ่มต้นที่เลือกใน Excel (AutoSum, AutoNumber, AutoOffset, AutoIndex)
  3. คลิกที่ลูกศรสีดำด้านล่าง
  4. เลือก MIN (ขั้นต่ำ), MAX (สูงสุด) หรือ AVERAGE (เฉลี่ย)
  5. สูตรจะปรากฏในเซลล์ที่ทำเครื่องหมายไว้ คลิกที่เซลล์อื่น - เซลล์นั้นจะถูกเพิ่มลงในฟังก์ชัน "ลาก" กล่องรอบๆ เพื่อให้ครอบคลุมช่วง หรือ Ctrl-คลิกกริดเพื่อเลือกหนึ่งองค์ประกอบในแต่ละครั้ง
  6. เมื่อเสร็จแล้ว ให้กด Enter ผลลัพธ์จะแสดงในเซลล์

ใน Excel การคำนวณค่าเฉลี่ยนั้นค่อนข้างง่าย ไม่ต้องเพิ่มแล้วแบ่งจำนวน มีฟังก์ชั่นแยกต่างหากสำหรับสิ่งนี้ คุณยังสามารถหาค่าต่ำสุดและสูงสุดในชุดได้ ง่ายกว่าการนับด้วยมือหรือการค้นหาตัวเลขในสเปรดชีตขนาดใหญ่ ดังนั้น Excel จึงเป็นที่นิยมในหลายสาขาของกิจกรรมที่ต้องการความแม่นยำ: ธุรกิจ การตรวจสอบ การจัดการบันทึกบุคลากร การเงิน การค้า คณิตศาสตร์ ฟิสิกส์ ดาราศาสตร์ เศรษฐศาสตร์ วิทยาศาสตร์