วิธีคำนวณค่าเฉลี่ยในตัวอย่าง excel จะทำคะแนนเฉลี่ยใน excel ได้อย่างไร? วิธีการคำนวณมาตรฐาน
วิธีคำนวณค่าเฉลี่ยของตัวเลขใน Excel
หาค่าเฉลี่ย เลขคณิตใน Excel คุณสามารถใช้นามสกุล .
ไวยากรณ์ AVERAGE
=เฉลี่ย(หมายเลข1,[หมายเลข2],…) - เวอร์ชั่นรัสเซีย
อาร์กิวเมนต์ AVERAGE
- หมายเลข1- ตัวเลขหรือช่วงแรกสำหรับการคำนวณค่าเฉลี่ยเลขคณิต
- หมายเลข2(ไม่บังคับ) – ตัวเลขที่สองหรือช่วงของตัวเลขเพื่อคำนวณค่าเฉลี่ยเลขคณิต จำนวนเงินสูงสุดอาร์กิวเมนต์ของฟังก์ชัน - 255
ในการคำนวณ ให้ทำตามขั้นตอนต่อไปนี้:
- เลือกเซลล์ใดก็ได้
- เขียนสูตรลงไป =เฉลี่ย(
- เลือกช่วงของเซลล์ที่คุณต้องการคำนวณ
- กดปุ่ม "Enter" บนแป้นพิมพ์
ฟังก์ชันจะคำนวณค่าเฉลี่ยในช่วงที่ระบุในเซลล์ที่มีตัวเลข
วิธีหาค่าเฉลี่ยที่ให้ข้อความ
หากมีบรรทัดหรือข้อความว่างในช่วงข้อมูล ฟังก์ชันจะถือว่าเป็น "ศูนย์" หากข้อมูลมี นิพจน์บูลีน FALSE หรือ TRUE จากนั้นฟังก์ชันจะถือว่า FALSE เป็น "ศูนย์" และ TRUE เป็น "1"
วิธีหาค่าเฉลี่ยเลขคณิตตามเงื่อนไข
ฟังก์ชันนี้ใช้เพื่อคำนวณค่าเฉลี่ยตามเงื่อนไขหรือเกณฑ์ ตัวอย่างเช่น สมมติว่าเรามีข้อมูลการขายผลิตภัณฑ์:
งานของเราคือการคำนวณยอดขายเฉลี่ยของปากกา ในการทำเช่นนี้ เราจะทำตามขั้นตอนต่อไปนี้:
- ในเซลล์ A13เขียนชื่อผลิตภัณฑ์ "ปากกา";
- ในเซลล์ B13มาใส่สูตรกัน:
=ค่าเฉลี่ย(A2:A10,A13,B2:B10)
ช่วงเซลล์ “ A2:A10” ชี้ไปที่รายการผลิตภัณฑ์ที่เราจะค้นหาคำว่า “ปากกา” การโต้แย้ง A13นี่คือลิงก์ไปยังเซลล์ที่มีข้อความที่เราจะค้นหาจากรายชื่อผลิตภัณฑ์ทั้งหมด ช่วงเซลล์ “ B2:B10” คือช่วงที่มีข้อมูลการขายผลิตภัณฑ์ โดยฟังก์ชันจะค้นหา “ปากกา” และคำนวณค่าเฉลี่ย
ในกรณีส่วนใหญ่ ข้อมูลจะกระจุกตัวอยู่ที่จุดศูนย์กลางบางส่วน ดังนั้น เพื่ออธิบายชุดข้อมูลใดๆ การระบุค่าเฉลี่ยก็เพียงพอแล้ว มาดูสามตัวกันดีกว่า ลักษณะเชิงตัวเลขซึ่งใช้ในการประมาณค่าเฉลี่ยของการแจกแจง: ค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และโหมด
เฉลี่ย
ค่าเฉลี่ยเลขคณิต (มักเรียกง่ายๆ ว่า ค่าเฉลี่ย) คือค่าประมาณทั่วไปของค่าเฉลี่ยของการแจกแจง เป็นผลจากการหารผลรวมของสิ่งที่สังเกตได้ทั้งหมด ค่าตัวเลขสำหรับจำนวนของพวกเขา สำหรับตัวอย่างตัวเลข X 1, X 2, ..., Xน, ค่าเฉลี่ยตัวอย่าง (แสดงด้วยสัญลักษณ์ ) เท่ากับ \u003d (X 1 + X 2 + ... + Xน) / น, หรือ
ค่าเฉลี่ยตัวอย่างอยู่ที่ไหน น- ขนาดตัวอย่าง, Xผม – องค์ประกอบที่ iตัวอย่าง
ดาวน์โหลดบันทึกในรูปแบบหรือรูปแบบ ตัวอย่างในรูปแบบ
พิจารณาการคำนวณค่าเฉลี่ย ค่าเลขคณิตผลตอบแทนประจำปีเฉลี่ย 5 ปีของกองทุนรวม 15 กองทุนด้วยมาก ระดับสูงความเสี่ยง (รูปที่ 1).
ข้าว. 1. ผลตอบแทนเฉลี่ยต่อปีของ 15 กองทุนรวมที่มีความเสี่ยงสูงมาก
ค่าเฉลี่ยตัวอย่างคำนวณได้ดังนี้:
นี่เป็นผลตอบแทนที่ดี โดยเฉพาะอย่างยิ่งเมื่อเทียบกับผลตอบแทน 3-4% ที่ธนาคารหรือผู้ฝากเครดิตยูเนี่ยนได้รับในช่วงเวลาเดียวกัน หากคุณจัดเรียงมูลค่าที่ส่งคืน จะเห็นได้ง่ายว่ากองทุนแปดกองทุนมีผลตอบแทนที่สูงกว่า และเจ็ดกองทุนต่ำกว่าค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตทำหน้าที่เป็นจุดสมดุล เพื่อให้กองทุนที่มีรายได้ต่ำสร้างสมดุลให้กับกองทุนที่มีรายได้สูง องค์ประกอบทั้งหมดของตัวอย่างมีส่วนร่วมในการคำนวณค่าเฉลี่ย ไม่มีตัวประมาณค่าอื่นๆ ของค่าเฉลี่ยการกระจายมีคุณสมบัตินี้
เมื่อคำนวณค่าเฉลี่ยเลขคณิตเนื่องจากค่าเฉลี่ยเลขคณิตขึ้นอยู่กับองค์ประกอบทั้งหมดของตัวอย่าง การมีค่ามากจึงส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ ในสถานการณ์เช่นนี้ ค่าเฉลี่ยเลขคณิตสามารถบิดเบือนความหมายของข้อมูลตัวเลขได้ ดังนั้น เมื่ออธิบายชุดข้อมูลที่มีค่าสุดขั้ว จำเป็นต้องระบุค่ามัธยฐานหรือค่าเฉลี่ยเลขคณิตและค่ามัธยฐาน ตัวอย่างเช่น หากนำผลตอบแทนของกองทุน RS Emerging Growth ออกจากกลุ่มตัวอย่าง ค่าเฉลี่ยตัวอย่างของผลตอบแทนของกองทุน 14 กองทุนจะลดลงเกือบ 1% เป็น 5.19%
ค่ามัธยฐาน
ค่ามัธยฐานคือค่ากลางของอาร์เรย์ตัวเลข หากอาร์เรย์ไม่มีตัวเลขซ้ำกัน องค์ประกอบครึ่งหนึ่งจะน้อยกว่าค่ามัธยฐานครึ่งหนึ่ง หากตัวอย่างมีค่ามาก ควรใช้ค่ามัธยฐานมากกว่าค่าเฉลี่ยเลขคณิตในการประมาณค่าเฉลี่ย ในการคำนวณค่ามัธยฐานของตัวอย่าง จะต้องเรียงลำดับก่อน
สูตรนี้คลุมเครือ ผลลัพธ์ขึ้นอยู่กับว่าตัวเลขเป็นคู่หรือคี่ น:
- หากตัวอย่างมีจำนวนรายการคี่ ค่ามัธยฐานคือ (n+1)/2-องค์ประกอบที่
- หากตัวอย่างมีองค์ประกอบเป็นจำนวนคู่ ค่ามัธยฐานจะอยู่ระหว่างองค์ประกอบตรงกลางทั้งสองของตัวอย่างและเท่ากับค่าเฉลี่ยเลขคณิตที่คำนวณจากองค์ประกอบทั้งสองนี้
ในการคำนวณค่ามัธยฐานสำหรับกลุ่มตัวอย่าง 15 กองทุนที่มีความเสี่ยงสูงมาก อันดับแรก เราต้องเรียงลำดับข้อมูลดิบ (ภาพที่ 2) จากนั้นค่ามัธยฐานจะอยู่ตรงข้ามกับจำนวนองค์ประกอบตรงกลางของกลุ่มตัวอย่าง ในตัวอย่างหมายเลข 8 ของเรา Excel มีฟังก์ชันพิเศษ =MEDIAN() ที่ทำงานกับอาร์เรย์ที่ไม่เรียงลำดับเช่นกัน
ข้าว. 2. ค่ามัธยฐาน 15 กองทุน
ดังนั้น ค่ามัธยฐานคือ 6.5 ซึ่งหมายความว่าครึ่งหนึ่งของกองทุนที่มีความเสี่ยงสูงมากไม่เกิน 6.5 ในขณะที่อีกครึ่งหนึ่งทำเช่นนั้น โปรดทราบว่าค่ามัธยฐานของ 6.5 นั้นมากกว่าค่ามัธยฐานของ 6.08 เล็กน้อย
หากเราลบความสามารถในการทำกำไรของกองทุน RS Emerging Growth ออกจากกลุ่มตัวอย่าง ค่ามัธยฐานของกองทุนที่เหลือ 14 กองทุนจะลดลงเหลือ 6.2% นั่นคือไม่เท่ากับค่าเฉลี่ยเลขคณิต (รูปที่ 3)
ข้าว. 3. ค่ามัธยฐาน 14 กองทุน
แฟชั่น
คำนี้ถูกนำมาใช้ครั้งแรกโดยเพียร์สันในปี พ.ศ. 2437 แฟชั่นเป็นตัวเลขที่เกิดขึ้นบ่อยที่สุดในกลุ่มตัวอย่าง (ทันสมัยที่สุด) แฟชั่นอธิบายได้ดี ตัวอย่างเช่น ปฏิกิริยาทั่วไปของผู้ขับขี่ต่อสัญญาณไฟจราจรเพื่อหยุดการจราจร ตัวอย่างคลาสสิกการใช้แฟชั่น - การเลือกขนาดของรองเท้าที่ผลิตหรือสีของวอลล์เปเปอร์ หากการกระจายมีหลายโหมด จะเรียกว่าต่อเนื่องหลายรูปแบบหรือหลายรูปแบบ (มี "จุดสูงสุด" สองจุดขึ้นไป) การกระจายหลายรูปแบบให้ ข้อมูลสำคัญเกี่ยวกับธรรมชาติของตัวแปรที่กำลังศึกษา ตัวอย่างเช่น ในการสำรวจทางสังคมวิทยา หากตัวแปรแสดงถึงความชอบหรือทัศนคติต่อบางสิ่งบางอย่าง ความหลายหลากอาจหมายความว่ามีความคิดเห็นที่แตกต่างกันหลายประการอย่างชัดเจน หลายรูปแบบยังเป็นตัวบ่งชี้ว่าตัวอย่างไม่เป็นเนื้อเดียวกันและการสังเกตอาจถูกสร้างขึ้นโดยการแจกแจงแบบ "คาบเกี่ยวกัน" สองครั้งหรือมากกว่า ไม่เหมือนกับค่าเฉลี่ยเลขคณิต ค่าผิดปกติจะไม่ส่งผลต่อโหมด สำหรับตัวแปรสุ่มแบบกระจายอย่างต่อเนื่อง เช่น ผลตอบแทนเฉลี่ยต่อปีของกองทุนรวม บางครั้งโหมดนี้ไม่มีอยู่เลย (หรือไม่สมเหตุสมผล) เนื่องจากตัวบ่งชี้เหล่านี้สามารถรับค่าต่างๆ ได้ ค่าที่เกิดซ้ำจึงหายากมาก
ควอร์ไทล์
ควอร์ไทล์เป็นหน่วยวัดที่ใช้บ่อยที่สุดในการประเมินการกระจายข้อมูลเมื่ออธิบายคุณสมบัติของตัวอย่างที่เป็นตัวเลขขนาดใหญ่ ในขณะที่ค่ามัธยฐานแบ่งอาร์เรย์ที่เรียงลำดับออกเป็นครึ่งหนึ่ง (50% ขององค์ประกอบอาร์เรย์มีค่าน้อยกว่าค่ามัธยฐานและมากกว่า 50%) ควอร์ไทล์จะแบ่งชุดข้อมูลที่สั่งซื้อออกเป็นสี่ส่วน ค่า Q 1 ค่ามัธยฐานและ Q 3 คือเปอร์เซ็นไทล์ที่ 25, 50 และ 75 ตามลำดับ ควอร์ไทล์แรก Q 1 เป็นตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วน: 25% ขององค์ประกอบน้อยกว่าและ 75% เป็น มากกว่าครั้งแรกควอร์ไทล์
ควอร์ไทล์ที่สาม Q 3 เป็นตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วนด้วย: 75% ขององค์ประกอบน้อยกว่าและ 25% มากกว่าควอร์ไทล์ที่สาม
ในการคำนวณควอไทล์ใน Excel เวอร์ชันก่อนปี 2550 จะใช้ฟังก์ชัน =QUARTILE(array, part) เริ่มต้นด้วย Excel 2010 สองฟังก์ชันที่ใช้:
- =QUARTILE.ON(อาร์เรย์ ส่วนหนึ่ง)
- =QUARTILE.EXC(อาร์เรย์ ส่วน)
ฟังก์ชันทั้งสองนี้ให้ประโยชน์เล็กน้อย ความหมายต่างๆ(รูปที่ 4). ตัวอย่างเช่น เมื่อคำนวณควอร์ไทล์ของกลุ่มตัวอย่างที่มีข้อมูลผลตอบแทนประจำปีเฉลี่ยของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน Q 1 = 1.8 หรือ -0.7 สำหรับ QUARTILE.INC และ QUARTILE.EXC ตามลำดับ อย่างไรก็ตาม ฟังก์ชัน QUARTILE ที่ใช้ก่อนหน้านี้สอดคล้องกับ ฟังก์ชั่นที่ทันสมัย QUARTILE ON ในการคำนวณควอร์ไทล์ใน Excel โดยใช้สูตรข้างต้น อาร์เรย์ข้อมูลสามารถปล่อยไว้แบบไม่เรียงลำดับได้
ข้าว. 4. คำนวณควอร์ไทล์ใน Excel
มาเน้นย้ำกันอีกครั้ง Excel สามารถคำนวณควอไทล์สำหรับ univariate ซีรีส์ไม่ต่อเนื่อง ซึ่งประกอบด้วยค่า ตัวแปรสุ่ม. การคำนวณควอไทล์สำหรับการแจกแจงตามความถี่แสดงไว้ในส่วนด้านล่าง
เฉลี่ยเรขาคณิต
ไม่เหมือนกับค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยเรขาคณิตจะวัดว่าตัวแปรเปลี่ยนแปลงไปมากเพียงใดในช่วงเวลาหนึ่ง ค่าเฉลี่ยเรขาคณิตคือรูต น th องศาจากผลิตภัณฑ์ นค่า (ใน Excel ใช้ฟังก์ชัน = CUGEOM):
G= (X 1 * X 2 * ... * X n) 1/n
พารามิเตอร์ที่คล้ายกันคือค่าเฉลี่ย ค่าเรขาคณิตอัตราผลตอบแทนถูกกำหนดโดยสูตร:
G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,
ที่ไหน อาร์ ไอ- อัตราผลตอบแทน ผม- ช่วงเวลาที่.
ตัวอย่างเช่น สมมติว่าเงินลงทุนเริ่มแรกคือ 100,000 ดอลลาร์ เมื่อสิ้นสุดปีแรก จะลดลงเหลือ 50,000 ดอลลาร์ และภายในสิ้นปีที่สอง จะกู้คืนเป็น 100,000 ดอลลาร์เดิม อัตราผลตอบแทนจากการลงทุนนี้มากกว่าสอง ระยะเวลาปีเท่ากับ 0 เนื่องจากจำนวนเงินเริ่มต้นและขั้นสุดท้ายเท่ากัน อย่างไรก็ตาม ค่าเฉลี่ยเลขคณิต อัตรารายปีกำไรคือ = (-0.5 + 1) / 2 = 0.25 หรือ 25% เนื่องจากอัตราผลตอบแทนในปีแรก R 1 = (50,000 - 100,000) / 100,000 = -0.5 และในวินาที R 2 = (100,000 – 50,000) / 50,000 = 1 ในขณะเดียวกันค่าเฉลี่ยเรขาคณิตของอัตราผลตอบแทนสำหรับสองปีคือ: G = [(1–0.5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0 ดังนั้น ค่าเฉลี่ยเรขาคณิตสะท้อนการเปลี่ยนแปลงได้แม่นยำยิ่งขึ้น (แม่นยำกว่า คือ ไม่มีการเปลี่ยนแปลง) ในปริมาณการลงทุนในช่วงครึ่งปีมากกว่าค่าเฉลี่ยเลขคณิต
ข้อเท็จจริงที่น่าสนใจ.อย่างแรก ค่าเฉลี่ยเรขาคณิตจะน้อยกว่าค่าเฉลี่ยเลขคณิตของตัวเลขเดียวกันเสมอ ยกเว้นกรณีที่ตัวเลขที่นำมาทั้งหมดมีค่าเท่ากัน ประการที่สอง พิจารณาคุณสมบัติ สามเหลี่ยมมุมฉากคุณสามารถเข้าใจได้ว่าทำไมค่าเฉลี่ยจึงเรียกว่าเรขาคณิต ความสูงของสามเหลี่ยมมุมฉากที่ลดลงถึงด้านตรงข้ามมุมฉากเป็นสัดส่วนเฉลี่ยระหว่างการฉายภาพของขาบนด้านตรงข้ามมุมฉาก และขาแต่ละข้างเป็นสัดส่วนเฉลี่ยระหว่างด้านตรงข้ามมุมฉากกับการฉายภาพบนด้านตรงข้ามมุมฉาก (รูปที่ 5) นี่เป็นวิธีทางเรขาคณิตในการสร้างค่าเฉลี่ยเรขาคณิตของสองส่วน (ความยาว) คุณต้องสร้างวงกลมบนผลรวมของทั้งสองส่วนนี้เป็นเส้นผ่านศูนย์กลาง จากนั้นจึงเพิ่มความสูงจากจุดเชื่อมต่อไปยังจุดตัดด้วย วงกลมจะให้ค่าที่ต้องการ:
ข้าว. 5. ลักษณะทางเรขาคณิตของค่าเฉลี่ยเรขาคณิต (รูปจาก Wikipedia)
ที่สอง ทรัพย์สินที่สำคัญข้อมูลตัวเลข - พวกเขา รูปแบบต่างๆระบุระดับการกระจายตัวของข้อมูล ตัวอย่างที่แตกต่างกันสองตัวอย่างสามารถแตกต่างกันได้ทั้งในค่าเฉลี่ยและในรูปแบบต่างๆ อย่างไรก็ตาม ดังแสดงในรูปที่ 6 และ 7 ตัวอย่างสองตัวอย่างสามารถมีความผันแปรเหมือนกัน แต่มีค่าเฉลี่ยต่างกัน หรือค่าเฉลี่ยเดียวกันและรูปแบบต่างกันโดยสิ้นเชิง ข้อมูลที่สอดคล้องกับรูปหลายเหลี่ยม B ในรูปที่ 7 เปลี่ยนแปลงน้อยกว่าข้อมูลที่สร้างรูปหลายเหลี่ยม A มาก
ข้าว. 6. การแจกแจงรูประฆังแบบสมมาตรสองชุดโดยมีค่าสเปรดเท่ากันและค่าเฉลี่ยต่างกัน
ข้าว. 7. การแจกแจงรูประฆังสมมาตรสองชุดที่มีค่าเฉลี่ยเท่ากันและการกระจายต่างกัน
ค่าประมาณการแปรผันของข้อมูลมีห้าค่า:
- ช่วง
- ช่วงระหว่างควอไทล์,
- การกระจายตัว
- ส่วนเบี่ยงเบนมาตรฐาน,
- ค่าสัมประสิทธิ์การแปรผัน
ขอบเขต
พิสัยคือความแตกต่างระหว่างองค์ประกอบที่ใหญ่ที่สุดและเล็กที่สุดของกลุ่มตัวอย่าง:
รูด = XMax-Xนาที
ช่วงของกลุ่มตัวอย่างที่มีผลตอบแทนเฉลี่ยต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุนสามารถคำนวณได้โดยใช้อาร์เรย์ที่สั่งซื้อ (ดูรูปที่ 4): ช่วง = 18.5 - (-6.1) = 24.6 ซึ่งหมายความว่าความแตกต่างระหว่างผลตอบแทนรายปีเฉลี่ยสูงสุดและต่ำสุดสำหรับกองทุนที่มีความเสี่ยงสูงมากคือ 24.6%
ช่วงการวัดการแพร่กระจายโดยรวมของข้อมูล แม้ว่าช่วงตัวอย่างจะเป็นการประมาณการอย่างง่ายของการกระจายข้อมูลทั้งหมด แต่จุดอ่อนของมันคือไม่คำนึงถึงวิธีการกระจายข้อมูลระหว่างองค์ประกอบต่ำสุดและสูงสุด เอฟเฟกต์นี้เห็นได้ชัดเจนในรูปที่ 8 ซึ่งแสดงตัวอย่างที่มีช่วงเดียวกัน มาตราส่วน B แสดงว่าถ้าตัวอย่างมีค่าสุดขั้วอย่างน้อยหนึ่งค่า ช่วงตัวอย่างจะเป็นค่าประมาณการกระจายของข้อมูลที่ไม่ถูกต้องแม่นยำมาก
ข้าว. 8. การเปรียบเทียบตัวอย่างสามตัวอย่างที่มีช่วงเดียวกัน สามเหลี่ยมเป็นสัญลักษณ์ของการสนับสนุนความสมดุลและตำแหน่งของมันสอดคล้องกับค่าเฉลี่ยของกลุ่มตัวอย่าง
ช่วงระหว่างควอไทล์
ช่วงระหว่างควอไทล์หรือค่าเฉลี่ยคือความแตกต่างระหว่างควอไทล์ที่สามและควอไทล์แรกของตัวอย่าง:
ช่วงระหว่างควอไทล์ \u003d Q 3 - Q 1
ค่านี้ทำให้สามารถประมาณการการแพร่กระจายขององค์ประกอบ 50% และไม่คำนึงถึงอิทธิพลขององค์ประกอบที่รุนแรง ช่วงระหว่างควอไทล์สำหรับตัวอย่างที่มีข้อมูลเกี่ยวกับผลตอบแทนประจำปีเฉลี่ยของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน สามารถคำนวณได้โดยใช้ข้อมูลในรูปที่ 4 (ตัวอย่างเช่น สำหรับฟังก์ชัน QUARTILE.EXC): ช่วงระหว่างควอไทล์ = 9.8 - (-0.7) = 10.5 ช่วงเวลาระหว่าง 9.8 ถึง -0.7 มักเรียกว่าครึ่งกลาง
ควรสังเกตว่าค่า Q 1 และ Q 3 และด้วยเหตุนี้ช่วงระหว่างควอไทล์ไม่ขึ้นอยู่กับการมีอยู่ของค่าผิดปกติ เนื่องจากการคำนวณไม่คำนึงถึงค่าใดๆ ที่จะน้อยกว่า Q 1 หรือมากกว่า Q 3 . ทั้งหมด ลักษณะเชิงปริมาณเช่น ค่ามัธยฐาน ควอร์ไทล์ที่หนึ่งและสาม และพิสัยระหว่างควอร์ไทล์ซึ่งไม่ได้รับผลกระทบจากค่าผิดปกติ จะเรียกว่าการวัดที่แข็งแกร่ง
แม้ว่าพิสัยและพิสัยระหว่างควอไทล์จะให้ค่าประมาณการกระจัดกระจายรวมและค่าเฉลี่ยของกลุ่มตัวอย่าง ตามลำดับ การประมาณการเหล่านี้ไม่ได้คำนึงถึงวิธีการกระจายข้อมูลอย่างแน่นอน ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานปราศจากข้อบกพร่องนี้ ตัวชี้วัดเหล่านี้ช่วยให้คุณประเมินระดับความผันผวนของข้อมูลรอบค่าเฉลี่ยได้ ความแปรปรวนตัวอย่างเป็นการประมาณของค่าเฉลี่ยเลขคณิตที่คำนวณจากผลต่างกำลังสองระหว่างแต่ละองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง สำหรับตัวอย่าง X 1 , X 2 , ... X n ความแปรปรวนตัวอย่าง (แสดงด้วยสัญลักษณ์ S 2 ถูกกำหนดโดยสูตรต่อไปนี้:
ที่ กรณีทั่วไปความแปรปรวนตัวอย่างคือผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง หารด้วยค่าที่เท่ากับขนาดกลุ่มตัวอย่างลบหนึ่ง:
ที่ไหน - ค่าเฉลี่ยเลขคณิต น- ขนาดตัวอย่าง, X ฉัน - ผม-th องค์ประกอบตัวอย่าง X. ใน Excel ก่อนเวอร์ชัน 2007 สำหรับการคำนวณ ความแปรปรวนตัวอย่างฟังก์ชัน =VAR() ถูกใช้ เนื่องจากเวอร์ชัน 2010 จะใช้ฟังก์ชัน =VAR.B()
ค่าประมาณการกระจายข้อมูลที่ใช้ได้จริงและเป็นที่ยอมรับกันมากที่สุดคือ มาตรฐาน ส่วนเบี่ยงเบนที่เลือก . ตัวบ่งชี้นี้แสดงด้วยสัญลักษณ์ S และเท่ากับ รากที่สองจากความแปรปรวนตัวอย่าง:
ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =STDEV() ถูกใช้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐาน จากเวอร์ชัน 2010 จะใช้ฟังก์ชัน =STDEV.V() ในการคำนวณฟังก์ชันเหล่านี้ อาร์เรย์ข้อมูลสามารถเรียงลำดับได้
ความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่างไม่สามารถเป็นค่าลบได้ สถานการณ์เดียวที่ตัวบ่งชี้ S 2 และ S สามารถเป็นศูนย์ได้คือถ้าองค์ประกอบทั้งหมดของตัวอย่างเท่ากัน ในนี้อย่างสมบูรณ์ คดีเหลือเชื่อพิสัยและพิสัยระหว่างควอไทล์ก็เป็นศูนย์เช่นกัน
ข้อมูลตัวเลขมีความผันผวนโดยเนื้อแท้ ตัวแปรใดๆ ก็สามารถใช้กับเซตได้ ค่านิยมที่แตกต่างกัน. ตัวอย่างเช่น กองทุนรวมต่าง ๆ มีอัตราผลตอบแทนและการสูญเสียที่แตกต่างกัน เนื่องจากความแปรปรวนของข้อมูลตัวเลข สิ่งสำคัญมากคือการศึกษาไม่เพียงแต่ค่าประมาณของค่าเฉลี่ยซึ่งเป็นผลรวมตามธรรมชาติเท่านั้น แต่ยังรวมถึงการประมาณค่าความแปรปรวนซึ่งแสดงลักษณะการกระจายของข้อมูลด้วย
ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานทำให้เราสามารถประมาณการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ย หรืออีกนัยหนึ่งคือ เพื่อกำหนดจำนวนองค์ประกอบในกลุ่มตัวอย่างที่น้อยกว่าค่าเฉลี่ย และจำนวนที่มากกว่า การกระจายตัวมีค่าบางอย่าง คุณสมบัติทางคณิตศาสตร์. อย่างไรก็ตาม ค่าของมันคือกำลังสองของหน่วยวัด - เปอร์เซ็นต์กำลังสอง ตารางดอลลาร์ ตารางนิ้ว ฯลฯ ดังนั้น การประมาณค่าความแปรปรวนตามธรรมชาติจึงเป็นค่าเบี่ยงเบนมาตรฐาน ซึ่งแสดงในหน่วยการวัดปกติ - เปอร์เซ็นต์ของรายได้ ดอลลาร์ หรือนิ้ว
ค่าเบี่ยงเบนมาตรฐานทำให้คุณสามารถประมาณปริมาณความผันผวนขององค์ประกอบตัวอย่างรอบๆ ค่าเฉลี่ยได้ ในเกือบทุกสถานการณ์ ค่าที่สังเกตได้ส่วนใหญ่อยู่ภายในค่าบวกหรือลบหนึ่งค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ดังนั้น เมื่อทราบค่าเฉลี่ยเลขคณิตขององค์ประกอบตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่างแล้ว จึงสามารถกำหนดช่วงเวลาของข้อมูลจำนวนมากได้
ค่าเบี่ยงเบนมาตรฐานของผลตอบแทนจากกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน คือ 6.6 (ภาพที่ 9) ซึ่งหมายความว่าความสามารถในการทำกำไรของกองทุนจำนวนมากแตกต่างจากมูลค่าเฉลี่ยไม่เกิน 6.6% (กล่าวคือ มีความผันผวนอยู่ในช่วงตั้งแต่ – ส= 6.2 – 6.6 = –0.4 ถึง +เ= 12.8) อันที่จริง ช่วงเวลานี้มีผลตอบแทนประจำปีเฉลี่ย 5 ปีที่ 53.3% (8 จาก 15) ของเงินทุน
ข้าว. 9. ส่วนเบี่ยงเบนมาตรฐาน
โปรดทราบว่าในกระบวนการหาผลต่างกำลังสอง สิ่งของที่อยู่ไกลจากค่าเฉลี่ยจะมีน้ำหนักมากกว่าสิ่งของที่อยู่ใกล้ คุณสมบัตินี้เป็นเหตุผลหลักว่าทำไมค่าเฉลี่ยเลขคณิตจึงมักใช้ในการประมาณค่าเฉลี่ยของการแจกแจง
ค่าสัมประสิทธิ์การแปรผัน
ค่าสัมประสิทธิ์การแปรผันเป็นค่าประมาณสัมพัทธ์ซึ่งแตกต่างจากการประมาณการแบบกระจายครั้งก่อน มันถูกวัดเป็นเปอร์เซ็นต์เสมอ ไม่ใช่ในหน่วยข้อมูลดั้งเดิม ค่าสัมประสิทธิ์การแปรผันซึ่งแสดงด้วยสัญลักษณ์ CV วัดการกระจายของข้อมูลรอบค่าเฉลี่ย ค่าสัมประสิทธิ์การแปรผันเท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยค่าเฉลี่ยเลขคณิตและคูณด้วย 100%:
ที่ไหน ส- ส่วนเบี่ยงเบนตัวอย่างมาตรฐาน - ค่าเฉลี่ยตัวอย่าง
ค่าสัมประสิทธิ์การแปรผันทำให้คุณสามารถเปรียบเทียบตัวอย่างสองตัวอย่าง ซึ่งองค์ประกอบต่างๆ จะแสดงในหน่วยการวัดที่ต่างกัน ตัวอย่างเช่น ผู้จัดการบริการจัดส่งทางไปรษณีย์ตั้งใจที่จะอัพเกรดกองรถบรรทุก เมื่อโหลดหีบห่อ มีข้อจำกัดสองประเภทที่ต้องพิจารณา: น้ำหนัก (เป็นปอนด์) และปริมาตร (เป็นลูกบาศก์ฟุต) ของแต่ละบรรจุภัณฑ์ สมมติว่าในตัวอย่าง 200 ถุง น้ำหนักเฉลี่ย 26.0 ปอนด์ ส่วนเบี่ยงเบนมาตรฐานของน้ำหนัก 3.9 ปอนด์ ปริมาตรบรรจุภัณฑ์เฉลี่ย 8.8 ลูกบาศก์ฟุต และค่าเบี่ยงเบนมาตรฐานของปริมาตรคือ 2.2 ลูกบาศก์ฟุต จะเปรียบเทียบการกระจายน้ำหนักและปริมาตรของบรรจุภัณฑ์ได้อย่างไร?
เนื่องจากหน่วยวัดน้ำหนักและปริมาตรต่างกัน ผู้จัดการต้องเปรียบเทียบการกระจายแบบสัมพัทธ์ของค่าเหล่านี้ ค่าสัมประสิทธิ์การแปรผันของน้ำหนักคือ CV W = 3.9 / 26.0 * 100% = 15% และค่าสัมประสิทธิ์การแปรผันของปริมาตร CV V = 2.2 / 8.8 * 100% = 25% . ดังนั้นการกระจายแบบสัมพัทธ์ของปริมาณแพ็กเก็ตจึงมากกว่าการกระจายแบบสัมพัทธ์ของน้ำหนัก
แบบฟอร์มการจัดจำหน่าย
คุณสมบัติที่สำคัญประการที่สามของกลุ่มตัวอย่างคือรูปแบบของการกระจาย การกระจายนี้สามารถเป็นแบบสมมาตรหรือไม่สมมาตรก็ได้ เพื่ออธิบายรูปร่างของการแจกแจง จำเป็นต้องคำนวณค่าเฉลี่ยและค่ามัธยฐาน หากการวัดทั้งสองนี้เหมือนกัน ตัวแปรจะถูกกล่าวว่ามีการกระจายแบบสมมาตร หากค่าเฉลี่ยของตัวแปรมากกว่าค่ามัธยฐาน การแจกแจงจะมีความเบ้เป็นบวก (รูปที่ 10) ถ้าค่ามัธยฐานมากกว่าค่าเฉลี่ย การแจกแจงของตัวแปรจะเบ้ในเชิงลบ ความเบ้เชิงบวกเกิดขึ้นเมื่อค่าเฉลี่ยเพิ่มขึ้นเป็นค่าผิดปกติ ค่านิยมสูง. ความเบ้เชิงลบเกิดขึ้นเมื่อค่าเฉลี่ยลดลงเป็นค่าที่เล็กผิดปกติ ตัวแปรมีการกระจายแบบสมมาตรถ้าไม่ใช้ค่าสุดโต่งใด ๆ ในทิศทางใดทิศทางหนึ่ง เช่น ค่าขนาดใหญ่และค่าเล็กของตัวแปรจะหักล้างกัน
ข้าว. 10. การแจกแจงสามประเภท
ข้อมูลที่ปรากฎในระดับ A มีความเบ้เป็นลบ รูปนี้แสดงหางยาวและเอียงซ้ายที่เกิดจากค่าเล็กน้อยผิดปกติ ค่าที่น้อยมากเหล่านี้จะเปลี่ยนค่าเฉลี่ยไปทางซ้าย และค่านี้จะน้อยกว่าค่ามัธยฐาน ข้อมูลที่แสดงในมาตราส่วน B มีการกระจายแบบสมมาตร แบ่งครึ่งซ้ายและขวาของการกระจายเป็นของตัวเอง เงาสะท้อน. ค่าขนาดใหญ่และค่าน้อยสมดุลกันและค่าเฉลี่ยและค่ามัธยฐานเท่ากัน ข้อมูลที่แสดงในระดับ B มีความเบ้เป็นบวก รูปนี้แสดงหางยาวและเอียงไปทางขวา เกิดจากการมีค่าสูงผิดปกติ ค่าที่มากเกินไปเหล่านี้จะเปลี่ยนค่าเฉลี่ยไปทางขวา และค่าจะมากกว่าค่ามัธยฐาน
ใน Excel สามารถรับสถิติเชิงพรรณนาได้โดยใช้ add-in แพ็คเกจการวิเคราะห์. ผ่านเมนู ข้อมูล → การวิเคราะห์ข้อมูลในหน้าต่างที่เปิดขึ้น ให้เลือกบรรทัด สถิติเชิงพรรณนาและคลิก ตกลง. ในหน้าต่าง สถิติเชิงพรรณนาให้แน่ใจว่าได้ระบุ ช่วงเวลาอินพุต(รูปที่ 11). หากคุณต้องการดูสถิติเชิงพรรณนาในชีตเดียวกันกับข้อมูลเดิม ให้เลือกปุ่มตัวเลือก ช่วงเอาต์พุตและระบุเซลล์ที่คุณต้องการวางด้านซ้าย มุมบนสถิติการส่งออก (ในตัวอย่างของเรา $C$1) หากต้องการส่งข้อมูลไปที่ ใบใหม่หรือใน หนังสือเล่มใหม่เพียงเลือกปุ่มตัวเลือกที่เหมาะสม ทำเครื่องหมายที่ช่องถัดจาก สถิติสุดท้าย. หรือคุณสามารถเลือก ระดับความยาก,k-th เล็กที่สุดและใหญ่เป็นอันดับ k.
ถ้าฝาก ข้อมูลในพื้นที่ การวิเคราะห์คุณไม่เห็นไอคอน การวิเคราะห์ข้อมูลคุณต้องติดตั้งส่วนเสริมก่อน แพ็คเกจการวิเคราะห์(ดูตัวอย่าง)
ข้าว. 11. สถิติเชิงพรรณนาผลตอบแทนประจำปีเฉลี่ย 5 ปีของกองทุนที่มีความเสี่ยงสูงมาก คำนวณโดยใช้ส่วนเสริม การวิเคราะห์ข้อมูลโปรแกรม Excel
Excel คำนวณ ทั้งสายสถิติที่กล่าวถึงข้างต้น: ค่าเฉลี่ย ค่ามัธยฐาน โหมด ค่าเบี่ยงเบนมาตรฐาน ความแปรปรวน ช่วง ( ช่วงเวลา) ขนาดต่ำสุด สูงสุด และขนาดตัวอย่าง ( ตรวจสอบ). นอกจากนี้ Excel ยังคำนวณสถิติใหม่ๆ ให้เราด้วย เช่น ข้อผิดพลาดมาตรฐาน ความโด่ง และความเบ้ มาตรฐานบกพร่อง เท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยสแควร์รูทของขนาดกลุ่มตัวอย่าง ไม่สมมาตรกำหนดลักษณะการเบี่ยงเบนจากสมมาตรของการกระจายและเป็นฟังก์ชันที่ขึ้นอยู่กับลูกบาศก์ของความแตกต่างระหว่างองค์ประกอบของตัวอย่างและค่าเฉลี่ย Kurtosis เป็นการวัดความเข้มข้นสัมพัทธ์ของข้อมูลรอบๆ ค่าเฉลี่ยเทียบกับส่วนท้ายของการกระจาย และขึ้นอยู่กับความแตกต่างระหว่างตัวอย่างกับค่าเฉลี่ยที่ยกกำลังสี่
การคำนวณ สถิติเชิงพรรณนาสำหรับ ประชากร
ค่าเฉลี่ย การกระจาย และรูปร่างของการแจกแจงที่กล่าวถึงข้างต้นเป็นคุณลักษณะตามตัวอย่าง อย่างไรก็ตาม หากชุดข้อมูลประกอบด้วยการวัดเชิงตัวเลขของประชากรทั้งหมด พารามิเตอร์ของชุดข้อมูลก็สามารถคำนวณได้ พารามิเตอร์เหล่านี้รวมถึงค่าเฉลี่ย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานของประชากร
มูลค่าที่คาดหวังเท่ากับผลรวมของค่าทั้งหมดของประชากรทั่วไปหารด้วยปริมาตรของประชากรทั่วไป:
ที่ไหน µ - มูลค่าที่คาดหวัง Xผม- ผม- การสังเกตตัวแปรที่ X, นู๋- ปริมาณประชากรทั่วไป ใน Excel เพื่อคำนวณ ความคาดหวังทางคณิตศาสตร์ใช้ฟังก์ชันเดียวกันกับค่าเฉลี่ยเลขคณิต: =AVERAGE()
ความแปรปรวนของประชากรเท่ากับผลรวมของผลต่างกำลังสองระหว่างองค์ประกอบของประชากรทั่วไปและเสื่อ ความคาดหวังหารด้วยขนาดของประชากร:
ที่ไหน σ2คือความแปรปรวนของประชากรทั่วไป Excel ก่อนเวอร์ชัน 2007 ใช้ฟังก์ชัน =VAR() เพื่อคำนวณความแปรปรวนของประชากร โดยเริ่มด้วยเวอร์ชัน 2010 =VAR.G()
ส่วนเบี่ยงเบนมาตรฐานของประชากรเท่ากับรากที่สองของความแปรปรวนประชากร:
Excel ก่อนเวอร์ชัน 2007 ใช้ =STDEV() ในการคำนวณค่าเบี่ยงเบนมาตรฐานของประชากร โดยเริ่มจากเวอร์ชัน 2010 =STDEV.Y() โปรดทราบว่าสูตรสำหรับความแปรปรวนประชากรและส่วนเบี่ยงเบนมาตรฐานจะแตกต่างจากสูตรสำหรับความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐาน เมื่อคำนวณ สถิติตัวอย่าง S2และ สตัวส่วนของเศษส่วนคือ น - 1และเมื่อคำนวณพารามิเตอร์ σ2และ σ - ปริมาณประชากรทั่วไป นู๋.
หลักการง่ายๆ
ในสถานการณ์ส่วนใหญ่ การสังเกตส่วนใหญ่กระจุกตัวอยู่รอบๆ ค่ามัธยฐาน ก่อตัวเป็นกระจุก ในชุดข้อมูลที่มีความเบ้เป็นบวก คลัสเตอร์นี้จะตั้งอยู่ทางด้านซ้าย (เช่น ด้านล่าง) ของการคาดหมายทางคณิตศาสตร์ และในชุดข้อมูลที่มีความเบ้เป็นลบ คลัสเตอร์นี้จะตั้งอยู่ทางด้านขวา (กล่าวคือ ด้านบน) ของการคาดหมายทางคณิตศาสตร์ ข้อมูลสมมาตรมีค่าเฉลี่ยและค่ามัธยฐานเดียวกัน และกลุ่มการสังเกตรอบๆ ค่าเฉลี่ย ทำให้เกิดการกระจายรูประฆัง หากการแจกแจงไม่มีความเบ้เด่นชัด และข้อมูลกระจุกตัวอยู่รอบจุดศูนย์ถ่วงที่แน่นอน สามารถใช้กฎทั่วไปในการประมาณความแปรปรวนได้ ซึ่งระบุว่า: หากข้อมูลมีการกระจายรูประฆัง แล้วประมาณ 68% ของการสังเกตมีค่าน้อยกว่าหนึ่งค่าเบี่ยงเบนมาตรฐานจากการคาดหมายทางคณิตศาสตร์ ประมาณ 95% ของการสังเกตอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าที่คาดหวัง และ 99.7% ของการสังเกตอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าที่คาดหวัง
ดังนั้น ค่าเบี่ยงเบนมาตรฐาน ซึ่งเป็นค่าประมาณของความผันผวนเฉลี่ยรอบการคาดหมายทางคณิตศาสตร์ ช่วยให้เข้าใจว่าการสังเกตมีการกระจายอย่างไร และเพื่อระบุค่าผิดปกติ มันเป็นไปตามหลักทั่วไปที่ว่าสำหรับการแจกแจงรูประฆัง มีเพียงค่าเดียวในยี่สิบค่าที่แตกต่างจากการคาดหมายทางคณิตศาสตร์โดยมีค่าเบี่ยงเบนมาตรฐานมากกว่าสองค่า ดังนั้นค่านอกช่วงเวลา µ ± 2σสามารถถือเป็นค่าผิดปกติได้ นอกจากนี้ การสังเกตเพียงสามใน 1,000 ครั้งเท่านั้นที่แตกต่างจากการคาดหมายทางคณิตศาสตร์โดยมีค่าเบี่ยงเบนมาตรฐานมากกว่าสามค่า ดังนั้นค่านอกช่วง µ ± 3σมักจะเป็นค่าผิดปกติ สำหรับการแจกแจงที่เบ้สูงหรือไม่ใช่รูประฆัง สามารถใช้กฎง่ายๆ ของ Biename-Chebyshev ได้
กว่าร้อยปีที่แล้วนักคณิตศาสตร์ Bienamay และ Chebyshev ค้นพบโดยอิสระ คุณสมบัติที่มีประโยชน์ส่วนเบี่ยงเบนมาตรฐาน. พบว่าชุดข้อมูลใด ๆ โดยไม่คำนึงถึงรูปร่างของการกระจาย ร้อยละของการสังเกตที่อยู่ในระยะไม่เกิน kค่าเบี่ยงเบนมาตรฐานจากการคาดหมายทางคณิตศาสตร์ ไม่น้อย (1 – 1/ 2)*100%.
ตัวอย่างเช่น if k= 2 กฎ Biename-Chebyshev ระบุว่าอย่างน้อย (1 - (1/2) 2) x 100% = 75% ของการสังเกตต้องอยู่ในช่วงเวลา µ ± 2σ. กฎนี้เป็นจริงสำหรับทุกคน kเกินหนึ่ง กฎของ Biename-Chebyshev นั้นดีมาก ลักษณะทั่วไปและใช้ได้สำหรับการแจกจ่ายใด ๆ แสดงว่า จำนวนเงินขั้นต่ำการสังเกตระยะทางจากความคาดหวังทางคณิตศาสตร์ไม่เกิน ตั้งค่า. อย่างไรก็ตาม หากการกระจายเป็นรูประฆัง กฎทั่วไปจะประมาณความเข้มข้นของข้อมูลรอบค่าเฉลี่ยได้แม่นยำยิ่งขึ้น
การคำนวณสถิติเชิงพรรณนาสำหรับการกระจายตามความถี่
หากไม่มีข้อมูลเดิม การกระจายความถี่จะกลายเป็นแหล่งข้อมูลเพียงแหล่งเดียว ในสถานการณ์เช่นนี้ คุณสามารถคำนวณค่าโดยประมาณของตัวบ่งชี้เชิงปริมาณของการแจกแจงได้ เช่น ค่าเฉลี่ยเลขคณิต ส่วนเบี่ยงเบนมาตรฐาน ควอร์ไทล์
หากข้อมูลตัวอย่างถูกนำเสนอเป็นการแจกแจงความถี่ ค่าโดยประมาณของค่าเฉลี่ยเลขคณิตสามารถคำนวณได้ โดยสมมติว่าค่าทั้งหมดในแต่ละคลาสจะกระจุกตัวที่จุดกึ่งกลางของคลาส:
ที่ไหน - ค่าเฉลี่ยตัวอย่าง น- จำนวนการสังเกตหรือขนาดกลุ่มตัวอย่าง กับ- จำนวนคลาสในการกระจายความถี่ mj- จุดกลาง เจ- ชั้น, ฉเจ- ความถี่ที่สอดคล้องกับ เจ-ชั้น.
ในการคำนวณค่าเบี่ยงเบนมาตรฐานจากการแจกแจงความถี่ จะถือว่าค่าทั้งหมดภายในแต่ละคลาสกระจุกตัวอยู่ที่จุดกึ่งกลางของคลาส
เพื่อให้เข้าใจว่าควอร์ไทล์ของซีรีส์ถูกกำหนดตามความถี่อย่างไร ให้เราพิจารณาการคำนวณควอไทล์ล่างตามข้อมูลสำหรับปี 2556 เกี่ยวกับการกระจายของประชากรรัสเซียตามรายได้เงินสดเฉลี่ยต่อหัว (รูปที่ 12)
ข้าว. 12. ส่วนแบ่งของประชากรรัสเซียที่มีรายได้ทางการเงินต่อหัวโดยเฉลี่ยต่อเดือน rubles
ในการคำนวณควอร์ไทล์แรกของช่วงเวลา ซีรีส์รูปแบบต่างๆคุณสามารถใช้สูตร:
โดยที่ Q1 คือค่าของควอร์ไทล์แรก xQ1 คือขีดจำกัดล่างของช่วงที่มีควอร์ไทล์แรก (ช่วงจะถูกกำหนดโดยความถี่สะสม ครั้งแรกที่เกิน 25%) i คือค่าของช่วงเวลา Σf คือผลรวมของความถี่ของกลุ่มตัวอย่างทั้งหมด อาจเท่ากับ 100% เสมอ SQ1–1 คือความถี่สะสมของช่วงก่อนหน้าช่วงที่มีควอร์ไทล์ต่ำกว่า fQ1 คือความถี่ของช่วงที่มีควอร์ไทล์ต่ำกว่า สูตรสำหรับควอร์ไทล์ที่สามนั้นแตกต่างกันไปในทุกที่ แทนที่จะเป็น Q1 คุณต้องใช้ Q3 และแทนที่ ¾ แทน ¼
ในตัวอย่างของเรา (รูปที่ 12) ควอไทล์ล่างอยู่ในช่วง 7000.1 - 10,000 ความถี่สะสมซึ่งเท่ากับ 26.4% ขีด จำกัด ล่างของช่วงเวลานี้คือ 7000 รูเบิล ค่าของช่วงเวลาคือ 3000 รูเบิล ความถี่สะสมของช่วงเวลาก่อนหน้าช่วงเวลาที่มีควอร์ไทล์ต่ำกว่าคือ 13.4% ความถี่ของช่วงเวลาที่มีควอร์ไทล์ต่ำกว่าคือ 13.0% ดังนั้น: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13.4) / 13 \u003d 9677 rubles
ข้อผิดพลาดที่เกี่ยวข้องกับสถิติเชิงพรรณนา
ในบันทึกนี้ เราได้ศึกษาวิธีอธิบายชุดข้อมูลโดยใช้สถิติต่างๆ ที่ประมาณค่าค่าเฉลี่ย การกระจาย และการแจกแจงของชุดข้อมูล ขั้นตอนต่อไปคือการวิเคราะห์และตีความข้อมูล จนถึงตอนนี้ เราได้ศึกษาคุณสมบัติวัตถุประสงค์ของข้อมูลแล้ว และตอนนี้เราหันไปใช้การตีความตามอัตวิสัย ข้อผิดพลาดสองประการกำลังรอผู้วิจัยอยู่: หัวข้อการวิเคราะห์ที่เลือกไม่ถูกต้องและการตีความผลลัพธ์ที่ไม่ถูกต้อง
การวิเคราะห์ผลการดำเนินงานของ 15 กองทุนรวมที่มีความเสี่ยงสูงมากนั้นค่อนข้างเป็นกลาง เขานำไปสู่ข้อสรุปที่เป็นรูปธรรมโดยสมบูรณ์: กองทุนรวมทั้งหมดมีผลตอบแทนที่แตกต่างกัน สเปรดของผลตอบแทนของกองทุนอยู่ในช่วงตั้งแต่ -6.1 ถึง 18.5 และผลตอบแทนเฉลี่ยอยู่ที่ 6.08 มั่นใจความเที่ยงธรรมของการวิเคราะห์ข้อมูล ทางเลือกที่เหมาะสมตัวชี้วัดเชิงปริมาณรวมของการกระจาย มีการพิจารณาวิธีการประมาณค่าค่าเฉลี่ยและการกระจายข้อมูลหลายวิธี และระบุข้อดีและข้อเสีย จะเลือกสถิติที่เหมาะสมซึ่งให้การวิเคราะห์ที่เป็นกลางและเป็นกลางได้อย่างไร หากการกระจายข้อมูลเอียงเล็กน้อย ควรเลือกค่ามัธยฐานเหนือค่าเฉลี่ยเลขคณิตหรือไม่ ตัวบ่งชี้ใดที่อธิบายลักษณะการกระจายของข้อมูลได้แม่นยำกว่า: ส่วนเบี่ยงเบนมาตรฐานหรือช่วง ควรระบุความเบ้เชิงบวกของการกระจายหรือไม่
ในทางกลับกัน การตีความข้อมูลเป็นกระบวนการเชิงอัตนัย ผู้คนที่หลากหลายได้ข้อสรุปต่างกัน ตีความผลลัพธ์เดียวกัน ทุกคนมีมุมมองของตัวเอง มีคนมองว่าผลตอบแทนรวมประจำปีของกองทุน 15 กองทุนที่มีความเสี่ยงสูงมากนั้นดีและค่อนข้างพอใจกับรายได้ที่ได้รับ คนอื่นอาจคิดว่ากองทุนเหล่านี้มีผลตอบแทนต่ำเกินไป ดังนั้น อัตวิสัยควรได้รับการชดเชยด้วยความซื่อสัตย์ เป็นกลาง และความชัดเจนของข้อสรุป
ประเด็นด้านจริยธรรม
การวิเคราะห์ข้อมูลเชื่อมโยงกับประเด็นทางจริยธรรมอย่างแยกไม่ออก ควรวิจารณ์ข้อมูลที่เผยแพร่ทางหนังสือพิมพ์ วิทยุ โทรทัศน์ และอินเทอร์เน็ต เมื่อเวลาผ่านไป คุณจะได้เรียนรู้ที่จะสงสัยไม่เพียงเกี่ยวกับผลลัพธ์ แต่ยังเกี่ยวกับเป้าหมาย หัวเรื่อง และความเที่ยงธรรมของการวิจัยด้วย Benjamin Disraeli นักการเมืองชื่อดังชาวอังกฤษกล่าวว่า "การโกหกมีอยู่สามประเภท: การโกหก การโกหกที่สาปแช่ง และสถิติ"
ตามที่ระบุในหมายเหตุ ประเด็นทางจริยธรรมเกิดขึ้นเมื่อเลือกผลลัพธ์ที่ควรนำเสนอในรายงาน ทั้งบวกและ ผลลัพธ์เชิงลบ. นอกจากนี้ ในการจัดทำรายงานหรือรายงานเป็นลายลักษณ์อักษร จะต้องนำเสนอผลงานอย่างตรงไปตรงมา เป็นกลาง และเป็นกลาง แยกแยะระหว่างการนำเสนอที่ไม่ดีและไม่ซื่อสัตย์ ในการทำเช่นนี้ จำเป็นต้องกำหนดว่าผู้พูดมีเจตนาอย่างไร บางครั้งผู้พูดละเว้นข้อมูลสำคัญด้วยความไม่รู้ และบางครั้งจงใจ (เช่น หากเขาใช้ค่าเฉลี่ยเลขคณิตเพื่อประมาณค่าเฉลี่ยของข้อมูลเบ้อย่างชัดเจนเพื่อให้ได้มา ผลลัพธ์ที่ต้องการ). การระงับผลที่ไม่ตรงกับมุมมองของผู้วิจัยถือเป็นการทุจริต
วัสดุจากหนังสือ Levin et al. ใช้สถิติสำหรับผู้จัดการ - ม.: วิลเลียมส์, 2547. - หน้า. 178–209
ปล่อยให้ฟังก์ชัน QUARTILE รวมกับ more รุ่นแรกๆเก่ง
สมมติว่าคุณต้องหาจำนวนวันโดยเฉลี่ยสำหรับงานที่พนักงานแต่ละคนจะเสร็จสิ้น หรือต้องการคำนวณช่วงเวลา 10 ปี อุณหภูมิเฉลี่ยในวันใดวันหนึ่ง การคำนวณค่าเฉลี่ยของชุดตัวเลขได้หลายวิธี
ค่าเฉลี่ยเป็นฟังก์ชันของการวัดแนวโน้มศูนย์กลาง ซึ่งจุดศูนย์กลางของชุดตัวเลขใน การกระจายทางสถิติ. สามเสียงส่วนใหญ่ เกณฑ์ทั่วไปแนวโน้มจากส่วนกลางโดดเด่น
เฉลี่ยค่าเฉลี่ยเลขคณิตคำนวณโดยการบวกชุดตัวเลขแล้วหารจำนวนตัวเลขเหล่านั้น ตัวอย่างเช่น ค่าเฉลี่ยของ 2, 3, 3, 5, 7 และ 10 มี 30 หารด้วย 6, 5;
ค่ามัธยฐานจำนวนตรงกลางของชุดตัวเลข ครึ่งหนึ่งของตัวเลขมีค่าที่มากกว่าค่ามัธยฐานและครึ่งหนึ่งของตัวเลขมีค่าที่น้อยกว่าค่ามัธยฐาน ตัวอย่างเช่น ค่ามัธยฐานของ 2, 3, 3, 5, 7 และ 10 คือ 4
โหมดจำนวนที่เกิดขึ้นบ่อยที่สุดในกลุ่มตัวเลข เช่น โหมด 2, 3, 3, 5, 7 และ 10 - 3
การวัดแนวโน้มศูนย์กลางของการกระจายตัวแบบสมมาตรของชุดตัวเลขทั้งสามนี้เป็นค่าเดียวกัน ในการแจกแจงตัวเลขจำนวนหนึ่งแบบอสมมาตร พวกมันสามารถแตกต่างกันได้
คำนวณค่าเฉลี่ยของเซลล์ที่อยู่อย่างต่อเนื่องในหนึ่งแถวหรือหนึ่งคอลัมน์
ทำดังต่อไปนี้
การคำนวณหาค่าเฉลี่ยของเซลล์ที่กระจัดกระจาย
เพื่อให้งานนี้สำเร็จ ให้ใช้ฟังก์ชัน เฉลี่ย. คัดลอกตารางด้านล่างลงในแผ่นเปล่า
การคำนวนถัวเฉลี่ยถ่วงน้ำหนัก
SUMPRODUCTและ จำนวนเงิน. ตัวอย่าง vThis คำนวณ ราคาเฉลี่ยหน่วยวัดที่จ่ายในการซื้อสามครั้ง โดยการซื้อแต่ละครั้งเป็นหน่วยวัดที่แตกต่างกันในราคาที่แตกต่างกันต่อหน่วย
คัดลอกตารางด้านล่างลงในแผ่นเปล่า
การคำนวณค่าเฉลี่ยของตัวเลขโดยไม่คำนึงถึง ค่าศูนย์
เพื่อให้งานนี้สำเร็จ ให้ใช้ฟังก์ชัน เฉลี่ยและ ถ้า. คัดลอกตารางด้านล่างและจำไว้ว่าในตัวอย่างนี้ เพื่อให้เข้าใจง่ายขึ้น ให้คัดลอกลงในแผ่นเปล่า
ค่าเฉลี่ยเลขคณิตใน excel สเปรดชีต Excelเหมาะที่สุดสำหรับการคำนวณใดๆ เมื่อเรียน Excel แล้ว คุณจะสามารถแก้ปัญหาในด้านเคมี ฟิสิกส์ คณิตศาสตร์ เรขาคณิต ชีววิทยา สถิติ เศรษฐศาสตร์ และอื่นๆ อีกมากมาย เราไม่ได้คิดถึงเครื่องมือที่ทรงพลังในคอมพิวเตอร์ของเรา ซึ่งหมายความว่าเราไม่ได้ใช้มันอย่างเต็มศักยภาพ ผู้ปกครองหลายคนคิดว่าคอมพิวเตอร์เป็นเพียงของเล่นราคาแพง แต่เปล่าประโยชน์! แน่นอน เพื่อให้เด็กได้ศึกษาเรื่องนี้จริงๆ คุณเองต้องเรียนรู้วิธีการทำงานนั้นแล้วจึงสอนเด็ก นี่เป็นอีกหัวข้อหนึ่ง แต่วันนี้ฉันต้องการคุยกับคุณเกี่ยวกับวิธีหาค่าเฉลี่ยเลขคณิตใน Excel
วิธีหาค่าเฉลี่ยเลขคณิตใน Excel
เราได้พูดถึงความรวดเร็วใน Excel แล้ว และวันนี้เราจะมาพูดถึงค่าเฉลี่ยเลขคณิต
เลือกเซลล์ C12และด้วยความช่วยเหลือ ตัวช่วยสร้างฟังก์ชัน เขียนสูตรคำนวณค่าเฉลี่ยเลขคณิตลงไป เมื่อต้องการทำสิ่งนี้ บนแถบเครื่องมือมาตรฐาน ให้คลิกที่ปุ่ม - การแทรกฟังก์ชัน −fx (ในภาพด้านบน ลูกศรสีแดงอยู่ด้านบน) กล่องโต้ตอบจะเปิดขึ้น ฟังก์ชั่นมาสเตอร์ .
- เลือกในช่อง หมวดหมู่ — สถิติ ;
- ในสนาม เลือกฟังก์ชั่น: เฉลี่ย ;
- คลิกที่ปุ่ม ตกลง .
หน้าต่างต่อไปนี้จะเปิดขึ้น อาร์กิวเมนต์และฟังก์ชัน .
ในสนาม นัมเบอร์1คุณจะเห็นรายการ S2:S11- โปรแกรมเองกำหนดช่วงของเซลล์ที่จำเป็น หาค่าเฉลี่ยเลขคณิต
คลิกที่ปุ่ม ตกลงและในเซลล์ C12ค่าเฉลี่ยเลขคณิตของคะแนนจะปรากฏขึ้น
ปรากฎว่าการคำนวณค่าเฉลี่ยเลขคณิตใน excel นั้นไม่ยากเลย และฉันก็กลัวสูตรต่างๆ อยู่เสมอ เอ่อ ไม่ใช่ตอนนั้นที่เราเรียน
นี้ ตัวประมวลผลสเปรดชีตรับมือกับการคำนวณเกือบทั้งหมด เหมาะสำหรับ การบัญชี. สำหรับการคำนวณมีเครื่องมือพิเศษ - สูตร สามารถใช้กับช่วงหรือแต่ละเซลล์ได้ หากต้องการทราบจำนวนต่ำสุดหรือสูงสุดในกลุ่มเซลล์ ไม่จำเป็นต้องค้นหาด้วยตนเอง เป็นการดีกว่าถ้าใช้ตัวเลือกที่มีให้สำหรับสิ่งนี้ นอกจากนี้ยังเป็นประโยชน์ในการหาวิธีคำนวณค่าเฉลี่ยใน Excel
โดยเฉพาะอย่างยิ่งในตารางที่มีข้อมูลจำนวนมาก หากคอลัมน์ประกอบด้วยราคาสินค้า ศูนย์การค้า. และคุณต้องค้นหาว่าผลิตภัณฑ์ใดที่ถูกที่สุด หากคุณค้นหา "ด้วยตนเอง" จะต้องใช้เวลามาก แต่ใน Excel สามารถทำได้ด้วยการคลิกเพียงไม่กี่ครั้ง ยูทิลิตี้ยังคำนวณค่าเฉลี่ยเลขคณิต ท้ายที่สุด นี่เป็นการดำเนินการง่ายๆ สองอย่าง: การบวกและการหาร
สูงสุดและต่ำสุด
นี่คือวิธีการค้นหา มูลค่าสูงสุดใน excel:
- วางเคอร์เซอร์เซลล์ไว้ที่ใดก็ได้
- ไปที่เมนู "สูตร"
- คลิกแทรกฟังก์ชัน
- เลือก "MAX" จากรายการ หรือเขียนคำนี้ในช่อง "ค้นหา" แล้วคลิก "ค้นหา"
- ในหน้าต่างอาร์กิวเมนต์ ให้ป้อนที่อยู่ของช่วงที่มีค่าสูงสุดที่คุณต้องการทราบ ใน Excel ชื่อเซลล์ประกอบด้วยตัวอักษรและตัวเลข ("B1", "F15", "W34") และชื่อของช่วงคือเซลล์แรกและเซลล์สุดท้ายที่รวมอยู่ในนั้น
- แทนที่จะเขียนที่อยู่ คุณสามารถเขียนตัวเลขได้หลายตัว จากนั้นระบบจะแสดงผลที่ใหญ่ที่สุด
- คลิกตกลง ผลลัพธ์จะปรากฏในเซลล์ที่เคอร์เซอร์อยู่
ขั้นตอนต่อไปคือการระบุช่วงของค่า
ตอนนี้ การหาค่าต่ำสุดใน Excel จะง่ายขึ้น อัลกอริทึมของการกระทำเหมือนกันทั้งหมด เพียงเลือก "MIN" แทน "MAX"
เฉลี่ย
ค่าเฉลี่ยเลขคณิตคำนวณดังนี้: บวกตัวเลขทั้งหมดจากเซตแล้วหารด้วยตัวเลข ใน Excel คุณสามารถคำนวณผลรวม ค้นหาจำนวนเซลล์ที่อยู่ในแถว และอื่นๆ แต่มันซับซ้อนและยาวเกินไป ต้องใช้เยอะ ฟังก์ชั่นต่างๆ. เก็บข้อมูลไว้ในใจ หรือแม้แต่เขียนบางอย่างลงบนกระดาษ แต่อัลกอริธึมสามารถทำให้ง่ายขึ้นได้
วิธีหาค่าเฉลี่ยใน Excel มีดังนี้
- ย้ายเคอร์เซอร์เซลล์ไปที่ any ที่ว่างตาราง
- ไปที่แท็บ "สูตร"
- คลิกที่ "แทรกฟังก์ชัน"
- เลือกเฉลี่ย
- หากรายการนี้ไม่อยู่ในรายการ ให้เปิดโดยใช้ตัวเลือก "ค้นหา"
- ในพื้นที่ Number1 ให้ป้อนที่อยู่ของช่วง หรือเขียนตัวเลขหลายตัวในช่องต่างๆ "Number2", "Number3"
- คลิกตกลง ค่าที่ต้องการจะปรากฏในเซลล์
ดังนั้นคุณจึงสามารถคำนวณได้ไม่เฉพาะกับตำแหน่งในตารางเท่านั้น แต่ยังสามารถคำนวณด้วยชุดคำสั่งต่างๆ ได้ด้วย อันที่จริง Excel มีบทบาทเป็นเครื่องคิดเลขขั้นสูง
วิธีอื่นๆ
ค่าสูงสุด ค่าต่ำสุด และค่าเฉลี่ยสามารถดูได้ด้วยวิธีอื่น
- ค้นหาแถบฟังก์ชันที่ระบุว่า "Fx" อยู่เหนือพื้นที่ทำงานหลักของโต๊ะ
- วางเคอร์เซอร์ในเซลล์ใดก็ได้
- ป้อนอาร์กิวเมนต์ในช่อง "Fx" มันเริ่มต้นด้วยเครื่องหมายเท่ากับ จากนั้นสูตรและที่อยู่ของช่วง/เซลล์ก็มาถึง
- คุณควรได้บางอย่างเช่น "=MAX(B8:B11)" (สูงสุด), "=MIN(F7:V11)" (ขั้นต่ำ), "=AVERAGE(D14:W15)" (โดยเฉลี่ย)
- คลิกที่ "ติ๊ก" ถัดจากฟิลด์ฟังก์ชัน หรือเพียงแค่กด Enter ค่าที่ต้องการจะปรากฏในเซลล์ที่เลือก
- สามารถคัดลอกสูตรลงในเซลล์ได้โดยตรง ผลจะเหมือนกัน
Excel-tool "Autofunctions" จะช่วยในการค้นหาและคำนวณ
- วางเคอร์เซอร์ในเซลล์
- ค้นหาปุ่มที่มีชื่อขึ้นต้นด้วย "อัตโนมัติ" ขึ้นอยู่กับตัวเลือกเริ่มต้นที่เลือกใน Excel (AutoSum, AutoNumber, AutoOffset, AutoIndex)
- คลิกที่ลูกศรสีดำด้านล่าง
- เลือก MIN (ขั้นต่ำ), MAX (สูงสุด) หรือ AVERAGE (เฉลี่ย)
- สูตรจะปรากฏในเซลล์ที่ทำเครื่องหมายไว้ คลิกที่เซลล์อื่น - เซลล์นั้นจะถูกเพิ่มลงในฟังก์ชัน "ลาก" กล่องรอบๆ เพื่อให้ครอบคลุมช่วง หรือ Ctrl-คลิกกริดเพื่อเลือกหนึ่งองค์ประกอบในแต่ละครั้ง
- เมื่อเสร็จแล้ว ให้กด Enter ผลลัพธ์จะแสดงในเซลล์
ใน Excel การคำนวณค่าเฉลี่ยนั้นค่อนข้างง่าย ไม่ต้องเพิ่มแล้วแบ่งจำนวน มีฟังก์ชั่นแยกต่างหากสำหรับสิ่งนี้ คุณยังสามารถหาค่าต่ำสุดและสูงสุดในชุดได้ ง่ายกว่าการนับด้วยมือหรือการค้นหาตัวเลขในสเปรดชีตขนาดใหญ่ ดังนั้น Excel จึงเป็นที่นิยมในหลายสาขาของกิจกรรมที่ต้องการความแม่นยำ: ธุรกิจ การตรวจสอบ การจัดการบันทึกบุคลากร การเงิน การค้า คณิตศาสตร์ ฟิสิกส์ ดาราศาสตร์ เศรษฐศาสตร์ วิทยาศาสตร์