วิธีการวิเคราะห์เชิงปริมาณ: การประมาณค่าช่วงความเชื่อมั่น ช่วงความเชื่อมั่นใน Excel: ความหมาย ความหมาย โครงสร้าง และการคำนวณ ช่วงความเชื่อมั่นทางสถิติ

💖 ชอบไหม?แชร์ลิงก์กับเพื่อนของคุณ

การวิเคราะห์ข้อผิดพลาดแบบสุ่มขึ้นอยู่กับทฤษฎีข้อผิดพลาดแบบสุ่ม ซึ่งทำให้รับประกันได้ว่าจะสามารถคำนวณค่าที่แท้จริงของค่าที่วัดได้และประเมินข้อผิดพลาดที่เป็นไปได้

ทฤษฎีข้อผิดพลาดแบบสุ่มขึ้นอยู่กับสมมติฐานต่อไปนี้:

ด้วยการวัดจำนวนมากข้อผิดพลาดแบบสุ่มที่มีขนาดเท่ากัน แต่มีสัญญาณต่างกันเกิดขึ้นบ่อยเท่า ๆ กัน

ข้อผิดพลาดขนาดใหญ่นั้นพบได้น้อยกว่าข้อผิดพลาดเล็กๆ (ความน่าจะเป็นของข้อผิดพลาดจะลดลงเมื่อขนาดเพิ่มขึ้น)

ด้วยการวัดจำนวนมากอย่างไม่สิ้นสุด ค่าที่แท้จริงของปริมาณที่วัดได้จะเท่ากับค่าเฉลี่ยเลขคณิตของผลการวัดทั้งหมด

การปรากฏตัวของผลการวัดอย่างใดอย่างหนึ่งเป็นเหตุการณ์สุ่มอธิบายโดยกฎการกระจายแบบปกติ

ในทางปฏิบัติ จะมีความแตกต่างระหว่างชุดการวัดทั่วไปและชุดตัวอย่าง

ภายใต้จำนวนประชากร หมายถึงชุดของค่าการวัดที่เป็นไปได้ทั้งหมดหรือค่าความผิดพลาดที่เป็นไปได้
.

สำหรับประชากรกลุ่มตัวอย่าง จำนวนการวัด จำกัดและกำหนดอย่างเคร่งครัดในแต่ละกรณี พวกเขาคิดว่าถ้า
แล้วตามด้วยค่าเฉลี่ยของชุดการวัดนี้ ใกล้เคียงกับมูลค่าที่แท้จริงมากพอ

1. การประมาณช่วงโดยใช้ความน่าจะเป็นของความเชื่อมั่น

สำหรับตัวอย่างขนาดใหญ่และการแจกแจงแบบปกติ คุณลักษณะการประเมินโดยทั่วไปของการวัดคือการกระจายตัว
และสัมประสิทธิ์การแปรผัน :

;
. (1.1)

การกระจายตัวบ่งบอกถึงความเป็นเนื้อเดียวกันของการวัด ที่สูงกว่า
ยิ่งการกระจายของการวัดมีมากขึ้น

ค่าสัมประสิทธิ์ของการแปรผันแสดงถึงความแปรปรวน ที่สูงกว่า ยิ่งความแปรปรวนของการวัดสัมพันธ์กับค่าเฉลี่ยยิ่งมากขึ้น

เพื่อประเมินความน่าเชื่อถือของผลการวัด จึงได้นำแนวคิดเรื่องช่วงความเชื่อมั่นและความน่าจะเป็นของความเชื่อมั่นมาใช้

ที่เชื่อถือ เรียกว่าช่วง ค่านิยม , ซึ่งมูลค่าที่แท้จริงตกลงไปในนั้น ปริมาณที่วัดได้ด้วยความน่าจะเป็นที่กำหนด

ความน่าจะเป็นของความมั่นใจ (ความน่าเชื่อถือ) ของการวัดคือความน่าจะเป็นที่ค่าที่แท้จริงของค่าที่วัดได้จะอยู่ภายในช่วงความเชื่อมั่นที่กำหนด เช่น ไปที่โซน
- ค่านี้จะถูกกำหนดเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์

,

ที่ไหน
- ฟังก์ชันปริพันธ์ของลาปลาซ ( ตารางที่ 1.1 )

ฟังก์ชันอินทิกรัลลาปลาสถูกกำหนดโดยนิพจน์ต่อไปนี้:

.

อาร์กิวเมนต์ของฟังก์ชันนี้คือ ปัจจัยการรับประกัน :

ตารางที่ 1.1

ฟังก์ชันอินทิกรัลลาปลาซ

บนพื้นฐานของข้อมูลบางอย่าง หากมีความน่าจะเป็นของความเชื่อมั่นเกิดขึ้น (มักจะถือว่าเท่ากับ
) จากนั้นจะถูกตั้งค่า ความแม่นยำของการวัด (ช่วงความมั่นใจ
) ขึ้นอยู่กับอัตราส่วน

.

ครึ่งหนึ่งของช่วงความเชื่อมั่นคือ

, (1.3)

ที่ไหน
- อาร์กิวเมนต์ของฟังก์ชัน Laplace ถ้า
(ตารางที่ 1.1 );

- ฟังก์ชั่นนักศึกษา ถ้า
(ตารางที่ 1.2 ).

ดังนั้น ช่วงความเชื่อมั่นจึงแสดงคุณลักษณะของความแม่นยำในการวัดตัวอย่างที่กำหนด และความน่าจะเป็นของความเชื่อมั่นจะแสดงคุณลักษณะของความน่าเชื่อถือของการวัด

ตัวอย่าง

เสร็จแล้ว
การวัดความแข็งแกร่งของพื้นผิวถนนส่วนทางหลวงด้วยโมดูลัสยืดหยุ่นโดยเฉลี่ย
และค่าที่คำนวณได้ของส่วนเบี่ยงเบนมาตรฐาน
.

จำเป็น กำหนดความแม่นยำที่ต้องการการวัดระดับความมั่นใจที่แตกต่างกัน
โดยรับค่าต่างๆ โดย ตารางที่ 1.1 .

ในกรณีนี้ ดังนั้น |

ดังนั้น สำหรับวิธีการและวิธีการวัดที่กำหนด ช่วงความเชื่อมั่นจึงเพิ่มขึ้นประมาณ ครั้งถ้าคุณเพิ่มขึ้น แค่เปิด
.

ตัวอย่างใดๆ ให้เพียงแนวคิดโดยประมาณของประชากรทั่วไป และคุณลักษณะทางสถิติของกลุ่มตัวอย่างทั้งหมด (ค่าเฉลี่ย โหมด ความแปรปรวน...) เป็นเพียงการประมาณบางส่วนหรือพูดเป็นค่าประมาณของพารามิเตอร์ทั่วไป ซึ่งในกรณีส่วนใหญ่ไม่สามารถคำนวณได้เนื่องจาก การเข้าไม่ถึงของประชาชนทั่วไป (ภาพที่ 20)

รูปที่ 20. ข้อผิดพลาดในการสุ่มตัวอย่าง

แต่คุณสามารถระบุช่วงเวลาที่ค่าจริง (ทั่วไป) ของลักษณะทางสถิติอยู่ได้ในระดับความน่าจะเป็น ช่วงเวลานี้เรียกว่า ช่วงความเชื่อมั่น (CI)

ดังนั้นค่าเฉลี่ยทั่วไปที่มีความน่าจะเป็น 95% จึงอยู่ภายใน

จากถึง (20)

ที่ไหน ที – ค่าตารางของการทดสอบของนักเรียนสำหรับ α =0.05 และ = n-1

ในกรณีนี้ CI สามารถพบได้ 99% ที เลือกสำหรับ α =0,01.

ความสำคัญเชิงปฏิบัติของช่วงความเชื่อมั่นคืออะไร?

    ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าค่าเฉลี่ยตัวอย่างไม่ได้สะท้อนถึงค่าเฉลี่ยประชากรอย่างแม่นยำ ซึ่งมักเกิดจากการมีขนาดตัวอย่างไม่เพียงพอ หรือความหลากหลาย เช่น การกระจายตัวขนาดใหญ่ ทั้งคู่ให้ค่าคลาดเคลื่อนที่มากกว่าของค่าเฉลี่ยและด้วยเหตุนี้ CI ที่กว้างขึ้น และนี่คือพื้นฐานในการกลับเข้าสู่ขั้นตอนการวางแผนการวิจัย

    ขีดจำกัดบนและล่างของ CI เป็นการประมาณว่าผลลัพธ์จะมีนัยสำคัญทางคลินิกหรือไม่

ให้เราอาศัยอยู่ในรายละเอียดเกี่ยวกับคำถามเกี่ยวกับนัยสำคัญทางสถิติและทางคลินิกของผลการศึกษาคุณสมบัติของกลุ่ม ให้เราจำไว้ว่าหน้าที่ของสถิติคือการตรวจจับความแตกต่างบางอย่างในประชากรทั่วไปเป็นอย่างน้อยโดยพิจารณาจากข้อมูลตัวอย่าง ความท้าทายสำหรับแพทย์คือการตรวจหาความแตกต่าง (ไม่ใช่แค่ข้อแตกต่าง) ที่จะช่วยในการวินิจฉัยหรือการรักษา และข้อสรุปทางสถิติก็ไม่ใช่พื้นฐานสำหรับข้อสรุปทางคลินิกเสมอไป ดังนั้นการลดลงที่มีนัยสำคัญทางสถิติของฮีโมโกลบิน 3 กรัม/ลิตรจึงไม่ทำให้เกิดความกังวล และในทางกลับกัน หากปัญหาบางอย่างในร่างกายมนุษย์ไม่แพร่หลายในระดับประชากรทั้งหมด ก็ไม่ใช่เหตุผลที่จะไม่จัดการกับปัญหานี้

ลองดูสถานการณ์นี้ ตัวอย่าง.

นักวิจัยสงสัยว่าเด็กผู้ชายที่ป่วยด้วยโรคติดเชื้อบางประเภทจะล้าหลังกว่าเพื่อนในการเติบโตหรือไม่ เพื่อจุดประสงค์นี้ จึงมีการศึกษาตัวอย่างโดยให้เด็กชาย 10 คนที่ป่วยด้วยโรคนี้เข้าร่วม ผลลัพธ์แสดงไว้ในตารางที่ 23

ตารางที่ 23. ผลลัพธ์ของการประมวลผลทางสถิติ

ขีดจำกัดล่าง

ขีด จำกัด บน

มาตรฐาน (ซม.)

เฉลี่ย

จากการคำนวณเหล่านี้ พบว่าส่วนสูงเฉลี่ยของกลุ่มตัวอย่างเด็กชายอายุ 10 ขวบที่ป่วยด้วยโรคติดเชื้อบางชนิดอยู่ในเกณฑ์ใกล้เคียงปกติ (132.5 ซม.) อย่างไรก็ตาม ขีดจำกัดล่างของช่วงความเชื่อมั่น (126.6 ซม.) บ่งชี้ว่ามีความน่าจะเป็น 95% ที่ความสูงเฉลี่ยที่แท้จริงของเด็กเหล่านี้สอดคล้องกับแนวคิดเรื่อง "ส่วนสูงสั้น" กล่าวคือ เด็กเหล่านี้แคระแกรน

ในตัวอย่างนี้ ผลลัพธ์ของการคำนวณช่วงความเชื่อมั่นมีความสำคัญทางคลินิก

บ่อยครั้งที่ผู้ประเมินราคาต้องวิเคราะห์ตลาดอสังหาริมทรัพย์ในส่วนที่ทรัพย์สินนั้นถูกประเมินตั้งอยู่ หากตลาดได้รับการพัฒนา การวิเคราะห์ทั้งชุดของวัตถุที่นำเสนออาจเป็นเรื่องยาก ดังนั้นจึงใช้ตัวอย่างของวัตถุในการวิเคราะห์ ตัวอย่างนี้ไม่ได้เป็นเนื้อเดียวกันเสมอไป บางครั้งจำเป็นต้องเคลียร์จุดที่รุนแรง - ข้อเสนอของตลาดสูงเกินไปหรือต่ำเกินไป เพื่อจุดประสงค์นี้จึงถูกนำมาใช้ ช่วงความมั่นใจ- การศึกษานี้มีวัตถุประสงค์เพื่อทำการวิเคราะห์เปรียบเทียบสองวิธีในการคำนวณช่วงความเชื่อมั่น และเลือกตัวเลือกการคำนวณที่เหมาะสมที่สุดเมื่อทำงานกับตัวอย่างที่แตกต่างกันในระบบ estimatica.pro

ช่วงความเชื่อมั่นคือช่วงของค่าคุณลักษณะที่คำนวณตามกลุ่มตัวอย่าง ซึ่งมีความน่าจะเป็นที่ทราบอยู่แล้วว่ามีพารามิเตอร์โดยประมาณของประชากรทั่วไป

จุดสำคัญของการคำนวณช่วงความเชื่อมั่นคือการสร้างช่วงดังกล่าวโดยอาศัยข้อมูลตัวอย่าง เพื่อให้สามารถระบุด้วยความน่าจะเป็นที่กำหนดว่าค่าของพารามิเตอร์โดยประมาณจะอยู่ในช่วงเวลานี้ กล่าวอีกนัยหนึ่ง ช่วงความเชื่อมั่นประกอบด้วยค่าที่ไม่ทราบของค่าประมาณที่มีความน่าจะเป็นที่แน่นอน ยิ่งช่วงห่างมากขึ้น ความคลาดเคลื่อนก็จะยิ่งสูงขึ้น

มีวิธีการต่างๆ ในการกำหนดช่วงความเชื่อมั่น ในบทความนี้เราจะดู 2 วิธี:

  • ผ่านค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน
  • ผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)

ขั้นตอนของการวิเคราะห์เปรียบเทียบวิธีการต่าง ๆ ในการคำนวณ CI:

1. สร้างตัวอย่างข้อมูล

2. เราประมวลผลโดยใช้วิธีการทางสถิติ: เราคำนวณค่าเฉลี่ย ค่ามัธยฐาน ความแปรปรวน ฯลฯ

3. คำนวณช่วงความเชื่อมั่นได้สองวิธี

4. วิเคราะห์ตัวอย่างที่ทำความสะอาดแล้วและช่วงความเชื่อมั่นที่ได้

ขั้นตอนที่ 1 การสุ่มตัวอย่างข้อมูล

ตัวอย่างถูกสร้างขึ้นโดยใช้ระบบ estimatica.pro ตัวอย่างรวมข้อเสนอ 91 รายการสำหรับการขายอพาร์ทเมนต์ 1 ห้องในโซนราคาที่ 3 พร้อมเลย์เอาต์ประเภท "ครุสชอฟ"

ตารางที่ 1. ตัวอย่างเริ่มต้น

ราคา 1 ตร.ม. ยูนิต

รูปที่ 1. ตัวอย่างเบื้องต้น



ขั้นตอนที่ 2 การประมวลผลตัวอย่างเริ่มต้น

การประมวลผลตัวอย่างโดยใช้วิธีทางสถิติจำเป็นต้องมีการคำนวณค่าต่อไปนี้:

1. ค่าเฉลี่ยเลขคณิต

2. ค่ามัธยฐานคือตัวเลขที่แสดงลักษณะของตัวอย่าง โดยครึ่งหนึ่งขององค์ประกอบตัวอย่างมีค่ามากกว่าค่ามัธยฐาน ส่วนอีกครึ่งหนึ่งมีค่าน้อยกว่าค่ามัธยฐาน

(สำหรับตัวอย่างที่มีค่าเลขคี่)

3. พิสัย - ความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดในกลุ่มตัวอย่าง

4. ความแปรปรวน - ใช้เพื่อประมาณค่าความแปรผันของข้อมูลได้แม่นยำยิ่งขึ้น

5. ค่าเบี่ยงเบนมาตรฐานตัวอย่าง (ต่อไปนี้ - SD) เป็นตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าการปรับรอบค่าเฉลี่ยเลขคณิต

6. ค่าสัมประสิทธิ์การเปลี่ยนแปลง - สะท้อนถึงระดับการกระจายของค่าการปรับ

7. ค่าสัมประสิทธิ์การแกว่ง - สะท้อนถึงความผันผวนสัมพัทธ์ของค่าราคาสุดขีดในตัวอย่างรอบค่าเฉลี่ย

ตารางที่ 2. ตัวบ่งชี้ทางสถิติของกลุ่มตัวอย่างดั้งเดิม

ค่าสัมประสิทธิ์การแปรผันซึ่งระบุลักษณะความเป็นเนื้อเดียวกันของข้อมูลคือ 12.29% แต่ค่าสัมประสิทธิ์การแกว่งสูงเกินไป ดังนั้น เราสามารถพูดได้ว่าตัวอย่างดั้งเดิมไม่เป็นเนื้อเดียวกัน ดังนั้น เรามาคำนวณช่วงความเชื่อมั่นกันดีกว่า

ขั้นตอนที่ 3 การคำนวณช่วงความเชื่อมั่น

วิธีที่ 1. การคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน

ช่วงความเชื่อมั่นถูกกำหนดดังนี้ ค่าต่ำสุด - ค่าเบี่ยงเบนมาตรฐานจะถูกลบออกจากค่ามัธยฐาน ค่าสูงสุด - ส่วนเบี่ยงเบนมาตรฐานจะถูกบวกเข้ากับค่ามัธยฐาน

ดังนั้น ช่วงความเชื่อมั่น (47179 CU; 60689 CU)

ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 1.



วิธีที่ 2 การสร้างช่วงความเชื่อมั่นโดยใช้ค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)

เอส.วี. Gribovsky ในหนังสือของเขา "วิธีการทางคณิตศาสตร์สำหรับการประมาณมูลค่าทรัพย์สิน" อธิบายวิธีการคำนวณช่วงความเชื่อมั่นผ่านค่าสัมประสิทธิ์นักเรียน เมื่อคำนวณโดยใช้วิธีนี้ ตัวประมาณค่าจะต้องตั้งค่าระดับนัยสำคัญ ∝ ด้วยตัวเอง ซึ่งจะกำหนดความน่าจะเป็นที่จะสร้างช่วงความเชื่อมั่น โดยปกติแล้ว จะใช้ระดับนัยสำคัญที่ 0.1 0.05 และ 0.01 สอดคล้องกับความน่าจะเป็นของความเชื่อมั่นที่ 0.9; 0.95 และ 0.99 ด้วยวิธีนี้ ค่าที่แท้จริงของความคาดหวังและความแปรปรวนทางคณิตศาสตร์จะถือว่าไม่เป็นที่รู้จักในทางปฏิบัติ (ซึ่งเกือบจะเป็นจริงเสมอเมื่อแก้ไขปัญหาการประมาณค่าเชิงปฏิบัติ)

สูตรช่วงความเชื่อมั่น:

n - ขนาดตัวอย่าง;

ค่าวิกฤตของสถิติ t (การกระจายตัวของนักเรียน) ที่มีระดับนัยสำคัญ ∝ จำนวนองศาอิสระ n-1 ซึ่งกำหนดจากตารางสถิติพิเศษหรือใช้ MS Excel ( → "สถิติ" → STUDRIST)

∝ - ระดับนัยสำคัญ รับ ∝=0.01

ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 2.

ขั้นตอนที่ 4 การวิเคราะห์วิธีการต่าง ๆ ในการคำนวณช่วงความเชื่อมั่น

สองวิธีในการคำนวณช่วงความเชื่อมั่น - ผ่านค่ามัธยฐานและค่าสัมประสิทธิ์ของนักเรียน - นำไปสู่ค่าช่วงเวลาที่แตกต่างกัน ดังนั้นเราจึงได้ตัวอย่างที่ทำความสะอาดแล้วสองตัวอย่างที่แตกต่างกัน

ตารางที่ 3. สถิติสำหรับสามตัวอย่าง

ดัชนี

ตัวอย่างเบื้องต้น

1 ตัวเลือก

ตัวเลือกที่ 2

ค่าเฉลี่ย

การกระจายตัว

โคฟ. รูปแบบต่างๆ

โคฟ. การสั่น

จำนวนวัตถุที่เลิกใช้ ชิ้น

จากการคำนวณที่ดำเนินการ เราสามารถพูดได้ว่าค่าช่วงความเชื่อมั่นที่ได้รับโดยวิธีการต่างๆ ตัดกัน ดังนั้นคุณสามารถใช้วิธีการคำนวณใดก็ได้ตามดุลยพินิจของผู้ประเมิน

อย่างไรก็ตาม เราเชื่อว่าเมื่อทำงานในระบบ estimatica.pro ขอแนะนำให้เลือกวิธีการคำนวณช่วงความเชื่อมั่น ขึ้นอยู่กับระดับของการพัฒนาตลาด:

  • หากตลาดยังไม่ได้รับการพัฒนา ให้ใช้วิธีการคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน เนื่องจากจำนวนวัตถุที่เลิกใช้ในกรณีนี้มีน้อย
  • หากตลาดได้รับการพัฒนา ให้ใช้การคำนวณผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์ของนักเรียน) เนื่องจากเป็นไปได้ที่จะสร้างตัวอย่างเริ่มต้นขนาดใหญ่

ในการเตรียมบทความมีการใช้สิ่งต่อไปนี้:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. วิธีทางคณิตศาสตร์ในการประเมินมูลค่าทรัพย์สิน มอสโก, 2014

2. ระบบข้อมูล estimatica.pro

โดยการเก็บตัวอย่างจากประชากร เราจะได้ค่าประมาณแบบจุดของพารามิเตอร์ที่สนใจ และคำนวณค่าคลาดเคลื่อนมาตรฐานเพื่อระบุความแม่นยำของการประมาณค่า

อย่างไรก็ตาม ในกรณีส่วนใหญ่ ข้อผิดพลาดมาตรฐานดังกล่าวไม่สามารถยอมรับได้ การรวมการวัดความแม่นยำนี้เข้ากับการประมาณช่วงสำหรับพารามิเตอร์ประชากรจะมีประโยชน์มากกว่ามาก

ซึ่งสามารถทำได้โดยใช้ความรู้เกี่ยวกับการแจกแจงความน่าจะเป็นทางทฤษฎีของสถิติตัวอย่าง (พารามิเตอร์) เพื่อคำนวณช่วงความเชื่อมั่น (CI - ช่วงความเชื่อมั่น, ดีไอ – ช่วงความเชื่อมั่น) สำหรับพารามิเตอร์

เลย ช่วงความมั่นใจขยายการประมาณค่าในทั้งสองทิศทางด้วยค่าที่แน่นอนซึ่งเป็นผลคูณของข้อผิดพลาดมาตรฐาน (ของพารามิเตอร์ที่กำหนด) ค่าทั้งสอง (ขีดจำกัดความเชื่อมั่น) ที่กำหนดช่วงเวลามักจะคั่นด้วยเครื่องหมายจุลภาคและอยู่ในวงเล็บ

ในสถิติ ก ช่วงความมั่นใจ(CI) เป็นการประมาณช่วงเวลาประเภทหนึ่งของพารามิเตอร์ประชากร เป็นช่วงเวลาที่สังเกตได้ (นั่นคือ คำนวณจากการสังเกต) โดยหลักการแล้วแตกต่างจากตัวอย่างหนึ่งไปอีกตัวอย่างหนึ่ง ซึ่งมักจะรวมค่าของพารามิเตอร์ที่น่าสนใจที่ไม่สามารถสังเกตได้หากทำการทดลองซ้ำ ความถี่ที่ช่วงเวลาที่สังเกตมีพารามิเตอร์นั้นถูกกำหนดโดยระดับความเชื่อมั่นหรือสัมประสิทธิ์ความเชื่อมั่น โดยเฉพาะอย่างยิ่ง ความหมายของคำว่า "ระดับความมั่นใจ" คือ ถ้า CI ถูกสร้างขึ้นจากการวิเคราะห์ข้อมูลที่แยกจากกันของการทดลองที่ทำซ้ำ (และอาจแตกต่างออกไป) สัดส่วนของช่วงเวลาดังกล่าวที่มีค่าที่แท้จริงของพารามิเตอร์จะตรงกับค่าที่กำหนด ระดับความเชื่อมั่น ในขณะที่ขีดจำกัดความเชื่อมั่นแบบสองด้านก่อให้เกิดช่วงความเชื่อมั่น ขีดจำกัดความเชื่อมั่นแบบด้านเดียวจะเรียกว่าขอบเขต (หรือขีดจำกัดความเชื่อมั่นล่าง/บน)


ช่วงความเชื่อมั่นจะแสดงว่าผลลัพธ์ของการสังเกตตัวอย่าง (แบบสำรวจ) จะอยู่ที่ช่วงใด หากเราทำการสำรวจที่เหมือนกัน 100 รายการในกลุ่มตัวอย่างที่เหมือนกันจากประชากรกลุ่มเดียว (เช่น 100 ตัวอย่าง กลุ่มละ 1,000 คนในเมืองที่มีประชากร 5 ล้านคน) ดังนั้นที่ระดับความเชื่อมั่น 95% ผลลัพธ์ 95 จาก 100 รายการจะอยู่ภายใน ช่วงความเชื่อมั่น (เช่น จาก 28% ถึง 32% โดยมีค่าจริง 30%) ตัวอย่างเช่น จำนวนที่แท้จริงของชาวเมืองที่สูบบุหรี่คือ 30% หากเราเลือกคน 1,000 คนติดต่อกัน 100 ครั้งและถามคำถามว่า "คุณสูบบุหรี่หรือไม่" ในกลุ่มตัวอย่างเหล่านี้ ใน 95 ตัวอย่างจาก 100 ตัวอย่างเหล่านี้ที่มีช่วงความเชื่อมั่น 2% ค่าจะอยู่ระหว่าง 28% ถึง 32%

คุณสามารถดูสูตรสำหรับการสร้างช่วงความเชื่อมั่นพร้อมตัวอย่างเชิงปฏิบัติได้ เช่น

การตีความช่วงความเชื่อมั่น

เมื่อตีความช่วงความเชื่อมั่น เราสนใจคำถามต่อไปนี้:

ช่วงความเชื่อมั่นกว้างแค่ไหน?

ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าการประมาณการไม่แม่นยำ แคบบ่งบอกถึงการประมาณการที่แม่นยำ
ความกว้างของช่วงความเชื่อมั่นขึ้นอยู่กับขนาดของข้อผิดพลาดมาตรฐาน ซึ่งในทางกลับกันก็ขึ้นอยู่กับขนาดตัวอย่าง และเมื่อพิจารณาตัวแปรตัวเลข ความแปรปรวนของข้อมูลจะสร้างช่วงความเชื่อมั่นที่กว้างกว่าการศึกษาชุดข้อมูลขนาดใหญ่ที่มีตัวแปรเพียงไม่กี่ตัว .

CI มีค่าใด ๆ ที่น่าสนใจเป็นพิเศษหรือไม่?

คุณสามารถตรวจสอบว่าค่าที่เป็นไปได้สำหรับพารามิเตอร์ประชากรอยู่ภายในช่วงความเชื่อมั่นหรือไม่ หากเป็นเช่นนั้น ผลลัพธ์จะสอดคล้องกับค่าที่เป็นไปได้นี้ ถ้าไม่เช่นนั้น ก็ไม่น่าเป็นไปได้ (สำหรับช่วงความเชื่อมั่น 95% โอกาสเกือบ 5%) ที่พารามิเตอร์จะมีค่านั้น -

วิธีหนึ่งในการแก้ปัญหาทางสถิติคือการคำนวณช่วงความเชื่อมั่น ซึ่งใช้เป็นทางเลือกที่ดีกว่าในการประมาณค่าแบบจุดเมื่อขนาดตัวอย่างมีขนาดเล็ก ควรสังเกตว่ากระบวนการคำนวณช่วงความเชื่อมั่นนั้นค่อนข้างซับซ้อน แต่เครื่องมือโปรแกรม Excel ช่วยให้คุณลดความซับซ้อนลงได้บ้าง เรามาดูวิธีการปฏิบัตินี้กัน

วิธีนี้ใช้สำหรับการประมาณช่วงของปริมาณทางสถิติต่างๆ ภารกิจหลักของการคำนวณนี้คือการกำจัดความไม่แน่นอนของการประมาณค่าแบบจุด

ใน Excel มีสองตัวเลือกหลักสำหรับการคำนวณโดยใช้วิธีนี้: เมื่อทราบความแปรปรวนและเมื่อไม่ทราบ ในกรณีแรก ฟังก์ชันนี้ใช้สำหรับการคำนวณ ความไว้วางใจ.NORMและในวินาที- ผู้ดูแลผลประโยชน์.นักศึกษา.

วิธีที่ 1: ฟังก์ชัน CONFIDENCE NORM

ผู้ดำเนินการ ความไว้วางใจ.NORMซึ่งเป็นของกลุ่มฟังก์ชันทางสถิติปรากฏตัวครั้งแรกใน Excel 2010 เวอร์ชันก่อนหน้าของโปรแกรมนี้ใช้อะนาล็อก เชื่อมั่น- จุดประสงค์ของตัวดำเนินการนี้คือเพื่อคำนวณช่วงความเชื่อมั่นแบบกระจายแบบปกติสำหรับค่าเฉลี่ยประชากร

ไวยากรณ์ของมันมีดังนี้:

CONFIDENCE.NORM(อัลฟ่า;มาตรฐาน_ปิด;ขนาด)

"อัลฟ่า"— อาร์กิวเมนต์ที่ระบุระดับนัยสำคัญที่ใช้ในการคำนวณระดับความเชื่อมั่น ระดับความเชื่อมั่นเท่ากับนิพจน์ต่อไปนี้:

(1- "อัลฟ่า")*100

"ส่วนเบี่ยงเบนมาตรฐาน"- นี่คือข้อโต้แย้งซึ่งมีสาระสำคัญที่ชัดเจนจากชื่อ นี่คือค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่เสนอ

"ขนาด"— อาร์กิวเมนต์ที่กำหนดขนาดตัวอย่าง

จำเป็นต้องมีอาร์กิวเมนต์ทั้งหมดให้กับโอเปอเรเตอร์นี้

การทำงาน เชื่อมั่นมีข้อโต้แย้งและความเป็นไปได้เหมือนกับข้อโต้แย้งก่อนหน้านี้ทุกประการ ไวยากรณ์ของมันคือ:

ความไว้วางใจ(อัลฟ่า, มาตรฐาน_ปิด, ขนาด)

อย่างที่คุณเห็นความแตกต่างนั้นอยู่ในชื่อของโอเปอเรเตอร์เท่านั้น เพื่อเหตุผลด้านความเข้ากันได้ ฟังก์ชันนี้จึงเหลืออยู่ใน Excel 2010 และเวอร์ชันที่ใหม่กว่าในหมวดหมู่พิเศษ "ความเข้ากันได้"- ใน Excel เวอร์ชัน 2007 และเวอร์ชันก่อนหน้า จะมีอยู่ในกลุ่มหลักของตัวดำเนินการทางสถิติ

ขีดจำกัดช่วงความเชื่อมั่นถูกกำหนดโดยใช้สูตรต่อไปนี้:

X+(-)บรรทัดฐานความมั่นใจ

ที่ไหน เอ็กซ์คือค่าตัวอย่างเฉลี่ยซึ่งอยู่ตรงกลางของช่วงที่เลือก

ตอนนี้เรามาดูวิธีคำนวณช่วงความเชื่อมั่นโดยใช้ตัวอย่างที่เฉพาะเจาะจงกัน ทำการทดสอบ 12 ครั้ง ส่งผลให้ได้ผลลัพธ์ที่แตกต่างกันตามที่แสดงไว้ในตาราง นี่คือทั้งหมดของเรา ค่าเบี่ยงเบนมาตรฐานคือ 8 เราจำเป็นต้องคำนวณช่วงความเชื่อมั่นที่ระดับความเชื่อมั่น 97%

  1. เลือกเซลล์ที่จะแสดงผลการประมวลผลข้อมูล คลิกที่ปุ่ม "แทรกฟังก์ชัน".
  2. ปรากฏขึ้น ตัวช่วยสร้างฟังก์ชัน- ไปที่หมวดหมู่ "สถิติ"และไฮไลท์ชื่อ "ความไว้วางใจ.NORM"- หลังจากนั้นคลิกที่ปุ่ม "ตกลง".
  3. หน้าต่างข้อโต้แย้งจะเปิดขึ้น ฟิลด์ของมันสอดคล้องกับชื่อของข้อโต้แย้งโดยธรรมชาติ
    วางเคอร์เซอร์ในช่องแรก - "อัลฟ่า"- ในที่นี้เราควรระบุระดับความสำคัญ อย่างที่เราจำได้ ระดับความไว้วางใจของเราคือ 97% ในเวลาเดียวกันเราบอกว่ามันคำนวณได้ดังนี้:

    (1-ระดับความน่าเชื่อถือ)/100

    นั่นคือเมื่อแทนค่าเราจะได้:

    โดยการคำนวณอย่างง่าย ๆ เราจะพบว่าอาร์กิวเมนต์ "อัลฟ่า"เท่ากับ 0,03 - ป้อนค่านี้ในฟิลด์

    ดังที่ทราบกันดีว่าตามเงื่อนไขแล้วค่าเบี่ยงเบนมาตรฐานจะเท่ากับ 8 - ดังนั้นในสนาม "ส่วนเบี่ยงเบนมาตรฐาน"เพียงเขียนหมายเลขนี้ลงไป

    ในสนาม "ขนาด"คุณต้องป้อนจำนวนองค์ประกอบการทดสอบที่ดำเนินการ อย่างที่เราจำได้พวกเขา 12 - แต่เพื่อให้สูตรเป็นแบบอัตโนมัติและไม่แก้ไขทุกครั้งที่เราทำการทดสอบใหม่ เรามาตั้งค่านี้ไม่ใช่ตัวเลขธรรมดา แต่ใช้โอเปอเรเตอร์ ตรวจสอบ- ดังนั้นให้วางเคอร์เซอร์ลงในช่อง "ขนาด"แล้วคลิกสามเหลี่ยมซึ่งอยู่ทางด้านซ้ายของแถบสูตร

    รายการฟังก์ชันที่ใช้ล่าสุดจะปรากฏขึ้น หากผู้ปฏิบัติงาน ตรวจสอบถูกใช้โดยคุณเมื่อเร็วๆ นี้ ซึ่งควรจะอยู่ในรายการนี้ ในกรณีนี้ คุณเพียงแค่ต้องคลิกที่ชื่อของมัน ไม่เช่นนั้นหากไม่พบก็ให้ไปที่จุดนั้น "ฟังก์ชั่นอื่นๆ...".

  4. สิ่งที่คุ้นเคยอยู่แล้วก็ปรากฏขึ้น ตัวช่วยสร้างฟังก์ชัน- ให้ย้ายกลับเข้ากลุ่มอีกครั้ง "สถิติ"- เราเน้นชื่อที่นั่น "ตรวจสอบ"- คลิกที่ปุ่ม "ตกลง".
  5. หน้าต่างข้อโต้แย้งสำหรับคำสั่งข้างต้นจะปรากฏขึ้น ฟังก์ชันนี้ออกแบบมาเพื่อคำนวณจำนวนเซลล์ในช่วงที่ระบุซึ่งมีค่าตัวเลข ไวยากรณ์ของมันมีดังนี้:

    นับ(value1,value2,...)

    กลุ่มข้อโต้แย้ง “คุณค่า”เป็นการอ้างอิงถึงช่วงที่คุณต้องการคำนวณจำนวนเซลล์ที่เต็มไปด้วยข้อมูลตัวเลข มีอาร์กิวเมนต์ดังกล่าวทั้งหมดได้สูงสุด 255 อาร์กิวเมนต์ แต่ในกรณีของเราเราต้องการเพียงอาร์กิวเมนต์เดียวเท่านั้น

    วางเคอร์เซอร์ในช่อง "ค่า 1"และกดปุ่มซ้ายของเมาส์ค้างไว้ เลือกช่วงที่มีคอลเลกชันของเราบนแผ่นงาน จากนั้นที่อยู่ของเขาจะปรากฏอยู่ในสนาม คลิกที่ปุ่ม "ตกลง".

  6. หลังจากนี้แอปพลิเคชันจะทำการคำนวณและแสดงผลลัพธ์ในเซลล์ที่มันอยู่ ในกรณีเฉพาะของเรา สูตรมีลักษณะดังนี้:

    มาตรฐานความมั่นใจ(0.03,8,COUNT(B2:B13))

    ผลการคำนวณโดยรวมก็คือ 5,011609 .

  7. แต่นั่นไม่ใช่ทั้งหมด ดังที่เราจำได้ ขีดจำกัดช่วงความเชื่อมั่นจะคำนวณโดยการบวกและลบผลการคำนวณออกจากค่าเฉลี่ยตัวอย่าง ความไว้วางใจ.NORM- ด้วยวิธีนี้ ขอบเขตด้านขวาและด้านซ้ายของช่วงความเชื่อมั่นจะถูกคำนวณตามลำดับ ค่าเฉลี่ยตัวอย่างสามารถคำนวณได้โดยใช้ตัวดำเนินการ เฉลี่ย.

    ตัวดำเนินการนี้ออกแบบมาเพื่อคำนวณค่าเฉลี่ยเลขคณิตของช่วงตัวเลขที่เลือก มีไวยากรณ์ที่ค่อนข้างง่ายดังต่อไปนี้:

    ค่าเฉลี่ย(หมายเลข 1, หมายเลข 2,...)

    การโต้แย้ง "ตัวเลข"อาจเป็นได้ทั้งค่าตัวเลขเดียวหรือการอ้างอิงไปยังเซลล์ หรือแม้แต่ช่วงทั้งหมดที่มีค่าเหล่านั้น

    ดังนั้นเลือกเซลล์ที่จะแสดงการคำนวณค่าเฉลี่ยแล้วคลิกที่ปุ่ม "แทรกฟังก์ชัน".

  8. เปิด ตัวช่วยสร้างฟังก์ชัน- จะกลับเข้าหมวด. "สถิติ"และเลือกชื่อจากรายการ "เฉลี่ย"- และเช่นเคยให้คลิกที่ปุ่ม "ตกลง".
  9. หน้าต่างข้อโต้แย้งจะเปิดขึ้น วางเคอร์เซอร์ในช่อง "หมายเลข 1"และกดปุ่มซ้ายของเมาส์ค้างไว้ เลือกช่วงของค่าทั้งหมด หลังจากแสดงพิกัดในช่องแล้วให้คลิกที่ปุ่ม "ตกลง".
  10. หลังจากนั้น เฉลี่ยแสดงผลการคำนวณในองค์ประกอบแผ่นงาน
  11. เราคำนวณขอบเขตด้านขวาของช่วงความเชื่อมั่น เมื่อต้องการทำเช่นนี้ ให้เลือกเซลล์แยกต่างหากแล้วใส่เครื่องหมาย «=» และเพิ่มเนื้อหาขององค์ประกอบแผ่นงานซึ่งมีผลลัพธ์ของการคำนวณฟังก์ชันอยู่ เฉลี่ยและ ความไว้วางใจ.NORM- หากต้องการคำนวณ ให้กดปุ่ม เข้า- ในกรณีของเรา เราได้สูตรดังนี้:

    ผลการคำนวณ: 6,953276

  12. ในทำนองเดียวกัน เราคำนวณขีดจำกัดด้านซ้ายของช่วงความเชื่อมั่น เฉพาะครั้งนี้จากผลลัพธ์ของการคำนวณ เฉลี่ยลบผลลัพธ์ของการคำนวณตัวดำเนินการ ความไว้วางใจ.NORM- สูตรผลลัพธ์สำหรับตัวอย่างของเราเป็นประเภทต่อไปนี้:

    ผลการคำนวณ: -3,06994

  13. เราพยายามอธิบายรายละเอียดขั้นตอนทั้งหมดในการคำนวณช่วงความเชื่อมั่น ดังนั้นเราจึงอธิบายแต่ละสูตรโดยละเอียด แต่คุณสามารถรวมการกระทำทั้งหมดไว้ในสูตรเดียวได้ การคำนวณขอบเขตด้านขวาของช่วงความเชื่อมั่นสามารถเขียนได้ดังนี้:

    ค่าเฉลี่ย(B2:B13)+ความมั่นใจ.NORM(0.03,8,COUNT(B2:B13))

  14. การคำนวณที่คล้ายกันสำหรับเส้นขอบด้านซ้ายจะมีลักษณะดังนี้:

    ค่าเฉลี่ย(B2:B13)-ความเชื่อมั่น.NORM(0.03,8,COUNT(B2:B13))

วิธีที่ 2: ฟังก์ชัน TRUST.STUDENT

นอกจากนี้ Excel ยังมีฟังก์ชันอื่นที่เกี่ยวข้องกับการคำนวณช่วงความเชื่อมั่น - ผู้ดูแลผลประโยชน์.นักศึกษา- ปรากฏใน Excel 2010 เท่านั้น ตัวดำเนินการนี้จะคำนวณช่วงความเชื่อมั่นของประชากรโดยใช้การแจกแจงของนักเรียน สะดวกมากที่จะใช้เมื่อไม่ทราบความแปรปรวนและดังนั้นจึงไม่ทราบค่าเบี่ยงเบนมาตรฐาน ไวยากรณ์ของตัวดำเนินการคือ:

ความมั่นใจนักเรียน(อัลฟ่า,มาตรฐาน_ปิด,ขนาด)

อย่างที่คุณเห็น ชื่อของตัวดำเนินการยังคงไม่เปลี่ยนแปลงในกรณีนี้

เรามาดูวิธีคำนวณขอบเขตของช่วงความเชื่อมั่นโดยมีค่าเบี่ยงเบนมาตรฐานที่ไม่ทราบโดยใช้ตัวอย่างประชากรเดียวกันกับที่เราพิจารณาในวิธีก่อนหน้านี้ เอาระดับความน่าเชื่อถือเหมือนครั้งที่แล้วที่ 97% เลย

  1. เลือกเซลล์ที่จะทำการคำนวณ คลิกที่ปุ่ม "แทรกฟังก์ชัน".
  2. ในที่เปิด ตัวช่วยสร้างฟังก์ชันไปที่หมวดหมู่ "สถิติ"- เลือกชื่อ "นักเรียนที่เชื่อถือได้"- คลิกที่ปุ่ม "ตกลง".
  3. หน้าต่างอาร์กิวเมนต์สำหรับตัวดำเนินการที่ระบุจะถูกเปิดใช้งาน

    ในสนาม "อัลฟ่า"โดยพิจารณาว่าระดับความเชื่อมั่นคือ 97% เราจึงเขียนตัวเลขลงไป 0,03 - เราจะไม่อาศัยหลักการคำนวณพารามิเตอร์นี้เป็นครั้งที่สอง

    หลังจากนั้นให้วางเคอร์เซอร์ลงในช่อง "ส่วนเบี่ยงเบนมาตรฐาน"- คราวนี้เราไม่รู้จักตัวบ่งชี้นี้และจำเป็นต้องคำนวณ ทำได้โดยใช้ฟังก์ชันพิเศษ - STDEV.V- หากต้องการเปิดหน้าต่างของโอเปอเรเตอร์นี้ ให้คลิกที่สามเหลี่ยมทางด้านซ้ายของแถบสูตร หากเราไม่พบชื่อที่ต้องการในรายการที่เปิดขึ้นให้ไปที่รายการนั้น "ฟังก์ชั่นอื่นๆ...".

  4. เริ่มต้น ตัวช่วยสร้างฟังก์ชัน- ย้ายไปหมวด "สถิติ"และทำเครื่องหมายชื่อไว้ในนั้น "STDEV.B"- จากนั้นคลิกที่ปุ่ม "ตกลง".
  5. หน้าต่างข้อโต้แย้งจะเปิดขึ้น หน้าที่ของผู้ปฏิบัติงาน STDEV.Vคือการหาค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง ไวยากรณ์ของมันมีลักษณะดังนี้:

    ส่วนเบี่ยงเบนมาตรฐาน B(หมายเลข 1; หมายเลข 2;...)

    ก็ไม่ยากที่จะคาดเดาว่าข้อโต้แย้งนั้น "ตัวเลข"คือที่อยู่ขององค์ประกอบการเลือก หากการเลือกถูกวางไว้ในอาร์เรย์เดียว คุณสามารถใช้อาร์กิวเมนต์เดียวเท่านั้นเพื่อจัดเตรียมลิงก์ไปยังช่วงนี้

    วางเคอร์เซอร์ในช่อง "หมายเลข 1"และเช่นเคย กดปุ่มซ้ายของเมาส์ค้างไว้เพื่อเลือกคอลเลกชัน หลังจากพิกัดอยู่ในสนามแล้วอย่ารีบกดปุ่ม "ตกลง"เนื่องจากผลลัพธ์จะไม่ถูกต้อง ก่อนอื่นเราต้องกลับไปที่หน้าต่างอาร์กิวเมนต์ของตัวดำเนินการ ผู้ดูแลผลประโยชน์.นักศึกษาเพื่อเพิ่มอาร์กิวเมนต์สุดท้าย โดยคลิกที่ชื่อที่เกี่ยวข้องในแถบสูตร

  6. หน้าต่างอาร์กิวเมนต์สำหรับฟังก์ชันที่คุ้นเคยอยู่แล้วจะเปิดขึ้นอีกครั้ง วางเคอร์เซอร์ในช่อง "ขนาด"- อีกครั้ง ให้คลิกที่สามเหลี่ยมที่เราคุ้นเคยอยู่แล้วเพื่อไปยังตัวเลือกโอเปอเรเตอร์ ดังที่คุณเข้าใจเราจำเป็นต้องมีชื่อ "ตรวจสอบ"- เนื่องจากเราใช้ฟังก์ชันนี้ในการคำนวณในวิธีก่อนหน้า จึงปรากฏอยู่ในรายการนี้ ดังนั้นเพียงคลิกที่ฟังก์ชันนี้ หากคุณไม่พบให้ปฏิบัติตามอัลกอริทึมที่อธิบายไว้ในวิธีแรก
  7. เมื่ออยู่ในหน้าต่างข้อโต้แย้ง ตรวจสอบให้วางเคอร์เซอร์ในช่อง "หมายเลข 1"และเมื่อกดปุ่มเมาส์ค้างไว้ ให้เลือกคอลเลกชัน จากนั้นคลิกที่ปุ่ม "ตกลง".
  8. หลังจากนั้น โปรแกรมจะทำการคำนวณและแสดงค่าช่วงความเชื่อมั่น
  9. เพื่อกำหนดขอบเขต เราจะต้องคำนวณค่าเฉลี่ยตัวอย่างอีกครั้ง แต่เนื่องจากอัลกอริทึมการคำนวณโดยใช้สูตร เฉลี่ยเช่นเดียวกับวิธีก่อนหน้าและแม้ผลลัพธ์จะไม่เปลี่ยนแปลง เราจะไม่พูดถึงรายละเอียดนี้อีกเป็นครั้งที่สอง
  10. บวกผลการคำนวณ เฉลี่ยและ ผู้ดูแลผลประโยชน์.นักศึกษาเราได้ขอบเขตที่ถูกต้องของช่วงความเชื่อมั่น
  11. หักออกจากผลการคำนวณของผู้ปฏิบัติงาน เฉลี่ยผลการคำนวณ ผู้ดูแลผลประโยชน์.นักศึกษาเรามีขีดจำกัดด้านซ้ายของช่วงความมั่นใจ
  12. หากเขียนการคำนวณในสูตรเดียว การคำนวณขอบเขตด้านขวาในกรณีของเราจะมีลักษณะดังนี้:

    ค่าเฉลี่ย(B2:B13)+ความมั่นใจ.นักเรียน(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

  13. ดังนั้นสูตรการคำนวณเส้นขอบด้านซ้ายจะมีลักษณะดังนี้:

    ค่าเฉลี่ย(B2:B13)-ความมั่นใจ.นักเรียน(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

อย่างที่คุณเห็น เครื่องมือ Excel ช่วยให้การคำนวณช่วงความเชื่อมั่นและขอบเขตของมันง่ายขึ้นมาก เพื่อวัตถุประสงค์เหล่านี้ จะใช้ตัวดำเนินการแยกกันสำหรับตัวอย่างที่ทราบและไม่ทราบความแปรปรวน

บอกเพื่อน