วิธีทดสอบ T ใน Excel

สารบัญ:

วิธีทดสอบ T ใน Excel
วิธีทดสอบ T ใน Excel
Anonim

การทดสอบ T เป็นวิธีตัดสินว่าชุดข้อมูลมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ โดยใช้การแจกแจงแบบ t ของนักเรียน T-Test ใน Excel เป็นการทดสอบ T สองตัวอย่างเปรียบเทียบค่าเฉลี่ยของสองตัวอย่าง บทความนี้จะอธิบายความหมายของนัยสำคัญทางสถิติและแสดงวิธีทำ T-Test ใน Excel

คำแนะนำในบทความนี้ใช้กับ Excel 2019, 2016, 2013, 2010, 2007; Excel สำหรับ Microsoft 365 และ Excel Online

Image
Image

นัยสำคัญทางสถิติคืออะไร

ลองนึกภาพคุณอยากรู้ว่าลูกเต๋าสองลูกตัวไหนให้คะแนนดีกว่ากัน คุณทอยลูกเต๋าแรกและรับ 2; คุณทอยลูกเต๋าที่สองและรับ 6สิ่งนี้บอกคุณหรือไม่ว่าการตายครั้งที่สองมักจะให้คะแนนสูงกว่า? หากคุณตอบว่า “ไม่แน่นอน” แสดงว่าคุณมีความเข้าใจในนัยสำคัญทางสถิติอยู่แล้ว คุณเข้าใจดีว่าความแตกต่างนั้นเกิดจากการสุ่มเปลี่ยนคะแนน ทุกครั้งที่มีการทอยลูกเต๋า เนื่องจากตัวอย่างมีขนาดเล็กมาก (ม้วนเดียวเท่านั้น) จึงไม่แสดงนัยสำคัญ

ลองนึกภาพคุณหมุนแต่ละลูกเต๋า 6 ครั้ง:

  • ลูกแรก 3, 6, 6, 4, 3, 3; ค่าเฉลี่ย=4.17
  • ลูกเต๋าที่สอง 5, 6, 2, 5, 2, 4; ค่าเฉลี่ย=4.00

ตอนนี้พิสูจน์ให้เห็นว่าลูกแรกทำคะแนนได้มากกว่าลูกที่สองหรือไม่? อาจจะไม่. ตัวอย่างเล็กๆ ที่มีค่าความแตกต่างค่อนข้างน้อยระหว่างวิธีการทำให้มีแนวโน้มว่าความแตกต่างจะยังคงเกิดจากการแปรผันแบบสุ่ม เมื่อเราเพิ่มจำนวนการทอยลูกเต๋า มันกลายเป็นเรื่องยากที่จะให้คำตอบตามสามัญสำนึกสำหรับคำถาม - ความแตกต่างระหว่างคะแนนเป็นผลมาจากการเปลี่ยนแปลงแบบสุ่มหรืออันที่จริงแล้วคะแนนหนึ่งมีแนวโน้มที่จะให้คะแนนสูงกว่าอีกหรือไม่

ความสำคัญคือความน่าจะเป็นที่ความแตกต่างที่สังเกตได้ระหว่างกลุ่มตัวอย่างเกิดจากการแปรผันแบบสุ่ม ความสำคัญมักเรียกว่าระดับอัลฟาหรือเพียงแค่ 'α' ระดับความเชื่อมั่น หรือเพียงแค่ 'c' คือความน่าจะเป็นที่ความแตกต่างระหว่างกลุ่มตัวอย่างไม่ได้เกิดจากการแปรผันแบบสุ่ม กล่าวอีกนัยหนึ่งว่ามีความแตกต่างระหว่างประชากรต้นแบบ ดังนั้น: c=1 – α

เราสามารถตั้งค่า 'α' ในระดับใดก็ได้ที่เราต้องการ เพื่อให้มั่นใจว่าเราได้พิสูจน์ความสำคัญแล้ว มักใช้ α=5% (ความมั่นใจ 95%) แต่ถ้าเราต้องการให้แน่ใจจริงๆ ว่าความแตกต่างใดๆ ไม่ได้เกิดจากการแปรผันแบบสุ่ม เราอาจใช้ระดับความมั่นใจที่สูงขึ้นโดยใช้ α=1% หรือแม้แต่ α=0.1 %.

การทดสอบทางสถิติต่างๆ ใช้ในการคำนวณนัยสำคัญในสถานการณ์ต่างๆ การทดสอบ T ใช้เพื่อพิจารณาว่าค่าเฉลี่ยของประชากรทั้งสองแตกต่างกันหรือไม่ และการทดสอบ F ใช้เพื่อพิจารณาว่าความแปรปรวนต่างกันหรือไม่

ทำไมต้องทดสอบความสำคัญทางสถิติ

เมื่อเปรียบเทียบของต่างๆ เราจำเป็นต้องใช้การทดสอบนัยสำคัญเพื่อตัดสินว่าอันใดดีกว่าอันอื่น สิ่งนี้ใช้ได้กับหลายฟิลด์ เช่น:

  • ในธุรกิจ ผู้คนจำเป็นต้องเปรียบเทียบผลิตภัณฑ์และวิธีการทางการตลาดที่แตกต่างกัน
  • ในกีฬา คนต้องเปรียบเทียบอุปกรณ์ เทคนิค และคู่แข่งที่แตกต่างกัน
  • ในทางวิศวกรรม ผู้คนจำเป็นต้องเปรียบเทียบการออกแบบและการตั้งค่าพารามิเตอร์ต่างๆ

หากคุณต้องการทดสอบว่าบางสิ่งทำงานได้ดีกว่าอย่างอื่น ในด้านใด ๆ คุณต้องทดสอบนัยสำคัญทางสถิติ

การแจก T-Distribution ของนักเรียนคืออะไร

A การแจกแจงแบบ t ของนักเรียนคล้ายกับการแจกแจงแบบปกติ (หรือแบบเกาส์เซียน) สิ่งเหล่านี้เป็นการแจกแจงรูประฆังที่มีผลลัพธ์ส่วนใหญ่ใกล้กับค่าเฉลี่ย แต่เหตุการณ์หายากบางอย่างอยู่ค่อนข้างไกลจากค่าเฉลี่ยในทั้งสองทิศทาง เรียกว่าส่วนท้ายของการกระจาย

รูปร่างที่แน่นอนของการแจกแจง t ของนักเรียนขึ้นอยู่กับขนาดกลุ่มตัวอย่าง สำหรับตัวอย่างมากกว่า 30 ตัวอย่าง จะคล้ายกับการกระจายตัวแบบปกติมาก เมื่อขนาดกลุ่มตัวอย่างลดลง หางก็จะใหญ่ขึ้น แสดงถึงความไม่แน่นอนที่เพิ่มขึ้นซึ่งมาจากการอนุมานจากกลุ่มตัวอย่างเล็กๆ

วิธีทดสอบ T-Test ใน Excel

ก่อนที่คุณจะใช้ T-Test เพื่อดูว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของตัวอย่างสองตัวอย่างหรือไม่ คุณต้องทำ F-Test ก่อน เนื่องจากการทดสอบ T-Test จะทำการคำนวณที่แตกต่างกัน ขึ้นอยู่กับว่ามีความแตกต่างกันอย่างมีนัยสำคัญระหว่างความแปรปรวนหรือไม่

คุณจะต้องใช้ ส่วนเสริมสำหรับการวิเคราะห์ Toolpak เพื่อทำการวิเคราะห์นี้

กำลังตรวจสอบและโหลด Add-In ของ Analysis Toolpak

ในการตรวจสอบและเปิดใช้งาน Analysis Toolpak ให้ทำตามขั้นตอนเหล่านี้:

  1. เลือกแท็บ FILE >select Options.
  2. ในกล่องโต้ตอบตัวเลือก เลือก เพิ่มเติม จากแท็บทางด้านซ้ายมือ
  3. ที่ด้านล่างของหน้าต่าง เลือกเมนูจัดการแบบเลื่อนลง จากนั้นเลือก โปรแกรมเสริมของ Excel เลือก ไป.

    Image
    Image
  4. ตรวจสอบให้แน่ใจว่าช่องทำเครื่องหมายถัดจาก Analysis Toolpak ถูกเลือกแล้วเลือก OK
  5. Analysis Toolpak เปิดใช้งานแล้ว และคุณพร้อมที่จะใช้ F-Tests และ T-Tests

ทำ F-Test และ T-Test ใน Excel

  1. ใส่ชุดข้อมูลสองชุดลงในสเปรดชีต ในกรณีนี้ เรากำลังพิจารณาการขายผลิตภัณฑ์สองรายการในหนึ่งสัปดาห์ นอกจากนี้ยังคำนวณมูลค่าการขายเฉลี่ยต่อวันสำหรับแต่ละผลิตภัณฑ์พร้อมกับค่าเบี่ยงเบนมาตรฐาน

    Image
    Image
  2. เลือกแท็บ Data > การวิเคราะห์ข้อมูล

    Image
    Image
  3. Select F-Test Two-Sample for Variances จากรายการ จากนั้นเลือก OK.

    Image
    Image

    F-Test มีความไวต่อสิ่งไม่ปกติมาก ดังนั้นจึงอาจปลอดภัยกว่าที่จะใช้การทดสอบ Welch แต่ใน Excel จะยากกว่า

  4. เลือกช่วงตัวแปร 1 และช่วงตัวแปร 2 ตั้งค่าอัลฟ่า (0.05 ให้ความมั่นใจ 95%); เลือกเซลล์สำหรับมุมบนซ้ายของผลลัพธ์ โดยพิจารณาว่าจะเติม 3 คอลัมน์และ 10 แถว เลือก ตกลง.

    Image
    Image

    สำหรับช่วงตัวแปร 1 ต้องเลือกตัวอย่างที่มีค่าเบี่ยงเบนมาตรฐานมากที่สุด (หรือความแปรปรวน)

  5. ดูผลการทดสอบ F เพื่อพิจารณาว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างความแปรปรวนหรือไม่ ผลลัพธ์ให้ค่าที่สำคัญสามประการ:

    • F: อัตราส่วนระหว่างความแปรปรวน
    • P(F<=f) one-tail: ความน่าจะเป็นที่ตัวแปร 1 ไม่มีค่าความแปรปรวนมากกว่าตัวแปร 2 จริง ๆ แล้ว ถ้านี่มากกว่า alpha ซึ่ง โดยทั่วไปคือ 0.05 ดังนั้นจึงไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างความแปรปรวน
    • F Critical one-tail: ค่าของ F ที่จะต้องให้ P(F<=f)=α หากค่านี้มากกว่า F แสดงว่าไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างความแปรปรวน

    P(F<=f) สามารถคำนวณได้โดยใช้ฟังก์ชัน FDIST โดย F และองศาอิสระสำหรับแต่ละตัวอย่างเป็นอินพุต ระดับความเป็นอิสระเป็นเพียงจำนวนการสังเกตในตัวอย่างลบหนึ่ง

  6. ตอนนี้คุณรู้แล้วว่ามีความแตกต่างระหว่างความแปรปรวนหรือไม่ คุณสามารถเลือก T-Test ที่เหมาะสมได้ เลือกแท็บ Data > Data Analysis จากนั้นเลือกอย่างใดอย่างหนึ่ง t-Test: Two-Sample Asuming Equal Variances หรือ t-Test: สองตัวอย่าง สมมติว่าความแปรปรวนไม่เท่ากัน

    Image
    Image
  7. ไม่ว่าคุณจะเลือกตัวเลือกใดในขั้นตอนก่อนหน้า คุณจะเห็นกล่องโต้ตอบเดียวกันเพื่อป้อนรายละเอียดของการวิเคราะห์ ในการเริ่มต้น เลือกช่วงที่มีตัวอย่างสำหรับ ตัวแปร 1 ช่วง และ ตัวแปร 2 ช่วง

    Image
    Image
  8. สมมติว่าคุณไม่ต้องการทดสอบความแตกต่างระหว่างค่าเฉลี่ย ให้ตั้งค่า ส่วนต่างของค่าเฉลี่ยที่ตั้งสมมติฐานไว้ เป็นศูนย์
  9. กำหนดระดับความสำคัญ Alpha (0.05 ให้ความมั่นใจ 95%) และเลือกเซลล์สำหรับมุมบนซ้ายของผลลัพธ์ โดยพิจารณาว่าการดำเนินการนี้จะเติม 3 คอลัมน์และ 14 แถว เลือก ตกลง.
  10. ตรวจทานผลลัพธ์เพื่อตัดสินใจว่ามีความแตกต่างที่สำคัญระหว่างวิธีการหรือไม่

    เช่นเดียวกับ F-Test หากค่า p ในกรณีนี้ P(T<=t) มากกว่า alpha ก็ไม่มีความแตกต่างที่มีนัยสำคัญ อย่างไรก็ตาม ในกรณีนี้ มีค่า p สองค่า ค่าหนึ่งสำหรับการทดสอบแบบด้านเดียว และอีกค่าหนึ่งสำหรับการทดสอบแบบสองส่วน ในกรณีนี้ ให้ใช้ค่า two-tail เนื่องจากตัวแปรใดค่าหนึ่งที่มีค่าเฉลี่ยมากกว่าจะมีความแตกต่างกันอย่างมีนัยสำคัญ

แนะนำ: