การถดถอยใน Excel เป็นวิธีการอัตโนมัติในกระบวนการทางสถิติของการเปรียบเทียบข้อมูลหลายชุดเพื่อดูว่าการเปลี่ยนแปลงในตัวแปรอิสระส่งผลต่อการเปลี่ยนแปลงในตัวแปรตามอย่างไร หากคุณเคยต้องการค้นหาความสัมพันธ์ระหว่างสองสิ่ง การใช้การวิเคราะห์การถดถอยใน Excel คือหนึ่งในวิธีที่ดีที่สุดในการทำเช่นนั้น
คำแนะนำในบทความนี้ใช้กับ Excel 2019, Excel 2016, Excel 2013, Excel 2010
ความหมายของการถดถอยคืออะไร
การถดถอยเป็นวิธีการสร้างแบบจำลองทางสถิติที่นักวิเคราะห์ใช้ในการกำหนดความสัมพันธ์ระหว่างตัวแปรหลายตัว
การวิเคราะห์การถดถอยเริ่มต้นด้วยตัวแปรเดียวที่คุณกำลังพยายามวิเคราะห์ และตัวแปรอิสระที่คุณกำลังทดสอบเพื่อดูว่าตัวแปรเหล่านั้นส่งผลต่อตัวแปรตัวเดียวหรือไม่การวิเคราะห์จะพิจารณาการเปลี่ยนแปลงในตัวแปรอิสระและพยายามเชื่อมโยงการเปลี่ยนแปลงเหล่านั้นกับการเปลี่ยนแปลงผลลัพธ์ในตัวแปรเดี่ยว (ขึ้นอยู่กับ)
อาจฟังดูเหมือนสถิติขั้นสูง แต่ Excel ทำให้การวิเคราะห์ที่ซับซ้อนนี้พร้อมใช้งานสำหรับทุกคน
การแสดงการถดถอยเชิงเส้นใน Excel
รูปแบบการวิเคราะห์การถดถอยที่ง่ายที่สุดคือการถดถอยเชิงเส้น การถดถอยเชิงเส้นอย่างง่ายจะพิจารณาความสัมพันธ์ระหว่างสองตัวแปรเท่านั้น
ตัวอย่างเช่น สเปรดชีตต่อไปนี้แสดงข้อมูลที่มีจำนวนแคลอรี่ที่แต่ละคนกินในแต่ละวันและน้ำหนักของพวกเขาในวันนั้น
เนื่องจากสเปรดชีตนี้มีข้อมูลสองคอลัมน์ และตัวแปรหนึ่งอาจมีผลกระทบต่ออีกตัวแปรหนึ่ง คุณจึงสามารถเรียกใช้การวิเคราะห์การถดถอยของข้อมูลนี้โดยใช้ Excel
การเปิดใช้งานส่วนเสริม Analysis ToolPak
ก่อนที่คุณจะใช้คุณลักษณะการวิเคราะห์การถดถอยของ Excel คุณต้องเปิดใช้งานส่วนเสริม Analysis ToolPak ในหน้าจอตัวเลือกของ Excel
-
ใน Excel เลือกเมนู ไฟล์ และเลือก ตัวเลือก.
-
เลือก ส่วนเสริม ในเมนูการนำทางด้านซ้ายมือ จากนั้น ตรวจสอบให้แน่ใจว่าได้เลือก Excel Add-ins ในฟิลด์ Manage
-
สุดท้าย เลือกปุ่ม Go
-
ในหน้าต่างป๊อปอัปของ Add-in เปิดใช้งาน Analysis ToolPack โดยคลิกที่ช่องด้านหน้าเพื่อเพิ่มเครื่องหมายและเลือก OK.
เมื่อเปิดใช้งาน Analysis ToolPak คุณก็พร้อมที่จะเริ่มทำการวิเคราะห์การถดถอยใน Excel แล้ว
วิธีการถดถอยเชิงเส้นอย่างง่ายใน Excel
ตัวอย่างการใช้สเปรดชีตน้ำหนักและแคลอรี คุณสามารถทำการวิเคราะห์การถดถอยเชิงเส้นใน Excel ได้ดังนี้
-
เลือกเมนู Data จากนั้น ในกลุ่ม Analysis เลือก Data Analysis.
-
ในหน้าต่าง Data Analysis เลือก Regression จากรายการ และคลิก ตกลง
-
The Input Y Range คือช่วงของเซลล์ที่มีตัวแปรตาม ในตัวอย่างนี้ นั่นคือน้ำหนัก Input X Range คือช่วงของเซลล์ที่มีตัวแปรอิสระ ในตัวอย่างนี้ นั่นคือคอลัมน์แคลอรี่
-
เลือก Labels สำหรับเซลล์ส่วนหัว แล้วเลือก แผ่นงานใหม่ เพื่อส่งผลลัพธ์ไปยังแผ่นงานใหม่ เลือก OK เพื่อให้ Excel เรียกใช้การวิเคราะห์และส่งผลไปยังชีตใหม่
-
ตรวจสอบใบงานใหม่ ผลการวิเคราะห์มีค่าจำนวนหนึ่งที่คุณต้องเข้าใจเพื่อตีความผลลัพธ์
แต่ละตัวเลขมีความหมายดังต่อไปนี้:
- หลาย R: สัมประสิทธิ์สหสัมพันธ์ 1 บ่งชี้ถึงความสัมพันธ์ที่แน่นแฟ้นระหว่างตัวแปรทั้งสอง ในขณะที่ -1 หมายถึงมีความสัมพันธ์เชิงลบที่แข็งแกร่ง 0 หมายความว่าไม่มีความสัมพันธ์
- R Square: สัมประสิทธิ์ความมุ่งมั่น ซึ่งแสดงจำนวนจุดระหว่างตัวแปรทั้งสองที่อยู่บนเส้นถดถอย ตามสถิติ นี่คือผลรวมของค่าเบี่ยงเบนกำลังสองจากค่าเฉลี่ย
- ปรับ R Square: ค่าทางสถิติที่เรียกว่า R square ที่ปรับตามจำนวนตัวแปรอิสระที่คุณเลือก
- ข้อผิดพลาดมาตรฐาน: ผลการวิเคราะห์การถดถอยแม่นยำเพียงใด หากข้อผิดพลาดนี้มีขนาดเล็ก แสดงว่าผลการถดถอยของคุณแม่นยำยิ่งขึ้น
- การสังเกต: จำนวนการสังเกตในรูปแบบการถดถอยของคุณ
ค่าที่เหลือในผลลัพธ์การถดถอยให้รายละเอียดเกี่ยวกับส่วนประกอบที่เล็กกว่าในการวิเคราะห์การถดถอย
- df: ค่าทางสถิติที่เรียกว่าดีกรีอิสระที่เกี่ยวข้องกับแหล่งที่มาของความแปรปรวน
- SS: ผลรวมของกำลังสอง อัตราส่วนของผลรวมที่เหลือของสี่เหลี่ยมจัตุรัสกับ SS ทั้งหมดควรน้อยกว่านี้ หากข้อมูลส่วนใหญ่ของคุณตรงกับเส้นการถดถอย
- MS: กำลังสองเฉลี่ยของข้อมูลการถดถอย
- F: สถิติ F (ทดสอบ F) สำหรับสมมติฐานว่าง นี่แสดงให้เห็นถึงความสำคัญของแบบจำลองการถดถอย
- Significance F: ค่าทางสถิติที่เรียกว่าค่า P ของ F.
ถ้าคุณไม่เข้าใจสถิติและการคำนวณตัวแบบการถดถอย ค่าที่ด้านล่างของสรุปจะไม่มีความหมายมากนัก อย่างไรก็ตาม Multiple R และ R Square เป็นสองส่วนที่สำคัญที่สุด
อย่างที่คุณเห็น ในตัวอย่างนี้ แคลอรี่มีความสัมพันธ์กับน้ำหนักรวมอย่างมาก
การวิเคราะห์การถดถอยเชิงเส้นพหุคูณใน Excel
ในการถดถอยเชิงเส้นแบบเดียวกัน แต่ด้วยตัวแปรอิสระหลายตัว ให้เลือกช่วงทั้งหมด (หลายคอลัมน์และแถว) สำหรับ Input X Range.
เมื่อเลือกตัวแปรอิสระหลายตัว คุณจะพบว่ามีความสัมพันธ์ที่แน่นแฟ้นน้อยกว่าเพราะมีตัวแปรมากมาย
อย่างไรก็ตาม การวิเคราะห์การถดถอยใน Excel สามารถช่วยให้คุณพบความสัมพันธ์กับตัวแปรเหล่านั้นตั้งแต่หนึ่งตัวขึ้นไปที่คุณอาจไม่ทราบว่ามีอยู่โดยการตรวจสอบข้อมูลด้วยตนเอง