วันพุธที่ 22 มกราคม พ.ศ. 2557

ความรู้เบื้องต้นเกี่ยวกับสถิติ

2.1.1 ความรู้เบื้องต้นเกี่ยวกับสถิติ
             สถิติเป็นตัวเลขที่แสดงข้อเท็จจริงในเรื่องต่างๆซึ่งอาจหมายถึงศาสตร์แขนงหนึ่งที่เรียกว่าสถิติศาสตร์แบ่งได้เป็นสถิติเชิงพรรณนาและสถิตเชิงอนุมานซึ่งต้องมีการเก็บรวบรวมข้อมูลเพื่อนำไปประมวลผลเป็นข่าวสารที่ต้องการการแบ่งประเภทข้อมูลอาจแบ่งตามาตราการวัดลักษณะของข้อมูล แหล่งของข้อมูล ประเภทของข้อมูล เป็นต้น
        สถิติศาสตร์มีขั้นตอนในการศึกษาที่เรียกว่าระเบียบวิธีทางสถิติ 4 ขั้นตอน คือการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูลและการแปลความหมายของข้อมูล

2.2.1.2 ความหมายของสถิติ 
สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistic มีรากศัพท์มาจาก  Stat หมายถึง ข้อมูลหรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่างๆ เช่น การทำสำมะโนครัวเพื่อทราบพลเมืองในประเทศทั้งหมด
สถิติ  หมายถึง ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณหน้าฝนในแต่ละปี สถิติในความหมายนี้  เรียกว่าข้อมูลทางสถิติ (Statistical  data)  
อีกความหมายหนึ่งสถิติหมายถึงวิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูลการนำเสนอข้อมูลการวิเคราะห์ ข้อมูลและการตีความหมายข้อมูล  
ประเภทของสถิติ
2.2.1.3 สถิติแบ่งออกเป็น  2  ประเภทคือ 
1.สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม หนึ่ง  ไม่สามารถอ้างอิงไปยังกลุ่มอื่น ๆได้ สถิติที่อยู่ในประเภทนี้ เช่น ค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม  ส่วนเบี่ยงเบนมาตรฐาน     พิสัย ฯลฯ 
2. สถิติอ้างอิง (Inferential  Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม หนึ่งหรือหลายกลุ่มแล้วสามารถอ้างอิงไปยังกลุ่มประชากรได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของ ประชากร  ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง  และตัวแทนที่ดีของประชากรเรียกว่ากลุ่มตัวอย่าง สถิติอ้างอิงสามารถแบ่งออกเป็น 2 ประเภทคือ  
          2.1 สถิติมีพารามิเตอร์  (Parametric  Statistics)  เป็นวิธีการทางสถิติที่จะต้องเป็นไป ตามข้อตกลงเบื้องต้นดังนี้
1. ข้อมูลต้องอยู่ในระดับช่วงขึ้นไป
2. ข้อมูลที่ได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
3. กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาต้องมีความแปรปรวนเท่ากัน สถิติประเภทนี้ เช่น   t-test,   Z-test,  ANOVA,  Regression   ฯลฯ      
2.2  สถิติไร้พารามิเตอร์ (Nonparametric  Statistics)  เป็นวิธีการทางสถิติที่ สามารถนำมาใช้ได้โดยปราศจากข้อตกลงเบื้องต้นสถิติที่อยู่ในประเภทนี้ เช่น ไคสแควร์, Median  test,  Sign test ฯลฯโดยปกติแล้วนักวิจัยนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติพารามิเตอร์มีอำนาจ การทดสอบ (Power of Test)  สูงกว่าการใช้สถิติไร้พารามิเตอร์               สถิติมีพารามิเตอร์เป็นการทดสอบที่ได้มาตรฐาน มีขั้นตอนต่าง ๆ ที่สมบูรณ์  ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นในการใช้สถิติมีพารามิเตอร์จึง ไม่มีผู้ใดคิดที่จะหันกลับไปใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน
2.21.4 ข้อมูลละระดับการวัดข้อมูล
ข้อมูล (data) คือข้อเท็จจริงต่างๆ ซึ่งจำจะเป็นตัวเลขก็ได้ข้อมูลได้จากการวัด ด้วยมาตรต่างๆ ซึ่งแบ่งได้ 4 ระดับหรือมาตรดังนี้
          1. มาตรนามบัญญัติ (nominal scale)เป็นการวัดระดับต่ำสุด โดยจะเป็นเพียงการจำแนกประเภทของคุณลักษณะหรือสิ่งของต่างๆ ตัวอย่างเช่น จำแนกผลลัพธ์จากการโยนเหรียญเป็นหัว หรือก้อย จำแนกหมู่โลหิต A,B,O หรือAB จำแนกบุคคลตามอาชีพเป็นข้าราชการค้าขาย หรือเกษตรกร หรือจำแนกสีของรุ้งออกเป็นสีต่างๆ
          การวัดในระดับนี้ อาจเป็นการกำหนดสัญลักษณ์ เพื่อจำแนกสิ่งต่างๆ เช่น กำหนดแทนเพศชาย แทนเพศหญิง นอกจากนั้น อาจมีการกำหนดตัวเลขเพื่อจำแนกสิ่งต่างๆ โดยที่ ตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณ เช่นเลขที่บ้าน ดังนั้นจึงนำเลขต่างๆ มาบวก ลบ คูณ หรือหารกันไม่ได้กระทำได้เพียงการนับเพื่อดูความถี่หรือการเกิดซ้ำๆ กัน ตัวอย่างข้อมูลอื่นๆ ที่ได้จากการวัดประเภทนี้เช่น หมายเลขนักฟุตบอล หมายเลขโทรศัพท์ หมายเลขประจำตัวผู้เสียภาษี รหัสไปรษณีย์ เลขหมู่หนังสือในห้องสมุด และหมายเลขเที่ยวบิน เป็นต้น
          2. มาตรเรียงอันดับ (ordinal or ranking scale) การวัดในระดับนี้เป็นการเรียงอันดับสิ่งต่างๆ ตามลักษณะหนึ่งๆ ซึ่งมีความสัมพันธ์กันในลักษณะดีกว่า ยากกว่าหรือนิยามมากกว่าตัวอย่างเช่น แม่บ้านคนหนึ่งมีความนิยมผงซักฟอก 3 ตราเป็น ดีที่สุด ดีมาก และดี ซึ่งจะเป็นว่าการวัดในระดับนั้น ในการวัดระดับนี้เพื่อความสะดวกอาจมีการกำหนดอันดับเป็นตัวเลขให้แก่สิ่งต่างๆ โดยที่ตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณตัวอย่างเช่นกล้วยไม้ที่ชนะการประกวดเป็นอันดับที่ 1 อันดับที่ 2 และอันดับที่ 3 มิได้หมายความว่า กล้วยไม้ที่ชนะการประกวดเป็นอันดับที่ 1 มีความงามเป็น 2 เท่าของกล้วยไม้ที่ได้อันดับที่ 2 และระบุไม่ได้ว่ากล้วยไม้ที่ได้อันดับที่ 1 งามกว่ากล้วยไม้ที่ได้อันดับที่ 2 มากน้อยเพียงใดนอกจากนั้น ความแตกต่างของความงามระหว่างกล้วยไม้ที่ได้อันดับที่ 1 กับ 2 และระหว่างกล้วยไม้ที่ได้อันดับที่ 2 กับ 3 ไม่จำเป็นต้องเท่ากัน ดังนั้นข้อมูลที่ได้จากการวัดในระดับนี้จึงนำมาบวก ลบ คูณ หาร กันไม่ได้
          3. มาตรอันตรภาค (interval scale)การวัดในระดับนี้ นอกจากจะมีคุณสมบัติการจำแนกและการเรียงอันดับสิ่งต่างๆ แล้ว แต่ละหน่วยของการวัดยังมีค่าคงที่อีกด้วยซึ่งทำให้สามารถระบุความแตกต่างระหว่างสิ่งต่างๆ ว่ามีมากน้อยเพียงใด นั่นคือ ข้อมูลซึ่งเป็นตัวเลขที่ได้จากการวัดในระดับนี้ จะมีความหมายในเชิงปริมาณอย่างแท้จริง
          4. มาตราอัตราส่วน (ratio scale) เป็นการวัดระดับสูงสุด ซึ่งนอกจากจะมีคุณสมบัติต่างๆ เหมือนมาตรอันตรภาคแล้ว ยังมีศูนย์แท้เป็นจุดเริ่มต้น นั่นคือ 0 หมายความว่าไม่มีอะไรเลยเช่น วัดน้ำหนักในหน่วยระบบเมตริกได้ 0 กิโลกรัมแสดงว่าไม่มีน้ำหนักเลย และเมื่อแปลงเป็นหน่วยระบบอังกฤษก็จะหนัก 0 ปอนด์ ซึ่งแสดงว่าไม่มีน้ำหนักเลยเช่นกัน ดังนั้น ข้อมูลที่ได้จากการวัดในระดับนี้จึงนำมาบวก ลบ คูณ หาร
         ตัวอย่างข้อมูลอื่นๆ ที่ได้จากการวัดในระดับนี้ เช่น ความยาว อายุ เวลา ความเร็ว
          ข้อมูลที่ได้จากการวัดทั้ง 4 ระดับ อาจแบ่งตามลักษณะของข้อเท็จจริงที่ปรากฏได้  2 ประเภทคือ
1. ข้อมูลเชิงคุณภาพ (qualitative data) หรือ ข้อมูลเชิงจำแนก (categorized data)ได้แก่ข้อมูลที่ไห้ข้อเท็จจริงในเชิงคุณภาพ ซึ่งบางครั้งอาจแทนด้วยตัวเลขก็ได้ โดยที่ตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณ เช่น เพศ เชื้อชาติ ศาสนา ความนิยม ทัศนคติ ข้อมูลประเภทนี้ได้จากการวัดด้วยมาตรนามบัญญัติ และมาตรเรียงอันดับ
          2. ข้อมูลเชิงปริมาณ (quantitative data) ได้แก่ข้อมูลที่ให้ข้อเท็จจริงในเชิงปริมาณ เช่น น้ำหนัก อายุ คะแนน เป็นต้น ข้อมูลประเภทนี้ได้จากการวัดด้วยมาตรอันตรภาคและมาตรอัตราส่วน
 ขั้นตอนการประมวลผลข้อมูล
          การประมวลผลข้อมูล ประกอบด้วย 3 ขั้นตอน ดังนี้
                    1. การเตรียมข้อมูลนำเข้า (Input Data)
                    2. การประมวลผล (Processing)
                    3. การนำเสนอหรือแสดงผลลัพธ์ (Output)
โดยแต่ละขั้นตอนมีรายละเอียด ดังนี้
2.1 การเตรียมข้อมูลนำเข้า
          1. การเก็บรวบรวมข้อมูล โดยอาจเป็นข้อมูลที่เก็บรวบรวมโดยตรงด้วยแบบสอบถามหรือแบบบันทึก ซึ่งเป็นข้อมูลปฐมภูมิ หรือเก็บรวบรวมจากแหล่งต่างๆ ซึ่งเป็นข้อมูลทุติยภูมิ
          2. การเปลี่ยนสภาพข้อมูล (Data Conversion) เป็นการเปลี่ยนสภาพของข้อมูลที่เก็บรวบรวมได้ไอยู่ในรูปแบบที่สามารถนำไปประมวลผลหรือวิเคราะห์ การเปลี่ยนสภาพข้อมูลประกอบด้วย
          * การลงรหัส (Coding) เป็นการเปลี่ยนรูปแบบข้อมูลโดยให้รหัสแทนข้อมูล รหัสที่ให้อาจเป็นตัวเลขตัวอักษรหรือข้อความ (ภาษาอังกฤษ)ก็ได้ โดยทั่วไปข้อมูลที่มีการกำหนดรหัสมักเป็นข้อมูลเชิงคุณภาพ ตัวอย่างเช่น กำหนดรหัสเป็นตัวเลข โดย 1 แทน ชาย 2 แทน หญิง หรือกำหนด รหัสเป็นตัวอักษร โดย male แทนชาย female แทนหญิง เป็นต้น
          ทั้งนี้ก่อนที่จะมีการรหัสผู้วิจัยต้องจัดทำคู่มือการลงรหัสเพื่อใช้เป็นคู่มือในการลงรหัส ตลอดจนการแปลผลลัพธ์ที่ได้จากการประมวลผลออกมาเป็นข้อความได้
          * การบรรณาธิกร (Editing) เป็นการตรวจสอบความถูกต้องของข้อมูลก่อนที่จะมีการลงรหัส ตลอดจนข้อมูลที่ได้มีการลงรหัสแล้ว โดยต้องตรวจสอบความครบถ้วนและสมบูรณ์ของข้อมูลตลอดจนความสัมพันธ์และความเป็นไปได้ของข้อมูล เช่น บุตรอายุมากกว่าบิดา หรืออายุ 15 ปี แต่มีอาชีพรับราชการ เป็นต้น
          * การแปรสภาพข้อมูล (Transforming) เป็นการป้อนข้อมูลซึ่งอยู่ในรูปรหัสแล้วบันทึกเป็นแฟ้มข้อมูลในสื่อบันทึกข้อมูล เช่น ดิสเก็ต (diskette) เทปแม่เหล็ก
          * การตรวจสอบข้อมูลในแฟ้มข้อมูล (Data Checking) จากแฟ้มข้อมูลซึ่งได้จากการป้อนและบันทึกข้อมูลแต่ละชุดในรูปรหัส ก่อนที่จะนำแฟ้มข้อมูลดังกล่าวไปประมวลผลต่อไปนักวิจัยจะต้องทำการตรวจสอบรหัสของแต่ละตัวแปร ว่ามีค่าตามที่กำหนด หรืออยู่ในช่วงที่กำหนดหรือไม่ตลอดจนตรวจสอบว่าตัวแปรที่สอดคล้องมีรหัสสอดคล้องกันหรือไม่หากพบค่าผิดพลาด จะต้องแก้ไขให้ถูกต้อง แล้วบันทึกข้อมูลดังกล่าว เพื่อนำไปประมวลผลต่อไป

2.2 การประมวลผล
          เป็นการนำข้อมูลที่เปลี่ยนสภาพแล้วมาวิเคราะห์ด้วยโปรแกรมสำเร็จรูปทางสถิติ ประกอบด้วย
-          การนิยามหรือการดึงข้อมูล
-          การแปลงค่าของข้อมูล
-          การรวมแฟ้มข้อมูล
-          การคำนวณและเปรียบเทียบ
-          การวิเคราะห์ข้อมูลทางสถิติ

2.3 การแสดงผลลัพธ์
          โดยอาจเป็นรายงานที่อยู่ในรูปข้อความ ตาราง หรือกราฟ แล้วแต่ความเหมาะสม และความสวยงาม
การกำหนดตัวแปรและรหัสของตัวแปร
          ดังได้กล่าวมาแล้วว่าการกำหนดรหัสมักจะใช้สำหรับข้อมูลเชิงคุณภาพ ในทางปฏิบัติแล้วและสร้างหรือกำหนดรหัสจะทำควบคู่กับการสร้างแบบสอบถาม เนื่องจากแบบสอบถามประกอบด้วยคำถามหรือกำหนดรหัสจะทำควบคู่กับการสร้างแบบสอบถามเนื่องจากแบบสอบถามประกอบด้วยคำถามหรือรายการข้อมูลต่างๆ โดยแต่ละรายการข้อมูลต้องมีการกำหนดตัวแปร 1 ตัว และค่าของตัวแปรก็คือข้อมูลโดยถ้าเป็นข้อมูลเชิงปริมาณ ค่าของตัวแปรก็คือค่ารหัสที่นักวิจัยเป็นผู้กำหนดนั่นเอง โดยทั่วไปจะเว้นเนื้อที่ด้านขวามือของแบบสอบถามไว้สำหรับลงรหัส ซึ่งจะทำเป็นช่องสี่เหลี่ยม ไว้ตรงกับคำถามนั้นๆ โดยมีจำนวนช่องสี่เหลี่ยมเพียงพอกับการบันทึกรหัสหรือค่าที่เป็นไปได้ของคำถามนั้นๆพร้อมกำหนดชี่อตัวแปรแทนคำถาม เพื่อนำไปใช้อ้างอิงในภายหลัง โดยชื่อตัวแปรนี้อาจกำหนดให้สอดคล้องกับรายการข้อมูลเพื่อให้สื่อความยาวไม่เกิน 8 ตัวอักษร เช่น คำถามอายุ กำหนดชื่อตัวแปรเป็น age โดยกำหนดสอบถามจากข้าราชการซึ่งตามระเบียบต้องมีอายุไม่เกิน 60 ปี ดังนั้นรหัสหรือค่าสุงสุดประกอบด้วยตัวเลข 2 หลัก และกำหนดช่องสี่เหลี่ยมในลักษณะ เพี่อให้เพียงพอกับการบันท฿กอายุที่เป็นไปได้ของข้าราชการแต่ละคนและกล่าวว่าค่าหรือรหัสของตัวแปร age  มีความกว้างเป็น 2 อนึ่ง คำถามในแบบสอบถาม 1 ข้อ อาจจะกำหนดตัวแปรได้มากกว่า 1ตัว ก็ได้ทั้งนี้เนื่องจากว่าคำถาม 1 ข้ออาจประกอบด้วยหลายรายการข้อมูลนั่นเอง
          การจัดเตรียมรหัสในแบบสอบถามเพื่อกำหนดจำนวนช่องสี่เหลี่ยมนั้น บางครั้งอาจขึ้นอยู่กับลักษณะของรูปแบบคำถาม ตลอดจนเทคนิคการวิเคราะห์ในขั้นต่อไป กล่าวคือ
          คำถามแบบปลายปิด เป็นคำถามที่กำหนดคำตอบไว้ให้ล่วงหน้าแน่นอนแล้ว ผู้ตอบจะต้องเลือกตามที่กำหนดไว้และสามารถลงรหัสได้ดังนี้
          1. คำถามที่กำหนดคำตอบไว้ให้เลือกตอบได้เพียงคำตอบเดียว จะกำหนดตัวแปรให้เพียง 1 ตัวแปร โดยมีรหัสเท่ากับจำนวนคำตอบที่มีเช่น
          เพศ     [ ] 1. ชาย
                     [ ] 2. หญิง      
          กำหนดชื่อตัวแปรเป็น gender และให้รหัส 1 แทน ชาย รหัส 2 แทน หญิงและกล่าวว่าค่าหรือรหัสของตัวแปร gender มีความกว้างเป็น 1 จึงกำหนดช่องสี่เหลี่ยมสำหรับบันทึกรหัสดังนี้
          ระดับความความพึงพอใจต่อการให้บริการของสำนักวิทยาบริการ
                   [ ] 1. ไม่พอใจมาก
                   [ ] 2. ไม่พอใจ
                   [ ] 3. เฉยๆ
                   [ ] 4. พอใจ
                   [ ] 5. พอใจมาก
          กำหนดชื่อตัวแปรเป็นv1 และรหัสของ v1 มีความกว้างเป็น 1 โดย 1 แทน ไม่พอใจมาก
                   2 แทน ไม่พอใจ
                   3. แทน เฉยๆ
                   4. แทน พอใจ
                   5. แทน พอใจมาก
          2. คำถามที่กำหนดคำตอบไว้ให้เลือกและให้ผู้ตอบเลือกตอบได้มากกว่าหนึ่งคำตอบ เช่น
                   เหตุผลที่ท่านมาใช้บริการที่ห้างสีทันดร (เลือกตอบได้มากกว่า 1 คำตอบ
                             [ ] สินค้าราคาถูก
                             [ ] มีสินค้าหลากหลายและครบครัน
                             [ ] มีบริการหลายประเภท
                             [ ] สถานที่จอดรถสะดวก
ในกรณีนี้กำหนดตัวแปรได้ 2 วิธี ขึ้นกับผลการวิเคราะห์ที่ต้องการ ดังนี้
          วิธีที่หนึ่ง ถ้าผู้วิจัยต้องการทราบจำนวนและร้อยละของแต่ละคำตอบ จากคำตอบที่ให้เลือก 4 คำตอบ ผู้ตอบได้ตั้งแต่ 1 ถึง 4 คำตอบ กรณีนี้นักวินักวิจัยกำหนดจำนวนตัวแปรเท่ากับจำนวนคำรอบที่ให้เลือก และแต่ละตัวแปรจะมีการกำหนดรหัสเพียง 2 รหัส คือ 1 แทน เลือกตอบ คำตอบดังกล่าว และ 0 คือ ไม่เลือกตอบคำตอบดังกล่าว นั่นคือรหัสของแต่ละตัวแปรมีความกว้างเป็น 1
          กำหนดชื่อตัวแปร 3 ตัว ดังนี้
                   Var 00001 แทน สินค้าราคาถูก
                   Var 00002 แทน มีสินค้าหลากหลายและครบครัน
                   Var 00003 แทน มีบริการหลายประเภท
การจัดทำคู่มือลงรหัส
          เมื่อผู้วิจัยได้รหัสแทนข้อมูลไว้แล้ว ขั้นตอนที่ควรจำทำควบคู่กันไปคือ การจัดทำคู่มือการลงรหัส เพราะผู้วิจัยอาจจำรหัสไม่ได้ หรือแปลความหมายผิดไป ตลอดจนเพื่อให้คณะผู้วิจัยเข้าใจตรงกัน คู่มือรหัสประกอบด้วย
1.       หมายเลขแบบสอบถาม
2.       เลขที่คำถาม
3.       ชื่อตัวแปร
4.       รายการข้อมูล
5.       ขนาดของค่าตัวแปร
6.       รหัสของคำตอบ
2.2.1.5 ประชากรและกลุ่มตัวอย่าง
การศึกษาวิชาสถิติ (Statistics ) จำเป็นอย่างมากที่ผู้ศึกษาจะต้องเข้าใจ คำว่าประชากร และตัวอย่าง  อย่างถ่องแท้เสียก่อน ในบทนี้จะขอกล่าวถึงสอง เรื่องนี้ เพื่อแสดงให้เห็นถึงความ เหมือน หรือ ความแตกต่างกัน ของประชากรและตัวอย่าง  เพื่อเป็นพื้นฐานความเข้าใจสำหรับหัวข้ออื่นๆด้วย
ประชากร (Population)
ในที่นี้คำว่าประชากรไม่ได้หมายถึง คนหรือประชาชน แต่หมายถึงสิ่งที่เราสนใจอยากรู้ข้อมูล เช่น. ส่วนสูงของคน คำว่าประชากรก็คือ ค่าส่วนสูงของคนหลายคนมากๆ   ถ้าเป็นอุณหภูมิ คำว่าประชากรก็จะหมายถึงค่าที่ได้จากการวัดหลายๆครั้ง ในในช่วงเวลานานๆ เป็นต้น ถ้าในทางวิชาสถิติ สิ่งสำคัญที่สุดหรือเป้าหมายของคนที่ใช้ความรู้ทางสถิติก็คือต้องการทราบหรืออธิบายถึงคุณสมบัติ ต่างๆ ของประชากร  แต่เนื่องจาก ในชีวิตจริงๆ ผู้ที่ใช้วิชาสถิติ ไม่มีวันที่จะเก็บข้อมูลของประชากรทั้งหมดได้หรอก ถ้าจะอธิบายคำว่าประชากรให้ได้ถูกต้องมากที่สุด ก็คงจะเป็นดังต่อไปนี้
มีจำนวนมากจนไม่อาจจะเก็บข้อมูลได้หมดแน่นอนว่า หากเราสามารถเก็บข้อมูลได้หมด นั้นแปลว่าเราสามารถอธิบายประชากรได้ถูกต้อง 100% เช่น. การศึกษาเรื่องน้ำหนักแรกเกิดของทารกในประเทศไทย คำว่าประชากรในการศึกษาครั้งนี้ก็คือน้ำหนักของทารกแรกเกิดทุกคนในประเทศไทยแน่นอนว่าจะต้องไม่มีที่สิ้นสุด เพราะจะมีทารกแรกเกิด เกิดขึ้นทุกวันๆ อีกอย่างก็คือ เป็นไปไม่ได้ที่ผู้ทำการศึกษาจะสามารถเก็บรวบรวมค่าน้ำหนักทารกแรกเกิดใหม่ ได้ทุกคน จะต้องมีข้อจำกัดมากมายทั้งต้นทุนในการดำเนินการเวลา และทรัพยากรอื่นๆหรือถ้ายกตัวอย่างในงานทางอุตสาหกรรม วิศวกรต้องการศึกษาเรื่องน้ำหนักบรรจุหนึ่งถุงของปูนซิเมนต์คำว่าประชากรก็คือน้ำหนักบรรจุปูน    ซิเมนต์ทุกถุง ทั้งที่อยู่ในโกดังเก็บทั้งที่ส่งไปหาลูกค้าแล้ว ทั้งที่กำลังอยู่ในสายการผลิต จะเห็นได้ว่าไม่มีวันที่วิศวกรจะเก็บข้อมูลได้ทุกถุงหรอกแต่ก็มีงานบางอย่างที่จำเป็นต้องเก็บข้อมูลของประชากรทั้งหมดเช่น งานสัมมโนประชากร ซึ่งเป็นเรื่องที่ภาครัฐจำเป็นต้องมีข้อมูลของคนทุกคนในประเทศ แต่จะเห็นได้ว่ารัฐต้องใช้ บุคคลากร อุปกรณ์ เครื่องมือ เงิน รวมถึงทรัพยากร ต่างๆไปอย่างมากมายกว่าจะทำได้

ตัวอย่าง (Sample)
เมื่อเราไม่อาจจะเก็บข้อมูลของประชากรทุกตัวได้ เราจึงมีวิธีที่จะเก็บเอาเพียงบางตัว บางส่วน บางช่วงเวลา ของประชากรเพื่อมาทำการวิเคราะห์ แล้วนำผลที่ได้กลับไปประมาณหรืออธิบายถึงประชากร อีกที สมาชิกของประชากรที่เราเก็บค่ามาดังกล่าวเรียกว่าตัวอย่างแน่นอนว่าเมื่อเราทำการศึกษาผ่านตัวอย่างย่อมให้ผลลัพธ์ ที่ผิดพลาดไปจากค่าที่แท้จริงของประชากรบ้าง  เราจึงต้องคำนึงถึง ระดับความเชื่อมั่นที่เราจะสามารถยอมรับความผิดพลาดดังกล่าว  มีองค์ประกอบหลายประการที่เกี่ยวข้องกับระดับความเชื่อมั่น เช่น วิธีการเก็บตัวอย่างจากประชากร  จำนวนตัวอย่างที่เก็บค่ามา  แม้แต่เครื่องมือทางสถิติที่เราเลือกใช้ในการวิเคราะห์  เป็นต้น ดังนั้นจึงมีความจำเป็นที่จะ ต้องมีแบบแผนอย่างถูกต้องด้วยในการที่จะเก็บตัวอย่าง  ที่ผู้ทำการศึกษาควรให้ความสนใจ

ตัวประมาณการและค่าประมาณการ (Estimator and Estimated value )
เนื่องจากในความเป็นจริงทางวิชาสถิติเรามิอาจจะรู้ค่า Population Parameter ได้เลย สิ่งที่เราสามารถรู้ได้ก็คือ Sample Statistics เท่านั้น แต่เนื่องจาก ท้ายที่สุดแล้วเราต้องการรู้ Population parameter ต่างหาก เราจึงใช้ Sample Statistics มาประมาณค่า Population parameter เราจึงเรียก     x ว่าตัวประมาณค่ากลาง (m ) ของประชากร ( Population mean estimator) นั่นหมายความว่า ค่าเฉลี่ยของตัวอย่าง ก็เป็นค่าโดยประมาณของค่ากลางของประชากร และเราเรียก  s ว่าตัวประมาณการค่าเบี่ยงเบนมาตรฐาน (s) ของประชากร    (Population standard deviation estimator ) นั่นหมายความ ค่าเบี่ยงเบนมาตรฐานของตัวอย่าง ก็เป็นค่าโดยประมาณของค่าเบี่ยงเบนมาตรฐาน ของประชากรด้วยเช่นกัน
ระดับองศาอิสระของข้อมูล (Degree of freedom )
แนวคิดเรื่อง Degree of freedom นี้มีหลากหลายแนวคิดมาก ผู้เขียนจำได้ว่า ในตอนที่เรียนวิชาสถิติในมหาวิทยาลัยนั้น คำอธิบายเกี่ยวกับคำๆ นี้ก็เป็นสิ่งที่ยังค้างคาใจอยู่มา จนปัจจุบันนี้แต่เมื่อได้มีโอกาสกลับมาใช้วิชาสถิติประยุกต์ ในการทำงานแล้วจึงเริ่มพอจะมีความเข้าใจมากขึ้น ที่ผู้เขียนเองอยากจะเสนอ แนวคิดซึ่งอาจจะทำให้ท่านมีข้อโต้แย้งได้ และผู้เขียนมีความยินดีอย่างยิ่งที่รับฟัง โดยผู้เขียนจะขอนำเสนอแนวคิดดังต่อไปนี้
1. Degree of freedom คือค่าที่ใช้เพื่อชดเชย ความผิดพลาดของตัวอย่าง (Sample) เมื่อนำมาคำนวนหาค่าสถิติ คือค่าการกระจายของข้อมูล (Standard deviation) เนื่องจากในความเป็นจริงแล้ว ค่าดังกล่าวนี้ จะเล็กกว่าค่า  Population Parameter เสมอ เนื่องจากโดยส่วนมากแล้ว เรามิอาจหาตัวแทนของประชากรได้ ตรง 100% เมื่อเป็นดังนี้ เมื่อเรานำไปประมาณค่า Population Parameter เราก็จะได้ค่า Population Standard Deviation ที่เล็กกว่าความเป็นจริงเสมอ  เพื่อแก้ไขข้อผิดพลาดดังกล่าว เราจึงลดตัวหาร ลง หนึ่งตัว เพื่อชดเชยปรากฎการณ์ดังกล่าว ดังนั้นสมการในการหาค่า Sample Standard Deviation ตัวหารหรือ Degree of freedom จึงเท่ากับจำนวนตัวอย่างลบด้วย 1 เสมอ แต่ถ้าหากว่าเรามิได้มีจุด ประสงค์จะนำค่า  sไปประมาณค่า (s) หรือพูดง่ายๆคือเราแค่อยากอธิบายข้อมูลของตัวอย่างที่เก็บมาเท่านั้นไม่ได้เอาไปคาดการณ์ค่าPopulation Parameter เราก็ไม่จำเป็น ต้องลดตัวหารลงแต่อย่างใด 
2. เนื่องจากเราต้องการเอาค่า Sample Statistics ไปประมาณค่า Population parameter  เราจึงใช้ x ประมาณค่ากลาง( m) ของประชากร เพราะเรามิอาจจะรู้ค่า  (m) ที่แท้จริงได้ และโดยธรรมชาติแล้วค่าxใดๆ ที่เราเก็บมาจากการสุ่มตัวอย่างนั้น จะมีแนวโน้มเข้าหาค่าไม่ใช่เข้าหาค่า ( m) เมื่อเราหาค่าเบี่ยงเบนมาตรฐาน Standard Deviation โดยยึดค่า x จึงทำให้ค่าที่ได้มานั้นผิดพลาดไปจากที่ควรจะเป็น เราจึงจำเป็นต้องชดเชยค่า s ให้เข้าใกล้ ( s ) ให้มากที่สุด ตัวหารในสมการจึงถูกลดลงไป หนึ่งตัวเสมอ
3. เมื่อไหร่ก็ตามที่มีการวิเคราะห์ หรือกระทำการทางคณิตศาสตร์ ระหว่างข้อมูลของ Sample สองกลุ่มหรือมากกว่า Degree of freedom ของแต่ละ Sample ก็ต้องถูกลดลง 1 เหมือนกัน อันส่งผลให้ Degree of freedom รวม จะลดลงมากกว่า 1 ตัว

2.2.1.6 ตัวแปร (Variables)
          ตัวแปร (Variable) หมายถึง คุณสมบัติหรือลักษณะเฉพาะของสิ่งใด ๆ ที่ผู้วิจัยกำลังศึกษา โดยคุณลักษณะดังกล่าวสามารถแปรค่าไปในด้านปริมาณ เช่น ความสูง อายุ น้ำหนัก ความเร็ว เป็นต้นหรืออาจเป็นไปทางด้านคุณภาพ เช่น เพศ เชื้อชาติ ศาสนา เป็นต้น

2.2.1.7 ประเภทของตัวแปร
การแบ่งประเภทของตัวแปรขึ้นอยู่กับเกณฑ์ที่นำไปใช้พิจารณาคุณสมบัติของค่าตัวแปร การจัดประเภทของตัวแปร  ดังเช่น
                1. ใช้ระดับของการวัดเป็นเกณฑ์ในการแบ่งตัวแปร จะแบ่งตัวแปรได้ 4 ระดับ เช่น
                       1.1 ตัวแปรนามบัญญัติ (Nominal Variable) คือ ตัวแปรจัดประเภทหรือตัวแปรจัดกลุ่ม  เป็นตัวแปรที่แบ่งตามชื่อหรือกลุ่มหรือประเภทของสิ่งนั้น ๆ เช่น เพศ แปรเป็น ชายและหญิง  ศาสนา แปรเป็น พุทธ คริสต์ อิสลาม อื่น ๆ เป็นต้น
                        1.2 ตัวแปรอันดับ (Ordinal Variable) เป็นตัวแปรที่แบ่งตามระดับของตัวแปรที่สามารถจัดลำดับได้ หรือทราบได้ชัดเจนว่าอะไรมากกว่า หรืออะไรเกิดก่อน หรืออะไรดีกว่า เช่น ลำดับการเกิด ระดับของข้าราชการ ยศ ตำแหน่ง เป็นต้น
                        1.3 ตัวแปรอันตรภาค (Interval Variable) เป็นตัวแปรที่เกิดจากระดับการวัดแบบอันตรภาค คือการวัดที่เริ่มจากศูนย์สมมุติ  และช่วงระหว่าง 1 หน่วยการวัดมีค่าเท่ากันตลอด เช่น อุณหภูมิในระบบองศาเซลเซียส  คะแนนสอบ เป็นต้น
                        1.4 ตัวแปรอัตราส่วน (Ratio Variable) เป็นตัวแปรที่เกิดจากระดับการวัดที่มีศูนย์แท้ (Absolute Zero) และ 1 หน่วยใด ๆ มีค่าเท่ากันหมด เช่น ความสูง ความเร็วรถ เป็นต้น
2. ใช้การทำหน้าที่ของตัวแปรเป็นเกณฑ์ จะแบ่งตัวแปรได้ 5 ประเภท ได้แก่
                        2.1 ตัวแปรต้นหรือตัวแปรอิสระ (Independent Variable) คือตัวแปรที่ทำหน้าที่เป็นสาเหตุของความผันแปรในสิ่งที่สนใจศึกษาในเรื่องหนึ่ง  ๆ เช่น อาชีพ และระดับการศึกษาของผู้ปกครอง เป็นตัวแปรต้น ในงานวิจัยเรื่อง “ปัจจัยที่มีผลต่อแรงจูงใจใฝ่สัมฤทธิ์ของนักเรียน”
                        2.2 ตัวแปรตาม (Dependent Variable) คือตัวแปรที่เป็นผลของตัวแปรต้นหรือคือตัวแปรที่ผู้วิจัยสนใจศึกษา เช่น ฐานะทางเศรษฐกิจ เป็นตัวแปรตามในงานวิจัยเรื่อง “การศึกษาองค์ประกอบที่มีอิทธิพลต่อฐานะทางเศรษฐกิจของคนไทย”
                        2.3 ตัวแปรรอง (Moderator Variable) จัดเป็นตัวแปรต้นชนิดหนึ่ง แต่มีความสำคัญเป็นรองจากตัวแปรต้น บางทีอาจเรียกว่าตัวแปรกลาง เป็นตัวแปรที่มีผลต่อตัวแปรตามด้วย เช่น การเปรียบเทียบผลการสอนภาษาญี่ปุ่นด้วยวิธีทีพีอาร์กับวิธีปกติ มีนักเรียนกลุ่มหนึ่งถือเป็นกลุ่มทดลองได้รับการสอนด้วยวิธีทีพีอาร์ และนักเรียนอีกลุ่มหนึ่งได้รับการสอนด้วยวิธีปกติ ผลการเปรียบเทียบพบว่าผลสัมฤทธิ์นักเรียนทั้งสองกลุ่มไม่มีความแตกต่างกัน แต่เมื่อเปรียบเทียบระหว่างนักเรียนชายกับนักเรียนหญิงพบว่ามีความแตกต่างกัน หากนักวิจัยไม่สนใจตัวแปรรอง อาจทำให้สรุปผลวิจัยคลาดเคลื่อนได้ กรณีนี้
                                ตัวแปรต้น คือ วิธีสอน
                                ตัวแปรตาม คือ ผลสัมฤทธิ์ภาษาญี่ปุ่น
                                ตัวแปรรอง คือ เพศ
2.4 ตัวแปรแทรกซ้อน  (Extraneous  Variable) คือตัวแปรที่นักวิจัยไม่ได้สนใจ
ศึกษาแต่เป็นตัวแปรที่มีผลต่อตัวแปรตามเนื่องจากในปรากฏการณ์ธรรมชาติ ตัวแปรทั้งหลายมีความเกี่ยวโยงซึ่งกันและกันเป็นการยากที่จะศึกษาผลของตัวแปรตามกับตัวแปรต้นที่สนใจเท่านั้น เช่น ต้องการศึกษาว่าการออกกำลังกายจะช่วยลดอาการภูมิแพ้ได้มากน้อยเพียงใดในเรื่องนี้ การออกกำลังกายเป็นตัวแปรต้น อาการภูมิแพ้เป็นตัวแปรตามตัวแปรแทรกซ้อนอาจมีได้มากมาย ได้แก่ ความสะอาดของที่พักอาศัยการแต่งกายให้ร่างกายอบอุ่น การรับประทานอาหารที่มีคุณค่า เป็นต้น ตัวแปรแทรกซ้อนนั้นมีอยู่ในปรากฏการณ์ปกติ นักวิจัยต้องวิเคราะห์ให้รอบคอบและวางแผนที่กำจัดหรือควบคุมให้ได้ เพื่อให้ผลการวิจัยมีความถูกต้องมากที่สุดเท่าที่จะทำได้
              2.5 ตัวแปรสอดแทรก (Intervening Variable) คือตัวแปรที่มีผลต่อตัวแปรตาม แต่นักวิจัยไม่ได้ตั้งในที่จะศึกษาอิทธิพลของตัวแปรนั้น ๆ ทำนองเดียวกับตัวแปรแทรกซ้อน  แต่ตัวแปรสอดแทรกเป็นตัวแปรที่นักวิจัยไม่สามารถควบคุมได้  ตัวแปรแทรกซ้อนเช่น ความร่วมมือของกลุ่มตัวอย่าง เป็นต้น

การวิเคราะห์ตัวแปร            
เมื่อเห็นรายชื่องานวิจัยเราน่าจะวิเคราะห์ตัวแปรจากชื่อรายงานวิจัยได้ว่างานวิจัยนั้นเกี่ยวข้องกับตัวแปรใด โดยเฉพาะอย่างยิ่งตัวแปรตามควรจะกำหนดได้ทันที นอกจากนี้เรายังสามารถคาดเดาตัวแปรได้จากส่วน   ต่าง ๆ ของงานวิจัยได้อีกหลายส่วน เช่น วัตถุประสงค์การวิจัย คำถามวิจัย และสมมุติฐานการวิจัย เป็นต้น

การกำหนดตัวแปร
          การกำหนดตัวแปรตาม โดยทั่วไปเรื่องที่ผู้วิจัยสนใจศึกษานั้นจะเป็นตัวแปรตาม เช่น
-   “การศึกษาความคิดสร้างสรรค์ของนักเรียนชั้นป. 3” แสดงว่าความคิดสร้างสรรค์       ตัวแปรตาม
-   “ ผลของการออกกำลังกายที่มีต่อสมรรถภาพทางกายของเยาวชน” แสดงว่า สมมรรถนะทางกาย เป็นตัวแปรตาม
การกำหนดตัวแปรต้น  ผู้วิจัยต้องมีความรู้หรือศึกษาเรื่องที่สนใจจนรอบรู้ตัวแปรต่าง ๆ ในปรากฏการณ์ธรรมชาติมีความสัมพันธ์กันอย่างไร และผู้วิจัยกำหนดกรอบการวิจัยซึ่งจะทำให้ผู้วิจัยสามารถระบุตัวแปรต้นและตัวแปรตามที่เกี่ยวข้องได้ต่อไป
2.2.1.8 การเก็บรวบรวมข้อมูล (Data Collection)
          เมื่อมีความจำเป็นต้องใช้ข้อมูล เราอาจดำเนินการเก็บรวบรวมด้วยตนเองหรืออาจนำเอาข้อมูลจากแหล่งที่มีผู้รวบรวมไว้แล้วมาใช้ก็ได้ที่จำเป็นต้องเก็บรวบรวมเองอาจเป็นเพราะข้อมูลที่เราต้องการใช้ไม่สามารถหาได้เลยไม่ว่าจากแหล่งใดหรือข้อมูลดังกล่าวพอหาได้แต่ไม่แน่ใจว่าจะเชื่อถือได้ อย่างไรก็ตามปัจจัยที่สำคัญในการตัดสินใจว่าจะดำเนินการเก็บรวบรวมข้อมูลด้วยตนเองหรือไม่ คือเวลาและค่าใช้จ่ายในการดำเนินงาน โดยทั่วไปการดำเนินการเก็บรวบรวมข้อมูลเป็นกระบวนการที่ต้องใช้เวลาและเสียค่าใช้จ่ายสูง นอกจากนี้มักจะต้องใช้คนดำเนินงานเป็นจำนวนมาก ดังนั้นในการเก็บรวบรวมข้อมูลที่สำคัญๆ และมีขอบเขตกว้างขวาง เช่น ข้อมูลเกี่ยวกับประชากร การเกษตร อุตสาหกรรม คมนาคม เป็นต้น หน่วยงานของรัฐบาลจึงเป็นผู้เก็บรวบรวมและพิมพ์เผยแพร่ข้อมูล

แหล่งที่มาของข้อมูล
 ดังได้กล่าวมาแล้ว ผู้ที่มีความจำเป็นต้องการใช้ข้อมูลอาจดำเนินการเก็บรวบรวมข้อมูลด้วยตนเองหรือเลือกใช้ข้อมูลที่มีผู้เก็บรวบรวมไว้แล้วก็ได้เอกชนหรือองค์การของรัฐบาลซึ่งเป็นผู้เก็บรวบข้อมูล เมื่อพิมพ์ข้อมูลเหล่านั้นขึ้นเพื่อเอาไว้ใช้เองหรือเพื่อเผยแพร่ก็ตาม จะได้รับการอ้างอิงว่าเป็นแหล่งปฐมภูมิ (Primary source) แต่ถ้าเอกชนหรือหน่วยงานใดจัดพิมพ์เอกสารโดยมีข้อมูลซึ่งได้นำมาจากเอกสารอื่นที่มีผู้รวบรวมไว้แล้วเอกสารที่จัดพิมพ์นั้นได้ชื่อว่าเป็นแหล่งทุติยภูมิ (Secondary source)ของข้อมูลดังกล่าว ตัวอย่างเช่น สำนักงานสถิติแห่งชาติได้เก็บรวบรวมข้อมูลเกี่ยวกับประชากรและเคหะใปีพ.ศ. 2523 และได้พิมพ์รายงานมีชื่อว่ารายงานสำมะโนประชากรและเคหะ พ.ศ. 2523เช่นนี้รายงานดังกล่าวได้ชื่อว่าเป็นแหล่งปฐมภูมิ ในเวลาต่อมาธนาคารแห่งหนึ่งได้นำข้อมูลแสดงจำนวนประชากรเป็นรายภาคจากรายงาน สำมะโนประชากรและเคหะ พ.ศ. 2523 ไปพิมพ์ลงในวารสารรายเดือนของธนาคาร เช่นนี้ วารสารของธนาคารได้ชื่อว่าเป็นแหล่งทุติยภูมิของข้อมูลที่นำลงพิมพ์นั้น
         อย่างไรก็ตาม แหล่งปฐมภูมิมักแสดงรายละเอียดของข้อมูลไว้มากกว่าเพราะเป็นผู้เก็บรวบรวมข้อมูลมาเอง ย่อมจะแสดงไว้ทั้งหมดทุกประเภทที่เกี่ยวกับเรื่องนั้นๆ ส่วนแหล่งทุติยภูมิมักจะแสดงรายละเอียดไว้น้อยกว่า เพราะเลือกเอาแต่ข้อมูลชนิดที่เกี่ยวข้องกับงาน หรือที่สนใจเท่านั้นไปพิมพ์ไว้

2.2.1.9 วิธีการเลือกตัวอย่าง
กลุ่มตัวอย่าง (Sample) หมายถึง ส่วนหนึ่งของประชากรที่นำมาศึกษาซึ่งเป็นตัวแทนของประชากรการที่กลุ่มตัวอย่างจะเป็นตัวแทนที่ดีของประชากรเพื่อการอ้างอิงไปยังประชากรอย่างน่าเชื่อถือได้นั้นจะต้องมีการเลือกตัวอย่างและขนาดตัวอย่างที่เหมาะสมซึ่งจะต้องอาศัยสถิติเข้ามาช่วยในการสุ่มตัวอย่างและการกำหนดขนาดของกลุ่มตัวอย่าง
 การสุ่มตัวอย่าง (Sampling) หมายถึง กระบวนการได้มาซึ่งกลุ่มตัวอย่างที่มีความเป็นตัวแทนที่ดีของประชากร

ประเภทของการสุ่มกลุ่มตัวอย่าง
            วิธีการสุ่มตัวอย่างแบ่งเป็น 2 ประเภทใหญ่ๆ คือ
1. การสุ่มตัวอย่างโดยไม่ใช้ความน่าจะเป็น ( Nonprobability sampling )เป็นการเลือกตัวอย่างโดยไม่คำนึงว่าตัวอย่างแต่ละหน่วยมีโอกาสถูกเลือกมากน้อยเท่าไรทำให้ไม่ทราบความน่าจะเป็นที่แต่ละหน่วยในประชากรจะถูกเลือก การเลือกกลุ่มตัวอย่างแบบนี้ไม่สามารถนำผลที่ได้อ้างอิงไปยังประชากรได้ แต่มีความสะดวกและประหยัดเวลาและค่าใช้จ่ายมากกว่า  ซึ่งสามารถทำได้หลายแบบ ดังนี้
1.1 การเลือกกลุ่มตัวอย่างแบบบังเอิญ (Accidental sampling) เป็นการเลือกกลุ่มตัวอย่างเพื่อให้ได้จำนวนตามต้องการโดยไม่มีหลักเกณฑ์กลุ่มตัวอย่างจะเป็นใครก็ได้ที่สามารถให้ข้อมูลได้
1.2 การเลือกกลุ่มตัวอย่างแบบโควต้า ( Quota  sampling ) เป็นการเลือกกลุ่มตัวอย่างโดยคำนึงถึงสัดส่วนองค์ประกอบของประชากรเช่นเมื่อต้องการกลุ่มตัวอย่าง 100 คน ก็แบ่งเป็นเพศชาย 50 คน หญิง 50 คนแล้วก็เลือกแบบบังเอิญ คือเจอใครก็เลือกจนครบตามจำนวนที่ต้องการ
1.3 การเลือกกลุ่มตัวอย่างแบบเจาะจง( Purposive  sampling ) เป็นการเลือกกลุ่มตัวอย่างโดยพิจารณาจากการตัดสินใจของผู้วิจัยเอง ลักษณะของกลุ่มที่เลือกเป็นไปตามวัตถุประสงค์ของการวิจัย การเลือกกลุ่มตัวอย่างแบบเจาะจงต้องอาศัยความรอบรู้ ความชำนาญและประสบการณ์ในเรื่องนั้นๆของผู้ทำวิจัยการเลือกกลุ่มตัวอย่างแบบนี้มีชื่อเรียกอีกอย่างว่า Judgment sampling
2. การสุ่มตัวอย่างโดยใช้ความน่าจะเป็น(Probability sampling)
เป็นการสุ่มตัวอย่างโดยสามารถกำหนดโอกาสที่หน่วยตัวอย่างแต่ละหน่วยถูกเลือก ทำให้ทราบความน่าจะเป็นที่แต่ละหน่วยในประชากรจะถูกเลือก การเลือกกลุ่มตัวอย่างแบบนี้สามารถนำผลที่ได้อ้างอิงไปยังประชากรได้  สามารถทำได้หลายแบบ ดังนี้
2.1 การสุ่มตัวอย่างแบบง่าย(Simple random sampling) เป็นการสุ่มตัวอย่างโดยถือว่าทุกๆหน่วยหรือทุกๆสมาชิกในประชากรมีโอกาสจะถูกเลือกเท่าๆกัน การสุ่มวิธีนี้จะต้องมีรายชื่อประชากรทั้งหมดและมีการให้เลขกำกับ วิธีการอาจใช้วิธีการจับสลากโดยทำรายชื่อประชากรทั้งหมด หรือใช้ตารางเลขสุ่มโดยมีเลขกำกับหน่วยรายชื่อทั้งหมดของประชากร
2.2 การสุ่มตัวอย่างแบบเป็นระบบ(Systematic sampling) เป็นการสุ่มตัวอย่างโดยมีรายชื่อของทุกหน่วยประชากรมาเรียงเป็นระบบตามบัญชีเรียกชื่อ การสุ่มจะแบ่งประชากรออกเป็นช่วงๆที่เท่ากันอาจใช้ช่วงจากสัดส่วนของขนาดกลุ่มตัวอย่างและประชากรแล้วสุ่มประชากรหน่วยแรก ส่วนหน่วยต่อๆไปนับจากช่วงสัดส่วนที่คำนวณไว้      
2.3 การสุ่มตัวอย่างแบบชั้นภูมิ (Stratified sampling) เป็นการสุ่มตัวอย่างโดยแยกประชากรออกเป็นกลุ่มประชากรย่อยๆ หรือแบ่งเป็นชั้นภูมิก่อน โดยหน่วยประชากรในแต่ละชั้นภูมิจะมีลักษณะเหมือนกัน (homogeneous) แล้วสุ่มอย่างง่ายเพื่อให้ได้จำนวนกลุ่มตัวอย่างตามสัดส่วนของขนาดกลุ่มตัวอย่างและกลุ่มประชากร                                                       
            2.4 การสุ่มตัวอย่างแบบกลุ่ม (Cluster sampling ) เป็นการสุ่มตัวอย่างโดยแบ่งประชากรออกตามพื้นที่โดยไม่จำเป็นต้องทำบัญชีรายชื่อของประชากร และสุ่มตัวอย่างประชากรจากพื้นที่ดังกล่าวตามจำนวนที่ต้องการ แล้วศึกษาทุกหน่วยประชากรในกลุ่มพื้นที่นั้นๆ หรือจะทำการสุ่มต่อเป็นลำดับขั้นมากกว่า 1 ระดับ โดยอาจแบ่งพื้นที่จากภาค เป็นจังหวัด จาก จังหวัดเป็นอำเภอ และเรื่อยไปจนถึงหมู่บ้าน

2.2.1.10 วิธีการเก็บรวบรวมข้อมูล       
          ในการดำเนินงานเก็บรวบรวมข้อมูล อาจแบ่งได้เป็น 2 วิธีใหญ่ๆ คือ โดยการสังเกตและโดยการสอบถาม
          1. การเก็บรวบรวมข้อมูลด้วยการสังเกต การเก็บรวบรวมข้อมูลด้วยวิธีนี้เรียกว่าเป็นการดำเนินงานข้างเดียว เช่นการนับจำนวนผู้โดยสารรถประจำทางในช่วงเวลาหนึ่งตามสถานที่ต่างๆ ของกรุงเทพมหานคร การนับจำนวนรถที่ผ่านด่านตรวจรถในช่วงเวลาต่างๆ เป็นต้น การทดลองทางวิทยาศาสตร์เพื่อทราบข้อมูลบางอย่างก็ถือว่าเป็นการเก็บรวบรวมข้อมูลด้วยการสังเกต เช่นนักวิทยาศาสตร์คิดค้นหลอดไฟฟ้าชนิดใหม่แล้วนำหลอดไฟฟ้าเหล่านี้จำนวนหนึ่ง มาทดลองเปิดให้กระแสไฟฟ้าผ่านเพื่อทราบว่าจะให้แสงสว่างนานเท่าไร อายุการใช้งานของแต่ละหลอดไฟฟ้า คือข้อมูลที่เก็บรวบรวม
2. การเก็บรวบรวมข้อมูลด้วยการสอบถาม การเก็บรวบรวมข้อมูลด้วยวิธีนี้อาจแบ่งได้เป็น 3 ข้อย่อยด้วยกัน คือ
 2.1 โดยการสัมภาษณ์เป็นส่วนตัว วิธีนี้ได้แก่การซักถามโต้ตอบสนทนากัน จะเป็นโดยการพูดจาเห็นหน้ากัน หรือพูดจากันทางโทรศัพท์ก็ได้ การเก็บรวบรวมข้อมูลโดยการสัมภาษณ์เป็นส่วนตัวนี้เป็นวิธีที่ใช้กับการเก็บรวบรวมข้อมูลที่สำคัญๆ โดยทั่วไป เช่นการทำสำมะโนประชากรและเคหะ การทำสำมะโนการเกษตร การสำรวจแรงงานการสำรวจการเปลี่ยนแปลงของประชากร เป็นต้นทั้งนี้เพราะผู้สัมภาษณ์ย่อมมีโอกาสอธิบายข้อถามให้ผู้ตอบสัมภาษณ์ได้เข้าใจแจ่มแจ้งและมีโอกาสซักถามเมื่อผู้ตอบตอบข้อความคลุมเครือ การเก็บรวบรวมข้อมูลด้วยวิธีนี้มีส่วนช่วยให้การเก็บรวบรวมข้อมูลได้ข้อจริงมาก โดยเฉพาะอย่างยิ่งจะช่วยลดข้อเท็จที่เกิดขึ้นจากการเข้าใจข้อถามผิด หรือเกิดขึ้นโดยมิได้เจตนาลงได้มาก
2.2 โดยการส่งแบบข้อถามทางไปรษณีย์วิธีนี้แม้จะมีข้อดีในแง่ที่เสียค่าใช้จ่ายในการดำเนินงานน้อยแต่ก็มีข้อเสียอยู่มากในด้านที่ผู้ตอบอาจเข้าใจคำถามไม่ถูกต้อง แล้วบันทึกข้อมูลที่ผิดวัตถุประสงค์ของข้อถามนั้น อนึ่งผู้ตอบบางคนก็ไม่สนใจกับข้อถาม ดังนั้นจึงปรากฏอยู่เสมอว่าการเก็บรวบรวมข้อมูลด้วยวิธีนี้มักได้รับแบบสอบถามกลับคืนมาไม่ครบถ้วนเป็นจำนวนมา และแบบสอบถามที่ได้รับกลับคืน บางรายการก็ไม่ได้รับการบันทึกนอกจากนั้นข้อเสียของวิธีการเก็บรวบรวมข้อมูลด้วยวิธีนี้อีกอย่างหนึ่งก็คือ ไม่สามารถใช้ได้กับชนทุกชั้นโดยเฉพาะอย่างยิ่งกับบุคคลที่อ่านเขียนไม่ได้  ดังนั้นในการเก็บรวบรวมข้อมูลด้วยการส่งแบบข้อถามทางไปรษณีย์จึงมีที่ใช้ค่อนข้างจำกัด โดยเฉพาะอย่างยิ่งในประเทศที่ด้อยหรือกำลังพัฒนา ซึ่งประชากรของประเทศที่ยังอ่านเขียนไม่ได้มีอยู่เป็นจำนวนมาก
         2.3 โดยการลงทะเบียน วิธีนี้โดยมากประชาชนเป็นผู้ให้ข้อมูลตามกฎหมายโดยการบันทึกข้อมูลลงในทะเบียน  เช่น ข้อมูลเกี่ยวกับรถยนต์ได้จากหลักฐานการจดทะเบียนที่กองทะเบียนกรมตำรวจ ข้อมูลเกี่ยวกับการเกิด การตาย การสมรส การหย่าร้างได้จากสำนักงานทะเบียนส่วนท้องถิ่น เป็นต้น

2.2.1.11 การจัดเตรียมข้อมูล
ข้อมูลที่การเก็บรวบรวมโดยวิธีหนึ่งเป็นข้อมูลซึ่งไม่มีการนำมาจัดเป็นหมวดหมู่หรือ ทำการวิเคราะห์ เรียกว่าข้อมูลดิบ (Raw Data) หรือคะแนนดิบ (Raw Score)ข้อมูลดิบเหล่านี้ถ้ามีจำนวนมากทำให้ไม่สามารถเห็นคุณลักษณะของข้อมูลได้ ดังนั้นเมื่อเก็บรวบรวมข้อมูลมาแล้วจึงต้องจัดเตรียมข้อมูลให้เป็นหมวดหมู่ ซึ่งวิธีการจัดเตรียมข้อมูลให้เป็นหมวดหมู่สามารถทำได้หลายวิธีแต่ที่นิยมใช้คือการแจกแจงความถี่ (Frequency Distribution) เป็นการเรียงลำดับข้อมุลดิบที่เก็บรวบรวมมาได้โดยจัดให้เป็นหมวดหมู่ แล้วหาจำวนของข้อมูลในแต่ละหมวดหมู่ ซึ่งจำนวนของข้อมูลในแต่ละหมวดหมู่นี้เรียกว่า ความถี่ (Frequency)

ไม่มีความคิดเห็น:

แสดงความคิดเห็น