อย่างที่เกริ่นไปแล้วในตอนที่แล้วว่า Descriptive Statistics เป็นการนำข้อมูลที่มีอยู่มานำเสนอทั้งการนำเสนอ โดยใช้ตัวเลขหรือใช้ภาพประกอบ วันนี้เราจะมาดูตัวอย่างข้อมูลที่เป็น Descriptive Statistics กันครับ

  • Central Tendency (แนวโน้มค่ากลาง) เช่น
    • Mean = ค่าเฉลี่ย หมายถึงนำค่าของทุกจำนวนบวกกันทั้งหมดแล้วหารด้วยจำนวนข้อมูล
    • Median = ค่าที่อยู่ตำแหน่งกึ่งกลาง เมื่อนำข้อมูลมาเรียงกันจากน้อยไปมาก
    • Mode = ค่าที่เกิดขึ้นบ่อยที่สุด
    • Midrange = ค่าเฉลี่ยระหว่างค่า Max และ Min
  • Dispersion (การกระจาย) เช่น
    • Range = ค่า Max – ค่า Min
    • Variance และ Standard Deviation
    • Percentiles และ Quartiles
      • Percentile คือการเรียงข้อมูลจากน้อยไปมาก แล้วแบ่งข้อมูลออกเป็น 100 ส่วน สมมติว่าเราสอบได้คะแนน Percentile ที่ 83 หมายความว่า มีคน 83% ที่สอบได้คะแนนน้อยกว่าเรา
      • Quartile คือการเรียงข้อมูลจากน้อยไปมาก แล้วแบ่งข้อมูลออกเป็น  4 ส่วน
        • ดังนั้น Median = Percentile ที่ 50 = Median ที่ 2 (Q2)
        • หากเราต้องการวัดการกระจายของข้อมูล อีกวิธีที่ทำได้คือการนำเอา Q3-Q1 ซึ่งเรียกว่า Interquartile Range
  • Box Plot

    เป็นการนำข้อมูลของ Sample อย่างน้อย 5 อย่างมาแสดงเป็นรูปกราฟ คือ ค่า Minimum, Q1, Q2, Q3, และ Maximum โดยการวาด Box Plot นี่ยังจะช่วยให้เห็น การกระจายของข้อมูล (ยิ่งแต่ละจุดห่างกัน แสดงว่ายิ่งกระจาย) และเห็น Outlier ซึ่งเป็นข้อมูลที่หลุดไปไกลๆ (เกินขอบ fence) ได้อีกด้วย

  • Scatter Plot

    เป็นการพล็อตข้อมูลลงบนกราฟที่มี 2 ตัวแปร (นิยมวางตัวแปรที่เราควบคุมเอง ไว้บนแกน X และวางข้อมูลที่ตอบสนองไว้ทางแกน Y) แล้วดูว่ามีความสัมพันธ์กันหรือไม่ ความสัมพันธ์ที่ว่านี้ เรียกว่า Correlation

ซึ่งเรามีการวัด Correlation coefficient (r) เป็นการวัดความสัมพันธ์ในลักษณะเป็นเส้นตรง มีค่าตั้งแต่ -1 ถึง +1

    • r=0 แปลว่า 2 ตัวแปรนี้ไม่มีความสัมพันธ์กันเป็นเส้นตรง
    • r=+1 แสดงว่ามีความสัมพันธ์แปรผันกันเป็นเส้นตรง (ไปทิศทางเดียวกัน)
    • r=-1 แสดงว่ามีความสัมพันธ์แปรผกผันกันเป็นเส้นตรง (ไปทางตรงข้าม)

เมื่อเข้าใจพื้นฐานของสถิติดีแล้ว ครั้งต่อไปเราจะพูดเรื่องที่สำคัญมากอีกอันหนึ่งในคือเรื่องของ Probability (ความน่าจะเป็น) กันครับ

Tagged on: