ทฤษฏีข้อมูล (อังกฤษ: Data Theory) เป็นทฤษฏีที่ว่าด้วยการแทนเชิงนามธรรมของแง่มุมต่าง ๆ ของข้อมูล ซึ่งใช้แบ่งแยกสถานะการณ์ต่าง ๆ ของข้อมูลที่เป็นไปได้ออกด้วยแนวคิดจำนวนน้อย
แง่มุมหลัก ๆ สองแง่มุมของทฤษฎีข้อมูลคือ
- ทฤษฏีการออกแบบเชิงประจักษ์ หรือ เชิงประสบการณ์ (Empirical Design Theory)
- ทฤษฏีการวัดผล (Measurement Theory)
ทฤษฎีการออกแบบเชิงการทดลอง
เป็นแง่มุมของทฤษฎีที่ว่าด้วยหัวข้อต่าง ๆ เช่น
- เงื่อนไขการทดลอง คือแง่มุมต่าง ๆของสถานการณ์ในการทดลอง
- วิถี หมายถึงการออกแบบการทดลองปกติ ได้แก่จำนวนเงื่อนไขใดบ้างในการทดลองที่ต้องคำนึงถึง การออกแบบการทดลองยังรวมถึงเงื่อนไขหลาย ๆ อย่างที่ต้องคำนึงถึงพร้อม ๆ กัน
- ระดับการทดลอง คือจำนวนค่าที่ต่างกันของวิถึการออกแบบ
- การซ้ำการทดลอง คือวิธีพิเศษในการออกแบบที่ใช้โดยการทำซ้ำเดิมวิถีทางโดยการผสมการออกแบบการทดลองต่าง ๆ เข้าด้วยกัน
- ภาวะการทดลอง คือจำนวนวิถึของการออกแบบที่มีเอกลักษณ์ ซึ่งพิจารณาด้วยข้อมูลที่เกี่ยวข้องคือ
- รูปร่าง เช่น ข้อมูลอาจจะเป็นสี่เหลี่ยมด้านเท่า (สองทาง,หนึ่งภาวะ)หรือเป็นสี่เหลี่ยมด้านขนาน (สองทาง, สองภาวะ)
- สมมาตรหรือไม่สมมาตร ข้อมูลที่เป็นสี่เหลี่ยมอาจจะสมมาตรหรืไม่ก็ได้ โดยข้อมูลที่ไม่สมมาตรจะเรียกว่าข้อมูลสามเหลี่ยม
- ข้อมูลแจกแจงหลายตัวแปร ข้อมูลเหล่านี้จะเป็นสี่เหลี่ยมด้านขนาน ส่วนใหญ่มีหนึ่งภาวะ และข้อมูลมักจะอยู่เรียงตัวเป็นสดมภ์
- ความสมบูรณ์ หากไม่มีข้อมูลหาข้อมูลจะเรียกว่าข้อมูลที่สมบูรณ์
- หมวดหมู่ในการสำรวจ
- การสำรวจจะต้องจัดหมวดหมู่
- สามารถใช้ตัวแปรเสริมของข้อมูล
- หมวดหมู่ต้องชัดเจนและมีจำนวนน้อย
ทฤษฎีในการวัดผล
เป็นแง่มุมเกี่ยวกับการกำหนดค่าตัวเลขให้กับลักษณะเฉพาะของสิ่งที่สำรวจหรือเหตุการณ์ต่าง ๆ โดยกำหนดกฎเกณฑ์ที่ใช้ให้เข้าใจง่าย ใช้งานง่ายและได้ค่าตัวเลขที่เกี่ยวข้องกับชุดของการวัดผลอื่น ๆ เท่าที่เป็นไปได้
ตัวอย่างเกี่ยวกับการใช้ทฤษฎีข้อมูล
ตัวอย่างเช่นการวิเคราะห์ความแตกต่างภายในหรือระหว่างกลุ่ม หรือ ความแปรปรวนตามหัวข้อของข้อมูลที่มีการแจกแจงหลายตัวแปร (multivariate data) วิธีการเชิงสถิติดั้งเดิมในการวิเคราะห์แบบมีการแจกแจงหลายตัวแปรนั้นจะสมมติว่าหน่วยในการวิเคราะห์นั้นที่แยกเฉพาะกลุ่ม (เช่น บุคคล, เด็ก, ผู้ใหญ่ ฯลฯ)นั้นจัดอยู่ในกลุ่มประชากรแบบเอกพันธุ์ (homogeneous population)และสามารถจัดเป็นกลุ่มตัวอย่างสุ่มจากประชากรกลุ่มนี้
อย่างไรก็ตามในทางการศึกษาด้านพฤติกรรม การสำรวจมักไม่เป็นไปอย่างไม่อิสระ และกลุ่มประชากรก็ไม่เอกพันธุ์คือ มีความหลากหลาย ซึ่งบ่อยครั้งไม่สามารถระบุได้ ซึ่งในสถานะการณ์แบบนี้จำเป็นต้องใช้วิธีการเชิงทฤษฏีข้อมูลในการพัฒนาวิธีที่ไม่ขึ้นกับการปรับค่าปรกติที่มีการแจกแจงหลายตัวและตัวอย่างแบบเอกพันธุ์ และเนื่องจากว่าการสำรวจแบ่งแยกเป็นกลุ่มย่อย ความแตกต่างภายในกลุ่มและนอกกลุ่มก็จะมีค่าตรงกลางซึ่งเรียกว่าการศึกษาปฏิสัมพันธ์ระหว่างกลุ่ม
การศึกษาทฤษฏีข้อมูลมุ่งเน้นไปใช้งานเกี่ยวกับความสัมพันธ์การศึกษาเชิงพฤติกรรมเช่นเรื่อง ศึกษาศาสตร์ และจิตวิทยา หรือเน้นในการค้นพบช่วงทั้งหมดของข้อมูลการสำรวจ และทดลองทางการแพทย์ ชีววิทยา และวิทยาศาสตร์สิ่งมีชีวิต
ดูเพิ่ม