ในสาขาการเรียนรู้ของเครื่อง ค่าแทนลักษณะ หรือ ฟีเจอร์ (feature) คือค่าตัวเลขที่ได้จากการแปลงข้อมูลเพื่อใช้ในการอธิบายลักษณะที่สำคัญของข้อมูลหรือแบบจำลอง และนำมาใช้ในการประมวลผลในภายหลัง[1]
ภาพรวม
ค่าจากข้อมูลดิบอาจไม่ได้อยู่ในสภาพที่ดีในแง่การใช้งานเสมอไป อาจมีค่าบางอย่าง 2 ค่าที่มีความหมายเหมือนกันหรือซ้ำซ้อน หรือในทางกลับกัน อาจมีค่าบางอย่างค่าเดียวที่แฝงรวมลักษณะของ 2 ค่าเข้าไว้ด้วยกัน หากสามารถแปลงข้อมูลดิบให้อยู่ในรูปแบบที่เหมาะสมได้ ก็จะสามารถใช้ประโยชน์จากข้อมูลได้อย่างมีประสิทธิภาพ ค่าที่แปลงแล้วซึ่งมีรูปแบบที่ดีและเหมาะที่จะใช้ในงานต่อ ๆ ไปได้นั้นเรียกว่า ค่าแทนลักษณะ
ค่าแทนลักษณะถูกดึงมาจากข้อมูลดิบ วิธีการแยกข้อมูลอาจคิดขึ้นโดยใช้ความรู้ของผู้เชี่ยวชาญ หรือ อาจเรียนรู้จากข้อมูลโดยใช้เทคนิคการเรียนรู้ของเครื่องต่าง ๆ
ค่าแทนลักษณะมีการใช้งานในด้านต่าง ๆ ตัวอย่างเช่น ใช้สำหรับการจัดหมวดหมู่ "ภาพถ่าย → ค่าแทนลักษณะ → หมวดหมู่วัตถุ" การสร้างภาพจากข้อความ "ข้อความ → ค่าแทนลักษณะ → รูปภาพ" และการบีบอัดข้อมูลเสียง "เสียง → ค่าแทนลักษณะ → เสียง" เป็นต้น
ค่าแทนลักษณะที่ควรเป็นนั้นแตกต่างกันไปขึ้นอยู่กับการใช้งาน ตัวอย่างเช่น สำหรับค่าแทนลักษณะสำหรับการบีบอัดข้อมูลนั้นจะให้ความสำคัญกับขนาด แต่ในการใช้งานด้านอื่น ๆ นั้น ขนาดอาจมีความสำคัญต่ำ
วิธีการหาค่าแทนลักษณะ
ค่าแทนลักษณะถูกสร้างขึ้นโดยการแปลงข้อมูล เรียกว่า การสกัดค่าแทนลักษณะ (feature extraction) การค้นหากฎการเปลี่ยนแปลงด้วยตนเองโดยใช้ความรู้ของผู้เชี่ยวชาญเรียกว่า วิศวกรรมค่าแทนลักษณะ (feature engineering)[2] และการค้นหากฎการเปลี่ยนแปลงโดยใช้การเรียนรู้ของเครื่อง เรียกว่าการเรียนรู้ค่าแทนลักษณะ
การแยกเอาค่าแทนลักษณะยังอาจเรียกว่า "การฝัง" (embedding) เนื่องจากเกี่ยวข้องกับการเชื่อมโยงค่าที่สังเกตได้/ข้อมูลดิบลงในปริภูมิค่าแทนลักษณะ ใน การประมวลภาษาธรรมชาติ การสกัดเอาค่าแทนลักษณะสำหรับคำต่าง ๆ เรียกว่า การฝังคำ
การเรียนรู้ค่าแทนลักษณะ
มีหลายวิธีในการเรียนรู้ค่าแทนลักษณะ[3] ได้แก่
วิธีการเหล่านี้อาจแบ่งได้เป็น แบบเชิงเส้น/แบบไม่เชิงเส้น, แบบมีผู้สอน/แบบสอนตัวเอง/แบบไม่มีผู้สอน, ตื้น/ลึก เป็นต้น ขึ้นกับวิธีการใช้งาน
การดำเนินการเรียนรู้หาค่าแทนลักษณะก่อนที่จะนำมาใช้ในงานการเรียนรู้หลักเรียกว่า การฝึกล่วงหน้า (pretraining) เนื่องจากการฝึกล่วงหน้าสามารถแยกต่างหากออกจากงานการเรียนรู้หลักได้ การเรียนรู้ค่าแทนลักษณะจึงอาจใช้การเรียนรู้ล่วงหน้าแบบไม่มีผู้ดูแลเพื่อดำเนินการเรียนรู้แบบมีผู้สอนโดยมีฉลากกำกับในงานการเรียนหลัก นอกจากนี้ การเรียนรู้ระยะทางคือการเรียนรู้ที่ฝังข้อมูลไว้ในปริภูมิที่สามารถวัดค่าได้ จึงสามารถใช้เป็นการเรียนรู้ค่าแทนลักษณะได้[4]
กระบวนการเลือกค่าแทนลักษณะที่เหมาะแก่การใช้งานจากชุดของค่าลักษณะต่าง ๆ เรียกว่า การเลือกค่าแทนลักษณะ
อ้างอิง