อักษรไทย เป็นอักษรที่ใช้เขียนภาษาไทยและภาษาของกลุ่มชาติพันธุ์ต่างๆ เช่น คำเมือง, อีสาน, ภาษาไทยใต้, มลายูปัตตานี เป็นต้น ในประเทศไทย มีพยัญชนะ 44 รูป สระ 21 รูป วรรณยุกต์ 4 รูป และเครื่องหมายอื่น ๆ อีกจำนวนหนึ่ง พยัญชนะไทยจะเรียงตัวไปตามแนวนอน จากซ้ายไปขวา ส่วนสระจะอยู่หน้า บน ล่าง และหลังพยัญชนะประกอบคำแล้วแต่ชนิดของสระ
อักษรไทยไม่มีการแยกอักษรตัวใหญ่หรืออักษรตัวเล็กอย่างอักษรโรมัน และไม่มีการเว้นวรรคระหว่างคำ เมื่อจบหนึ่งประโยคจะลงท้ายด้วยการเว้นวรรค กับมีเครื่องหมายวรรคตอนจำนวนหนึ่ง
ภาษาไทยมีเลขไทยเป็นของตัวเอง แต่นิยมใช้ตัวเลขอาหรับเป็นส่วนใหญ่ในชีวิตประจำวัน
ประวัติและวิวัฒนาการ
ราว พ.ศ. 400 ไทยได้อพยพจากถิ่นเดิมมาตั้งภูมิลำเนาอยู่ใกล้อาณาเขตมอญ ซึ่งกำลังเป็นชาติที่เจริญรุ่งเรืองในสมัยนั้น เริ่มแรกคงเริ่มเลียนแบบตัวอักษรมาจากมอญ ต่อมาราว พ.ศ. 1500 เมื่อขอมขยายอำนาจเข้ามาในดินแดนของคนไทยซึ่งตั้งอยู่บริเวณริมแม่น้ำยม และได้ปกครองเมืองเชลียงและเมืองสุโขทัย ไทยก็เริ่มดัดแปลงอักษรที่มีอยู่เดิมให้คล้ายกับอักษรขอมหวัด
อักษรมอญและอักษรขอมที่ไทยนำมาดัดแปลงใช้นั้นล้วนเป็นอักษรที่รับและแปลงรูปมาจากอักษรพราหมี ของพวกพราหมณ์ซึ่งแพร่หลายในอินเดียตอนเหนือ และอักษรสันสกฤตในสมัยราชวงศ์ปัลลวะ ซึ่งแพร่หลายบริเวณอินเดียตอนใต้ อักษรอินเดียทั้งคู่นี้ต่างก็รับแบบมาจากอักษรฟินิเชียนอีกชั้นหนึ่ง อักษรเฟนีเซียนับได้ว่าเป็นอักษรที่เก่าแก่ที่สุด และเป็นแม่แบบตัวอักษรของชาติต่างๆ ทั้งในเอเชียและยุโรป
ราว พ.ศ. 1826 พ่อขุนรามคำแหงทรงประดิษฐ์อักษรไทยที่เรียกกันว่า "ลายสือไทย" ขึ้น[ใคร?] ซึ่งได้เค้ารูปมาจากอักษรมอญและอักษรขอมที่มีอยู่เดิม ทำให้อักษรไทยมีลักษณะคล้ายคลึงกับอักษรทั้งสอง แม้บางตัวจะไม่คล้ายกัน แต่ก็สามารถรู้ได้ว่าดัดแปลงมาจากอักษรตัวไหน
อักษรไทยมีการปรับปรุงอยู่เรื่อยๆ ในสมัยพญาฦๅไทราว พ.ศ. 1900 มีการแก้ไขตัวอักษรให้ผิดเพี้ยนไปบ้างเล็กน้อย โดยเฉพาะการเพิ่มเชิงที่ตัว ญ ซึ่งใช้ติดต่อเรื่อยมาจนทุกวันนี้ คาดว่าน่าจะเอาอย่างมาจากเขมร ในสมัยสมเด็จพระนารายณ์มหาราช ราว พ.ศ. 2223 ตัวอักษรเริ่มมีทรวดทรงดีขึ้นแต่ก็ไม่ทิ้งเค้าเดิม มีบางตัวเท่านั้นที่แก้ไขผิดไปจากเดิม คือตัว ฎ และ ธ ซึ่งเหมือนกับที่ใช้อยู่ในปัจจุบัน นักวิชาการจำนวนหนึ่งเชื่อว่าในสมัยสมเด็จพระนารายณ์มหาราช ตัวอักษรและการใช้งานมีความคล้ายคลึงกับในปัจจุบันมากที่สุด
อักษรไทย
พยัญชนะ
พยัญชนะไทยมี 44 รูป แต่ละตัวมีชื่อเรียกโดยเฉพาะ สามารถแบ่งตามฐานที่ใช้ในการออกเสียงเป็นวรรค เสียงอ่านที่กำกับไว้คือเสียงเมื่อเป็นพยัญชนะต้น
วรรค |
ฐานกรณ์ |
กักสิถิล |
กักธนิตหรือเสียดแทรก |
นาสิก
|
วรรค กะ |
เพดานอ่อน
|
ก ไก่ [k~g]
|
ข ไข่ [kʰ~x]
|
ฃ ขวด¹ [kʰ~x]
|
ค ควาย [kʰ~x]
|
ฅ คน¹ [kʰ~x]
|
ฆ ระฆัง [kʰ~x]
|
ง งู [ŋ]
|
วรรค จะ |
เพดานแข็ง
|
จ จาน [t͡ɕ]
|
ฉ ฉิ่ง [t͡ɕʰ]
|
ช ช้าง [t͡ɕʰ]
|
ซ โซ่ [s~z~ɕ]
|
ฌ เฌอ [t͡ɕʰ]
|
ญ หญิง [ɲ]²
|
วรรค ฏะ |
ปุ่มเหงือก
|
ฎ ชฎา [d̪]
|
ฏ ปฏัก [t̪]
|
ฐ ฐาน [tʰ]
|
ฑ มณโฑ [tʰ]/[d̪]
|
ฒ ผู้เฒ่า [tʰ] |
ณ เณร [n]
|
วรรค ตะ
|
ด เด็ก [d̪] |
ต เต่า [t̪]
|
ถ ถุง [tʰ]
|
ท ทหาร [tʰ]
|
ธ ธง [tʰ] |
น หนู [n]
|
วรรค ปะ |
ริมฝีปาก
|
บ ใบไม้ [b] |
ป ปลา [p]
|
ผ ผึ้ง [pʰ] |
ฝ ฝา [f]
|
พ พาน [pʰ] |
ฟ ฟัน [f]
|
ภ สำเภา [pʰ] |
ม ม้า [m]
|
ไตรยางศ์ |
กลาง |
สูง |
ต่ำ
|
- ฃ และ ฅ เป็นอักษรที่ในปัจจุบันเลิกใช้แล้ว
- ในปัจจุบันเสียงนี้ถูกแทนที่ด้วย /j/ ในภาษาไทยกลาง แต่ยังคงพบได้ในภาษาไทยถิ่นอื่นๆ เช่น ภาษาไทยอีสาน เป็นต้น
- อ ถือว่าเป็นเสียงว่างให้รูปสระมาเกาะได้
พยัญชนะไทยยังแบ่งออกเป็น 3 หมู่ เรียกว่า ไตรยางศ์ ประกอบด้วย
- อักษรสูง 11 ตัว ได้แก่ ข ฃ ฉ ฐ ถ ผ ฝ ศ ษ ส ห
- อักษรกลาง 9 ตัว ได้แก่ ก จ ฎ ฏ ด ต บ ป อ
- อักษรต่ำ 24 ตัว ได้แก่ ค ฅ ฆ ง ช ซ ฌ ญ ฑ ฒ ณ ท ธ น พ ฟ ภ ม ย ร ล ว ฬ ฮ
ความถี่ของพยัญชนะไทย พยัญชนะไทยที่ใช้บ่อยที่สุดคือ น และที่ใช้น้อยที่สุดคือ ฅ ความถี่ที่แสดงในตารางอาจแตกต่างกันในทางปฏิบัติตามประเภทของข้อความ
(ผู้อ่านสามารถทดลองเปิดหน้าข่าว หรือเปิดหนังสือ ebook สักเล่มแล้วลอง ค้นหา(search) อักษรโดดๆ เช่น ก ข ค ... จะพบว่าพยัญชนะไทยที่ใช้มากที่สุดในเอกสารนั้นคือ น (นอ หนู) หรืออาจจะเป็นตัวพยัญชนะ ร อ บ้างในบางเอกสารเท่านั้น)
ยูนิโคด |
ชื่อตัวอักษร |
พยัญชนะไทย |
ความถี่ TNC v.1 |
ความถี่ LEXiTRON Data 2.0 |
ความถี่ พจนานุกรมราชบัณฑิตฯ 2554
|
0E19
|
NO NU |
น |
9.68% |
8.61% |
8.29%
|
0E23
|
RO RUA |
ร |
7.47% |
9.17% |
9.04%
|
0E2D
|
O ANG |
อ |
7.44% |
6.61% |
6.42%
|
0E01
|
KO KAI |
ก |
7.35% |
7.54% |
7.79%
|
0E07
|
NGO NGU |
ง |
6.90% |
6.26% |
5.66%
|
0E21
|
MO MA |
ม |
6.24% |
5.77% |
5.78%
|
0E22
|
YO YAK |
ย |
4.90% |
4.90% |
5.18%
|
0E27
|
WO WAEN |
ว |
4.80% |
4.71% |
4.56%
|
0E25
|
LO LING |
ล |
3.97% |
4.26% |
4.85%
|
0E14
|
DO DEK |
ด |
3.96% |
3.89% |
3.60%
|
0E17
|
THO THAHAN |
ท |
3.75% |
2.89% |
2.73%
|
0E2B
|
HO HIP |
ห |
3.59% |
3.26% |
3.67%
|
0E15
|
TO TAO |
ต |
3.31% |
3.81% |
3.93%
|
0E04
|
KHO KHWAI |
ค |
3.09% |
3.35% |
2.47%
|
0E2A
|
SO SUA |
ส |
3.07% |
3.84% |
4.13%
|
0E1B
|
PO PLA |
ป |
2.90% |
2.60% |
2.76%
|
0E1A
|
BO BAIMAI |
บ |
2.88% |
3.06% |
3.06%
|
0E08
|
CHO CHAN |
จ |
2.69% |
2.05% |
1.98%
|
0E02
|
KHO KHAI |
ข |
2.13% |
1.78% |
1.88%
|
0E1E
|
PHO PHAN |
พ |
1.95% |
2.27% |
2.43%
|
0E0A
|
CHO CHANG |
ช |
1.56% |
1.73% |
1.75%
|
0E1C
|
PHO PHUNG |
ผ |
0.86% |
0.87% |
0.72%
|
0E16
|
THO THUNG |
ถ |
0.79% |
0.79% |
0.73%
|
0E13
|
NO NEN |
ณ |
0.64% |
0.65% |
0.80%
|
0E28
|
SO SALA |
ศ |
0.60% |
0.89% |
0.90%
|
0E18
|
THO THONG |
ธ |
0.56% |
0.63% |
0.78%
|
0E29
|
SO RUSI |
ษ |
0.47% |
0.56% |
0.60%
|
0E0D
|
YO YING |
ญ |
0.46% |
0.57% |
0.57%
|
0E20
|
PHO SAMPHAO |
ภ |
0.44% |
0.61% |
0.70%
|
0E0B
|
SO SO |
ซ |
0.42% |
0.45% |
0.43%
|
0E09
|
CHO CHING |
ฉ |
0.25% |
0.29% |
0.36%
|
0E10
|
THO THAN |
ฐ |
0.20% |
0.15% |
0.20%
|
0E1F
|
FO FAN |
ฟ |
0.18% |
0.44% |
0.33%
|
0E1D
|
FO FA |
ฝ |
0.13% |
0.24% |
0.20%
|
0E0F
|
TO PATAK |
ฏ |
0.08% |
0.08% |
0.14%
|
0E0E
|
DO CHADA |
ฎ |
0.08% |
0.08% |
0.08%
|
0E12
|
THO PHUTHAO |
ฒ |
0.07% |
0.04% |
0.04%
|
0E2E
|
HO NOKHUK |
ฮ |
0.06% |
0.10% |
0.12%
|
0E11
|
THO NANGMONTHO |
ฑ |
0.03% |
0.11% |
0.14%
|
0E06
|
KHO RAKHANG |
ฆ |
0.03% |
0.07% |
0.12%
|
0E2C
|
LO CHULA |
ฬ |
0.02% |
0.03% |
0.07%
|
0E0C
|
CHO CHOE |
ฌ |
0.003% |
0.01% |
0.03%
|
0E03
|
KHO KHUAT |
ฃ |
0.001% |
0% |
0%
|
0E05
|
KHO KHON |
ฅ |
0.0003% |
0% |
0%
|
1นับความถี่จาก Thai National Corpus (1st version on CQPweb) จำนวน 34,782,267 โทเค็น
2นับความถี่ จากฐานข้อมูล LEXiTRON Data 2.0 จำนวนคำศัพท์ในพจนานุกรม 32,365 คำ เก็บถาวร 2017-09-27 ที่ เวย์แบ็กแมชชีน
3นับความถี่จากฐานข้อมูล พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๕๔ จำนวนคำศัพท์ในพจนานุกรม 39,191 คำ (db.version 2018.07.24)
สระ
สระในภาษาไทยมี 21 รูป ซึ่งรูปสระเหล่านี้จะนำไปประกอบเป็นรูปสระที่ใช้จริงอีกต่อหนึ่ง (ดูที่ ภาษาไทย)
วรรณยุกต์
วรรณยุกต์ในภาษาไทยมี 4 รูป 5 เสียง
เสียงวรรณยุกต์ไทยตามหลักภาษาศาสตร์ แบ่งได้ดังนี้
- เสียงสามัญ (ระดับเสียงกึ่งสูง-กลาง)
- เสียงเอก (ระดับเสียงกึ่งต่ำ-ต่ำ)
- เสียงโท (ระดับเสียงสูง-ต่ำ)
- เสียงตรี (ระดับเสียงกึ่งสูง-สูง)
- เสียงจัตวา (ระดับเสียงต่ำ-กึ่งสูง)
รูปวรรณยุกต์
เครื่องหมายวรรณยุกต์ในภาษาไทย มี 4 รูป ดังนี้
ไม้เอก (-่) ไม้โท (-้) ไม้ตรี (-๊) และ ไม้จัตวา (-๋)
อย่างไรก็ตาม ในจารึกสมัยโบราณ เช่น ศิลาจารึกพ่อขุนรามคำแหง มีเครื่องหมายวรรณยุกต์เพียง 2 รูป คือ ไม้เอก (-่) และไม้โท (-๋)[ต้องการอ้างอิง] เช่น น๋อง (น้อง), ห๋า (ห้า)
การผันเสียงวรรณยุกต์
โดยทั่วไปเสียงพยางค์หนึ่งในภาษาไทย สามารถผันได้ ๕ เสียงวรรณยุกต์ แต่ในภาษาเขียน จะมีกฎเกณฑ์การผันที่ตายตัว ดังนี้
หมู่อักษร-คำเป็นคำตาย |
เสียงสามัญ |
เสียงเอก |
เสียงโท |
เสียงตรี |
เสียงจัตวา
|
อักษรกลาง คำเป็น |
กา |
ก่า |
ก้า |
ก๊า |
ก๋า
|
อักษรกลาง คำตาย สระสั้น |
- |
กะ |
ก้ะ |
ก๊ะ |
ก๋ะ
|
อักษรกลาง คำตาย สระยาว |
- |
กาบ |
ก้าบ |
ก๊าบ |
ก๋าบ
|
อักษรสูง คำเป็น |
- |
ข่า |
ข้า |
- |
ขา
|
อักษรสูง คำตาย สระสั้น |
- |
ขะ |
ข้ะ |
- |
-
|
อักษรสูง คำตาย สระยาว |
- |
ขาบ |
ข้าบ |
- |
-
|
อักษรต่ำ คำเป็น |
คา |
- |
ค่า |
ค้า |
-
|
อักษรต่ำ คำตาย สระสั้น |
- |
- |
ค่ะ |
คะ |
ค๋ะ
|
อักษรต่ำ คำตาย สระยาว |
- |
- |
คาบ |
ค้าบ |
ค๋าบ
|
คำตายของอักษรกลางและอักษรสูง ไม่ว่าสระจะเป็นเสียงสั้นหรือเสียงยาวก็ผันวรรณยุกต์ตามรูปแบบเดียวกัน เว้นแต่คำตายของอักษรต่ำ เมื่อเป็นสระเสียงสั้นหรือเสียงยาวจะผันคนละแบบ
อักษรต่ำและอักษรสูงไม่สามารถผันให้ครบ ๕ เสียงได้ จึงมักจะใช้อักษรเสียงเดียวกันจากอีกหมู่หนึ่งมาใช้เป็นอักษรนำ โดยมีอักษรสูงนำ (ยกเว้นอักษร อ ซึ่งเป็นอักษรกลาง สามารถนำ อักษร ย ได้) เช่น นา หน่า น่า น้า หนา, มี หมี่ มี่ มี้ หมี
ตัวเลข
ตัวเลขที่เป็นอักษรไทย เรียกว่าเลขไทย มีลักษณะดังนี้
- ๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙
วิธีการบอกจำนวนใช้ระบบประจำหลักเหมือนกับตระกูลตัวเลขอาหรับอื่น ๆ
เครื่องหมายวรรคตอน
รหัสยูนิโคดสำหรับอักษรไทย
ช่วงรหัสยูนิโคด (Unicode) ของอักษรไทย คือ U+0E00 ถึง U+0E7F
ดูเพิ่ม
แหล่งข้อมูลอื่น