Thảo nguyên Pontus
Kavkaz
Đông Á
Đông Âu
Bắc Âu
Thảo nguyên Bắc/Đông
Châu Âu
Nam Á
Thảo nguyên
Ấn Độ
Người Ấn-Arya
Người Iran
Ấn-Arya
Iran
Khác
Ngữ hệ Ấn-Âu là một ngữ hệ lớn có nguồn gốc từ Tây và Nam đại lục Á-Âu. Nó bao gồm hầu hết ngôn ngữ của châu Âu cùng với các ngôn ngữ ở sơn nguyên Iran và miền bắc tiểu lục địa Ấn Độ. Một số ngôn ngữ Ấn-Âu, chẳng hạn như tiếng Anh, tiếng Pháp, tiếng Bồ Đào Nha và tiếng Tây Ban Nha đã lan rộng nhờ làn sóng thuộc địa hóa của người châu Âu và hiện được sử dụng trên khắp thế giới. Hệ Ấn-Âu được chia thành nhiều nhánh, lớn nhất phải kể đến đó là các nhóm Ấn-Iran, German, Rôman và Balt-Slav. Các ngôn ngữ có số người nói lớn nhất là tiếng Tây Ban Nha, tiếng Anh, tiếng Hindustan (tiếng Hindi/Urdu), tiếng Bồ Đào Nha, tiếng Bengal, tiếng Marathi, tiếng Punjab và tiếng Nga (mỗi thứ tiếng có hơn 100 triệu người nói). Tiếng Đức, Pháp, Ý và Ba Tư đều có hơn 50 triệu người nói. Tổng cộng, 46% dân số thế giới (3,2 tỷ người) có tiếng mẹ đẻ là ngôn ngữ Ấn-Âu, đông đảo nhất so với bất kỳ ngữ hệ nào khác. Theo ước tính của Ethnologue, có khoảng 445 ngôn ngữ Ấn-Âu đang được sử dụng, hơn 2/3 (313) trong số đó thuộc nhánh Ấn-Iran.[2]
Tất cả các ngôn ngữ Ấn-Âu đều bắt nguồn từ một ngôn ngữ mẹ duy nhất, gọi là tiếng Ấn-Âu nguyên thủy, từng được nói ở một thời điểm nào đó thuộc thời đại đồ đá mới. Urheimat (hay còn dịch là quê nhà ngôn ngữ, tức là nơi ngữ hệ đó phát tích) chính xác của tiếng Ấn-Âu hiện vẫn đang là chủ đề của nhiều học thuyết cạnh tranh. Trong số đó thì thuyết Kurgan đang rất được đề cao, cho rằng nơi phát tích hệ Ấn-Âu tọa lạc tại vùng thảo nguyên Pontus–Caspi và gắn liền với văn hóa Yamna có niên đại khoảng 3.000 năm TCN. Trước thời điểm phát minh ra chữ viết, hệ Ấn-Âu đã lan rộng và phân tách thành các nhánh, phân bố khắp châu Âu, Tây và Nam Á. Văn liệu độc lập của ngôn ngữ Ấn-Âu manh nha xuất hiện vào thời kỳ đồ đồng dưới dạng tiếng Hy Lạp Mycenaea và các ngôn ngữ Tiểu Á như tiếng Hitti và tiếng Luwia. Tuy vậy, manh mối Ấn-Âu lâu đời nhất được phát hiện lại là một số từ và tên riêng tiếng Hitti được ghi xen kẽ trong các văn bản tiếng Akkad cổ đại tại di chỉ Kültepe của dân tộc Assyria miền đông Tiểu Á vào thế kỷ 20 TCN.[3] Mặc dù người Ấn-Âu cổ hơn không để lại bất kỳ văn liệu nào, ta vẫn có thể biết được một số khía cạnh đời sống văn minh của họ, nhờ vào sự so sánh các văn hóa hậu duệ và phục nguyên văn hóa nguyên thủy đó.[4]
Hệ Ấn-Âu có ý nghĩa rất quan trọng đối với lĩnh vực ngôn ngữ học lịch sử vì nó sở hữu lịch sử được ghi chép cổ thứ hai so với bất kỳ hệ nào được biết đến, chỉ đứng sau ngữ hệ Phi-Á với tiếng Ai Cập và các ngôn ngữ Semit còn cổ hơn rất nhiều. Phân tích mối liên hệ giữa các ngôn ngữ Ấn-Âu và phục dựng lại căn nguyên của chúng là trọng tâm cho sự phát triển phương pháp luận ngành ngôn ngữ học lịch sử, đưa lĩnh vực này thành một ngành khoa học hàn lâm thật sự vào thế kỷ XIX.
Hệ Ấn-Âu hiện không có liên hệ với bất kỳ ngữ hệ nào khác, mặc dù một số đề xuất gây tranh cãi vẫn đã được đưa ra.
Vào thế kỷ XVI, những người châu Âu đi đến tiểu lục địa Ấn Độ bắt đầu nhận ra những nét tương tự giữa các ngôn ngữ Ấn-Arya, Iran, và châu Âu. Năm 1583, nhà truyền giáo Dòng Tên người Anh Thomas Stephens tại Goa đã viết một lá thư cho người thân (không được công bố cho tới tận thế kỷ XX),[5] mà trong đó ông đề cập đến sự tương đồng giữa ngôn ngữ Ấn Độ (đặc biệt là tiếng Phạn) với tiếng Hy Lạp và tiếng Latinh.
Filippo Sassetti, một nhà buôn sinh ra tại Florence năm 1540, cũng nhận thấy điều tương tự khi đi đến Ấn Độ. Năm 1585, ông ghi nhận một số sự tương đồng từ vựng giữa tiếng Phạn và tiếng Ý (gồm devaḥ/dio "chúa", sarpaḥ/serpe "rắn", sapta/sette "bảy", aṣṭa/otto "tám", và nava/nove "chín").[5] Tuy nhiên, quan sát của Stephens và Sassetti đã không dẫn đến nghiên cứu chuyên sâu hơn nào.[5]
Năm 1647, học giả và nhà ngôn ngữ học người Hà Lan Marcus Zuerius van Boxhorn chú ý đến nét tương tự ở một số ngôn ngữ châu Á và châu Âu nhất định, và cho rằng chúng xuất phát một ngôn ngữ chung gọi là Scythia. Các ngôn ngữ trong giả thuyết của ông gồm tiếng Hà Lan, tiếng Albania, tiếng Hy Lạp, tiếng Latinh, tiếng Ba Tư, và tiếng Đức, sau đó cho thêm vào các ngôn ngữ Slav, các ngôn ngữ Celt, và các ngôn ngữ gốc Balt. Ý kiến của Van Boxhorn không phổ biến và cũng không giúp khuyến khích nghiên cứu sâu hơn.
Thomas Young lần đầu tiên sử dụng thuật ngữ Indo-European năm 1813, dựa trên phân bố địa lý của hệ này: từ Tây Âu tới Bắc Ấn Độ.[6][7] Từ đồng nghĩa Indo-Germanic (Ấn-German, Idg. hay IdG.), xuất hiện năm 1810 bằng tiếng Pháp (indo-germanique) trong nghiên cứu của Conrad Malte-Brun; thuật ngữ này hiện bị xem là lỗi thời và ít phổ biến hơn Indo-European, dù trong tiếng Đức indogermanisch vẫn là thuật ngữ chuẩn.
Ngữ hệ Ấn-Âu được chia thành 10 nhánh chính, được liệt kê dưới đây theo thứ tự bảng chữ cái:
Ngoài mười nhánh cổ điển được liệt kê ở trên, một số ngôn ngữ và nhóm ngôn ngữ Ấn-Âu đã tuyệt chủng, ít được biết đến hơn đã tồn tại hoặc được đề xuất là đã tồn tại:
Việc phân chia các ngôn ngữ Ấn-Âu thành các nhóm satem và centum được nhà ngôn ngữ học Peter von Bradke đưa ra vào năm 1890, mặc dù Karl Brugmann đã đề xuất một kiểu phân loại tương tự vào năm 1886. Ở các ngôn ngữ satem, bao gồm nhánh Balto-Slav và Ấn-Iran, cũng như (về hầu hết các khía cạnh) Albania và Armenia, các âm ngạc mềm bị ngạc cứng hóa của Proto-Ấn-Âu được phục dựng vẫn khác biệt và thường bị xát hóa, trong khi các âm ngạc mềm-môi hòa lẫn với 'các âm ngạc mềm thường'. Ở các ngôn ngữ centum, các âm ngạc mềm bị ngạc cứng hóa này hòa lẫn với các ngạc mềm thường, trong khi các âm ngạc mềm-môi vẫn khác biệt. Ví dụ như từ "một trăm" trong tiếng Avesta (satem) và tiếng Latinh (centum) — âm ngạc mềm bị ngạc cứng hóa ban đầu đã biến thành âm [s] xát ở Avesta, nhưng thành âm ngạc mềm [k] thường ở Latinh.
Đặc điểm này không phải là sự phân tách theo phả hệ, sự phân chia centum–satem thường được coi là kết quả của những thay đổi lan rộng trên các nhánh phương ngữ PIE trên một khu vực địa lý cụ thể; đường đồng ngữ centum–satem giao với một số đường đồng ngữ khác đánh dấu sự khác biệt giữa các đối tượng địa lý trong các nhánh IE sớm. Có thể là các nhánh centum trên thực tế phản ánh tình trạng ban đầu của tiếng PIE, và chỉ các nhánh satem chia sẻ một loạt các đổi mới, ảnh hưởng đến tất cả các khu vực ngoại vi của liên tục phương ngữ PIE.[23] Kortlandt đề xuất rằng tổ tiên của tiếng Balt và Slav đã bị satem hóa trước khi bị ảnh hưởng bởi tây Ấn-Âu.[24]
Tiếng Proto-Ấn-Âu (PIE) được đề xuất là tổ tiên chung được tái tạo của các ngôn ngữ Ấn-Âu, được nói bởi người Proto-Ấn-Âu (sắc tộc ngôn ngữ). Từ những năm 1960, kiến thức về tiếng Anatolia đã đủ chắc chắn để thiết lập mối quan hệ của nó với PIE. Sử dụng phương pháp nội phục dựng, một giai đoạn trước đó, gọi là Tiền Proto-Ấn-Âu, đã được đề xuất.
PIE là một ngôn ngữ biến tố, trong đó các mối quan hệ ngữ pháp giữa các từ được báo hiệu thông qua các hình vị biến tố (thường ở cuối một từ). Từ gốc của PIE là những hình vị cơ bản mang một ý nghĩa từ vựng. Các hậu tố được thêm vào để tạo thành các thân từ, và bằng cách thêm vào các phần cuối, chúng lại tạo thành các từ biến tố (danh từ hoặc động từ). Hệ thống động từ Ấn-Âu được phục dựng rất phức tạp và giống như danh từ, thể hiện tính biến âm sắc.
Về mặt lịch sử, sự đa dạng hóa ngôn ngữ mẹ thành các nhánh ngôn ngữ con chưa được chứng thực. Tuy vậy, dòng thời gian của sự tiến hóa của các ngôn ngữ con hầu như không còn gì để bàn cãi, bất kể câu hỏi về nguồn gốc Ấn-Âu.
Sử dụng phương pháp phân tích toán học vay mượn từ sinh học tiến hóa, Don Ringe và Tandy Warnow đề xuất cây tiến hóa của các nhánh Ấn-Âu sau đây:[25]
David Anthony đề xuất trình tự sau:[27]
Khi tiếng Proto-Ấn-Âu (PIE) bắt đầu phân tách thành các nhánh con, hệ thống âm thanh của nó cũng bắt đầu thay đổi theo các quy luật âm thanh khác nhau, được minh chứng trong các ngôn ngữ con sau này.
Hệ thống âm vị PIE rất phức tạp, sở hữu 15 phụ âm dừng, bao gồm sự phân biệt bất thường giữa ba âm kêu là các âm dừng vô thanh, hữu thanh và "hữu thanh bật hơi", và sự phân biệt bất thường giữa ba loại phụ âm ngạc mềm (âm loại k) là "âm vòm" ḱ ǵ ǵh, "ngạc mềm thường" k g gh và ngạc mềm-môi kʷ gʷ gʷh. (Tính chính xác của các thuật ngữ âm vòm và ngạc mềm thường còn bị tranh cãi) Tất cả các ngôn ngữ con đều tiêu giảm số lượng khác biệt giữa các âm thanh này theo những con đường khác nhau.
Ví dụ tiếng Anh thuộc ngữ tộc German, thể hiện các thay đổi ngữ âm sau đây:
Mỗi phụ âm gốc bị dịch chuyển một bước về bên phải. Ví dụ, âm dʰ gốc trở thành âm d, còn âm d gốc lại trở thành âm t và âm t gốc lại trở thành âm θ (phát âm chữ th trong từ "thin" của tiếng Anh). Đây là lí do trong tiếng Anh các chữ f, th, h và wh lại được phát âm như hiện giờ. Các ví dụ sau đây so sánh tiếng Anh với tiếng La-tinh, một ngôn ngữ không có biển chuyển gì nhiều về mặt ngữ âm:
<ref>
chang
So while linguists may debate about the ties between Albanian and older languages of the Balkans, and while most Albanians may take the genealogical connection to Illyrian as incontrovertible, the fact remains that there is simply insufficient evidence to connect Illyrian, Thracian, or Dacian with any language, including Albanian (Cho nên các nhà ngôn ngữ có thể tiếp tục tranh luận về mối liên hệ giữa tiếng Albania và các ngôn ngữ cổ hơn vùng Balka, và người dân Albania có thể cứ tiếp tục cho rằng quan hệ họ hàng của chúng là không thể chỗi cái, sự thật vẫn là ta không có đủ bằng chứng để kết nối tiếng Illyria, Thrace, hoặc Dacia với bất kì ngôn ngữ nào, kể cả tiếng Albania)