Tiếng Sogdia thường được xếp vào nhánh đông bắc trong ngữ chi Iran. Không còn bằng chứng trực tiếp nào về dạng cổ hơn của ngôn ngữ này (tạm gọi là "tiếng Sogdia cổ") sót lại, dù việc Sogdia được nhắc đến trong những bản khắc tiếng Ba Tư cổ cho thấy nó từng tồn tại chí ít từ thời đế quốc Achaemenid (559–323 BCE).
Như tiếng Khotan, ngữ pháp và hình thái tiếng Sogdia nói chung nguyên thủy hơn so với tiếng Ba Tư trung đại. Tiếng Yaghnob là hậu duệ của một phương ngữ tiếng Sogdia thế kỷ XVIII nói ở Osrushana, một vùng nằm phía nam Sogdia.
Văn kiện Sogdia
Những mẫu văn thư tiếng Sogdia thu nhặt ở Tân Cương, Trung Quốc khơi mào cho nghiên cứu ngôn ngữ này. Robert Gauthiot (học giả Sogdia đầu tiên) và Paul Pelliot (người mà khi đi di khảo tại Đôn Hoàng thu hồi được văn kiện tiếng Sogdia) là hai người đầu tiên đứng ra nghiên cứu. Gauthiot ra mắt nhiều bài viết nghiên cứu dựa văn kiện của Pelliot, tuy ông qua đời trong Thế chiến thứ I. Một trong những bài viết đáng chú tâm nhất của Gauthiot là một tập từ vựng tiếng Sogdia, đang trong quá trình hoàn thành khi ông mất. Émile Benveniste nối tiếp công việc này sau cái chết của Gauthiot.[4]
Nhiều mẫu văn bản Sogdia được tìm thấy ở Turfan trong những cuộc viễn chinh Turfan của người Đức. Những chuyến viễn chinh này do bảo tàng Dân tộc học Berlin sắp đặt.[4] Hầu hết là văn bản tôn giáo Mani giáo hay Kitô giáo, gồm cả bản dịch Kinh Thánh. Đa số văn bản tôn giáo như vậy có niên đại từ thế kỷ IX-X.[5]
Đôn Hoàng và Turfan là hai nơi có nhiều văn kiện Sogdia về Mani giáo, Phật giáo, Kitô hơn cả.
Chữ viết
Giống mọi ngôn ngữ Iran trung đại khác, chữ Sogdia bắt nguồn từ chữ Aram. Như trong chữ Pahlavi, chữ Sogdia kết hợp nhiều chữ tượng hình, tượng ý: nhiều từ tiếng Aram được dùng nhằm thể hiện từ gốc Iran. Chữ Sogdia là tiền thân trực tiếp của chữ Uyghur cổ mà chính nó lại là tiền thân của chữ Mông Cổ.
Như đa số hệ chữ con bắt nguồn từ chữ Sinai nguyên thủy, không có ký hiệu riêng cho nguyên âm. Ba ký hiệu phụ âm (chuyển tự là) ’ y w có thể dùng đại diện cho lần lượt ba nguyên âm dài [a: i: u:]. Có lúc chúng còn biểu thị nguyên âm ngắn (khác với việc nguyên âm ngắn luôn không được viết ra trong chữ Aram).[6] Nhằm phân biệt nguyên âm ngắn với nguyên âm dài, có thể đặt dấu aleph đằng trước để chỉ nguyên âm dài.[6]
Ngoài ra, tiếng Sogdia còn được viết bằng chữ Mani, gồm 29 ký tự.[7]
^Nordhoff, Sebastian; Hammarström, Harald; Forkel, Robert; Haspelmath, Martin biên tập (2013). “Sogdian”. Glottolog. Leipzig: Max Planck Institute for Evolutionary Anthropology.
^ abUtz, David. (1978). Survey of Buddhist Sogdian studies. Tokyo: The Reiyukai Library.