Det finns ingen vedertagen terminologi för att klassificera språkfamiljer hierarkiskt, ingen motsvarighet till den biologiska systematikens hierarki, med ordningar, familjer, släkten, och arter. Nordiska språk, germanska språk och indoeuropeiska språk är alla språkfamiljer, trots att de föregående tillhör de senare. Däremot är det vanligt att rita trädliknande diagram över språks genetiska släktskap, varför språkfamiljer även kallas språkträd eller språkstam, och underfamiljer grenar av en överordnad familj.
Språkens utveckling och förgrening påminner i många avseenden om levande varelsers evolution. Redan Charles Darwin själv drog sådana paralleller[1]. Evolutionära resonemang föll sedan i visst vanrykte inom lingvistiken, men har återupplivats under senare år av flera forskare[2][3][4], och många idéer från såväl biologisk evolution som memetik är på väg att finna fruktbara tillämpningar inom den historiska lingvistiken. Analogin med biologisk evolution ska dock inte dras för långt, obesläktade språk beblandar sig med varann betydligt mer än vad obesläktade djurarter gör, så att den lingvistiska evolutionen inte blir en ren trädstruktur.
Många språkfamiljer, som indoeuropeiska eller austronesiska, är välbelagda och helt vedertagna. Men det finns också en mängd olika hypoteser om relationer på högre nivå, språkfamiljerna emellan, som kan vara mer eller mindre omstridda, där beläggen inte är så starka och entydiga att konsensus har uppstått bland historiska lingvister. Särskilt gäller detta släktskap som kan antas ligga mycket långt tillbaka i tiden, där den historiska lingvistikens komparativa metoder inte riktigt räcker till. Flertalet historiska lingvister anser att det finns en gräns för hur långt tillbaka det är möjligt att rekonstruera släktskap. Det finns dock en minoritet lingvister, till exempel Joseph Greenberg och Merritt Ruhlen, som försöker tänja metoderna till det yttersta, eller finna nya metoder, för att kartlägga djupare släktskap mellan de erkända språkfamiljerna.
Tämligen okontroversiell är den forskning som bedrivs med den historiska lingvistikens reguljära komparativa metod för att försöka knyta ihop två eller fler etablerade språkfamiljer, eller knyta isolatspråk till en språkfamilj. Ett ständigt arbete pågår med växlande framgång, och efterhand blir vissa släktband etablerade, medan andra grupperingar, som ural-altaiska språk, kan förlora acceptans.
Det mest extrema (och kontroversiella) är att försöka rekonstruera urspråketproto-värld, den gemensamma förfadern till alla dagens mänskliga språk. Monogenesteorin, tanken att alla språk faktiskt har ett gemensamt ursprung, är närmast självklar utifrån vad vi vet om människans och språkets ursprung, men detta urspråk torde ligga tiotusentals eller hundratusentals år tillbaka i tiden. Det är enligt de flesta lingvister tveksamt om det är meningsfullt att ens försöka finna spår av ett sådant språk. Trots detta gör en handfull forskare med Merritt Ruhlen i spetsen anspråk på att ha rekonstruerat några ord ur proto-värld[5].