Формалниот јазик L е карактеризиран како множество од F конечен број на елементи изградени од множество на симболи A.
Математички, формалниот јазик е неподредениот пар L={A,F}.
Постојат и други алтернативни опции на начини на кои може да се гледа на формалните јазици:
Збир на зборови
Збир на реченици
Во првиот случај множеството А се нарекува азбука L, а елементите на F се нарекуваат зборови.
Во вториот случај множеството А се нарекува лексикон на вокабуларот F, додека елементите на F се нарекуваат реченици.
Математичката теорија на формалните јазици се нарекува теорија на формални јазици.
Иако вообичаено е да се слуша терминот формални јазици надвор од математиката, логиката и компјутерските науки кога се мисли на начин на изразување кое е стилизирано и прецизно во секојкдневниот говор, но смислата на формалните јазици е строго дефинирана според теоријата за формални јазици.
Како пример за формални јазици може да биде, азбука од типот на {a,b} и еден од стринговите на азбуката може да биде abbaababa.
Еден типичен јазик над таа азбука може да биде множество од стрингови кои имаат ист број на a и b.
Примери
Множество на сите зборови составени од a,b;
Множество {a^n}, каде што n е природен број и a^n е стринг за кој се мисли дека a се повторува n пати;
Конечен јазик, како на пример {{a,b}{a,aa,bba}}
Множество на синтаксички точни програми дадени во некој програмски јазик или
Множество на влезови за конкретна Турингова машина.
Формалните јазици можат да бидат специфицирани на најразлични начини како: