نموذج توليد الصور من النص هو نموذج للتعلم الآلي يأخذ وصفًا للغة الطبيعية وينتج صورة مطابقة لهذا الوصف.
ظهرت نماذج تحويل النص إلى صورة لأول مرة في منتصف عام 2010، تزامنًا مع بدايات ثورة الذكاء الاصطناعي. وفي عام 2022 نتيجة للتقدم في الشبكات العصبية العميقة. بدأ إنتاج أحدث نماذج تحويل النص إلى صورة، مثل DALL-E 2 من OpenAI، وGoogle Brain's Imagen ، و Stable Diffusion من StabilityAI، و Midjourney في الاقتراب من جودة الصور الفوتوغرافية الحقيقية والفن المرسوم بواسطة الإنسان.