Los prompts para imágenes de IA son instrucciones en lenguaje natural que describen la imagen que quieres generar con herramientas como Midjourney, DALL-E 3 (OpenAI) o Stable Diffusion. Un buen prompt incluye: el sujeto principal, el estilo artístico, la iluminación, la composición, el ángulo de cámara y los modificadores de calidad. La diferencia entre un prompt básico y uno avanzado puede ser la diferencia entre una imagen genérica y una imagen professional lista para usar en marketing, e-commerce o diseño.
En 2024, Midjourney generó más de 964 millones de imágenes (dato de su Discord público). Las empresas de LATAM que usan IA para generar imágenes de marketing reducen su presupuesto de stock photography en un 60-80%. La clave es aprender a comunicarle a la IA exactamente qué quieres — y eso se llama prompt engineering visual.
La estructura estándar de un prompt de imagen tiene 6 capas — no todas son obligatorias, pero cada una añade control:
[SUJETO] + [ACCIÓN/POSE] + [ENTORNO] + [ESTILO ARTÍSTICO] + [ILUMINACIÓN] + [CÁMARA/COMPOSICIÓN] + [CALIDAD] Ejemplo básico: "A woman working on laptop" Ejemplo avanzado: "A professional Latina woman in her 30s working on laptop in a modern coworking space, natural window light from the left, warm afternoon glow, candid lifestyle photography, shot with 85mm f/1.8 lens, shallow depth of field, editorial magazine style, 8K resolution, photorealistic"
photorealistic, DSLR photography, natural lighting, shot on Sony A7III, bokeh background, depth of field, editorial photography, National Geographic style
digital illustration, concept art, detailed, Artstation style, 2D character design, flat shading, vector illustration, cartoon style
3D render, Blender, Cinema 4D, octane render, subsurface scattering, photorealistic materials, studio HDRI lighting, product visualization
oil painting, watercolor, impressionist style, acrylic painting, Renaissance portrait style, Baroque chiaroscuro, Japanese ukiyo-e woodblock
Los negative prompts le dicen al modelo qué NO debe incluir. Son especialmente importantes en Stable Diffusion y Midjourney v6 para evitar artefactos comunes.
Negative prompt estándar para fotografía de personas: "blurry, deformed hands, extra fingers, bad anatomy, watermark, text, logo, low quality, pixelated, overexposed, underexposed, ugly, distorted face" Negative prompt para UI/productos: "realistic photo, 3D render, human faces, handwriting, shadows on product"
¿Quieres aprender a usar IA generativa para imágenes, texto y automatización?
En Midjourney v6, los prompts en inglés dan mejores resultados porque el modelo fue entrenado principalmente con texto en inglés. DALL-E 3 y gpt-image-1 entienden bien el español y producen resultados de calidad similar. Para máximo control y calidad, los prompts técnicos en inglés son recomendables, especialmente para modificadores de estilo y cámara.
En Argentina, México y la mayoría de países LATAM, las imágenes generadas con IA no tienen protección de derechos de autor porque requieren autoría humana. Puedes usarlas comercialmente, pero revisa los términos de cada herramienta: Midjourney en plan Basic restringe uso comercial; DALL-E 3 y gpt-image-1 permiten uso comercial completo con suscripción activa.