Problema
Los LLMs producen outputs muy distintos dependiendo de cómo se formule la instrucción. Sin una metodología sistemática de prompting, los resultados son inconsistentes, no siguen el formato esperado o pierden calidad. Diseñar prompts de forma rigurosa es una habilidad técnica, no intuitiva.
Solución
Estudio sistemático de técnicas de prompting con evaluación cuantitativa y cualitativa de outputs. Se comparan zero-shot, few-shot, chain-of-thought, role prompting y prompts con restricciones explícitas de formato, para identificar cuándo usar cada técnica.
Técnicas evaluadas
- Zero-shot: instrucción directa sin ejemplos — línea base
- Few-shot: 2–5 ejemplos de input/output en el prompt — mejora de consistencia de formato
- Chain-of-thought: instrucción para razonar paso a paso antes de dar la respuesta final
- Role prompting: asignar un rol experto al modelo para sesgar el tono y el dominio
- Structured output: instrucción de formato JSON/Markdown con schema explícito
Evaluación y conclusiones
- Rubrica de evaluación: seguimiento de instrucciones, calidad, formato y consistencia
- Casos donde chain-of-thought mejora significativamente el razonamiento matemático/lógico
- Few-shot vs. zero-shot: el punto de rendimiento decreciente de añadir más ejemplos
- Integración con API de OpenAI: temperature, max_tokens y stop sequences como palancas adicionales