Fecha de publicación: 2024-03-05
La diferencia entre un **modelo "instructed"** y un **modelo "no instructed"** radica en la forma en que han sido entrenados y optimizados para interactuar con los usuarios.
---
### **1. Modelo "Instructed" (Instruction-Tuned Model)**
Es un modelo que ha sido afinado con un proceso de **Instruction Tuning**, lo que significa que ha sido entrenado específicamente para responder a instrucciones dadas por los usuarios de manera más precisa y útil.
#### **Características:**
- Se entrena con conjuntos de datos donde las instrucciones (prompts) y las respuestas esperadas están claramente definidas.
- Mejora en la capacidad de entender y seguir instrucciones detalladas.
- Responde de forma más estructurada y alineada con la intención del usuario.
- Se entrena con ejemplos de **diálogo humano**, lo que lo hace más conversacional y útil para tareas específicas.
#### **Ejemplo:**
👉 **Usuario:** _Explica la diferencia entre TCP y UDP en 3 frases cortas._
👉 **Modelo "Instructed":**
1. **TCP** garantiza la entrega de los datos en orden y sin errores, pero es más lento.
2. **UDP** es más rápido, pero no garantiza la entrega ni el orden de los paquetes.
3. TCP se usa en aplicaciones críticas como navegación web, mientras que UDP es ideal para streaming.
Este modelo entiende la instrucción y estructura la respuesta en función del pedido del usuario.
---
### **2. Modelo "No Instructed" (Base Model o Pre-Trained Model)**
Es un modelo que ha sido pre-entrenado con grandes volúmenes de texto, pero sin una optimización específica para seguir instrucciones de los usuarios.
#### **Características:**
- Solo ha aprendido a **predecir la siguiente palabra** en función de patrones en los datos con los que fue entrenado.
- No ha sido afinado con ejemplos de instrucciones, por lo que puede responder de manera más genérica o menos estructurada.
- Tiende a generar respuestas que **no siempre siguen el formato** que el usuario espera.
- Puede requerir _prompt engineering_ avanzado para obtener respuestas precisas.
#### **Ejemplo:**
👉 **Usuario:** _Explica la diferencia entre TCP y UDP en 3 frases cortas._
👉 **Modelo "No Instructed":**
_"TCP es un protocolo orientado a la conexión que garantiza la entrega de paquetes. UDP, en cambio, es un protocolo sin conexión que no garantiza la entrega. TCP se usa en aplicaciones como navegación web, mientras que UDP es útil para aplicaciones como streaming de video y juegos en línea."_
Aquí el modelo responde correctamente, pero no sigue exactamente la instrucción de estructurarlo en "tres frases cortas". No está diseñado para obedecer con precisión la intención del usuario.
---
### **Resumen:**
|Característica|Modelo Instructed 🚀|Modelo No Instructed 🛠️|
|---|---|---|
|Entrenamiento|Ajustado con "instruction tuning"|Pre-entrenado en grandes volúmenes de texto|
|Capacidad de seguir instrucciones|Alta, sigue el formato del usuario|Baja, responde según patrones aprendidos|
|Estilo de respuesta|Más estructurado y útil|Más genérico y menos predecible|
|Uso principal|Asistentes conversacionales, tareas específicas|Modelos base para ajuste fino o generación de texto libre|
En términos prácticos, los modelos "instructed" son más útiles para aplicaciones interactivas como asistentes de IA, mientras que los modelos "no instructed" suelen ser utilizados como base para posteriores afinamientos (_fine-tuning_) en tareas específicas.