Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

Esta es la Iteración 4, que incorpora además Data Augmentation semi-automático con un GPT personalizado.

Descripción

Al dataset Alpaca-style se añaden 500 entradas nuevas (250 reformulaciones + 250 creativas) generadas por un GPT experto en lore de Skyrim. Esto busca balancear temas y enriquecer el modelo.

Metodología

Dataset Alpaca v2 + 500 entradas de Data Augmentation (creatividad y extensión rankeadas).
Framework: Unsloth con LoRA 4 bits.
Entrenamiento:
- Épocas: 10
- Pérdida final: ~0.03

Uso

ollama serve --model javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

curl -X POST http://localhost:11434/v1/chat/completions \
     -H "Content-Type: application/json" \
     -d '{
       "model":"llama-3.1-8b-instruct-alpaca-v3",
       "messages":[{"role":"user","content":"Cuéntame una historia ficticia sobre un guerrero y un dragón en Skyrim."}]
     }'

javier-lazaro
/

Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

Descripción

Metodología

Uso

Model tree for javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3