Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

Esta es la Iteración 4, que incorpora además Data Augmentation semi-automático con un GPT personalizado.

Descripción

Al dataset Alpaca-style se añaden 500 entradas nuevas (250 reformulaciones + 250 creativas) generadas por un GPT experto en lore de Skyrim. Esto busca balancear temas y enriquecer el modelo.

Metodología

  1. Dataset Alpaca v2 + 500 entradas de Data Augmentation (creatividad y extensión rankeadas).
  2. Framework: Unsloth con LoRA 4 bits.
  3. Entrenamiento:
    • Épocas: 10
    • Pérdida final: ~0.03

Uso

ollama serve --model javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

curl -X POST http://localhost:11434/v1/chat/completions \
     -H "Content-Type: application/json" \
     -d '{
       "model":"llama-3.1-8b-instruct-alpaca-v3",
       "messages":[{"role":"user","content":"Cuéntame una historia ficticia sobre un guerrero y un dragón en Skyrim."}]
     }'
Downloads last month
4
GGUF
Model size
8.03B params
Architecture
llama
Hardware compatibility
Log In to view the estimation

4-bit

16-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3

Quantized
(469)
this model