Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3
Esta es la Iteración 4, que incorpora además Data Augmentation semi-automático con un GPT personalizado.
Descripción
Al dataset Alpaca-style se añaden 500 entradas nuevas (250 reformulaciones + 250 creativas) generadas por un GPT experto en lore de Skyrim. Esto busca balancear temas y enriquecer el modelo.
Metodología
- Dataset Alpaca v2 + 500 entradas de Data Augmentation (creatividad y extensión rankeadas).
- Framework: Unsloth con LoRA 4 bits.
- Entrenamiento:
- Épocas: 10
- Pérdida final: ~0.03
Uso
ollama serve --model javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3
curl -X POST http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model":"llama-3.1-8b-instruct-alpaca-v3",
"messages":[{"role":"user","content":"Cuéntame una historia ficticia sobre un guerrero y un dragón en Skyrim."}]
}'
- Downloads last month
- 4
Hardware compatibility
Log In
to view the estimation
4-bit
16-bit
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for javier-lazaro/Skyrim-Esp-Llama-3.1-8B-Instruct-Alpaca-v3
Base model
meta-llama/Llama-3.1-8B
Finetuned
meta-llama/Llama-3.1-8B-Instruct