Mauricio-100
/

agent-ai

@@ -1,16 +1,18 @@
-# agent_ai.py
 import os
 from transformers import PreTrainedTokenizerFast, GPTNeoXForCausalLM, GPTNeoXConfig
 # -------------------------------
 # Paramètres du modèle (>2M)
 # -------------------------------
 model_config = {
     "vocab_size": 50257,
-    "n_embd": 512,       # embedding dimension
-    "n_layer": 12,       # nombre de couches -> augmente les paramètres
-    "n_head": 8,         # attention heads
-    "block_size": 128,   # max tokens
     "dropout": 0.1,
     "model_type": "gpt_neox"
 }
@@ -22,13 +24,11 @@ paths = {
     "model_save": "./agent_model",
     "tokenizer_save": "./agent_tokenizer"
 }
-# Crée les dossiers s'ils n'existent pas
 os.makedirs(paths["model_save"], exist_ok=True)
 os.makedirs(paths["tokenizer_save"], exist_ok=True)
 # -------------------------------
-# Tokenizer minimal compatible Xenova
 # -------------------------------
 tokenizer = PreTrainedTokenizerFast(
     tokenizer_file=None,
@@ -45,14 +45,18 @@ tokenizer.save_pretrained(paths["tokenizer_save"])
 config = GPTNeoXConfig(
     vocab_size=model_config["vocab_size"],
     hidden_size=model_config["n_embd"],
-    num_layers=model_config["n_layer"],
     num_attention_heads=model_config["n_head"],
     max_position_embeddings=model_config["block_size"],
     dropout_rate=model_config["dropout"],
 )
 model = GPTNeoXForCausalLM(config)
-model.save_pretrained(paths["model_save"])
 # -------------------------------
 # Test rapide
@@ -62,6 +66,21 @@ inputs = tokenizer(prompt, return_tensors="pt")
 output = model.generate(**inputs, max_length=50)
 print(tokenizer.decode(output[0], skip_special_tokens=True))
-print("✅ Modèle Agent-AI créé et sauvegardé dans les dossiers :")
-print(f"   Modèle : {paths['model_save']}")
-print(f"   Tokenizer : {paths['tokenizer_save']}")

+# main.py — Gopu Agent-AI pour Friendli
 import os
+import torch
 from transformers import PreTrainedTokenizerFast, GPTNeoXForCausalLM, GPTNeoXConfig
+from huggingface_hub import login, upload_folder
 # -------------------------------
 # Paramètres du modèle (>2M)
 # -------------------------------
 model_config = {
     "vocab_size": 50257,
+    "n_embd": 512,
+    "n_layer": 12,
+    "n_head": 8,
+    "block_size": 128,
     "dropout": 0.1,
     "model_type": "gpt_neox"
 }
     "model_save": "./agent_model",
     "tokenizer_save": "./agent_tokenizer"
 }
 os.makedirs(paths["model_save"], exist_ok=True)
 os.makedirs(paths["tokenizer_save"], exist_ok=True)
 # -------------------------------
+# Tokenizer minimal compatible Xenova + Friendli
 # -------------------------------
 tokenizer = PreTrainedTokenizerFast(
     tokenizer_file=None,
 config = GPTNeoXConfig(
     vocab_size=model_config["vocab_size"],
     hidden_size=model_config["n_embd"],
+    num_hidden_layers=model_config["n_layer"],
     num_attention_heads=model_config["n_head"],
     max_position_embeddings=model_config["block_size"],
     dropout_rate=model_config["dropout"],
 )
 model = GPTNeoXForCausalLM(config)
+# -------------------------------
+# Sauvegarde en safetensors (recommandé pour Friendli)
+# -------------------------------
+model.save_pretrained(paths["model_save"], safe_serialization=True)
 # -------------------------------
 # Test rapide
 output = model.generate(**inputs, max_length=50)
 print(tokenizer.decode(output[0], skip_special_tokens=True))
+# -------------------------------
+# Push vers Hugging Face Hub
+# -------------------------------
+HF_TOKEN = os.environ.get("HF_TOKEN")
+REPO_ID = "Mauricio-100/agent-ai"  # Change si tu veux publier ailleurs
+if HF_TOKEN:
+    print("🔐 Connexion à Hugging Face Hub...")
+    login(token=HF_TOKEN)
+    print("📤 Upload du modèle...")
+    upload_folder(folder_path=paths["model_save"], repo_id=REPO_ID, repo_type="model")
+    upload_folder(folder_path=paths["tokenizer_save"], repo_id=REPO_ID, repo_type="model")
+    print(f"✅ Modèle poussé sur https://huggingface.co/{REPO_ID}")
+    print("🚀 Tu peux maintenant activer Friendli Endpoints depuis l’onglet [Deploy] du modèle.")
+else:
+    print("⚠️ Aucun HF_TOKEN trouvé. Ajoute-le dans les Secrets ou les variables d’environnement.")