Mauricio-100
/

agent-ai

Token Classification

text-generation

text-generation-inference

Model card Files Files and versions

agent-ai / main.py

Mauricio-100's picture

Rename agent_ai.py to main.py

6280afa verified 10 days ago

history blame contribute delete

2.79 kB

	# main.py — Gopu Agent-AI pour Friendli
	import os
	import torch
	from transformers import PreTrainedTokenizerFast, GPTNeoXForCausalLM, GPTNeoXConfig
	from huggingface_hub import login, upload_folder

	# -------------------------------
	# Paramètres du modèle (>2M)
	# -------------------------------
	model_config = {
	"vocab_size": 50257,
	"n_embd": 512,
	"n_layer": 12,
	"n_head": 8,
	"block_size": 128,
	"dropout": 0.1,
	"model_type": "gpt_neox"
	}

	# -------------------------------
	# Chemins de sauvegarde
	# -------------------------------
	paths = {
	"model_save": "./agent_model",
	"tokenizer_save": "./agent_tokenizer"
	}
	os.makedirs(paths["model_save"], exist_ok=True)
	os.makedirs(paths["tokenizer_save"], exist_ok=True)

	# -------------------------------
	# Tokenizer minimal compatible Xenova + Friendli
	# -------------------------------
	tokenizer = PreTrainedTokenizerFast(
	tokenizer_file=None,
	bos_token="<s>",
	eos_token="</s>",
	unk_token="<unk>",
	pad_token="<pad>"
	)
	tokenizer.save_pretrained(paths["tokenizer_save"])

	# -------------------------------
	# Création du modèle
	# -------------------------------
	config = GPTNeoXConfig(
	vocab_size=model_config["vocab_size"],
	hidden_size=model_config["n_embd"],
	num_hidden_layers=model_config["n_layer"],
	num_attention_heads=model_config["n_head"],
	max_position_embeddings=model_config["block_size"],
	dropout_rate=model_config["dropout"],
	)

	model = GPTNeoXForCausalLM(config)

	# -------------------------------
	# Sauvegarde en safetensors (recommandé pour Friendli)
	# -------------------------------
	model.save_pretrained(paths["model_save"], safe_serialization=True)

	# -------------------------------
	# Test rapide
	# -------------------------------
	prompt = "Bonjour Agent-AI, que peux-tu faire ?"
	inputs = tokenizer(prompt, return_tensors="pt")
	output = model.generate(**inputs, max_length=50)
	print(tokenizer.decode(output[0], skip_special_tokens=True))

	# -------------------------------
	# Push vers Hugging Face Hub
	# -------------------------------
	HF_TOKEN = os.environ.get("HF_TOKEN")
	REPO_ID = "Mauricio-100/agent-ai" # Change si tu veux publier ailleurs

	if HF_TOKEN:
	print("🔐 Connexion à Hugging Face Hub...")
	login(token=HF_TOKEN)

	print("📤 Upload du modèle...")
	upload_folder(folder_path=paths["model_save"], repo_id=REPO_ID, repo_type="model")
	upload_folder(folder_path=paths["tokenizer_save"], repo_id=REPO_ID, repo_type="model")
	print(f"✅ Modèle poussé sur https://huggingface.co/{REPO_ID}")
	print("🚀 Tu peux maintenant activer Friendli Endpoints depuis l’onglet [Deploy] du modèle.")
	else:
	print("⚠️ Aucun HF_TOKEN trouvé. Ajoute-le dans les Secrets ou les variables d’environnement.")