Восстановим константы, словарь и модели из прошлого нотубка

In [1]:
import os
import pandas as pd
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset

from src.models.models import TransformerClassifier, LSTMClassifier, CustomMambaClassifier, SimpleMambaBlock
from src.data_utils.config import DatasetConfig
from src.data_utils.dataset_params import DatasetName
from src.data_utils.dataset_generator import DatasetGenerator

MAX_SEQ_LEN = 300
EMBEDDING_DIM = 128
BATCH_SIZE = 32 
NUM_CLASSES = 2
SAVE_DIR = "../pretrained_comparison" 
DATA_DIR = "../datasets" 
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")

config = DatasetConfig(load_from_disk=True, path_to_data=DATA_DIR)
generator = DatasetGenerator(DatasetName.IMDB, config=config)

_, _, _ = generator.generate_dataset() 
vocab = generator.vocab
VOCAB_SIZE = len(vocab)
text_processor = generator.get_text_processor()

Возьмем всопомгательную функцию из пролшло нотубка

In [2]:
from sklearn.metrics import accuracy_score, precision_recall_fscore_support

def evaluate_on_test(model, test_loader, device, criterion):
 model.eval()
 total_test_loss = 0
 all_preds = []
 all_labels = []

 with torch.no_grad():
 for batch_X, batch_y in test_loader:
 batch_X, batch_y = batch_X.to(device), batch_y.to(device)
 outputs = model(batch_X)
 loss = criterion(outputs, batch_y)
 total_test_loss += loss.item()
 
 _, predicted = torch.max(outputs.data, 1)
 all_preds.extend(predicted.cpu().numpy())
 all_labels.extend(batch_y.cpu().numpy())
 
 avg_test_loss = total_test_loss / len(test_loader)
 
 accuracy = accuracy_score(all_labels, all_preds)
 precision, recall, f1, _ = precision_recall_fscore_support(all_labels, all_preds, average='binary')
 
 return {'loss': avg_test_loss, 'accuracy': accuracy, 'precision': precision, 'recall': recall, 'f1_score': f1}

Создадим генератор датасета и передадим в него уже готовый текстовый процессор, заберем датасет из другого распределения

In [3]:

def create_dataloader(X, y, batch_size, shuffle=True):
 X_tensor = torch.as_tensor(X, dtype=torch.long)
 y_tensor = torch.as_tensor(y, dtype=torch.long)
 dataset = TensorDataset(X_tensor, y_tensor)
 return DataLoader(dataset, batch_size=batch_size, shuffle=shuffle)

text_processor = generator.get_text_processor()
config_polarity = DatasetConfig(
 load_from_disk=True,
 path_to_data="../datasets",
 train_size=25000, # взяли весь датасет
 val_size=12500,
 test_size=12500,
 build_vocab=False
)
generator_polarity = DatasetGenerator(DatasetName.POLARITY, config=config_polarity)
generator_polarity.vocab = generator.vocab
generator_polarity.id2word = generator.id2word
generator_polarity.text_processor = text_processor
(X_train, y_train), (X_val, y_val), (X_test, y_test) = generator_polarity.generate_dataset()


test_loader = create_dataloader(X_test, y_test, BATCH_SIZE, shuffle=False)

Восстановим конфигурации конфигов моделей из прошлого нотубка

In [4]:
model_configs = {
 "CustomMamba": {
 "class": CustomMambaClassifier,
 "params": {'vocab_size': VOCAB_SIZE, 'd_model': EMBEDDING_DIM, 'd_state': 8, 
 'd_conv': 4, 'num_layers': 2, 'num_classes': NUM_CLASSES},
 },
 "Lib_LSTM": {
 "class": LSTMClassifier,
 "params": {'vocab_size': VOCAB_SIZE, 'embed_dim': EMBEDDING_DIM, 'hidden_dim': 128, 
 'num_layers': 2, 'num_classes': NUM_CLASSES, 'dropout': 0.5},
 },
 "Lib_Transformer": {
 "class": TransformerClassifier,
 "params": {'vocab_size': VOCAB_SIZE, 'embed_dim': EMBEDDING_DIM, 'num_heads': 4, 
 'num_layers': 2, 'num_classes': NUM_CLASSES, 'max_seq_len': MAX_SEQ_LEN},
 },
}

Теперь посмотрим на результаты

In [5]:
results = {}
for model_name, config in model_configs.items(): 
 model_path = os.path.join(SAVE_DIR, f"best_model_{model_name.lower()}.pth") 
 model = config['class'](**config['params']).to(DEVICE)

 model.load_state_dict(torch.load(model_path, map_location=DEVICE))
 criterion = nn.CrossEntropyLoss()
 test_metrics = evaluate_on_test(model, test_loader, DEVICE, criterion)
 results[model_name] = test_metrics
 
results_df = pd.DataFrame(results).T
print("\n\n--- Итоговая таблица сравнения моделей на тестовых данных ---")
print(results_df.to_string())


 output = torch._nested_tensor_from_mask(




--- Итоговая таблица сравнения моделей на тестовых данных ---
 loss accuracy precision recall f1_score
CustomMamba 0.583675 0.70344 0.653410 0.871734 0.746945
Lib_LSTM 0.675894 0.59520 0.574803 0.744423 0.648709
Lib_Transformer 0.618924 0.66432 0.612190 0.904238 0.730091


Снимали тут на "игрушечных данных". На даже на них видно, что:
 - accuracy выше всего на Mamba
 - Трансформер справился тоже неплохо
 - LSTM опять проиграл

В следующем нотбуке обучим Mamba и Transformer на всем датасете и снимем качество на втором. Та модель, которая будет лучше, "поедет в продакшн" 