Qwen3-0.6B - sumarizacija

Модел за сумаризацију заснован на Qwen3 моделу - 600 милиона параметара

Summarization model based on Qwen3 model - 600 million parameters

>>> from transformers import Qwen3ForCausalLM, Qwen2TokenizerFast
>>> import torch

>>> device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
>>> model = Qwen3ForCausalLM.from_pretrained("te-sla/sum600")
>>> model.to(device)
>>> model.eval()
>>> tokenizer = Qwen2TokenizerFast.from_pretrained("te-sla/sum600", padding_side="left")
>>> eos_token = "<|endoftext|>"
>>> tokenizer.pad_token = eos_token
>>> tokenizer.pad_token_id = tokenizer.convert_tokens_to_ids(tokenizer.pad_token)
>>> tokenizer.eos_token = tokenizer.pad_token
>>> tokenizer.eos_token_id = tokenizer.pad_token_id
>>> tokenizer.padding_side = "left"

>>> text = "Trombofilija nastaje kao rezultat kompleksne interakcije između negenetičkih i genetičkih faktora rizika koji hemostaznu ravnotežu pomeraju u smeru hiperkoagulacije i dovode do pojave tromboze. Veoma značajan faktor rizika za nastanak trombofilije je deficijencija inhibitora koagulacije: antitrombina, proteina C ili proteina S. Veliki korak u razumevanju genetičke osnove i molekularne dijagnostike trombofilije napravljen je otkrićem rezistencije na aktivirani protein C i faktor V Leiden mutacije. Ubrzo je otkrivena i varijanta u 3'-nekodirajucem regionu gena za faktor II (FII G20210A), za koju je pokazano da dovodi do povišene koncentracije protrombina u plazmi. Ove dve genske varijante su najučestaliji genetički faktori rizika za nastanak trombofilije. Nedavno je opisana nova mutacija u genu za protrombin (c.1787G gt T) za koju je pokazano da dovodi do rezistencije na antitrombin, odnosno do smanjene mogućnosti inaktivacije mutiranog trombina od strane antitrombina, sto predstavlja novi mehanizam za nastanak trombofilije. U toku poslednjih decenija, opisan je veliki broj genetičkih faktora rizika za nastanak trombofilije, uključuju}i one koji dovode do: nedostatka inhibitora koagulacije, povećanog nivoa ili smanjene inaktivacije koagulacionih faktora ili defekata sistema za fibrinolizu. Međutim, većina njih nije od dijagnostičke važnosti zbog njihovog malog ili još uvek nepoznatog uticaja na etiologiju trombofilije. Primena novih tehnologija koje omogućavaju analizu velikog broja gena kod jednog pacijenta otvoriće mogućnost individualnog utvrđivanja genetičkih faktora rizika, samim tim i adekvatan terapeutski pristup."
>>> text += eos_token
>>> inputs = tokenizer(text, return_tensors="pt", padding="longest", truncation=True, max_length=1024)
>>> inputs = {k: v.to(device) for k, v in inputs.items()}
>>> prompt_length = inputs["input_ids"].shape[1]

>>> with torch.no_grad():
>>>     generated_ids = model.generate(
>>>     input_ids=inputs["input_ids"],
>>>     attention_mask=inputs["attention_mask"],
>>>     max_new_tokens=200,
>>>     no_repeat_ngram_size=3,
>>>     num_beams=6,
>>>     min_length = 50,
>>>     length_penalty = 0,
>>>     early_stopping = True,
>>>     pad_token_id = tokenizer.pad_token_id,
>>>     eos_token_id = tokenizer.pad_token_id)

>>> generated_ids = generated_ids.cpu()
>>> decoded_output = tokenizer.decode(generated_ids[0][prompt_length:], skip_special_tokens=True).strip()

>>> print(decoded_output)
>>> Nova mutacija kod gena za prodovebina omogućava rezibilnost na antidovebina, što je ključno za mehanizme nastanka trombozi.
Author
Mihailo Škorić
Computation
TESLA project


Истраживање jе спроведено уз подршку Фонда за науку Републике Србиjе, #7276, Text Embeddings – Serbian Language Applications – TESLA

This research was supported by the Science Fund of the Republic of Serbia, #7276, Text Embeddings - Serbian Language Applications - TESLA

Downloads last month
43
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for te-sla/sum600

Finetuned
Qwen/Qwen3-0.6B
Finetuned
(405)
this model

Dataset used to train te-sla/sum600