kobart-summarization-counseling

Evaluations

Validation set

  • Rouge-L F1: 0.26156

Datasets

AI-Hub (https://www.aihub.or.kr)

Usage

  • transformers: v4.45.2
pip install torch transformers
import torch
from transformers import BartForConditionalGeneration, PreTrainedTokenizerFast

tokenizer = PreTrainedTokenizerFast.from_pretrained("shlee5784/kobart-summarization-counseling-v1")
model = BartForConditionalGeneration.from_pretrained("shlee5784/kobart-summarization-counseling-v1")

text = """
์ƒ๋‹ด์ž:๊น€โ—‹โ—‹๋‹˜, ์˜ค๋Š˜ ์ด ์ž๋ฆฌ์— ์˜ค์‹  ๊ฒƒ๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„ํžˆ ์˜๋ฏธ ์žˆ๋Š” ์‹œ์ž‘์ด์—์š”. ์ง€๊ธˆ ์–ด๋–ค ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ๊ณ„์‹ ์ง€ ์ฒœ์ฒœํžˆ ์ด์•ผ๊ธฐํ•ด ์ฃผ์…”๋„ ๊ดœ์ฐฎ์Šต๋‹ˆ๋‹ค.
๋‚ด๋‹ด์ž:๋ช‡ ๋‹ฌ ์ „๋ถ€ํ„ฐ ์•„๋ฌด๊ฒƒ๋„ ํ•˜๊ณ  ์‹ถ์ง€ ์•Š์•„์š”. ์ž ๋„ ์ž˜ ์•ˆ ์˜ค๊ณ , ํšŒ์‚ฌ ์ผ๋„ ์ง‘์ค‘์ด ์•ˆ ๋˜๋‹ค ๋ณด๋‹ˆ ์ž๊พธ ์‹ค์ˆ˜๋ฅผ ํ•ด์š”. ์‚ฌ๋žŒ์„ ๋งŒ๋‚˜๋Š” ๊ฒƒ๋„ ํ”ผํ•˜๊ฒŒ ๋˜๊ณ , ๊ทธ๋ƒฅ ์‚ฌ๋Š” ๊ฒŒ ์˜๋ฏธ ์—†๋‹ค๋Š” ์ƒ๊ฐ์ด ๊ณ„์† ๋“ค์–ด์š”.
์ƒ๋‹ด์ž:๊ทธ๋Ÿฐ ์ƒ๊ฐ์ด ๋ฐ˜๋ณต๋˜๋ฉด ๋งŽ์ด ์ง€์น˜๊ณ  ํž˜๋“œ์…จ์„ ๊ฒƒ ๊ฐ™์•„์š”. ์š”์ฆ˜์—๋„ ๊ทธ๋Ÿฐ ๋ฌด์˜๋ฏธํ•œ ๊ฐ์ •์ด ์ž์ฃผ ๋“œ์‹œ๋‚˜์š”?
๋‚ด๋‹ด์ž:๋„ค, ๊ฑฐ์˜ ๋งค์ผ ๊ทธ๋ž˜์š”. ์•„์นจ์— ๋ˆˆ๋œจ๋Š” ๊ฒƒ๋„ ๋ฒ„๊ฒ๊ณ , ๊ทธ๋ƒฅ ๋ˆ„์›Œ ์žˆ๊ณ  ์‹ถ์–ด์š”. ๊ฐ€๋”์€ ์ด๋ ‡๊ฒŒ ์‚ฌ๋Š” ๊ฒŒ ๋ฌด์Šจ ์˜๋ฏธ๊ฐ€ ์žˆ๋‚˜ ์‹ถ๊ณ , ๋ชจ๋“  ๊ฑธ ๋๋‚ด๊ณ  ์‹ถ๋‹ค๋Š” ์ƒ๊ฐ๋„ ๋“ค๊ธด ํ•ด์š”. ํ•˜์ง€๋งŒ ์‹ค์ œ๋กœ ๋ญ˜ ํ•˜์ง„ ์•Š์•˜์–ด์š”.
์ƒ๋‹ด์ž:๊ทธ๋Ÿด ๋•Œ ๋งˆ์Œ์„ ์ง„์ •์‹œํ‚ค๊ฑฐ๋‚˜ ์Šค์Šค๋กœ๋ฅผ ๋‹ฌ๋ž˜๊ธฐ ์œ„ํ•ด ํ•ด๋ณด์…จ๋˜ ๋ฐฉ๋ฒ•์ด ์žˆ์œผ์‹ค๊นŒ์š”?
๋‚ด๋‹ด์ž:์ž ์„ ์ž๋ ค๊ณ  ์• ์“ฐ๊ฑฐ๋‚˜ ์ด์–ดํฐ ๋ผ๊ณ  ์Œ์•…์„ ๋“ฃ๊ธฐ๋„ ํ•ด์š”. ์นœ๊ตฌํ•œํ…Œ ์—ฐ๋ฝํ• ๊นŒ ์ƒ๊ฐ์€ ํ•˜์ง€๋งŒ ๊ดœํžˆ ๋” ํ”ผ๊ณคํ•ด์งˆ๊นŒ ๋ด ๋ง์„ค์ด๊ฒŒ ๋ผ์š”.
์ƒ๋‹ด์ž:์ž˜ ๊ฒฌ๋””๊ณ  ๊ณ„์…จ๋„ค์š”. ์ง€๊ธˆ ๋ง์”€ํ•ด ์ฃผ์‹  ๊ฑธ ๋ณด๋ฉด ์šฐ์šธ๊ฐ์ด ๊ฝค ์˜ค๋žซ๋™์•ˆ ์ง€์†๋˜๊ณ  ์žˆ๊ณ , ์ˆ˜๋ฉด์ด๋‚˜ ์ง‘์ค‘ ๊ฐ™์€ ์ผ์ƒ ๊ธฐ๋Šฅ์—๋„ ์˜ํ–ฅ์„ ์ฃผ๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™์•„์š”. ์ž์‚ด์— ๋Œ€ํ•œ ์ƒ๊ฐ์€ ๋“œ์‹œ์ง€๋งŒ ๊ตฌ์ฒด์ ์ธ ๊ณ„ํš์€ ์—†์œผ์‹  ๊ฑฐ์ฃ ?
๋‚ด๋‹ด์ž:๋„ค. ๊ทธ๋ƒฅ ์ƒ๊ฐ๋งŒ ๋“ค์–ด์š”. ๋ถ€๋ชจ๋‹˜ํ•˜๊ณ  ๋™์ƒ์ด ์žˆ์–ด์„œ ์ž์ฃผ ๋ณด์ง„ ์•Š์ง€๋งŒ ์—ฐ๋ฝ์€ ์ฃผ๊ณ ๋ฐ›์•„์š”.
์ƒ๋‹ด์ž:์ง€๊ธˆ ์ค‘์š”ํ•œ ๊ฑด โ—‹โ—‹๋‹˜์ด ์•ˆ์ „ํ•˜๊ฒŒ ์ด ์‹œ๊ธฐ๋ฅผ ์ง€๋‚˜๊ฐ€์‹ค ์ˆ˜ ์žˆ๋„๋ก ๋„์™€๋“œ๋ฆฌ๋Š” ๊ฑฐ์˜ˆ์š”. ์˜ค๋Š˜์€ ์šฐ์„  ์œ„๊ธฐ ์ƒํ™ฉ์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์•ˆ์ „๊ณ„ํš๋ถ€ํ„ฐ ํ•จ๊ป˜ ๋งŒ๋“ค์–ด ๋ณผ๊ฒŒ์š”. ๋ฏฟ๊ณ  ์—ฐ๋ฝํ•  ์ˆ˜ ์žˆ๋Š” ์‚ฌ๋žŒ, ๋งˆ์Œ์„ ์•ˆ์ •์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•, ๊ทธ๋ฆฌ๊ณ  ๋„์›€์ด ํ•„์š”ํ•  ๋•Œ ์—ฐ๋ฝํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๊ด€ ์ •๋ณด๋„ ํ•จ๊ป˜ ์•ˆ๋‚ด๋“œ๋ฆด ๊ฑฐ์˜ˆ์š”.
๋‚ด๋‹ด์ž:์•Œ๊ฒ ์Šต๋‹ˆ๋‹ค.
์ƒ๋‹ด์ž:๊ทธ๋ฆฌ๊ณ  ๋‹ค์Œ ์ƒ๋‹ด๋ถ€ํ„ฐ๋Š” ์ƒ๊ฐ์˜ ํ๋ฆ„์„ ํ•จ๊ป˜ ์ ๊ฒ€ํ•˜๊ณ , ์กฐ๊ธˆ์”ฉ ๊ท ํ˜•์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋„๋ก ๋•๋Š” ์ธ์ง€ํ–‰๋™์น˜๋ฃŒ๋ฅผ ์‹œ์ž‘ํ•ด๋ณด๋ ค ํ•ด์š”. ๊ทธ ๊ณผ์ •์—์„œ โ—‹โ—‹๋‹˜์ด ์ž์ฃผ ๋– ์˜ฌ๋ฆฌ๋Š” ๋ถ€์ •์ ์ธ ์ƒ๊ฐ๋“ค์„ ๋‹ค๋ฃจ๊ฒŒ ๋  ๊ฑฐ์˜ˆ์š”. ๋ถ€๋‹ด์ด ํฌ์ง€ ์•Š๋„๋ก ์ฒœ์ฒœํžˆ ์ง„ํ–‰ํ•  ํ…Œ๋‹ˆ ํŽธํ•˜๊ฒŒ ์ž„ํ•ด์ฃผ์‹œ๋ฉด ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค.
๋‚ด๋‹ด์ž:ํ•ด๋ณผ๊ฒŒ์š”.
์ƒ๋‹ด์ž:์ž˜ ๋”ฐ๋ผ์™€ ์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ด์š”. ์˜ค๋Š˜ ์ด์•ผ๊ธฐํ•ด์ฃผ์‹  ๋‚ด์šฉ์€ ์•„์ฃผ ์ค‘์š”ํ•œ ์ฒซ๊ฑธ์Œ์ด์—ˆ๊ณ , ์ƒ๋‹ด์ด ๋๋‚œ ๋’ค 48์‹œ๊ฐ„ ์ด๋‚ด์— ์ „ํ™”๋กœ ์•ˆ๋ถ€๋ฅผ ํ•œ ๋ฒˆ ์—ฌ์ญค๋ณผ ์˜ˆ์ •์ด์—์š”. ํ•„์š”ํ•œ ๊ฒฝ์šฐ ์ •์‹ ๊ณผ์ ์ธ ํ‰๊ฐ€๋„ ํ•จ๊ป˜ ๊ณ ๋ คํ•ด๋ณผ ์ˆ˜ ์žˆ์–ด์š”. ๋‹ค์Œ ์ƒ๋‹ด์—์„œ ์กฐ๊ธˆ ๋” ํŽธ์•ˆํ•œ ๋งˆ์Œ์œผ๋กœ ๋ต ์ˆ˜ ์žˆ๊ธฐ๋ฅผ ๋ฐ”๋ผ์š”.
๋‚ด๋‹ด์ž:๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
"""

raw_input_ids = tokenizer.encode(text)
input_ids = [tokenizer.bos_token_id] + raw_input_ids + [tokenizer.eos_token_id]

summary_ids = model.generate(torch.tensor([input_ids]), num_beams=5, max_length=512, eos_token_id=1, no_repeat_ngram_size=3)
tokenizer.decode(summary_ids.squeeze().tolist(), skip_special_tokens=True)
output: "์ฆ์ƒ:๋‚ด๋‹ด์ž๋Š” ๋ช‡ ๋‹ฌ ์ „๋ถ€ํ„ฐ ์‹œ์ž‘๋œ ์ง€์†๋œ ์šฐ์šธ๊ฐ๊ณผ ๋ฌด๊ธฐ๋ ฅ๊ฐ์„ ํ˜ธ์†Œํ•˜๋ฉฐ, ์ผ์ƒ ๊ธฐ๋Šฅ ์ €ํ•˜์™€ ์ž์‚ด ์ƒ๊ฐ์„ ๊ฒฝํ—˜ํ•˜๊ณ  ์žˆ๋‹ค. ์ˆ˜๋ฉด์žฅ์• ์™€ ์ง‘์ค‘๋ ฅ ์ €ํ•˜, ๋Œ€์ธ๊ธฐํ”ผ๋„ ๋‚˜ํƒ€๋‚˜๊ณ  ์žˆ๋‹ค. ๋Œ€์‘:์ƒ๋‹ด์ž๋Š” ๋‚ด๋‹ด์ž์˜ ๊ฐ์ •์„ ๊ณต๊ฐํ•˜๋ฉฐ ์•ˆ์ „๊ณ„ํš์„ ์ˆ˜๋ฆฝํ•˜๊ณ , ์ธ์ง€ํ–‰๋™ ์น˜๋ฃŒ๋ฅผ ํ†ตํ•ด ์ƒ๊ฐ์˜ ํ๋ฆ„์„ ์ ๊ฒ€ํ•˜๊ณ  ๋ถ€์ •์ ์ธ ์‚ฌ๊ณ ๋ฅผ ๋‹ค๋ฃจ๋„๋ก ์ง€๋„ํ•  ์˜ˆ์ •์ด๋‹ค. ๋˜ํ•œ ์œ„๊ธฐ ์ƒํ™ฉ์—์„œ ์•ˆ์ „๊ณ„ํš ์ˆ˜๋ฆฝ๊ณผ ์‹ฌ๋ฆฌ์  ์ง€์ง€๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ๋‚ด๋‹ด์ž๊ฐ€ ํŽธ์•ˆํ•˜๊ฒŒ ์ƒ๋‹ด์— ์ž„ํ•  ์ˆ˜ ์žˆ๋„๋ก ์•ˆ๋‚ดํ•˜์˜€๋‹ค."

Input type

"""
์ƒ๋‹ด์ž:<์ƒ๋‹ด์ž ํ…์ŠคํŠธ>
๋‚ด๋‹ด์ž:<๋‚ด๋‹ด์ž ํ…์ŠคํŠธ>
์ƒ๋‹ด์ž:<์ƒ๋‹ด์ž ํ…์ŠคํŠธ>
...
"""

License

Licensed under the modified MIT License.

Downloads last month
13
Safetensors
Model size
124M params
Tensor type
F32
ยท
Inference Providers NEW
This model isn't deployed by any Inference Provider. ๐Ÿ™‹ Ask for provider support

Model tree for shlee5784/kobart-summarization-counseling-v1

Finetuned
(21)
this model