kobart-summarization-counseling
- ์ด ๋ชจ๋ธ์ kobart-base-v2์ fine-tuned ๋ชจ๋ธ๋ก, ์ฌ๋ฆฌ์๋ด ๋ฐ์ดํฐ, ๋ณต์ง ๋ถ์ผ ์ฝ์ผํฐ ์๋ด๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ๋ฆฌ ์๋ด ๋ํ๋ฌธ ์์ฝ ์์ ์ ๋ํด ํ์ตํ ๋ชจ๋ธ์ ๋๋ค.
Evaluations
Validation set
- Rouge-L F1: 0.26156
Datasets
AI-Hub (https://www.aihub.or.kr)
Usage
- transformers: v4.45.2
pip install torch transformers
import torch
from transformers import BartForConditionalGeneration, PreTrainedTokenizerFast
tokenizer = PreTrainedTokenizerFast.from_pretrained("shlee5784/kobart-summarization-counseling-v1")
model = BartForConditionalGeneration.from_pretrained("shlee5784/kobart-summarization-counseling-v1")
text = """
์๋ด์:๊นโโ๋, ์ค๋ ์ด ์๋ฆฌ์ ์ค์ ๊ฒ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ์๋ฏธ ์๋ ์์์ด์์. ์ง๊ธ ์ด๋ค ์ด๋ ค์์ ๊ฒช๊ณ ๊ณ์ ์ง ์ฒ์ฒํ ์ด์ผ๊ธฐํด ์ฃผ์
๋ ๊ด์ฐฎ์ต๋๋ค.
๋ด๋ด์:๋ช ๋ฌ ์ ๋ถํฐ ์๋ฌด๊ฒ๋ ํ๊ณ ์ถ์ง ์์์. ์ ๋ ์ ์ ์ค๊ณ , ํ์ฌ ์ผ๋ ์ง์ค์ด ์ ๋๋ค ๋ณด๋ ์๊พธ ์ค์๋ฅผ ํด์. ์ฌ๋์ ๋ง๋๋ ๊ฒ๋ ํผํ๊ฒ ๋๊ณ , ๊ทธ๋ฅ ์ฌ๋ ๊ฒ ์๋ฏธ ์๋ค๋ ์๊ฐ์ด ๊ณ์ ๋ค์ด์.
์๋ด์:๊ทธ๋ฐ ์๊ฐ์ด ๋ฐ๋ณต๋๋ฉด ๋ง์ด ์ง์น๊ณ ํ๋์
จ์ ๊ฒ ๊ฐ์์. ์์ฆ์๋ ๊ทธ๋ฐ ๋ฌด์๋ฏธํ ๊ฐ์ ์ด ์์ฃผ ๋์๋์?
๋ด๋ด์:๋ค, ๊ฑฐ์ ๋งค์ผ ๊ทธ๋์. ์์นจ์ ๋๋จ๋ ๊ฒ๋ ๋ฒ๊ฒ๊ณ , ๊ทธ๋ฅ ๋์ ์๊ณ ์ถ์ด์. ๊ฐ๋์ ์ด๋ ๊ฒ ์ฌ๋ ๊ฒ ๋ฌด์จ ์๋ฏธ๊ฐ ์๋ ์ถ๊ณ , ๋ชจ๋ ๊ฑธ ๋๋ด๊ณ ์ถ๋ค๋ ์๊ฐ๋ ๋ค๊ธด ํด์. ํ์ง๋ง ์ค์ ๋ก ๋ญ ํ์ง ์์์ด์.
์๋ด์:๊ทธ๋ด ๋ ๋ง์์ ์ง์ ์ํค๊ฑฐ๋ ์ค์ค๋ก๋ฅผ ๋ฌ๋๊ธฐ ์ํด ํด๋ณด์
จ๋ ๋ฐฉ๋ฒ์ด ์์ผ์ค๊น์?
๋ด๋ด์:์ ์ ์๋ ค๊ณ ์ ์ฐ๊ฑฐ๋ ์ด์ดํฐ ๋ผ๊ณ ์์
์ ๋ฃ๊ธฐ๋ ํด์. ์น๊ตฌํํ
์ฐ๋ฝํ ๊น ์๊ฐ์ ํ์ง๋ง ๊ดํ ๋ ํผ๊ณคํด์ง๊น ๋ด ๋ง์ค์ด๊ฒ ๋ผ์.
์๋ด์:์ ๊ฒฌ๋๊ณ ๊ณ์
จ๋ค์. ์ง๊ธ ๋ง์ํด ์ฃผ์ ๊ฑธ ๋ณด๋ฉด ์ฐ์ธ๊ฐ์ด ๊ฝค ์ค๋ซ๋์ ์ง์๋๊ณ ์๊ณ , ์๋ฉด์ด๋ ์ง์ค ๊ฐ์ ์ผ์ ๊ธฐ๋ฅ์๋ ์ํฅ์ ์ฃผ๊ณ ์๋ ๊ฒ ๊ฐ์์. ์์ด์ ๋ํ ์๊ฐ์ ๋์์ง๋ง ๊ตฌ์ฒด์ ์ธ ๊ณํ์ ์์ผ์ ๊ฑฐ์ฃ ?
๋ด๋ด์:๋ค. ๊ทธ๋ฅ ์๊ฐ๋ง ๋ค์ด์. ๋ถ๋ชจ๋ํ๊ณ ๋์์ด ์์ด์ ์์ฃผ ๋ณด์ง ์์ง๋ง ์ฐ๋ฝ์ ์ฃผ๊ณ ๋ฐ์์.
์๋ด์:์ง๊ธ ์ค์ํ ๊ฑด โโ๋์ด ์์ ํ๊ฒ ์ด ์๊ธฐ๋ฅผ ์ง๋๊ฐ์ค ์ ์๋๋ก ๋์๋๋ฆฌ๋ ๊ฑฐ์์. ์ค๋์ ์ฐ์ ์๊ธฐ ์ํฉ์์ ์ฌ์ฉํ ์ ์๋ ์์ ๊ณํ๋ถํฐ ํจ๊ป ๋ง๋ค์ด ๋ณผ๊ฒ์. ๋ฏฟ๊ณ ์ฐ๋ฝํ ์ ์๋ ์ฌ๋, ๋ง์์ ์์ ์ํฌ ์ ์๋ ๋ฐฉ๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋์์ด ํ์ํ ๋ ์ฐ๋ฝํ ์ ์๋ ๊ธฐ๊ด ์ ๋ณด๋ ํจ๊ป ์๋ด๋๋ฆด ๊ฑฐ์์.
๋ด๋ด์:์๊ฒ ์ต๋๋ค.
์๋ด์:๊ทธ๋ฆฌ๊ณ ๋ค์ ์๋ด๋ถํฐ๋ ์๊ฐ์ ํ๋ฆ์ ํจ๊ป ์ ๊ฒํ๊ณ , ์กฐ๊ธ์ฉ ๊ท ํ์ ์ฐพ์ ์ ์๋๋ก ๋๋ ์ธ์งํ๋์น๋ฃ๋ฅผ ์์ํด๋ณด๋ ค ํด์. ๊ทธ ๊ณผ์ ์์ โโ๋์ด ์์ฃผ ๋ ์ฌ๋ฆฌ๋ ๋ถ์ ์ ์ธ ์๊ฐ๋ค์ ๋ค๋ฃจ๊ฒ ๋ ๊ฑฐ์์. ๋ถ๋ด์ด ํฌ์ง ์๋๋ก ์ฒ์ฒํ ์งํํ ํ
๋ ํธํ๊ฒ ์ํด์ฃผ์๋ฉด ์ข๊ฒ ์ต๋๋ค.
๋ด๋ด์:ํด๋ณผ๊ฒ์.
์๋ด์:์ ๋ฐ๋ผ์ ์ฃผ์
์ ๊ฐ์ฌํด์. ์ค๋ ์ด์ผ๊ธฐํด์ฃผ์ ๋ด์ฉ์ ์์ฃผ ์ค์ํ ์ฒซ๊ฑธ์์ด์๊ณ , ์๋ด์ด ๋๋ ๋ค 48์๊ฐ ์ด๋ด์ ์ ํ๋ก ์๋ถ๋ฅผ ํ ๋ฒ ์ฌ์ญค๋ณผ ์์ ์ด์์. ํ์ํ ๊ฒฝ์ฐ ์ ์ ๊ณผ์ ์ธ ํ๊ฐ๋ ํจ๊ป ๊ณ ๋ คํด๋ณผ ์ ์์ด์. ๋ค์ ์๋ด์์ ์กฐ๊ธ ๋ ํธ์ํ ๋ง์์ผ๋ก ๋ต ์ ์๊ธฐ๋ฅผ ๋ฐ๋ผ์.
๋ด๋ด์:๊ฐ์ฌํฉ๋๋ค.
"""
raw_input_ids = tokenizer.encode(text)
input_ids = [tokenizer.bos_token_id] + raw_input_ids + [tokenizer.eos_token_id]
summary_ids = model.generate(torch.tensor([input_ids]), num_beams=5, max_length=512, eos_token_id=1, no_repeat_ngram_size=3)
tokenizer.decode(summary_ids.squeeze().tolist(), skip_special_tokens=True)
output: "์ฆ์:๋ด๋ด์๋ ๋ช ๋ฌ ์ ๋ถํฐ ์์๋ ์ง์๋ ์ฐ์ธ๊ฐ๊ณผ ๋ฌด๊ธฐ๋ ฅ๊ฐ์ ํธ์ํ๋ฉฐ, ์ผ์ ๊ธฐ๋ฅ ์ ํ์ ์์ด ์๊ฐ์ ๊ฒฝํํ๊ณ ์๋ค. ์๋ฉด์ฅ์ ์ ์ง์ค๋ ฅ ์ ํ, ๋์ธ๊ธฐํผ๋ ๋ํ๋๊ณ ์๋ค. ๋์:์๋ด์๋ ๋ด๋ด์์ ๊ฐ์ ์ ๊ณต๊ฐํ๋ฉฐ ์์ ๊ณํ์ ์๋ฆฝํ๊ณ , ์ธ์งํ๋ ์น๋ฃ๋ฅผ ํตํด ์๊ฐ์ ํ๋ฆ์ ์ ๊ฒํ๊ณ ๋ถ์ ์ ์ธ ์ฌ๊ณ ๋ฅผ ๋ค๋ฃจ๋๋ก ์ง๋ํ ์์ ์ด๋ค. ๋ํ ์๊ธฐ ์ํฉ์์ ์์ ๊ณํ ์๋ฆฝ๊ณผ ์ฌ๋ฆฌ์ ์ง์ง๋ฅผ ์ ๊ณตํ๋ฉฐ, ๋ด๋ด์๊ฐ ํธ์ํ๊ฒ ์๋ด์ ์ํ ์ ์๋๋ก ์๋ดํ์๋ค."
Input type
"""
์๋ด์:<์๋ด์ ํ
์คํธ>
๋ด๋ด์:<๋ด๋ด์ ํ
์คํธ>
์๋ด์:<์๋ด์ ํ
์คํธ>
...
"""
License
Licensed under the modified MIT License.
- Downloads last month
- 13
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
๐
Ask for provider support
Model tree for shlee5784/kobart-summarization-counseling-v1
Base model
gogamza/kobart-base-v2