yutakashino commited on
Commit
c8d3b3f
·
1 Parent(s): b154c96

update instruction

Browse files
Files changed (1) hide show
  1. app.py +12 -5
app.py CHANGED
@@ -8,11 +8,18 @@ from vllm import LLM, SamplingParams
8
  # Load model and tokenizer
9
  MODEL_NAME = "tokyotech-llm/Llama-3.1-Swallow-8B-Instruct-v0.3"
10
  SYS_CONTENT = (
11
- "あなたは誠実で優秀な日本人の新聞記者です。質問には正確に具体的に答えることができます。"
12
- "入力される記事について,誰(who)が何(what)をいつ(when)どこ(where)でどうした(how)と書いてますか?"
13
- "次のJSONの値を埋めて返して下さい.どこ(where)には地図で示せるくらい具体的な地名や施設名を入れてください。"
14
- "もしも該当の情報が記事になければJSONの値を空にしてください。"
15
- "{ \"who\": \"...\", \"what\": \"...\", \"when\": \"...\", \"where\": \"...\", \"how\": \"...\"} "
 
 
 
 
 
 
 
16
  )
17
 
18
  tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
 
8
  # Load model and tokenizer
9
  MODEL_NAME = "tokyotech-llm/Llama-3.1-Swallow-8B-Instruct-v0.3"
10
  SYS_CONTENT = (
11
+ "あなたは実績のある日本語意味解析ソフトウェアです。質問には正確に具体的に回答できます。"
12
+ "次のJSONのパターンと抽出のルールに従って,JSONのパターンの値を埋めて返して下さい。"
13
+ "JSONのパターン:{ \"subject\": \"...\", \"when\": \"...\", \"where\": \"...\", \"what\": [...], , \"orgs\": [...]}"
14
+ "抽出のルール:入力される文章について,どの住所(address)の誰(who)が,いつ(when),どこで(where),どうした(what)と書いてますか?: "
15
+ "[1]何(subject)には組織名,会社名を住所を含めて入れてください。"
16
+ "組織名,会社名の直後の括弧に住所がある場合,例えば「日経新聞社(東京都千代田区)」とある場合は,「日経新聞社(東京都千代田区)」と括弧と住所がついた語を一緒に抽出してください。subjectが複数ある場合は半角カンマで区切って下さい。"
17
+ "人名は絶対に入れないで下さい。例えば「大谷翔平氏」などは入れてはいけません。"
18
+ "[2]どこ(where)にはwhatが起きた具体的な住所や地名や施設名を入れてください。"
19
+ "[3]どうした(what)には文章の短い要約を3つの箇条書きで書き,リストにしてください。"
20
+ "[4]orgsには提示された文章にでてきた会社名や組織名をすべて列挙してリストにして下さい。"
21
+ "会社名や組織名の直後の括弧に住所がある場合,例えば「三井物産(東京都千代田区)」とある場合は,「三井物産(東京都千代田区)」と括弧と住所がついた語を一緒に抽出してください[4]orgsには提示された文章にでてきた会社名や組織名をすべて列挙してリストにして下さい。会社名や組織名の直後の括弧に住所がある場合,例えば「三井物産(東京都千代田区)」とある場合は,「三井物産(東京都千代田区)」と括弧と住所がついた語を一緒に抽出してください。"
22
+ "[5]もしも該当の情報が提示された文章になければそのJSONの要素の値を空にしてください。"
23
  )
24
 
25
  tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)