teozosa commited on
Commit
fb384c9
·
verified ·
1 Parent(s): bd84c62

📝 Update JP translation

Browse files
Files changed (1) hide show
  1. README.md +32 -30
README.md CHANGED
@@ -214,21 +214,21 @@ If you are interested in custom solutions with edge deployment, please contact [
214
 
215
  # LFM2-350M-ENJP-MT (日本語)
216
 
217
- [LFM2-350M](https://huggingface.co/LiquidAI/LFM2-350M)モデルを基盤とし、このチェックポイントは短~中程度の入力に対する**日本語/英語の双方向翻訳**をほぼリアルタイムで行うよう最適化されています。
218
 
219
  ![image/png](https://cdn-uploads.huggingface.co/production/uploads/65d6b6c1a07ad79084a0d214/hhras0rRcBPnQWmHmU7dC.png)
220
 
221
- LFM2-350M-ENJP-MTは、その10倍以上のサイズのモデルと同等の翻訳品質を実現します。
222
 
223
  ## 📊 翻訳品質
224
 
225
- 以下はモデルが生成した翻訳例です。これらの例は、英語➡️日本語と日本語➡️英語の両方向におけるモデルの強みと典型的なスタイルを体感いただくことを目的としています。
226
 
227
- 日常的な文章、技術的な説明、ビジネスコミュニケーション、ニュース報道など様々な分野のテキストを組み合わせていますので、異なる領域における性能を評価いただけます。
228
 
229
  ### 英語 ➡️ 日本語
230
 
231
- これらの例は、日本語への翻訳において、製品説明、技術的な文章、正式な説明文において本モデルの強みを示しています。
232
 
233
  <table>
234
  <colgroup>
@@ -267,7 +267,7 @@ LFM2-350M-ENJP-MTは、その10倍以上のサイズのモデルと同等の翻
267
 
268
  ### 日本語 ➡️ 英語
269
 
270
- これらの例は、ニュース報道、口語表現、ビジネス文脈において、英語への翻訳時にニュアンスを保持するモデルの能力を示しています。
271
 
272
  <table>
273
  <colgroup>
@@ -305,28 +305,30 @@ LFM2-350M-ENJP-MTは、その10倍以上のサイズのモデルと同等の翻
305
  </table>
306
 
307
  > [!NOTE]
308
- > 📝LFM2-350M-ENJP-MTは、強力な汎用英語⇔日本語翻訳をすぐに提供しますが、私たちの主な目標は、多用途でコミュニティが活用できる基盤モデルを提供することです。これは、最高クラスのタスク特化型翻訳システムを容易に構築できるように設計された基盤です。
309
- >
310
- > あらゆる基盤モデルと同様に、成長の余地は残されています。特に以下の領域において:  
311
- >
312
- > - 技術・専門用語(医療、法律、工学)
313
- > - 新規固有名詞(新製品、ブランド、文化的参照)
314
- > - 業界・ドメイン・企業固有のニュアンス(EC、金融、社内用語)
315
- >
316
- > これらはまさに、Liquid AIと開発者コミュニティによるファインチューニングで解決可能な課題です。本モデルは単なる最終形ではなく、現実のニーズに合わせたファインチューニング済み翻訳モデルの豊かなエコシステムを促進する触媒と位置付けています。
 
 
317
 
318
- ## 📄モデル詳細
319
 
320
- **生成パラメータ**: `temperature=0`で貪欲なデコードを使用す���ことを強く推奨します。
321
 
322
- **システムプロンプト**: LFM2-ENJP-MT**には**、以下の2つのシステムプロンプトのいずれかが必要です:
323
- * 英語から日本語への翻訳には「Translate to Japanese.」
324
- * 日本語から英語への翻訳には「Translate to English.」
325
 
326
  > [!WARNING]
327
- > ⚠️ これらの2つのシステムプロンプトのいずれかがなければ、モデルは意図した通りに動作しません。
328
 
329
- **チャットテンプレート**: LFM2-ENJP-MTは、以下のようなChatML風のチャットテンプレートを使用します:
330
  ```
331
  <|startoftext|><|im_start|>system
332
  Translate to English.<|im_end|>
@@ -335,17 +337,17 @@ C. elegansとは何ですか?<|im_end|>
335
  <|im_start|>assistant
336
  What is C. elegans?<|im_end|>
337
  ```
338
- Hugging FaceのTransformersの専用関数[`.apply_chat_template()`](https://huggingface.co/docs/transformers/en/chat_templating#applychattemplate)を使用して自動的に適用できます。
339
 
340
  > [!WARNING]
341
- > ⚠️ このモデルは単一のターンでの会話を対象としています。
342
 
343
- ## 🏃LFM2の実行方法
344
 
345
- - Hugging Face: [LFM2-350M](https://huggingface.co/LiquidAI/LFM2-350M)
346
- - llama.cpp: [LFM2-350M-ENJP-MT-GGUF](https://huggingface.co/LiquidAI/LFM2-350M-ENJP-MT-GGUF)
347
- - LEAP: [LEAPモデルライブラリ](https://leap.liquid.ai/models?model=lfm2-350m-enjp-mt)
348
 
349
- ## 📬お問い合わせ
350
 
351
- エッジデプロイメントを伴うカスタムソリューションにご興味をお持ちの場合は、[弊社営業チーム](https://www.liquid.ai/ja/contact)までお問い合わせください。
 
214
 
215
  # LFM2-350M-ENJP-MT (日本語)
216
 
217
+ [LFM2-350M](https://huggingface.co/LiquidAI/LFM2-350M)モデルをベースに、本チェックポイントは短文から中程度の入力に対する **日本語/英語の双方向リアルタイム翻訳** 用にファインチューニングされています。
218
 
219
  ![image/png](https://cdn-uploads.huggingface.co/production/uploads/65d6b6c1a07ad79084a0d214/hhras0rRcBPnQWmHmU7dC.png)
220
 
221
+ LFM2-350M-ENJP-MTは、サイズが10倍以上大きいモデルに匹敵する翻訳品質を実現します。
222
 
223
  ## 📊 翻訳品質
224
 
225
+ 以下は本モデルが生成した翻訳例です。英語➡️日本語、日本語➡️英語の両方向における強みと典型的なスタイルを示しています。
226
 
227
+ 日常文、技術的記述、ビジネス文書、報道などを含んでおり、さまざまな領域での性能を確認できます。
228
 
229
  ### 英語 ➡️ 日本語
230
 
231
+ これらの例は、日本語翻訳において、製品説明、技術文、形式的な解説での強みを示しています。
232
 
233
  <table>
234
  <colgroup>
 
267
 
268
  ### 日本語 ➡️ 英語
269
 
270
+ これらの例は、ニュース記事のニュアンス、口語表現、ビジネス文脈を保ちながら英語に翻訳できるモデルの能力を示しています。
271
 
272
  <table>
273
  <colgroup>
 
305
  </table>
306
 
307
  > [!NOTE]
308
+ > 📝 LFM2-350M-ENJP-MTは汎用的な英日翻訳において高い性能を発揮しますが、我々の主な目標は、コミュニティに力を与える柔軟な基盤モデルを提供することです。
309
+ > これは一流のタスク特化型翻訳システムを容易に構築できるよう設計された基盤です。
310
+ >
311
+ > すべての基盤モデルと同様に、成長の余地があります。特に以下のような場面です:
312
+ > - 極端に長い文脈や専門的/文脈依存の翻訳
313
+ > - 専門分野の言語(医療、法律、工学)
314
+ > - 新しい固有名詞(新製品、ブランド、文化的参照)
315
+ > - 業界・分野・企業特有のニュアンス(EC、金融、社内用語)
316
+ >
317
+ > これらはLiquid AIおよび開発者コミュニティによるファインチューニングで解決可能な課題です。
318
+ > 本モデルを最終到達点ではなく、実世界に即した多様な翻訳モデル群を生み出す触媒として位置付けています。
319
 
320
+ ## 📄 モデル詳細
321
 
322
+ **生成パラメータ**: `temperature=0`を指定した貪欲デコード(greedy decoding)の使用を強く推奨します。
323
 
324
+ **システムプロンプト**: LFM2-ENJP-MTは以下のいずれかのシステムプロンプトを必須とします:
325
+ * 英語 → 日本語翻訳: `"Translate to Japanese."`
326
+ * 日本語 → 英語翻訳: `"Translate to English."`
327
 
328
  > [!WARNING]
329
+ > ⚠️ これらのシステムプロンプトがなければモデルは意図通りに動作しません。
330
 
331
+ **チャットテンプレート**: LFM2-ENJP-MTは以下のようなChatML風テンプレートを使用します:
332
  ```
333
  <|startoftext|><|im_start|>system
334
  Translate to English.<|im_end|>
 
337
  <|im_start|>assistant
338
  What is C. elegans?<|im_end|>
339
  ```
340
+ Hugging FaceのTransformersの専用関数[`.apply_chat_template()`](https://huggingface.co/docs/transformers/en/chat_templating#applychattemplate)を使えば自動で適用できます。
341
 
342
  > [!WARNING]
343
+ > ⚠️ 本モデルはシングルターン会話用に設計されています。
344
 
345
+ ## 🏃 LFM2の実行方法
346
 
347
+ - Hugging Face: [LFM2-350M](https://huggingface.co/LiquidAI/LFM2-350M)
348
+ - llama.cpp: [LFM2-350M-ENJP-MT-GGUF](https://huggingface.co/LiquidAI/LFM2-350M-ENJP-MT-GGUF)
349
+ - LEAP: [LEAP モデルライブラリ](https://leap.liquid.ai/models?model=lfm2-350m-enjp-mt)
350
 
351
+ ## 📬 お問い合わせ
352
 
353
+ エッジ環境への導入を含むカスタムソリューションにご興味がある方は、[営業チーム](https://www.liquid.ai/ja/contact)までお問い合わせください。