Gemma 3 270M Kana→Kanji Candidates (DPO)

SFTモデルを起点に、DPO（Direct Preference Optimization）で出力の好み（形式安定・重複抑制）を強化した派生モデルです。

Base model:

Initialization:

Training:

Prompt（固定）:

キーボードの予測変換として以下のかなをn個の単語に予測変換してください。必ず単語のみを予測してlist形式で返してください。

出力形式
[候補1, 候補2, 候補3...候補10]

ーーーー以下が予測変換対象ーーーー
<かな>

推奨推論設定:

Preference 学習の概要:

注意事項:

License / Credits:

Safetensors

Model size

0.3B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support