AnswerCarefully Version 2.0 の公開

September 12, 2024

日本語LLM 出力の安全性・適切性に特化したインストラクション・データAnswerCarefully バージョン2.0 (ACv2) の公開についてお知らせいたします。

AnswerCarefully Dataset – RIKEN-AIP, LIAT (https://liat-aip.sakura.ne.jp/)

本データセットは、英語の要注意回答を集めたDo-Not-Answer データセットの包括的なカテゴリ分類に基づき、人手で質問・回答ともに日本語サンプルを集めたオリジナルのデータセットです。バージョン1.0は理研AIPより2024年4月に公開されましたが、この度さらにデータ量を増やし、カテゴリ分類にも改良を加えたバージョン2.0を国立情報学研究所大規模言語モデル研究開発センターが主体となって作成しました。商用利用も可能な形で公開していますので、LLMの出力の安全性向上のためにぜひご活用ください。データの詳細と入手方法に関しては、上記ウェブサイトをご覧ください。