V3. リアルタイム学習 (Real Time Learning)

管理目標

LLM システム内でのリアルタイム学習に関連するリスクを軽減するためのコントロールを確立します。ここでは、リアルタイムでのユーザーインタラクションに基づいてモデルを継続的にファインチューニングします。

#
要件
L1
L2
L3

3.1

モデルとインタラクションするための明確な使用条件とガイドラインを定義し、許容できる振る舞いと許容できない振る舞いをユーザーに認識させます。

3.2

モデルのパフォーマンスとインタラクションの継続的な監視を確保します。これには、すべての入力と出力を (必要に応じて、データの潜在的な機密性を考慮して) リアルタイムでログ記録し、不適切な振る舞いと予期しない振る舞いを迅速に特定して対処することが含まれます。

3.3

モデルが望ましくない振る舞いを示し始めた場合に即座に介入するための明確なプロトコルを作成します。これには必要に応じてシステムを迅速にオフラインにする機能を含める必要があります。

3.4

ユーザーインタラクションを定期的に分析して、モデルを不適切な振る舞いに操作しようとする試みを特定して軽減します。

3.5

人間の承認を得てモデルを段階的に更新できる増分学習アプローチの使用を検討します。

Last updated