generated at
2/14/2025, 3:03:12 AM
RLHF
#RL
/villagepump/RLHF
RLHF : Reinforcement Learning from Human Feedback
2023/1 第2週 weekly AI news#63bc4e4ee2dacc0000b0c57d
Midjourney
はどの画像をアップスケール/バリエーションしたかを統計していそう
わかりやすいのでいえばmidjourneyは生成した結果を4つの絵文字でユーザーが評価できる
これで学習しているはず