generated at
entropix
>エントロピーベースのサンプリングと並列CoTデコード(Parallel CoT Decoding)
> 目標は、エントロピーを使用してコンテキスト認識サンプリングを行うことです。これにより、o1のCoTやAnthropicsに似たものをシミュレートして、推論時間計算を使用してはるかに優れた結果を得ることができるはずです。

https://note.com/shi3zblog/n/n3a8944695680?sub_rt=share_pb物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く

オリジナルの実装より少し古い(attention head entropyを考慮しない)らしい(GGUFで出来るかもわかんないとのこと)
DeepSeek-R1蒸留モデル版のQwen2.5とかでこれやったらどの程度性能が上がるんだろmorisoba65536


関連しているらしい
AIモデルには本来、複雑な問題を解決するための推論能力が備わっているが、greedy decodingに頼ると途中の思考過程を省略して直接答えを出そうとする傾向があり、ハルシネーションを引き起こす可能性がある