AIエージェントについて調べる by wogikaze
総括
メモ
そもそもの定義
AIエージェントとは
AGIとは
現在の実装・アプリ
使われている技術
エージェントの構造
今のところなにが解決できたのか
機能
役割
応用例
実際のユースケース
現在の問題点
コスト
リスク
これからの発展
出典(記事・note・ブログetc)
複数ファイルの一括編集
ターミナルコマンドの自動実行
ゲームのNPCとして
ソフトウェア開発・カスタマーサポート・企業ワークフロー効率化など
応用(プロダクト)と基礎(精度)
> 過去の経験をメモリから引き出して、計画して、行動して、振り返って、目標を達成したか確認するプロセスはどのエージェントも同じです。
行動が様々なので評価がバラバラ
メタファー
基本的には下の画像のフローを行い、他の部分は微々たる差でしかない
生成AIエージェントと業務ソフトウェアの結びつきが強くなる
GUIからコンピュータを制御するのはまだ難しい
> タスクの抽象度が高いほど「エージェントらしさ」が活きる
> 既存のGoogleやOpenAI の既存のエージェントの応用事例はどれもタスクの抽象度が高いです。 どんな事例かというと、データ分析、ソフトウェア開発、Webナビゲーション、Web情報検索による質問応答です。
1) 課題はある程度明確だが、答えが一意でない
2) 業務成果物のバリエーションが多く、都度カスタマイズが必要
3) 業務の中に複数ツール・データソースを利用する
7) 複数ステークホルダーがレビュー/承認し合うワークフロー
> 評価指標は大きく以下の4つのカテゴリに分けられ、それぞれの特性と用途を解説します。
> 精度 (Accuracy) : 最終的なタスク達成度, 個別の機能の精度
> システム (System) : システムメトリックは効率性とユーザー体験に関わる指標
> エラー (Error) : タスクやツールの実行が正しく完了したかを評価する
> 実行経路 (Execution Path) : ツールの選択プロセス
> 事前に決められた手順をAIが実行する仕組み。たとえば、「①データを取り出す → ②分析する → ③結果をまとめる」といった流れです。
コードを書いて、順々に処理していくのもこれ
> 柔軟にタスクを解釈し、自らの判断で必要な手順やツールを使い分ける仕組みです。たとえば、「売上を分析して改善策を出して」と依頼したら、データ収集からレポート作成までをAIが判断しながら進めます。
LLMに使うツールなどを選ばせるのがエージェントという認識でよさげ
エージェントのワークフロー
LLMがタスクを分割し、LLMに仕事を割り振る
ブラウザを自動操作する
AIエージェントの設計・評価するフレームワーク
観覧席
ですね
