/work4ai/AIエージェントについて調べる by wogikaze

generated at 2/17/2025, 7:38:28 PM
AIエージェントについて調べる by wogikaze
総括

メモ

そもそもの定義
AIエージェントとは
AGIとは

現在の実装・アプリ
使われている技術
エージェントの構造

今のところなにが解決できたのか
機能
役割

応用例
実際のユースケース

現在の問題点
コスト
リスク

これからの発展


出典(記事・note・ブログetc)
Cursor
Cursor Composer Agent
複数ファイルの一括編集
ターミナルコマンドの自動実行
GitHub - masamasa59/ai-agent-papers: Weekly AI Agent News!の論文内容を更新
https://masamasa59.hatenablog.com/entry/weekly-ai-agent-journeyWeekly AI Agent News!から見えたAIエージェントの現在地 - 襖からキリン
ゲームのNPCとして
AIエージェントの評価方法(AIエージェントベンチマーク)
VLMを利用してGUIを直接操作する
現実のシミュレーションのため(LMAgent)
実装のためのフレームワーク(Phidata, OpenAI Swarn, CrewAI, Autogen, LangGraph)
ソフトウェア開発・カスタマーサポート・企業ワークフロー効率化など
応用(プロダクト)と基礎(精度)
> 過去の経験をメモリから引き出して、計画して、行動して、振り返って、目標を達成したか確認するプロセスはどのエージェントも同じです。
行動が様々なので評価がバラバラ
メタファー
基本的には下の画像のフローを行い、他の部分は微々たる差でしかない
https://www.langchain.com/breakoutagents/perplexityPerplexity
https://masamasa59.hatenablog.com/entry/ai-agent-business-guideAIエージェントビジネスの現状と今後の考察 - 襖からキリン
生成AIエージェントと業務ソフトウェアの結びつきが強くなる
GUIからコンピュータを制御するのはまだ難しい
https://masamasa59.hatenablog.com/entry/business-challenges-for-ai-agents生成AIエージェントが刺さる業務課題を探そう！ - 襖からキリン
> タスクの抽象度が高いほど「エージェントらしさ」が活きる
> 既存のGoogleやOpenAI の既存のエージェントの応用事例はどれもタスクの抽象度が高いです。 どんな事例かというと、データ分析、ソフトウェア開発、Webナビゲーション、Web情報検索による質問応答です。
1) 課題はある程度明確だが、答えが一意でない
2) 業務成果物のバリエーションが多く、都度カスタマイズが必要
3) 業務の中に複数ツール・データソースを利用する
7) 複数ステークホルダーがレビュー/承認し合うワークフロー
https://masamasa59.hatenablog.com/entry/2024-best-papers-on-ai-agents2024年生成AIエージェントのおすすめ論文 16選 - 襖からキリン
https://note.com/wandb_jp/n/nf563ea9d3096?sub_rt=share_pbAIエージェントの評価｜Weights & Biases Japan
Compound AIシステムやworkflow
> 評価指標は大きく以下の4つのカテゴリに分けられ、それぞれの特性と用途を解説します。
> 精度 (Accuracy) : 最終的なタスク達成度, 個別の機能の精度
> システム (System) : システムメトリックは効率性とユーザー体験に関わる指標
> エラー (Error) : タスクやツールの実行が正しく完了したかを評価する
> 実行経路 (Execution Path) : ツールの選択プロセス
https://www.anthropic.com/research/building-effective-agentsBuilding effective agents \ Anthropic
https://note.com/kyutaro15/n/ne88fe2fcf928?sub_rt=share_pbClaudeが提案するエージェント構築：簡単で効果的な設計のベストプラクティス｜Kyutaro
ワークフローとエージェントの違い
> ワークフロー
> 事前に決められた手順をAIが実行する仕組み。たとえば、「①データを取り出す → ②分析する → ③結果をまとめる」といった流れです。
Difyとかこれに近い
コードを書いて、順々に処理していくのもこれ
> エージェント
> 柔軟にタスクを解釈し、自らの判断で必要な手順やツールを使い分ける仕組みです。たとえば、「売上を分析して改善策を出して」と依頼したら、データ収集からレポート作成までをAIが判断しながら進めます。
LLMに使うツールなどを選ばせるのがエージェントという認識でよさげ
エージェントのワークフロー
Orchestrator、凄く面白い
LLMがタスクを分割し、LLMに仕事を割り振る
これ強化学習で見た図やな
https://github.com/browser-use/browser-usebrowser-use/browser-use
ブラウザを自動操作する
Computer Useよりも精度が良いらしい
https://www.microsoft.com/en-us/research/blog/aiopslab-building-ai-agents-for-autonomous-clouds/AIOpsLab: Building AI agents for autonomous clouds - Microsoft Research
https://github.com/microsoft/AIOpsLabmicrosoft/AIOpsLab
AIエージェントの設計・評価するフレームワーク
https://agent.ai/agentsagent.ai 
https://cloud.google.com/blog/products/ai-machine-learning/bringing-ai-agents-to-enterprises-with-google-agentspace?hl=enBringing AI Agents to Enterprises with Google Agentspace 
https://xtech.nikkei.com/atcl/nxt/column/18/00001/10073/Googleが「Agentspace」発表、AIエージェントで企業内の定型業務を自動化
https://www.youtube.com/watch?v=kUk6ShVeInI
ところてん / 安野貴博
https://zenn.dev/neoai/articles/fc5e39cffeb4612024年 ビッグテックのAI Agent 動向まとめ
https://huyenchip.com/2025/01/07/agents.htmlAgents
https://note.com/dory111111/n/ncab810c5fc21採用AIエージェント「リクルタAI」 - 1年間のプロダクト開発の裏側｜Ryoichi Takahashi │ 株式会社Algomatic Works
OpenAI Operator
OpenAI Deep Research

観覧席
Devin.aiもこの部類かな
ですね