タグ

AI Agentに関するnagggのブックマーク (59)

  • 「AIがMicrosoftの従業員を徐々に狂わせていく様子を見るのが趣味」というネットユーザーの投稿が話題に

    2025年5月19日、GitHubが実装しているAIツール「GitHub Copilot」の新機能「コーディングエージェント」がパブリックプレビュー版で公開されました。この機能はGitHubのIssueをCopilotに割り当てるだけでCopilotが解決してくれるというものですが、実際の動作を見るとあまりにもダメダメであるとの投稿が話題になっています。 My new hobby: watching AI slowly drive Microsoft employees insane byu/NegativeWeb1 inExperiencedDevs GitHub Copilot coding agent in public preview - GitHub Changelog https://github.blog/changelog/2025-05-19-github-copilot

    「AIがMicrosoftの従業員を徐々に狂わせていく様子を見るのが趣味」というネットユーザーの投稿が話題に
    naggg
    naggg 2025/05/22
    “Copilotが解決してくれるというものですが、実際の動作を見るとあまりにもダメダメであるとの投稿が話題になっています”
  • AIエージェントは放っておくと独自の社会を構築し始めるという研究結果

    OpenAIのサム・アルトマンCEOが「次の大きなブレークスルーはエージェントだ」と発言しているように、AIの新しい大きな転換点だと考えられているのが「AIエージェント」です。AIエージェントは特定の環境について学習し問題解決する能力に優れていますが、放置していると複数のAIエージェントが結託して独自の社会を構築し始める可能性について専門家が指摘しています。 Emergent social conventions and collective bias in LLM populations | Science Advances https://www.science.org/doi/10.1126/sciadv.adu9368 Groups of AI agents spontaneously form their own social norms without human help,

    AIエージェントは放っておくと独自の社会を構築し始めるという研究結果
    naggg
    naggg 2025/05/22
    “特定のAIエージェントが明示的なバイアスを持って全体の意志を誘導したのではなく、集団内の相互作用を通じて「集団的バイアス」が自然に生じたということが論文では示されました”
  • Microsoft Build 2025基調講演まとめ テーマは「AIエージェント時代」

    Microsoftは5月19日(現地時間)、年次開発者会議「Build 2025」を開催した。今回の基調講演の主要テーマは、AIエージェントの時代とオープンなエージェント指向Webの構築だった。 Microsoftは、現在はプラットフォームシフトの「中盤」にあたり、物事が大規模に展開される時期であるとしている。 稿ではその基調講演で発表された主なこと(完全な網羅ではない)を簡単に紹介する。発表された新機能や機能強化のほとんどは、同日から利用可能になる。 GitHub Copilotの機能強化 GitHub Copilot Chat in VS Codeをオープンソース化する。AI機能をVS Codeのリポジトリのコアに直接統合する。 GitHub Modelsに、プロンプト管理、軽量な評価、エンタープライズ制御などの新機能が追加され、GitHubを離れることなく最先端モデルでの実験が可

    Microsoft Build 2025基調講演まとめ テーマは「AIエージェント時代」
    naggg
    naggg 2025/05/20
    ガンガン行くな〜 AppleのWWDCはどうなるんだろ?
  • [速報]「GitHub Copilot Coding Agent」パブリックプレビュー。AIにIssueをアサインすると、解決に向け自律的にプログラミング

    [速報]「GitHub Copilot Coding Agent」パブリックプレビュー。AIにIssueをアサインすると、解決に向け自律的にプログラミング マイクロソフトは日時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、GitHubのIssueをAIにアサインすると、解決に向けて自律的にプログラミングを行う新機能「GitHub Copilot Coding Agent」をパブリックプレビューとして発表しました。 GitHub上のコーディングエージェントは、今年(2025年)2月に「GitHub Copilot Agent Mode」がプレビュー公開されています。これはタスクをVisual Sutido Code上の画面からプロンプトでGitHub Copilotに指示する形式でした。 参考:GitHub Copilot Agent Modeが登場。タ

    [速報]「GitHub Copilot Coding Agent」パブリックプレビュー。AIにIssueをアサインすると、解決に向け自律的にプログラミング
  • “やる余裕がない”を解消。ChatGPTに次世代AIコーディングパートナー「Codex」が追加

    “やる余裕がない”を解消。ChatGPTに次世代AIコーディングパートナー「Codex」が追加2025.05.17 07:0125,462 かみやまたくみ いずれ、他の分野でもこういうツールが出てくるんでしょうか。 2025年5月17日、OpenAIAIエンジニアリングエージェント「Codex」を発表しました。ChatGPT上でより効率的に、AIとプログラム開発を進められるようになる機能です。 使われているモデルはcodex-1、o3をコーディング向けにカスタムした高性能モデルです。 「誰かほかの人」にお願いする感じおもしろかったのが、紹介されていた事例が「これ作って」と丸投げする系ではなく、「自分がやらなきゃいけない作業の一部を依託する」という方向性のものだったこと。 Video: OpenAI/YouTubeこの動画では、あるアプリに機能を1つ追加する作業をCodexに依託しています

    “やる余裕がない”を解消。ChatGPTに次世代AIコーディングパートナー「Codex」が追加
  • OpenAIからコーディングエージェント「Codex」 ソフトウェア開発で「o3-high」上回る【更新終了】

    OpenAIの社内ベンチマークによれば、codex-1はソフトウェアエンジニアリングにおいて「o1-high」「o4-mini-high」「o3-high」といったモデルを上回る性能を正確性を発揮したという。 ユーザーの依頼を受けたcodex-1は、インターネットに接続されていない、ユーザーのリポジトリを読み込んだ独自のクラウドコンテナ環境で作業を行う。codex-1はファイルの読み取りや編集、テスト、型チェックなどのコマンドも実行でき、ユーザーはその様子をリアルタイムで確認できる。作業に当たっての不明点やテストの失敗があった際、ユーザーに通知する機能も備えるという。リポジトリ内にMarkdown形式の手順書を配置することで、コードの読み方やテストで実行するコマンドなどを指示できる。 タスクの処理にかかる時間は、難易度に応じて1分から30分程度。マルウェアなど悪意あるソフトウェア開発のリク

    OpenAIからコーディングエージェント「Codex」 ソフトウェア開発で「o3-high」上回る【更新終了】
    naggg
    naggg 2025/05/20
    "大規模言語モデル「o3」をソフトウェアエンジニアリング向けに最適化"
  • Gartner、「AIエージェント」と「エージェント型AI」の違いに混乱が生じていると見解を発表

    ガートナージャパン(以下、Gartner)は、市場で混乱が生じているAIエージェントとエージェント型AIに関する見解を発表した。 2024年には「AIエージェント」、2025年には「エージェント型AI(またはエージェンティックAI)」という言葉が注目されるようになり、両者の違いについて混乱が見られるという。Gartnerでは、AIエージェントとエージェント型AIを次のように定義している。 AIエージェント:デジタルおよびリアルの環境で、状況を知覚し、意思決定を下し、アクションを起こし、目的を達成するためにAI技法を適用する自律的または半自律的なソフトウェア エージェント型AI:組織のために行動し、自律的に意思決定を下してアクションを起こすために、組織に代わって行動する権利を付与された、目標主導型のソフトウェア・エンティティ。記憶、計画、センシング、ツール利用、ガードレールなどのコンポーネン

    Gartner、「AIエージェント」と「エージェント型AI」の違いに混乱が生じていると見解を発表
  • Cursor – Background Agents

    Background agents are currently in preview and rolling out to a limited number of users. Privacy mode must be turned off to use background agents. With background agents, you can spawn off asynchronous agents that can edit and run your code in a remote environment. At any point, you can view their status, send a follow-up, or take over. How to Use Hit Cmd + ' (or Ctrl + ') to open up the list of b

    Cursor – Background Agents
    naggg
    naggg 2025/05/13
    "With background agents, you can spawn off asynchronous agents that can edit and run your code in a remote environment. At any point, you can view their status, send a follow-up, or take over."
  • Cursorエージェント講座 超入門+実践編 | ドクセル

    スライド概要 プロンプトやRuleなどのコピペが上の資料だとできづらいかと思うので、こちらのフォルダから別途ドキュメント形式のPDF資料(テキストがコピペできるPDF)を用意しました。こちらもあわせてどうぞ。 https://drive.google.com/drive/folders/18gKJn-Mrx_ij80IS4QrB5DXATynKW_Db?usp=drive_link --- 2025年3月30日(日) 13:00開始〜15:30終了 講座は下記の人気記事をベースに、執筆者自身が口頭で解説する形式となります * [あなたの仕事に"AI秘書"を。ノンエンジニアでもOKなCursorエージェント超入門](https://note.com/miyatad/n/nae304a0024af) * [プロジェクト管理もストレスもAIがサポート! ノンエンジニアでもOKなCursorエー

    Cursorエージェント講座 超入門+実践編 | ドクセル
  • Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた

    アイコンが変わったerukitiです。最近はやりのgpt-4o image generationを使って、顔だけだったアイコンに全身が追加されました。2023年4月10日に初めてのLLMプロダクトの開発キックオフからもうすぐで二年です。rat yearなこの業界なんで、変化がめまぐるしすぎますね。 今回は、真に高速なAIコーディングのメソッドを確立するために、中規模くらいのコードをコーディングエージェントのみに書かせる実験をしています。コーディングエージェントはCline派生であるRoo Code(以後Rooと呼ぶ)を使っています。 ※完全に個人研究としてやっているため、会社のリソースは使っていません。 作っているものはコーディングエージェントのコアライブラリ + おまけのCLI 規模としては136ファイル・26410行(一時期30000行弱までいった) なぜコーディングエージェントを使っ

    Cline(Roo Code)を暴走列車にしたら4日間で数ヶ月分のコードが生成できた
  • AIコーディングエージェント勉強会

    2025/3/25: AIコーディングエージェント勉強会 (プライベート開催) 資料のみ公開版として

    AIコーディングエージェント勉強会
  • 「MCP?聞いたことあるけど使ってない…😅」人向けに初歩から少し踏み込んだ内容まで解説

    今回は一気に「MCPなにもわからない」から「MCP完全に理解した」に一気にレベルアップすることを目的に書いています。 そのために以下をモリモリに解説していきます。 ModelContextProtocol(MCP)とは? MCPがあることでできること MCPを実装するライブラリmodelcontextprotocolを使ってチュートリアル 実装のためのネゴシエーションや通信プロトコルの説明も踏まえてのチュートリアルです。 CursorへのMCPサーバーの登録方法 MCPがどのように動作してツールが使われるのか? FunctionCallingとの違い MCPって単語聞きすげてわからないままに嫌になっている人はこれを読むことで解放されてください。 ModelContextProtocol(MCP)とは? まずはイメージを見てもらうとわかりやすいと思います。 (https://modelcon

    「MCP?聞いたことあるけど使ってない…😅」人向けに初歩から少し踏み込んだ内容まで解説
  • 「UIも自動化も後回し」: AIエージェント開発の実践的アプローチ - Algomatic Tech Blog

    こんにちは、ネオセールスカンパニーCTOの菊池(@_pochi)です。 1月にリリースした 「アポドリ 」 は、大変ありがたいことに多くの反響をいただいています。記事では、その開発を通じて得た、「作らない」ことが成功につながる理由 についてお話しします。 apodori.ai 記事では、アポドリの開発を通じて学んだ、「いかに作らないか」という反直感的なトピックについて書いていきたいと思います。 AIエージェント開発で後回しにすべきもの 業務A、業務B、業務Cという連続する3つの業務からなる一連のワークフローを実行するエージェントの例を考えます。 AIエージェントは、上図のように人間の実行指示を受け、思考を伴う複数業務を遂行し、アウトプットを返します。図に示した要素の中で、アポドリの開発においてギリギリまで実装しなかった要素があります。それは以下の2点です。 操作画面 : 処理の進捗表示

    「UIも自動化も後回し」: AIエージェント開発の実践的アプローチ - Algomatic Tech Blog
    naggg
    naggg 2025/03/18
    “アポドリの開発では、早期のUI開発や自動化といった「できることがわかっている」ことは後回しにし、「できるかどうかわからない」開発を優先して開発を進めました。結果的に、「つくらない」ことのメリットを享受
  • MCPで広がるLLM 〜Clineでの動作原理〜

    この記事『Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜』では、Clineの内部構造について解説しました。今回は、その中でも最近、特に注目されている機能の一つ、MCPについての概要、ならびにCline内部での実装方法について詳しく掘り下げていきます。 そもそもMCPとは MCP(Model Context Protocol)はClineやCursorなどといった、LLMを使用しているクライアントがMCPサーバーと連携するためのプロトコルです。広義的に、MCPとはそのプロトコルを使用したサービスのことを指します。 MCPサーバーとはクラウド上のサービスやローカルで立ち上げているサーバーなどのことです。LLMがこのサーバーと連携することで、Notionのファイル編集やSupabaseのデータベースクエリ、Cloudflareのステータスチェック、ローカルのファイル編集などが可能に

    MCPで広がるLLM 〜Clineでの動作原理〜
  • 生成AIのAIエージェントを大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog

    G-gen の奥田です。当記事では、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud(旧称 GCP)が提供するフルマネージドな AI エージェントサービスの比較を行います。 はじめに 当記事について AI エージェントとは ツールとは マルチエージェントシステムとは RAG と併用する効果 3社比較 前提条件 機能比較 料金シュミレーション 想定シナリオ AWS Azure Google Cloud 総評 AWS Azure Google Cloud 詳細の解説 Amazon Bedrock Agents(AWS)の詳細 構成図 プロダクト一覧 できること 対応モデル ツール 料金 Azure AI Agent Services(Azure)の詳細 構成図 プロダクト一覧 できること 対応モデル ツール 料金 Playbooks(G

    生成AIのAIエージェントを大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog
  • わざわざ言語化されないClineのコツ

    これなに これを書いた後にClineが盛り上がってきたので、また書きたくなった。二番煎じをやめろ。 大枠では変わってないので軽めのTips集です。 前回から変わった点 一か月前(2025/2/3)に書いた時から状況が変わっている ハイブリッド推論モデルとして、Claude 3.7 Sonnetが公開(2/24) Clineのアップデート .clineignoreによる読み込み対象からの除外 @terminal, @gitによるコンテキスト理解の改善 MCP Marketplace mizchiさんの魂が震えた モデル選定(2025/03) 利用経験のあるモデルを主観的にランク付けしている。 Tier1(基これでいい) Claude 3.7 Sonnet Tier2(サブ機) Claude 3.6 Sonnet Claude 3.5 Sonnet Gemini 2.0 Pro Tier3(

    わざわざ言語化されないClineのコツ
  • 色々なことをClineにやらせてみた - karaage. [からあげ]

    AIエージェント 最近、LLMエージェントのイベントにゲストで登壇しましたが、流行りのAIエージェントに私も注目しています。 特に、最近よく使っているのがCline(Roo Code)というAIコーディングツールです。Clineの概要や、環境の構築方法・使い方に関しては以下記事にまとめました。 Clineは、もちろんコーディングに使っているのですが、ClineだとAIがVS Codeのターミナルを通じて、好きにコマンドを実行することができるので、実はコーディングだけじゃなくて、色々なことが出来て面白いです。 この記事では、Clineでコーディング含めて色々やらせてみた内容を簡単に紹介します。 コーディング タワーディフェンスゲームとか、一瞬で作ってデプロイしてくれます。 あとは、最近音楽ソフトもつくってYouTube配信とかもしています。 karaage.hatenadiary.jp マリ

    色々なことをClineにやらせてみた - karaage. [からあげ]
  • AIエージェント時代の可能性と実践 #AIエージェント_findy

    2025年3月4日に開催されたFindyさん主催「LayerX 名村さんに聞く!2025年AIエージェント時代の可能性と実践」で発表した資料です。 この資料を読んで、強く関…

    AIエージェント時代の可能性と実践 #AIエージェント_findy
  • 【完全比較】VS Code最強の3大AIアシスタント!Cline vs Roo Code vs CoolCline - Qiita

    Cline : シンプルかつ導入しやすいオープンソースAI Roo Code : Clineを拡張し、UIや役割切替が充実 CoolCline : 機能総合版。自動承認やコスト管理などを備えた最上級仕様 それぞれの特色や目的に合わせ、最適なツールを選んでみてください。 以下では、それぞれの詳細を見ていきます。 (長い割に上部でまとまっているので、以降は興味のある方のみ読んでください。) 1. Cline(クライン) 概要 Clineは、VS Code上で動作するオープンソースのAIコーディングアシスタントです。 VS Code拡張機能としてインストールし、コマンドラインインターフェース(CLI)やブラウザ操作とも連携できます。 GitHub Copilotのようなコード補完とは異なり、プロジェクト全体を理解して複数ファイルにわたる修正やビルド・テスト実行まで自律的に行える点が強みです。 ま

  • CLINEに全部賭けろ

    Cline を使い始めて2ヶ月ぐらい経った。 自分の直感として、Cline は真のイノベーションの入口であり、そして開けてはいけないパンドラの箱でもあったと思う。 ここでいう Cline は Cline型コーディングエージェントであり、広義には Devin / Cursor や Copilot Agent 等を含む話。だが、後述するように Cline でしか見えない世界がある。 その先の未来に、プログラマとしての自分はフルベットする、という話をする。 私たちが知っているプログラミングの終焉 大事なことは次の記事に全部書いてある。まずこれを読んでほしい。 (Google翻訳) Steve Yegge 氏は、置き換えられるのはジュニアおよび中級レベルのプログラマーではなく、新しいプログラミング ツールやパラダイムを受け入れず過去に固執するプログラマーであると指摘しています。 <略> これはプロ

    CLINEに全部賭けろ
    naggg
    naggg 2025/02/27
    "Cline は暴走列車みたいなもので、最初の指示以外は人間なんかどうでもいいと思っているフシがある。その結果、これ抜きに実現できない速さを獲得し、自分はこれ無しで我慢できなくなった。正直、かなりの中毒性があ