タグ

LLMに関するKesinのブックマーク (77)

  • サイバーエージェント社員の20%が使うAIプラットフォーム「Dify」、プロダクト主導で3,000時間/月削減する方法 | CyberAgent Developers Blog

    透明性を高める公開ロードマップ 利用者との信頼構築のためにも、現在運営として何を考えているかわかるよう、機能ロードマップもSlackのリスト機能を活用して公開しています。 v0 (Vercel社が提供する生成AIによって画像・自然言語からUIコードを生成するツール)を使ったプロトタイプなどを使い、ここでやり取りすることにより、各部署/グループ会社のAI活用推進者とも連携をとりつつ、個々のステークホルダーとのやり取りが断片化しないように合意形成を進められます。 OpenView Partners (PLGの提唱企業)によるNotionなどの事例 継続的なカスタマイズ開発 私たちのプロジェクトでは、Difyをシングルテナントのまま、全ユーザーが自由な相手を選べるReBAC(関係ベースのアクセス制御)のアプリ共有機能を独自に実装しました。これにより、利用者ごとの組織・利用形態に合わせた柔軟にアプ

    サイバーエージェント社員の20%が使うAIプラットフォーム「Dify」、プロダクト主導で3,000時間/月削減する方法 | CyberAgent Developers Blog
    Kesin
    Kesin 2025/05/26
    Dify利用事例の共有大変助かる。バッチ処理でリソースを多量に使われてしまう話をちょうど最近聞いたけどアプリごとに調整可能だったのか
  • Claude Code Actionのプロンプト設計が、AIエージェント開発にかなり参考になる件

    Devin, Coding Agent (Github Copilot), Codex (OpenAI) やJules (Google)のような、バックグランド動作するコーディングエージェントが続々と発表されて、ついに先日のAnthropicのカンファレンスでClaude Codeでも同様のことが行えるようになりました! Claude CodeのDevin型コーディングエージェントはGithubワークフロー上で動作するのですが、なんと実装のコードがなんと公開されているではありませんか!! プロンプトやGithubのMCP設定等の実装も垣間見ることが出来ます! AIエージェントを開発している身からすると常時稼働型エージェントを作りたいと考えており、バックグラウンド型のコーディングエージェントの動作はどうしても深ぼらねばと思っていた矢先に撒き餌が...! それだけでなく、プロンプト設計自体の完

    Claude Code Actionのプロンプト設計が、AIエージェント開発にかなり参考になる件
    Kesin
    Kesin 2025/05/25
  • Devin Searchのプロンプト生成機能で指示の精度を上げる

    Devin Searchの機能のうち、Devinへの実装依頼プロンプトを生成する機能がとても使い勝手がいいと感じたので、記事でご紹介します。 そもそもDevin Searchとは? 詳しい説明は公式のドキュメントをご覧いただければと思いますが、ざっくり言うと「リポジトリに関する質問に、関連コードを添えて答えてくれるツール」です。 Devin Searchの画面 「リポジトリを横断的に検索し関連コードを出す」という機能だけでも十分に使えるのですが、個人的に気に入っているのは「検索したコンテキストを使い、そのままプロンプトを生成できる」という点です。 Devinを利用する際の課題と解決策 Devinはリモート型のエージェントでローカルで作業をする必要がない点や、Devin内部のVSCodeやブラウザを使うことでCursorなどのローカル型のエージェントに近い使い方をできるのがとても便利です。

    Devin Searchのプロンプト生成機能で指示の精度を上げる
    Kesin
    Kesin 2025/05/25
  • 【現地最速速報】Microsoft Build 2025 の激選Key Topics🚀【AIまわり】

    現地参加中のMicrosoft Build 2025についてKeynoteが先程終わりました! 参考:Microsoft Build 2025 参考:Book of News(こちらにあらかた今回のアップデートはまとまっています) 記事では現地参加したKeynoteとMS公式のBook of News、 MS公式ブログをもとにし、最新AIアップデートを中心に、個人的に注目なトピックについて取り上げ書いていきたいと思います! また、トピックに関連する MS公式ブログのリンクもなるべく添えるようにしてますのであわせてご覧になるとより詳細とイメージが分かるかと思います! Keynote現地の様子 まずは、現地の様子ということで、Keynote会場の入口の様子です。(朝の6:45頃) 他の写真: 2日目Keynoteの写真: こちらの写真は個人的にまさに今回のAIアップデートを象徴する1枚だなと

    【現地最速速報】Microsoft Build 2025 の激選Key Topics🚀【AIまわり】
    Kesin
    Kesin 2025/05/20
  • GitHub Copilot coding agent in public preview - GitHub Changelog

    BackAI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities an

    GitHub Copilot coding agent in public preview - GitHub Changelog
    Kesin
    Kesin 2025/05/20
    DevinっぽいGitHub Copilot coding agentがpublic preview。多分以前はproject padawanと呼ばれてたやつ。裏でGitHub Actions環境を立ち上げてprの作成を自動でやってくれる。ドキュメントを見るとMCPの設定まで可能らしくて先進的
  • GitHub Models built into your repository is in public preview - GitHub Changelog

    BackAI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities an

    GitHub Models built into your repository is in public preview - GitHub Changelog
    Kesin
    Kesin 2025/05/20
    LLMのプロンプトを各モデルで実行したときの比較、評価を行える機能がpublic preview。よくある機能だとは思うがGitHub Modelsと連携してGitHubの中で無料で使えるのはありがたい
  • DevinをRoo Codeで置き換え、レビュー精度やコスト、速度を大幅に改善した話 〜その定量 & 定性成果から、設計思想まで〜

    レビュー精度:対象PRへの指摘のうち、正しかった指摘割合の平均 再現率:Devinの良い指摘を再現した割合 レビュー内容の精度やコストから、予想以上にDevinのレビュー精度を上回っていることがわかります。 また、レビューの速度についても、Devinと同等 / ほとんどの場合、Devinよりも高速でした。(ローカル環境がそのまま使えるため、環境セットアップの時間が省略されているのもポイントですね) 定量その2 サイクルタイム レビュー精度という数値のみを追いかけてしまうと、「指摘は鋭いがレスポンスが遅い」といった数値ハック・局所最適に陥るリスクがあります。 開発フロー全体の健全性 を測るために、2 つ目の軸としてサイクルタイム という健康指標を導入しています。これから組織で展開する際に、精度にのみ注目し他を見落とすことがないよう、合わせて指標を追っていきます。 計測には technuma

    DevinをRoo Codeで置き換え、レビュー精度やコスト、速度を大幅に改善した話 〜その定量 & 定性成果から、設計思想まで〜
    Kesin
    Kesin 2025/05/16
  • Cline利用におけるデータの取り扱いについて - サーバーワークスエンジニアブログ

    【2025年5月16日追記】 利用規約について、Cline社からの回答により適用範囲が明確となりました。 以下の記事も合わせてご覧ください。 blog.serverworks.co.jp 【2025年5月16日追記ここまで】 これまでClineに関するブログ記事をいくつか公開し紹介してきました。 今回、利用規約の変更に伴うユーザーデータの取り扱いについて懸念が生じたため、記事ではClineの利用規約の中でも特に注意すべき点と、弊社の対応についてご説明します。 Cline利用規約の変更点とデータ収集のリスク Clineの利用規約 (https://cline.bot/tos 更新日: 2025年2月24日) を確認すると、ユーザーコンテンツの取り扱いに関する記述が変更されていることがわかります。特に注目すべきは、利用規約の3.2における以下の記述です。 You further grant,

    Cline利用におけるデータの取り扱いについて - サーバーワークスエンジニアブログ
    Kesin
    Kesin 2025/05/13
    実際に使われてしまうかどうかは分からないものの、業務で使う場合は規約に書いてある通りに受け取るしかない
  • ローカルRAGを手軽に構築できるMCPサーバを作りました

    はじめに 最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。 今回は、LLMの代表的なユースケースとも言えるRAG(Retrieval-Augmented Generation)です。RAGはドキュメントから関連情報を検索し、AIの回答生成に活用する技術で、専門知識や最新情報を必要とするタスクに使われます。以前にTanuki-8BとOllamaとDifyを使って日語ローカルRAG構築という記事でローカルRAGの構築について説明したので詳しくはそちらを参照してください。簡単なRAGの構成図としては以下となります(記事より引用)。 今回は、このRAGをMCPを使って実現します。つくるMCPサーバの中身としてはPostgreSQLでベクトル

    ローカルRAGを手軽に構築できるMCPサーバを作りました
    Kesin
    Kesin 2025/05/08
  • AIエージェントCline、freeeはどうやって全社導入した? - freee Developers Hub

    はじめに 最近のAI関連技術の進化は目まぐるしいですよね。私たちfreeeの開発組織でも、世の中のトレンドに追従、あるいは先回りする形でGitHub Copilotや社内から安全にLLMを利用するための基盤整備にも取り組んできました。そして2025年、これまでの検証フェーズを経て、AI活用をさらに加速させるべく、AIツールの格導入を進めています。 現在、freeeの開発現場では主に GitHub Copilot、Cline、そしてDevinといったAIツールが活用されています(他にも細かなツールはありますが!)。特に最近全開発者向けに開放されたClineは、今後の開発スタイルを変える可能性を秘めていると注目しています。 この記事では、そのClineを全社導入するにあたり、私たちがどのように考え、どのような課題に直面し、そしてどう対策してきたのかをお伝えできればと思います。この記事が、AI

    AIエージェントCline、freeeはどうやって全社導入した? - freee Developers Hub
    Kesin
    Kesin 2025/05/08
    Bedrockとの間に独自Proxyで入力と出力のマスキングか
  • 話題のDeepWikiをセルフホスト?Open DeepWikiを試してみた

    最近、「DeepWiki」が注目されているという話をよく聞きます。 DeepWikiはGithubリポジトリのコードを解析し、自動的にWikiを作成してくれるサービスなのですが、無料プランではプライベートリポジトリに対応していないなど、利用できる機能に制限があります。 そこで、DeepWikiの機能をOSSで実現し、さらに機能が追加されたものがないか探してみたところ、ぴったりのプロジェクトが見つかりました。 OSSで実現したものががありました。その名も 「Open DeepWiki」 です。 そこで今回は、セルフホスト環境でOpen DeepWikiを使用してみました。 概要 Open DeepWikiは以下の技術を使用しているようです。(家DeepWiki 調査) フロントエンド React Next.js ReactMarkdown Mermaid.js Tailwind CSS

    話題のDeepWikiをセルフホスト?Open DeepWikiを試してみた
    Kesin
    Kesin 2025/05/05
  • AI時代に試したものと所感 - memo_md

    技術系のものは Zenn に書いてたので、気づけばこのブログ一年くらい放置していた。苔とか生えてそう。 AI 関係で色々試したり触ってた 世はまさに大 AI 時代なのは周知の事実で、誰もが口を開けば MCP とか Cursor とかの話をしてる。 そういう自分も例外ではなく、ここ最近は色々と触ったり作ったりしてた。 その知見をもとにして仕事でも使う機会も増えてきた。 蓄積されてきた感じがあるので、一回吐き出しておこうかなと思う。 作った / 独自 rules の複製用 CLI ツール "airules" という名前で、AIエディタ用の個人用 rules を管理するためのCLIツールをDenoで作った。 これはJSRで公開してある。開発はすべて Agent に書かせて、自分ではほぼコードは書いてない。 jsr.io github.com 自分はいまのところ Cursor を課金してメインで使

    AI時代に試したものと所感 - memo_md
    Kesin
    Kesin 2025/04/30
    最後のAI関連のアウトプットする意味に悩むの分かる。どうせ一ヶ月後には陳腐化してるかもしれないのと、DeepResearchに聞けば多分誰でも知り得る肌感覚が身に付いてしまったので自分が書く意味を見いだしにくくなった
  • 【今週の話題】OpenAI Codex CLIがマルチプロバイダサポート、Rust実装が追加

    OpenAI Codex CLIの最新版でOpenAI以外の複数のプロバイダをサポートするようになりました。 feat: support multiple providers via Responses-Completion transformation by dnakov · Pull Request #247 · openai/codexIehlmtANJX95U1uN.mp4 Implemented it as a transformation between Responses API and Completion API so that it supports existing providers that implement the Completion API and minimGitHubopenaiこのマルチプロバイダ対応は、dnakov氏のコントリビュートによって実現

    【今週の話題】OpenAI Codex CLIがマルチプロバイダサポート、Rust実装が追加
    Kesin
    Kesin 2025/04/26
    codexの最新情報。codexのマルチプロバイダ対応はClaude Codeの方で有名だった方が実装したらしい。こういう話面白い
  • AI前提のサービス運用について再考する

    [Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails

    AI前提のサービス運用について再考する
    Kesin
    Kesin 2025/04/25
    LLMで運用ドキュメントを参照させる方法の取り組み。単純なRAGだと古いドキュメントを引っ張ってきてしまう問題はたしかにと思いました
  • OpenAI謹製コーディングエージェント Codex + o4-mini が思ってたよりもシェル芸エンジニアだった - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに OpenAIがコーディングエージェントCodexをOSSライセンスで公開しました。 この記事ではCodex + o4-mini がどのようにコーディングを行うのか分析します。 Codexとは Codexの使い方などについては以下の記事にまとめられています。 Codexの動きを分析してみる システムプロンプト agent-loop.tsの末尾にシステムプロンプトが記載れています。 ロール定義 1. 「Codex CLI」という身体を持った存在として振る舞え You are operating as and within the

    Kesin
    Kesin 2025/04/25
  • User prompt improvement is now in public preview within the GitHub Models playground · GitHub Changelog

    AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

    User prompt improvement is now in public preview within the GitHub Models playground · GitHub Changelog
    Kesin
    Kesin 2025/04/25
    GitHub Modelsにプロンプトの改良機能が追加された。他の有名どころでは大体存在している機能ではあるので順当な改良か
  • AIエージェントの地上戦 〜開発計画と運用実践 / 2025/04/08 Findy W&Bミートアップ #19

    こちらのイベントで登壇した資料になります。 https://findy.connpass.com/event/348365/ Algomatic では全方位全職種積極採用中です: https://jobs.algomatic.jp/

    AIエージェントの地上戦 〜開発計画と運用実践 / 2025/04/08 Findy W&Bミートアップ #19
  • Playwright MCP を使ってAIにUXを評価してもらう - Qiita

    はじめに 乗り遅れましたが巷ではMCPが流行っていたので、気になっていたPlaywright MCPを使ってみたいと思います。 今回は、AIが画面操作を出来るならUXも評価してくれるのでは?という思い付きを試してみました。 1. MCPとは? MCPは、Model Context Protocolの略称です。 Protocolとある通り、「AI」と「サービスやリソース」を繋ぐ、共通規格です。 従来の悩み 従来は、AIと他サービスやリソースを連携させる際、それぞれの接続先ごとに個別の実装が必要となり、開発者に大きな負担がかかっていました。 下記ではAIエージェントが利用できるように「ブラウザ操作」「画像生成」など個別に実装する必要があります。 MCPが解決すること 「AI」と「サービスやリソース」を繋ぐ部分を共通規格化することで、開発の負担が減り、手軽にAIとサービス・リソースを接続できるよ

    Playwright MCP を使ってAIにUXを評価してもらう - Qiita
    Kesin
    Kesin 2025/04/16
    面白い使い方だ。開発内部の人間はどうしてもバイアスがかかるからAIは多少間違えることを差し引いてもAIに判断させるのはコスパが良さそう
  • MCPサーバーを安全に動かすための工夫

    現在普及しているStdioServerTransport型MCPサーバーの使用方法は設定ファイルにnpxやuvxコマンドを記述する。​これはその場でダウンロードしたスクリプトファイルを実行することを意味する。 https://code.visualstudio.com/docs/copilot/chat/mcp-servers​しかしこの実行方式は開発者には悪名高いソフトウェアのインストール手順「curlしてbash(URLでダウンロードしてきたシェルスクリプトをパイプしてノールック実行)」を思い出させる。「curlしてbash」なら単一の信頼した配布元を基準に判断できるがnpxやuvx方式は依存するライブラリも芋づる式に参照してくる。つまり任意のコードをどこかの経路(MCPサーバー体でなくその内部の別の依存ライブラリかもしれない)を通じて実行される可能性は残る。 curl | bash

    MCPサーバーを安全に動かすための工夫
    Kesin
    Kesin 2025/04/12
    ファイルシステム、環境変数に加えて通信先も許可制にできるDenoはMCPの用途に向いていると思う。けどjs製以外のMCPサーバーには使えないのでもっと標準的な方法がデファクトスタンダードとして登場してほしい
  • うさぎでもわかる マルチエージェントLLMシステムの失敗理由

    うさぎでもわかる マルチエージェントLLMシステムの失敗理由 はじめに:うさぎ村の困りごと こんにちは、今日はうさぎさんたちの困りごとについて、お話しましょう。 うさぎ村には、色々な役割のうさぎさんたちが住んでいます。みんなが力を合わせて「大きなニンジンケーキ」を作ることになったのですが、なぜか上手くいかないんです... でも、なぜうまくいかないのでしょう。みんなとても賢いうさぎたちなのに、一緒に協力するとどうもうまくいかないことがしばしば...これって、不思議ですよね? 実は、これとよく似た問題がAI技術の世界でも起きているんです。「マルチエージェントLLMシステム」と呼ばれる、複数のAIが協力して作業を行うシステムが、理論上は素晴らしいはずなのに実際にはうまく機能しないという問題が研究で明らかになりました。 今回は、この研究論文「Why Do Multi-Agent LLM Syste

    うさぎでもわかる マルチエージェントLLMシステムの失敗理由
    Kesin
    Kesin 2025/04/11
    失敗の原因が人間と似すぎていて面白い