[B! LLM] Kesinのブックマーク

サイバーエージェント社員の20%が使うAIプラットフォーム「Dify」、プロダクト主導で3,000時間/月削減する方法 | CyberAgent Developers Blog

透明性を高める公開ロードマップ利用者との信頼構築のためにも、現在運営として何を考えているかわかるよう、機能ロードマップもSlackのリスト機能を活用して公開しています。 v0 (Vercel社が提供する生成AIによって画像・自然言語からUIコードを生成するツール)を使ったプロトタイプなどを使い、ここでやり取りすることにより、各部署/グループ会社のAI活用推進者とも連携をとりつつ、個々のステークホルダーとのやり取りが断片化しないように合意形成を進められます。 OpenView Partners （PLGの提唱企業）によるNotionなどの事例継続的なカスタマイズ開発私たちのプロジェクトでは、Difyをシングルテナントのまま、全ユーザーが自由な相手を選べるReBAC（関係ベースのアクセス制御）のアプリ共有機能を独自に実装しました。これにより、利用者ごとの組織・利用形態に合わせた柔軟にアプ

Kesin 2025/05/26

Dify利用事例の共有大変助かる。バッチ処理でリソースを多量に使われてしまう話をちょうど最近聞いたけどアプリごとに調整可能だったのか

Dify
LLM

リンク

Claude Code Actionのプロンプト設計が、AIエージェント開発にかなり参考になる件

Devin, Coding Agent (Github Copilot), Codex (OpenAI) やJules (Google)のような、バックグランド動作するコーディングエージェントが続々と発表されて、ついに先日のAnthropicのカンファレンスでClaude Codeでも同様のことが行えるようになりました！ Claude CodeのDevin型コーディングエージェントはGithubワークフロー上で動作するのですが、なんと実装のコードがなんと公開されているではありませんか！！プロンプトやGithubのMCP設定等の実装も垣間見ることが出来ます！ AIエージェントを開発している身からすると常時稼働型エージェントを作りたいと考えており、バックグラウンド型のコーディングエージェントの動作はどうしても深ぼらねばと思っていた矢先に撒き餌が...！それだけでなく、プロンプト設計自体の完

Kesin 2025/05/25

LLM

リンク

Devin Searchのプロンプト生成機能で指示の精度を上げる

Devin Searchの機能のうち、Devinへの実装依頼プロンプトを生成する機能がとても使い勝手がいいと感じたので、本記事でご紹介します。そもそもDevin Searchとは？詳しい説明は公式のドキュメントをご覧いただければと思いますが、ざっくり言うと「リポジトリに関する質問に、関連コードを添えて答えてくれるツール」です。 Devin Searchの画面「リポジトリを横断的に検索し関連コードを出す」という機能だけでも十分に使えるのですが、個人的に気に入っているのは「検索したコンテキストを使い、そのままプロンプトを生成できる」という点です。 Devinを利用する際の課題と解決策 Devinはリモート型のエージェントでローカルで作業をする必要がない点や、Devin内部のVSCodeやブラウザを使うことでCursorなどのローカル型のエージェントに近い使い方をできるのがとても便利です。

Kesin 2025/05/25

LLM

リンク

【現地最速速報】Microsoft Build 2025 の激選Key Topics🚀【AIまわり】

現地参加中のMicrosoft Build 2025についてKeynoteが先程終わりました! 参考:Microsoft Build 2025 参考:Book of News(こちらにあらかた今回のアップデートはまとまっています) 本記事では現地参加したKeynoteとMS公式のBook of News、 MS公式ブログをもとにし､最新AIアップデートを中心に､個人的に注目なトピックについて取り上げ書いていきたいと思います！また、トピックに関連する MS公式ブログのリンクもなるべく添えるようにしてますのであわせてご覧になるとより詳細とイメージが分かるかと思います！ Keynote現地の様子まずは､現地の様子ということで､Keynote会場の入口の様子です｡(朝の6:45頃) 他の写真: 2日目Keynoteの写真: こちらの写真は個人的にまさに今回のAIアップデートを象徴する1枚だなと

Kesin 2025/05/20

LLM

リンク

GitHub Copilot coding agent in public preview - GitHub Changelog

BackAI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities an

Kesin 2025/05/20

DevinっぽいGitHub Copilot coding agentがpublic preview。多分以前はproject padawanと呼ばれてたやつ。裏でGitHub Actions環境を立ち上げてprの作成を自動でやってくれる。ドキュメントを見るとMCPの設定まで可能らしくて先進的

github
LLM

リンク

GitHub Models built into your repository is in public preview - GitHub Changelog

BackAI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities an

Kesin 2025/05/20

LLMのプロンプトを各モデルで実行したときの比較、評価を行える機能がpublic preview。よくある機能だとは思うがGitHub Modelsと連携してGitHubの中で無料で使えるのはありがたい

github
LLM

リンク

DevinをRoo Codeで置き換え、レビュー精度やコスト、速度を大幅に改善した話〜その定量 & 定性成果から、設計思想まで〜

レビュー精度：対象PRへの指摘のうち、正しかった指摘割合の平均再現率：Devinの良い指摘を再現した割合レビュー内容の精度やコストから、予想以上にDevinのレビュー精度を上回っていることがわかります。また、レビューの速度についても、Devinと同等 / ほとんどの場合、Devinよりも高速でした。（ローカル環境がそのまま使えるため、環境セットアップの時間が省略されているのもポイントですね）定量その2 サイクルタイムレビュー精度という数値のみを追いかけてしまうと、「指摘は鋭いがレスポンスが遅い」といった数値ハック・局所最適に陥るリスクがあります。開発フロー全体の健全性を測るために、2 つ目の軸としてサイクルタイムという健康指標を導入しています。これから組織で展開する際に、精度にのみ注目し他を見落とすことがないよう、合わせて指標を追っていきます。計測には technuma

Kesin 2025/05/16

LLM

リンク

Cline利用におけるデータの取り扱いについて - サーバーワークスエンジニアブログ

【2025年5月16日追記】利用規約について、Cline社からの回答により適用範囲が明確となりました。以下の記事も合わせてご覧ください。 blog.serverworks.co.jp 【2025年5月16日追記ここまで】これまでClineに関するブログ記事をいくつか公開し紹介してきました。今回、利用規約の変更に伴うユーザーデータの取り扱いについて懸念が生じたため、本記事ではClineの利用規約の中でも特に注意すべき点と、弊社の対応についてご説明します。 Cline利用規約の変更点とデータ収集のリスク Clineの利用規約 (https://cline.bot/tos 更新日: 2025年2月24日) を確認すると、ユーザーコンテンツの取り扱いに関する記述が変更されていることがわかります。特に注目すべきは、利用規約の3.2における以下の記述です。 You further grant,

Kesin 2025/05/13

実際に使われてしまうかどうかは分からないものの、業務で使う場合は規約に書いてある通りに受け取るしかない

LLM

リンク

ローカルRAGを手軽に構築できるMCPサーバを作りました

はじめに最近話題のMCP（Model Context Protocol）記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください（お約束）。今回は、LLMの代表的なユースケースとも言えるRAG（Retrieval-Augmented Generation）です。RAGはドキュメントから関連情報を検索し、AIの回答生成に活用する技術で、専門知識や最新情報を必要とするタスクに使われます。以前にTanuki-8BとOllamaとDifyを使って日本語ローカルRAG構築という記事でローカルRAGの構築について説明したので詳しくはそちらを参照してください。簡単なRAGの構成図としては以下となります（記事より引用）。今回は、このRAGをMCPを使って実現します。つくるMCPサーバの中身としてはPostgreSQLでベクトル

Kesin 2025/05/08

LLM

リンク

AIエージェントCline、freeeはどうやって全社導入した？ - freee Developers Hub

はじめに最近のAI関連技術の進化は目まぐるしいですよね。私たちfreeeの開発組織でも、世の中のトレンドに追従、あるいは先回りする形でGitHub Copilotや社内から安全にLLMを利用するための基盤整備にも取り組んできました。そして2025年、これまでの検証フェーズを経て、AI活用をさらに加速させるべく、AIツールの本格導入を進めています。現在、freeeの開発現場では主に GitHub Copilot、Cline、そしてDevinといったAIツールが活用されています（他にも細かなツールはありますが！）。特に最近全開発者向けに開放されたClineは、今後の開発スタイルを変える可能性を秘めていると注目しています。この記事では、そのClineを全社導入するにあたり、私たちがどのように考え、どのような課題に直面し、そしてどう対策してきたのかをお伝えできればと思います。この記事が、AI

Kesin 2025/05/08

Bedrockとの間に独自Proxyで入力と出力のマスキングか

LLM

リンク

話題のDeepWikiをセルフホスト？Open DeepWikiを試してみた

最近、「DeepWiki」が注目されているという話をよく聞きます。 DeepWikiはGithubリポジトリのコードを解析し、自動的にWikiを作成してくれるサービスなのですが、無料プランではプライベートリポジトリに対応していないなど、利用できる機能に制限があります。そこで、DeepWikiの機能をOSSで実現し、さらに機能が追加されたものがないか探してみたところ、ぴったりのプロジェクトが見つかりました。 OSSで実現したものががありました。その名も「Open DeepWiki」です。そこで今回は、セルフホスト環境でOpen DeepWikiを使用してみました。概要 Open DeepWikiは以下の技術を使用しているようです。(本家DeepWiki 調査) フロントエンド React Next.js React Markdown Mermaid.js Tailwind CSS バ

Kesin 2025/05/05

LLM

リンク

AI時代に試したものと所感 - memo_md

技術系のものは Zenn に書いてたので、気づけばこのブログ一年くらい放置していた。苔とか生えてそう。 AI 関係で色々試したり触ってた世はまさに大 AI 時代なのは周知の事実で、誰もが口を開けば MCP とか Cursor とかの話をしてる。そういう自分も例外ではなく、ここ最近は色々と触ったり作ったりしてた。その知見をもとにして仕事でも使う機会も増えてきた。蓄積されてきた感じがあるので、一回吐き出しておこうかなと思う。作った / 独自 rules の複製用 CLI ツール "airules" という名前で、AIエディタ用の個人用 rules を管理するためのCLIツールをDenoで作った。これはJSRで公開してある。開発はすべて Agent に書かせて、自分ではほぼコードは書いてない。 jsr.io github.com 自分はいまのところ Cursor を課金してメインで使

Kesin 2025/04/30

最後のAI関連のアウトプットする意味に悩むの分かる。どうせ一ヶ月後には陳腐化してるかもしれないのと、DeepResearchに聞けば多分誰でも知り得る肌感覚が身に付いてしまったので自分が書く意味を見いだしにくくなった

LLM

リンク

【今週の話題】OpenAI Codex CLIがマルチプロバイダサポート、Rust実装が追加

OpenAI Codex CLIの最新版でOpenAI以外の複数のプロバイダをサポートするようになりました。 feat: support multiple providers via Responses-Completion transf ormation by dnakov · Pull Request #247 · openai/codexIehlmtANJX95U1uN.mp4 Implemented it as a transf ormation between Responses API and Completion API so that it supports existing providers that implement the Completion API and minim…GitHub openaiこのマルチプロバイダ対応は、dnakov氏のコントリビュートによって実現

Kesin 2025/04/26

codexの最新情報。codexのマルチプロバイダ対応はClaude Codeの方で有名だった方が実装したらしい。こういう話面白い

LLM

リンク

AI前提のサービス運用について再考する

[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails

Kesin 2025/04/25

LLMで運用ドキュメントを参照させる方法の取り組み。単純なRAGだと古いドキュメントを引っ張ってきてしまう問題はたしかにと思いました

LLM
開発

リンク

OpenAI謹製コーディングエージェント Codex + o4-mini が思ってたよりもシェル芸エンジニアだった - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに OpenAIがコーディングエージェントCodexをOSSライセンスで公開しました。この記事ではCodex + o4-mini がどのようにコーディングを行うのか分析します。 Codexとは Codexの使い方などについては以下の記事にまとめられています。 Codexの動きを分析してみるシステムプロンプト agent-loop.tsの末尾にシステムプロンプトが記載れています。ロール定義 1. 「Codex CLI」という身体を持った存在として振る舞え You are operating as and within the

Kesin 2025/04/25

LLM

リンク

User prompt improvement is now in public preview within the GitHub Models playground · GitHub Changelog

AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

Kesin 2025/04/25

GitHub Modelsにプロンプトの改良機能が追加された。他の有名どころでは大体存在している機能ではあるので順当な改良か

github
LLM

リンク

AIエージェントの地上戦〜開発計画と運用実践 / 2025/04/08 Findy W&Bミートアップ #19

こちらのイベントで登壇した資料になります。 https://findy.connpass.com/event/348365/ Algomatic では全方位全職種積極採用中です： https://jobs.algomatic.jp/

Kesin 2025/04/20

開発
LLM

リンク

Playwright MCP を使ってAIにUXを評価してもらう - Qiita

はじめに乗り遅れましたが巷ではMCPが流行っていたので、気になっていたPlaywright MCPを使ってみたいと思います。今回は、AIが画面操作を出来るならUXも評価してくれるのでは？という思い付きを試してみました。 1. MCPとは？ MCPは、Model Context Protocolの略称です。 Protocolとある通り、「AI」と「サービスやリソース」を繋ぐ、共通規格です。従来の悩み従来は、AIと他サービスやリソースを連携させる際、それぞれの接続先ごとに個別の実装が必要となり、開発者に大きな負担がかかっていました。下記ではAIエージェントが利用できるように「ブラウザ操作」「画像生成」など個別に実装する必要があります。 MCPが解決すること「AI」と「サービスやリソース」を繋ぐ部分を共通規格化することで、開発の負担が減り、手軽にAIとサービス・リソースを接続できるよ

Kesin 2025/04/16

面白い使い方だ。開発内部の人間はどうしてもバイアスがかかるからAIは多少間違えることを差し引いてもAIに判断させるのはコスパが良さそう

LLM

リンク

MCPサーバーを安全に動かすための工夫

現在普及しているStdioServerTransport型MCPサーバーの使用方法は設定ファイルにnpxやuvxコマンドを記述する。これはその場でダウンロードしたスクリプトファイルを実行することを意味する。 https://code.visualstudio.com/docs/copilot/chat/mcp-serversしかしこの実行方式は開発者には悪名高いソフトウェアのインストール手順「curlしてbash（URLでダウンロードしてきたシェルスクリプトをパイプしてノールック実行）」を思い出させる。「curlしてbash」なら単一の信頼した配布元を基準に判断できるがnpxやuvx方式は依存するライブラリも芋づる式に参照してくる。つまり任意のコードをどこかの経路（MCPサーバー本体でなくその内部の別の依存ライブラリかもしれない）を通じて実行される可能性は残る。 curl | bash

Kesin 2025/04/12

ファイルシステム、環境変数に加えて通信先も許可制にできるDenoはMCPの用途に向いていると思う。けどjs製以外のMCPサーバーには使えないのでもっと標準的な方法がデファクトスタンダードとして登場してほしい

mcp
LLM

リンク

うさぎでもわかるマルチエージェントLLMシステムの失敗理由

うさぎでもわかるマルチエージェントLLMシステムの失敗理由はじめに：うさぎ村の困りごとこんにちは、今日はうさぎさんたちの困りごとについて、お話しましょう。うさぎ村には、色々な役割のうさぎさんたちが住んでいます。みんなが力を合わせて「大きなニンジンケーキ」を作ることになったのですが、なぜか上手くいかないんです... でも、なぜうまくいかないのでしょう。みんなとても賢いうさぎたちなのに、一緒に協力するとどうもうまくいかないことがしばしば...これって、不思議ですよね？実は、これとよく似た問題がAI 技術の世界でも起きているんです。「マルチエージェントLLMシステム」と呼ばれる、複数のAIが協力して作業を行うシステムが、理論上は素晴らしいはずなのに実際にはうまく機能しないという問題が研究で明らかになりました。今回は、この研究論文「Why Do Multi-Agent LLM Syste

Kesin 2025/04/11

失敗の原因が人間と似すぎていて面白い

LLM

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

LLMに関するKesinのブックマーク (77)

お知らせ

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

今週のはてなブックマーク数ランキング（2025年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス