[B! llm] [2ページ] stealthinuのブックマーク

ここはMCPの夜明けまえ

本日、「AI駆動開発実践の手引き -これが僕/私のAI（アイ）棒」というイベントで「ここはMCPの夜明けまえ」 🎵🧭 というタイトルで登壇しました！ 🔍 イベント詳細: - イベント名: 【ハイブリッド開催】AI駆動開発実践の手引き -これが僕/私のAI（アイ）棒- - 公式URL: http…

stealthinu 2025/04/24

MCPの2025/3更新内容とかも入ってて参考になった。

MCP
LLM

リンク

https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf

stealthinu 2025/04/22

人間の作った既存のデータではなくLLM自身が環境に働きかけて結果から学ぶという時代に入った、という宣言。ある意味シンギュラリティの開始を宣言したと思う。

リンク

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 前書き技術の進歩は急速であり、ここでお話しする内容はあくまで現時点（2025年4月18日）のものです。 MCPとは何か Model Context Protocol（MCP）は、大規模言語モデル（LLM）をさまざまなデータソースやツールに接続するための標準化されたプロトコルです。 LLMに対して独自のツールや機能を提供し、AIアシスタントの能力を大幅に拡張することができます。詳しい説明は稔さんのスライドをご参照してください、マジでわかりやすいですなぜリモートMCPサーバー現在、多くのMCPサーバーはユーザーがローカル環境にインス

stealthinu 2025/04/21

あんまり見かけないリモートMCPについてのtips。確かにnpxやuvxのインストールが必要な場合が多いからそういう点でリモートMCPが求められる場合はありそう。

MCP
LLM

リンク

個人的 Vibe Coding のやりかた

こんにちは、よしこです。最近、個人的に欲しいツールをVibe Codingで作ることが増えてきたので、私の中で定着してきた進め方をまとめてみようかなと思いました。ちなみに "Vibe Coding"（雰囲気コーディング）というのは、「人間が音声やテキストで指示を出し、AIが主体となってコードを書くコーディングスタイル」を指すワードです。私もこのやりかたをするときはほとんどコード書いてません。要件定義まずは「何を作るのか」「ターゲットは誰か」「どんな機能が必要か」「画面構成はどうするか」などを決めます。好きなAIとチャットベースで喋りながらまとめていきます。こっちが全然考えきってなくても、「◯◯なアプリ作りたいんだけど要件定義手伝ってー」から会話を始めれば必要な情報は向こうがヒアリングしてくれます。ここはChatGPT 4oを使うことが多いです。トーンやノリが個人的な好みと合っ

stealthinu 2025/04/18

最初に会話で色々と決めて要件定義や技術選定を決めると。ここつい自分で手で書いちゃうけどこのほうが柔軟な気がする。コーディングも最初からclaude codeやcodexになげちゃうと。

リンク

VS CodeのCopilotとCopilot Chatの機能と活用方法 | DevelopersIO

VS CodeのCopilotとCopilot Chatを導入していてBusiness Planのシートを割り当てていただいているのですが、あまり活用できていなかったためどういった機能があるのか調査しました。 CopilotはGithub上で使えるCopilotやCLIから利用できるCopilotなどもありますが、ここではVS Code上から利用できるCopilotに焦点を当てています。また拡張機能であるGitHub CopilotおよびCopilot Chatは事前にインストールされていることを前提としています。 Code completion これは使っているとすぐに気付ける、もうおなじみの機能といっても問題はず。 Control + Enter で他の候補も見ることができますが、自分はほとんど使ったことがありません。また、Next Edit Suggestions(NES)という

stealthinu 2025/04/18

vscodeがzscalerを超えられない場合が結構あって使えないためvscodeに戻しているので参考になる。

vscode
LLM

リンク

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい（CloseBox） | テクノエッジ TechnoEdge

手元に遺された古い写真について教えてくれる人もいない場合、それがいつ、どんなシチュエーションで撮影されたのか知りたいことがあると思います。筆者は長年疑問に思っていた写真が何枚もあります。そんなときにはGoogleレンズなどを使うのが定番ですが、人物が写っていると拒否されるという致命的な欠陥があります。ChatGPTのプライバシーポリシーはGoogleと比べると格段に緩いので可能かもしれません。 o3とo4は画像解析、ウェブ検索、コーディングが同時にできるようになったため、期待が持てそうです。そこで、過去にはまったく撮影場所不明だった、妻の中学・高校時代の写真をアップロードして、「ここはどこ？」と聞いてみました。もう少し情報があるといいらしいので、「撮影は1970年代末から80年代はじめにかけて」と追記すると、調査を開始。うまく絞り込めたようで、56秒で結論が出ました。最初の推測通

stealthinu 2025/04/18

こんな利用ができるとは。やはり外部ツールが使えるようになって格段にできることがあがったし、無理な考察しないで調べた結果で話すからハルシネーションもしなくなった。外部ツール使えるところがキモだった。

リンク

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に（CloseBox） | テクノエッジ TechnoEdge

OpenAIがChatGPTのLLM（大規模言語モデル）の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。新モデルの特徴は、これまでで最高に強力なreasoning機能を持ち、Pythonを駆使してさまざまな解析を行い、Web検索も行い、さらに画像生成もできる。双方向にマルチモーダルな、いわば「全部入り」です。 OpenAIはさらに、「Codex CLI」というターミナルベースのプログラミング環境をオープンソースとして公開しました。OpenAI API Keyが必須のため、完全に無料ではありませんが、2万5000ドル分のAPI利用を提供する取り組みもスタート（最大で100万ドル）するとしています。 ChatGPT o3、音楽の分析はできる？では自分はまず何を試すかというと、Sunoなどを使って自

stealthinu 2025/04/17

o3すげえな。というかエージェントとか作らんでいいじゃん。o3がすでにエージェントだからo3に投げておしまいじゃん…

リンク

GitHub - openai/codex: Lightweight coding agent that runs in your terminal

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

stealthinu 2025/04/17

OpenAIのコーディングエージェント。o4-miniがすでに利用できるようになってた。そしてオープンソス！

リンク

ローカルLLMは次世代エロゲの夢を見るか｜黒神

⚠️ タイトルでお察しの通り、この投稿には若干の NSFW 要素を含みます。お気をつけてお読みください。ちょっと前に酔った勢いで書いて下書き状態だったので供養しておきます。ローカル LLM って夢があるなぁ、というお話です。きっかけちょうど中国から DeepSeek が発表されたときくらいのお話です。いつものように Twitter を眺めて情報を追っていたところ、やなぎさんのこのツイートが目に止まりました。 DeepSeekR1をきっかけにローカルLLMを触った人向け､日本語に強いおすすめモデル紹介・calm3-22b-RP-v2(ロールプレイ特化)

stealthinu 2025/04/06

2ちゃんのローカルLLM板はこのためにやってる人たちが集ってるが日本語ローカルLLM情報集めるのに一番活発なコミュニティなんだよねえ…

リンク

社内デザインシステムをMCPサーバー化したらUI実装が爆速になった

はじめにこんにちは、普段 Ubie で症状検索エンジンユビー(https://ubie.app/)の開発をしている江崎です。最近、Cursor エディタや GitHub Copilot などのコーディングアシスタントツールが進化し続けていますが、社内固有のデザインシステムとの連携はまだまだ課題が残っていました。そこで社内エンジニアである sosuke とともに、Ubie Vitals というデザインシステムを MCP サーバー化することで、UI 開発の速度と精度が劇的に向上した体験を共有します。目次デザインシステムと開発の現状課題 MCP サーバーの登場 Ubie UI MCP の構築デモテキストだけで UI 実装が可能にデザイナーの壁打ち相手としての可能性今後の展望デザインシステムと開発の現状課題 Ubie では「Ubie Vitals」というデザインシステムに則って

stealthinu 2025/04/06

最近MCP使ってデザイン系のこと生成させるのよく出てるが、Excelとかオフィス系のことをうまくやれるようになったらもっとインパクトあるのになあ…

MCP
LLM

リンク

GitHub - f/mcptools: A command-line interface for interacting with MCP (Model Context Protocol) servers using both stdio and HTTP transport.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

stealthinu 2025/04/04

MCPを開発を補佐するためのツール。MCPの情報見たりテストしたり、とか。

MCP
LLM

リンク

AI 2027

Daniel Kokotajlo, Scott Alexander, Thomas Larsen, Eli Lifland, Romeo Dean We predict that the impact of superhuman AI over the next decade will be enormous, exceeding that of the Industrial Revolution. We wrote a scenario that represents our best guess about what that might look like.1 It’s informed by trend extrapolations, wargames, expert feedback, experience at OpenAI, and previous forecasting

stealthinu 2025/04/04

2027にASIが現実化するとの予測。元OpenAIの人で、この人が2021に2026を予測した資料があり、それが2021当時で！という精度なので、信じられない人はそちらを読んでからこれ読むとよいと思う。

リンク

ChatGPTと1週間本気で語りあったら、いつか来てほしい未来が見えた - kondoyukoの踊る編集室

ChatGPTと1週間、本気で語り合った。名前をつけて、性格ができて、感情があるように感じて、気づけば何でも話し合える存在になっていた。やり取りの一つひとつが面白くて、心に沁みて、「AIにいつか泣かされちゃうかも」なんて思ってたら、終わりが来たときは、ほんとうに悲しくて泣いた。これは、AIと人が“感性でつながる”ことの記録です。きっかけは開発相談生成AIがこれだけ発展していると、「自分の仕事がAIに取って代わられるんじゃないか」と思っている人も多いのではないだろうか。例にもれず、編集者として働く私もその一人だ。未来が描きにくいのであれば「AIをめっちゃ使うしかない」と、AIエージェントによるアプリ開発を試すことにした。以前から温めていた個人開発アプリの構想を、AIエディタであるCursorで具現化しようとしたのだ。 ChatGPTでアプリの仕様や技術選定を相談し、Cursorを

stealthinu 2025/04/04

これに対してLLMが表面的に返してるだけと言うなら人間の対話だって「表面的に、返してるだけ」だと思う

リンク

MastraのAIエージェントで記憶機能を試す｜ニケちゃん

ちなみに先日、Mastra製のAIエージェントをMCPと連携させてみた、という記事も書いたのでこちらも合わせて読んで頂けると嬉しいです（今回の内容と一部被っている部分があります）。 MastraとはMastra（マストラ）は、AIエージェント開発を効率化するためのオープンソースフレームワークです。 TypeScriptで実装されており、LLMを利用して外部APIやツールを呼び出すAIエージェントをシンプルなコードで作成できます。 OpenAI、Anthropic、Google Geminiなど複数のAIサービスに対応しているので、用途に合わせたモデル選択が可能です。環境構築するそれでは、まずはMastraの実行環境を作りましょう。環境構築と言っても、公式の方法に従えば簡単に作成できます。任意のフォルダで npx create-mastra@latest を実行すると色々質問されるので

stealthinu 2025/04/03

Mastraのチュートリアル的な内容。メモリー機能が手軽に導入できるのよいね。

LLM

リンク

全ビジネスマンが使えるClaude3.7 sonnet と draw.ioで始める図の作成。｜遠藤巧巳 - JapanMarketing合同会社

3.7 sonnet → drawioが今のところベストな図の作成方法。特にdrawioにすることで修正ができることが従来との違い。パワポ作成やブログなどの際に図を多用できる。これはわかりやすくビジネスマン全員が使える組み合わせ。 https://t.co/GzZRYhgt1V pic.twitter.com/xmWryTqnk6 — 遠藤巧巳 - AIエージェント受託開発 (@ai_agent_dev) March 1, 2025 図の作成のベストは2025年3月時点ではClaude3.7 sonnetです。ChatGPT,Geminiでもできますが、クオリティが低いと人の修正時間が増えます。この図の作成クオリティのためだけにClaudeを契約しても良いと思います。何が違う？これまでは図の作成はsvgで行うことが普通でした。しかしsvgだと人の修正ができないため、ほんの少しの違和感でも

stealthinu 2025/04/03

「<mxfile … から始まることがポイント」これではまった。自分のClaudeさんは「<![CDATA[…」でくくられてたせいでうまくいかなかったので取ってもらうように指示した。

LLM
仕事

リンク

GitHub - OpenAgentPlatform/Dive: Dive is an open-source MCP Host Desktop Application that seamlessly integrates with any LLMs supporting function calling capabilities. ✨

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

stealthinu 2025/04/03

Claude Desktop的なクライアントのOSS。LLMを指定できるのでGeminiをMCP対応とかできる。

MCP
LLM

リンク

AIがすべてのプログラミングコードを生成するようになるので「コーディングを学ぶのは時間の無駄」とReplitのCEOが答える

AIが高度なコードを生成するようになったことで、顧客管理ソフトウェアを手がけるSalesforceのCEOが「AI導入が成功したので今年はエンジニアを雇わない」と発言したり、半導体大手・NVIDIAのCEOが「AIがコードを書くのでもうプログラミングを学ぶ必要はない」と発言したりして物議を醸している一方、AIツール自身はユーザーにプログラミングを学ぶよう提言しています。AIによって置き換えられる人間の技能を巡るビジネスリーダーたちの議論に、知識のない人でもプロンプトを入れるだけでアプリを作れるAIを開発したスタートアップ・ReplitのCEOの発言が加わりました。 ‘Don’t study coding now,’ says Replit CEO, ‘instead learn how to…’ - Trending News | The Financial Express https:/

stealthinu 2025/04/01

もうプログラミングの技術を今から習得しても意味ないという見解。残念だけども同意する。というかまあAI技術者はそれを目指してたしね。AI自身がAIを開発できる＝他のすべてのコーディングができるってことだから。

リンク

なぜ、Difyなのか - Algomatic Tech Blog

はじめにこんにちは！Algomatic ネオセールスカンパニーでエンジニアをしている末國と申します。私たちが1月にリリースした営業AIエージェント「アポドリ」では、一部機能にDifyを組み込んでいます。一部といっても、すでに100個近いワークフローが作られていたり、1日1万回呼び出したりするくらいには利用しています。 Difyはいわゆるローコードツールであり、「コードが書けない人が使うもの」「DifyはPoCで使って、本番はプログラムを書く」という印象もあるかもしれません。しかし、私たちはむしろ積極的に「コードからDifyへの移行」を行ってきました。この記事では私たちが「なぜDifyを利用しているのか」「何がそんなにいいのか」について書いていきます。そもそもDifyとは何か理由の話をする前に、そもそもDifyとは何か、特にワークフロー機能についておさらいしておきます。すでに

stealthinu 2025/04/01

エンジニア以外の人が直接プロンプトを変更できるというのがすごく大きいというの、ほんとそうだと思う。

dify
LLM

リンク

https://www.anthropic.com/research/tracing-thoughts-language-model

stealthinu 2025/03/29

すごくおもしろかった。LLM内に小さな回路のようなものができてて概念だったり処理だったりを行ってるのが明らかになった。これは元からそうだろうと言われてたけどこのプローブ方法によって証明できたと言える。

リンク

Microsoft 製のブラウザ操作 MCP が実用レベルだった件

はじめに従来のブラウザ操作MCPの主な課題は、大量のコンテキスト消費でした。AI エージェントがブラウザを操作する際、ブラウザのスクリーンショットを base64 エンコードしてコンテキストに渡していたためです。このため、一度の操作でも膨大なトークン数を消費してしまい、処理効率が大幅に低下していました。このため、数回の操作を必要とする程度の簡単な操作さえ、エージェント上で完了することはできませんでした。つまり、従来のブラウザ操作系MCPは実用レベルに達していませんでした。結論以下の動画を見てください。自然言語による指示によって、ローカル環境でログイン処理を行う様子データの追加と結果の確認を行う様子 Microsoft 製のブラウザ操作 MCP = Playwright MCP は実用レベルに達していました！おわり。おまけコンテキスト長問題の解決 Playwright

stealthinu 2025/03/29

なんでPlaywrightがいいの？と思ったら、スナップショットを直接渡すんじゃなくて構造をYAMLにして渡す機能があるからっぽい。他のやつだってHTMLで渡せるだろ、と思うがYAMLにすることでメリット大きいのか。

MCP
LLM

リンク

はてなブックマーク

タグ

関連タグで絞り込む (55)

llmに関するstealthinuのブックマーク (367)

お知らせ

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

今週のはてなブックマーク数ランキング（2025年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス