[B! LLM] stealthinuのブックマーク

社内勉強会の内容共有はNotebookLMでやるのがいいかもと思った話 | DevelopersIO

お疲れさまです。とーちです。皆さんの会社では社内勉強会をやったりしていますか？業務都合等もあって勉強会に参加できない人もいると思いますが、そういった方にも勉強会の内容は共有したいですよね。また、勉強会後に個人的に復習したいなというケースもあるかなと思います。こういった勉強会の内容の共有をするためにNotebookLMを使うのがいいかもと思ったので、今日はその内容を共有しようと思います。前提条件前提としてGoogle Workspaceを使っている環境を想定しています。 Google Workspaceのプランごとの比較表を見る限りでは今回ご紹介する内容なら Business Standard プラン以上であれば試せると思いますが、筆者が試した環境はEnterpriseプラン環境である点をご承知おきください。勉強会の内容はMeetで録画・文字起こしオンラインでもオフラインでも勉

stealthinu 2025/05/28

勉強会の書き起こし用プロンプト参考に

llm

リンク

コーディングエージェントを作ってるけどうまくいかなかった話～あるいは二ヶ月本気でコーディングエージェントと向き合った話～ / Two Month Agent Struggle

https://connpass.com/event/353478/ 登壇資料です。 - エディタ間借り型コーディングエージェントの仕組みと限界 - 負けパターン集と、その回避対策 - コーディングエージェントのこれから

stealthinu 2025/05/28

コーディングエージェント自体を作った知見。コンテキストにどうやって必要なものだけを残すかが鍵っぽい。LLMが注意を向ける先、スコープを絞ることが重要。

リンク

【2025年5月完全版】RAG の教科書

はじめに昨今、AI の進化により、様々な分野での応用が進んでいます。特に、自然言語処理(NLP)の分野では、RAG( Retrieval-Augmented Generation)が注目されています。RAG は、情報検索と生成を組み合わせた手法であり、特に大規模言語モデル(LLM)と組み合わせることで、その性能を大幅に向上させることができます。また、NativeRAG や GraphRAG, AgentRAG などさまざまな RAG のバリエーションが登場しており、これらは特定のユースケースやデータセットに対して最適化されています。今回は、RAG の基本的な概念から、RAG のプロジェクトの進め方、精度向上の方法に至るまで詳しく解説します。みなさんの GenAI Application の開発に役立てていただければ幸いです。本記事は 5 万文字を超える大作となっております。お時

stealthinu 2025/05/26

これはだいぶ細かくまとまってる。まあ最近はdeep research系があるからまとめるの楽になったよね。でも質のいいまとめはありがたい。

リンク

新しいブラウザ操作系エージェントのworkflow-useがかなり良さそうな予感

Browser　Useから新しいブラウザ操作系エージェントが登場しましためちゃくちゃ魅力的だったので紹介します。従来のブラウザ操作系エージェント browser-useに限らず、従来のブラウザ操作系エージェントはユーザーからの自然言語な指令をもとにブラウザを操作します。 AIエージェントは画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべき要素を推論 → playwrightで操作をループしてタスクを行います。現在僕もよく使っているのですが、何点か課題があります。どうしてもアクションに揺らぎがある自然言語での指示である以上仕方ないのですが、「〇〇をクリックして〇〇をしてほしい」と言った細かい指示はプロンプトのチューニングが不可欠であり使用モデルの賢さにも依存します。処理に時間がかかる画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべ

stealthinu 2025/05/26

browser-useを一続きの処理を名前をつけて登録することができる機能、みたいな感じ。確かに正しい方向に思うのだが、書いてあるように変更には対応できない。そこを自動修正できるようにしたいところ。

llm
MCP

リンク

TS特化Clineプログラミング(テキスト版)

tskaigi で発表した https://tskaigi.mizchi.workers.dev/ のコピペしやすい用にしたバージョンです。ほぼ marp のソースコードそのままですが、プロンプトのコピペ用にそのまま公開します。本資料の内容うまくいくプロンプトうまくいかないプロンプト、その理由現状認識注意: 前日リリースのClaude 4 の評価は間に合ってません!!!! Claude 4 Opus の高すぎる怖い数時間触った感じ: 改善傾向だが、抱えてる問題も同じ傾向主張: 言語特化プロンプトが必要(今は) Coding Agent は言語ごとのユースケースに最適化されていないベストプラクティスをユーザーが取捨選定する必要 TS 周辺は技術選定で発散しがちプログラミング言語間の転移学習は不安定 GitHub を丸暗記しても、コンテキストに応じて翻訳&参照できるかは別の

stealthinu 2025/05/25

今まさに色々手法試しているところなのですごく参考になる。このあたりはrizumitaさんもだいぶ研究されてるはずで話聞いてみたい。

リンク

The End of Programming as We Know It

Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more Betty Jean Jennings and Frances Bilas (right) program the ENIAC in 1946. Via the Computer History Museum Eventually, interpreted languages, which are much easier to debug, became the norm. BASIC, one of the first of these to hit the big time, was at first s

stealthinu 2025/05/21

“私たちが知っているプログラミングの終焉”が起こるだけと言うが自分は甘いと思う。この予測は今のLLMが今のレベル＋程度のままならそうだろうが、LLMは指数関数的な知能の拡大が起こると思っているので。

リンク

Google DeepMindから“拡散言語モデル”「Gemini Diffusion」登場　文字通り爆速で文章・コード生成

米Google DeepMindは5月20日（現地時間）、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。

stealthinu 2025/05/21

LLMというかtransformerがdiffusionモデルで置き換えられたもの。flash-2.0位の能力はでてて生成速度がめちゃくちゃ速い。最初に概略のイメージ作ってそっから詳細を詰めてくみたいな思考方法に近くなるのかな？

リンク

Google I/O 2025: 研究が現実に

編集者注：以下は、Google I/O 2025 のスンダーピチャイの発言を編集し、イベントで発表された内容を加えて再構成したものです。すべての発表についてはこちらをご覧ください。例年であれば、Google I/O 開催前の数週間は、一番の見どころとなる最新モデルを基調講演で発表できるよう準備しており、発表を行うことはほとんどありませんでした。しかし Gemini の時代においては、今までで最も高性能なモデルを 3 月に発表したり、AlphaEvolve のような画期的なブレークスルーを 1 週間前に発表することも珍しくなくなりました。 Google は、最高のモデルと製品をいち早く皆様に提供すべく、これまでにないスピードで開発を進めています。進化し続けるモデル私が特に期待を寄せているのは、モデルの急速な進化です。進歩の指標である Elo スコアにおいて、初代 Gemini Pro

stealthinu 2025/05/21

音声翻訳機能とかちょっとだけやろうとしてた。今これやってるところには終了のお知らせ。YouTube翻訳とかもだろう。

リンク

日本語対話コーパス一覧

日本語対話コーパス一覧これは日本語を対象とした、対話システムの構築に利用できる言語資源のリストです。本リストは、理化学研究所吉野幸一郎さん発案のもと、C4A研究所中野幹生さん、東北大学赤間怜奈さん、大阪大学駒谷和範さん、JAIST 吉川禎洋さん、リクルート林部祐太さん、京都大学児玉貴志さん、愛知工業大学徳久良子さん、名古屋大学山下紗苗さんにご協力をいただき、水上雅博が作成いたしました（所属はリスト作成または更新時のものです）。もしこのリストに載っていないものや、リストのまちがいに気づかれた場合、新たにコーパスをリリースした際には是非、issueやメールで教えてください。対話コーパス主に人同士または人とシステム間（2名以上の場合を含む）で、対話（模擬対話等を含む）を行ったコーパスです。名前データ量形式研究利用商用利用概要

stealthinu 2025/05/21

日本語対話コーパスの一覧。さらっと検索した感じでもれているのはなかった。

リンク

［速報］マイクロソフト、AIモデルをWindows/macOSローカルで実行可能にする「Azure AI Foundry Local」発表

［速報］マイクロソフト、AIモデルをWindows/macOSローカルで実行可能にする「Azure AI Foundry Local」発表マイクロソフトは日本時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、WindowsおよびmacOSのローカル環境でエッジ環境に最適化されたAIモデルを実行可能にする「Azure AI Foundry Local」を発表しました。同時に、これまでWindows Copilot Runtimeと呼ばれてきたWindows上のAI実行環境を「Windows AI Foundry」としてアップデート。Windows上での「Azure AI Foundry Local」をこれに統合することも明らかにします。 Azure AI Foundryとは Azure AI Foundryは、クラウドサービスであるMicrosoft A

stealthinu 2025/05/20

オープンなLLMをWindows上でGPUやNPUなどのハードウェアに合わせた最適化して実行できるようにするみたい。構成図みると自動的にONNXに変換してくれるらしい。transformerを？まじ？？

リンク

［速報］マイクロソフト、WindowsがMCPをサポートすると発表。AIエージェントでWindowsやアプリとの連携が可能に

［速報］マイクロソフト、WindowsがMCPをサポートすると発表。AIエージェントでWindowsやアプリとの連携が可能にマイクロソフトは日本時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、AIアプリケーションやエージェントとアプリケーションを連携させるプロトコルである「MCP」（Model Context Protocol）をWindowsがネイティブにサポートすると発表しました。 WindowsのMCPサポートでは、以下の機能がWindowsに実装されます。 MCP Servers for Windows ファイルシステムやウィンドウ管理、Windows Subsystem for Linux（WSL）などのWindowsシステムファンクションがMCPサーバとなり、AIアプリケーションやエージェントからアクセス可能になる。 MCP Registr

stealthinu 2025/05/20

うわー、これはすげえ。WindowsをLLMから自由に使えるようにするぞっていう意思表示。

リンク

コラム「今の生成AI市場って焼き畑農業っぽくない？（2025年5月時点の所感）」｜「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典

今日は2025年5月13日です。ちょっとだけ大ピンチです。『ロマンシングサガ2 リベンジオブザセブン』をまだクリアしていないのに『RAIDOU Remastered: 超力兵団奇譚』というゲームを予約注文してしまいました。発売日は6月19日です。それまでに『ロマンシングサガ2 リベンジオブザセブン』をクリアしなくては、いけません。これは仕事してる場合じゃないっすね！そんな半分本気な冗談を言ったところで今回もゆるく行ってみましょう。超不定期連載「分かりそう」で「分からない」でも「分かった」気になれるITコラムでございまぁす。このコーナーでは、各用語の説明ページでは取り上げにくいIT関連のネタをテーマに、だらだらと思いついたことを書いていきます。みなさんが「あぁ、なんか役に立ちそうな気もするけど、役に立たないかなぁ。でも、もしかしたら役に立つかも」と思える情報を発信できるように頑張ります！

stealthinu 2025/05/14

もうこの考えは１周遅れ。今はLLM自身が良質なコンテンツを作ってそれを学習させた方が良い、という流れになってる。汎用LLMもAlphaGoがたどったルートを通ると考えれば良い。

リンク

Cursor – Background Agents

Background agents are currently in preview and rolling out to a limited number of users. Privacy mode must be turned off to use background agents. With background agents, you can spawn off asynchronous agents that can edit and run your code in a remote environment. At any point, you can view their status, send a follow-up, or take over. How to Use Hit Cmd + ' (or Ctrl + ') to open up the list of b

stealthinu 2025/05/10

cursorが0.50でbackground agentっていうdevinみたいにほったらかしでやってくれるモードをプレビューとしてつけたんだけど自分ところには0.50が降ってこない。ひでえ。

LLM
vscode

リンク

AI人格を形成するエンジンを自作してみる【蒼月ハヤテプロジェクト #001】

はじめに世の中にAIキャラクターというジャンルがあります。それは、キャラクターの応答や行動をAI、いわゆるChatGPTなどで生成するというものです。ChatGPTの登場以降、技術は急速に発展し、今ではAIに配信をさせる「AITuber」と呼ばれるものまで誕生しています。一方で、この分野において、決定的に欠落しているものがあります。それは「自己組織的な人格形成」と「自律的な行動の創発」です。いままでのAIキャラクターは、あらかじめ開発者やユーザーが設定したキャラクター像に則って動いたりします。しかし、逆に言えばAIが自分で判断してそのような人格や思想をもったのではなく、開発者の想定で作られたものです。行動も設計した中での行動に過ぎません。私は、自分で色々なことに驚いたり、喜んだり、悲しんだり、自分で考え、自分で行動することができるAI主体、「ゴースト」が作りたいと思いました。「ゴ

stealthinu 2025/05/09

web上の記事を読むことによって徐々に人格を形成していく、という人格形成エンジンの実験。自分が実験したい自我の実験に近い感じ。

LLM
心理

リンク

GitHub - PatrickJS/awesome-cursorrules: 📄 A curated list of awesome .cursorrules files

.cursorrules is a powerful feature in Cursor AI that allows developers to define project-specific instructions for the AI. Here's why you might want to use it: Customized AI Behavior: .cursorrules files help tailor the AI's responses to your project's specific needs, ensuring more relevant and accurate code suggestions. Consistency: By defining coding standards and best practices in your .cursorru

stealthinu 2025/05/09

cursor rulesのテンプレート集

リンク

GitHub - InditexTech/mcp-teams-server: An MCP (Model Context Protocol) server implementation for Microsoft Teams integration, providing capabilities to read messages, create messages, reply to messages, mention members.

stealthinu 2025/05/07

Teams用のMCP。こんなメジャーそうなMCPに思うのにすごく探してもこれしか見つからなかった。しかも前に探したときは見つけられなくて、つい一月前くらいから公開されてる感じ。

LLM
MCP

リンク

プログラマー必見！FastAPI-MCPでAI時代のAPI開発を加速する方法（初心者向けコード付き） - Qiita

はじめにみなさん、こんにちは！最近、API開発の現場で「これマジですごい！」と思わず叫んでしまったツールを見つけたんですよ。それが「FastAPI-MCP」です！ FastAPI使ってる人なら絶対に知るべきツールです。だって、あなたのAPIをAIモデル（GPTやClaudeなど）に簡単に操作させることができるんですから！私みたいな初心者でも数分で設定できちゃいました。 FastAPI-MCPって何がすごいの？まず、FastAPI-MCPの核となる機能を紹介します：認証機能が標準装備：FastAPIの依存性注入（Depends()）をそのまま使えるから、セキュリティ面も安心！ FastAPIとの相性抜群：単なるOpenAPI変換ツールじゃなく、FastAPIのASGIインターフェースを直接使うから超効率的！設定ほぼゼロ：FastAPIアプリを指定するだけでMCPツールが自動生成される

stealthinu 2025/04/25

FastAPI-MCPのチュートリアル記事。まださわってなかったのでやとかないと。既存のAPIをMCPにするには絶対いいだろうし認証が使えるのもよさそう。

リンク

忖度なしモードは本当にo3を賢くするのか？｜IT navi

１．通常モードのo3回答①今回の検証では、以下の質問を使用します。 AI時代の教育の在り方は？【o3の回答】※今回、ChatGPT o3は1分18秒考え、Web検索も使用しました。インターネットで調査ユーザーの質問「AI時代の教育の在り方は？」に答えるには、最新の情報が役立ちそうです。例えば、生成AIを教育に活用する方法や日本の文部科学省のデジタル教科書ガイドライン、OECDの提言などが含まれます。これに基づいて、最近の政策、国際的なガイドライン（2023年のUNESCOなど）をしっかり参考にするため、インターネットで最新の情報を調べることにします。 AI時代の教育の在り方 AI時代における教育は、人間中心のアプローチと能力ベースの学びに焦点を当てます。学習目標は、基礎的なリテラシー（読み書き、数学、デジタル）やAIリテラシー、メタスキル（批判的思考、創造性）にシフトします。教育方法