タグ

LLMに関するstealthinuのブックマーク (365)

  • 社内勉強会の内容共有はNotebookLMでやるのがいいかもと思った話 | DevelopersIO

    お疲れさまです。とーちです。 皆さんの会社では社内勉強会をやったりしていますか? 業務都合等もあって勉強会に参加できない人もいると思いますが、そういった方にも勉強会の内容は共有したいですよね。また、勉強会後に個人的に復習したいなというケースもあるかなと思います。 こういった勉強会の内容の共有をするためにNotebookLMを使うのがいいかもと思ったので、今日はその内容を共有しようと思います。 前提条件 前提としてGoogle Workspaceを使っている環境を想定しています。 Google Workspaceのプランごとの比較表を見る限りでは今回ご紹介する内容なら Business Standard プラン以上であれば試せると思いますが、筆者が試した環境はEnterpriseプラン環境である点をご承知おきください。 勉強会の内容はMeetで録画・文字起こし オンラインでもオフラインでも勉

    社内勉強会の内容共有はNotebookLMでやるのがいいかもと思った話 | DevelopersIO
    stealthinu
    stealthinu 2025/05/28
    勉強会の書き起こし用プロンプト参考に
  • コーディングエージェントを作ってるけどうまくいかなかった話 ~あるいは二ヶ月本気でコーディングエージェントと向き合った話~ / Two Month Agent Struggle

    https://connpass.com/event/353478/ 登壇資料です。 - エディタ間借り型コーディングエージェントの仕組みと限界 - 負けパターン集と、その回避対策 - コーディングエージェントのこれから

    コーディングエージェントを作ってるけどうまくいかなかった話 ~あるいは二ヶ月本気でコーディングエージェントと向き合った話~ / Two Month Agent Struggle
    stealthinu
    stealthinu 2025/05/28
    コーディングエージェント自体を作った知見。コンテキストにどうやって必要なものだけを残すかが鍵っぽい。LLMが注意を向ける先、スコープを絞ることが重要。
  • 【2025年5月完全版】RAG の教科書

    はじめに 昨今、AI の進化により、様々な分野での応用が進んでいます。特に、自然言語処理(NLP)の分野では、RAG( Retrieval-Augmented Generation)が注目されています。RAG は、情報検索と生成を組み合わせた手法であり、特に大規模言語モデル(LLM)と組み合わせることで、その性能を大幅に向上させることができます。 また、NativeRAG や GraphRAG, AgentRAG などさまざまな RAG のバリエーションが登場しており、これらは特定のユースケースやデータセットに対して最適化されています。 今回は、RAG の基的な概念から、RAG のプロジェクトの進め方、精度向上の方法に至るまで詳しく解説します。 みなさんの GenAI Application の開発に役立てていただければ幸いです。 記事は 5 万文字を超える大作となっております。 お時

    【2025年5月完全版】RAG の教科書
    stealthinu
    stealthinu 2025/05/26
    これはだいぶ細かくまとまってる。まあ最近はdeep research系があるからまとめるの楽になったよね。でも質のいいまとめはありがたい。
  • 新しいブラウザ操作系エージェントのworkflow-useがかなり良さそうな予感

    Browser Useから新しいブラウザ操作系エージェントが登場しました めちゃくちゃ魅力的だったので紹介します。 従来のブラウザ操作系エージェント browser-useに限らず、従来のブラウザ操作系エージェントはユーザーからの自然言語な指令をもとにブラウザを操作します。 AIエージェントは画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべき要素を推論 → playwrightで操作をループしてタスクを行います。 現在僕もよく使っているのですが、何点か課題があります。 どうしてもアクションに揺らぎがある 自然言語での指示である以上仕方ないのですが、「〇〇をクリックして〇〇をしてほしい」と言った細かい指示はプロンプトのチューニングが不可欠であり使用モデルの賢さにも依存します。 処理に時間がかかる 画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべ

    新しいブラウザ操作系エージェントのworkflow-useがかなり良さそうな予感
    stealthinu
    stealthinu 2025/05/26
    browser-useを一続きの処理を名前をつけて登録することができる機能、みたいな感じ。確かに正しい方向に思うのだが、書いてあるように変更には対応できない。そこを自動修正できるようにしたいところ。
  • TS特化Clineプログラミング(テキスト版)

    tskaigi で発表した https://tskaigi.mizchi.workers.dev/ のコピペしやすい用にしたバージョンです。 ほぼ marp のソースコードそのままですが、プロンプトのコピペ用にそのまま公開します。 資料の内容 うまくいくプロンプト うまくいかないプロンプト、その理由 現状認識 注意: 前日リリースのClaude 4 の評価は間に合ってません!!!! Claude 4 Opus の高すぎる怖い 数時間触った感じ: 改善傾向だが、抱えてる問題も同じ傾向 主張: 言語特化プロンプトが必要(今は) Coding Agent は言語ごとのユースケースに最適化されていない ベストプラクティスをユーザーが取捨選定する必要 TS 周辺は技術選定で発散しがち プログラミング言語間の転移学習は不安定 GitHub を丸暗記しても、コンテキストに応じて翻訳&参照できるかは別の

    TS特化Clineプログラミング(テキスト版)
    stealthinu
    stealthinu 2025/05/25
    今まさに色々手法試しているところなのですごく参考になる。このあたりはrizumitaさんもだいぶ研究されてるはずで話聞いてみたい。
  • The End of Programming as We Know It

    Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more Betty Jean Jennings and Frances Bilas (right) program the ENIAC in 1946. Via the Computer History Museum Eventually, interpreted languages, which are much easier to debug, became the norm. BASIC, one of the first of these to hit the big time, was at first s

    The End of Programming as We Know It
    stealthinu
    stealthinu 2025/05/21
    “私たちが知っているプログラミングの終焉”が起こるだけと言うが自分は甘いと思う。この予測は今のLLMが今のレベル+程度のままならそうだろうが、LLMは指数関数的な知能の拡大が起こると思っているので。
  • Google DeepMindから“拡散言語モデル”「Gemini Diffusion」登場 文字通り爆速で文章・コード生成

    Google DeepMindは5月20日(現地時間)、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。

    Google DeepMindから“拡散言語モデル”「Gemini Diffusion」登場 文字通り爆速で文章・コード生成
    stealthinu
    stealthinu 2025/05/21
    LLMというかtransformerがdiffusionモデルで置き換えられたもの。flash-2.0位の能力はでてて生成速度がめちゃくちゃ速い。最初に概略のイメージ作ってそっから詳細を詰めてくみたいな思考方法に近くなるのかな?
  • Google I/O 2025: 研究が現実に

    編集者注:以下は、Google I/O 2025 のスンダー ピチャイの発言を編集し、イベントで発表された内容を加えて再構成したものです。すべての発表についてはこちらをご覧ください。 例年であれば、Google I/O 開催前の数週間は、一番の見どころとなる最新モデルを基調講演で発表できるよう準備しており、発表を行うことはほとんどありませんでした。しかし Gemini の時代においては、今までで最も高性能なモデルを 3 月に発表したり、AlphaEvolve のような画期的なブレークスルーを 1 週間前に発表することも珍しくなくなりました。 Google は、最高のモデルと製品をいち早く皆様に提供すべく、これまでにないスピードで開発を進めています。 進化し続けるモデル私が特に期待を寄せているのは、モデルの急速な進化です。進歩の指標である Elo スコアにおいて、初代 Gemini Pro

    Google I/O 2025: 研究が現実に
    stealthinu
    stealthinu 2025/05/21
    音声翻訳機能とかちょっとだけやろうとしてた。今これやってるところには終了のお知らせ。YouTube翻訳とかもだろう。
  • 日本語対話コーパス一覧

    語対話コーパス一覧 これは日語を対象とした、対話システムの構築に利用できる言語資源のリストです。 リストは、理化学研究所 吉野 幸一郎さん発案のもと、C4A研究所 中野 幹生さん、東北大学 赤間 怜奈さん、大阪大学 駒谷 和範さん、JAIST 吉川 禎洋さん、リクルート 林部 祐太さん、京都大学 児玉 貴志さん、愛知工業大学 徳久 良子さん、名古屋大学 山下 紗苗さんにご協力をいただき、水上 雅博が作成いたしました(所属はリスト作成または更新時のものです)。 もしこのリストに載っていないものや、リストのまちがいに気づかれた場合、新たにコーパスをリリースした際には是非、issueやメールで教えてください。 対話コーパス 主に人同士または人とシステム間(2名以上の場合を含む)で、対話(模擬対話等を含む)を行ったコーパスです。 名前 データ量 形式 研究利用 商用利用 概要

    stealthinu
    stealthinu 2025/05/21
    日本語対話コーパスの一覧。さらっと検索した感じでもれているのはなかった。
  • [速報]マイクロソフト、AIモデルをWindows/macOSローカルで実行可能にする「Azure AI Foundry Local」発表

    [速報]マイクロソフト、AIモデルをWindows/macOSローカルで実行可能にする「Azure AI Foundry Local」発表 マイクロソフトは日時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、WindowsおよびmacOSのローカル環境でエッジ環境に最適化されたAIモデルを実行可能にする「Azure AI Foundry Local」を発表しました。 同時に、これまでWindows Copilot Runtimeと呼ばれてきたWindows上のAI実行環境を「Windows AI Foundry」としてアップデートWindows上での「Azure AI Foundry Local」をこれに統合することも明らかにします。 Azure AI Foundryとは Azure AI Foundryは、クラウドサービスであるMicrosoft A

    [速報]マイクロソフト、AIモデルをWindows/macOSローカルで実行可能にする「Azure AI Foundry Local」発表
    stealthinu
    stealthinu 2025/05/20
    オープンなLLMをWindows上でGPUやNPUなどのハードウェアに合わせた最適化して実行できるようにするみたい。構成図みると自動的にONNXに変換してくれるらしい。transformerを?まじ??
  • [速報]マイクロソフト、WindowsがMCPをサポートすると発表。AIエージェントでWindowsやアプリとの連携が可能に

    [速報]マイクロソフト、WindowsがMCPをサポートすると発表。AIエージェントでWindowsやアプリとの連携が可能に マイクロソフトは日時間5月20日未明に開幕したイベント「Microsoft Build 2025」で、AIアプリケーションやエージェントとアプリケーションを連携させるプロトコルである「MCP」(Model Context Protocol)をWindowsがネイティブにサポートすると発表しました。 WindowsのMCPサポートでは、以下の機能がWindowsに実装されます。 MCP Servers for Windows ファイルシステムやウィンドウ管理、Windows Subsystem for Linux(WSL)などのWindowsシステムファンクションがMCPサーバとなり、AIアプリケーションやエージェントからアクセス可能になる。 MCP Registr

    [速報]マイクロソフト、WindowsがMCPをサポートすると発表。AIエージェントでWindowsやアプリとの連携が可能に
    stealthinu
    stealthinu 2025/05/20
    うわー、これはすげえ。WindowsをLLMから自由に使えるようにするぞっていう意思表示。
  • コラム「今の生成AI市場って焼き畑農業っぽくない?(2025年5月時点の所感)」|「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典

    今日は2025年5月13日です。ちょっとだけ大ピンチです。『ロマンシング サガ2 リベンジオブザセブン』をまだクリアしていないのに『RAIDOU Remastered: 超力兵団奇譚』というゲームを予約注文してしまいました。発売日は6月19日です。それまでに『ロマンシング サガ2 リベンジオブザセブン』をクリアしなくては、いけません。これは仕事してる場合じゃないっすね!そんな半分気な冗談を言ったところで今回もゆるく行ってみましょう。超不定期連載「分かりそう」で「分からない」でも「分かった」気になれるITコラムでございまぁす。このコーナーでは、各用語の説明ページでは取り上げにくいIT関連のネタをテーマに、だらだらと思いついたことを書いていきます。みなさんが「あぁ、なんか役に立ちそうな気もするけど、役に立たないかなぁ。でも、もしかしたら役に立つかも」と思える情報を発信できるように頑張ります!

    コラム「今の生成AI市場って焼き畑農業っぽくない?(2025年5月時点の所感)」|「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典
    stealthinu
    stealthinu 2025/05/14
    もうこの考えは1周遅れ。今はLLM自身が良質なコンテンツを作ってそれを学習させた方が良い、という流れになってる。汎用LLMもAlphaGoがたどったルートを通ると考えれば良い。
  • Cursor – Background Agents

    Background agents are currently in preview and rolling out to a limited number of users. Privacy mode must be turned off to use background agents. With background agents, you can spawn off asynchronous agents that can edit and run your code in a remote environment. At any point, you can view their status, send a follow-up, or take over. How to Use Hit Cmd + ' (or Ctrl + ') to open up the list of b

    Cursor – Background Agents
    stealthinu
    stealthinu 2025/05/10
    cursorが0.50でbackground agentっていうdevinみたいにほったらかしでやってくれるモードをプレビューとしてつけたんだけど自分ところには0.50が降ってこない。ひでえ。
  • AI人格を形成するエンジンを自作してみる【蒼月ハヤテプロジェクト #001】

    はじめに 世の中にAIキャラクターというジャンルがあります。 それは、キャラクターの応答や行動をAI、いわゆるChatGPTなどで生成するというものです。ChatGPTの登場以降、技術は急速に発展し、今ではAIに配信をさせる「AITuber」と呼ばれるものまで誕生しています。 一方で、この分野において、決定的に欠落しているものがあります。それは「自己組織的な人格形成」と「自律的な行動の創発」です。 いままでのAIキャラクターは、あらかじめ開発者やユーザーが設定したキャラクター像に則って動いたりします。しかし、逆に言えばAIが自分で判断してそのような人格や思想をもったのではなく、開発者の想定で作られたものです。行動も設計した中での行動に過ぎません。 私は、自分で色々なことに驚いたり、喜んだり、悲しんだり、自分で考え、自分で行動することができるAI主体、「ゴースト」が作りたいと思いました。「ゴ

    AI人格を形成するエンジンを自作してみる【蒼月ハヤテプロジェクト #001】
    stealthinu
    stealthinu 2025/05/09
    web上の記事を読むことによって徐々に人格を形成していく、という人格形成エンジンの実験。自分が実験したい自我の実験に近い感じ。
  • GitHub - PatrickJS/awesome-cursorrules: 📄 A curated list of awesome .cursorrules files

    .cursorrules is a powerful feature in Cursor AI that allows developers to define project-specific instructions for the AI. Here's why you might want to use it: Customized AI Behavior: .cursorrules files help tailor the AI's responses to your project's specific needs, ensuring more relevant and accurate code suggestions. Consistency: By defining coding standards and best practices in your .cursorru

    GitHub - PatrickJS/awesome-cursorrules: 📄 A curated list of awesome .cursorrules files
    stealthinu
    stealthinu 2025/05/09
    cursor rulesのテンプレート集
  • GitHub - InditexTech/mcp-teams-server: An MCP (Model Context Protocol) server implementation for Microsoft Teams integration, providing capabilities to read messages, create messages, reply to messages, mention members.

    stealthinu
    stealthinu 2025/05/07
    Teams用のMCP。こんなメジャーそうなMCPに思うのにすごく探してもこれしか見つからなかった。しかも前に探したときは見つけられなくて、つい一月前くらいから公開されてる感じ。
  • プログラマー必見!FastAPI-MCPでAI時代のAPI開発を加速する方法(初心者向けコード付き) - Qiita

    はじめに みなさん、こんにちは!最近、API開発の現場で「これマジですごい!」と思わず叫んでしまったツールを見つけたんですよ。それが「FastAPI-MCP」です! FastAPI使ってる人なら絶対に知るべきツールです。だって、あなたのAPIAIモデル(GPTやClaudeなど)に簡単に操作させることができるんですから!私みたいな初心者でも数分で設定できちゃいました。 FastAPI-MCPって何がすごいの? まず、FastAPI-MCPの核となる機能を紹介します: 認証機能が標準装備:FastAPIの依存性注入(Depends())をそのまま使えるから、セキュリティ面も安心! FastAPIとの相性抜群:単なるOpenAPI変換ツールじゃなく、FastAPIのASGIインターフェースを直接使うから超効率的! 設定ほぼゼロ:FastAPIアプリを指定するだけでMCPツールが自動生成される

    プログラマー必見!FastAPI-MCPでAI時代のAPI開発を加速する方法(初心者向けコード付き) - Qiita
    stealthinu
    stealthinu 2025/04/25
    FastAPI-MCPのチュートリアル記事。まださわってなかったのでやとかないと。既存のAPIをMCPにするには絶対いいだろうし認証が使えるのもよさそう。
  • 忖度なしモードは本当にo3を賢くするのか?|IT navi

    1.通常モードのo3回答①今回の検証では、以下の質問を使用します。 AI時代の教育の在り方は? 【o3の回答】※今回、ChatGPT o3は1分18秒考え、Web検索も使用しました。 インターネットで調査 ユーザーの質問「AI時代の教育の在り方は?」に答えるには、最新の情報が役立ちそうです。例えば、生成AI教育に活用する方法や日の文部科学省のデジタル教科書ガイドライン、OECDの提言などが含まれます。これに基づいて、最近の政策、国際的なガイドライン(2023年のUNESCOなど)をしっかり参考にするため、インターネットで最新の情報を調べることにします。 AI時代の教育の在り方 AI時代における教育は、人間中心のアプローチと能力ベースの学びに焦点を当てます。学習目標は、基礎的なリテラシー(読み書き、数学、デジタル)やAIリテラシー、メタスキル(批判的思考、創造性)にシフトします。教育方法

    忖度なしモードは本当にo3を賢くするのか?|IT navi
    stealthinu
    stealthinu 2025/04/25
    深津さん考案の「人類への忖度なし」プロンプトで賢くなってるかをGemini-2.5-proでLLM-as-a-Jadgeしている。状況による、という感じ。試してみても創造的なことについてはこの指示が有効そうな感じはする。
  • ここはMCPの夜明けまえ

    日、「AI駆動開発実践の手引き -これが僕/私のAI(アイ)棒」というイベントで「ここはMCPの夜明けまえ」 🎵🧭 というタイトルで登壇しました! 🔍 イベント詳細: - イベント名: 【ハイブリッド開催】AI駆動開発実践の手引き -これが僕/私のAI(アイ)棒- - 公式URL: http…

    ここはMCPの夜明けまえ
    stealthinu
    stealthinu 2025/04/24
    MCPの2025/3更新内容とかも入ってて参考になった。
  • https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf

    stealthinu
    stealthinu 2025/04/22
    人間の作った既存のデータではなくLLM自身が環境に働きかけて結果から学ぶという時代に入った、という宣言。ある意味シンギュラリティの開始を宣言したと思う。