「OpenAI Agents SDK」の概要についてまとめました。 ・OpenAI Agents SDK 1. Agents SDK「Agents SDK」は、Agentシステムを構築するための軽量パッケージです。これは、以前の実験プロジェクト「Swarm」の本番環境対応版となります。 「Agents SDK」は、以下な最小限のプリミティブで構成されています: ・Agent : 指示とToolを備えたLLM ・Handoff : 特定のタスクを他のAgentに委任できる機能 ・Guardrail : Agentへの入力を検証するしくみ これらのプリミティブを Python と組み合わせることで、ToolとAgentの間の複雑な関係を表現し、学習コストなしに実用的なアプリケーションを構築できます。 さらに、SDK には トレース機能(Agentの動作を可視化・デバッグできる機能)が組み込まれ
こんにちは、Martinです。以前からOpenAIのo1などのモデルが推論中に一見関係のなさそうな寄り道をすることが確認されています。例えば、温泉に入ったり、漫画を読んだりです。自分はこうしたAIのおもしろい行動を見るがわりと好きなので、見つけたらXのブックマークなどに保存して収集しています。 今のところ、この「寄り道」はOpenAI o1, Deep researchなどの推論モデルでみられます。 傾向としては、o1などのネットアクセスを使わない推論モデルが、人間と同じように気分転換のために急に温泉に行くなどの寄り道をしているケースと、Deep researchのようにブラウジング中に目に入った広告などに気を取られて寄り道するケースがあるようです。 食事をしながら休憩しているケース韓国料理や焼酎を味わっています。焼酎を飲んだ後に性能が下がらないかやうや不安を感じます。 うちのAI、思考の
以下の記事が面白かったので、簡単にまとめました。 ・Introducing ChatGPT Gov 1. ChatGPT Gov米国政府の人工知能の採用は、この技術における米国のグローバルリーダーシップを維持および強化するために不可欠であると考えています。「OpenAI」では、人々が困難な問題を解決するのを助けるためにAIを構築しており、公衆衛生やインフラの改善から国家安全保障の強化まで、複雑な課題に取り組む公共部門を支援するためのこれらのツールの大きな可能性を見ています。OpenAIの製品を米国政府に提供することで、AIが民主的な価値観に沿った国益と公共の利益に役立つことを保証すると同時に、政策立案者がこれらの能力を責任を持って統合して、アメリカ国民により良いサービスを提供することを目指しています。 本日 (2025年1月28日) 、米国政府機関に「OpenAI」のフロンティアモデルを
OpenAI Realtime API (WebRTC) の WebRTC 仕様についてまとめました。 まとめ OpenAI Realtime API (WebRTC) はクライアント・サーバーモデルであり P2P ではない OpenAI Realtime API (WebRTC) のシグナリングは WHIP に似せた独自仕様 WebRTC の作者 や Go の WebRTC 実装 Pion の作者 が OpenAI にいる クライアント・サーバーモデル OpenAI Realtime API の WebRTC (以降 Realtime API) は WebRTC P2P ではなく、クライアントサーバーモデルです。つまり、 OpenAI に WebRTC サーバーがあり、そこに接続しています。 WebRTC サーバー実装 おそらく WebRTC サーバーは Go の WebRTC 実装であ
OpenAI、ユーザーに代わってWebのタスクを実行するエージェント「Operator」のリサーチプレビュー版を発表 ―米国のProユーザが利用可能に OpenAIは2025年1月24日、Webにアクセスしてユーザーに代わってタスクを実行できるエージェント「Operator」を発表した。現在はリサーチプレビュー版として米国内のProユーザ向けに提供されており、ユーザーからのフィードバックを受け改良を加えている。 Introducing Operator research preview | OpenAI Introduction to Operator & Agentshttps://t.co/nbH7OMmkmO — OpenAI (@OpenAI) January 23, 2025 Operatorは、Computer-Using Agent(CUA)と呼ばれる新しいモデルを採用し
ドナルド・トランプ米大統領は1月21日(現地時間)、少なくとも1000億ドル規模のAIインフラを米国に構築するための、米OpenAI、ソフトバンクG、米Oracleによる合弁事業を発表した。「Stargate」と呼ばれるこの合弁事業は、向こう4年間で5000億ドルを投資する計画。ソフトバンクが財務責任を、OpenAIが運営責任を負い、ソフトバンクGの孫正義会長兼社長が会長を務める。 左から、Stargateプロジェクトを発表するトランプ大統領とそれに立ち会う、Oracleのラリー・エリソン会長兼CTO、ソフトバンクGの孫正義会長、OpenAIのサム・アルトマンCEO 初期技術パートナーとして、Arm、Microsoft、NVIDIA、Oracle、OpenAIが名を連ねる。まずはテキサスに大規模なデータセンターを構築する計画だ。 孫氏は昨年12月、トランプ氏を訪問し、米国に今後4年間で10
米Microsoftは1月21日(現地時間)、米OpenAIとの契約を更新したと発表した。これまでMicrosoftがOpenAIに独占的にデータセンターのインフラを提供してきたが、この更新でOpenAIはMicrosoftの競合他社のインフラも利用可能になる。 公式ブログには、「新たな契約には、容量の独占権の変更が含まれており、Microsoftが優先購入権(ROFR)を持つモデルに移行する」とある。「OpenAIをさらに支援するため、Microsoftは主にモデルの研究とトレーニングのために、OpenAIが追加の容量を構築することを承認した」。 わかりにくいが、OpenAIがAIの研究とトレーニングのために追加の容量が必要になり、Microsoftがそれを賄えない場合は、OpenAIはMicrosoftの競合他社から容量を購入できるということを意味する。 Microsoftは、Open
以下の記事が面白かったので、簡単にまとめました。 ・Predicted Outputs 1. Predicted Outputs「Predicted Outputs」は、出力トークンの多くが事前にわかっている場合に、ChatCompletionの応答を高速化する機能です。これは、テキストまたはコードを少し変更して再生成する場合に役立ちます。 2. コードリファクタリングの例「GPT-4o」で「TypeScript」のコードの一部をリファクタリングし、Userクラスのusernameプロパティをemailに変換するとします。 class User { firstName: string = ""; lastName: string = ""; username: string = ""; } export default User;上記の4行目を除き、ファイルの大部分は変更されません。現在の
OpenAIが開発する動画生成AI「Sora」が、ついに研究プレビューから一般公開へと移行しました。 今年初め、Soraがテキストからリアルな動画を生み出す実験的取り組みとして話題を呼びましたが、今回「Sora Turbo」という高速化モデルを搭載し、Sora.com(新たなインターフェース)上でChatGPT Plus/Proユーザー向けに本格的な利用が可能となりました。 Soraの特徴:① Sora Turboによる高速な生成2月のプレビュー版から大幅に改善された「Sora Turbo」は、従来よりも高速な動画生成を可能にしています。 テキスト入力から、1080p解像度、最長20秒、ワイドスクリーン・垂直・正方形といった多様なアスペクト比の動画を生成できます。 プロンプトは「a closeup of a woman’s face with brown hair, circular re
本記事は、前記事の続編です。 Azure OpenAIのGraphRAGを解説及び検証(解説編) はじめに 前回記事では、GraphRAGやGraphDBの特徴、活用事例等に関し解説いたしました。 今回の記事は、検証編として、実際に、GraphRAGをAzure上にデプロイし、検証していきます。 検証編目次 graphrag-acceleratorとは 事前準備 Azureリソースの準備 graphrag-acceleratorのデプロイ クエリの用意 実行結果 まとめ graphrag-acceleratorとは graphrag-acceleratorを graphragを簡単にAzure上に構築できるIaCとして、graphrag-acceleratorが公開されています。 事前準備 ①以下のツールが必要になります。 Azure CLI >= v2.55.0 awk - a stan
私たちは以前にもGPT-4o-miniをファインチューニングして運用しているというお話をシェアして大きな反響いただきました。 上の記事では、GPT-4oの出力を人手で修正(アノテーション)して、GPT-4-miniをファインチューニングする運用をご紹介していますが、蒸留はGPT-4oの出力をそのまま使用するのが大きな違いです。 また、今回の発表の肝は、この蒸留をOpenAIのDashboad上で簡単に行えるようになったことです。 ですが、他社さんでも実際に蒸留を使っているというお話はあまり聞ないので、蒸留の基本とModel Distillationの使い方をご紹介しつつ、使い所と注意点をシェアしたいと思います。 o1-previewとo1-miniが同時に発表されたことを見ても、今後も"高性能で高価なモデル"と"少し性能は劣るが安価なモデル"は(多少の時期の違いがあっても)セットでリリース
私の今まで経験してきた全てのLLMノウハウを詰め込んだ、LLMシステムの開発ガイドです。 初めてLLMシステムを開発したいと思った時でも、精度改善や運用に行き詰った時でも、何かしら役に立つと思います。 現在200ページ超。 今後も随時更新していきます。 2023/7/28 体裁修…
はじめに 今後 AI が欠かせないツールになることは間違いありません。2023年の AI ブームを受け、来年は AI を活用したプロジェクトを計画している人も多いでしょう。Azure OpenAI を試す人が増えており、効率的なセキュリティ対策について質問を受ける場面が増えています。特に、OpenAI をきっかけに Azure を使い始めたばかりの方は、セキュリティに関する疑問や課題にぶち当たっているかもしれません。 AI セキュリティの事始めとして、Azure OpenAI のチュートリアルから Web アプリをデプロイした後で、 ポータルから確認できるセキュリティ関連の設定や機能について紹介します。これらの設定や機能をどのように運用して、アプリ、インフラのセキュリティを向上させるのか具体的に示します。チュートリアルの前提条件や必要な持ち物については、チュートリアル内の記載を参考にしてく
背景 Twitter で予想外にいいねをたくさん頂いていたため解説記事として出します。 OpenAI の API を活用してその会社のサービスに沿った SQL を返してくれる slack bot を開発しました。主に「OpenAI の API でものを作ってみたい人」「slack bot を簡単に開発したいと思っている人」「Cloudflare Workers に手を出したいと思っている人」などが対象の記事です。 作るものとしては、以下の 2 つです。 slack bot OpenAI に対してリクエストを送るバックエンド 今回使うモデルは gpt-3.5-turbo になります。単純に prompt としてデータベースの DDL を与えてあげれば bot が精度の高い SQL を返してくれるのではないかと考え作成しました。着想から設計、実装、リリースまで 5 時間ほどで出来たのですごく便
はじめに 23年6月19日にAzure OpenAIに独自データを追加できる機能「Add your data」がパブリックプレビューで発表されました。GPTは自分が知らない情報に関して、答えることができないですが、この機能を使うことで独自のデータとGPTモデルを簡単に連携させることができ、GPTが知らない独自のデータを参照して回答を生成できるようになります。また、回答のソースを独自データに限定することもできるので、ChatGPTの活用の幅が大きく広がります。 一通り使ってみたので、具体的な利用方法を解説していきます(公式ドキュメントにも詳しく記載されています)。 (23年9月追記) Add your dataにベクトル検索の機能が追加されました。詳細はこちらのブログで丁寧に解説されていますので、ご参照ください。 独自データの追加 使えるモデルはチャット形式のモデル「gpt-3.5-turb
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く