米アルファベットは少なくとも2026年まではエンジニアの数を増やすと、スンダー・ピチャイ最高経営責任者(CEO)が語った。同社は人工知能(AI)への投資も強化しているが、人材が引き続き重要だとピチャイ氏は強調した。 サンフランシスコで開かれたブルームバーグ・テック会合に出席したピチャイ氏は、近い将来はエンジニアリングへの投資を続けると述べた。 マイクロソフトなど米テクノロジー大手企業はAIで主導的な地位を維持するために必要な巨額の投資費用を補おうと、今年に入りさらに人員を削減。この動きは、一部の雇用がAIに取って代わられるとの懸念を強めている。アルファベット子会社のグーグルも過去数年で数度にわたり人員削減を実施し、投資余力を確保した。
ポイント・オブ・ノーリターン:プログラミング、AGI、アメリカ 2025.03.26 Updated by yomoyomo on March 26, 2025, 00:00 am JST オライリー・メディアのコンテンツ戦略担当バイスプレジデントを務めるマイク・ルキダスは、以前よりプログラミングの未来について文章を書いており、ワタシもそれをフォローしてきました。 2019年5月には、プログラミング・ツールに関し、我々は未だ「パンチカード」を使っているようなものだと不満を表明した上で、「配管工」にたとえられる「ブルーカラー」のプログラマーにとってのプログラミングが、もっと視覚的なものになるべきと論じていますが、その背景には人工知能のコード作成機能がそうしたグラフィカル化を実現してくれるのではという期待がありました。 そして、この年の末には、ソフトウエアはニューラルネットワークの重み付けとし
Today's AI systems have human-designed, fixed architectures and cannot autonomously and continuously improve themselves. The advance of AI could itself be automated. If done safely, that would accelerate AI development and allow us to reap its benefits much sooner. Meta-learning can automate the discovery of novel algorithms, but is limited by first-order improvements and the human design of a sui
TL;DR 社内の開発情報にアクセスするMCPサーバーを作成して、AI開発ツールが業務知識を活用できるようにしてみた。 具体的なツール事例(DBスキーマ参照、コード検索など)と、AIに活用させるための命名、レスポンス、権限などの考え方とコツを紹介。 TL;DR はじめに MCPとは MonotaROでのMCP DBスキーマを使ったコード生成 既存ソースコードからの業務知識抽出 共通モジュールの使用例の検索 MCPツール実装のコツ プロセスの状態に依存せずツールを利用できるようにする できるだけ具体的なツール名をつけてパラメータを修飾する レスポンスとしてinformativeなフィードバックを返す (なるべく)実行ユーザーの権限を使う まとめ はじめに MonotaROでは、ドメインモデリングでリアーキテクチャに挑むと同時に、モノタロウのAI駆動開発の全貌をご紹介しますのようにAIツールを
アンドリュー・ボスワースは音楽を聴くために特定のアプリを開く代わりに、やりたいことをAIに伝えて、後は任せる方がいいという。 AI は、人々がソフトウェアと対話する方法になるかもしれないとMetaのCTOが述べている。それはアプリモデルを根底から覆すものであり、一部の企業にとっては悪夢となるだろう。ボスワースは、このシフトは全体としてポジティブなものだと語った。 AIは人々がテクノロジーを使う主な手段として、アプリに取って代わる可能性があると、メタの最高技術責任者(CTO)は語った。 アンドリュー・ボスワース(Andrew Bosworth)は先日、ベンチャーキャピタルのアンドリーセン・ホロウィッツ(Andreessen Horowitz)が公開したポッドキャストの中で、現在、人々は「アプリの庭」からソフトウェアを選んでいると語った。同社は、フェイスブック(Facebook)の初期投資家だ
番組のフル視聴(47分)はこちらから https://bit.ly/42dh2B6 10日間無料トライアル実施中 年割プランに入ると、今だけAmazonギフト券3,000円分をプレゼント(4月30日まで) http://bit.ly/3X5XMzD _____ 世界情勢は認知戦でコントロールされている、という、苫米地英人氏と佐藤優氏。 前回の議論に続き、今回はメディアコントロールの裏側や、 "超AI"スーパーインテリジェンスが作る新世界についてトークしていく。 すでにAIは人間の知能を超えたという苫米地氏。 AIにおける基準の策定が必須になるというが、人間が設定したルールが矛盾だらけだった場合、AIが導き出す答えとは? さらに、AIはネットワークの中で緊急事態が起きた場合、どのような行動を起こすのか。 台湾有事、偶発戦の可能性は? 人間が「死の恐怖」を超越すれば、戦争はなくなるのか
エージェント評価における改良された回答正確性判断機能 エージェント評価は、Databricksの顧客がGenAIアプリケーションの品質を定義し、測定し、改善する方法を理解するのを可能にします。顧客データを扱う業界特有の文脈でのGenAIアプリケーションのML出力の品質を測定することは、新たな複雑さの次元を持っています:入力は複雑なオープンエンドの質問を含むことがあり、出力は文字列マッチングメトリクスを使用して参照回答と簡単に比較できない長い形式の回答になることがあります。 エージェント評価は、2つの補完的なメカニズムでこの問題を解決します。最初の一つは、組み込みのレビューUIで、人間の専門家がアプリケーションの異なるバージョンとチャットして生成されたレスポンスにフィードバックを提供することができます。二つ目は、組み込みのLLMジャッジのスイートで、自動的なフィードバックを提供し、評価プロセ
この記事は every Tech Blog Advent Calendar 2024 の 16日目の記事です。 はじめに こんにちは。 株式会社エブリーの開発本部データ&AIチーム(DAI)でデータエンジニアをしている吉田です。 今回は、Databricks Mosaic AIによるLLM アプリケーションの評価についてのお話です。 背景 近年、LLMを利用したアプリケーションが増えており、DELISH KITCHENでもAIによる料理アシスタントとして「デリッシュAI」の提供を開始しました。 そのような状況の中で、サービスにLLMアプリケーションを組み込む際には、アプリケーションの評価がますます重要な課題となっています。 しかし、LLMアプリケーションの品質は、データの質、モデルの性能、プロンプト、retrieverの性能など複数の要素が影響するため、評価は複雑で難しい課題です。 また、
パイロットから本番まで - 自動評価、専門家のフィードバック、両フェーズを通じた明確な反復パスでGenAIの採用を効率化します。 カスタマイズ可能なGenAI評価 - カスタムメトリクスを定義し、新しいGuidelines AI Judgeを使用し、柔軟な入出力スキーマを持つ任意のユースケースを評価します。 シームレスな専門家とのコラボレーション - 更新されたレビューアプリは、フィードバックの収集と評価データセットの管理を簡素化します。 今週初め、Databricks における新たなエージェント開発機能を発表しました。私たちはこれまで数百社の顧客と話をする中で、パイロット段階を超えて活用を進める上で、共通する2つの課題があることに気づきました。 1つ目は、モデルの本番環境での性能に対する信頼が持てないこと。 2つ目は、改善のための明確なプロセスが確立されていないこと。 この2つの課題が原
Cursor擦り倒すシリーズ Cursorで要件定義がエラいスムーズになった話 (続)Cursorで「詳細設計→ガントチャート草稿」作成がめっちゃ楽になった話 「Cursor」×「A5:SQL Mk-2」でテーブル定義書をリッチにする 「Cursor」×「Obsidian」内部リンク生成&最適化プロンプト ←本稿こちら 「Cursor」で「難解コード」のリーディングがめちゃ楽になった話 「Cursorで要件定義をめっちゃ簡単に」を「rules」にしてさらに簡単にした 「Cursor」で「素の議事録」を「要件定義書」に高速でまとめなおした話 AIのおかげでナレッジまとめのペースも精度も爆上がりでして、記事の更新ペースはどんどん上がっていっております。ありがたし。 日々のドキュメントメンテナンスに追われながらも、「情報の流動性」と「ナレッジのネットワーク化」がいかにチームの生産性を左右するかを
How Nubank refactors millions of lines of code to improve engineering efficiency with Devin Overview One of Nubank’s most critical, company-wide projects for 2023-2024 was a migration of their core ETL — an 8 year old, multi-million lines of code monolith — to sub-modules. To handle such a large refactor, their only option was a multi-year effort that distributed repetitive refactoring work across
Vibe Check: Codex—OpenAI’s New Coding Agent Our hands-on day-0 review of the new autonomous software engineer Dan Shipper 🎧 🖥 Bonus: A special episode of AI & I with OpenAI product team member Alexander Embiricos is now live. Watch on X or YouTube, or listen on Spotify or Apple Podcasts. Was this newsletter forwarded to you? Sign up to get it in your inbox. Last night I shipped a new feature for
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2024年3月12日にCognition社がDevinを世界初の完全自律型AIエンジニアとして発表しました。 GitHub Copilotのようにコードを補完したりサジェストしてくれるのではなく、与えられた情報をベースに自律的に開発プロセス全体を行えるというのが大きな特徴でした。 最近話題になっているAI エージェント型プロダクトの一つですね。 その性能を調べるため、弊社も発表当時Waiting Listに登録して早いうちに試したいと考えていましたが、全く連絡が無いまま数ヶ月が経過していました。 その間、他社からもGitHub
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く