タグ

2025年1月6日のブックマーク (87件)

  • 2024年 Python / データ分析 / 生成 AI 関連の人気Qiita記事150選 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに どうもこんにちは。kunishou です。2024 年も残すところ明日のみになりました。皆さん年の瀬をいかがお過ごしでしょうか? 今年も毎年恒例ですが、年末の暇な時間を使って Python / データ分析 / 生成 AI 関連の人気 Qiita 記事 150 選を作成し記事にしました! 年末年始の空いている時間に、記事で 2024 年の Python / データ分析 / 生成 AI 関連のトレンドを振り返っていただけたら幸いです。 過去の記事はこちら モチベーション Qiita公式からも毎年1月にQiitaの人気記事のランキ

    2024年 Python / データ分析 / 生成 AI 関連の人気Qiita記事150選 - Qiita
    misshiki
    misshiki 2025/01/06
    ChatGPTによるものみたいですが傾向分析が最後の方にあり、2023年から2024年の傾向変化が分かります。移り変わりが早すぎてビックりしますが、2024年はGPTやAOAIなどはランクを下げたようです。生成AIが強かったと。
  • 財務省の不適切なデータ解析について|破綻国家研究所

    投稿は、財務省主計局が公表した資料において、統計的な不備が存在するにもかかわらず結論を導いていると考えられる点を、事実ベースで指摘・説明するものです。 あくまでも事実に基づいた指摘を行っているものであり、陰謀論を助長する趣旨ではありません。根拠のない憶測や陰謀論には強く反対いたします。 1. はじめに昨今、103万円の壁引き上げで財務省に対して 「積極財政をすべきだ」「緊縮財政をすべきだ」などの議論が盛んに行われています。 今回の問題の質はそこではありません。 財務省主計局がIMFの一次データを用いて相関関係を分析する際に、 適切な統計処理を行わないまま結論を導いています。 積極財政・緊縮財政を語る以前の不適切な統計処理の問題です。 では、なぜその不適切な統計処理が問題になるのでしょうか。 それは、誤った処理によって可視化されたデータやグラフを使って議論しても、 妥当な結論を得ることが

    財務省の不適切なデータ解析について|破綻国家研究所
    misshiki
    misshiki 2025/01/06
    “財務省主計局がIMFの一次データを用いて相関関係を分析する際に、 適切な統計処理を行わないまま結論を導いています。積極財政・緊縮財政を語る以前の不適切な統計処理の問題です。”
  • ビットコイン市場分析入門 | NOMURA

    目次 I.ビットコイン市場の基構造 II.ビットコイン市場の歴史 III.暗号資産価格の変動特性 IV.ビットコインのポートフォリオ分散効果 V.X (Twitter)データを用いたビットコイン市場参加者の解析 要約と結論 米国トランプ前大統領の当選を契機に、ビットコイン価格は最高値を更新した。このような状況の中、ビットコインに対する関心が高まっている。稿では、ビットコイン市場を理解するために必要な基的事項を整理し、これまでのビットコイン市場の価格動向を概観する。また、ビットコインの価格変動の特性と市場参加者の特性に関する分析も紹介する。 第I章では、ビットコインの基構造を解説し、非中央集権型ネットワークの利点やブロックチェーン技術の透明性と信頼性について詳述する。特に、ビットコインの新規供給量を制御する半減期のメカニズムが、暗号資産としての価値維持にどのように寄与しているかを解説

    misshiki
    misshiki 2025/01/06
    論文“I.ビットコイン市場の基本構造 II.ビットコイン市場の歴史 III.暗号資産価格の変動特性 IV.ビットコインのポートフォリオ分散効果 V.X (Twitter)データを用いたビットコイン市場参加者の解析 ”
  • DuckDB から直接 PostgreSQL アクセスする

    前提 DuckDB が使える環境 Docker Compose が使える環境 まとめ DuckDB から直接 PostgreSQL にアクセスできる PostgreSQL の読み込みも書き込みもできる バッチ処理を PostgreSQL のリードレプリカからデータを読み込んで、DuckDB で集計して PostgreSQL に書き込むと言うのができる DuckDB とは こちらをどうぞ。 DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck PostgreSQL Extension 名前で誤解しやすいのですが DuckDB の PostgreSQL Extension であって、PostgreSQL の Extension ではないので注意してください。 DuckDB のPostgreSQL Extension は PostgreSQL のデータを直接操作で

    DuckDB から直接 PostgreSQL アクセスする
    misshiki
    misshiki 2025/01/06
    “DuckDB から直接 PostgreSQL にアクセスできる...PostgreSQL に接続するためには、Secret Manager を利用します。”
  • Gemini2.0とStreamlitでお手軽なグラウンディング搭載の生成アプリ作成|masa_kazama

    この記事では、プロタイプ作成が簡単にできるPythonStreamlitを用いて、Google検索を組み込んだ生成AIアプリの作り方を紹介します。Gemini2.0のAPIが最近すごく便利になってきていて、Google検索を組み込むようなシステムも簡単に作ることができます。Gemini APIを使って、生成AIのアプリを作ってみたいと思っている方に、参考になれば幸いです。(※今回使ったコードはGithubで公開しています。) 記事は、「Ubie生成AIアドベントカレンダー」の記事です。 Gemini APIGeminiのAPIを使う方法は、2種類あります。 Google AI StudioのAPI経由 Vertex AIAPI経由 Google AI StudioのAPIは無料枠もあり、個人のアプリ開発やプロトタイプ作成に適しています。一方で、Vertex AIAPIは、企業がシス

    Gemini2.0とStreamlitでお手軽なグラウンディング搭載の生成アプリ作成|masa_kazama
    misshiki
    misshiki 2025/01/06
    “プロタイプ作成が簡単にできるPythonのStreamlitを用いて、Google検索を組み込んだ生成AIアプリの作り方を紹介”
  • 機械学習と数理最適化の融合|moai-lab公式

    機械学習数理最適化の融合パターン機械学習(ML)と数理最適化(MO)は、それぞれが強力な問題解決ツールですが、近年、互いの強みを活かす形で融合が進んでいます。この融合は、問題解決の新たな可能性を切り開くと期待されています。ここでは、MLとMOの融合を7つのパターンに分類し、それぞれの特徴を解説します。 1. ML -> MO (ML-first MO-second: ML先 MO後) このパターンでは、まず機械学習を用いてデータから予測や知見を獲得し、その結果を基に数理最適化問題を解きます。 例: 機械学習で需要予測を行い、その予測結果に基づいて生産計画の最適化問題を解く。 特徴: 機械学習が現実世界の複雑なパターンを捉え、最適化がその情報を用いて具体的な行動を決定します。 2. MO -> ML (MO-first ML-second: MO先 ML後) ここでは、まず数理最適化を用い

    機械学習と数理最適化の融合|moai-lab公式
    misshiki
    misshiki 2025/01/06
    “機械学習(ML)と数理最適化(MO)は、それぞれが強力な問題解決ツールですが、近年、互いの強みを活かす形で融合が進んでいます。...MLとMOの融合を7つのパターンに分類し、それぞれの特徴を解説します。”
  • 書籍「ディープラーニングの数学」10章のDLモデルをGPUで動かす - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 書籍「ディープラーニングの数学」の著者です。 Amazonリンク この書籍は、ディープラーニングを含めた機械学習のアルゴリズムを数学的に定式化し、Pythonのプログラムをスクラッチで組み立てて(使っているライブラリはほぼNumPyとMayplotlibだけです)、実習コードで動作を確認する立て付けのです。 10章の実習プログラムはディープラーニングのプログラムになっているのですが、他の章の実習コードと比べて恐ろしく処理に時間がかかります(1つの繰り返し処理で30分から1時間)。ここをなんとかできないかと前から思っていて、先

    書籍「ディープラーニングの数学」10章のDLモデルをGPUで動かす - Qiita
    misshiki
    misshiki 2025/01/06
    “今までNumPyでやっていた繰り返し計算をすべてPytorchのTensor型データを対象とし、torch.xxの関数だけを使って行うという話”
  • ダニロ ヴァルガス ヴァスコンセロス (Danilo Vasconcellos Vargas) - k* Distribution: Evaluating the Latent Space of Deep Neural Networks using Local Neighborhood Analysis. - 論文 - researchmap

    Shashank Kotyan, Tatsuya Ueda, Danilo Vasconcellos Vargas 記述言語 英語 掲載種別 研究論文(学術雑誌) DOI 10.1109/TNNLS.2024.3446509 Most examinations of neural networks' learned latent spaces typically employ dimensionality reduction techniques such as t-distributed stochastic neighbor embedding (t-SNE) or uniform manifold approximation and projection (UMAP). These methods distort the local neighborhood in the visua

    misshiki
    misshiki 2025/01/06
    “k* 分布: 局所近傍分析を使用したディープ ニューラル ネットワークの潜在空間の評価。”
  • AIのブラックボックス解決へ計算過程を可視化 九州大 - 日本経済新聞

    九州大学の研究チームは人工知能AI)の計算過程を可視化する新しい手法を開発した。AIが何をもとに結論を出したのかが不明な「ブラックボックス問題」の解決に役立つ。医療分野でAIを使う画像診断ツールの精度向上などに使える可能性がある。ヒトの脳の仕組みをまねてデータ処理を学習する「ニューラルネットワーク」というAI技術について、AIがデータを整理する過程を可視化する「t-SNE」や「UMAP」と

    AIのブラックボックス解決へ計算過程を可視化 九州大 - 日本経済新聞
    misshiki
    misshiki 2025/01/06
    “研究チームはニューラルネットワークがデータを整理する過程を可視化する「k*分布」という手法を新たに開発した。”
  • ソニーグループポータル | ソニーのKaggle Master座談会 〜 ソニーのエンジニアとしてAIの最前線に挑み続ける

    Kaggle参加当時は、ソニーセミコンダクタソリューションズ株式会社イメージング&センシングエッジコア技術部門に所属。現在はソニー株式会社 システム・ソフトウェア技術センターに所属し、デジタル一眼カメラα™向けのAI技術および応用技術の開発に従事。 スキルアップを模索するなかで、Kaggleと出会った ── まずKaggleに参加した経緯を、当時の仕事の状況を含めて教えてください。 宮谷:私は2018年にKaggleに参加しました。当時はデジタル一眼カメラα™(アルファ)のエンジニアで、「世界に先駆け、Deep Learningをカメラに導入しよう」と着想し、カメラ画質改善やオートフォーカス向けの新規アルゴリズムの開発などを手がけていました。ただその頃はDeep Learningの実社会への応用事例が報告され始め、新手法も日々発表されていたAIの発展期。現在のように学習コンテンツが充実して

    ソニーグループポータル | ソニーのKaggle Master座談会 〜 ソニーのエンジニアとしてAIの最前線に挑み続ける
    misshiki
    misshiki 2025/01/06
    “ 宮谷:私もKaggleで色々なコンペに参加し、経験値を上げたことに”
  • BIツール研究所の代表が謎のBIツールThoughtSpotを導入した話|ウィル/Sho Maekawa

    こんにちは。BIツール研究所のウィルです。 データエンジニアリング関連でいつも勉強させてもらっている方々が参加している「datatech-jp Advent Calendar 2024」に投稿しております。とても面白い記事が多いのでぜひ他の投稿もチェックしてみてください。 私は今、コミューンというオンラインコミュニティプラットフォームなどを提供しているSaaS企業に勤めております。 これまでスタートアップでよくあるredashとLooker StudioをBIツールとして利用していたのですが、この度ThoughtSpotというBIツールを導入しました。 BIツールオタクである私が、なぜ日であまり有名ではないThoughtSpotを導入したのかをお話しします。 ざっくりとしたデータチームの状況・社員数150人くらいのスタートアップ ・立ち上げ1年ほどのデータ組織 ・データパイプラインの基礎

    BIツール研究所の代表が謎のBIツールThoughtSpotを導入した話|ウィル/Sho Maekawa
    misshiki
    misshiki 2025/01/06
    “ThoughtSpotというBIツール...USを中心としたグローバルでは有名な製品です。ガートナーのMagic Quadrant でもTableauやLookerなどと同じLeadersに位置する製品です。”
  • https://x.com/A7_data/status/1875459905466794421

    misshiki
    misshiki 2025/01/06
    “落合陽一さんの論文の読み方を参考にしたこのプロンプトをGoogle AI Studioに入れてGemini Experimental 1206と読む方がいい”
  • VSCode で LLM と論文執筆

    この記事は CyberAgent AI Lab Advent Calendar 2024 19 日目の記事です。 はじめに 非ネイティブにとって英語論文執筆はハードルが高いものですが、最近では LLM の発展によりハードルがだいぶ下がりつつあるのではないでしょうか。 LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトVSCode 上で編集する方法を紹介したいと思います。VSCode 上で編集することで、GitHub Copilot (+そのほかの強力な拡張機能) を使用することができます。また、ローカルにプロジェクトをシンクさせることで Git 管理することも可能となリます。個人的には LLM による不意な編集が気になるため、Git 化することで VSCode 上で差分の確認や復元が容易になるのはメリットだと感じて

    VSCode で LLM と論文執筆
    misshiki
    misshiki 2025/01/06
    “LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトを VSCode 上で編集する方法を紹介”
  • Building AI Products—Part I: Back-end Architecture

    In 2023, we launched an AI-powered Chief of Staff for engineering leaders—an assistant that unified information across team tools and tracked critical project developments. Within a year, we attracted 10,000 users, outperforming even deep-pocketed incumbents such as Salesforce and Slack AI. Here is an early demo: By May 2024, we realized something interesting: while our AI assistant was gaining tr

    misshiki
    misshiki 2025/01/06
    “アシスタントを動かすAIエージェントの構築方法 推論パイプラインの構築と運用方法 すべてを機能させたAI特有のツールとテクニック”
  • 将棋AIの強化学習の基礎が根底から変わりそうな件 | やねうら王 公式サイト

    将棋AIでは、教師(教師局面)を生成して、そこから評価関数パラメーターの学習を行っている。AlphaZeroなんかもそうしている。 教師は、実際に対局して生成する。ところが、この対局は、1手指すごとに何千とか何万とかの局面を探索しないといけない。Deep Learning(以下DLと略す)系の将棋AIの場合、何千とか何万の局面を探索すということは、その回数だけ推論を行うということである。普通、学習は、順伝播 逆伝播で、順伝播のコストをCとすると、逆伝播は2Cぐらい、つまり合計で3Cぐらいの計算コストを要するのだが、推論(これは順伝播)はCだから、要するに学習は3倍のコストを要する。ところが、教師生成時に1手指すのに仮に1万局面探索するとしたら、10000Cかかるわけで、これは学習コスト(3C)の3333倍である。 というように、教師生成のコストは学習時のコストとは比較にならないほどのコスト

    misshiki
    misshiki 2025/01/06
    “強化学習での教師生成のために(探索を行って)質の高い教師を生成する必要はなく、既存の(質の低い)教師データで桁違いに大きなモデルに学習させて、そいつを蒸留するほうが低い計算コストで済む可能性がある。”
  • エムスリーのAI・機械学習チームって何やってるの?2024年1年間で作ってきた28個のプロダクトを大公開 - エムスリーテックブログ

    こんにちは。エンジニアリンググループゼネラルマネジャー & 機械学習エンジニアの大垣です。 さて、私が機械学習エンジニアとして仕事をしているAI機械学習チームでは、今年一年で28個のプロダクトをリリースしました。月に2つくらいは新規プロダクトが出てる計算ですね。なかなか高速にリリースできているのではないでしょうか。 なお、この1年で5名のメンバーが新規に加わり、チームが12人から17人になったので、来年は更に加速していきたいです!*1 これらのプロダクトを簡単にお見せしつつ、エムスリーという医療xWebの企業でMLのチームはどういう仕事をしているのか、というのをお届けできればと思います! 多いっちゃ多いので、新メンバーはカルタでプロダクトを覚えています。このカルタ自体もLazzaroniというプロダクトです 年間15個以上のプロダクトをリリースするAIチームを入社したてのフレッシュな目線

    エムスリーのAI・機械学習チームって何やってるの?2024年1年間で作ってきた28個のプロダクトを大公開 - エムスリーテックブログ
    misshiki
    misshiki 2025/01/06
    “これらのプロダクトを簡単にお見せしつつ、エムスリーという医療xWebの企業でMLのチームはどういう仕事をしているのか、というのをお届け”
  • コーディングAI課金するならCodyが断トツ良い話

    概要 開発者向けの AI ツールは数多くありますが、その中で「Cody」は 無名ながらも知る人ぞ知る優れたプロダクトです。私が普段いるAI技術者コミュニティでは密かに絶大な支持を集めていますが、SNSなどでの一般的な知名度はほとんどないため、ここで紹介します。 Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。私はすでに半年課金愛用していて、おそらく来年も愛用するでしょう。 Cody とはなんぞや Cody くんは、VSCode や、JetBrains IDEs、Neovim、Eclipseなどのコードエディタの拡張機能として使えるコーディング補助 AI ツールです。 他の生成 AI コードツールと同様に、AI コード補完とAIチャットがあります。 なぜ Cody がおススメなのか C

    コーディングAI課金するならCodyが断トツ良い話
    misshiki
    misshiki 2025/01/06
    “Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。”
  • Microsoft、「Visual Studio Code」バージョン1.96公開 テキスト入力を上書きに切り替えられるオーバータイプモード追加 ターミナルで合字に対応

    Microsoftは2024年12月12日(米国時間)、WindowsLinuxmacOSに対応するクロスプラットフォームのエディタ「Visual Studio Code」(以下、VS Code)の最新版「November 2024」(バージョン1.96)を公開した。 VS Codeバージョン1.96では、テキスト入力を上書きモードに切り替えられるオーバータイプモードや、ターミナルの合字対応、拡張機能のインストール制限など、開発効率やセキュリティを向上させる機能が追加されている。 VS Codeバージョン1.96の主な変更点 関連記事 「Visual Studio Code」バージョン1.95公開 Copilot Chatがより使いやすくなる機能追加など Microsoftは「Visual Studio Code」のバージョン1.95を公開した。Copilot Editsや複数のGit

    Microsoft、「Visual Studio Code」バージョン1.96公開 テキスト入力を上書きに切り替えられるオーバータイプモード追加 ターミナルで合字に対応
    misshiki
    misshiki 2025/01/06
    “2024年12月12日(米国時間)、WindowsやLinux、macOSに対応するクロスプラットフォームのエディタ「Visual Studio Code」(以下、VS Code)の最新版「November 2024」(バージョン1.96)を公開”
  • フロントエンドでPythonを活用!PyScriptの魅力と使い方

    はじめに 皆さん、はじめまして。Thinkings株式会社でプロダクトエンジニアとして働いている、まろんです! 突然ですが、皆さんは「Python」をご存じでしょうか? 「空飛ぶモンティ・パイソン」というコメディ番組が由来で、今や非常に人気のあるプログラミング言語です。 Pythonはそのシンプルな文法と豊富なライブラリによって、データ分析機械学習、バックエンド開発など、幅広い分野で活躍しています。技術系情報共有サイト(Qiitaなど)でも、常に人気上位に入る言語です。 しかし、Webアプリケーションを開発するとき、バックエンドはPythonフロントエンドReactなどの別言語で開発することが一般的ですよね。言語が分かれることで、初心者は「なぜフロントとバックエンドで異なる言語を覚えなきゃならないの?」と苦労することもあるでしょう。 そんな方にご紹介したいのが、2022年4月にAna

    フロントエンドでPythonを活用!PyScriptの魅力と使い方
    misshiki
    misshiki 2025/01/06
    “PyScriptの魅力と使い方”
  • 2024年のスマホを総括 生成AIの浸透/カメラは完成形の域に/メーカーの勢力図に変化も

    2024年のスマホを総括 生成AIの浸透/カメラは完成形の域に/メーカーの勢力図に変化も:石野純也のMobile Eye(1/3 ページ) 「Galaxy AI」「Apple Intelligence」「Gemini」……2024年は、スマホが生成AIを取り込み、その基性能を大きく伸ばした1年だったと総括できる。一方で、スマホに搭載される機能の中で最も重要視されているカメラも、家といえるデジタルカメラに迫る性能を持った端末が多数投入された。カメラの処理にもAIがフル活用されてきたが、その集大成的な1台が目を引いた1年だった。 メーカー別という切り口で見ると、“新顔”が大きく伸びた傾向も見て取れる。Xiaomiとモトローラは、その代表格といえる。規模感ではこれら2メーカーには及ばないものの、新規参入のメーカーとしてNothing Phoneのミッドレンジモデルである「Nothing Ph

    2024年のスマホを総括 生成AIの浸透/カメラは完成形の域に/メーカーの勢力図に変化も
    misshiki
    misshiki 2025/01/06
    “2024年は、スマホが生成AIを取り込み、その基本性能を大きく伸ばした1年だったと総括できる。”
  • AWSのAIモデル Amazon Nova Lite で遊んでみる - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    AWSのAIモデル Amazon Nova Lite で遊んでみる - Qiita
    misshiki
    misshiki 2025/01/06
    “個人利用でも安く使えそうな生成AIモデルのAmazon Nova Lite と Nova Micro が登場したので遊んでみた。”
  • AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】

    2024年9月に登場した「Raspberry Pi AI Camera」は、カメラセンサー内にAI処理用のプロセッサを内蔵しており、カメラそのものにAIモデルを読み込ませてAIカメラとして使うことができます。ドキュメントも充実しており、比較的簡単にAIモデルを自作できそうだったので、実際に「USBケーブルの種類を見分けるAIモデル」をトレーニングして実行してみました。 Raspberry Pi AI Camera – Raspberry Pi https://www.raspberrypi.com/products/ai-camera/ Raspberry Pi -Ultralytics YOLO ドキュメント https://docs.ultralytics.com/ja/guides/raspberry-pi/ SONY IMX500 - Ultralytics YOLO Docs h

    AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】
    misshiki
    misshiki 2025/01/06
    “ドキュメントも充実しており、比較的簡単にAIモデルを自作できそうだったので、実際に「USBケーブルの種類を見分けるAIモデル」をトレーニングして実行してみました。”
  • AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK

    「Raspberry Pi AI Camera」はソニーのインテリジェントビジョンセンサー「IMX500」を搭載したRaspberry Pi向けカメラモジュールです。IMX500はイメージセンサーとAIアクセラレーターを積層した構造で、母艦デバイスに負荷をかけることなくAI処理をカメラ側で実行可能。そんなRaspberry Pi AI CameraがGIGAZINE編集部に届いたので、実際にRaspberry Pi 5と接続して物体検知AIを実行してみました。 Raspberry Pi AI Camera – Raspberry Pi https://www.raspberrypi.com/products/ai-camera/ ◆開封&外観チェック これがRaspberry Pi AI Cameraのパッケージです。 箱の中には各種パーツが袋に入った状態で詰め込まれていました。 内容物は

    AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK
    misshiki
    misshiki 2025/01/06
    “「Raspberry Pi AI Camera」はソニーのインテリジェントビジョンセンサー「IMX500」を搭載したRaspberry Pi向けカメラモジュールです。”
  • AIのトレーニングで使用されるチップ「H100」「H200」「MI300X」の性能を比較した結果判明した事実とは?

    AIの学習や推論に用いるAIインフラストラクチャーの市場では、「H100」「H200」といったNVIDIA製のAI特化チップが大きなシェアを獲得しています。一方で、NVIDIAのライバル企業となるAMD2023年12月に「Instinct MI300X」を発表しています。そんなH100・H200・MI300Xについて、テクノロジー系メディアのSemianalysisがさまざまなベンチマークテストを実施し、それぞれの結果について報告しています。 MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive – SemiAnalysis https://semianalysis.com/2024/12/22/mi300x-vs-h100-vs-h200-benchmark-part-1-training/

    AIのトレーニングで使用されるチップ「H100」「H200」「MI300X」の性能を比較した結果判明した事実とは?
    misshiki
    misshiki 2025/01/06
    “AMDも2023年12月に「Instinct MI300X」を発表”
  • ChatGPTライクなUIのローカルLLMを構築できるGPT4Allとは?

    GPT4AllでChatGPTライクなユーザーインタフェースで使える大規模言語モデルを構築する ChatGPTMicrosoft Copilotなどの生成AIサービスは「情報漏えいなどが心配」と感じているのならば、手元のWindows 10/11上でLLM(大規模言語モデル)を構築すればよい。ChatGPTライクなユーザーインタフェースを持つ「GPT4All」を使えば、簡単にローカルLLMの構築が可能だ。 ChatGPTMicrosoft Copilot、PerplexityなどのLLM(大規模言語モデル)/生成AIサービスを利用すると、これまで面倒だった作業が簡単にできることがある。ただ、こうした生成AIサービスは、入力データがインターネット上のどこかのサイトにアップロードされることは避けられず、どうしても情報漏えいなどのセキュリティ面で不安がある。 そんな心配がある場合、手元のWi

    ChatGPTライクなUIのローカルLLMを構築できるGPT4Allとは?
    misshiki
    misshiki 2025/01/06
    “ChatGPTライクなユーザーインタフェースを持つ「GPT4All」を使えば、簡単にLLMが利用可能だ。その使い方を紹介”
  • Devin.aiを試す - 西尾泰和の外部脳

    Devin.aiを試す 長くなってきたので切り出した Devin.aiを試す2024 2025-01-02 Session Usage Limitについて Devin went to sleep due to session usage limits. Limitをだいぶ超えてから止まるようだw 追記 説明を読むとセッション単位のように読めますが、最後のユーザーの発言以降で使用できる ACUs の上限 (by teramoto) あ、そうなんだ、どうりで超えてるものもあるなぁと思った Devin観察日記 3日目|Daiki Teramoto nishio 「さて、いよいよ金銭感覚が麻痺して参りました。一歩先の未来を生きるためのコストとして受け入れつつも、たまに冷静になる瞬間が恐ろしいです。」 あーあー聞こえないーー(1ヶ月のトークンを1週間で使い切っておかわりした人) nishio 冗談は

    Devin.aiを試す - 西尾泰和の外部脳
  • Devin

    How Nubank refactors millions of lines of code to improve engineering efficiency with Devin Overview One of Nubank’s most critical, company-wide projects for 2023-2024 was a migration of their core ETL — an 8 year old, multi-million lines of code monolith — to sub-modules. To handle such a large refactor, their only option was a multi-year effort that distributed repetitive refactoring work across

    Devin
  • Devin観察日記 0日目|Daiki Teramoto

    買うことにしました、Devin。月額500ドル。 https://devin.ai/ 今まで気になってはいたものの、高いし、買うつもりはありませんでした。 しかし今日、@nishioさんのご好意で試してみる機会を頂き、十分感動したので、やっぱり買ってみることにしました。 というわけで、今日からブログを始めます。名付けて「Devin観察日記」。 アフィリエイトも無いので、ゆるくやっていきます。 「このリポジトリを開発対象に加えたい」最初に驚いたのは、Devinへの仕事の頼み方です。GUIでポチポチするのかと思いきや、「このリポジトリを開発対象に加えたい」とメンションするだけ。 「このリポジトリを開発対象に加えたい」とDevinに指示する西尾さんたったこれだけの指示で、git cloneしてREADMEを読んで、npm installなんかまでやってくれます。リモートで向こうに人がいるような感

    Devin観察日記 0日目|Daiki Teramoto
    misshiki
    misshiki 2025/01/06
    “Devin。月額500ドル。”高い...。
  • 【徹底解説】Browser Useの仕組みや安全性、設定方法までまるっと解説!|ChatGPT研究所

    はじめに今、Xなどで話題になっている「Browser Use」は、AIがローカル環境のブラウザを自動操作できるようにするPythonライブラリです。 具体的には、Googleなどの検索サイトを開いて情報を収集したり、フォームへテキスト入力を行ったりといった「人の手作業」を代行してくれます。 「ブラウザを勝手に操作するなんて危なくないか?」と思う方もいるかもしれません。実際、便利な反面、マルウェアのリスクや情報流出の可能性を理解しておくことは重要です。 記事では、Browser Useでできることや導入の流れ、セキュリティ面の注意点などをわかりやすく整理しました。 Browser Useの導入方法では、「ターミナル」や「コマンド」など聞き馴染みのない初心者の方にもわかりやすく解説していますので、初心者の方々も安心して読み進めてください。 Browser Useとはbrowser-use は

    【徹底解説】Browser Useの仕組みや安全性、設定方法までまるっと解説!|ChatGPT研究所
    misshiki
    misshiki 2025/01/06
    “browser-use は、AIにブラウザ操作の権限を与える仕組みです。検索やクリックといった行動を自動化できる利便性がある一方、「自分のブラウザを勝手に操作される」リスクもわずかながら存在します。”
  • browser-useによるブラウザ操作自動化のサンプル集

    はじめに browser-use を使う上で詳しいドキュメントがなかったので、自分で使ってみたことをまとめてみました。 browser-use の基礎的なところは以下にまとめてあります。 ブラウザを起動させず、ヘッドレスモードで実行したい BrowserConfigのheadlessをTrueにすることで、ブラウザを起動させず、ヘッドレスモードで実行することができます。 from browser_use.browser.browser import Browser, BrowserConfig browser = Browser( config=BrowserConfig( headless=True, ) ) async def main(): model = ChatOpenAI(model='gpt-4o') agent = Agent( task='東京の天気をGoogleで調べて

    browser-useによるブラウザ操作自動化のサンプル集
    misshiki
    misshiki 2025/01/06
    “ブラウザを起動させず、ヘッドレスモードで実行したい。カスタムアクションを作成したい。ユーザーに入力を求めたい。step のマックスを設定したい。CAPTCHA を解きたい出力をカスタマイズしたい。”などなど。
  • browser-useの基礎理解

    はじめに 最近話題になっている browser-use について自己理解のために基的なところをまとめてみます。 公式リポジトリはこちら browser-use とは? browser-use は、Python で作られた「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。具体的には、下記のような機能を提供しています。 ビジョン機能や HTML 抽出 ブラウザで読み込んだページの DOM(要素構造)を解析、スクリーンショットやテキスト情報を取得できます。 マルチタブ管理 自動で複数タブを開き、それぞれのタブを並行して操作できます。 カスタムアクション機能 たとえば「特定のファイルを保存」「データベースへ登録」「社内チャットに通知する」など、ユーザー独自のアクションを定義できます。 自己修正機能 操作が失敗したり、要素を見つけられなかったりした場合に、自分で修正

    browser-useの基礎理解
    misshiki
    misshiki 2025/01/06
    “browser-use は、Python で作られた「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。”
  • browser-use やばいです - Qiita

    はじめに 語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。 プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。 早速試してみます。 実践 複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

    misshiki
    misshiki 2025/01/06
    “browser-useは使いやすく、X-Pathを使ったクローリングよりもはるかに手軽ですが、その分トークンの消費量が多いです。正確に計算したわけではありませんが、通常...の4~5倍程度のコストがかかっているようです。”
  • RAG開発の超入門【RaggleのQuickStart | Pythonのソースコードあり】

    はじめまして、ますみです! 株式会社Galirage(ガリレージ)という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^ この記事では、入門者向けの「RAG」の開発手法を解説します! もしもPythonを使ったことがない方は、下記のZennを参考にしてください。 また、RAGについての基礎知識を学びたい方は、下記のZennを参考にしてください。 さらに、RaggleというRAGの精度を競うコンペを開催しているため、ご興味のある方は、こちらのコンペを通して、RAGのスキルアップにご活用ください! なんと1位の人には、賞金30万円も付与されます🏆 それでは、早速解説をしていきます! この記事の内容を習得すれば、Raggleに応募できる状態になるため、ぜひ皆さんもRaggleのコンペに挑戦していただけたら幸いです^^ 全体の流れ

    RAG開発の超入門【RaggleのQuickStart | Pythonのソースコードあり】
    misshiki
    misshiki 2025/01/06
    “この記事の内容を習得すれば、Raggle(RAGの精度を競うコンペ)に応募できる状態になるため、ぜひ皆さんもRaggleのコンペに挑戦していただけたら”
  • RAGで使うベクトルDBと検索エンジン、WeaviateのCEOに「違い」を聞いた

    生成AI人工知能)に業務データを活用させる手法として有力視されているRAG(Retrieval-Augmented Generation、検索拡張生成)には、ベクトルデータベース(DB)やベクトル検索エンジンと呼ばれる技術を使用する。 今回、ベクトルDBの「Weaviate」を開発するオランダWeaviate(ウィービエイト)の創業者でCEO(最高経営責任者)のBob Van Luijt(ボブ・ヴァン・ルイット)氏が2024年12月に来日した際、インタビューする機会を得た。ベクトルDBとベクトル検索エンジンは何が異なり、ユーザーは2つの技術をどう選択すべきなのか聞いたので紹介しよう。 まず、RAGにおいてベクトルDBとベクトル検索エンジンが果たす役割は、基的に同じだ。ユーザーがチャットボットなどに入力したプロンプト(指示文)に関連する情報を、業務データなど大規模言語モデル(LLM)が事

    RAGで使うベクトルDBと検索エンジン、WeaviateのCEOに「違い」を聞いた
    misshiki
    misshiki 2025/01/06
    “Weaviate自体がRAGのワークフローを実現する仕組みを搭載することでLangChainやLlamaIndexを使わなくてもRAGアプリを構築できるようにする。Weaviateがあれば、開発者はコードを5行記述するだけで、RAGアプリを実現可能になる”
  • DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説

    なぜDeepSeek V3は“破壊的”なのか? 大規模言語モデル(LLM)といえば、OpenAIのGPTシリーズやMetaのLlamaシリーズなど、膨大な学習コストと大手企業の潤沢なリソースが必要というイメージが強いかもしれません。しかし、2024年末にリリースされたDeepSeek V3は、その“常識”を一変させる存在として大きな注目を集めています。 わずか数カ月・約558万ドルという圧倒的低コストで学習完了 GPT-4oに匹敵する性能をうたうオープンソースモデルであり、APIも数分の1~十数分の1と圧倒的価格破壊を起こしている Mixture-of-Experts(MoE)を活用して370B級モデルを安価・高速に動作 こうしたインパクトは「破壊的」と評されるに十分でしょう。これまで「開発コスト」や「リソース」による参入障壁が高かったLLMの世界に、新たな扉を開く可能性を秘めているからで

    DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説
    misshiki
    misshiki 2025/01/06
    “わずか数カ月・約558万ドルという圧倒的低コストで学習完了。GPT-4oに匹敵する性能をうたうオープンソースモデルであり、APIも数分の1~十数分の1と圧倒的価格破壊を起こしている。370B級モデルを安価・高速に動作”
  • Killed by LLM

    Killed 1 month ago, Abstract reasoning challenge consisting of visual pattern completion tasks. Each task presents a sequence of abstract visual patterns and requires selecting the correct completion. Created by François Chollet as part of a broader investigation into measuring intelligence. It was 5 years and 1 months old.

    misshiki
    misshiki 2025/01/06
    「AI」の性能が「人間」を超え、最先端を測定できなくなったベンチマークを「飽和:Saturation」と表現。飽和時点を記念碑として時系列で並べた一覧。「Killed by Google」に着想を得ているが面白い!
  • 円城塔のローラ:Apple silicon専用機械学習フレームワークを用いた円城塔LLMの開発と運用 - SF游歩道

    Apple silicon専用の機械学習フレームワークMLXと,MLXを用いた大規模言語モデル(LLM)を利用するためのツール群MLX-LMを用いて,芥川賞作家円城塔の小説を模倣する(ことが期待される)小説生成機関を作成したので,作成方法や運用結果について記す. 導入 方法 結果 議論 国立情報学研究所が公開するllm-jpの元データの再配布に関する著作権法上の問題 円城塔の模倣を生成するために,エンジニアが円城塔を模倣する必要がある問題 確認のために結局人力査読が必要な問題 感想 おまけ 参考文献 導入 Appleは,自社で開発したApple silicon専用の機械学習フレームワークMLXを公開し,またMLXを用いた大規模言語モデル(LLM)を利用するためのツール群MLX-LMを開発・公開している. 一方,芥川賞作家である円城塔は,自身のGitHub小説データセットを公開している.デ

    円城塔のローラ:Apple silicon専用機械学習フレームワークを用いた円城塔LLMの開発と運用 - SF游歩道
    misshiki
    misshiki 2025/01/06
    “MLXを用いた大規模言語モデル(LLM)を利用するためのツール群MLX-LMを用いて,芥川賞作家円城塔の小説を模倣する(ことが期待される)小説生成機関を作成したので,作成方法や運用結果について”
  • AIスクレインピングエージェントの構築(LangGraph, Firecrawl)

    はじめに この記事では、LangGraphとFirecrawlを使用して、企業のWebサイトから特定の情報を抽出するWebスクレインピングエージェントを構築する方法を紹介します。具体的には、企業のホームページから社長の名前を取得する方法を解説します。 参考にさせていただいた動画 この動画では特定のキーワードをホームページから取得していますが、今回は正規表現では取得できないより抽象的な情報を取得することに挑戦しました。 使用技術 LangGraph LangGraphは、AIエージェントを作るためのツールで、複雑な処理をいい感じに管理してくれる便利なフレームワークです。状態遷移グラフを使って、どの処理をどの順番でやるかを分かりやすく設計できます。 特徴: 処理の流れを図にして確認できる(Mermaid図対応) 条件分岐や並列処理ができて柔軟 タスクの状態を一括管理 プロジェクトでの役割:

    AIスクレインピングエージェントの構築(LangGraph, Firecrawl)
    misshiki
    misshiki 2025/01/06
    “LangGraphとFirecrawlを使用して、企業のWebサイトから特定の情報を抽出するWebスクレインピングエージェントを構築する方法を紹介”
  • AIエージェントの発展とRAGの新境地、「エージェンティックRAG」が注目される理由 | AMP[アンプ] - ビジネスインスピレーションメディア

    既存RAGの課題、ハルシネーションやコンテキスト理解不足など 企業における生成AI活用では、情報の正確性が特に重視される。そのため、生成AIを利用する場合、検索拡張生成(RAG)の導入が一般的となっている。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれている。 しかし、既存のRAGシステムには、いくつかの課題が存在する。課題は大きく4つに分類される。 第1の課題は、RAGだけでは情報の正確性が担保できないことだ。たとえば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれる。この場合、CRMが最も信頼できる情報源となるはずだが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報

    AIエージェントの発展とRAGの新境地、「エージェンティックRAG」が注目される理由 | AMP[アンプ] - ビジネスインスピレーションメディア
    misshiki
    misshiki 2025/01/06
    “エージェンティックRAGは、AIエージェントをRAGパイプラインに組み込むことで、情報検索と生成の精度を向上させる手法である。”
  • 2025年はRAGの次にAIエージェントが来る

    はじめに 2024年のAI界隈では「RAG」が一巡し、その可能性と限界が明確になってきました。最も顕著な点は「RAGは魔法の杖ではない」という認識の広がりではないでしょうか? RAGは確かに、既存の文書やデータを活用したAIの応答精度向上に貢献してきました。しかし、単純な質問応答を超えた複雑なタスクの実行や、動的な状況への適応には限界があることも明らかになっています。この限界を超えるための次のステップとして注目を集めているのが「AIエージェント」です。 OpenAICEOであるサム・アルトマンが「次のブレークスルーはエージェントだ」と発言していたり Anthropic社員がこのようなスピーチをしたりしています。 AIエージェントとは AIエージェントは、特定のタスクや目的のために設計された自律的なAIシステムです。たとえば、会議の参加者の予定を自動で調整して最適な時間を設定するAIアシス

    2025年はRAGの次にAIエージェントが来る
    misshiki
    misshiki 2025/01/06
    AIエージェントについて、概要、特徴、代表的な種類、マルチエージェント用のフレームワークなど、一通りの全体像をまとめている記事。
  • 2024年 ビッグテックのAI Agent 動向まとめ

    はじめに 株式会社neoAIの研究開発組織 (neoAI Research) / 東京大学の大槻真輝です。 最近LLMの推論能力の向上によりAI Agentがトレンドになりつつあります。また、MicrosoftAmazonなどのビッグテックもAI Agentをテーマに様々なプロダクトやサービスを展開し始めています。 そこで今回は2024年4月にIBMとMicrosoftが出したAgentに関するサーベイ論文「The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey」 を軸にGoogleAWSMicrosoftOpenAI、AnthropicのAgentに関する動向や立ち位置を整理したいと思います。 論文概要 エージェントとは? 2023年の

    2024年 ビッグテックのAI Agent 動向まとめ
    misshiki
    misshiki 2025/01/06
    “2024年4月にIBMとMicrosoftが出したAgentに関するサーベイ論文「The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey」を軸にGoogle、AWS、Microsoft、OpenAI、AnthropicのAgentに関する動向や立ち位置を整理。”
  • AIのマルチエージェントシステムとは? その構築方法、CrewAIでの導入ステップガイド

    大規模言語モデル(LLM)を活用したAIエージェントを複数組み合わせる「マルチエージェントシステム(マルチAIエージェント)」の構築において、LangChainとCrewAIという2つのフレームワークが注目を集めている。LangChainは、特定機能を持つエージェントを設計し、多様なLLMを統合できる基盤的プラットフォーム。一方、CrewAIは、LangChain上に構築されており、マルチエージェントシステムに特化した組織化と協調の層を提供するフレームワークだ。この記事では、AIマルチエージェントシステムの基礎と具体的なサービス、さらにはCrewAIを使って、リサーチャー、データアナリスト、ライターの3つのAIエージェントが市場分析を行う具体的なシステムの構築方法を紹介したい。

    AIのマルチエージェントシステムとは? その構築方法、CrewAIでの導入ステップガイド
    misshiki
    misshiki 2025/01/06
    “AIマルチエージェントシステムの基礎と具体的なサービス、さらにはCrewAIを使って、リサーチャー、データアナリスト、ライターの3つのAIエージェントが市場分析を行う具体的なシステムの構築方法を紹介”
  • AIエージェントの評価|Weights & Biases Japan

    W&B AI Solution Engineerの鎌田 (X: olachinkei) です。2023年以降注目を集める「AIエージェント」ですが、その可能性が広く議論されている一方で、具体的な開発プロセスや評価方法についての情報はまだ整理されていないのが現状です。そこで、ブログではAIエージェントに関する評価体系について、現時点での知見をまとめていきます。専門的な内容も交えながらも、できる限りわかりやすくお届けしますので、ぜひ最後までお付き合いください。 Compound AI システムの登場とAIエージェントへの発展生成AIの進化により、特に大規模言語モデルは簡単なプロンプト入力だけでさまざまなタスクを解決できるようになりました。しかし、AIの活用が広がる中で、私たちは単一のモデルに依存するアプローチから複数のコンポーネントを統合する新しいアプローチへと移行しています。このアプローチ

    AIエージェントの評価|Weights & Biases Japan
    misshiki
    misshiki 2025/01/06
    “AIエージェントに関する評価体系について、現時点での知見をまとめていきます。”
  • 対話型AIエージェントでGoogle AI Agentハッカソンの担当者を作ってみた

    作ったもの カスタマーサポート全般を行う対話型AIエージェントを作成しました。 ユーザからの質問対応や新機能要望のヒアリング、さらにクレームや緊急対応受付を一括して対話型AIエージェントが担います。 AIエージェントとの対話内容は自動的に分析され、スプレッドシートで一元管理されます。新機能の要望は即座にGitHub Issueとして起票され、クレームや緊急度の高いケースはSMSで担当者へリアルタイム通知する仕組みを備えています。 対象ユーザ 今回のプロダクトの対象ユーザは、ハッカソンの参加者および担当者になります。 ただ、このプロダクトはプロンプトを変えるだけであらゆるサービス・商品のカスタマーサポート担当をAIエージェントができるようにカスタマイズ性高く構築しています。 背景にある課題 ハッカソンの開発プロジェクト条件に、以下のサービスを使うことが要件となっています。 参加者は自分が

    対話型AIエージェントでGoogle AI Agentハッカソンの担当者を作ってみた
    misshiki
    misshiki 2025/01/06
    “カスタマーサポート全般を行う対話型AIエージェントを作成しました。 ユーザからの質問対応や新機能要望のヒアリング、さらにクレームや緊急対応受付を一括して対話型AIエージェントが担います。”
  • 2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集

    関連リソース Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents 【論文紹介】LLMベースのAIエージェントのデザインパターン18選 基盤モデルを用いたAIエージェントの設計パターン The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey は、「AIエージェントのアーキテクチャ」について、シン

    2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集
    misshiki
    misshiki 2025/01/06
    “軽量DDDのようにすぐ実装に応用しやすいパターンやガイドラインの類を探してみました。”
  • Anthropicの定義する"AI Agent"を理解する

    巷では「AIエージェント」のワードをよく見かける一方、何をAIエージェントと定義するのか自分もフワっとしていたので、2024年12月20日に公開されたAnthropicの「Building effective agents」の記事を読んでみました。 「AIエージェントの定義ははっきりと定まっていません」みたいな文言は方々で見ますが、各社がどういう見解でそのワードを使っているのか、なんとなく理解することはできます。 ちなみに、以下の「うたたね / Masaki Otsuki」さんの記事では各社がどのような位置付けとしているのかがまとまっており、私も勉強させていただきました。ありがとうございます。 ※記事ではAnthropicの記事に焦点を絞り、記事の内容を元に記述しています。 エージェントとワークフローの違い ワークフロー: LLMとツールが事前定義されたコードのパスを通じて調整されるシス

    Anthropicの定義する"AI Agent"を理解する
    misshiki
    misshiki 2025/01/06
    “Anthropicの記事に焦点を絞り、記事の内容を元に記述”
  • LLMがオワコン化した2024年

    当ニュースレターは2023年を「SaaSがオワコン化した年」と位置づけたが、2024年は早くもAIが終わった一年であった。少なくとも大規模言語モデル(LLM)そのものの発展を、物珍しそうに追いかける時期は過ぎた。生成AIが今後どこまで賢くなるかはもちろん未知数である。しかし、既に業務で十分に役立つレベルにある現行モデルのコストが今後も下がっていくことは確実だ。 The cost of GPT-4 APIs at launch in Mar 2023 was roughly ~$30 per 1m tokens. Seeing Deepseek V-3 APIs at ~$1 per 1m tokens today. For AI application companies, cost of "intelligence" is falling significantly faster tha

    LLMがオワコン化した2024年
    misshiki
    misshiki 2025/01/06
    “少なくとも大規模言語モデル(LLM)そのものの発展を、物珍しそうに追いかける時期は過ぎた。”
  • 動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

    “テキストから物理シミュレーションを生成するAI”を内蔵した高速物理エンジン「Genesis」Genesisは、新たに開発された物理エンジンで、多彩な3Dオブジェクトや物理現象の生成機能を備えています。この物理エンジンは、ロボット工学や物理AIアプリケーションなど、幅広い分野での活用を見据えて開発されました。 Pythonベースのオープンソースとして開発され、GitHubでコードが公開されていますが、現在はIsaac Gym/LabやMujocoと同様の物理シミュレーター部分のみが公開されており、生成機能は内部開発用として非公開となっています。 Genesis開発者のKashu Yamazaki氏に聞いたところ、Genesisの構造は低レイヤーに物理シミュレーター、高レイヤーに生成AIエンジン(イメージとしてはLLMエージェントに近い形)を備えており、ユーザーのプロンプトから物理シミュレー

    動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
    misshiki
    misshiki 2025/01/06
    “テキストから物理シミュレーションを生成するAIを内蔵した高速物理エンジン「Genesis」、GPT-4oやClaude-3.5-Sonnetに匹敵するオープンソースの大規模言語モデル「DeepSeek-V3」を取り上げます。”
  • 12 Days of OpenAI の対抗馬となる Google からの発表まとめ - Algomatic Tech Blog

    こんにちは。NEO(x) の宮脇(@catshun_)です。 先日 OpenAI から 12 Days of OpenAI がありましたが、同時に Google のリリースも注目されていたのでこちらにまとめます。 Gemini 2.0 1. パフォーマンスの大幅な改善 2. マルチモーダル I/O の対応 3. ネイティブツールの呼び出し 4. Gemini 2.0 Flash Thinking Exp モデルのリリース Gemini 2.0 を使用するプロジェクト例 1. Project Astra 2. Project Mariner 3. Jules 4. Data Science Agent Deep Research Veo 2 Imagen 3 Whisk NotebookLM Plus Android XR Google Agentspace 1. 企業全体での情報発見 2.

    12 Days of OpenAI の対抗馬となる Google からの発表まとめ - Algomatic Tech Blog
    misshiki
    misshiki 2025/01/06
    “Gemini 2.0”など。
  • OpenAI、営利企業(PBC)への再編計画を発表 AGIの使命のために

    OpenAIは12月27日(現地時間)、現在の非営利団体と営利企業という構造を見直し、進化させていくと発表した。AGIの利益を全人類に届けるという使命を達成するためという。 AGI実現のためにはさらなる資金調達が必要なため、現行の営利企業をデラウェア州公益法人(PBC)に転換する計画だ。 同社は2015年、AGI実現を目指して研究機関として設立された。当初はAGI開発のためにこれほどの計算能力が必要だとは想定していなかった。 だがやがて、LLMの大規模化がAGIへの有望な道であることが明らかになり、そのためには寄付以上の資が必要になった。そのため、2019年に研究機関から現在の体制である、非営利団体が管理する営利企業という独自構造に再編した。 この体制で、10月には66億ドル調達したが、より多くの投資家から資金を調達するためには、株式を発行できる組織構造に移行する必要があるという。 そ

    OpenAI、営利企業(PBC)への再編計画を発表 AGIの使命のために
    misshiki
    misshiki 2025/01/06
    “AGI実現のためにはさらなる資金調達が必要なため、現行の営利企業をデラウェア州公益法人(PBC)に転換する計画だ。”
  • OpenAIが営利企業が事業を主導していく形態へ転換する方針を表明

    チャットAIChatGPT」の開発で知られるOpenAIが、「非営利組織の下に営利部門子会社がある」という体勢を改めて、営利企業による事業主導へと転換する方針を明らかにしました。 Why OpenAI’s Structure Must Evolve To Advance Our Mission | OpenAI https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/ OpenAI's for-profit plan includes a public benefit corporation https://www.engadget.com/ai/openais-for-profit-plan-includes-a-public-benefit-corporation-163634265.

    OpenAIが営利企業が事業を主導していく形態へ転換する方針を表明
    misshiki
    misshiki 2025/01/06
    “一方で、OpenAIすべてが営利企業化するわけではなく、非営利組織のOpenAI Inc.も継続して残り、健康や教育、科学の分野での慈善活動を追求していくことになるとのことです。”
  • OpenAIはVisaのように技術ではなく法律で市場を支配しようと企んでいるとの指摘

    OpenAIが、決済業界においてVisaが実施した戦略と同様に、他企業の参入障壁を設けることでAI市場で支配的な地位を確立しようとしているとジャーナリストのテイラー・ローレンツ氏が指摘しています。 OpenAI is Visa - Sherwood News https://sherwood.news/tech/openai-is-visa/ ローレンツ氏は「Visaの成功は単に決済ネットワークを構築したことではなく、顧客を囲い込み、競合他社を締め出す障壁を作ったことにある」と言及。AIを開発するOpenAIGoogle、Meta、Amazonのような競合と争わなければならないため、OpenAI人工知能Visaになろうとしていると話しました。 Visa歴史は1958年にさかのぼります。この年、バンク・オブ・アメリカが6万人のカリフォルニア州民にクレジットカードを一方的に郵送し、その

    OpenAIはVisaのように技術ではなく法律で市場を支配しようと企んでいるとの指摘
    misshiki
    misshiki 2025/01/06
    “OpenAIが、決済業界においてVisaが実施した戦略と同様に、他企業の参入障壁を設けることでAI市場で支配的な地位を確立しようとしている”
  • OpenAIの最新研究が明かすAIのスキルレベル、AIエンジニアリングなど高度スキル領域も自動化される可能性 | AMP[アンプ] - ビジネスインスピレーションメディア

    AI機械学習エンジニアリングスキルを測定するMLEベンチマークの登場 AIによる自動化は、さまざまな領域へと拡大の一途をたどっている。その波は、単純作業だけでなく、高度な専門性を要する分野にまで及び始めている。現在、注目を集めているのが機械学習エンジニアリングだ。 OpenAIが2024年10月、AIシステムによる機械学習エンジニアリングの能力を測定する新しいベンチマーク「MLE-bench」を発表。この研究により、AIが高度な専門領域でも一定の成果を上げられる可能性が明らかになった。 このベンチマークは、機械学習コンテストのプラットフォームとして知られるKaggleの実世界データサイエンスコンペティション75件を活用し、AIシステムの能力を包括的に評価するもの。Kaggleとは、企業や研究機関が抱える実際のデータ分析の課題を、世界中のデータサイエンティストが競って解決するプラットフォー

    OpenAIの最新研究が明かすAIのスキルレベル、AIエンジニアリングなど高度スキル領域も自動化される可能性 | AMP[アンプ] - ビジネスインスピレーションメディア
    misshiki
    misshiki 2025/01/06
    “OpenAIが2024年10月、AIシステムによる機械学習エンジニアリングの能力を測定する新しいベンチマーク「MLE-bench」を発表。この研究により、AIが高度な専門領域でも一定の成果を上げられる可能性が明らかになった。”
  • ChatGPTとSoraで障害発生──原因は「上流プロバイダー」

    関連記事 OpenAIの「12 Days」まとめ OpenAIが12月5日から12日間にわたって12の発表を行ってきた「12 Days of OpenAI」が完結。その内容を簡単にまとめた。 OpenAIChatGPTApple Intelligenceとの連携開始で約4時間ダウン OpenAIChatGPTやSoraが12月11日、数時間にわたってダウンした。同日からApple IntelligenceやMacでアカウントなしでChatGPTにアクセスできるようになっていた。 ChatGPTが一時ダウン 平日朝からの障害で「仕事にならない」などの声も 米OpenAIのチャットAIChatGPT」において、11月22日朝から障害が発生。ChatGPTAPIの両方でアクセスできない状態が続いていたが、午前10時半(日時間)に復旧。編集部でもアクセスできることを確認した。 Chat

    ChatGPTとSoraで障害発生──原因は「上流プロバイダー」
    misshiki
    misshiki 2025/01/06
    “「ChatGPT」や「Sora」、APIで12月26日午前11時ごろ(現地時間)から、エラー率が高くなる問題が発生している。同社はステータスページで「この問題は上流プロバイダーによって発生」したと説明し、修正に取り組んでいる
  • アメリカでも中国でもない Sakana AIが日本を本丸とする意義:朝日新聞GLOBE+

    生成AI人工知能)開発のスタートアップ企業「Sakana AI」(社・東京都港区)は、創業1年ほどで、企業評価額10億ドル超で未上場のユニコーン企業になるなど、注目を集めています。Sakana AIの共同創業者で最高執行責任者の伊藤錬(れん)氏による講演会「AIの作り方、AI企業の作り方」(主催:東京大学未来ビジョン研究センター・同センター安全保障研究ユニット、共催:朝日新聞GLOBE)が11月19日、東京大学で開かれました。講演の後半では、宮地ゆう朝日新聞編集委員が聞き手となり、Sakana AIの意義や目指すところを深掘りしました。 ――そもそも、ともにSakana AIを創業したデイビッド・ハさんやライオン・ジョーンズさんとはどうやって知り合ったのですか? デイビッドは、イギリスで私が働いていた企業の仲間です。デイビッドとライオングーグルの元同僚同士で、私はデイビッドを通してラ

    アメリカでも中国でもない Sakana AIが日本を本丸とする意義:朝日新聞GLOBE+
    misshiki
    misshiki 2025/01/06
    “エヌビディアで、アメリカ勢からの投資はおしまい。なぜかと言うと、我々は日本の会社で、日本が本丸なのです。我々は日本の課題を解決したいと思っています。”
  • NVIDIA(エヌビディア)も出資、Sakana AIをつくった「まったく逆」の発想とは?:朝日新聞GLOBE+

    生成AI人工知能)開発のスタートアップ企業「Sakana AI」(社・東京都港区)は、創業1年ほどで企業評価額10億ドル超のユニコーン企業になるなど、注目を集めています。Sakana AIの共同創業者で最高執行責任者の伊藤錬(れん)氏による講演会「AIの作り方、AI企業の作り方」(主催:東京大学未来ビジョン研究センター・同センター安全保障研究ユニット、共催:朝日新聞GLOBE)が11月19日、東京大学で開かれました。講演の内容を2回にわたってお伝えします。 Sakana AIは、2003年に作ったばかりの会社です。香港系カナダ人のデイビッド・ハ(最高経営責任者)、イギリス・ウェールズ出身のライオン・ジョーンズ(最高技術責任者)と私でつくりました。 デイビッドは、米金融大手ゴールドマン・サックスでデリバティブ(金融派生商品)のトレーダーだったのですが、「AIの研究者になる」と一念発起して

    NVIDIA(エヌビディア)も出資、Sakana AIをつくった「まったく逆」の発想とは?:朝日新聞GLOBE+
    misshiki
    misshiki 2025/01/06
    “でも、「AIがあなたの生活を劇的に変えた経験ってありますか」と言われると、私はなかったんです。 実はこれが今のAIの限界、AIの問題点だと思っていて”
  • 【本命】Googleから検索エージェントが登場!

    ついに、GoogleからDeep Research(検索エージェント)がリリースされました。 検索エージェントとは何なのか?検索(ググる)はどうアップデートされたのか? Deep Researchの魅力や強みを紹介しながら、紐解いていきます。 あやみ氏(https://x.com/ayami_marketing)が、Deep Researchを使ってDeep Researchの記事を書いてくれました笑 このまま記事にしてしまおうか....と悩むくらいクオリティが高いです。 (ハルシネーションがあるか探してみてくださいね!) ぜひ最後までお読みください。 Deep Research執筆記事のあとに、私の解説も入れています。こちらも合わせて読んでいただけると嬉しいです。 なお、途中の挿入画像はImageFXで生成しており、プロンプトは前段の文章を英訳して入れただけです。 ざっくり概要を把握

    【本命】Googleから検索エージェントが登場!
    misshiki
    misshiki 2025/01/06
    “Gemini Deep Researchは、AIを活用して複雑なトピックを自動的に調査し、包括的で読みやすいレポートを提供する機能です”
  • 2024 AI Timeline - a Hugging Face Space by reach-vb

    Discover amazing ML apps made by the community

    2024 AI Timeline - a Hugging Face Space by reach-vb
    misshiki
    misshiki 2025/01/06
    2024年に登場したAIモデル(Llama 3.1などのOpen Source Models: 55件と、o1などのAPI Only Models: 63件)が時系列に並べられた一覧表(閲覧専用のカンバンボード?)です。時系列の図を作る時に参考になりそう。
  • さよならClaude、こんにちはGemini 〜Claude愛用者がGeminiに乗り換えた理由〜|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

    大規模言語モデルの進化は目覚ましく、新しいモデルが次々と登場する中、Gemini 2.0シリーズに注目しています。 上記記事を出してから私は1年弱ほど、Claude 3.5をメイン使用してきました。Claudeは「いいヤツ」で個人的にも愛着があったのですが、後ろ髪を引かれつつ最近Geminiに乗り換えました。(Claude 3.5Opusが出たらまた戻るかもしれません) このポストでたくさんの方から共感の声をいただいたのだが、自分でも確かにClaudeの方が性格がいいと思う。 その点に関してClaudeに聞いてみると、 「その他のAIモデルとの比較について、私の視点からコメントをさせていただくのは適切ではないと考えています。」 と返ってきた。 やはり性格がいい。 https://t.co/Ozxpp8yunW — K.Ishi@生成AIの産業応用 (@K_Ishi_AI) December

    さよならClaude、こんにちはGemini 〜Claude愛用者がGeminiに乗り換えた理由〜|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
    misshiki
    misshiki 2025/01/06
    “Claude 3.5からGemini 2.0シリーズに乗り換えた筆者の経験に基づき、その実力と現状の課題を解説し”
  • マイクロソフト、AIデータセンターに800億ドル(12.6兆円)投資

    マイクロソフト、AIデータセンターに800億ドル(12.6兆円)投資
    misshiki
    misshiki 2025/01/06
    “半分以上を米国に投資。そのうえで、まもなく発足するトランプ政権に、「大統領と議会は、米国のAIリーダーシップの強化を支援のために取り組みを拡大すべき」と提言している。”
  • マイクロソフト AI開発のデータセンター構築に巨額投資と発表 | NHK

    AI人工知能をめぐる開発が加速する中、アメリカIT大手・マイクロソフトは、ことし6月末までに、開発に必要なデータセンターの構築に日円で12兆5000億円余りの巨額の投資を行うことを発表しました。 これは、マイクロソフトのブラッド・スミス社長が3日、自社の公式ブログで明らかにしたものです。 それによりますと、会社はことし6月末までの1年間にAIの開発に必要なデータセンターの構築に800億ドル、日円で12兆5000億円余りの投資を行うとしていて、このうちの半分以上はアメリカ投資するとしています。 また、ブログでは、トランプ次期大統領の就任を前にAIに関する政策提言もしていて「最も優先すべき公共政策は民間部門が追い風を受けて前進し続けられるようにすることだ」と述べ、競争力を高めるためにも強引な規制によって民間部門を減速させるべきではないとの考えを示しました。 AIへの投資をめぐっては、

    マイクロソフト AI開発のデータセンター構築に巨額投資と発表 | NHK
    misshiki
    misshiki 2025/01/06
    “マイクロソフトは、ことし6月末までに、開発に必要なデータセンターの構築に日本円で12兆5000億円余りの巨額の投資を行うことを発表”
  • 研究者にとってo1Proは3万円課金する価値があるか?|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

    研究者が論文執筆や助成金の申請書を書く際、近年は大規模言語モデル(LLM)を活用するケースが増えています。確かにo1proの書く文章はAI臭さが無いですし、その知識や発想力に驚かさせる事は多いです。ただo1proをアカデミック関連の業務に試してきましたが、その経験から言えば、3万円を払ってo1Proを使う必要性は低い、というのが私の現在のところの正直な結論です。以下に理由を述べます。 1. o1モデルにおけるプロンプトのコツo1モデルは「シンプルなプロンプトがベスト」とされており、複雑なコンテキストや指示を加えすぎると性能を発揮しづらいと言われています。一部のプロンプトエンジニアリング(few-shot learning や「think step by step」など)は、性能を向上させない場合もあります。以下がベストプラクティスです: シンプルで直接的に:簡潔な指示が最も効果的です。 連

    研究者にとってo1Proは3万円課金する価値があるか?|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
    misshiki
    misshiki 2025/01/06
    “現状の感想としては「研究者が論文・申請書のためにo1Proに課金する必要は薄い」という結論”
  • ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi

    2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。 また、Googleは、2024年12月6日にGemini-Exp-1206(Gemini 2.0 Experimental Advanced)、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。 AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル(o1とGem

    ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi
    misshiki
    misshiki 2025/01/06
    “Chatbot Arenaでの性能評価では、Geminiのスコアがo1のスコアを上回っているようでしたが、実際にテストしてみると、ほとんどの分野でo1の性能がGemini 2.0を圧倒していました。”
  • AIによる性的な偽画像作成サイトへのアクセス、世界3番目1800万回…被害拡散の温床

    【読売新聞】 生成AI(人工知能)で性的な偽画像「ディープフェイク」を作成できるサイトへの日国内からのアクセス数が、11月までの1年間で1800万回超に上り、米国、インドに続き世界で3番目に多かったことが読売新聞の調査でわかった。

    AIによる性的な偽画像作成サイトへのアクセス、世界3番目1800万回…被害拡散の温床
    misshiki
    misshiki 2025/01/06
    “生成AI(人工知能)で性的な偽画像「ディープフェイク」を作成できるサイトへの日本国内からのアクセス数が、11月までの1年間で1800万回超に上り、米国、インドに続き世界で3番目に多かった”
  • 「人がAIと共同作業する未来」へ突き進む 2025年のAIを予測する【西田宗千佳のイマトミライ】

    「人がAIと共同作業する未来」へ突き進む 2025年のAIを予測する【西田宗千佳のイマトミライ】
    misshiki
    misshiki 2025/01/06
    “2025年は「本格的活用ルール」の行方が定まる時期と言えそうだ。”
  • 元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01|CreativeEdge Vlog

    元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01 2025年元旦 2016年11月からスタートした「AIクリエイティブ」は8年、生成AIに注力してから2年経ちました。昨年は業のInstructional Designを「0」、生成AIを「100」にして取り組んできましたが、2025年も継続していきます。 ただ、「映画を撮らない映画監督のように」今後も表舞台ではInstructional Designerを名乗ります。 廃業宣言みたいなものですが、生成AIをビジネスにすることだけは避けないといけませんので(※生成AIは最大限に活用するけど生成AIのビジネスはしない)、複合的かつ多層的に将来を決めていきたいと思います。 「AIクリエイティブ」活動は8年、生成AIの取り組みは2年経過4月から開始した非公式のライブ配

    元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01|CreativeEdge Vlog
    misshiki
    misshiki 2025/01/06
    “特定の技術に依存した強固なワークフローは大変危険なので、常に置き換え可能な状態にしておくことが重要。”
  • ONE OK ROCKが“AIと共存した”MVを発表。人工知能で人の心を動かすことはできるのか?

    ONE OK ROCKが“AIと共存した”MVを発表。人工知能で人の心を動かすことはできるのか?2024.12.26 18:007,745 照沼健太 AI人工知能)と人類は共存できるのか。 CGを一切使わず、AIと一緒に作った映像。それが、ONE OK ROCKのニューシングル「Dystopia」のMVです。 Video: ONE OK ROCK/YouTube実写映像とAIが生成した映像を合成することで、SF的なディストピア世界を描き出した作は、「AIを制作チームの一員」として迎え、人間とAIが共存しながらクリエイションする方式をとって制作されました。 ONE OK ROCKのボーカル・Takaさんと、MVを手がけた北田 一真監督(以下、北田監督)の対談を通し、1年前には考えられなかった「AIとMVを共作した」作の舞台裏と、そこに込められた二人の情熱に迫ります。 ディストピアの中

    ONE OK ROCKが“AIと共存した”MVを発表。人工知能で人の心を動かすことはできるのか?
    misshiki
    misshiki 2025/01/06
    “CGを一切使わず、AIと一緒に作った映像。それが、ONE OK ROCKのニューシングル「Dystopia」のMVです。”
  • AIは人間の進化をどのように変えるのか?

    AIの発展によって社会が大きく変わることが予想されますが、AIの影響は社会レベルにとどまらず、生命体としての人間の進化にも影響を及ぼす可能性があります。そこでオーストラリアのニューサウスウェールズ大学の進化生物学者であるロバート・ブルックス氏が、「AIが人間の進化をどのように変えるのか?」について解説しています。 Smaller brains? Fewer friends? An evolutionary biologist asks how AI will change humanity’s future https://theconversation.com/smaller-brains-fewer-friends-an-evolutionary-biologist-asks-how-ai-will-change-humanitys-future-244179 「今よりもっと高度なAI

    AIは人間の進化をどのように変えるのか?
    misshiki
    misshiki 2025/01/06
    “すでに人間は、文字と筆記によって知識を外部化することで個人が覚えるべき負担が軽減され、その結果としてここ数千年で人間の脳が縮小。AIの進化も同様に、人間の脳を縮小させる方向に進化させる可能性がある。”
  • もうすぐ消滅するという人間の翻訳について|平野暁人

    ひとつの翻訳が、終わった。 1の翻訳原稿を仕上げた、わけではない。 この世界に存在していた翻訳のひとつが いま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は0件。 2025年の収入見込みも畢竟、0円ということになる。 あくまでもひとつの翻訳の話である。 つまりは翻訳のひとつの話である。 関係ないと思うならこの先を読まなくてもいい。 自分の知る現実と違うならこの先を信じなくてもいい。 人間の数だけ人間があり 現実の数だけ現実がある。 そのような場所を あるいはそのとらえ難さをこそ 人は「世界」と呼ぶのだから。 そうしてその「世界」の中で ひとつの翻訳が終わった。 じつに翻訳のひとつとして 文字通り終わってしまった。 もっとも、収入の見込みが完全に断たれた経験はこれが初めてではない。 わずか数ヶ月前まで遥かな対岸でちらちらと燃えていたはずの疫禍がその存外長い舌を露わにし

    もうすぐ消滅するという人間の翻訳について|平野暁人
    misshiki
    misshiki 2025/01/06
    “翻訳というものがかつて生身の専門家や勉強家たちの手によって一定の質を保たれていたことも思い出されなくなり、やがて知る由もなくなる。...人間とは、慣れてゆく生き物である”
  • 半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる?(CloseBox) | テクノエッジ TechnoEdge

    みなさん、AIサブスクしてますか? 個人的な話で恐縮ですが、筆者は毎月13万円ほど生成AI関連のサブスクリプションにお金を使っていることが、先日判明しました。 この12月に家の30年ローンを払い終わったのですが、それとほぼ同額です。 2024年の中頃に一度サブスク関係を試算したときの、ほぼ2倍になっているのです。 で、現在の状況を明らかにしておこうと思います。 米ドルの場合は1ドル152円換算。年払いの場合はそれを12等分しています。 Adobe CCが大したことないように見えてしまうのは錯視でしょうか。 深刻なのが、動画生成関連のサービスです。HeyGen、Runway、Luma、Soraと、Unlimitedプランを使おうとすると1~3万円の出費を余儀なくされます。個別にクレジットを追加購入するとさらに料金アップするのでこれでも節約になってるというのが、生成AIガチャの怖いところです。

    半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる?(CloseBox) | テクノエッジ TechnoEdge
    misshiki
    misshiki 2025/01/06
    “筆者は毎月13万円ほど生成AI関連のサブスクリプションにお金を使っている”
  • AIが生徒に囲碁を教えた結果、男女の実力差が解消。男女差は人間指導が原因?(生成AIクローズアップ) | テクノエッジ TechnoEdge

    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、AI教師が囲碁を生徒に指導すると学習効果はどうなるかを調査した研究論文「Can Artificial Intelligence Improve Gender Equality? Evidence from a Natural Experiment」に注目します。 この実験は2020年9月から2021年7月にかけて、中国の囲碁教室で実施されました。新型コロナウイルス対策により一部の教師が隔離されたことをきっかけに、36人の教師のうち16人がAI教師に置き換えられること

    AIが生徒に囲碁を教えた結果、男女の実力差が解消。男女差は人間指導が原因?(生成AIクローズアップ) | テクノエッジ TechnoEdge
    misshiki
    misshiki 2025/01/06
    “実験結果、AI指導を受けた生徒グループの勝率は、5ヶ月後には50%から56%に上昇し、着手の質も大幅に向上しました。”
  • 「プログラミング言語」は今後不要になるのか ソフトウェア開発者の業務、半分はAIで自動化可能に

    この記事は、『生成AIで世界はこう変わる』(今井翔太著、SBクリエイティブ)に掲載された内容に、編集を加えて転載したものです(無断転載禁止)。 ソフトウェア開発における生成AIは、私自身が積極的に利用していることもあり、定量的な研究成果に加え、当事者の生の声もお伝えしたいと思います。この部分に関しては主観的な記述も多くなりますが、その点はご留意ください。 「ChatGPT以前のソフトウェア開発は石器時代だった」とは、ある開発者の言葉です。言語生成AIが持つプログラミングコードの生成能力は驚異的なものです。ChatGPT登場当日、私が最も驚き、「これは当にすごい」と確信したきっかけは、このプログラミングコードの生成能力を目の当たりにしたことでした。

    「プログラミング言語」は今後不要になるのか ソフトウェア開発者の業務、半分はAIで自動化可能に
    misshiki
    misshiki 2025/01/06
    “実際にどれくらい生産性が上がったのか、定量的に表すのは難しいのですが、どれだけ低く見積もっても2倍以上、5倍、10倍という数字でも納得できるレベルです。”
  • AI技術を活用して除雪を行うロボット除雪機が大雪前に何とか間に合った...→毎日の雪かきが重労働となっている地域での生活が一変するのではと称賛の嵐

    yuta suito @yutasuito NPUで動くロボット除雪機が大雪前に間に合いました☃️パイロン置いてスイッチ入れると自動で雪を端に寄せます。毎日の除雪時間が1/3に💨💨💨 #raspberrypi pic.x.com/WR3WZ3cKye 2024-12-27 11:24:09

    AI技術を活用して除雪を行うロボット除雪機が大雪前に何とか間に合った...→毎日の雪かきが重労働となっている地域での生活が一変するのではと称賛の嵐
    misshiki
    misshiki 2025/01/06
    “NPUで動くロボット除雪機”
  • 製造業DXプロセス別解説まとめ(後編)

    MONOistやEE Times Japanに掲載した主要な記事を、読みやすいPDF形式の電子ブックレットに再編集した「エンジニア電子ブックレット」。製造業のバリューチェーンを10のプロセスに分け、DXを進める上で起こりがちな課題と解決へのアプローチを紹介する連載「製造業DXプロセス別解説」全12回の後半に当たる第7回~第12回をまとめた。

    製造業DXプロセス別解説まとめ(後編)
    misshiki
    misshiki 2025/01/06
    “DXを進める上で起こりがちな課題と解決へのアプローチを紹介する連載「製造業DXプロセス別解説」全12回の後半に当たる第7回~第12回をまとめ”
  • AIの脅威ってどんなもの? 専門家が考える悪影響とその対策

    AIの脅威ってどんなもの? 専門家が考える悪影響とその対策2024.12.27 21:00 Sylvia Lu, The Conversation - Gizmodo US [原文] ( Kenji P. Miyajima ) ソーシャルメディア(SNS)のタイムラインを眺めていると、お気に入りの音楽アプリがプレイリストを提案してくれたりします。これだけみると、人工知能AI)が好みを学んで必要なものを提供してくれて、私たちの生活を向上させてくれる存在のように感じるかもしれません。しかし、その便利さの裏には「アルゴリズムによる弊害」という深刻な問題が潜んでいます。 その弊害は、目に見えるものでも、すぐに影響が表れるものでもありません。AIシステムが知らないうちにユーザーの生活に関する意思決定を行なうことで、時間をかけて徐々に悪影響が積み重なっていきます。このようなシステムの隠された力が、プ

    AIの脅威ってどんなもの? 専門家が考える悪影響とその対策
    misshiki
    misshiki 2025/01/06
    “アルゴリズムによる弊害を4つの法的領域に分類。「プライバシー」、「自律性」、「平等性」、「安全性」です。それぞれの領域は、繊細でありながら、往々にして抑制されないAIシステムの影響力に対して脆弱です。”
  • DeepL創業者「時が熟すのを待っていた」音声翻訳を開始 | 経済プレミアインタビュー | 山口敦雄 | 毎日新聞「経済プレミア」

    DeepLのヤロスワフ・クテロフスキー最高経営責任者=東京都港区で2024年11月25日、山口敦雄撮影 ドイツ人工知能AI)翻訳サービス会社のDeepLは11月から会話の音声翻訳サービスを開始した。サービス開始時点で日語、英語ドイツ語韓国語など13の言語に対応し、多言語のオンライン会議で利用できる。文章翻訳で定評のある同社にとり、音声翻訳サービスの開始は長年の念願がかなった形だ。同社の創業者のヤロスワフ・クテロフスキー最高経営責任者(CEO)に音声翻訳の可能性について聞いた。 文章より音声翻訳の方が難しい ――音声翻訳サービスの「DeepL Voice」を開始しました。 ◆多くの社員が開発にかかわり、膨大な作業量の結果、出来上がったサービスだ。とてもうれしく誇りに思う。特にうれしかったことは、実際に使い始めたユーザーからの反応だ。「Voice」が登場したことで、いろいろな会話に深

    DeepL創業者「時が熟すのを待っていた」音声翻訳を開始 | 経済プレミアインタビュー | 山口敦雄 | 毎日新聞「経済プレミア」
    misshiki
    misshiki 2025/01/06
    “音声翻訳サービスの「DeepL Voice」を開始しました。”
  • 学習障害をAIで支援する: 極東ブログ

    VOA(Voice of America)に「AI技術が障害を持つ学生の公平な学習環境を実現」(AI technology helps level playing field for students with disabilities)という記事があり、教育におけるAI技術の影響について興味深い内容だった。この記事では、障害を持つ学生がAI技術を活用して学びの壁を克服し、学びの場での公平性を実現している様子を描いていた。 を持つ学生への影響 記事ではいくつかの事例が紹介されているが、ディスレクシア(読字障害)を持つ14歳の女子学生の実体験が興味深いものだった。彼女は幼い頃から文字を正確に読むことが難しく、また書字においても、”rhinoceros(サイ)”は "rineanswsaurs"、”sarcastic(皮肉な)”は”srkastik"と書いてしまうらしい。そこで彼女は「自分は愚

    misshiki
    misshiki 2025/01/06
    “特別支援教育において、AIが学生を支援する過程で、学習者が本来自力で磨くべき能力を十分に伸ばせなくなるリスクがある。”
  • Metaがユーザーの反発を受けAIキャラクターアカウントを削除

    Metaが自社プラットフォーム上で独自に展開していたAIキャラクターのアカウントを削除したことが明らかになりました。 Meta's AI Profiles Are Indistinguishable From Terrible Spam That Took Over Facebook https://www.404media.co/metas-ai-profiles-are-indistinguishable-from-terrible-spam-that-took-over-facebook/ Meta shuts down its AI character accounts after user outcry https://www.nbcnews.com/tech/social-media/meta-ai-insta-shuts-character-instagram-fb-acco

    Metaがユーザーの反発を受けAIキャラクターアカウントを削除
    misshiki
    misshiki 2025/01/06
    “バグにより一部のAIキャラクターアカウントがブロックできなくなっていたため、アカウントを削除したと説明しています。”
  • 生成AIめぐり規制と技術革新の両立目指す新法案提出へ 政府 | NHK

    偽情報の拡散など生成AIをめぐるリスクが指摘される中、政府は新たな法案を通常国会に提出する方針です。悪質な事案に対し国が調査を行うなどとする一方、適正な研究開発を図ることも盛り込んでいて、規制と技術革新の両立を目指したい考えです。 生成AIをめぐっては、生産性の向上などのメリットの一方、巧妙な偽情報の拡散といったさまざまなリスクも指摘されています。 こうした中、政府は今月召集される通常国会に、新たな法案を提出する方針です。 法案の骨子案では、AI技術を用いた悪質な事案が発生した場合、国が調査し、結果に基づいて事業者への指導や助言、それに国民への情報提供を行うとしています。 一方で、AIの適正で透明な研究開発や活用を図ることも盛り込んでいます。 内閣府によりますと、AIの規制をめぐっては、アメリカが事業者の自主的な取り組みを重視しているのに対しEUは、極めてリスクの高いAIの利用を法律で禁止

    生成AIめぐり規制と技術革新の両立目指す新法案提出へ 政府 | NHK
    misshiki
    misshiki 2025/01/06
    “政府は新たな法案を通常国会に提出する方針です。悪質な事案に対し国が調査を行うなどとする一方、適正な研究開発を図ることも盛り込んでいて、規制と技術革新の両立を目指したい考えです。”
  • 「AI翻訳で仕事が減った」という話題がバズってるけど、むしろAI翻訳のおかげで景気が良くなった?→「正しい翻訳」ができる翻訳家は人手不足らしい

    リンク note(ノート) もうすぐ消滅するという人間の翻訳について|平野暁人 ひとつの翻訳が、終わった。 1の翻訳原稿を仕上げた、わけではない。 この世界に存在していた翻訳のひとつが いま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は0件。 2025年の収入見込みも畢竟、0円ということになる。 あくまでもひとつの翻訳の話である。 つまりは翻訳のひとつの話である。 関係ないと思うならこの先を読まなくてもいい。 自分の知る現実と違うならこの先を信じなくてもいい。 人間の数だけ人間があり 現実の数だけ現実がある。 そのような場所を あるいはそのとらえ難さをこそ 人 932 users 740

    「AI翻訳で仕事が減った」という話題がバズってるけど、むしろAI翻訳のおかげで景気が良くなった?→「正しい翻訳」ができる翻訳家は人手不足らしい
    misshiki
    misshiki 2025/01/06
    “結局のところ「弱いやつから死ぬ」なのかも”
  • AI翻訳の影響で仕事が激減した翻訳者さんによるnoteが切ない「人間の側が翻訳に対する要求水準を下げ始めた」

    リンク note(ノート) もうすぐ消滅するという人間の翻訳について|平野暁人 ひとつの翻訳が、終わった。 1の翻訳原稿を仕上げた、わけではない。 この世界に存在していた翻訳のひとつが いま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は0件。 2025年の収入見込みも畢竟、0円ということになる。 あくまでもひとつの翻訳の話である。 つまりは翻訳のひとつの話である。 関係ないと思うならこの先を読まなくてもいい。 自分の知る現実と違うならこの先を信じなくてもいい。 人間の数だけ人間があり 現実の数だけ現実がある。 そのような場所を あるいはそのとらえ難さをこそ 人 932 users 740 箱入りさん @voxjoe @aki_traducteur 歯がゆく、辛く、言葉も無くしてしまう出来事に涙を禁じ得ません。 何とお声掛けすればと考えてしまいますし、何をもって励ませ

    AI翻訳の影響で仕事が激減した翻訳者さんによるnoteが切ない「人間の側が翻訳に対する要求水準を下げ始めた」
    misshiki
    misshiki 2025/01/06
    “ほかでもなく、人間の側が翻訳に対する要求水準を下げ始めたからである。”
  • perplexityのスペース機能がソフトウェアの調べものに便利 - mrwk update

    TL;DR perplexity のスペースは情報源をURLとファイルで登録できる →質問するとそこを優先的に検索 →githubや公式サイト、ドキュメントを登録する →ソフトウェアの調べものがはかどる! 注意点: 日語で質問すると日語で検索しようとして失敗する。プロンプトで「(質問文) 英語で検索して日語でまとめて」って書くとよい perplexityのスペース perplexity、検索まとめと、翻訳があやしいニュースサイトとしてそこそこ便利に使っています。 ちょっと前から「スペース」という機能ができていたのですが、使ってみたところ予想以上にいい感じでした。 スペースはここ スペース機能は複数人で共有されるスペースを作って、特定のトピックについてperplexityとのchat履歴をまとめる機能です。ここで、ソースとして情報源のファイルやリンクを登録することができます。 ソース

    perplexityのスペース機能がソフトウェアの調べものに便利 - mrwk update
    misshiki
    misshiki 2025/01/06
    “スペース機能は複数人で共有されるスペースを作って、特定のトピックについてperplexityとのchat履歴をまとめる機能です。ここで、ソースとして情報源のファイルやリンクを登録することができます。”
  • フリーランスが使っている生成AIサービス 3位「Gemini」、2位「Perplexity」、1位は?

    仕事での生成AI活用度について「業務内で有効活用しており、日常的に使用」「部分的に取り入れて時々使っている」と回答した人は14.3%にとどまった。 「使ったことがない」と回答した人は73.5%に上り、フリーランスへの生成AIの浸透度が低いことが分かった。

    フリーランスが使っている生成AIサービス 3位「Gemini」、2位「Perplexity」、1位は?
    misshiki
    misshiki 2025/01/06
    “フリーランスが利用している「生成AIサービス」TOP10は? 活用している業務領域について、最も多いのは「文章作成や校閲」で63.2%。「資料作成」(26.3%)、「カスタマーサポートやメール対応」(15.8%)と続いた。”
  • 群雄割拠の生成AI みんなが今、実際に使っているツールは何?

    SHIFT AIは2024年12月25日、「2024年AI人工知能)トレンドランキング」を発表した。同社が運営するAIのビジネス活用を学べるメディアコミュニティー「SHIFT AI」の会員を対象に実施した調査の結果をまとめたもので、827人から有効回答を得た。それによると2024年話題になったと思う生成AIツールと実際に今使っている生成AIツールのトップはどちらも「ChatGPT」だった。 テキスト系はChatGPTの人気が圧倒的、では画像や動画は? 関連記事 生成AIの採用率が高い組織ほどオープンソースへの依存度が高い? Linux Foundationが調査レポートを発表 Linux Foundation Japanは、調査レポート「生成AIの未来を形作る オープンソースイノベーションの影響」を発表した。84%の組織が生成AIを中~高程度導入しており、その41%がオープンソースを利用

    群雄割拠の生成AI みんなが今、実際に使っているツールは何?
    misshiki
    misshiki 2025/01/06
    “2024年話題になったと思う生成AIツールと実際に今使っている生成AIツールのトップはどちらも「ChatGPT」だった。”
  • 日立、AI活用のバッテリー充放電制御や空調計画最適化ソリューションを提供開始

    日立製作所と日立産業制御ソリューションズは、エネルギーマネジメントサービス「EMilia」に、AIを用いた工場、オフィスビル向けのバッテリー充放電制御および空調計画最適化ソリューションを追加した。 日立製作所(日立)と日立産業制御ソリューションズは2024年12月17日、日立のエネルギー、設備マネジメントサービス「EMilia(エミリア)」に、工場やオフィスビル向けのバッテリー充放電制御と空調計画最適化機能を追加した。AI人工知能)を用いたソリューションとなる。 バッテリー充放電制御ソリューションは、工場やオフィスビルでEV(電気自動車)充電器や定置型蓄電池を運用する際に活用できる。EVの走行計画や電力需要予測などのデータを用いて、目標とする電力使用量を超えない最適な充放電計画をAIにより自動で立案して制御する。EVや蓄電池に貯めた電力を計画的に利用することも可能で、非常時の企業の防災や

    日立、AI活用のバッテリー充放電制御や空調計画最適化ソリューションを提供開始
    misshiki
    misshiki 2025/01/06
    “工場やオフィスビルの電力使用量やコストを低減する運転計画を、AIが室外機1台ごとに自動立案する。時間帯ごとの電力削減の優先度や電力の需要予測をベースに立案するため、空調性能も維持できる。”
  • 2024年出版関連動向回顧と年初予想の検証 | HON[.]jp News Blog

    Text to Image by Adobe Firefly Image 2 Model(厳かな神社の境内で大きな翼を持つ黒い龍と美しい白蛇が並んでいる) 《この記事は約 50 分で読めます(1分で600字計算)》 HON.jp News Blog 編集長の鷹野が、年初に公開した出版関連動向予想12024年出版関連の動向予想〈HON.jp News Blog(2024年1月10日)〉 https://hon.jp/news/1.0/0/46075を検証しつつ、2024年を振り返ります。 2024年概況 まず概況から。出版科学研究所「出版指標マンスリー・レポート」2024年12月号によると、2024年1~11月期の紙の書籍雑誌推定販売額は9172億円で、前年同期比5.7%減でした22024年11月期 紙書籍雑誌推定販売金額は前年同月比5.7%減 ~ 出版指標マンスリーレポートより〈HON.j

    2024年出版関連動向回顧と年初予想の検証 | HON[.]jp News Blog
    misshiki
    misshiki 2025/01/06
    動向をまとめてくれてありがたい。個人的には相変わらず本を買いまくっているのだけどなぁ。
  • 「.NET」の配信サイトに予期せぬ変更 ~一部のCI環境やインストーラーに影響が出る恐れ/CDN「edg.io」倒産の余波

    「.NET」の配信サイトに予期せぬ変更 ~一部のCI環境やインストーラーに影響が出る恐れ/CDN「edg.io」倒産の余波
    misshiki
    misshiki 2025/01/06
    “CDN(コンテンツ配信ネットワーク)の1つ、「edg.io」が倒産により近々運営を停止するのが原因。以下のドメインが影響を受ける。” 年末年始はCDN変更への対応作業してた。