misshikiのブックマーク / 2025年1月6日

2024年 Python / データ分析 / 生成 AI 関連の人気Qiita記事150選 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめにどうもこんにちは。kunishou です。2024 年も残すところ明日のみになりました。皆さん年の瀬をいかがお過ごしでしょうか？今年も毎年恒例ですが、年末の暇な時間を使って Python / データ分析 / 生成 AI 関連の人気 Qiita 記事 150 選を作成し記事にしました！年末年始の空いている時間に、本記事で 2024 年の Python / データ分析 / 生成 AI 関連のトレンドを振り返っていただけたら幸いです。過去の記事はこちらモチベーション Qiita公式からも毎年1月にQiitaの人気記事のランキ

misshiki 2025/01/06

ChatGPTによるものみたいですが傾向分析が最後の方にあり、2023年から2024年の傾向変化が分かります。移り変わりが早すぎてビックりしますが、2024年はGPTやAOAIなどはランクを下げたようです。生成AIが強かったと。

リンク

財務省の不適切なデータ解析について｜破綻国家研究所

本投稿は、財務省主計局が公表した資料において、統計的な不備が存在するにもかかわらず結論を導いていると考えられる点を、事実ベースで指摘・説明するものです。あくまでも事実に基づいた指摘を行っているものであり、陰謀論を助長する趣旨ではありません。根拠のない憶測や陰謀論には強く反対いたします。 1. はじめに昨今、103万円の壁引き上げで財務省に対して「積極財政をすべきだ」「緊縮財政をすべきだ」などの議論が盛んに行われています。今回の問題の本質はそこではありません。財務省主計局がIMFの一次データを用いて相関関係を分析する際に、適切な統計処理を行わないまま結論を導いています。積極財政・緊縮財政を語る以前の不適切な統計処理の問題です。では、なぜその不適切な統計処理が問題になるのでしょうか。それは、誤った処理によって可視化されたデータやグラフを使って議論しても、妥当な結論を得ることが

misshiki 2025/01/06

“財務省主計局がIMFの一次データを用いて相関関係を分析する際に、適切な統計処理を行わないまま結論を導いています。積極財政・緊縮財政を語る以前の不適切な統計処理の問題です。”

リンク

ビットコイン市場分析入門 | NOMURA

目次 I.ビットコイン市場の基本構造 II.ビットコイン市場の歴史 III.暗号資産価格の変動特性 IV.ビットコインのポートフォリオ分散効果 V.X (Twitter)データを用いたビットコイン市場参加者の解析要約と結論米国トランプ前大統領の当選を契機に、ビットコイン価格は最高値を更新した。このような状況の中、ビットコインに対する関心が高まっている。本稿では、ビットコイン市場を理解するために必要な基本的事項を整理し、これまでのビットコイン市場の価格動向を概観する。また、ビットコインの価格変動の特性と市場参加者の特性に関する分析も紹介する。第I章では、ビットコインの基本構造を解説し、非中央集権型ネットワークの利点やブロックチェーン技術の透明性と信頼性について詳述する。特に、ビットコインの新規供給量を制御する半減期のメカニズムが、暗号資産としての価値維持にどのように寄与しているかを解説

misshiki 2025/01/06

論文“I.ビットコイン市場の基本構造 II.ビットコイン市場の歴史 III.暗号資産価格の変動特性 IV.ビットコインのポートフォリオ分散効果 V.X (Twitter)データを用いたビットコイン市場参加者の解析 ”

投資

リンク

DuckDB から直接 PostgreSQL アクセスする

前提 DuckDB が使える環境 Docker Compose が使える環境まとめ DuckDB から直接 PostgreSQL にアクセスできる PostgreSQL の読み込みも書き込みもできるバッチ処理を PostgreSQL のリードレプリカからデータを読み込んで、DuckDB で集計して PostgreSQL に書き込むと言うのができる DuckDB とはこちらをどうぞ。 DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck PostgreSQL Extension 名前で誤解しやすいのですが DuckDB の PostgreSQL Extension であって、PostgreSQL の Extension ではないので注意してください。 DuckDB のPostgreSQL Extension は PostgreSQL のデータを直接操作で

misshiki 2025/01/06

“DuckDB から直接 PostgreSQL にアクセスできる...PostgreSQL に接続するためには、Secret Manager を利用します。”

リンク

Gemini2.0とStreamlitでお手軽なグラウンディング搭載の生成アプリ作成｜masa_kazama

この記事では、プロタイプ作成が簡単にできるPythonのStreamlitを用いて、Google検索を組み込んだ生成AIアプリの作り方を紹介します。Gemini2.0のAPIが最近すごく便利になってきていて、Google検索を組み込むようなシステムも簡単に作ることができます。Gemini APIを使って、生成AIのアプリを作ってみたいと思っている方に、参考になれば幸いです。(※今回使ったコードはGithubで公開しています。) 本記事は、「Ubie生成AIアドベントカレンダー」の記事です。 Gemini APIGeminiのAPIを使う方法は、2種類あります。 Google AI StudioのAPI経由 Vertex AIのAPI経由 Google AI StudioのAPIは無料枠もあり、個人のアプリ開発やプロトタイプ作成に適しています。一方で、Vertex AIのAPIは、企業がシス

misshiki 2025/01/06

“プロタイプ作成が簡単にできるPythonのStreamlitを用いて、Google検索を組み込んだ生成AIアプリの作り方を紹介”

リンク

機械学習と数理最適化の融合｜moai-lab公式

機械学習と数理最適化の融合パターン機械学習（ML）と数理最適化（MO）は、それぞれが強力な問題解決ツールですが、近年、互いの強みを活かす形で融合が進んでいます。この融合は、問題解決の新たな可能性を切り開くと期待されています。ここでは、MLとMOの融合を7つのパターンに分類し、それぞれの特徴を解説します。 1. ML -> MO (ML-first MO-second: ML先 MO後) このパターンでは、まず機械学習を用いてデータから予測や知見を獲得し、その結果を基に数理最適化問題を解きます。例: 機械学習で需要予測を行い、その予測結果に基づいて生産計画の最適化問題を解く。特徴: 機械学習が現実世界の複雑なパターンを捉え、最適化がその情報を用いて具体的な行動を決定します。 2. MO -> ML (MO-first ML-second: MO先 ML後) ここでは、まず数理最適化を用い

misshiki 2025/01/06

“機械学習（ML）と数理最適化（MO）は、それぞれが強力な問題解決ツールですが、近年、互いの強みを活かす形で融合が進んでいます。...MLとMOの融合を7つのパターンに分類し、それぞれの特徴を解説します。”

リンク

書籍「ディープラーニングの数学」10章のDLモデルをGPUで動かす - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに書籍「ディープラーニングの数学」の著者です。 Amazonリンクこの書籍は、ディープラーニングを含めた機械学習のアルゴリズムを数学的に定式化し、Pythonのプログラムをスクラッチで組み立てて(使っているライブラリはほぼNumPyとMayplotlibだけです)、実習コードで動作を確認する立て付けの本です。 10章の実習プログラムはディープラーニングのプログラムになっているのですが、他の章の実習コードと比べて恐ろしく処理に時間がかかります(1つの繰り返し処理で30分から1時間)。ここをなんとかできないかと前から思っていて、先

misshiki 2025/01/06

“今までNumPyでやっていた繰り返し計算をすべてPytorchのTensor型データを対象とし、torch.xxの関数だけを使って行うという話”

リンク

ダニロヴァルガスヴァスコンセロス (Danilo Vasconcellos Vargas) - k* Distribution: Evaluating the Latent Space of Deep Neural Networks using Local Neighborhood Analysis. - 論文 - researchmap

Shashank Kotyan, Tatsuya Ueda, Danilo Vasconcellos Vargas 記述言語英語掲載種別研究論文（学術雑誌） DOI 10.1109/TNNLS.2024.3446509 Most examinations of neural networks' learned latent spaces typically employ dimensionality reduction techniques such as t-distributed stochastic neighbor embedding (t-SNE) or uniform manifold approximation and projection (UMAP). These methods distort the local neighborhood in the visua

misshiki 2025/01/06

“k* 分布: 局所近傍分析を使用したディープニューラルネットワークの潜在空間の評価。”

ディープラーニング

リンク

AIのブラックボックス解決へ計算過程を可視化　九州大 - 日本経済新聞

九州大学の研究チームは人工知能（AI）の計算過程を可視化する新しい手法を開発した。AIが何をもとに結論を出したのかが不明な「ブラックボックス問題」の解決に役立つ。医療分野でAIを使う画像診断ツールの精度向上などに使える可能性がある。ヒトの脳の仕組みをまねてデータ処理を学習する「ニューラルネットワーク」というAIの技術について、AIがデータを整理する過程を可視化する「t-SNE」や「UMAP」と

misshiki 2025/01/06

“研究チームはニューラルネットワークがデータを整理する過程を可視化する「k*分布」という手法を新たに開発した。”

リンク

ソニーグループポータル | ソニーのKaggle Master座談会〜ソニーのエンジニアとしてAIの最前線に挑み続ける

Kaggle参加当時は、ソニーセミコンダクタソリューションズ株式会社イメージング&センシングエッジコア技術部門に所属。現在はソニー株式会社システム・ソフトウェア技術センターに所属し、デジタル一眼カメラα™向けのAI 技術および応用技術の開発に従事。スキルアップを模索するなかで、Kaggleと出会った ── まずKaggleに参加した経緯を、当時の仕事の状況を含めて教えてください。宮谷：私は2018年にKaggleに参加しました。当時はデジタル一眼カメラα™（アルファ）のエンジニアで、「世界に先駆け、Deep Learningをカメラに導入しよう」と着想し、カメラ画質改善やオートフォーカス向けの新規アルゴリズムの開発などを手がけていました。ただその頃はDeep Learningの実社会への応用事例が報告され始め、新手法も日々発表されていたAIの発展期。現在のように学習コンテンツが充実して

misshiki 2025/01/06

“ 宮谷：私もKaggleで色々なコンペに参加し、経験値を上げたことに”

Kaggle

リンク

BIツール研究所の代表が謎のBIツールThoughtSpotを導入した話｜ウィル/Sho Maekawa

こんにちは。BIツール研究所のウィルです。データエンジニアリング関連でいつも勉強させてもらっている方々が参加している「datatech-jp Advent Calendar 2024」に投稿しております。とても面白い記事が多いのでぜひ他の投稿もチェックしてみてください。私は今、コミューンというオンラインコミュニティプラットフォームなどを提供しているSaaS企業に勤めております。これまでスタートアップでよくあるredashとLooker StudioをBIツールとして利用していたのですが、この度ThoughtSpotというBIツールを導入しました。 BIツールオタクである私が、なぜ日本であまり有名ではないThoughtSpotを導入したのかをお話しします。ざっくりとしたデータチームの状況・社員数150人くらいのスタートアップ・立ち上げ1年ほどのデータ組織・データパイプラインの基礎

misshiki 2025/01/06

“ThoughtSpotというBIツール...USを中心としたグローバルでは有名な製品です。ガートナーのMagic Quadrant でもTableauやLookerなどと同じLeadersに位置する製品です。”

リンク

https://x.com/A7_data/status/1875459905466794421

misshiki 2025/01/06

“落合陽一さんの論文の読み方を参考にしたこのプロンプトをGoogle AI Studioに入れてGemini Experimental 1206と読む方がいい”

人工知能

リンク

VSCode で LLM と論文執筆

この記事は CyberAgent AI Lab Advent Calendar 2024 19 日目の記事です。はじめに非ネイティブにとって英語論文執筆はハードルが高いものですが、最近では LLM の発展によりハードルがだいぶ下がりつつあるのではないでしょうか。 LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトを VSCode 上で編集する方法を紹介したいと思います。VSCode 上で編集することで、GitHub Copilot (+そのほかの強力な拡張機能) を使用することができます。また、ローカルにプロジェクトをシンクさせることで Git 管理することも可能となリます。個人的には LLM による不本意な編集が気になるため、Git 化することで VSCode 上で差分の確認や復元が容易になるのはメリットだと感じて

misshiki 2025/01/06

“LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトを VSCode 上で編集する方法を紹介”

人工知能

リンク

Building AI Products—Part I: Back-end Architecture

In 2023, we launched an AI-powered Chief of Staff for engineering leaders—an assistant that unified information across team tools and tracked critical project developments. Within a year, we attracted 10,000 users, outperforming even deep-pocketed incumbents such as Salesforce and Slack AI. Here is an early demo: By May 2024, we realized something interesting: while our AI assistant was gaining tr

misshiki 2025/01/06

“アシスタントを動かすAIエージェントの構築方法推論パイプラインの構築と運用方法すべてを機能させたAI特有のツールとテクニック”

人工知能

リンク

将棋AIの強化学習の基礎が根底から変わりそうな件 | やねうら王公式サイト

将棋 AIでは、教師(教師局面)を生成して、そこから評価関数パラメーターの学習を行っている。AlphaZeroなんかもそうしている。教師は、実際に対局して生成する。ところが、この対局は、1手指すごとに何千とか何万とかの局面を探索しないといけない。Deep Learning(以下DLと略す)系の将棋 AIの場合、何千とか何万の局面を探索すということは、その回数だけ推論を行うということである。普通、学習は、順伝播逆伝播で、順伝播のコストをCとすると、逆伝播は2Cぐらい、つまり合計で3Cぐらいの計算コストを要するのだが、推論(これは順伝播)はCだから、要するに学習は3倍のコストを要する。ところが、教師生成時に1手指すのに仮に1万局面探索するとしたら、10000Cかかるわけで、これは学習コスト(3C)の3333倍である。というように、教師生成のコストは学習時のコストとは比較にならないほどのコスト

misshiki 2025/01/06

“強化学習での教師生成のために(探索を行って)質の高い教師を生成する必要はなく、既存の(質の低い)教師データで桁違いに大きなモデルに学習させて、そいつを蒸留するほうが低い計算コストで済む可能性がある。”

リンク

エムスリーのAI・機械学習チームって何やってるの？2024年1年間で作ってきた28個のプロダクトを大公開 - エムスリーテックブログ

こんにちは。エンジニアリンググループゼネラルマネジャー & 機械学習エンジニアの大垣です。さて、私が機械学習エンジニアとして仕事をしているAI・機械学習チームでは、今年一年で28個のプロダクトをリリースしました。月に2つくらいは新規プロダクトが出てる計算ですね。なかなか高速にリリースできているのではないでしょうか。なお、この1年で5名のメンバーが新規に加わり、チームが12人から17人になったので、来年は更に加速していきたいです！*1 これらのプロダクトを簡単にお見せしつつ、エムスリーという医療xWebの企業でMLのチームはどういう仕事をしているのか、というのをお届けできればと思います！多いっちゃ多いので、新メンバーはカルタでプロダクトを覚えています。このカルタ自体もLazzaroniというプロダクトです年間15個以上のプロダクトをリリースするAIチームを入社したてのフレッシュな目線

misshiki 2025/01/06

“これらのプロダクトを簡単にお見せしつつ、エムスリーという医療xWebの企業でMLのチームはどういう仕事をしているのか、というのをお届け”

人工知能

リンク

コーディングAI課金するならCodyが断トツ良い話

概要開発者向けの AI ツールは数多くありますが、その中で「Cody」は無名ながらも知る人ぞ知る優れたプロダクトです。私が普段いるAI 技術者コミュニティでは密かに絶大な支持を集めていますが、SNSなどでの一般的な知名度はほとんどないため、ここで紹介します。 Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。私はすでに半年課金愛用していて、おそらく来年も愛用するでしょう。 Cody とはなんぞや Cody くんは、VSCode や、JetBrains IDEs、Neovim、Eclipseなどのコードエディタの拡張機能として使えるコーディング補助 AI ツールです。他の生成 AI コードツールと同様に、AI コード補完とAIチャットがあります。なぜ Cody がおススメなのか C

misshiki 2025/01/06

“Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。”

リンク

Microsoft、「Visual Studio Code」バージョン1.96公開　テキスト入力を上書きに切り替えられるオーバータイプモード追加　ターミナルで合字に対応

Microsoftは2024年12月12日（米国時間）、WindowsやLinux、macOSに対応するクロスプラットフォームのエディタ「Visual Studio Code」（以下、VS Code）の最新版「November 2024」（バージョン1.96）を公開した。 VS Codeバージョン1.96では、テキスト入力を上書きモードに切り替えられるオーバータイプモードや、ターミナルの合字対応、拡張機能のインストール制限など、開発効率やセキュリティを向上させる機能が追加されている。 VS Codeバージョン1.96の主な変更点関連記事「Visual Studio Code」バージョン1.95公開　Copilot Chatがより使いやすくなる機能追加など Microsoftは「Visual Studio Code」のバージョン1.95を公開した。Copilot Editsや複数のGit

misshiki 2025/01/06

“2024年12月12日（米国時間）、WindowsやLinux、macOSに対応するクロスプラットフォームのエディタ「Visual Studio Code」（以下、VS Code）の最新版「November 2024」（バージョン1.96）を公開”

プログラミング

リンク

フロントエンドでPythonを活用！PyScriptの魅力と使い方

はじめに皆さん、はじめまして。Thinkings株式会社でプロダクトエンジニアとして働いている、まろんです！突然ですが、皆さんは「Python」をご存じでしょうか？「空飛ぶモンティ・パイソン」というコメディ番組が由来で、今や非常に人気のあるプログラミング言語です。 Pythonはそのシンプルな文法と豊富なライブラリによって、データ分析や機械学習、バックエンド開発など、幅広い分野で活躍しています。技術系情報共有サイト（Qiitaなど）でも、常に人気上位に入る言語です。しかし、Webアプリケーションを開発するとき、バックエンドはPython、フロントエンドはReactなどの別言語で開発することが一般的ですよね。言語が分かれることで、初心者は「なぜフロントとバックエンドで異なる言語を覚えなきゃならないの？」と苦労することもあるでしょう。そんな方にご紹介したいのが、2022年4月にAna

misshiki 2025/01/06

“PyScriptの魅力と使い方”

Python

リンク

2024年のスマホを総括　生成AIの浸透／カメラは完成形の域に／メーカーの勢力図に変化も

2024年のスマホを総括　生成AIの浸透／カメラは完成形の域に／メーカーの勢力図に変化も：石野純也のMobile Eye（1/3 ページ）「Galaxy AI」「Apple Intelligence」「Gemini」……2024年は、スマホが生成AIを取り込み、その基本性能を大きく伸ばした1年だったと総括できる。一方で、スマホに搭載される機能の中で最も重要視されているカメラも、本家といえるデジタルカメラに迫る性能を持った端末が多数投入された。カメラの処理にもAIがフル活用されてきたが、その集大成的な1台が目を引いた1年だった。メーカー別という切り口で見ると、“新顔”が大きく伸びた傾向も見て取れる。Xiaomiとモトローラは、その代表格といえる。規模感ではこれら2メーカーには及ばないものの、新規参入のメーカーとしてNothing Phoneのミッドレンジモデルである「Nothing Ph

misshiki 2025/01/06

“2024年は、スマホが生成AIを取り込み、その基本性能を大きく伸ばした1年だったと総括できる。”

人工知能

リンク

AWSのAIモデル Amazon Nova Lite で遊んでみる - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

misshiki 2025/01/06

“個人利用でも安く使えそうな生成AIモデルのAmazon Nova Lite と Nova Micro が登場したので遊んでみた。”

リンク

AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】

2024年9月に登場した「Raspberry Pi AI Camera」は、カメラセンサー内にAI処理用のプロセッサを内蔵しており、カメラそのものにAIモデルを読み込ませてAIカメラとして使うことができます。ドキュメントも充実しており、比較的簡単にAIモデルを自作できそうだったので、実際に「USBケーブルの種類を見分けるAIモデル」をトレーニングして実行してみました。 Raspberry Pi AI Camera – Raspberry Pi https://www.raspberrypi.com/products/ai-camera/ Raspberry Pi -Ultralytics YOLO ドキュメント https://docs.ultralytics.com/ja/guides/raspberry-pi/ SONY IMX500 - Ultralytics YOLO Docs h

misshiki 2025/01/06

“ドキュメントも充実しており、比較的簡単にAIモデルを自作できそうだったので、実際に「USBケーブルの種類を見分けるAIモデル」をトレーニングして実行してみました。”

リンク

AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK

「Raspberry Pi AI Camera」はソニーのインテリジェントビジョンセンサー「IMX500」を搭載したRaspberry Pi向けカメラモジュールです。IMX500はイメージセンサーとAIアクセラレーターを積層した構造で、母艦デバイスに負荷をかけることなくAI処理をカメラ側で実行可能。そんなRaspberry Pi AI CameraがGIGAZINE編集部に届いたので、実際にRaspberry Pi 5と接続して物体検知AIを実行してみました。 Raspberry Pi AI Camera – Raspberry Pi https://www.raspberrypi.com/products/ai-camera/ ◆開封＆外観チェックこれがRaspberry Pi AI Cameraのパッケージです。箱の中には各種パーツが袋に入った状態で詰め込まれていました。内容物は

misshiki 2025/01/06

“「Raspberry Pi AI Camera」はソニーのインテリジェントビジョンセンサー「IMX500」を搭載したRaspberry Pi向けカメラモジュールです。”

リンク

AIのトレーニングで使用されるチップ「H100」「H200」「MI300X」の性能を比較した結果判明した事実とは？

AIの学習や推論に用いるAIインフラストラクチャーの市場では、「H100」「H200」といったNVIDIA製のAI特化チップが大きなシェアを獲得しています。一方で、NVIDIAのライバル企業となるAMDも2023年12月に「Instinct MI300X」を発表しています。そんなH100・H200・MI300Xについて、テクノロジー系メディアのSemianalysisがさまざまなベンチマークテストを実施し、それぞれの結果について報告しています。 MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive – SemiAnalysis https://semianalysis.com/2024/12/22/mi300x-vs-h100-vs-h200-benchmark-part-1-training/

misshiki 2025/01/06

“AMDも2023年12月に「Instinct MI300X」を発表”

人工知能

リンク

ChatGPTライクなUIのローカルLLMを構築できるGPT4Allとは？

GPT4AllでChatGPTライクなユーザーインタフェースで使える大規模言語モデルを構築する ChatGPTやMicrosoft Copilotなどの生成AIサービスは「情報漏えいなどが心配」と感じているのならば、手元のWindows 10／11上でLLM（大規模言語モデル）を構築すればよい。ChatGPTライクなユーザーインタフェースを持つ「GPT4All」を使えば、簡単にローカルLLMの構築が可能だ。 ChatGPTやMicrosoft Copilot、PerplexityなどのLLM（大規模言語モデル）／生成AIサービスを利用すると、これまで面倒だった作業が簡単にできることがある。ただ、こうした生成AIサービスは、入力データがインターネット上のどこかのサイトにアップロードされることは避けられず、どうしても情報漏えいなどのセキュリティ面で不安がある。そんな心配がある場合、手元のWi

misshiki 2025/01/06

“ChatGPTライクなユーザーインタフェースを持つ「GPT4All」を使えば、簡単にLLMが利用可能だ。その使い方を紹介”

リンク

Devin.aiを試す - 西尾泰和の外部脳

Devin.aiを試す長くなってきたので切り出した Devin.aiを試す2024 2025-01-02 Session Usage Limitについて Devin went to sleep due to session usage limits. Limitをだいぶ超えてから止まるようだw 追記説明を読むとセッション単位のように読めますが、最後のユーザーの発言以降で使用できる ACUs の上限 (by teramoto) あ、そうなんだ、どうりで超えてるものもあるなぁと思った Devin観察日記 3日目｜Daiki Teramoto nishio 「さて、いよいよ金銭感覚が麻痺して参りました。一歩先の未来を生きるためのコストとして受け入れつつも、たまに冷静になる瞬間が恐ろしいです。」あーあー聞こえないーー(1ヶ月のトークンを1週間で使い切っておかわりした人) nishio 冗談は

misshiki 2025/01/06

リンク

Devin

How Nubank refactors millions of lines of code to improve engineering efficiency with Devin Overview One of Nubank’s most critical, company-wide projects for 2023-2024 was a migration of their core ETL — an 8 year old, multi-million lines of code monolith — to sub-modules. To handle such a large refactor, their only option was a multi-year effort that distributed repetitive refactoring work across

misshiki 2025/01/06

リンク

Devin観察日記 0日目｜Daiki Teramoto

買うことにしました、Devin。月額500ドル。 https://devin.ai/ 今まで気になってはいたものの、高いし、買うつもりはありませんでした。しかし今日、@nishioさんのご好意で試してみる機会を頂き、十分感動したので、やっぱり買ってみることにしました。というわけで、今日からブログを始めます。名付けて「Devin観察日記」。アフィリエイトも無いので、ゆるくやっていきます。「このリポジトリを開発対象に加えたい」最初に驚いたのは、Devinへの仕事の頼み方です。GUIでポチポチするのかと思いきや、「このリポジトリを開発対象に加えたい」とメンションするだけ。「このリポジトリを開発対象に加えたい」とDevinに指示する西尾さんたったこれだけの指示で、git cloneしてREADMEを読んで、npm installなんかまでやってくれます。リモートで向こうに人がいるような感

misshiki 2025/01/06

“Devin。月額500ドル。”高い...。

リンク

【徹底解説】Browser Useの仕組みや安全性、設定方法までまるっと解説！｜ChatGPT研究所

はじめに今、Xなどで話題になっている「Browser Use」は、AIがローカル環境のブラウザを自動操作できるようにするPythonライブラリです。具体的には、Googleなどの検索サイトを開いて情報を収集したり、フォームへテキスト入力を行ったりといった「人の手作業」を代行してくれます。「ブラウザを勝手に操作するなんて危なくないか？」と思う方もいるかもしれません。実際、便利な反面、マルウェアのリスクや情報流出の可能性を理解しておくことは重要です。本記事では、Browser Useでできることや導入の流れ、セキュリティ面の注意点などをわかりやすく整理しました。 Browser Useの導入方法では、「ターミナル」や「コマンド」など聞き馴染みのない初心者の方にもわかりやすく解説していますので、初心者の方々も安心して読み進めてください。 Browser Useとはbrowser-use は

misshiki 2025/01/06

“browser-use は、AIにブラウザ操作の権限を与える仕組みです。検索やクリックといった行動を自動化できる利便性がある一方、「自分のブラウザを勝手に操作される」リスクもわずかながら存在します。”

リンク

browser-useによるブラウザ操作自動化のサンプル集

はじめに browser-use を使う上で詳しいドキュメントがなかったので、自分で使ってみたことをまとめてみました。 browser-use の基礎的なところは以下にまとめてあります。ブラウザを起動させず、ヘッドレスモードで実行したい BrowserConfigのheadlessをTrueにすることで、ブラウザを起動させず、ヘッドレスモードで実行することができます。 from browser_use.browser.browser import Browser, BrowserConfig browser = Browser( config=BrowserConfig( headless=True, ) ) async def main(): model = ChatOpenAI(model='gpt-4o') agent = Agent( task='東京の天気をGoogleで調べて

misshiki 2025/01/06

“ブラウザを起動させず、ヘッドレスモードで実行したい。カスタムアクションを作成したい。ユーザーに入力を求めたい。step のマックスを設定したい。CAPTCHA を解きたい出力をカスタマイズしたい。”などなど。

リンク

browser-useの基礎理解

はじめに最近話題になっている browser-use について自己理解のために基本的なところをまとめてみます。公式リポジトリはこちら browser-use とは？ browser-use は、Python で作られた「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。具体的には、下記のような機能を提供しています。ビジョン機能や HTML 抽出ブラウザで読み込んだページの DOM（要素構造）を解析、スクリーンショットやテキスト情報を取得できます。マルチタブ管理自動で複数タブを開き、それぞれのタブを並行して操作できます。カスタムアクション機能たとえば「特定のファイルを保存」「データベースへ登録」「社内チャットに通知する」など、ユーザー独自のアクションを定義できます。自己修正機能操作が失敗したり、要素を見つけられなかったりした場合に、自分で修正

misshiki 2025/01/06

“browser-use は、Python で作られた「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。”

リンク

browser-use やばいです - Qiita

はじめに語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。早速試してみます。実践複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

misshiki 2025/01/06

“browser-useは使いやすく、X-Pathを使ったクローリングよりもはるかに手軽ですが、その分トークンの消費量が多いです。正確に計算したわけではありませんが、通常...の4～5倍程度のコストがかかっているようです。”

リンク

RAG開発の超入門【RaggleのQuickStart | Pythonのソースコードあり】

はじめまして、ますみです！株式会社Galirage（ガリレージ）という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^ この記事では、入門者向けの「RAG」の開発手法を解説します！もしもPythonを使ったことがない方は、下記のZenn 本を参考にしてください。また、RAGについての基礎知識を学びたい方は、下記のZenn 本を参考にしてください。さらに、RaggleというRAGの精度を競うコンペを開催しているため、ご興味のある方は、こちらのコンペを通して、RAGのスキルアップにご活用ください！なんと1位の人には、賞金30万円も付与されます🏆 それでは、早速解説をしていきます！この記事の内容を習得すれば、Raggleに応募できる状態になるため、ぜひ皆さんもRaggleのコンペに挑戦していただけたら幸いです^^ 全体の流れ

misshiki 2025/01/06

“この記事の内容を習得すれば、Raggle（RAGの精度を競うコンペ）に応募できる状態になるため、ぜひ皆さんもRaggleのコンペに挑戦していただけたら”

リンク

RAGで使うベクトルDBと検索エンジン、WeaviateのCEOに「違い」を聞いた

生成AI（人工知能）に業務データを活用させる手法として有力視されているRAG（Retrieval-Augmented Generation、検索拡張生成）には、ベクトルデータベース（DB）やベクトル検索エンジンと呼ばれる技術を使用する。今回、ベクトルDBの「Weaviate」を開発するオランダWeaviate（ウィービエイト）の創業者でCEO（最高経営責任者）のBob Van Luijt（ボブ・ヴァン・ルイット）氏が2024年12月に来日した際、インタビューする機会を得た。ベクトルDBとベクトル検索エンジンは何が異なり、ユーザーは2つの技術をどう選択すべきなのか聞いたので紹介しよう。まず、RAGにおいてベクトルDBとベクトル検索エンジンが果たす役割は、基本的に同じだ。ユーザーがチャットボットなどに入力したプロンプト（指示文）に関連する情報を、業務データなど大規模言語モデル（LLM）が事

misshiki 2025/01/06

“Weaviate自体がRAGのワークフローを実現する仕組みを搭載することでLangChainやLlamaIndexを使わなくてもRAGアプリを構築できるようにする。Weaviateがあれば、開発者はコードを5行記述するだけで、RAGアプリを実現可能になる”

リンク

DeepseekV3は何がすごいのか？何故ヤバいと言われているのかを解説

なぜDeepSeek V3は“破壊的”なのか？大規模言語モデル（LLM）といえば、OpenAIのGPTシリーズやMetaのLlamaシリーズなど、膨大な学習コストと大手企業の潤沢なリソースが必要というイメージが強いかもしれません。しかし、2024年末にリリースされたDeepSeek V3は、その“常識”を一変させる存在として大きな注目を集めています。わずか数カ月・約558万ドルという圧倒的低コストで学習完了 GPT-4oに匹敵する性能をうたうオープンソースモデルであり、APIも数分の1～十数分の1と圧倒的価格破壊を起こしている Mixture-of-Experts（MoE）を活用して370B級モデルを安価・高速に動作こうしたインパクトは「破壊的」と評されるに十分でしょう。これまで「開発コスト」や「リソース」による参入障壁が高かったLLMの世界に、新たな扉を開く可能性を秘めているからで

misshiki 2025/01/06

“わずか数カ月・約558万ドルという圧倒的低コストで学習完了。GPT-4oに匹敵する性能をうたうオープンソースモデルであり、APIも数分の1～十数分の1と圧倒的価格破壊を起こしている。370B級モデルを安価・高速に動作”

リンク

Killed by LLM

Killed 1 month ago, Abstract reasoning challenge consisting of visual pattern completion tasks. Each task presents a sequence of abstract visual patterns and requires selecting the correct completion. Created by François Chollet as part of a broader investigation into measuring intelligence. It was 5 years and 1 months old.

misshiki 2025/01/06

「AI」の性能が「人間」を超え、最先端を測定できなくなったベンチマークを「飽和：Saturation」と表現。飽和時点を記念碑として時系列で並べた一覧。「Killed by Google」に着想を得ているが面白い！

リンク

円城塔のローラ：Apple silicon専用機械学習フレームワークを用いた円城塔LLMの開発と運用 - ＳＦ游歩道

Apple silicon専用の機械学習フレームワークMLXと，MLXを用いた大規模言語モデル（LLM）を利用するためのツール群MLX-LMを用いて，芥川賞作家円城塔の小説を模倣する（ことが期待される）小説生成機関を作成したので，作成方法や運用結果について記す．導入方法結果議論国立情報学研究所が公開するllm-jpの元データの再配布に関する著作権法上の問題円城塔の模倣を生成するために，エンジニアが円城塔を模倣する必要がある問題確認のために結局人力査読が必要な問題感想おまけ参考文献導入 Appleは，自社で開発したApple silicon専用の機械学習フレームワークMLXを公開し，またMLXを用いた大規模言語モデル（LLM）を利用するためのツール群MLX-LMを開発・公開している．一方，芥川賞作家である円城塔は，自身のGitHubで小説データセットを公開している．デ

misshiki 2025/01/06

“MLXを用いた大規模言語モデル（LLM）を利用するためのツール群MLX-LMを用いて，芥川賞作家円城塔の小説を模倣する（ことが期待される）小説生成機関を作成したので，作成方法や運用結果について”

リンク

AIスクレインピングエージェントの構築(LangGraph, Firecrawl)

はじめにこの記事では、LangGraphとFirecrawlを使用して、企業のWebサイトから特定の情報を抽出するWebスクレインピングエージェントを構築する方法を紹介します。具体的には、企業のホームページから社長の名前を取得する方法を解説します。参考にさせていただいた動画この動画では特定のキーワードをホームページから取得していますが、今回は正規表現では取得できないより抽象的な情報を取得することに挑戦しました。使用技術 LangGraph LangGraphは、AIエージェントを作るためのツールで、複雑な処理をいい感じに管理してくれる便利なフレームワークです。状態遷移グラフを使って、どの処理をどの順番でやるかを分かりやすく設計できます。特徴: 処理の流れを図にして確認できる（Mermaid図対応）条件分岐や並列処理ができて柔軟タスクの状態を一括管理本プロジェクトでの役割:

misshiki 2025/01/06

“LangGraphとFirecrawlを使用して、企業のWebサイトから特定の情報を抽出するWebスクレインピングエージェントを構築する方法を紹介”

リンク

AIエージェントの発展とRAGの新境地、「エージェンティックRAG」が注目される理由 | AMP[アンプ] - ビジネスインスピレーションメディア

既存RAGの課題、ハルシネーションやコンテキスト理解不足など企業における生成AI活用では、情報の正確性が特に重視される。そのため、生成AIを利用する場合、検索拡張生成（RAG）の導入が一般的となっている。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれている。しかし、既存のRAGシステムには、いくつかの課題が存在する。課題は大きく4つに分類される。第1の課題は、RAGだけでは情報の正確性が担保できないことだ。たとえば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれる。この場合、CRMが最も信頼できる情報源となるはずだが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報

misshiki 2025/01/06

“エージェンティックRAGは、AIエージェントをRAGパイプラインに組み込むことで、情報検索と生成の精度を向上させる手法である。”

リンク

2025年はRAGの次にAIエージェントが来る

はじめに 2024年のAI界隈では「RAG」が一巡し、その可能性と限界が明確になってきました。最も顕著な点は「RAGは魔法の杖ではない」という認識の広がりではないでしょうか？ RAGは確かに、既存の文書やデータを活用したAIの応答精度向上に貢献してきました。しかし、単純な質問応答を超えた複雑なタスクの実行や、動的な状況への適応には限界があることも明らかになっています。この限界を超えるための次のステップとして注目を集めているのが「AIエージェント」です。 OpenAIのCEOであるサム・アルトマンが「次のブレークスルーはエージェントだ」と発言していたり Anthropic社員がこのようなスピーチをしたりしています。 AIエージェントとは AIエージェントは、特定のタスクや目的のために設計された自律的なAIシステムです。たとえば、会議の参加者の予定を自動で調整して最適な時間を設定するAIアシス

misshiki 2025/01/06

AIエージェントについて、概要、特徴、代表的な種類、マルチエージェント用のフレームワークなど、一通りの全体像をまとめている記事。

リンク

2024年ビッグテックのAI Agent 動向まとめ

はじめに株式会社neoAIの研究開発組織 (neoAI Research) / 東京大学の大槻真輝です。最近LLMの推論能力の向上によりAI Agentがトレンドになりつつあります。また、MicrosoftやAmazonなどのビッグテックもAI Agentをテーマに様々なプロダクトやサービスを展開し始めています。そこで今回は2024年4月にIBMとMicrosoftが出したAgentに関するサーベイ論文「The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey」を軸にGoogle、AWS、Microsoft、OpenAI、AnthropicのAgentに関する動向や立ち位置を整理したいと思います。論文概要エージェントとは？ 2023年の

misshiki 2025/01/06

“2024年4月にIBMとMicrosoftが出したAgentに関するサーベイ論文「The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey」を軸にGoogle、AWS、Microsoft、OpenAI、AnthropicのAgentに関する動向や立ち位置を整理。”

リンク

AIのマルチエージェントシステムとは？その構築方法、CrewAIでの導入ステップガイド

大規模言語モデル（LLM）を活用したAIエージェントを複数組み合わせる「マルチエージェントシステム（マルチAIエージェント）」の構築において、LangChainとCrewAIという2つのフレームワークが注目を集めている。LangChainは、特定機能を持つエージェントを設計し、多様なLLMを統合できる基盤的プラットフォーム。一方、CrewAIは、LangChain上に構築されており、マルチエージェントシステムに特化した組織化と協調の層を提供するフレームワークだ。この記事では、AIマルチエージェントシステムの基礎と具体的なサービス、さらにはCrewAIを使って、リサーチャー、データアナリスト、ライターの3つのAIエージェントが市場分析を行う具体的なシステムの構築方法を紹介したい。

misshiki 2025/01/06

“AIマルチエージェントシステムの基礎と具体的なサービス、さらにはCrewAIを使って、リサーチャー、データアナリスト、ライターの3つのAIエージェントが市場分析を行う具体的なシステムの構築方法を紹介”

リンク

AIエージェントの評価｜Weights & Biases Japan

W&B AI Solution Engineerの鎌田 (X: olachinkei) です。2023年以降注目を集める「AIエージェント」ですが、その可能性が広く議論されている一方で、具体的な開発プロセスや評価方法についての情報はまだ整理されていないのが現状です。そこで、本ブログではAIエージェントに関する評価体系について、現時点での知見をまとめていきます。専門的な内容も交えながらも、できる限りわかりやすくお届けしますので、ぜひ最後までお付き合いください。 Compound AI システムの登場とAIエージェントへの発展生成AIの進化により、特に大規模言語モデルは簡単なプロンプト入力だけでさまざまなタスクを解決できるようになりました。しかし、AIの活用が広がる中で、私たちは単一のモデルに依存するアプローチから複数のコンポーネントを統合する新しいアプローチへと移行しています。このアプローチ

misshiki 2025/01/06

“AIエージェントに関する評価体系について、現時点での知見をまとめていきます。”

リンク

対話型AIエージェントでGoogle AI Agentハッカソンの担当者を作ってみた

作ったものカスタマーサポート全般を行う対話型AIエージェントを作成しました。ユーザからの質問対応や新機能要望のヒアリング、さらにクレームや緊急対応受付を一括して対話型AIエージェントが担います。 AIエージェントとの対話内容は自動的に分析され、スプレッドシートで一元管理されます。新機能の要望は即座にGitHub Issueとして起票され、クレームや緊急度の高いケースはSMSで担当者へリアルタイム通知する仕組みを備えています。対象ユーザ今回のプロダクトの対象ユーザは、本ハッカソンの参加者および担当者になります。ただ、このプロダクトはプロンプトを変えるだけであらゆるサービス・商品のカスタマーサポート担当をAIエージェントができるようにカスタマイズ性高く構築しています。背景にある課題本ハッカソンの開発プロジェクト条件に、以下のサービスを使うことが要件となっています。参加者は自分が

misshiki 2025/01/06

“カスタマーサポート全般を行う対話型AIエージェントを作成しました。ユーザからの質問対応や新機能要望のヒアリング、さらにクレームや緊急対応受付を一括して対話型AIエージェントが担います。”

リンク

2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集

関連リソース Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents 【論文紹介】LLMベースのAIエージェントのデザインパターン18選基盤モデルを用いたAIエージェントの設計パターン The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey は、「AIエージェントのアーキテクチャ」について、シン

misshiki 2025/01/06

“軽量DDDのようにすぐ実装に応用しやすいパターンやガイドラインの類を探してみました。”

リンク

Anthropicの定義する"AI Agent"を理解する

巷では「AIエージェント」のワードをよく見かける一方、何をAIエージェントと定義するのか自分もフワっとしていたので、2024年12月20日に公開されたAnthropicの「Building effective agents」の記事を読んでみました。「AIエージェントの定義ははっきりと定まっていません」みたいな文言は方々で見ますが、各社がどういう見解でそのワードを使っているのか、なんとなく理解することはできます。ちなみに、以下の「うたたね / Masaki Otsuki」さんの記事では各社がどのような位置付けとしているのかがまとまっており、私も勉強させていただきました。ありがとうございます。 ※本記事ではAnthropicの記事に焦点を絞り、記事の内容を元に記述しています。エージェントとワークフローの違いワークフロー: LLMとツールが事前定義されたコードのパスを通じて調整されるシス

misshiki 2025/01/06

“Anthropicの記事に焦点を絞り、記事の内容を元に記述”

人工知能

リンク

LLMがオワコン化した2024年

当ニュースレターは2023年を「SaaSがオワコン化した年」と位置づけたが、2024年は早くもAIが終わった一年であった。少なくとも大規模言語モデル（LLM）そのものの発展を、物珍しそうに追いかける時期は過ぎた。生成AIが今後どこまで賢くなるかはもちろん未知数である。しかし、既に業務で十分に役立つレベルにある現行モデルのコストが今後も下がっていくことは確実だ。 The cost of GPT-4 APIs at launch in Mar 2023 was roughly ~$30 per 1m tokens. Seeing Deepseek V-3 APIs at ~$1 per 1m tokens today. For AI application companies, cost of "intelligence" is falling significantly faster tha

misshiki 2025/01/06

“少なくとも大規模言語モデル（LLM）そのものの発展を、物珍しそうに追いかける時期は過ぎた。”

人工知能

リンク

動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説（生成AIウィークリー） | テクノエッジ TechnoEdge

“テキストから物理シミュレーションを生成するAI”を内蔵した高速物理エンジン「Genesis」Genesisは、新たに開発された物理エンジンで、多彩な3Dオブジェクトや物理現象の生成機能を備えています。この物理エンジンは、ロボット工学や物理AIアプリケーションなど、幅広い分野での活用を見据えて開発されました。 Pythonベースのオープンソースとして開発され、GitHubでコードが公開されていますが、現在はIsaac Gym/LabやMujocoと同様の物理シミュレーター部分のみが公開されており、生成機能は内部開発用として非公開となっています。 Genesis開発者のKashu Yamazaki氏に聞いたところ、Genesisの構造は低レイヤーに物理シミュレーター、高レイヤーに生成AIエンジン（イメージとしてはLLMエージェントに近い形）を備えており、ユーザーのプロンプトから物理シミュレー

misshiki 2025/01/06

“テキストから物理シミュレーションを生成するAIを内蔵した高速物理エンジン「Genesis」、GPT-4oやClaude-3.5-Sonnetに匹敵するオープンソースの大規模言語モデル「DeepSeek-V3」を取り上げます。”

リンク

12 Days of OpenAI の対抗馬となる Google からの発表まとめ - Algomatic Tech Blog

こんにちは。NEO(x) の宮脇（@catshun_）です。先日 OpenAI から 12 Days of OpenAI がありましたが、同時に Google のリリースも注目されていたのでこちらにまとめます。 Gemini 2.0 1. パフォーマンスの大幅な改善 2. マルチモーダル I/O の対応 3. ネイティブツールの呼び出し 4. Gemini 2.0 Flash Thinking Exp モデルのリリース Gemini 2.0 を使用するプロジェクト例 1. Project Astra 2. Project Mariner 3. Jules 4. Data Science Agent Deep Research Veo 2 Imagen 3 Whisk NotebookLM Plus Android XR Google Agentspace 1. 企業全体での情報発見 2.

misshiki 2025/01/06

“Gemini 2.0”など。

リンク

OpenAI、営利企業（PBC）への再編計画を発表　AGIの使命のために

米OpenAIは12月27日（現地時間）、現在の非営利団体と営利企業という構造を見直し、進化させていくと発表した。AGIの利益を全人類に届けるという使命を達成するためという。 AGI実現のためにはさらなる資金調達が必要なため、現行の営利企業をデラウェア州公益法人（PBC）に転換する計画だ。同社は2015年、AGI実現を目指して研究機関として設立された。当初はAGI開発のためにこれほどの計算能力が必要だとは想定していなかった。だがやがて、LLMの大規模化がAGIへの有望な道であることが明らかになり、そのためには寄付以上の資本が必要になった。そのため、2019年に研究機関から現在の体制である、非営利団体が管理する営利企業という独自構造に再編した。この体制で、10月には66億ドル調達したが、より多くの投資家から資金を調達するためには、株式を発行できる組織構造に移行する必要があるという。そ

misshiki 2025/01/06

“AGI実現のためにはさらなる資金調達が必要なため、現行の営利企業をデラウェア州公益法人（PBC）に転換する計画だ。”

リンク

OpenAIが営利企業が事業を主導していく形態へ転換する方針を表明

チャットAI「ChatGPT」の開発で知られるOpenAIが、「非営利組織の下に営利部門子会社がある」という体勢を改めて、営利企業による事業主導へと転換する方針を明らかにしました。 Why OpenAI’s Structure Must Evolve To Advance Our Mission | OpenAI https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/ OpenAI's for-profit plan includes a public benefit corporation https://www.engadget.com/ai/openais-for-profit-plan-includes-a-public-benefit-corporation-163634265.

misshiki 2025/01/06

“一方で、OpenAIすべてが営利企業化するわけではなく、非営利組織のOpenAI Inc.も継続して残り、健康や教育、科学の分野での慈善活動を追求していくことになるとのことです。”

OpenAI

リンク

OpenAIはVisaのように技術ではなく法律で市場を支配しようと企んでいるとの指摘

OpenAIが、決済業界においてVisaが実施した戦略と同様に、他企業の参入障壁を設けることでAI市場で支配的な地位を確立しようとしているとジャーナリストのテイラー・ローレンツ氏が指摘しています。 OpenAI is Visa - Sherwood News https://sherwood.news/tech/openai-is-visa/ ローレンツ氏は「Visaの成功は単に決済ネットワークを構築したことではなく、顧客を囲い込み、競合他社を締め出す障壁を作ったことにある」と言及。AIを開発するOpenAIはGoogle、Meta、Amazonのような競合と争わなければならないため、OpenAIは人工知能のVisaになろうとしていると話しました。 Visaの歴史は1958年にさかのぼります。この年、バンク・オブ・アメリカが6万人のカリフォルニア州民にクレジットカードを一方的に郵送し、その

misshiki 2025/01/06

“OpenAIが、決済業界においてVisaが実施した戦略と同様に、他企業の参入障壁を設けることでAI市場で支配的な地位を確立しようとしている”

OpenAI

リンク

OpenAIの最新研究が明かすAIのスキルレベル、AIエンジニアリングなど高度スキル領域も自動化される可能性 | AMP[アンプ] - ビジネスインスピレーションメディア

AIの機械学習エンジニアリングスキルを測定するMLEベンチマークの登場 AIによる自動化は、さまざまな領域へと拡大の一途をたどっている。その波は、単純作業だけでなく、高度な専門性を要する分野にまで及び始めている。現在、注目を集めているのが機械学習エンジニアリングだ。 OpenAIが2024年10月、AIシステムによる機械学習エンジニアリングの能力を測定する新しいベンチマーク「MLE-bench」を発表。この研究により、AIが高度な専門領域でも一定の成果を上げられる可能性が明らかになった。このベンチマークは、機械学習コンテストのプラットフォームとして知られるKaggleの実世界データサイエンスコンペティション75件を活用し、AIシステムの能力を包括的に評価するもの。Kaggleとは、企業や研究機関が抱える実際のデータ分析の課題を、世界中のデータサイエンティストが競って解決するプラットフォー

misshiki 2025/01/06

“OpenAIが2024年10月、AIシステムによる機械学習エンジニアリングの能力を測定する新しいベンチマーク「MLE-bench」を発表。この研究により、AIが高度な専門領域でも一定の成果を上げられる可能性が明らかになった。”

リンク

ChatGPTとSoraで障害発生──原因は「上流プロバイダー」

関連記事 OpenAIの「12 Days」まとめ OpenAIが12月5日から12日間にわたって12の発表を行ってきた「12 Days of OpenAI」が完結。その内容を簡単にまとめた。 OpenAIのChatGPT、Apple Intelligenceとの連携開始で約4時間ダウン OpenAIのChatGPTやSoraが12月11日、数時間にわたってダウンした。同日からApple IntelligenceやMacでアカウントなしでChatGPTにアクセスできるようになっていた。 ChatGPTが一時ダウン　平日朝からの障害で「仕事にならない」などの声も米OpenAIのチャットAI「ChatGPT」において、11月22日朝から障害が発生。ChatGPTとAPIの両方でアクセスできない状態が続いていたが、午前10時半（日本時間）に復旧。編集部でもアクセスできることを確認した。 Chat

misshiki 2025/01/06

“「ChatGPT」や「Sora」、APIで12月26日午前11時ごろ（現地時間）から、エラー率が高くなる問題が発生している。同社はステータスページで「この問題は上流プロバイダーによって発生」したと説明し、修正に取り組んでいる

OpenAI

リンク

アメリカでも中国でもない　Sakana AIが日本を本丸とする意義：朝日新聞GLOBE＋

生成AI（人工知能）開発のスタートアップ企業「Sakana AI」（本社・東京都港区）は、創業1年ほどで、企業評価額10億ドル超で未上場のユニコーン企業になるなど、注目を集めています。Sakana AIの共同創業者で最高執行責任者の伊藤錬（れん）氏による講演会「AIの作り方、AI企業の作り方」（主催：東京大学未来ビジョン研究センター・同センター安全保障研究ユニット、共催：朝日新聞GLOBE）が11月19日、東京大学で開かれました。講演の後半では、宮地ゆう朝日新聞編集委員が聞き手となり、Sakana AIの意義や目指すところを深掘りしました。 ――そもそも、ともにSakana AIを創業したデイビッド・ハさんやライオン・ジョーンズさんとはどうやって知り合ったのですか？デイビッドは、イギリスで私が働いていた企業の仲間です。デイビッドとライオンはグーグルの元同僚同士で、私はデイビッドを通してラ

misshiki 2025/01/06

“エヌビディアで、アメリカ勢からの投資はおしまい。なぜかと言うと、我々は日本の会社で、日本が本丸なのです。我々は日本の課題を解決したいと思っています。”

人工知能

リンク

NVIDIA（エヌビディア）も出資、Sakana AIをつくった「まったく逆」の発想とは？：朝日新聞GLOBE＋

生成AI（人工知能）開発のスタートアップ企業「Sakana AI」（本社・東京都港区）は、創業1年ほどで企業評価額10億ドル超のユニコーン企業になるなど、注目を集めています。Sakana AIの共同創業者で最高執行責任者の伊藤錬（れん）氏による講演会「AIの作り方、AI企業の作り方」（主催：東京大学未来ビジョン研究センター・同センター安全保障研究ユニット、共催：朝日新聞GLOBE）が11月19日、東京大学で開かれました。講演の内容を2回にわたってお伝えします。 Sakana AIは、2003年に作ったばかりの会社です。香港系カナダ人のデイビッド・ハ（最高経営責任者）、イギリス・ウェールズ出身のライオン・ジョーンズ（最高技術責任者）と私でつくりました。デイビッドは、米金融大手ゴールドマン・サックスでデリバティブ（金融派生商品）のトレーダーだったのですが、「AIの研究者になる」と一念発起して

misshiki 2025/01/06

“でも、「AIがあなたの生活を劇的に変えた経験ってありますか」と言われると、私はなかったんです。実はこれが今のAIの限界、AIの問題点だと思っていて”

人工知能

リンク

【本命】Googleから検索エージェントが登場！

ついに、本家GoogleからDeep Research（検索エージェント）がリリースされました。検索エージェントとは何なのか？検索（ググる）はどうアップデートされたのか？ Deep Researchの魅力や強みを紹介しながら、紐解いていきます。あやみ氏（https://x.com/ayami_marketing）が、Deep Researchを使ってDeep Researchの記事を書いてくれました笑このまま記事にしてしまおうか....と悩むくらいクオリティが高いです。（ハルシネーションがあるか探してみてくださいね！）ぜひ最後までお読みください。 Deep Research執筆記事のあとに、私の解説も入れています。こちらも合わせて読んでいただけると嬉しいです。なお、途中の挿入画像はImageFXで生成しており、プロンプトは前段の文章を英訳して入れただけです。ざっくり概要を把握

misshiki 2025/01/06

“Gemini Deep Researchは、AIを活用して複雑なトピックを自動的に調査し、包括的で読みやすいレポートを提供する機能です”

リンク

2024 AI Timeline - a Hugging Face Space by reach-vb

Discover amazing ML apps made by the community

misshiki 2025/01/06

2024年に登場したAIモデル（Llama 3.1などのOpen Source Models: 55件と、o1などのAPI Only Models: 63件）が時系列に並べられた一覧表（閲覧専用のカンバンボード？）です。時系列の図を作る時に参考になりそう。

リンク

さよならClaude、こんにちはGemini 〜Claude愛用者がGeminiに乗り換えた理由〜｜genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

大規模言語モデルの進化は目覚ましく、新しいモデルが次々と登場する中、Gemini 2.0シリーズに注目しています。上記記事を出してから私は1年弱ほど、Claude 3.5をメイン使用してきました。Claudeは「いいヤツ」で個人的にも愛着があったのですが、後ろ髪を引かれつつ最近Geminiに乗り換えました。（Claude 3.5Opusが出たらまた戻るかもしれません）このポストでたくさんの方から共感の声をいただいたのだが、自分でも確かにClaudeの方が性格がいいと思う。その点に関してClaudeに聞いてみると、「その他のAIモデルとの比較について、私の視点からコメントをさせていただくのは適切ではないと考えています。」と返ってきた。やはり性格がいい。 https://t.co/Ozxpp8yunW — K.Ishi@生成AIの産業応用 (@K_Ishi_AI) December

misshiki 2025/01/06

“Claude 3.5からGemini 2.0シリーズに乗り換えた筆者の経験に基づき、その実力と現状の課題を解説し”

リンク

マイクロソフト、AIデータセンターに800億ドル(12.6兆円)投資

misshiki 2025/01/06

“半分以上を米国に投資。そのうえで、まもなく発足するトランプ政権に、「大統領と議会は、米国のAIリーダーシップの強化を支援のために取り組みを拡大すべき」と提言している。”

リンク

マイクロソフト AI開発のデータセンター構築に巨額投資と発表 | NHK

AI＝人工知能をめぐる開発が加速する中、アメリカのIT大手・マイクロソフトは、ことし6月末までに、開発に必要なデータセンターの構築に日本円で12兆5000億円余りの巨額の投資を行うことを発表しました。これは、マイクロソフトのブラッド・スミス社長が3日、自社の公式ブログで明らかにしたものです。それによりますと、会社はことし6月末までの1年間にAIの開発に必要なデータセンターの構築に800億ドル、日本円で12兆5000億円余りの投資を行うとしていて、このうちの半分以上はアメリカで投資するとしています。また、ブログでは、トランプ次期大統領の就任を前にAIに関する政策提言もしていて「最も優先すべき公共政策は民間部門が追い風を受けて前進し続けられるようにすることだ」と述べ、競争力を高めるためにも強引な規制によって民間部門を減速させるべきではないとの考えを示しました。 AIへの投資をめぐっては、

misshiki 2025/01/06

“マイクロソフトは、ことし6月末までに、開発に必要なデータセンターの構築に日本円で12兆5000億円余りの巨額の投資を行うことを発表”

リンク

研究者にとってo1Proは3万円課金する価値があるか？｜genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

研究者が論文執筆や助成金の申請書を書く際、近年は大規模言語モデル（LLM）を活用するケースが増えています。確かにo1proの書く文章はAI臭さが無いですし、その知識や発想力に驚かさせる事は多いです。ただo1proをアカデミック関連の業務に試してきましたが、その経験から言えば、3万円を払ってo1Proを使う必要性は低い、というのが私の現在のところの正直な結論です。以下に理由を述べます。 1. o1モデルにおけるプロンプトのコツo1モデルは「シンプルなプロンプトがベスト」とされており、複雑なコンテキストや指示を加えすぎると性能を発揮しづらいと言われています。一部のプロンプトエンジニアリング（few-shot learning や「think step by step」など）は、性能を向上させない場合もあります。以下がベストプラクティスです：シンプルで直接的に：簡潔な指示が最も効果的です。連

misshiki 2025/01/06

“現状の感想としては「研究者が論文・申請書のためにo1Proに課金する必要は薄い」という結論”

リンク

ChatGPT o1とGemini 2.0の性能を比較してみた｜IT navi

2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。また、Googleは、2024年12月6日にGemini-Exp-1206（Gemini 2.0 Experimental Advanced）、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。 AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル（o1とGem

misshiki 2025/01/06

“Chatbot Arenaでの性能評価では、Geminiのスコアがo1のスコアを上回っているようでしたが、実際にテストしてみると、ほとんどの分野でo1の性能がGemini 2.0を圧倒していました。”

リンク

ＡＩによる性的な偽画像作成サイトへのアクセス、世界３番目１８００万回…被害拡散の温床

【読売新聞】　生成ＡＩ（人工知能）で性的な偽画像「ディープフェイク」を作成できるサイトへの日本国内からのアクセス数が、１１月までの１年間で１８００万回超に上り、米国、インドに続き世界で３番目に多かったことが読売新聞の調査でわかった。

misshiki 2025/01/06

“生成ＡＩ（人工知能）で性的な偽画像「ディープフェイク」を作成できるサイトへの日本国内からのアクセス数が、１１月までの１年間で１８００万回超に上り、米国、インドに続き世界で３番目に多かった”

リンク

「人がAIと共同作業する未来」へ突き進む　2025年のAIを予測する【西田宗千佳のイマトミライ】

misshiki 2025/01/06

“2025年は「本格的活用ルール」の行方が定まる時期と言えそうだ。”

人工知能

リンク

元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる／ Blog - 2025/01/01｜CreativeEdge Vlog

元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる／ Blog - 2025/01/01 2025年元旦 2016年11月からスタートした「AIクリエイティブ」は8年、生成AIに注力してから2年経ちました。昨年は本業のInstructional Designを「0」、生成AIを「100」にして取り組んできましたが、2025年も継続していきます。ただ、「映画を撮らない映画監督のように」今後も表舞台ではInstructional Designerを名乗ります。廃業宣言みたいなものですが、生成AIをビジネスにすることだけは避けないといけませんので（※生成AIは最大限に活用するけど生成AIのビジネスはしない）、複合的かつ多層的に将来を決めていきたいと思います。「AIクリエイティブ」活動は8年、生成AIの取り組みは2年経過4月から開始した非公式のライブ配

misshiki 2025/01/06

“特定の技術に依存した強固なワークフローは大変危険なので、常に置き換え可能な状態にしておくことが重要。”

人工知能

リンク

ONE OK ROCKが“AIと共存した”MVを発表。人工知能で人の心を動かすことはできるのか？

ONE OK ROCKが“AIと共存した”MVを発表。人工知能で人の心を動かすことはできるのか？2024.12.26 18:007,745 照沼健太 AI（人工知能）と人類は共存できるのか。 CGを一切使わず、AIと一緒に作った映像。それが、ONE OK ROCKのニューシングル｢Dystopia｣のMVです。 Video: ONE OK ROCK/YouTube実写映像とAIが生成した映像を合成することで、SF的なディストピア世界を描き出した本作は、｢AIを制作チームの一員｣として迎え、人間とAIが共存しながらクリエイションする方式をとって制作されました。 ONE OK ROCKのボーカル・Takaさんと、本MVを手がけた北田一真監督（以下、北田監督）の対談を通し、1年前には考えられなかった｢AIとMVを共作した｣本作の舞台裏と、そこに込められた二人の情熱に迫ります。ディストピアの中

misshiki 2025/01/06

“CGを一切使わず、AIと一緒に作った映像。それが、ONE OK ROCKのニューシングル｢Dystopia｣のMVです。”

人工知能

リンク

AIは人間の進化をどのように変えるのか？

AIの発展によって社会が大きく変わることが予想されますが、AIの影響は社会レベルにとどまらず、生命体としての人間の進化にも影響を及ぼす可能性があります。そこでオーストラリアのニューサウスウェールズ大学の進化生物学者であるロバート・ブルックス氏が、「AIが人間の進化をどのように変えるのか？」について解説しています。 Smaller brains? Fewer friends? An evolutionary biologist asks how AI will change humanity’s future https://theconversation.com/smaller-brains-fewer-friends-an-evolutionary-biologist-asks-how-ai-will-change-humanitys-future-244179 「今よりもっと高度なAI

misshiki 2025/01/06

“すでに人間は、文字と筆記によって知識を外部化することで個人が覚えるべき負担が軽減され、その結果としてここ数千年で人間の脳が縮小。AIの進化も同様に、人間の脳を縮小させる方向に進化させる可能性がある。”

人工知能

リンク

もうすぐ消滅するという人間の翻訳について｜平野暁人

ひとつの翻訳が、終わった。１本の翻訳原稿を仕上げた、わけではない。この世界に存在していた翻訳のひとつがいま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は０件。 2025年の収入見込みも畢竟、０円ということになる。あくまでもひとつの翻訳の話である。つまりは翻訳のひとつの話である。関係ないと思うならこの先を読まなくてもいい。自分の知る現実と違うならこの先を信じなくてもいい。人間の数だけ人間があり現実の数だけ現実がある。そのような場所をあるいはそのとらえ難さをこそ人は「世界」と呼ぶのだから。そうしてその「世界」の中でひとつの翻訳が終わった。じつに翻訳のひとつとして文字通り終わってしまった。もっとも、収入の見込みが完全に断たれた経験はこれが初めてではない。わずか数ヶ月前まで遥かな対岸でちらちらと燃えていたはずの疫禍がその存外長い舌を露わにし

misshiki 2025/01/06

“翻訳というものがかつて生身の専門家や勉強家たちの手によって一定の質を保たれていたことも思い出されなくなり、やがて知る由もなくなる。...人間とは、慣れてゆく生き物である”

人工知能

リンク

半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる？（CloseBox） | テクノエッジ TechnoEdge

みなさん、AIサブスクしてますか？個人的な話で恐縮ですが、筆者は毎月13万円ほど生成AI関連のサブスクリプションにお金を使っていることが、先日判明しました。この12月に家の30年ローンを払い終わったのですが、それとほぼ同額です。 2024年の中頃に一度サブスク関係を試算したときの、ほぼ2倍になっているのです。で、現在の状況を明らかにしておこうと思います。米ドルの場合は1ドル152円換算。年払いの場合はそれを12等分しています。 Adobe CCが大したことないように見えてしまうのは錯視でしょうか。深刻なのが、動画生成関連のサービスです。HeyGen、Runway、Luma、Soraと、Unlimitedプランを使おうとすると1～3万円の出費を余儀なくされます。個別にクレジットを追加購入するとさらに料金アップするのでこれでも節約になってるというのが、生成AIガチャの怖いところです。

misshiki 2025/01/06

“筆者は毎月13万円ほど生成AI関連のサブスクリプションにお金を使っている”

人工知能

リンク

AIが生徒に囲碁を教えた結果、男女の実力差が解消。男女差は人間指導が原因？（生成AIクローズアップ） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間の気になる生成AI 技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI 技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AI教師が囲碁を生徒に指導すると学習効果はどうなるかを調査した研究論文「Can Artificial Intelligence Improve Gender Equality? Evidence from a Natural Experiment」に注目します。この実験は2020年9月から2021年7月にかけて、中国の囲碁教室で実施されました。新型コロナウイルス対策により一部の教師が隔離されたことをきっかけに、36人の教師のうち16人がAI教師に置き換えられること

misshiki 2025/01/06

“実験結果、AI指導を受けた生徒グループの勝率は、5ヶ月後には50%から56%に上昇し、着手の質も大幅に向上しました。”

人工知能

リンク

「プログラミング言語」は今後不要になるのか　ソフトウェア開発者の業務、半分はAIで自動化可能に

この記事は、『生成AIで世界はこう変わる』（今井翔太著、SBクリエイティブ）に掲載された内容に、編集を加えて転載したものです（無断転載禁止）。ソフトウェア開発における生成AIは、私自身が積極的に利用していることもあり、定量的な研究成果に加え、当事者の生の声もお伝えしたいと思います。この部分に関しては主観的な記述も多くなりますが、その点はご留意ください。「ChatGPT以前のソフトウェア開発は石器時代だった」とは、ある開発者の言葉です。言語生成AIが持つプログラミングコードの生成能力は驚異的なものです。ChatGPT登場当日、私が最も驚き、「これは本当にすごい」と確信したきっかけは、このプログラミングコードの生成能力を目の当たりにしたことでした。

misshiki 2025/01/06

“実際にどれくらい生産性が上がったのか、定量的に表すのは難しいのですが、どれだけ低く見積もっても2倍以上、5倍、10倍という数字でも納得できるレベルです。”

リンク

AI技術を活用して除雪を行うロボット除雪機が大雪前に何とか間に合った...→毎日の雪かきが重労働となっている地域での生活が一変するのではと称賛の嵐

yuta suito @yutasuito NPUで動くロボット除雪機が大雪前に間に合いました☃️パイロン置いてスイッチ入れると自動で雪を端に寄せます。毎日の除雪時間が1/3に💨💨💨 #raspberrypi pic.x.com/WR3WZ3cKye 2024-12-27 11:24:09

misshiki 2025/01/06

“NPUで動くロボット除雪機”

リンク

製造業DXプロセス別解説まとめ（後編）

MONOistやEE Times Japanに掲載した主要な記事を、読みやすいPDF形式の電子ブックレットに再編集した「エンジニア電子ブックレット」。製造業のバリューチェーンを10のプロセスに分け、DXを進める上で起こりがちな課題と解決へのアプローチを紹介する連載「製造業DXプロセス別解説」全12回の後半に当たる第7回～第12回をまとめた。

misshiki 2025/01/06

“DXを進める上で起こりがちな課題と解決へのアプローチを紹介する連載「製造業DXプロセス別解説」全12回の後半に当たる第7回～第12回をまとめ”

DX

リンク

AIの脅威ってどんなもの？専門家が考える悪影響とその対策

AIの脅威ってどんなもの？専門家が考える悪影響とその対策2024.12.27 21:00 Sylvia Lu, The Conversation - Gizmodo US ［原文］（ Kenji P. Miyajima ）ソーシャルメディア（SNS）のタイムラインを眺めていると、お気に入りの音楽アプリがプレイリストを提案してくれたりします。これだけみると、人工知能（AI）が好みを学んで必要なものを提供してくれて、私たちの生活を向上させてくれる存在のように感じるかもしれません。しかし、その便利さの裏には｢アルゴリズムによる弊害｣という深刻な問題が潜んでいます。その弊害は、目に見えるものでも、すぐに影響が表れるものでもありません。AIシステムが知らないうちにユーザーの生活に関する意思決定を行なうことで、時間をかけて徐々に悪影響が積み重なっていきます。このようなシステムの隠された力が、プ

misshiki 2025/01/06

“アルゴリズムによる弊害を4つの法的領域に分類。｢プライバシー｣、｢自律性｣、｢平等性｣、｢安全性｣です。それぞれの領域は、繊細でありながら、往々にして抑制されないAIシステムの影響力に対して脆弱です。”

リンク

DeepL創業者「時が熟すのを待っていた」音声翻訳を開始 | 経済プレミアインタビュー | 山口敦雄 | 毎日新聞「経済プレミア」

DeepLのヤロスワフ・クテロフスキー最高経営責任者＝東京都港区で2024年11月25日、山口敦雄撮影ドイツの人工知能（AI）翻訳サービス会社のDeepLは11月から会話の音声翻訳サービスを開始した。サービス開始時点で日本語、英語、ドイツ語、韓国語など13の言語に対応し、多言語のオンライン会議で利用できる。文章翻訳で定評のある同社にとり、音声翻訳サービスの開始は長年の念願がかなった形だ。同社の創業者のヤロスワフ・クテロフスキー最高経営責任者（CEO）に音声翻訳の可能性について聞いた。文章より音声翻訳の方が難しい ――音声翻訳サービスの「DeepL Voice」を開始しました。 ◆多くの社員が開発にかかわり、膨大な作業量の結果、出来上がったサービスだ。とてもうれしく誇りに思う。特にうれしかったことは、実際に使い始めたユーザーからの反応だ。「Voice」が登場したことで、いろいろな会話に深

misshiki 2025/01/06

“音声翻訳サービスの「DeepL Voice」を開始しました。”

人工知能

リンク

学習障害をAIで支援する: 極東ブログ

VOA（Voice of America）に「AI 技術が障害を持つ学生の公平な学習環境を実現」（AI techno logy helps level playing field for students with disabilities）という記事があり、教育におけるAI 技術の影響について興味深い内容だった。この記事では、障害を持つ学生がAI 技術を活用して学びの壁を克服し、学びの場での公平性を実現している様子を描いていた。を持つ学生への影響記事ではいくつかの事例が紹介されているが、ディスレクシア（読字障害）を持つ14歳の女子学生の実体験が興味深いものだった。彼女は幼い頃から文字を正確に読むことが難しく、また書字においても、”rhinoceros（サイ）”は "rineanswsaurs"、”sarcastic（皮肉な）”は”srkastik"と書いてしまうらしい。そこで彼女は「自分は愚

misshiki 2025/01/06

“特別支援教育において、AIが学生を支援する過程で、学習者が本来自力で磨くべき能力を十分に伸ばせなくなるリスクがある。”

リンク

Metaがユーザーの反発を受けAIキャラクターアカウントを削除

Metaが自社プラットフォーム上で独自に展開していたAIキャラクターのアカウントを削除したことが明らかになりました。 Meta's AI Profiles Are Indistinguishable From Terrible Spam That Took Over Facebook https://www.404media.co/metas-ai-profiles-are-indistinguishable-from-terrible-spam-that-took-over-facebook/ Meta shuts down its AI character accounts after user outcry https://www.nbcnews.com/tech/social-media/meta-ai-insta-shuts-character-instagram-fb-acco

misshiki 2025/01/06

“バグにより一部のAIキャラクターアカウントがブロックできなくなっていたため、アカウントを削除したと説明しています。”

リンク

生成AIめぐり規制と技術革新の両立目指す新法案提出へ政府 | NHK

偽情報の拡散など生成AIをめぐるリスクが指摘される中、政府は新たな法案を通常国会に提出する方針です。悪質な事案に対し国が調査を行うなどとする一方、適正な研究開発を図ることも盛り込んでいて、規制と技術革新の両立を目指したい考えです。生成AIをめぐっては、生産性の向上などのメリットの一方、巧妙な偽情報の拡散といったさまざまなリスクも指摘されています。こうした中、政府は今月召集される通常国会に、新たな法案を提出する方針です。法案の骨子案では、AI 技術を用いた悪質な事案が発生した場合、国が調査し、結果に基づいて事業者への指導や助言、それに国民への情報提供を行うとしています。一方で、AIの適正で透明な研究開発や活用を図ることも盛り込んでいます。内閣府によりますと、AIの規制をめぐっては、アメリカが事業者の自主的な取り組みを重視しているのに対しEUは、極めてリスクの高いAIの利用を法律で禁止

misshiki 2025/01/06

“政府は新たな法案を通常国会に提出する方針です。悪質な事案に対し国が調査を行うなどとする一方、適正な研究開発を図ることも盛り込んでいて、規制と技術革新の両立を目指したい考えです。”

リンク

「AI翻訳で仕事が減った」という話題がバズってるけど、むしろAI翻訳のおかげで景気が良くなった？→「正しい翻訳」ができる翻訳家は人手不足らしい

リンク note（ノート）もうすぐ消滅するという人間の翻訳について｜平野暁人ひとつの翻訳が、終わった。１本の翻訳原稿を仕上げた、わけではない。この世界に存在していた翻訳のひとつがいま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は０件。 2025年の収入見込みも畢竟、０円ということになる。あくまでもひとつの翻訳の話である。つまりは翻訳のひとつの話である。関係ないと思うならこの先を読まなくてもいい。自分の知る現実と違うならこの先を信じなくてもいい。人間の数だけ人間があり現実の数だけ現実がある。そのような場所をあるいはそのとらえ難さをこそ人 932 users 740

misshiki 2025/01/06

“結局のところ「弱いやつから死ぬ」なのかも”

人工知能

リンク

AI翻訳の影響で仕事が激減した翻訳者さんによるnoteが切ない「人間の側が翻訳に対する要求水準を下げ始めた」

リンク note（ノート）もうすぐ消滅するという人間の翻訳について｜平野暁人ひとつの翻訳が、終わった。１本の翻訳原稿を仕上げた、わけではない。この世界に存在していた翻訳のひとつがいま終焉を迎えたのだ。 2024年末現在、僕の手元にきている来年の依頼は０件。 2025年の収入見込みも畢竟、０円ということになる。あくまでもひとつの翻訳の話である。つまりは翻訳のひとつの話である。関係ないと思うならこの先を読まなくてもいい。自分の知る現実と違うならこの先を信じなくてもいい。人間の数だけ人間があり現実の数だけ現実がある。そのような場所をあるいはそのとらえ難さをこそ人 932 users 740 箱入りさん @voxjoe @aki_traducteur 歯がゆく、辛く、言葉も無くしてしまう出来事に涙を禁じ得ません。何とお声掛けすればと考えてしまいますし、何をもって励ませ

misshiki 2025/01/06

“ほかでもなく、人間の側が翻訳に対する要求水準を下げ始めたからである。”

人工知能

リンク

perplexityのスペース機能がソフトウェアの調べものに便利 - mrwk update

TL;DR perplexity のスペースは情報源をURLとファイルで登録できる →質問するとそこを優先的に検索 →githubや公式サイト、ドキュメントを登録する →ソフトウェアの調べものがはかどる! 注意点: 日本語で質問すると日本語で検索しようとして失敗する。プロンプトで「(質問本文) 英語で検索して日本語でまとめて」って書くとよい perplexityのスペース perplexity、検索まとめと、翻訳があやしいニュースサイトとしてそこそこ便利に使っています。ちょっと前から「スペース」という機能ができていたのですが、使ってみたところ予想以上にいい感じでした。スペースはここスペース機能は複数人で共有されるスペースを作って、特定のトピックについてperplexityとのchat履歴をまとめる機能です。ここで、ソースとして情報源のファイルやリンクを登録することができます。ソース

misshiki 2025/01/06

“スペース機能は複数人で共有されるスペースを作って、特定のトピックについてperplexityとのchat履歴をまとめる機能です。ここで、ソースとして情報源のファイルやリンクを登録することができます。”

人工知能

リンク

フリーランスが使っている生成AIサービス　3位「Gemini」、2位「Perplexity」、1位は？

仕事での生成AI活用度について「業務内で有効活用しており、日常的に使用」「部分的に取り入れて時々使っている」と回答した人は14.3％にとどまった。「使ったことがない」と回答した人は73.5％に上り、フリーランスへの生成AIの浸透度が低いことが分かった。

misshiki 2025/01/06

“フリーランスが利用している「生成AIサービス」TOP10は？活用している業務領域について、最も多いのは「文章作成や校閲」で63.2％。「資料作成」（26.3％）、「カスタマーサポートやメール対応」（15.8％）と続いた。”

人工知能

リンク

群雄割拠の生成AI　みんなが今、実際に使っているツールは何？

SHIFT AIは2024年12月25日、「2024年AI（人工知能）トレンドランキング」を発表した。同社が運営するAIのビジネス活用を学べるメディアコミュニティー「SHIFT AI」の会員を対象に実施した調査の結果をまとめたもので、827人から有効回答を得た。それによると2024年話題になったと思う生成AIツールと実際に今使っている生成AIツールのトップはどちらも「ChatGPT」だった。テキスト系はChatGPTの人気が圧倒的、では画像や動画は？関連記事生成AIの採用率が高い組織ほどオープンソースへの依存度が高い？　Linux Foundationが調査レポートを発表 Linux Foundation Japanは、調査レポート「生成AIの未来を形作る　オープンソースイノベーションの影響」を発表した。84％の組織が生成AIを中～高程度導入しており、その41％がオープンソースを利用

misshiki 2025/01/06

“2024年話題になったと思う生成AIツールと実際に今使っている生成AIツールのトップはどちらも「ChatGPT」だった。”

人工知能

リンク

日立、AI活用のバッテリー充放電制御や空調計画最適化ソリューションを提供開始

日立製作所と日立産業制御ソリューションズは、エネルギーマネジメントサービス「EMilia」に、AIを用いた工場、オフィスビル向けのバッテリー充放電制御および空調計画最適化ソリューションを追加した。日立製作所（日立）と日立産業制御ソリューションズは2024年12月17日、日立のエネルギー、設備マネジメントサービス「EMilia（エミリア）」に、工場やオフィスビル向けのバッテリー充放電制御と空調計画最適化機能を追加した。AI（人工知能）を用いたソリューションとなる。バッテリー充放電制御ソリューションは、工場やオフィスビルでEV（電気自動車）充電器や定置型蓄電池を運用する際に活用できる。EVの走行計画や電力需要予測などのデータを用いて、目標とする電力使用量を超えない最適な充放電計画をAIにより自動で立案して制御する。EVや蓄電池に貯めた電力を計画的に利用することも可能で、非常時の企業の防災や

misshiki 2025/01/06

“工場やオフィスビルの電力使用量やコストを低減する運転計画を、AIが室外機1台ごとに自動立案する。時間帯ごとの電力削減の優先度や電力の需要予測をベースに立案するため、空調性能も維持できる。”

人工知能

リンク

2024年出版関連動向回顧と年初予想の検証 | HON[.]jp News Blog

Text to Image by Adobe Firefly Image 2 Model（厳かな神社の境内で大きな翼を持つ黒い龍と美しい白蛇が並んでいる）《この記事は約 50 分で読めます（1分で600字計算）》 HON.jp News Blog 編集長の鷹野が、年初に公開した出版関連動向予想12024年出版関連の動向予想〈HON.jp News Blog（2024年1月10日）〉 https://hon.jp/news/1.0/0/46075を検証しつつ、2024年を振り返ります。 2024年概況まず概況から。出版科学研究所「出版指標マンスリー・レポート」2024年12月号によると、2024年1～11月期の紙の書籍雑誌推定販売額は9172億円で、前年同期比5.7％減でした22024年11月期紙書籍雑誌推定販売金額は前年同月比5.7％減～出版指標マンスリーレポートより〈HON.j