megamouthの葬列

長い旅路の終わり

AIだけどAIじゃない

AIブームである。私のような場末のエンジニアにまで、AI案件の話が飛んでくる始末だ。

AI案件とは、だいたいにおいて、「ChatGPTのようなAIに我が社の長年の課題(属人化している業務や、時間のかかる業務)を代替させ、業務効率化を図る」という趣旨になっている。

ところで、案件の決裁権を握っているおじさんたちにとって、AIとはChatGPTのことだ。つまりは日本語を理解し、なんだか賢そうな返答を返し、全てを解決してくれそうなふいんきのあるチャットボットのことである。
さて、どうやってAI(LLM)に建築物の構造計算の検証や、ブランド品の値付け査定や、Webデザインをさせたらいいだろうか?

哀れなプロンプトエンジニアたちが、あの手この手でプロンプトを調整することで、LLMはそれらしい返答を返してくれる。それらしい数字、それらしい値段、どこかで見たことのあるHTML。だが、実際それを業務に反映させる段になって、顧客はおそらくこう言うだろう。
「これ本当にあってる?」

ChatGPTであろうが、claudeだろうが、geminiだろうが、それが正しい結果であることを保証しない。というより、こういう用途であれば、よくよく見ればLLMが素で返す回答が正しいほうが珍しい。それらは文脈でそれっぽいものを返す「人間っぽさ」がウリなのであって、機械的な精密さはどこにもないし、そもそもそんな仕組みではないからだ。

善良な顧客の中にはアプリケーションベンダーがLLMのコアの部分(例えばディープラーニングの中間層的な存在)に干渉できると思っている人がいる。もちろんそんなことはできない。なんならデコード前のトークン列にすらアクセスできないことだってある。私たちができることは、ChatGPTのかっこいWebインターフェースの代わりにAPIを使うことだけだ。APIというとまた煙に巻かれる人がでるから、もっとわかりやすく言うと、ブラウザを自動で操作して、結果を自分のアプリケーションに取り込んでいるようなイメージだ。私たちにしてみれば、APIの裏側にあるGPUサーバーの暗がりの中で連中が何をしてるかなんて知ったこっちゃないのである。

こんな体たらくで、LLMが嘘ばっかついてるのが判明しても、案件としては走ってしまっているものだから、最終的に「なんとかなりませんか?」という話になる。なりませんよ、さようなら、と言えればいいのだが、こっちも日銭が欲しいので、正しい結果か検証できるようにしたり、LLMが再現性のある結果を出せるようにルールベースのアルゴリズムで作られた処理をtool callできるようにしたりする。結局、構造計算のアルゴリズムを用意したり、LLM以前にあったような画像認識を裏で動かしたり、Webデザインのテンプレートを用意するのである。あれ?これってAIのプロジェクトだったよね?

もちろん、システムが「本物」の結果を必要としていることがわかった時点で、「AI(LLM)にはこんな仕事は無理なので、古典的なルールベースのアルゴリズムでいきましょう」と言えればいいのだが、実際のところはそうもいかない。なぜなら予算はAIに対して降りているからだ。結果できたものがAIではありません、では通らないのである。顧客が本当に必要としていたものがAI(LLM)でないにも関わらずだ。

画像認識のように、広い意味でAI(機械学習やCNN)だったらしめたものだ。「もちろんこれはAI(広義)でございますよ!」と堂々と言い張ることができる。良かったね。でもそれも出来ないような案件、たとえば、Excelから数値を読み取って集計したり相関をとったりするようなものだったらどうするか?

チャットインターフェースをつけるのである。ChatGPTのWebインターフェースを再発明して、とってつけて、LLMが内部でうけとった結果を出力できるようにするのである。「やあ、マザーコンピューター、23かける638は?」「16,054でございます閣下」とやれるようにするのである。電卓叩けよ。

どう考えても古式ゆかしいWeb UIのほうがふさわしい案件でも、なんならWindowsアプリケーションでローカルで動かしたほうがいい案件でも、答えがチャットインターフェースで返ってきたらそれはAIということになるらしい。
ここで得られる結論とは、AIとは「チャットインターフェース」のことであるということだ。残念ながらこれが2025年の日本のITにおける一つの現実だ。

*

どうして、こうなる前に構造計算や画像認識や統計処理の案件として、それらを発注できなかったのだろう、と思う。それが必要だというなら、AIブーム関係なしにそれを発注すれば良かったではないか。そういった案件をAI案件として発注しても、わけのわからないAIコンサルにChatGPTのUI再実装版を納品されるリスクを負うだけで、何のメリットもない。

予算が下りなかったのだろう、と思う。例えば私が抱えている顧客に20年前にPerlで作られたシステムを未だに運用している顧客がいる。今の技術で作れば様々な課題が解決しますよ、と何度言ってもシステムがリプレースされることがないので、サーバーリプレイスの度に私がマイグレーションしている(ちなみに最新のAlma Linuxでも動いている。私がすごいのではなく、Perl v5系の後方互換性が狂気じみているおかげだ)

課題があっても、事務員がExcelテキストエディタを駆使してなんとかしてしまっているのである。そういう「あったらいいけど、なくても何とかなる」というものについて、今までの企業は全くといっていいほど予算をつけなかった。

だから、AIブームの大盤振る舞いが露骨に写るのだ。「AIでこの課題を解決したいんです!」って、それ課題だったんですか?一年前には同じ口で、そんな機能にはビタ一文払う気はない、と言ってませんでしたっけ?

*

しかし同時に、私はこのAIブームに発注を繰り返すAIおじさんに同情もしている。おじさんが課題と見なして予算をかけようとしても「無駄遣い」と言われていたのに、同じ課題をAIで解決すると言えば「先進的」と賞賛される現実に一番虚しい感情を抱いているのはAIおじさんだろうからだ。

だから、むしろ今、AI以前にあった、Web3.0のNFTや、メタバースの熱狂を思い出してほしい、と思う。

あの時、距離を置いていた人々は、単に熱意がなかったのだろうか。むしろ、彼らはブームの本質を見抜き、その空虚さを感じ取っていたのではないか。
同様に、現在のAIブームに対しても、手放しで熱狂するのではなく、その実態と限界を冷静に見極めようとしてほしい、それがビジネスマンとしての誠実さではないだろうか、と思うのだがどうだろうか?

真のイノベーションは、単なるバズワードの消費からは生まれない。本当に価値のあるものは、地に足のついた課題認識と、それを解決するための最適な技術選択、そして細部へのこだわりから生まれる。皆がAIが万能薬ではないことを知ったその時、私たちはより本質的な議論ができる(かもしれない)と、私はほんの僅か、希望を抱いている。