みんなのケータイ

適材適所で使い分けていきたいスマホで使える各種生成AI――Galaxy S25とiPhone 16

 使える生成AIが増えてきた。ソフトバンクキャリアのGalaxy S25ユーザーの筆者は、Galaxy AI、Gemini、そしてキャリアが1年間無料で提供している「perplexity Pro」も使うことができる。また、iPhone 16があるので、「Apple Intelligence」も利用できる。

 Galaxy AIもApple Intelligenceも、AIがスマートフォンやOSに統合されているので、慣れてくれば使っているという意識なしに使えそうだ。例えば、「Hey、Siri」や「OK、Google」、自宅であれば「Alexa!」と自然に呼びかけているのと同じように、だ。

 リアルタイム文字起こしと、そこから作文するという内容の記事は、編集長が執筆していたので、臍(ほぞ)を噛みながら書くのを諦めるとして、文字起こしの精度や、それぞれのAIの使い道についてふと気づいたことを紹介していきたい。

右からGalaxy S23 Ultraのbing、Galaxy S25のperplexity Pro、iPhone 16のボイスメモ

文字起こしの精度

 Galaxy S25のボイスレコーダーアプリとiPhone 16のボイスメモアプリは、録音した音声データから文字起こしをする機能が追加されている。Galaxy Z Fold 3では10分間だけリアルタイム文字起こしも可能であったが、現在所有しているGalaxy S25とGalaxy S23 Ultraにはその機能がない。その点で、iOS 18以降を搭載するiPhone 16に負けている。

 では、録音済み音声データをどれほどの精度で文字起こししてくれるのだろうか。

 ここでは、ケータイWatchのとある記事を30秒ほど朗読した結果が以下のものだ。比較として、元のテキストの他に、AIボイスレコーダーとして人気の高い「PLAUD NotePin」と専用アプリを使って文字起こしした結果も掲載している。

左上が元のテキストで、右上が「PLAUD」、左下がGalaxy S25、右下がiPhone 16だ

 文字色が赤くなっているのが誤りの箇所である。元のテキストが303文字。「録音」を「録画」としている箇所や「Evernote」を「レバーノート」と誤っている箇所などは、それぞれ1文字分だけが違うといえるし、iPhone 16の「バーノート」は「エ」を聞き取れていないだけである。

 アルファベットとカタカナの融合(Anドロイド等)に関しては、どのようにカウントすれば良いのか悩ましいところだが、音としては合っているのでノーカウントとすれば、どちらも99%以上の精度で文字起こしできているといえよう。

 むしろ、AIボイスレコーダーのPLAUD NotePinが暴走しているのが気になるぐらいだ。

 この結果は、筆者がアナウンサーばりの滑舌で朗読したからというのにも起因しているので、発表会会場やインタビューといった場面では、また違った結果になるかもしれない。

 とはいえ、会議が多い、議事録を作らねばならないといった職種の人が最新のiOSを搭載したiPhoneや、フラッグシップモデルのGalaxy端末を持っているのであれば、きっと役に立つだろう。

夕飯の献立を質問した

 夕飯に限らず、食事を作るのは大変だ。いや、作るのはいい。献立を考えるのが面倒くさいのだ。

 学校給食並みに、1カ月の献立を考えて、どこかに貼り付けてみてはどうか、と考えたこともあったのだが、そもそも献立を考えるのが面倒なので1回も実行することなく、その案は立ち消えとなった。

 そこで、優秀なAIたちに献立を考えてもらうことにした。これなら、冷蔵庫や冷凍庫に何が入っているかを確認するだけで良い。

 ある日の冷蔵庫には、ナスとニンジンとレンコンが使われないまま保存されていた。そこで、「冷蔵庫にはナスとニンジンとレンコンがあります。今夜の夕食はどうしましょうか」と優秀なAIエージェントたちに質問することにした。

 perplexity Proの回答は以下のようなものであった。

メニューと簡易的なレシピをリスト形式で教えてくれる。参照元リンクもあるので、もっと詳しく知りたいのであれば、タップして遷移できる

 Geminiでは、次のように回答してくれた。

メニューだけでなく、作り方まで表示するのがGemini流だ。料理に慣れており、アバウトなアドバイスでも味を想像しながら作れる人であれば、この画面で完結する

 Siriにも聞いてみた。

文章として意味を理解していないなぁと感じる結果が返ってきた。「迷った日におすすめ!」という遷移先から考えると、むしろ深読みしているのかもしれないが

 最後に、冒頭では触れなかったが、「bing」アプリのCopilotにも質問した。

声で質問したところ、爽やかな男性の声で回答された上、テキストでも残されていた。内容は、主菜と副菜に分けたもので、実用的だと感じた。本論とは関係ないのだが、筆者の最近ハマっている「Nippon Boys」の面々にCopilotのしゃべり方が似ていたので、ニヤッとした

 なお、GalaxyのAIアシスタント「Bixby」(ビグスビー)は、端末内またはWebでの検索や、端末の操作、リマインダーの設定などには使えるが、このような質問には対応していない。「今夜の」という部分だけを切り取って「何時に設定しますか」と質問されてしまった。

 今回は文字起こしに関連したものと、自然言語での質問に対してどのように回答されるのかといった2点に絞って比べたのだが、どれにも一長一短があるものだなぁというのが、今回の検証で得た感想だ。

 それぞれの性質を理解しつつ、使いこなす日が来る……とは到底考えられないので、マルチに使えるものができてくれないかなぁという思いが強まったのであった。