iPhoneよりも進んでいるって本当！？Androidスマホの超絶AIテクノロジー

2024.08.28

物価高や円安、過度な値引きに対する規制などもあり、スマホの価格が高騰しています。もはや「手軽には買い換えられない」ということなのでしょう。内閣府の消費動向調査によれば、スマホの使用年数は年々伸びており、今や平均で4年以上。買い換えのサイクルが長くなっているだけでなく、市場では最先端のハイエンドモデルよりも、より手頃な価格の製品に人気が集まっています。

コンピュータの頭脳とも言えるチップセットや、データを保管するストレージ、ディスプレイやカメラ、バッテリーなど、スマホを構成する様々な技術が成熟し、ハイエンドモデルでなければできないことが少なくなっているのも、その理由のひとつと言えるかもしれません。

では、スマホの進化は止まってしまったのかというと、決してそんなことはありません。特に最近、各メーカーのハイエンドモデルが注力しているのが「AI」です。

たとえばGoogleは自社製のスマホ「Google Pixel」シリーズに、独自に開発したチップセットの「Tensor」を採用。このチップセットではAIの活用に必要不可欠な、機械学習のための高速処理が可能で、以下に紹介するような様々なAI機能がスマホで利用できるようになっています。以前はこうした機能の多くはクラウドサービスにアクセスしないと利用できず、そのためにタイムラグが発生して、結果が得られるまで待たされることがよくありました。今はこれらの機能の多くがオンデバイス、つまりスマホの中で処理されるようになってきています。オンデバイスのAIはネットワークを経由しない分だけ、処理結果を得るまでにかかる時間が短く、スピーディーなのが特徴です。

「スマホ」に役立つ関連記事 スマホでビジネスを効率化！今すぐ使いたい仕事がはかどる便利アプリ10選

Google PixelなどのAndroidスマホで利用できるAI機能の例

超解像ズーム

Google Pixelシリーズのハイエンドモデル「Google Pixel 8 Pro」は、チップセットに最新の「Tensor G3」を搭載するほか、光学5倍ズームが可能なカメラを搭載しています。さらにAIを用いて、最大30倍の「超解像ズーム」が可能になっています。一般にデジタルズームは、画像の一部分を切り取って引き延ばしているので、ズーム倍率が高くなればなるほど、つまり引き延ばせば引き延ばすほどほど解像度が低下し、粗い画質の写真になってしまいます。「超解像ズーム」では、解像度の低下をAIが補うことで、画質の劣化を抑えた写真撮影が可能です。なお、この機能は前モデルの「Google Pixel 7 Pro」にも搭載されています。

ボケ補正

撮った写真をあとからよく見てみたら、ピンぼけの残念な写真になっていたということはよくあること。「ボケ補正」はこのピンぼけ写真を、AIを用いてあとから修正できる機能です。AIが写真を解析してディテールを再構築してくれるので、残念な写真がベストショットに生まれ変わります。

消しゴムマジック

CMでも大きくアピールされていた機能で、背景に意図せず映りこんだ人やモノを選択して、消すことができます。そこにあったものを消すだけでなく、同時にあったはずの背景もAIが生成しています。生成がうまくいけば、消したものが最初からそこになかったかのように、自然な仕上がりの写真になります。同様の機能はGoogle Pixel以外のAndroidスマホでも、標準の写真編集アプリの機能のひとつとして、徐々に採用されています。

▲消しゴムマジック使用前。

▲消しゴムマジック使用後。

編集マジック

AIが被写体を自動認識して切り抜き、拡大、縮小や移動、明るさや背景の変更などが自由にできる機能です。消しゴムマジックと同様に、被写体を縮小したり、動かした際に空いたスペースの背景を生成して補うしくみ。編集で写真の画角を変更する際、これまでは小さく切り取ることしかできませんでしたが、生成AIを使えば拡大することも可能。足りない背景も作り出すことができます。

Google Pixelではこのほかにも、集合写真を撮ったときに、AIが自動的に前後複数の写真を組み合わせて、全員がベストな表情の集合写真に仕上げてくれる「ベストテイク」や、ビデオ撮影した際の音声データからノイズを検出して、自動的に聞き取りやすいように加工してくれる「音声消しゴムマジック」などの機能が利用できます。

なお、「ボケ補正」「消しゴムマジック」「編集マジック」は当初、Google Pixelシリーズ向けに提供されていたAI機能でしたが、現在はクラウドで写真を管理できる「Googleフォト」の編集機能のひとつとして、他のAndroidスマホやiPhoneでも、利用できるようになっています。

音声のリアルタイム通訳

AIを用いた通訳機能も提供されています。たとえば音声アシスタントの「Google アシスタント」に「OK Google、英語を通訳して」のように話しかければ、「通訳モード」が起動。日本語と英語のように異なる言語で話せば、互いに翻訳した内容をテキストで表示すると同時に、音声でも読み上げてくれます。

さらに折りたたみスマホの「Google Pixel Fold」では、前後の画面を使った「デュアル通訳モード」が利用可能。内側のディスプレイに?自分用、外側のディスプレイに相手用の翻訳内容を表示できるので、それぞれの画面を見ながらよりスムーズに会話ができます。

▲折りたたみ式のスマホ「GooglePixelFold」。内側のディスプレイで自分用に日本語を表示。

▲外側のディスプレイで相手用に翻訳を表示できる。

電話のリアルタイム通訳や迷惑防止

最新の「Galaxy S24」シリーズや「Zenfone 11 Ultra」など、一部のAndroidスマホには、電話をかけた相手との会話を、同時通訳してくれる機能も搭載されています。話した内容を自動的に文字起こしして、設定した言語に翻訳し、さらに音声で読み上げてくれるというもの。オンデバイスで処理されるので、文字起こしから音声読み上げまでが速く、まるで通訳者に逐次通訳してもらっているかのようなスピード感で利用できます。海外のホテルやレストランを予約する際などに活用できそうです。

▲「Zenfone 11 Ultra」では電話をかけた相手との会話を、同時通訳してくれる。

通話を自動的に文字起こしできる機能を活用して、迷惑電話防止などの機能も提供されています。Google Pixelシリーズでは、音声アシスタントのGoogle アシスタントが代わりに電話へ応対し、相手が話した内容を文字起こしして、表示してくれる機能を提供。発信者番号をもとに企業名を?特定したり、迷惑電話を識別したりすることもできます。

シャープの「AQUOS R9」などでも同様に、通話を文字起こしして、それを詐欺電話の音声データベースと照合し、詐欺の可能性がある通話に対して、警告を発する機能を提供しています。

▲「AQUOS R9」では詐欺電話の音声データベースと照合し警告を発する。

テキストや写真の翻訳

チャットでも、入力した日本語を自動的に指定した言語に変換して送信したり、相手の言語で書かれたメッセージを日本語に自動翻訳して表示することができます。標準の「メッセージ」アプリだけでなく、LINEなどでも同様に自動翻訳によるメッセージのやり取りが可能。世界中の人達と会話を楽しむことができます。

このほか「カメラ」でも、「Google レンズ」というAIによる画像解析ができる機能を用いて、外国語で書かれた看板やメニューなどの文字を翻訳することができます。これはカメラをかざすだけで、すぐに翻訳結果が見られる仕組みになっています。なお、この「Google レンズ」では翻訳以外にも、画像解析機能を用いて、カメラが捉えた文字をキーワードにして検索する、カメラが捉えた商品と同じものを検索する、カメラが捉えた花の名前を調べるといったことができます。

▲「Google レンズ」の画像解析機能。カメラが捉えた花の名前を調べることができる。

囲って検索

「Google レンズ」は画像解析によって、カメラで捉えたものが何かを判断し、それを検索することができます。最近、この機能からさらに進化した「囲って検索」という新しい検索方法も利用できるようになりました。これは画面の一部分を指でマークすると、マークしたところにある情報から検索ができるというものです。たとえばSNSで有名人が身につけていたファッションを囲って、同じものを検索したり、わからない言葉を囲って調べたりすることができます。この「囲って検索」は最新の「Google Pixel」シリーズのほか、サムスンの最新スマホ「Galaxy S24」シリーズなどでも利用できます。

レコーダーの文字起こし

音声を解析して自動的にテキスト化する機能は、スマホで利用できる、代表的なAI機能のひとつです。LINEが提供する「CLOVA Note」をはじめ、クラウドAIを利用して、録音した音声から自動的に文字起こしができるサービスはたくさんあり、スマホのアプリケーションとしても提供されています。

最新の「Google Pixel」シリーズや「Galaxy S24」シリーズでは、この文字起こしを、クラウドAIを使用せずにスマホ内で処理しています。スマホ内での処理なので、文字起こしのスピードが速く、たとえば「Google Pixel」シリーズ標準のレコーダーアプリでは、あらかじめ指定した言語の文字起こしが、音声の録音と同時にリアルタイムで行われます。

▲「Gemini」でレコーダーから自動文字起こしした内容を要約できる。

録音内容の要約

最新の「Google Pixel 8 Pro」ではさらに、Googleが開発した生成AIの「Gemini」が利用できるようになりました。この「Gemini」を使って、レコーダーから自動文字起こしをした内容を、要約することができます。この機能はまだ英語のみの対応ですが、音声の自動文字起こしから要約までできるようになれば、会議の議事録からレポートを作成したり、インタビュー原稿をまとめるのにも大変役立ちます。

「Galaxy S24」シリーズなど、他メーカーのAndroidスマホの中にも、ボイスレコーダーアプリで文字起こしができるものが増えています。さらにそれを要約したり、翻訳できる機能を提供しているものもあります。

▲「Zenfone11Ultraのレコーダー通訳機能

iPhoneでも2025年以降には、AIの利用が可能になる

iPhoneにも音声AIアシスタントのSiriなど、AIを用いた機能はあります。しかしここまでに紹介したような画像編集や、オンデバイスAIでのリアルタイムの文字起こしや翻訳、要約のような機能は、Google PixelをはじめとするAndroidスマホの方が先行していました。AI機能に関しては、iPhoneの遅れが指摘されていたのです。

そこでアップルは先日、独自のAI「Apple Intelligence」を、iPhoneを含む製品に搭載すると発表しました。またOpen AIの「Chat GPT」と連携し、Siriで使えるようにすることも明らかにしています。Google Pixelなどと同じく、音声を自動で文字起こししたり、要約することが可能。また写真から不要なオブジェクトを消去することもできます。ほかにもAIが重要な情報だけを選んで通知してくれる機能や、会話にあわせた絵文字を生成できる機能、メールを要約したり、簡単に返信できる機能、ラフスケッチからイメージを生成できる機能等々、AIを用いた多数の機能が利用できるようになります。残念ながら当初は英語のみの対応で、日本語でこれらの機能を使えるようになるのは2025年以降になりそうですが、いよいよiPhoneでもAI機能が強化されます。

今はディスプレイのきれいさやカメラの性能、バッテリー持ちなど、ハードウェアのスペックがスマホを選ぶ際のポイントになっていますが、これからはどんなAI機能が利用できるかで、スマホを選ぶ時代になりそう。2025年以降、iPhoneの使い方がどう変わるのか気になりますが、その間にAndroidスマホのAIがさらなる進化を遂げるのかにも、注目したいところです。

取材・文／太田百合子　イラスト：D★FUNK　編集：木崎・稗田／なるモ編集部

iPhoneよりも進んでいるって本当！？Androidスマホの超絶AIテクノロジー