録音、文字起こし、翻訳もできる…変わり種の“AIイヤホン”を試す 議事録作成もお安い御用

AI技術を活用したスマートイヤホンを展開する新興メーカーのviaimが日本初上陸を果たし、5月21日より新型デバイス「viaim RecDot(ヴィエイム レックドット)」の応援販売がMakuakeにて始まりました。ここでは一足先に体験することができたので、使用感をレポートします。
viaimとは中国発のスタートアップメーカーで、ビジネス用途に適する「AIイヤホン」を展開しています。中国市場でのAI会議用イヤホン販売数No.1を記録しており、今回日本上陸したRecDotはその新型モデルとなっています。価格は一般販売で34,800円(税込)とハイエンドモデルらしい設定ですが、クラウドファンディング(Makuake)では早期購入者向けの割引プランも展開されています。
https://www.makuake.com/project/viaim/
そもそも「AIイヤホン」は何がAI?
本機の最大の特長は、通話や会議をワンタッチで録音し、その音声をリアルタイムで文字起こし・翻訳・要約まで自動で行える点。通常、イヤホンの内蔵マイクはビデオ通話などの補助的な存在ですが、本機は録音機能もフル活用できるというものです。なお、「AIイヤホン」と言っても何がAIなのか?と気になるところですが「録音した音声の文字起こし・翻訳」「ノイズ除去」「文字起こし後の処理」などがAIを活用している部分になります。
主にビジネスシーンでの用途が想定されており、会議や通話を録音し、その内容を自動でテキスト化・翻訳・要約することで、議事録作成や多言語対応の負担を大幅に軽減してくれる…などの使い道があります。
録音方法はおおまかに4種類。まず、手っ取り早く録音できるのがイヤホン単体での録音。イヤホン本体をつまむだけで録音が開始されるできというもので、録音したデータは本体(左、右)メモリーに保存されます。文字起こしを行いたい場合、公式アプリを通じてデバイスに取り込む作業が必要になるため、突然の録音のタイミングなどに適しています。

続いて、同じくらい手っ取り早く使えるのが「通話録音」。以降は公式アプリを通じて利用する機能となり、その名の通りビデオ通話やチャット、電話の際に録音、リアルタイムに文字起こしするものです。公式によれば「急な電話に」適しているといいます。
なお、肝心な文字起こしの精度ですが、体感ベースになりますが非常に高いです。ウェブミーティングやインタビュー現場で使ってみたところ、Pixelスマートフォンで利用できる録音機能と同等な印象です。また、雑音が入る状況でも、AIノイズ除去技術を搭載しているため、やや拾う音が小さい(=発声源が遠い)場合でも耐用できました。
3つつ目は公式アプリと併用する「オーディオ録音」。こちらはデバイス内の音声を直接録音し、リアルタイムで文字起こしを行うというもの。スマートフォンやPCで再生中の動画や音声をその場で文字起こし・翻訳しするだけでなく、字幕としてリアルタイム表示する機能も用意されています。

最後はイヤホンをケースに格納したままで用いる「現場録音」。こちらはイヤホンを装着していない際、多人数でのミーティングやアナウンスなどで活用できるもの。発声源のボリューム次第ではありますが、複数人の会話や車内アナウンスももちゃんと拾って正確な出力ができていました。使い方としては、イヤホンの本体を開き、公式アプリから「現場録音」を押すだけ。
ただ、ケースの蓋は開けておかないとうまく集音されないので、堂々と置いているとやや不自然なのは否めません。

音質などイヤホンとしても性能も◯ 注意点は
また、共有機能も備えており、セミナーや商談、ガイドツアーなど多人数が参加する場面でもスムーズな多言語対応が可能です。さらに、文字起こし後はテキストファイルとしてダウンロードできるだけでなく「要約」で会議の議事録を作成したり、「ToDoリスト作成」でやるべきことを洗い出してくれたりてき、効率が上がる機能も用意されています。

ちなみに、翻訳については日本語、英語、 中国語、韓国語、など15言語に対応。筆者は取材のためマレーシアにいますが、環境音が多い高速鉄道のアナウンスも問題なく文字起こしから翻訳までできました。
録音以外の機能を見てみましょう。デザイン面では、丸みを帯びたミニマルで洗練されたケースとイヤホン本体が高級感を演出。軽量で持ち運びやすく、日常使いにも適しています。また、いくら機能が豊富でも音質に難があれば元も子もないですが、使用した所感では音質はかなりクリアで、低音もしっかり響いている印象です。
もちろんノイズキャンセリング機能も搭載しており、外部の雑音をしっかりカットするほか、外音取り込みもできる。バッテリーは最大36時間の連続使用が可能で、急速充電にも対応しています。
なお、褒めるだけでなく注意点を紹介しておくと、文字起こしは無料で行える量が月ごとに決まっています。
具体的には月600分まで無料で利用でき、より多く使いたい場合は有料プラン(Pro:月1,800分、Ultra:無制限)を契約する必要があります。文字起こし処理はサービスのサーバー上で行われ、その処理も非常に負荷のかかるものであるため、買い切り型のビジネスモデルには限界があります。そのことを加味すると、仕方ないでしょう。
また、文字起こしや翻訳処理はサービスのサーバー側で行うため、セキュリティ面で心配も想定されます。公式によれば5月下旬よりSTT処理は日本国内にあるサーバーで処理するようになるとのことで、地理的な心配事は軽減されますが、オンデバイスでない以上、セキュアな情報が含まれる内容は控えておいたほうが賢明かもしれません。