こんにちは、MATTU(@sunmattu)です。
今はAI時代。
業務効率化も叫ばれますが、そのなかで近年飛躍的な進歩を遂げているのはボイスレコーダーです。
録音だけでなく、文字起こしまでできるため、議事録作成など非常に簡単にこなせます。
スマホでもPixelやGalaxyなど、AIを使ったボイスレコーダーを使うことができますが、専用のボイスレコーダーを持ち歩いておけば、スマホと別に録音することもできるため非常に便利に使えます。
そんなAIボイスレコーダーですが、iFLYTEK VOITERシリーズは、指向性マイクを2つ、その他の無指向性マイクアレイも複数台搭載し、とにかく録音の漏らしのないように設計されています。
レコーダーでの文字起こし、PCでもその後の編集がしやすいのが特徴です。
特に、iFLYTEK VOITERシリーズは、SR302 ProとSR502Jの2機種あります。
どちらを選ぶべきでしょうか?また、スマホより文字起こしの精度は高いでしょうか?
実際に使ってみましたので、検証していきます。
商品貸出:iFLYTEK

AIボイスレコーダーiFLYTEK VOITER SR302Pro / SR502J の特徴は?
ボイスレコーダーもAIを使った音声文字起こしを搭載されたものが増えてきました。
今回お借りしました「iFLYTEK VOITER」シリーズは、完全にオフラインで文字起こしができるモデルと、オンラインのAIサーバーとやり取りをして文字起こしができるモデルの2種類があります。
完全オフラインモデル「iFLYTEK VOITER SR302 Pro」

iFLYTEK VOITER SR302Proは、録音・文字起こしが完全にオフラインで出来るモデルです。

従来のボイスレコーダーと同様の見た目をしており、上部には2つの指向性マイクと、下部に4つの無指向性マイクアレイがついています。

右側面に電源ボタン、左側面に音量ボタン、表面の画面下に録音ボタン、十字キー・ボタンがついています。
端末下部にはスピーカーとUSB Type-Cが搭載されています。
画面自体もタッチ搭載で、使いやすいです。

オンラインモデル「iFLYTEK VOITER SR502J」

iFLYTEK VOITER SR502Jは、録音しながら、オンライン接続時に文字起こしも可能なモデルです。
文字起こしについては、別途Wi-Fi接続かSIMを挿入してのモバイルネットワーク接続が必要となります。

スマホのような大きな画面をタッチ操作する形態で、端末上部には2つの指向性マイクが搭載されています。
また、端末左右には、合計6つの無指向性マイクが搭載され、合計8つのマイクがしっかり録音してくれます。

サイドには、右側面に電源ボタンとSIMスロットが、左側面に録音ボタン・音量上下ボタンが搭載されています。
端末下部にはUSB Type-C端子とスピーカーが搭載されています。

2モデルの仕様の違い
2つのモデルのスペックの違いは、以下の通りです。
製品 | VOITER SR302 Pro | VOITER SR502J |
---|---|---|
大きさ | 117.5x46x15mm 99.6g | 125.0×62.26×14.8mm 166g |
画面サイズ | 2.0インチ(240×320) | 3.5インチ |
バッテリー | 2000mAh 待機時28日、録音時7時間 | 2500mAh 待機時25日、録音時20時間 |
マイク | 指向性マイクx2 無指向性マイクアレイx4 集音距離:5m | 指向性マイクx2 無指向性マイクx6 集音距離:最大10m |
ノイズキャンセル | 〇 | 〇 |
音質 | 16kHz/16bit モノラル256kbps | 音楽 48kHz/16bit 取材・会議・講演・メモ・標準 32kHz/16bit 省電力 16kHz/16bit |
カメラ | ー | 800万画素 ビデオ撮影・録画は縦向きのみ (文字起こし字幕は横書きのみ) |
ストレージ | 32GB | 16GB クラウド10GB |
通信 | ー | 4G LTE(Band 1/3/8/41) Wi-Fi (2.4GHz帯のみ) Bluetooth 5.0 |
記録形式 | オーディオ .wav テキスト .docx | オーディオ .aac / .wav ビデオ .mp4 テキスト .txt 写真 .jpg |

iFLYTEK VOITERを使って感じた違いとメリット・デメリット
2モデルの最大の違いは「オンラインか、オフラインか」SR302Proはオフラインで文字起こしができるのが最大のメリット!
iFLYTEK VOITER SR302ProとSR502Jの最大の違いは、文字起こしをオフラインで完結できるか、オンラインを使うかの違いです。

SR302Proはオフラインで完結できるため、ネットワークの接続が不要です。
オンラインを使用しないため、セキュリティーも担保できます。クライアントとの会議など、個人情報や解禁日時のある情報などを取り扱う場合には、非常に便利です。
SR502Jは、Wi-FiかLTEでオンライン通信する状態の場合のみ、文字起こしができます。
録音自体はオフラインでもできますが、文字起こしまで行いたい場合にはオンライン状態にしておく必要があります。

SR302Proは単体で文字起こしを確認することはできますが、画面が小さい分表示できる文字量が非常に少ないです。
文字起こししながら画面を見る、という用途よりは、文字起こしの処理が正常に行えているという確認に使うほうがいいかもしれません。
SR502Jのほうが画面が大きい分、文字起こし内容の確認も簡単です。

両方ともUSBでPCに保存可能。SR502Jは、クラウドへのアップロードもカンタン!
SR302Pro・SR502Jともに、USB Type-Cケーブルを使ってデータをPCなどにバックアップできます。
SR302Proではオンライン保存ができないため、USBを使ったバックアップが主なバックアップ手段となります。

SR502Jは、録音後クラウドにデータをバックアップすることも可能です。
録音終了後にオンライン状態であれば自動アップロードすることもできますし、録音データを長押しして「クラウド保存」を選択すれば手動でのアップロードも可能です。
クラウドから、音声や文字起こしのファイルをダウンロードすることも可能です。
SR302Proでは音声ファイルは.wav、文字起こしはWordファイル(.docx)で、SR502Jでは音声ファイルは.aac・.wavで、テキストファイル(.txt)で保存ができます。


VOITER SR502J・SR302Proの録音音質は?
マイクが多数ついていますが、録音音質はどうでしょうか?

VOITER SR502JとSR302Proでは、発表会・講演会のような環境ではSR502Jのほうが優れているように感じます。
両者とも環境ノイズが発生するような環境でも自動的に判断・除去してくれるノイズキャンセル機能は搭載されているのですが、SR502Jでは、周囲の物音や反響音などのノイズをより除去している印象です。
一方、かなりAIでのノイズ除去をされているSR502Jですが、ノイズ除去に合わせてボリューム調整もされているようで、発表会での録音音声を聴き比べてみると、意外と音量がスポット的に大きくなる場面が多い印象です。
記録用にとどめるのであればかなり優秀ですが、例えば動画・ポッドキャストなどで使う場合には、ちょっと聞き取りにくいかもしれません。

SR302Proでも話者の音声はちゃんと聞き取ることはでき、ノイズキャンセルはある程度されていますが、少し音声はこもり気味な気もします。
だからと言って声が明瞭でない、というわけでは全くなく、SR502Jよりは音量ボリュームは比較的一定を維持しているように感じています。

VOITER SR502J・SR302Proの文字起こしの精度は?
文字起こしの精度を比較してみると、以下の通りです。
端末上での文字起こしは、両者とも話者識別はされておらず、打ち合わせのようなシーンでは複数人の会話が入り混じっている感じです。

(SR502Jの方の選択部分は、SR302Pro(word)で表示している部分)
文字起こし自体は、精度が高いように感じます。
環境にもよりますが数人で行う会議を録音する状況などでは、かなり文字起こしの精度が高いです。
SR502Jのリアルタイム文字起こしのほうは、改行がされません。
テキストファイルで見返すと少し見にくいので、発表会など、一人がまとまった説明をするようなシーンでは、SR302Proのほうが見やすいようにも感じます。
一方、特にSR302Proでは、基本的に日本語での文字起こしではアルファベットは用いられず、カタカナが使われています。
SR502Jでも、Google・Bluetoothなど限られた単語はアルファベットにされますが、アルファベットで表記される多くの固有名詞はカタカナになっている場合が多いです。

また、外国語と同時通訳者がいるような環境では、言語を検知してどちらかのみ、ということはせずに両方を文字起こししようとします。片方は見ないようにした方がいいかもしれません。
個人的には、SR502Jのほうが固有名詞には少しだけ強みがある一方、SR302Proのほうが意外と文字変換等の精度は高い印象があります。

SR502Jなら、クラウドで話者識別も可能!
SR502Jではクラウドにアップロードした場合、クラウド上で改めて文字起こしが可能です。
クラウド上での文字起こしの場合、人数と言語を指定することで話者を識別した文字起こしができます。

話者の識別については、かなり精度が高い印象です。
他社のPLAUD AIやGalaxyのボイスレコーダーでも話者を識別した文字起こしが可能ですが、複数人の会話だと結構混じってしまう頻度は高い印象です。
VOITER SR502Jの話者識別は、複数人が入り混じってもかなり精度高く識別してくれています。文字起こし前に人数を指定するからかと思います。

逆に、発表会など、人数を指定しにくい場での文字起こしをする際は「自動検出」を選べますが、その場合は混じりやすいような気がします。

SR502Jはカメラも搭載!録画しながら音声の文字起こしも可能
SR502Jのほうは、カメラも搭載しています。
写真の撮影も可能ですし、動画を撮影しながら文字起こしも可能です。

ただし、録画は縦長のみ、文字起こしは横書きでの対応となります。
記録として残しやすいとは思いますが、画質は多くのスマートフォンのほうが勝るため、あくまでも記録用として使うといいと思います。
動画など、作品として使うなら、別カメラで動画を撮り、音声のみの録音のほうが便利でしょう。

待機時も含めたバッテリー持ちは、SR302Proのほうがいい印象

何度か取材の際にSR502J・SR302Proを両方持ち歩いて録音してみました。
持ち歩く際に非常に大事なのがバッテリー持ち。
録音時・PC取り込み時を除けば、意外とボイスレコーダーはカバンの中に眠っている機会も多いと思います。
いざ使いたい!という場面でバッテリー残量が多いのは、SR302Proのほうでした。
SR502JはAndroidベースということもあってか、多少バッテリーの減りが速い印象があります。
一度の充電で長く使いたいなら、SR302Proのほうが便利そうです。

iFLYTEK VOITER SR302Pro・SR502Jと、Galaxy・Pixel・PLAUD Noteとの違いは?
SR302Proはオフラインでの文字起こし(話者識別なし)、SR502Jはクラウドを使えば話者識別を加味した文字起こしが可能です。ボイスレコーダーとしても優秀で、非常に使い勝手がいいです。
一方、機能面としては、要約・翻訳は両者とも搭載されていません。
要約をうまく使いたい方は、PLAUD Noteシリーズ、翻訳まで含めてトータルで使いたい方はGalaxyスマートフォンの文字起こしアシストを使うとよさそうです。
Galaxyスマートフォンの文字起こしアシスト

Galaxy Z Fold6では、文字起こしはマイクの音声の明瞭さに大きく左右されやすいですが、要約・翻訳は意外と精度が高めです。
話者3が英語、話者2が日本語で、話者2のみを読めば意味はつながりますが、そこそこの誤爆はあります。

Galaxyスマートフォンの文字起こしは、「通訳」アプリのリスニングモードのみリアルタイムで文字起こし可能です。
通常のボイスレコーダー・Samsung Notesでは、録音中のリアルタイム文字起こしはできません。

PLAUD Note

PLAUD NoteのPC版(Webアプリ版)のキャプチャも出していますが、PLAUD Noteは日本語通訳を抽出して文字起こしをしています。
要約もかなり的を射ている傾向があります。ただし、翻訳まではしてくれません。
また、PLAUD Noteは、録音中のリアルタイム文字起こしには対応していない点には注意です。

Google Pixelのレコーダーアプリ
「スマホで文字起こし」の代表選手は、Google Pixelでしょう。

Google Pixelも、英語パートは抜いて日本語パートのみ書き起こしています。
こちらもかなり精度は高いです。
Galaxyでもいえることですが、スマートフォンでの録音の場合、電話着信や動画を録画したい場合にはレコーダーが止まってしまうという欠点があります。
抜け・もれなくすべてを録音したい場合は、レコーダーがあったほうがいいです。
なお、Googleのレコーダーアプリは、リアルタイム文字起こしには対応していますが、要約・翻訳には対応していません。
また、他のデバイスで録音した音声を読み込んで文字起こしすることはできません。
(Galaxyスマートフォンのボイスレコーダー、PLAUD AI、VOITER SR502Jのクラウド保存ツールについては、他デバイスの読み込み可能)

しっかりと聴き取りやすい音声で、しっかり文字起こし!

今回は、iFLYTEK VOITER SR302Pro・SR502Jをレビューしました。
2者の最大の違いはオフラインで完結するか(SR302Pro)、オンラインでクラウドを含めて使えるか(SR502J)という点だと思います。
ただ、録音音質や文字起こしのデータ形式、見え方でも結構変わるような印象があります。
記録用に、文字起こしベースで使うなら便利かもしれません。
その後の要約まで見据えるのであれば、PLAUD Noteのほうが勝りますが、録音音質はやはりちゃんとした高性能マイクが搭載されているVOITERシリーズのほうがいいです。
文字起こしまでの利用がメインであれば、VOITERのほうがいいかもしれません。
自分がもし買うとしたら…SR502Jのほうにしそうです。
話者識別、ノイズキャンセル機能の聞きやすさは非常に便利だと感じました。
ぜひ、ボイスレコーダーを検討中の方は、参考にしてみてくださいね!


コメント