英語のPodcastが聞き取れないので、英語音声書き起こしサービスを利用して書き起こし→日本語訳する

タイトルの通りなのですが、TOEICがたったの785点しかないので英語のPodcastが十分に聞き取れません。

ここで思ったのが

  1. Podcastの音声を、自動音声書き起こしサービスに投げる
  2. 出力されたテキストを英和翻訳
  3. 日本語訳の完成

にすればいいんじゃない?と。最難関は自動音声書き起こしですが、それさえクリアできれば道は見える。日本語の音声書き起こしは前チャレンジして断念したのですが、英語やったらいけるやろ!と思いました。

試験対象のPodcast

On the latest All About 365 podcast – do you need to backup Office 365? | All About Office 365

です。Office 365 というマイクロソフト社のクラウドサービスをバックアップすべきかどうか、という内容です。技術的な話。音声は45分間、イギリス英語。

英語の音声書き起こしサービス

英語でぐぐってみたところ、以下のサービスが引っかかりました。

その他、いろいろな英語書き起こしサービスが紹介されているサイトもありました。

ひとまず、最初の書いた2サイトで試してみたいと思います。

Speech to Text Demo

IBMのWatsonを利用したサービスです。というかデモサイト?音声ファイルをサイトにアップロードすると再生が始まり、リアルタイムで翻訳される。なので、音声ファイルと同じだけの時間はかかる。特徴としては話者が2人以上いた場合に、どちらがしゃべっているかを判別して書き起こしてくれること。今回のPodcastは話者が2人でしたが、ちゃんと書き分けてくれました。

欠点は、技術的な用語を意図通りに書き起こししてくれなかったこと。Office 365を英語で発音すると、Office three six fiveなのですが、これがそのまま書き起こされる。まぁこれは仕方ないですね。一応、9つまで用語を定義し、事前学習させることが出来るのですが、今回のPodcastについては効果が薄かったです。

また、10分程度音声を読み込ませたところで通信が不安定になり、翻訳が止まってしまうことがありました。これもデモサイトなので仕方ないですかね…。5分程度に区切ればうまくいきました。音声区切りのためにOnline MP3 Cutter – 曲のカットと着信音の作成というサイトを使いました。今は何でもオンラインで出来るので便利。

Automatically Transcribe Your MP3 Audio to Text Online Vocalmatic

海外でかなりお勧めされていたサイト。ファイルをアップロードするとサービス側でテキスト書き起こしをして、終わったらメールで結果を知らせてくれる。どういう仕組みかは分かりませんが、音声ファイルの実時間よりも早いし、書き起こしも正確。Office 365 という音声も、しっかり”Office 365″と書き起こされている。裏で人間ががんばってるのか…?

早い!めちゃくちゃ性能いい!…のですが。料金が高い。無料で使えるのは30分だけで、その後は30分9$(1,000円)から。こりゃ仕事で使うもので、趣味には高すぎます。

動画サービスの音声書き起こし

さて、英語の音声書き起こしサービスを探してて思ったのがそもそもyoutubeとかMicrosoft Streamで音声書き起こしできるんじゃね?ということに気づきました。これらは動画サービスなのでmp3は利用できませんが、動画編集ソフトで静止画+音声を編集し、mp4など作ればOKです。

youtube

言わずと知れたyoutube。15分以上の動画をアップロードするのにSMS認証が必要なのでそれを済ませてアップロード。しばらくすると自動翻訳された字幕がつきます。翻訳精度はなかなか…なのですが、いかんせん出力形式がstrという音声字幕形式なので、文の途中で改行が入る形式となります。

改行を消すとこのザマ。

Google翻訳にぶん投げればある程度解析してくれるのですが、ぱっと見は見づらい…です。

Microsoft Stream

Offic 365 を利用している人なら、Microsoft Streamというのが使えます。これも最近、自動字幕作成機能が有効になったので、youtubeと同じように使えます。…まぁyoutubeに比べた時のメリットはSMS認証が不要なことくらいでしょうか。youtubeと同じく字幕テキスト形式で出るし、youtubeに比べて翻訳精度がいい、という事はありませんでした。

まとめ

こんな感じかな、と。

ツール ソース 音声認識AI 話者区別 出力形式 価格 その他制約
Speech to Text 〇音声 IBM 〇対応 〇txt形式(話者単位) 〇無料 5分程度に区切って処理
Vocalmatic 〇音声 独自 ×非対応 △txt形式(時系列単位) ×有料(30分1000円)
youtube ×動画 Google ×非対応 △str形式 〇無料
Microsoft Stream ×動画 Microsoft ×非対応 △vtt形式 ×有料(月額500円程度)

Speech to Text最強な気がしました。特に今回、複数話者のpodcastだったので、話者区別機能が非常に使えました。

ちなみに”Office three six five”と話者が発声した時の書き起こし結果はこちら。Office three six fiveは”Office 365″という固有製品なので、Office 365と書き起こしてほしい。

ツール Office three six five
Speech to Text Office three six five
Vocalmatic Office 365
youtube Office 365
Microsoft Stream Office three six five

Microsoft Streamさん、自社製品なんだから頑張ってください。

豪雪時の都市部チェーン規制についてパブコメ送りました

こんな話題がありまして。

大雪時のチェーン義務化、国交省(共同通信) – Yahoo!ニュース

スタッドレスでぶいぶい言わせてる僕としては「スタッドレスで十分!チェーン不要!」と脊髄反射し、他の雪山ユーザーも同様の意見でした。そして以下の通り、国の方でパブリックコメントを募集しているようなので「スタッドレス車は通行可にせよ!」という意見を出そうと思いました。

報道発表資料:チェーン規制等に関する改正案のパブリックコメントを開始します~「道路標識、区画線及び道路標示に関する命令の一部を改正する命令案」について~ – 国土交通省

が、国に言う以上はちゃんと考えて意見したいな~と思った結果、以下のようになりました。

本規制の目的を考える

国のリリースから引っ張ってきました↓

1.改正の背景
・ 大雪時における道路交通の確保を図ることを目的として、本年11月1日に国土交通省で開催された第4回冬期道路交通確保対策検討委員会で、大雪時の道路交通の確保のためにいわゆるチェーン規制を実施すべき旨が示されたことを踏まえ、道路標識、区画線及び道路標示に関する命令(昭和35年総理府令・建設省令第3号)の改正を行うことを予定しております。

大雪時の道路交通の確保のためにいわゆるチェーン規制を実施すべきとありますし、各種報道にもある通り、昨年の大雪時の都市部国道での立ち往生事件の再発防止として考案された規制です。

昨年の事件を再発させないために何らかの規制を行うのは賛成です。緊急車両の通行を妨げるのはよくないし、雪が落ち着いて物流を復旧させようと思っても、路肩に落ちて動けない車があれば復旧が遅れるからです。

ただ、規制によってスタッドレスユーザーの自分が影響を受けたくない、という一心で、以下考えてみました。

対象のタイヤ種別

登坂力

ユーザーが一番かみついているのは”チェーンOK、スタッドレスタイヤNG”ということです。なるほど、確かにチェーンの方がスタッドレスタイヤよりも登坂力が高く、スタックしにくいかもしれません。しかしながら、大部分の一般ユーザーはチェーン未保有、スタッドレスタイヤであり、スタッドレスタイヤなら雪道だろうがゲレンデの坂だろうが、特に問題なく登れることを経験上知っています。実際、JAFのテストは以下の通りです。

JAF|交通安全とエコ|JAFユーザーテスト|雪道での登坂テスト

…まぁ二駆スタッドレスでは厳しいゲレンデもありますが、ひとまず街中レベルの坂なら”〇問題ない”と扱います。

見分け

遠目から見て、スタッドレスタイヤとノーマルは区別がつきません。よって、高速道路の入り口のようなチェックをしなければ、ノーマルタイヤユーザーが”ばれないだろう”とスタッドレスタイヤのふりをして規制を突破する可能性があります。

タイヤ種別まとめ

以下となりました。

種別 見分け 雪道の登坂力
チェーン チェーン ◎問題ない
スタッドレスタイヤ タイヤ 〇問題ない
ノーマルタイヤ タイヤ ×問題あり

ということは。解決策として、スタッドレスタイヤとノーマルタイヤを見分けることが出来るようになれば、問題が解消する事が分かります。ぱっと思いつく案として…

  • 1.国の認定のスタッドレスタイヤは、スタッドレスを分かる目印をつけることを許可する。そのタイヤを着用していれば、チェーンと同等扱いとする
    • タイヤメーカーとの協力が必要だが、利権が生まれるので意外と仕組みづくりが進むかも?
    • ノーマルタイヤで再現できては意味がないが、その場合はタイヤメーカーを処罰すればよい
    • 自力で目印を生成するようなユーザーはいないだろう、と予測
  • 2.運転手に対してスタッドレスタイヤ着用の認定証を国が発行できるようにする。
    • 認定証を発行するまでの仕組みづくりが大変そう
    • 外観で分からない、というデメリットがないため、ズルをする運転手はいそう

くらいでしょうか。2については、急ピッチで進められたドローン認定でも1年程度なので、結構時間かかりそうですね。1について、統一した印を作って生産までこぎつけるには時間がかかりそうですが、認定スタッドレスのタイヤ型番さえ決めてしまえば、ひとまず機能はしそう(自転車の職質みたく、いったん警察官につかまるというステップが必要になるが)です。

ただ、どちらにしてもコストがかかるため、スタッドレス解禁は次のステップであり、ひとまずはチェーンのみで規制が始まるのは仕方ないかな…と思います。

対象範囲の道路

ゲレンデへの道や、長野県北部などそもそもの豪雪地帯の道路は規制不要でしょ、と思います。理由として

  • ほぼ全ての車がスタッドレス以上の装備を着用している = スタックする車が少ないから
  • スタッドレスで登れないような坂でスタックしている車がいたとしても、市民生活に影響がない道路だから

からです。スタックを0にするならこれらの道路もチェーン規制の対象とすべきですが、実際にスタックの数は少なく、ゲレンデへの登り道でスタックしている車があっても日本国的にはな~んも不利益ないので介入しなくてよいと思われます。

逆に規制対象の道は

  • ノーマルの車がうようよしている = スタックする車が多いから
  • スタックしている車がある場合、市民生活に影響が出る道路だから

ような道にすべきです。市民生活に影響が出る道路かの判断は国交省に任せるとして、スタックしている車の多い少ないはJAFなど民間事業者に聞けば実績が提示されると思います。あるいは”該当都市の車の数とスタッドレスタイヤの売れ行き”とかでもいいですね。

まとめ

上記のロジックで規制対象の道路を選別してもらえれば、雪国のゲレンデに行くのにチェーンを着用する必要がある、という事態は免れそうです。1つ懸念として、東京都内の道路も規制対象になる、出発の日に東京に雪が降っていて規制が発動している、というシチュエーションがありますが、まぁレアケースかな、というのと、規制対象は国道なので、裏道使って高速の入り口までたどり着ければなんとかなる…(←危険思想

ともかく、大雪で物流が止まるのは国として不利益だと思いますが、納得感のある規制をお願いします。