スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

続・情報保障の未来

機械による音声認識は難しい。私が知る限り、およそ次のようなハードルがある。

  1. 音波を「人間の声」として認識する。
    audio-wave-vector.jpg

    こういうのを、
    「キシャノキシャガキシャデ…」と認識できなくてはならない。

  2. 「人間の声」を、日本語として適切に表記する。
    「キシャノキシャガキシャデ…」を、「貴社の記者が汽車で…」と表記できなくてはならない。

  3. 雑多な背景音の中から、目的の音声をより分ける。
    込んでいるマクドナルドの店内で、聞こえてくる雑多な音声の中から、目の前の店員の
    「ハンバーガーとポテト、nnn円です」
    という声だけをより分けて認識できなくてはならない。

  4. 話し言葉を、ある程度整えて文字化する。
    話し言葉は、しばしば「てにをは」が微妙に狂っていたり、能動態と受動態が混乱していたりする。それでも普通、音声で聞くならば、話の流れ、発語の勢いといったものに助けられて、何となく話し手の意図は理解できるものである。
    しかし、これをそのまま忠実に文字化して、字幕を目で追うならば、とても読めたモノではない…ということになりがちである。話の流れ、発語の勢いなどの「メタ情報」が、字幕からは一切そぎ落とされてしまうからだ。
    ゆえに、ある程度「書き言葉」に近づけるような操作(これを整文という)が必要になってくる。


数年前、音声認識のデモンストレーションを見たことがあるが、事前に「単語辞書」のようなものを十分に仕込んでおいて【2.の対策】、静かな部屋で【3.の対策】、マイクに向かってはっきりと明瞭な発音で話して【1.の対策】、どうにか「結構ちゃんと認識するじゃん」というレベルだった。
(今はどのくらい進化しているか、最新状況は私には分からない)

ここで、1.2.3.と、4.とは、難しさの質が全く違うことにお気づきであろうか。
すなわち、前者(1.2.3.)は、機械にとって難しいとはいえ、頑張れば何とか正解にたどり着く可能性がある。現に、数年前に私が見たデモンストレーションでも、結構いい線いっていた。しかし、後者(4.)は、そもそも何が正解であるかが曖昧だ。整文するといっても、人によって、全く違う文章になりかねず、人間にとっても難しいのである。いわんや機械をや。

そう考えると、先日の記事(情報保障の未来)で書いたように、機械による音声認識がパソコン要約筆記に取って代わる…ということは無く、機械と人間の共同作業がベストになるかもしれない。機械が1.2.3.までを分担し、その結果に対して、訓練を受けた人間が迅速に、適切に4.を施すことで、読みやすい字幕を提供する、というスタイルだ。

パソコン要約筆記奉仕員チームで、今度、4.をテーマとした研修を行うべく、現在準備中です。具体的には、「えーっと」等の冗長な語句や、言葉の繰り返し、てにをはが微妙に狂っている、等々、そのまま文字化したのではグダグダ字幕になってしまうような話をネタとして流して、連携入力を行い、最終的に、整文された読みやすい字幕になっているかどうか、という観点で検証する予定です。
スポンサーサイト

字幕どうしよう

アニメ作品「宇宙戦艦ヤマト2199」のDVDに日本語字幕が無いことから、ここはひとつオレが作るか…と張り切っていたのですが、今年4月から開始したTV放映には字幕がついていたのでした。
私はテレビを見ないので、迂闊にも今まで気づかなかった。

「テレビ放送の録画ではなく、DVD、Blu-rayを手元に揃えて好きなときに鑑賞したい」
という人もいるだろうし、その中には聴覚障害者もいるかもしれない。だからDVDの字幕作成には意味が無いとはいえないが、テレビの録画という手段をとれば、簡単に後からでも字幕付きで楽しめることを考えると、ここで多大な労力を費やすのが割に合わなく感じれられる。
(ちなみに現在、第一話の内容をすべて聞き取って文字に起こしたという段階で、これからいよいよ、IPtalkのスライドエディタの機能によって同期字幕化にとりかかろうか、と思っていたところ)

それに、映像作品に字幕をつける際の著作権の問題は、過去の事例を調べてみると、そう簡単には片付かないらしく、これはある程度の出費覚悟で弁護士に相談しなくてはならないだろうか?パソコン要約筆記奉仕員で3年間活動して貯まったお金(n十万円)で足りるかな…とも考えていたところでした。

どうしようか。
代わりにIPtalkのスライドエディタ講座でもやりましょうか?

情報保障の未来

数年前のこと、一時期、機械による音声認識を研究している人とつながりがあった。
私は直接聞いていないが、あるとき、その人がこう言ったらしい。
「音声認識を研究している自分は、みなさん(パソコン要約筆記者)にとって商売敵ではないですか?」

なるほど、
「私はパソコン要約筆記の収入で家族を支えている、一家の大黒柱だ!」
という人にとっては、音声認識技術は商売敵とも言えるだろう。しかし、おそらくそんな人はどこにもいないと思う(そんな収入を得るのはまず無理)。

もし、機械が発達して、いつでも音声が文字化できるようになれば、その方がいいに決まっている。現状の、人間が必死になってキーボードを叩くという原始的、かつ、入力者の技量に依存する不安定な方法にくらべれば。

コンピューターが普及した現在でも、算盤(すなわち人力のデジタル計算機)が細々と生き残っているように、機械による音声認識が普及した将来でも、パソコン要約筆記(すなわち人力の音声認識)は、「言語能力を鍛えるのに最適」といった理由で、少数者によって受け継がれていくような気がする。そうあって欲しい。

同期する字幕Mac対応方法

先日の記事(同期する字幕)では、Windows用の簡単な字幕サンプルを提示した。
何とかしてMacintoshでも同様のことがしたい、と思い、調べたところ、QuickTimeのテキストトラックという形式で同期字幕を記述できるとわかった。

WindowsのSAMI形式を、テキストトラックに変換するツールがあればいいのだが、どうも見当たらなかった。日本語以外に目を向ければ、世界の誰かが作っているのをWebで発見できるかもしれないが、そこまでして探すよりも自分で作った方が速そうだ。

実はこの手のコンバート用ツールを作るのは、私は結構得意で、仕事でも、膨大なログファイルの書式を見やすく変換するツールなどをよく作る。主にawkスクリプトを使うが、今回のSAMI→テキストトラック変換に関しては、作成した変換ツールを、後で公開して、誰でも簡単に使えるようにしたい。
そう考えると、awkではなくVBscriptで作れば、Windowsユーザーなら誰でも使えるのでよかろう。

宇宙戦艦ヤマト2199、字幕作成までの道のりはまだ遠い。

同期する字幕

先日の記事(ヤマト2199 字幕つくります)では、字幕だけが出てくる動画を作成するプランを考えました。
この方式だと、映画鑑賞者が、字幕動画を「ポチッと」スタートするタイミングがずれてしまうと、それ以降、映画と字幕がズレを保ったまま進んでしまい、鑑賞者はストレスが溜まってしまうでしょう。

そうではなく、何とかして、微妙なタイミングで「ポチッと」やらなくても、普通に映画を見れば、きちんと台詞と同期した字幕がでるようにしたい、と思っていたところ、何とかできそうだと分かりました。
(ただしWindowsのみ。Macintoshではよくわからない。詳しい方がいらしたら何とか教えていただきたい)
興味を持たれた方は、以下の手順をトライしてみてください。

  1. 動画の準備

    「無料映像素材 フリー素材館」のサイトから、「誕生日の歌」をダウンロードする。
     http://www.namaewallpaper.com/movie/01ms/bin/01bs.html
     (1920×1080 wmv素材のダウンロード  の方をダウンロードしてください)
     おなじみの、「Happy birthday to you」の歌。映像がとても幻想的で、思わず見入ってしまう動画です。

  2. Windows Media player の設定
    (バージョンによっては若干違うかもしれませんが、適当に似たような項目を見つけて頑張ってください)

    右クリック→その他のオプション(O)
    画面1

    「セキュリティ」タブの、「ローカルキャプションがある場合は表示する(C)」をチェック
    画面2

    右クリック→歌詞、キャプション、および字幕(B)の、「利用できる場合はオン(N)」を選択
    画面3

  3. 字幕ファイルの準備

    以下の内容をコピーして、メモ帳に貼りつける。
    ----- ココカラ -----

    <SAMI>
    <Head>
    <STYLE TYPE="text/css">
    <!--
    P {
    margin-left: 10%;
    margin-right: 0pt;
    margin-top: 0pt;
    margin-bottom: 0pt;
    text-align: left;
    font-size: 18pt;
    font-family: MS Pゴシック;
    font-weight: normal;
    color: white;
    background-color: black;
    }

    .JPCC {
    Name: Japanese;
    lang: ja-JP;
    }
    -->
    </Style>
    </Head>

    <Body>
    <SYNC Start= 0000><P Class=JPCC > </P>
    <SYNC Start= 7440><P Class=JPCC >うれしいな 今日は</P>
    <SYNC Start=11895><P Class=JPCC >たのしいな 今日は</P>
    <SYNC Start=16580><P Class=JPCC >誕生日 おめでとう</P>
    <SYNC Start=21225><P Class=JPCC >お歌を歌いましょう</P>
    <SYNC Start=25735><P Class=JPCC >Happy birthday to you</P>
    <SYNC Start=30205><P Class=JPCC > </P>
    <SYNC Start=30305><P Class=JPCC >Happy birthday to you</P>
    <SYNC Start=34905><P Class=JPCC > </P>
    <SYNC Start=34955><P Class=JPCC >Happy birthday dear なんとかちゃん</P>
    <SYNC Start=42000><P Class=JPCC > </P>
    <SYNC Start=42285><P Class=JPCC >Happy birthday to you</P>
    <SYNC Start=47385><P Class=JPCC > </P>
    </Body>
    </SAMI>
    <!-- 終わり -->

    ----- ココマデ -----
    貼りつけたら、
     ・動画ファイル 01bs.wmv を格納したフォルダに、
     ・01bs.smi という名前で
    保存して下さい。
    (01bs.smi.txt という名前にならないように注意すべし!)


これで、動画ファイル 01bs.wmv をWindows Media Player で開いて見て下さい!
もし、字幕が出ないようなら、一度 Windows Media Player を閉じて、再度開いて下さい。

この字幕ファイルは、IPtalkの「スライドエディタ」で艱難辛苦の末に作成し、若干手直ししたものです。
そのうち、「スライドエディタによる字幕作成講座」をこのブログ上でやるかもしれません。

ヤマト2199 字幕つくります

アニメ「宇宙戦艦ヤマト」が、現在リメイクされている(宇宙戦艦ヤマト2199)。
テレビ放映は毎週日曜日、今年4月から始まったのだが、すでに話は昨年から先行して作られており、昨年4月以降、断続的に、先行上映と称して数話ずつまとめて映画館で上映していた。その都度、上映した分(1話=約30分弱を2~4話分ずつ)を1枚のディスクにまとめたDVD、Blu-rayも発売されている。
現時点で出ているのは4巻まで。(内容は、4巻全部あわせると第1話~第14話まで収められている)

このDVDには字幕がなく、Blu-rayには英語字幕があっても日本語字幕がない。
そこで、「日本語字幕を作ろう」と思い立ちました。

そうは言っても、発売されているディスクに字幕を追加することはできないので、真っ黒な背景に字幕のみが現れては消える動画を作成します。こんな感じ。



閲覧者は、購入したディスクを再生するのと同時に、タイミングを合わせて字幕動画をパソコンで表示させることによって、字幕付きでヤマト2199を鑑賞できる、という寸法です。

これにはいくつかのハードルがある。
  • 著作権者の了解が得られるか
    (作成した字幕動画は無償で一般に公開するという条件)

  • どのツールを使用すれば最も効率よく作業ができるか
    (上記サンプルは、Windows Movie Maker で作成し、フリーの変換ツールでmpeg1に変換したが、今後、大量の字幕を作成するにあたって、作業効率を考えれば有償の動画編集ソフトが必要になるかもしれない)

  • ヤマト2199の全話にわたって、私の根気が続くか
    (全26話、DVD、Blu-rayは7巻までの予定)

著作権者への確認はこれから行います。ヤマトが好きなのに、日本語字幕がないことによって購入を諦めていた聴覚障害者が、この字幕動画によってDVD、Blu-rayの購入に踏み切れば、それは売り上げ増につながるのだから、誰にとっても悪い話ではない筈です。

早速、DVD(字幕一切なし)の1巻を買ってきたのですが、一部、台詞の内容がよくわからない部分があるため、Blu-ray(英語字幕あり)を買い直して、英語字幕によって確認する必要が出てきました。2巻以降は、始めからBlu-rayを購入した方がよさそうです。
プロフィール
カテゴリ
全記事表示リンク

全ての記事を表示する

最新記事
最新コメント
最新トラックバック
月別アーカイブ
RSSリンクの表示
リンク
QRコード
QR
カウンター
にほんブログ村 その他生活ブログ 献血・ドナーカードへ
にほんブログ村
にほんブログ村 その他生活ブログ ボランティアへ
にほんブログ村
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。