YOUTUBE動画の字幕をダウンロードするCGI

URL/ID
HTMLSRTTXTXML   ()  

 YouTube動画の字幕(CC)データをGoogleサーバからダウンロードするCGIです。
 自動生成の字幕には対応していませんので、注意してください。

【使い方】
1.YouTubeの字幕(CC)付き動画のページURLかID(11字)をフォームに入力。
2.出力ファイル形式を、HTML、SRT、TXT、XML、の中から選択。
 HTML:字幕の不要な改行を無視してつなげています(文末判定は不完全です)
 SRT:動画ファイル用の一般的な字幕ファイル形式です
 TXT:編集していない字幕文字列です(表示するエディタはその言語に対応している必要があります)
 XML:元ソースです
3.字幕の言語をプルダウンメニューから選択。または、言語コード(Errorページに示される使用可能言語リストの左端の文字列)を括弧内の空欄に入力。
4.「ダウンロード」ボタンを押す。
5.出てきたダイアログボックスでファイルを開くか保存するか等を選択。

※外部サイト(検索サイトのキャッシュなど)からは動作しません。

追記(2014/04/25):
 google側の仕様変更によるものではないと思うのですが、srt選択時、一回表示分の字幕で元データのxml上に改行が2ヶ所以上ある字幕において文字列が欠けるバグが出ていたので、直しました。日本語や中国語、韓国語など2バイト文字の字幕で発生しやすかったようです。

追記2(2015/11/24):
 1時間以上の動画で出ていたSRTタイムスタンプのバグを修正しました。

追記3(2015/12/06):
 短縮URL(https://youtu.be/~)に対応しました。

追記4(2016/03/02):
 HTML出力で、元データの行末に句点等がある場合に改行するようにしました(一部言語のみ)。

追記5(2020/05/14):
 TXT形式を追加しました。

| コメント(10) | トラックバック(1) |  

トラックバック(1)

トラックバックURL: http://purplebaby.opal.ne.jp/mt/mt-tb.cgi/118

 YouTubeの字幕だけダウンロードするCGIを作ってブログにあげてみた。一週... 続きを読む

コメント(10)

作成&公開、ありがとう!!!

字幕CGIを開発頂きありがとうございます.
ところで,字幕STLの時間設定に不具合があるようで,
字幕が途中(1時間後)から固定してしまって変わらないようになってしまいます.下記の動画などでご確認ください

https://www.youtube.com/watch?v=1OLz6uUuMp8

コメントありがとうございます。
さきほどSRTのタイムスタンプのバグ(1時間以上の場合)を修正しました。多分直っているのではないかと思います。
長いことほったらかしでまったく気づきませんでした。失礼いたしました。

ものすごく重宝しています!
ありがとうございます‼︎

大変、助かりました。
素晴らしいソフトで感謝しております。

ありがとうございます!
目的の動画コードの中にname=の部分の記載がなく、どうしたものかとお手上げ状態だったのですが助かりました

非常に助かりました!
字幕をgoogle翻訳にかけてじっくり読みたかったのでちょうど良かったです!

これはどんな技術を用いて作成されたのでしょうか?興味があります
教えていただけると幸いです

便利ですね‼︎‼︎
AppleのWWDCをダウンロードして 読み物として使っています‼︎

たいへん便利なものを作成・公開してくださり、ありがとうございます。
このようなご好意にふれると、自分もまた誰かの役に立つことができればと思わされます。
直接お礼もできませんが、「purplebabyのブログ」様からいただいたご好意は他の誰かに渡します。
m(_ _)m

コメントする

今日の日付

広告

月別 アーカイブ

※随時加筆修正する場合があります。

※コメント・サインイン用のOpenIDは、GoogleYahoo! JAPANmixiはてなlivedoor等のアカウントに、あらかじめ付属しているものがあります。

Powered by Movable Type 4.22-ja