YouTubeの字幕だけダウンロードするCGIを作って今月1日にブログにあげた。それまで一週間以上かけて少しずつスクリプトを組んで、ようやく稼動させることができたものだ。一応私の環境ではひととおりちゃんと動いてくれている(と思う)。機械翻訳系の字幕には対応していないわけだが、実際YouTubeで表示してみれば分かるけれど、機械翻訳は文章としてかなり破綻していてわざわざダウンロードするほどのものでもないように思う。
先月に、イエール大学がYouTube上に公開している講義動画の文学理論のシリーズをぼつぼつ見始めたのだが、私として、正直字幕なしで理解するのはややきついのであり、字幕のありがたさと、字幕を読み直すのに動画をシークして戻さねばならないなど併せて多少の不便さにも思いが至った。それで字幕をダウンロードしてくれるフリーソフトのGoogle2SRTというのを試したのだが、OSを64bitにしたせいなのか、起動すらしなかった。SRTを落とすだけなら他に方法があるような感じもしたが、SRTだけでなく文章としてまとめて読みたいという欲求もあり、自分でスクリプトを書くことにした。以前の法令データCGIを改良すれば、処理自体はわりと近いはずだし、簡単だろうと思ったらまあそれどころではなかったわけである。しかし何とか一定の完成を見てよかった。
以前RSS非対応サイトのデータをCGIで取得してRSSを勝手に作れないかと思案したときに、そういうサービスをすでにやっているLivedoorの利用規約がどうなってるか探したりして、法的なことを気にしていたが、考えてみればこの種のスクリプトのデータ取得のトリガーは利用者なのであって、その誰かが実行しなければCGI自体はなんらの意味も持ち得ない。いわば機械的ツールとしてサーバ上に設けられた特定目的のHTTPクライアントみたいなものだとみなしうると思う。しかも今回の処理ではサーバにデータのキャッシュすら残していないので、その場限りの「お使い&加工」サービスでしかない。Googleのように、普段から先取り的に巡回して蓄積した他サイトのデータに改変を加え、自サイト内で継続的に公開することで自己のコンテンツとしているのより、かなりましであろうと思われる。
無理の無い程度でスクリプトをメンテナンスorトリミング等しようとは思っているが、元々のソースデータの場所が変わった場合には、すぐに対応できない恐れがある。というのも定義データや字幕データの場所のアルゴリズムは自分でフラッシュを解析するなどして割り出したものでは全然なく(私はフラッシュのアクションスクリプト関連はよく分からないし、解析するにもなにか専用のアプリケーションが必要なのではないかと思う)、ネット上の情報を参考にして組み込んだに過ぎないので、自前ではGoogle(YouTube)側の仕様変更に対して即応出来ない。というわけでその場合には、対応まで時間が掛かるかもしれませんので悪しからず。
サイト管理のブログ記事
一応「投影性同一視」の方を訳し直し終えた。思いのほか悪戦苦闘したがなんとかかんとか。Wikipediaの元記事は多少なりともましになっていたと思うし、文面自体が半分以上は刷新されている感じではあったが、根本的に新しいことが追記されてるわけでもそうはないので、訳し直すほどでもなかったような気もする。まあこれはこれ。
問題は致命的におかしいところのあった「スプリッティング」の方だ。現在の英文記事は以前におかしかったところはそこそこ直されている感じではあるのだが。今度は冒頭の一般的定義やら最後の段落の変な位置のカンマまでなんとも別様に怪しくなっているわけだが・・・。
訳しながら、改めてメラニー・クラインの偉大さと繰り返される死別に彩られた彼女の不幸な個人史に、またフロイトを含める他の偉人たちのもがきぶりに思いを馳せないでもなかった。この分野は偉人だからといってある意味誰も正しくはない。あるいは正しいこととしてはそう近くはない未来まで誰も何もはっきりとは分かり得ない分野なのだと思う。
偉人たちはそれぞれが茫漠たる暗闇を思い思いに照らし出す細いライトのようなものだと思わないでもなかった。
以前英文拙訳カテゴリで出した英語版WIKIPEDIAの記事の和訳は、当時も少し書いているが、WIKIPEDIAの元記事の文章そのものがおかしかったり、多分情報として間違っていると思われる箇所もそのまま訳している。私の訳がおかしいと思われていたかもしれないが(そういう箇所もあるかもしれないが)、WIKIPEDIAの各項目のHISTORYから参照してもらえれば分かる人は分かるはずで、当時の該当する元記事自体が微妙な代物なのだ。当初日本語版WIKIPEDIAにない項目の和訳を出すのは面白いのではないかと思って始めたのだけれど、訳しながらそういうわけでだんだん意気阻喪してしまったという経緯がある。
WIKIPEDIAはある程度自由な共同編集なので内容が微妙なのは日本語版にしろ英語版にしろ仕方がないのだろう。しかし今般、時間が経って、そこそこ手直しされてきた箇所もあるようだ。
時間があったら幾つか(「スプリッティング」と「投影性同一視」くらいは)訳し直そうかなあ・・・。
Paged Archives Pluginで非常に簡単に、Movabletypeにおけるカテゴリのページ分割ができるのだが、全然知らなかった。瓢箪から駒で今朝インストール。このカテゴリ表示の処理が不服でブログから遠ざかっていた面も幾らかあったわけだが、大したことではないが、なんだか気が晴れた。
※MT4.2以降の場合は<MTEntries limit="$limit">を<MTEntries>のみとしなければ動作しないので注意。
さくらサーバの仕様が変更になったらしく、ブログへのリンクも「リダイレクト」から「マルチドメイン」に変更できるようになったのでやってみた。しかしmovabletypeの内部URLを当該URLに設定変更したところ上手く動作せず、またぞろ再インストール。
ドメイン名自体もhttp://purplebaby.sakura.tv/blog/からpurplebaby.opal.ne.jpに変更した。
movabletypeのバージョンは最新のMT-4.22-ja。
解凍したファイル・フォルダをすべて上書き転送して、CSSファイルは別途既存のもので更に上書き。
その後Textarea.jsのリンク作成部にtarget=_blankを入れる。
MT4.12ベータ版を入れてみていたのだが今回正式版に入れ替えた。ベータ版導入以前から少し細かな挙動の不具合等が気になっていたこともあって、アップデートではなく全削除しての新規インストール。記事データやスタイルシートは勿論バックアップを取っていたが、テンプレートの方の保存をうっかり忘れたまま作業を開始してしまい、やや手間取ってしまった。
別途サーバ上のブログ用フォルダ全体をバックアップしてもいたのだが、そこからテンプレートファイルの所在を捜そうとするも結局分からず、日の目は見なかった。仕方がないので出力されたHTMLを参考にしてテンプレートを一々修正し復旧し終えたが、テンプレートファイルはセキュリティ上の問題であの中のどこかに固めてあるということなのだろうか。
使い勝手についてはまだよく分からない。
どうも写真を貼ってその高さまで本文が到達しないとレイアウトが崩れてしまうようで、昨日辺りに直していた。やったことは単純なことで「ブログ記事のメタデータ」のテンプレート内の外枠となるタグの<div>を<table>に変えただけだが、それに付随してスタイルシートの既存"display: block;"を当該<table>ではなく<td>に適用させる必要があった。そうしないとOPERAでは修正が反映されなかった。
多分これでメタデータを区切る破線が写真を突き抜けず下に接して表示されるようになっていると思う。
あと、前から一行が長すぎる気がしていたので、全体の横幅を40pxだけ縮めてみた。
しかし、色々テンプレートに手を加えてくるとそれらをバックアップしておきたくなるわけだが、一々メモ帳等にコピーして行くしかないのかなあ。movabletype備え付けのバックアップ機能にはテンプレートやスタイルシートの保存は含まれないみたいだ。
月送り機能を付けようと思ったらどんどん深みにはまっていった。
1)<MTArchivePrevious>と<MTArchiveNext>を利用して先月と来月分アーカイブへのリンクを作成する。が、今度は個別ページやカテゴリアーカイブでカレンダー自体が表示されなくなってしまった。今はこれ以上はちょとどうしようもない感じ。月別表示時の排他的なnameがあるといいのだが見当たらないし、自分で設定することも出来ないようだった。有志のプログラマの方がJAVAやAJAXを使った高度なカレンダーをネット上に公開されているようだが、素人としては設置するのもそこそこ大変そうだし、デザインがみな同じになってしまわないか、ページが重くなるのではないかと、何となくそちらには気が進まない。2)既定の<mt:Calendar>を、月別アーカイブに合致するカレンダーを自動表示してくれる<mt:Calendar month="this">に変更すると、トップのindexページでは利かなくなってしまうので、</mt:Calendar>までの内容を<mt:if name="main_index">と<mt:else>によって条件分けして別個に記述。
残念ではあるけれど、どうしても付けねばならないというものでもなし、月送り機能は省いたままで運用しようと思う。
最近のコメント
purplebaby≫MOさん Youtubeは、自動生成系の字幕の場合、複数の… (240325)
MO≫いつもありがたく使用させていただいています。 不具合なのか1… (240324)
purplebaby≫2023/10/16 15:49 コメント投稿者: 山田 隆… (231016)
MO≫はじめまして、便利で毎回使用させていただいていますが、1点リ… (230515)
wakamin≫もう何年も利用させていただいております。 srtだけでなく、… (230127)
sennapeng≫YouTubeの英語字幕を、ゆっくり翻訳できないかとググって… (220519)
tab≫初めて利用させて頂きました。 無料で公開してくださり本当にあ… (220507)
purplebaby≫イナチャン55さん、yosiさん、動作報告ありがとうございま… (211205)
イナチャン55≫早速の対応ありがとうございます。 数年前から秘密の宝ツールと… (211205)
yosi≫早速のご対応ありがとうございます。無事に srtファイルをダ… (211205)