遅ればせながら、2011年のツイートを元に、身の回りの出来事を振り返ってみたいと思います。
1月
- SmartReaderプロジェクトに加わる。自然言語処理を使った英文読解の教育用ソフトウェア開発プロジェクトで、中東にあるCMUカタール校と共同研究。
- IBMワトソンがJeopardy!というアメリカの名物クイズ番組で歴代クイズチャンピオン2人に 勝利。
- 2009年に私がニューヨークのIBM TJ ワトソン研究所で3ヶ月間インターンしたのが、ワトソン(DeepQA)チーム。その時実装したアルゴリズムが、ワトソン内での解答スコアリングの一部を担っている。
- 地元メディアに取材される。
- 上の写真に出てるナイバーグ先生はCNNやPBSに出たり、一緒にインターンしていた同僚ニコは科学誌「サイエンス」にインタビューされたりもしている。
- ドイツ在住の友人から私がドイツのテレビに映っていたと連絡が。
- 対戦放映の日、CMUではワトソン観戦イベントが催され、満員御礼。
- ワトソンチームとのジャーナルペーパーもこの頃書き始める。(年末の時点で採択決定はされているものの未発表)
- アメフトNFLの決勝、第45回スーパーボウルでピッツバーグ・スティーラーズとグリーンベイ・パッカーズが対戦。2005, 2008シーズンに続き3度目の現地での スティーラーズ優勝を体験できるかと思いきや、惜敗。
- 生後3ヶ月の娘にホワイトハウスのオバマ夫妻から手紙が。「Welcome to the world!」ではじまる誕生祝いの手紙。いい記念になりました。(実はこの手紙は、アメリカで生まれた赤ちゃんならリクエストすれば誰でももらえます。)
- 月刊ASCII.Technologies 5月号にて、拙記事「IBM Watsonはいかにしてクイズ王に勝利したのか」が12ページの特集で掲載。
- ワトソンに関しては情報処理学会の7月号の会誌にも詳しい解説があります。金山 博, 武田 浩一: "Watson: クイズ番組に挑戦する質問応答システム", 「情報処理」 Vol.52 No.7, 2011.
- CMUの元教授 Leslie Valiant 氏が機械学習の業績でチューリング賞受賞。これはコンピュータサイエンス界のノーベル賞のようなもので、今回の受賞で、CMUからのチューリング賞受賞者は元学生2人、元教授5人、現教授4人だそう。
- 東日本大震災。ustream経由のテレビ中継を徹夜で見る。亡くなられた方々のご冥福をお祈りいたします。
- CMUの日本人で募金活動をしていたら、たくさんの人が関心をもって、募金してくれた。中には$50、$100の募金してくれた学生も。私もベンジャミン・フランクリン3人分ばかり募金。
- DARPAのマシンリーディングプロジェクトの会議でワシントン州シアトルへ。学生シンポジアムの取りまとめ役+ポスター発表。
- このプロジェクトはまだあまり情報が出てないか、出ていても不正確なのが多かったり。一応CNETの記事はここ。IBM, BBN, SRIの率いる3つのチームがいろいろな大学と提携しており、私のいるCMUのナイバーグ・三田村グループは、IBMのワトソンメンバーが率いるRACRチームにいて、テキサス大、ユタ大、ISI、MITなどとコラボレートしている。同じCMUでもトム・ミッチェル先生は別チーム。
- マイクロソフト主催のIE9杯オンライン競書大会というのに参加。
- IE9を使うとブラウザ上から書道ができるMSのサイトのキャンペーンに友人のすすめで参加。祖母は毎日書展で大賞を取ったりしたプロの書家でしたが、私は習字の素養は一切ないのでイラストで誤魔化してみました・・・。が、好評だったようで優秀賞を頂きました。
- 娘が寝返りを打つ。
- ピッツバーグ在住日本人向けメーリングリストpgh-jを悪戦苦闘しながらグーグルグループに移行。既存メンバーをinviteしたところ、800アドレスも登録があった。結構日本人いるんですね。
- 花粉症2年目。今年は日本から持ってきた薬がなくなり、アメリカの普通の花粉症の薬はシーズン前から継続して飲み始めないと効かないようで苦戦。塩酸プソイドエフェドリンという血管収縮剤(decongestant)入りの薬はアメリカでは法律上薬局のカウンターの奥にしかないようで、これを見つけるまで大変だった。
- ACL参加のため、オレゴン州 ポートランドへ。
- 聞く側のみのはじめてのACLでしたが、自然言語処理の一番大規模な学会なので千人規模のすごい人。
- NLP界の著名研究者と話せる絶好の機会のほか、日本の研究者の方々とも知りあえる貴重な機会で楽しかった。
- LTIの後輩Dipanjanがベストペーパー賞を受賞。同じNoahの研究グループのAndréも2年前にACLでベストペーパーを取っていて、勢いを感じる。
- 2011年はACL, ICML, UISTでCMU関係者がベストペーパーを取る。これにより、CMUはコンピュータサイエンスのトップカンファレンスで最もベストペーパーを取った研究機関1位にランクイン。
- 招待講演はワトソンについてだった。PI Daveの講演はCMUで2箇所とシアトルのを合せて実は4回目だったり。今年は各地で講演しているようで、8月のアメリカ人工知能学会での招待講演はVideo Lecturesで動画とスライドが見られる。
- 娘がハイハイをはじめる。
- EMNLP参加のため、スコットランドはエディンバラへ。TextInferワークショップで発表。
- 出張の時は早朝か夜にジョギングしながら観光すると、空いた街を早く回れて効率的。
- Getty Imagesから「あなたのFlickrアルバムからいい写真を6枚選んだので、われわれに売りませんか」というメールが。売りませんが…。
- 「IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる」スティーヴン・ベイカー 発売。最後の解説のところに私の名前も出てきます。ありがとうございます>
金山さん・武田さん
- フロリダはキーウェストとマイアミビーチへ家族旅行。
- ダウンタウンをジョギング中、バットマン3のロケに遭遇。先月からCMU周辺で撮影していて、メロン・インスティテュートがゴッサム市役所、CERTやCMMでおなじみのSEIがゴッサム刑務所だそう。
- Yahoo! Labsのプロジェクトに加わる。
- Yahoo!のグリッド環境にアクセスするには、雇用してもらって専用ラップトップを支給してもらうのが一番手っ取り早いとのことなので、CPTでリモートのパートタイムコントラクターに。
- F1ビザの場合、パートタイムのCPTとフルタイムのCPTはOPTへの影響が違い、パートタイムだと影響なし。
- Yahoo知恵袋の英語版Yahoo Answersを使ったQAのプロジェクトに。序盤はHadoopのいろんなMapper/Reducerの実装&ランで下準備。
- これでプロジェクトは3つ同時進行(+D論とNTCIR)。月曜にカタールとIBMとY!の3つのテレコンが重なることが多く、ミーティング三昧の曜日に。
- 10kmのマラソン大会(Pittsburgh Great Race)に出場。結果は去年の44分58秒からほとんど変わらず、45分01秒。
- CMUに2.65億ドルの歴史的大口寄付が来て話題になる。寄付されたWilliam S. Dietrich II氏はなんとその1ヶ月後に逝去された…。
- 夏からこの頃にかけて、いろいろなソフトウェアをリリース。
- JAWJAW. 日本語ワードネットのAPI。前からSourceforgeで公開していたのをリファクタリング後、Google Project Hostingに移行。すぐ使えるjarも公開。
- WS4J. 日本語ワードネットを使って、例えば「サイクロン」と「ハリケーン」なら0.9565というように単語間の意味的関連性を計算(いろいろ指標がありほとんどは0~1の間で出る)。
- Wikipedia Redirect. ウィキペディアのダンプからリダイレクト情報を抽出。"東日本大地震" -> "東北地方太平洋沖地震" というように固有名詞間の表記のゆれの解消に役立つ。
- RITE SDK. 1つクラスを実装すればNTCIR-9 RITEに参加するシステムが作れ、評価もできるフレームワーク的ツール。
- SEPIA. 情報検索・質問応答の評価データ(質問、トピック、正解ナゲット、関連文書)の構築ができるウェブアプリ。コーパス検索や評価機能もあり。
- DIMPLE. EMNLP 2011 TextInferワークショプで発表した論文の実験に使ったコード。paraphraseの語彙的多様性を評価。
- Project hello world. 個人用に備忘録的にためていたエクセル生成やチャート生成などのサンプルコード集。
- LTIが25周年を迎える。
- LTI(言語技術研究所)というのはCMUのSCS(コンピュータサイエンス学部)の一部で自然言語処理、情報検索、機械翻訳、音声認識、一風変って計算生物学などが領域の学科。学生数は修士と博士合せて今や130人近くいて、私もその一人。SCS全体だと修士360人、博士420 人もいる。CMUはコンピュータサイエンスを研究するなら、どんなニッチな分野でも仲間が見つかるような場所だと思う。
- 集合写真 by ラルフ・ブラウン先生
- 娘が歩きはじめる。
- 家族が一足早い日本への里帰り。
- 娘の1才の誕生日は、ヨーグルトでできたケーキと背負い餅でお祝い。
- 前半2週間は1年半ぶりの日本。
- 東京にてNTCIR-9ワークショップ。口頭1本、ポスター2本。
- NTCIR-9 RITEという含意関係・言い換え・矛盾の認識タスクに運営側、参加者側両方で参加。参加者各自のシステムを共通のデータを作って評価。
- RITEは5カ国24チームの参加があり、近年のNTCIRのタスクでも最大規模の参加者数だったのは運営冥利につきる。すばらしい人達と仕事ができたことに感謝。
- NTCIR全タスクの運営委員
(Photo credit: NII) - 参加レポート: id:hjym_u さん、id:mamoruk さん
- 「ロボットは東大に入れるか」キックオフシンポジウム
- ロボット(ソフトウェア)の賢さのベンチマークとして大学入試問題を使用する、NII主導で各大学にまたがる大規模プロジェクトの立ち上げイベント。
- 大学に入るというとセンセーショナルに捉えられそうだが、成果として大切なのはそのために必要な各要素技術の発展、というのは間違いない。ワトソンのときもそうだったが、メッセージや難しさを正しく伝えるのは難しい。
- RITEのサブタスクの一つ、大学入試サブタスクはセンター試験から問題を作成したが、実はこの「東ロボ」プロジェクトとオーバーラップしている。
- 大学入試は解答の解説を読んでもすぐに理解できないことがあるが、トリビアクイズは答えを知ってしまえばすぐ腑に落ちるという点で違うのかもしれない。
- 懇談会に出たかったが、次の予定のため早稲田へ。
- 参加レポート:ロボコンマガジン, IHARA Note, NAL’s blog
- 関連記事:朝日新聞, マイナビニュース, PCWatch, Newsweek, @IT
- 海外大学院留学説明会@早稲田大学 ( 当日のスライド )
- 早稲田63号館にてスタンフォード・石綿さん (@hitoshi831223)、チューリッヒ工科大・高野さん (@JgalasKom)、MIT・小野さん (@masahiro_ono)と大学院留学について講演。
- 数えていないけど、100人は来ていた気がする。興味本位で聞きに来ている人(もちろん大歓迎なのですが)ばかりでなく、実際に留学準備の具体的な行動を起こしている人が多く、驚いた。(私が大学院留学の準備をしていた時は、身の回りに同士はまったくいませんでした…。)小野さんが米国大学院学生会を立ち上げて毎年各地の大学で地道に講演会を開いてきた影響はかなり大きいに違いない。
- 理工に地下鉄の駅が完成していたり、他の工場のような建物に比べて近未来的な63号館ができていたり、変化を感じた。
- F1/F2ビザ更新
- 大使館の非移民ビザのページには「ご家族がビザを申請する場合は...主たる申請者との関係を証明する戸籍または婚姻証明を提出してください。」とあり、さも家族が代理申請ができるようなニュアンスで書いてあるが、まず入り口の受付で配偶者の代理申請は不可だと断られる。館内のもっと話がわかりそうな人と交渉すると、同じプログラムで期限が切れた場合の更新(珍しいケース?)だと代理申請できるかもしれないですね、とのことで一旦受理。しかし十分後、現在は新たに指10本全部の指紋が必須で、過去に指2本しか指紋を取っていないため、代理申請はやっぱり不可という結論。8時の開門前についたものの、急遽本人を呼び出し、結局12時前までかかり、ミーティングを1つスキップせざるを得なくなったのが残念。ちなみに予約は2人分必要で、レターパックは1つでOKでした。
- 今年のウェビー賞のパーソン・オブ・ザ・イヤー部門をIBMワトソンが取った
- ちなみに日本ではワトソン「君」と呼ばれたりもするが、アメリカの身の回りでは何故か擬人化はされていない。(Watsonをheという代名詞で呼ぶかどうか身近なところで議論があった。)
- その他、いろいろ選ばれているようです。
- 2011年に撮った写真は、ほとんどボツになってますが、2万4千枚でした。親バカぶりを発揮してます。
- 2011年のジョギング年間走行距離は685キロでした。2012年はとてつもなく忙しくなりそうですが、5/6のピッツバーグマラソンに申し込んでしまったことだし、フルマラソンデビューで完走するためには、もっと継続的に走りたいと思います。
2012年もよろしくお願いします。
相変わらず几帳面だなぁ。自分で作る一年の timeline も味があっていいね。
返信削除写真2万4千枚て、1枚1MBとしても24GB。撮り過ぎ(笑
明けましておめでとう!
返信削除写真の他にも動画もたくさんあって、1才記念に親戚上映用のムービー作ったんだけど、編集が大変だった・・・。