セミナー

鹿島・山田研究室では、機械学習・データマイニング・人工知能分野を中心に様々な分野で活躍されている方々に講演いただく公開セミナーを開催しています。

今後の公開セミナー情報


現在のところ予定しているセミナーはありません。


過去の公開セミナー情報

2019/6/10: A supervised learning approach to Granger causality inference

講演者:近原 鷹一 氏 (NTT)
日時・場所 : 2019/6/10(月) 15:00- 於 総合研究7号館 435室

概要:Inferring temporal causal directions is an important task in time series analysis and has various applications in many fields. In this talk, I will present our recent work, which has achieved high inference accuracy via a data-driven way. Our method is designed to infer the direction of Granger causality. Although Granger causality is a widely used definition of temporal causality, when using the existing methods, it is not easy to correctly infer the direction. This is because these methods, which use regression models, require to appropriately select
the models for each time series data; otherwise they output wrong causal directions. As a novel approach that does not require such selection of
regression models, we propose a supervised learning approach that solves Granger causality identification problem by ternary classification.
Based on the distance metric between distribution called maximum mean discrepancy (MMD), we introduce the feature representation that provides
sufficiently different feature vectors for time series with different Granger causality directions. By comparing the performance with the
model-based existing methods, we show the effectivity of our data-driven approach.


2019/5/20: Variational Autoencoder with Implicit Optimal Priors

講演者:高橋 大志 氏 (NTT)
日時・場所 : 2019/5/20(月) 15:00- 於 総合研究7号館 435室

概要:Variational Autoencoders (VAE)では潜在変数の事前分布として標準ガウス分布を用いることが多いが、これはVAEの学習を妨げていると指摘されている。本研究では、VAEにとって最適な事前分布であるaggregated posterior (周辺事後分布)を導入し、密度比推定を用いた学習法を提案する。


2019/1/11: Learning Factorized Multi-modal Representations

講演者:Yao-Hung Hubert Tsai (Carnegie Mellon University)
日時・場所 : 2019/1/11(金) 11:00- 於 総合研究15号館 112室

概要:Learning multimodal representations is a fundamentally complex research problem due to the presence of multiple heterogeneous sources of information. Although the presence of multiple modalities provides additional valuable information, there are two key challenges to address when learning from multimodal data: 1) models must learn the complex intra-modal and cross-modal interactions for prediction and 2) models must be robust to unexpected missing or noisy modalities during testing. In this talk, we propose to optimize for a joint generative-discriminative objective across multimodal data and labels. We introduce a model that factorizes representations into two sets of independent factors: multimodal discriminative and modality-specific generative factors. Multimodal discriminative factors are shared across all modalities and contain joint multimodal features required for discriminative tasks such as sentiment prediction. Modality-specific generative factors are unique for each modality and contain the information required for generating data.
Experimental results show that our model is able to learn meaningful multimodal representations that achieve state-of-the-art or competitive performance on six multimodal datasets. Our model demonstrates flexible generative capabilities by conditioning on independent factors and can reconstruct missing modalities without significantly impacting performance.
Lastly, we interpret our factorized representations to understand the interactions that influence multimodal learning.


2019/1/7: 化学構造式のためのハイパーグラフ文法と分子の最適化への応用

講演者:梶野 洸 氏(IBM)
日時・場所 : 2019/1/7(月) 15:00- 於 総合研究15号館 112室

概要: 本研究は、所望の物性を持つ新たな分子の構造の候補を機械学習を用いて発見
することを目的とする。変分オートエンコーダ (VAE)を用いることで分子構造の最適
化を連続最適化問題として解けるが、この方針では分子グラフを生成するモデルに関
して、例えば原子価に関する制約を守ったり三次元的な構造情報を表現する点で課題
があった。本研究はグラフ文法を用いてこれらの課題を解決する。


2018/5/22: 機械学習のWebデータマイニングへの応用

講演者:小西 卓哉 氏(国立情報学研究所)
日時・場所 : 2018/5/22(火) 13:00- 於 総合研究7号館 情報3講義室 (1階 104)

概要: 本講演では近年取り組んだWebデータマイニングに関する2つの研究について紹介する。

1) トピックモデルによる検索クエリの潜在パターン推定:情報検索ではユーザの検索意図を知ることが様々なタスクに役立つ。本研究では、ユーザが入力する検索クエリに頻出する潜在パターンをトピック列として推定することで、検索意図を知る手がかりとして応用することを考える。トピックの共起をモデル化するトピックモデルとそのベイズ推定アルゴリズムを提案し、計算コストを抑えつつ解釈性の高いトピックを学習できることを示す。また、検索クエリに関連するいくつかのタスクでの有効性を確認する。
論文:https://dl.acm.org/citation.cfm?id=2835794

2) 特徴選択によるウェブ上の観測者の検知:ウェブサービスにおいて将来注目される情報を前もって把握することは様々なメリットがある。これら流行情報を事前に察知する傾向があるユーザを観測者と呼び、ユーザの情報取得履歴から発見することを考える。本研究では、スパース推定による特徴選択を応用することで有用な観測者の集合を発見する手法を提案する。実際のソーシャルブックマークデータを用いた評価実験により提案手法の有効性を確認する。
論文:http://www.ijcai.org/Abstract/16/529


2018/1/29: Transitioning Crowd-Powered Systems to AI

講演者: Jeffrey P. Bigham 氏(Carnegie Mellon University)
日時・場所 : 2018/1/29(月) 16:00- 於 総合研究7号館 講義室2(1階101号室)

概要: Over the past few years, Dr. Bigham has been developing and deploying interactive crowd-powered systems that solve characteristic “hard” problems in computer science by combining human and machine computation. For instance, VizWiz answers visual questions for blind people in seconds, Legion drives robots in response to natural language commands, Chorus holds helpful general conversations with human partners, and Scribe robustly converts streaming speech to text in less than five seconds. In this talk, he will quickly overview that work, and then discuss ongoing work on transitioning from crowd power to computation, in order to lower latency, reduce costs, and increase privacy.

講演者プロフィール: Jeffrey P. Bigham is an Associate Professor in the Human-Computer Interaction and Language Technologies Institutes in the School of Computer Science at Carnegie Mellon University. He uses clever combinations of crowds and computation to build truly intelligent systems, with a focus on systems supporting people with disabilities. Dr. Bigham received his B.S.E degree in Computer Science from Princeton University in 2003, and received his Ph.D. in Computer Science and Engineering from the University of Washington in 2009. He has been a Visiting Researcher at MIT CSAIL and Microsoft Research. He has received a number of awards for his work, including the MIT Technology Review Top 35 Innovators Under 35 Award, the Alfred P. Sloan Fellowship, and the National Science Foundation CAREER Award.


2017/10/07: KDD2017 勉強会

日時・場所 : 2017/10/7(土) 13:00- 於 総合研究7号館4階 435号室
概要:データマイニング分野の国際会議KDD2017の会議参加報告・論文紹介ならびに今後の研究へ向けたディスカッションを行います。
KDD2017 勉強会


2017/8/31: Machine Learning for Anime&Manga

日時・場所 : 2017/8/31(木) 13:00- 於 総合研究7号館1階 講義室1
概要:アニメ・マンガ分野での機械学習応用についての2件の講演を開催します。

講演者1: Yanghua Jin (Fudan University/Kyoto University)
タイトル:Exploring the Automatic Anime Character Creation with Generative Adversarial Networks

Automatic generation of facial images has been well studied after the Generative Adversarial Network(GAN) came out. There exist some attempts applying the GAN model to the problem of generating facial images of anime characters, but none of the existing work gives a promising result. In this talk, I will give a brief introduction of recent GAN studies and describe how we combine most advanced GAN techniques together and build up a stable and high-quality model. To assist people with anime character design, we build a website (http://make.girls.moe/) with our pre-trained model available online. Commonly, deploying deep learning service is costly, I will also introduce how we successfully handle millions of visits only with a 20$/month private server.

講演者2: Jill-Jênn Vie (RIKEN Center for Advanced Intelligence Project (AIP))
タイトル: Mangaki: Using Ratings and Posters to Recommend Anime and Mangas (like in Eden of the East)

Abstract: What anime should you watch next, according to what anime you enjoyed previously? Mangaki is a free website where users can rate anime and receive recommendations. Collaborative filtering is a technique that models the interaction between users and items (here, anime), in order to infer which people have similar taste and which anime are close to each other. However, when a new anime is released, it has not been rated yet, therefore it is hard to know who will want to watch it. In this presentation, we will present several classical models for collaborative filtering, and a new model: Blended Alternate Least Squares with Explanation (BALSE) that automatically extracts tag information from posters using deep learning in order to improve the recommendations.
To try Mangaki: https://mangaki.fr.
To know more, and compete to our data challenge: http://research.mangaki.fr


2016/10/01: KDD2016 勉強会

日時・場所 : 2016/10/1(土) 10:30- 於 総合研究7号館4階 435号室
概要:データマイニング分野の国際会議KDD2016の会議参加報告・論文紹介ならびに今後の研究へ向けたディスカッションを行います。
KDD2016 勉強会


2016/6/29: 情報処理の医療応用の可能性

講演者: 荒牧 英治 氏(奈良先端科学技術大学院大学)
日時・場所: 2016/6/29(水) 13:30-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室3
概要: ビッグデータ,人工知能,ディープラーニング,さまざまな情報技術の波が医療を革新しつつある.新しい技術によって,どのようなことが可能になりつつあるのか,言語処理技術を中心に,認知症,感染症,副作用といった医療応用事例を紹介する.

講演者プロフィール: 2000年京都大学総合人間学部卒業.2002年京都大学大学院情報学研究科修士課程修了.2005年東京大学大学院情報理工系研究科博士課程修了.博士(情報理工学). 2005年東京大学医学部附属病院特任助教,2008年東京大学知の構造化センター特任講師,2011年京都大学デザイン学ユニット特定准教授を経て,奈良先端科学技術大学院大学特任准教授.医療情報学,自然言語処理の研究に従事.


2016/3/14: ビッグデータ時代の機械学習

講演者: 山田 誠 氏(京都大学)
日時・場所: 2016/3/14(月) 13:30-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: Yahoo, グーグル, Facebook, Amazon等のIT企業においては, 数千万〜数億ユーザーに対して記事推薦, E-mailの スパム検出, 商品の推薦, 友達推薦 等のサービスを提供していることから, 超大規模データ(ビッグデータ)を自動的にかつ効率よく解析する必要がある. そのため, IT企業においては, 2000年代初頭から盛んに大規模分散処理に基づく機械学習手法が利用されてきた. 近年では, IT企業以外の民間企業や大学においても, スマートフォン等のセンサーを搭載したモバイル端末の普及や計測機器の高度化により, 膨大な量 のデータが利用可能となり, 大規模分散処理や大規模データを効率よく扱う機 械学習手法が用いられ始めている. そのため, 予測精度が高いだけではなくデータに対してスケールする機械学習手法の開発が, より良いサービスを提供することや新しい科学的発見をサポートすることにおいて, 非常に重要となっている. 本講演では, 機械学習技術がIT企業においてどのようにビッグデータ に応用されているかを解説し, 次いで, Yahoo Labsおよび京都大学で研究開発を進めている超高次元特徴選択や推薦アルゴリズムについて紹介する.


2016/3/14: 劣モジュラ関数を用いた機械学習に関する最近の話題

講演者: 河原 吉伸 氏(大阪大学)
日時・場所: 2016/3/14(月) 14:45-15:45 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 劣モジュラ関数は,集合関数における凸関数に相当する関数で,最適化を考えたときの性質の良さと,応用を考えたときの表現力をあわせもった関数であることが知られている.近年では,機械学習をはじめとした広い数理・応用分野でその有用性が認識され議論されるようになっている.本発表では,まず劣モジュラ関数とそれに伴う基礎事項,及び機械学習に必要となる最適化アルゴリズムの導入的事項を説明する.その上で,劣モジュラ関数の性質を利用した機械学習における最近の研究について概観する.特に,機械学習における劣モジュラ最適化の火付け役ともなった劣モジュラ関数最大化の機械学習への応用や,ネットワークフロー最適化として帰着可能な構造正則化学習など,ある程度大きな問題サイズでも適用できる(実用的な)アプローチを中心に,具体的な適用例を見ながら話を進める.また特に最近の話題として,劣モジュラ関数を用いた確率分布による構造的学習に関連したアプローチについてもふれる.


2016/1/7: クラウドソーシング・コンピュータビジョン・ストリートビューを用いた歩道のアクセシビリティデータの収集手法

講演者: 原 航太郎 氏(University of Maryland, College Park)
日時・場所: 2016/1/7(木) 16:00-17:30 於 京都大学 吉田キャンパス 総合研究8号館 講義室1
概要: 歩道と車道の間のスロープ(縁石ランプ)の欠如など、整備の行き届いていない劣悪な歩道環境は歩行障害がある方の生活に支障をきたします。アメリカでは歩道などの公共の場が全ての人にとってアクセシブル(バリアフリー)であるよう法令(*)で義務付けられているにもかかわらず、多くの地域で問題が改善されないまま残されています。アクセシビリティはインフラの問題である一方、どの歩道がアクセシブルかといった情報の欠如、またその情報を集める効率的なメカニズムがないことも問題とされています。本セミナーではこの情報の欠如を解決する手法として、クラウドソーシング・コンピュータビジョン・ストリートビューを用いた情報を収集する手法を紹介させていただきます。

(*)Americans with Disability Act。日本ではバリアフリー法により、公共交通施設や建築物のバリアフリー化、または基準適合努力が義務付けられています。

発表資料:http://www.slideshare.net/kotarohara/using-crowdsourcing-automated-methods-and-google-street-view-to-collect-sidewalk-accessibility-data


2015/12/28: 高階結合正則化と機械学習諸問題への応用

講演者: 竹内 孝 氏(NTTコミュニケーション科学基礎研究所)
日時・場所: 2015/12/28(月) 16:00-17:00 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 機械学習の問題では、特徴量のグループ(例えば、同じ意味を持つ単語、同じジャンルの音楽など)が事前知識として得られる場合がある。ある問題において、グループに属する特徴量が同じ働きをするならば、これらの特徴量のパラメタは同一の真値を持つと仮定できる。しかし、既存の正則化(Fused LASSOやGroup LASSO等)では前述の仮定を表現できない。

本講演では、構造正則化の1つとして、特徴量のグループをハイパーグラフとして利用しパラメタの推定量を平滑化する高階結合正則化、および高階結合正則化項の劣モジュラ性を利用し正則化項を最小化するO(nlogn)の近接法を提案する。数値実験として、線形回帰問題に提案法と既存の正則化を適応した場合の汎化性能比較結果を示す。また、最新の研究トピックとして、マルチタスクラーニングへの構造正則化の応用や、時空間データ解析における低ランクなテンソル補完問題への構造正則化の導入、平均近接法を用いた非負行列因子分解法などを紹介する。


2015/10/16: 競技データマイニングにおけるテクニックと動向

講演者: 小嵜 耕平 氏(AIGジャパン・ホールディングス株式会社)
日時・場所: 2015/10/16(金) 14:00-15:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 予測モデルや最適化手法を競い合うコンテストは古くから様々な場で開催されてきました。近年ではデータサイエンスをクラウドソーシングする場として Kaggle をはじめとしたプラットフォームが登場し、賞金付きのコンテストが活発に行われています。本講演では競技としてのデータマイニングのコンテストについて解説し、講演者の KDD Cup 2015 での優勝の経緯、コンテストで用いられるテクニックや優勝者の解法について紹介します。
発表資料:https://speakerdeck.com/smly/techniques-tricks-for-data-mining-competitions


2015/8/29: データマイニング検討会(KDD 2015)

日時・場所 : 2015/8/29(土) 10:30-18:30 於 総合研究7号館4階 435号室
概要:データマイニング分野の国際会議KDD2015の会議参加報告・論文紹介ならびに今後の研究へ向けたディスカッションを行います。
データマイニング検討会(KDD 2015)


2015/7/22: ベイズ的最適化(Bayesian Optimization)の基礎と応用

講演者: 佐藤 一誠 氏(東京大学)
日時・場所 : 2015/7/22(水) 13:00-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室2
概要: ベイズ的最適化とは、入力から出力を得るコストが高いブラックボックス関数を効率的に最適化する手法の総称である。高コストなブラックボックス関数に対し て、少ない入力のステップでより最適化な出力を得ることを目的とする。例えば化学実験において、ある実験設定を入力として、得られた化合物の良し悪しが数 値的に計測可能な場合に、より良い実験設定を探索する問題は、ベイズ的最適化の1つの応用例となる。
近年、機械学習アルゴリズムの複雑化にともない、機械学習アルゴリズムの実験設定も複雑化しており、ベイズ的最適化によって機械学習の実験を効率化する 研究が注目を集めている。例えば、word2vecに代表される単語のベクトル表現学習では、ベクトルの次元、窓幅、負例サンプリング分布のパラメータ、 負例数、学習率などさまざまな実験設定があり、これらの効果的な実験設定を効率的に探索する必要がある。
本講演では、ベイズ的最適化の基礎事項としてガウス過程の基礎から説明を行い、ベイズ的最適化の入門から応用まで説明する。


2015/7/17: データを価値化する解析プロセスの俯瞰と効率化

講演者: 近藤 康一朗氏(株式会社 電通)
日時・場所 : 2015/7/17(金) 14:00-15:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: データ収集、集計、解析、レポーティング/コンサルティングなど、データを価値化するプロセスを具体的なケース事例と共に紹介します。各プロセスにおける 初心者向けの学習方法、先端技術、効率化の手段をご紹介します。また、講演者の実業務をもとにマーケティング業界におけるデータ・サイエンティストのキャ リアについても解説を行います。
発表資料:http://www.slideshare.net/koichirokondo/ss-50652353


2015/3/16: 自然言語処理におけるディープラーニングの発展

講演者:坪井 祐太 氏 (日本IBM東京基礎研究所)
日時・場所 : 2015/3/16(月) 16:00-17:00 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要:
自然言語処理でもディープラーニングが盛り上がり始めています。
画像・音声処理と自然言語処理の違いや、最近進展のあったRNNに基づく手法など
最先端の手法をご紹介します。[発表資料]

参考文献:
坪井 祐太, 自然言語処理におけるディープラーニングの発展, オペレーション
ズ・リサーチ, Vol.60, No.4 (In press)


2015/1/20: 能動学習による多関係データセットの構築

講演者:梶野 洸 氏 (東京大学大学院情報理工学系研究科数理情報学専攻)
日時・場所 : 2015/1/20(火) 15:00~16:00 於 京都大学 吉田キャンパス 総合研究7号館 情報3講義室 (1階 104)
概要:
セマンティックウェブ、知識ベースなど、様々なデータは、二主体間の複数種類の有向関係で記述できる。これを多関係データと呼ぶ。ウェブや科学論文から多関係データセットを自動抽出する研究が多く行われているが、常識的な知識などが抽出できないという欠点がある。本講演では、能動的に人に関係の有無を尋ねる能動学習を用いて多関係データセットを構築する手法を提案する。実データを用いた実験により手法の有効性を確認する。
発表資料:能動学習による多関係データセットの構築 – slideshare


2014/11/28: テンソル分解を用いた大規模実データからの異常検知の試み

講演者:丸橋弘治 氏 (株式会社富士通研究所 ナレッジプラットフォーム研究部)
日時・場所 : 2014/11/28(金) 14:45~16:00(質疑応答込み) 於 京都大学 吉田キャンパス 総合研究7号館セミナー室2
概要:
近年、社会のあらゆる場所で蓄積されたデータを、ビジネスなどの実問題に活用する動きが活発になっている。特に、ネットワーク通信ログやWebアクセスログ、POSデータといった、多数の人や機器の挙動を記録したデータから、不正行為などの特殊な意図に基づく挙動を発見することが、セキュリティやマーケティングなどの分野で求められている。これは、人や機器などの要素に対し、大量の要素間関係の集合の中から、特徴的な要素間関係のパタンを見つけ出すことに相当する。現状のネットワーク侵入検知などでは、注目すべき要素間関係のパタンをルールとして予め記述しておき、ルールに合致するパタンを検知する。しかし、このような方法では、新手の攻撃パタンなど、想定の範疇を超えたパタンを見つけることができない。この問題に対する一つの有効なアプローチは、データ全体における要素間関係の主要な分布をモデル化した上で、主要な分布と比較して特徴的な分布を示す要素間関係の集合を検知するアプローチである。本セミナーでは、要素間関係を表すデータをテンソルとみなし、テンソル分解を用いて主要な分布をモデル化することにより、特徴的な要素間関係のパタンを検知する、いくつかの事例を紹介する。


2014/9/23: ACM SIGKDD2014 論文読み会

日時・場所 : 2014/9/23(火) 13:00-20:30 於 総合研究7号館4階 435号室
概要:データマイニング分野のトップ国際会議KDDの論文を紹介します。
KDD2014論文読み会 (関西会場)


2014/4/22: クラウドソーシングを支える品質管理手法

講演者: 馬場 雪乃(国立情報学研究所 ビッグデータ数理国際研究センター/JST ERATO 河原林巨大グラフプロジェクト 特任助教)
日時・場所 : 2014/4/22(火) 16:30-18:00 於 総合研究7号館1階 情報3講義室
概要:
不特定多数の人々にインターネットを介して仕事を発注する仕組み「クラウドソーシング」の利用が様々な業種で拡大している。
情報科学の研究においても、データ収集や評価実験など人間の力が必要となる場面でクラウドソーシングが広く使われるようになり、クラウドソーシングは研究遂行上必要不可欠なツールになりつつある。
さらに、クラウドソーシングをより良い仕組みにするための研究が、人工知能やヒューマンコンピュータインタラクションの分野を中心として行われている。
本講演では、特に研究で用いるツールとしてのクラウドソーシングの有用性を紹介した後、クラウドソーシングを支える技術として期待される品質管理の研究について解説する。


2014/4/21: 構造データに対するカーネル法と簡潔データ構造

講演者: 木村 大翼 (東京大学 大学院情報理工学系研究科 数理情報学専攻 博士課程)
日時・場所 : 2014/4/21(月) 13:30-15:00 於 総合研究7号館1階 セミナー室1
概要:
近年、文字列、木構造、グラフ構造など非ベクトル型データとして表現される構造データに対する学習の重要性は年々増加している。
このような構造データに対する強力な学習手法の一つとしてカーネル法があり、代表的な学習器としてサポートベクトルマシン(SVM)がある。
しかし、一般にカーネル関数を用いたSVM学習の計算量は入力のデータ数nについてO(n^2)であり、大規模データに対する学習は困難である。
また一方で簡潔データ構造と呼ばれるデータ構造が注目されている。
簡潔データ構造とはデータの大きさが情報論的下限と呼ばれる非常に小さい大きさに漸近し、かつ高速な演算を可能とするデータ構造であり、ビット列、文字列、木構造、グラフ構造など様々な離散構造に対し提案されている。

本講演ではまず構造データに対するカーネル法の枠組みを述べ、特に木カーネルをいくつか紹介し、カーネル法の計算量的問題点に触れる。
その後簡潔データ構造の枠組みを述べ、ビット列、文字列、木構造に対する簡潔データ構造を紹介する。
最後に構造データに対するカーネル法の計算量的問題が簡潔データ構造によって解決されることを述べ、簡潔データ構造を利用した木カーネルの高速なSVMの学習アルゴリズムを紹介する。提案アルゴリズムの時間計算量はデータ数nについてO(n)であり、なおかつ空間計算量はラベル付き木の情報論的下限に漸近する。