2021/6/9(水) 13:20~15:00/15:20~17:00

データマイニング・機械学習の研究において広告は中心的な分野です。
多くの主要国際会議では広告技術のセッションがあり、高い注目を集めています。
しかし国内の会議では広告がセッションとして扱われることは稀であり、十分な議論を行えていない現状があります。
今回本オーガナイズドセッションを実施することを契機として、
日本における広告技術の研究開発のコミュニティが生まれ、議論が活性化することで、
多くの研究が生まれていくことを期待しています。

7件の研究発表と1件の招待講演を実施します。

〇熊谷 雄介1、板倉 陽一郎2、見並 良治1、猪谷 誠一1、道本 龍1 (1. 株式会社博報堂、2. ひかり総合法律事務所)

さまざまな大規模データセットが企業や大学によって公開され,それらを用いた研究や開発が行われている.また,深層学習フレームワークの発展によってデータセットのみならず学習済み統計モデルも広く公開され,利活用が進んでいる.それらの資源には多くの場合さまざまなライセンスが指定されているが,一般の研究者がそれを意識することはまれである.しかし,データセットや学習済み統計モデルを用いた商用システムやソリューションの開発を行う際には,どの用途であればライセンス違反になるのか,またはならないのかを十分に検討しなければならないが,既存研究においては明らかにされておらず,各社の判断において行われているのが現状である.そこで本研究では,データセットと学習済み統計モデルを用いた研究やビジネスのより安心・安全な実現を手助けするために (1) 代表的なデータセットや学習済み統計モデルのライセンスを確認し,(2) データセットや学習済み統計モデルのユースケースを列挙し, (3) ライセンスとユースケースの組み合わせについて何が可能で何が不可能か,の3点を検討した.

〇黒木 開1、川上 孝介1、岩井 大志1、石塚 湖太2、中田 和秀2 (1. negocia株式会社、2. 東京工業大学)

リスティング広告における広告文の品質向上は、消費者をランディングページ(LP)へ誘導し、購買へと繋げるために大変重要である。 品質向上手法には一般的に知られた手法がいくつかあり、例えば検索キーワードを広告文内に含めることで、クリック率など各種指標が改善することが知られている。そこで本論文ではより優れた広告文を生成するために、特定のキーワードを高確率で含む文生成手法を提案する。ベースとなる自然言語処理モデルには事前学習済みBERTをEnc-Dec構造にしたBERT2BERTを採用し、学習データはgoogle広告において配信されていた約69万件の広告データを用いた。また、生成時に「ドア」と「扉」といった類語の生成を防止するため、キーワードをマスクした形で学習を行なった。加えて文生成時にはキーワードを優先出力する手法を検討した。実際に配信された広告データを用いてその精度を評価した結果、提案手法は最大約80%の確率で広告文内にキーワードを挿入できることを確認し、既存モデル(BERT2BERTを学習データでfine-tuningしたのみのモデル)の挿入率を有意に上回ることができた。

〇棚橋 耕太郎1、濱田 賢吾1、梅谷 俊治2 (1. 株式会社リクルート、2. 大阪大学)

広告の認知を促す上で,ユーザの広告への接触回数を考えることは重要である.広告への接触回数がある閾値を超えると広告認知に繋がりやすくなることが知られており,広告の効果を測る指標のひとつとして広く用いられている.本発表では,TVCM出稿者側の立場からCMの編成問題を取り扱い,TV局から割当てられたCM枠に対して,どの枠にどの種類のCMを割当てると各種類のCMの認知が最大になるかという問題を整数計画問題として定式化する.この際,あるユーザのあるCMに対する期待視聴回数が閾値を超えるとCMは認知される考え,各種類のCMに対して,認知に至るようなターゲット視聴者の数を最大化する.さらに,実際の視聴データを用いて提案モデルの有効性を確認する.ここで,最適化の入力データの規模が大きいと実用的な時間で解を得ることが困難であるため,LP緩和問題の解を用いたサンプリング手法を新たに提案する.その結果,提案のサンプリング手法を用いる方が,ランダムサンプリングを行う場合と比較して良い結果を得られることが確認できた.

山本 覚1、アグチバヤル アマルサナー1 (1. データアーティスト株式会社)

ユーザーの嗜好性を行動パターンから把握し最適なコンテンツを配信する技術がこれまで広告効率を大きく改善してきた。一方で個人情報保護の観点からユーザーの行動を詳細にトラッキングすることへの制限が強化されている。そのような状況下では、より少ない接点の中で、ユーザーのストレスにならず嗜好性を把握する手法が求められている。 そのようなニーズにこたえるために、本論文ではGPT(Genarative Pretrained Transfomer)を用いた対話エンジンを開発し、Twitter上でユーザーの興味情報を収集するシステムを構築、そこから得られる嗜好性情報の分析を行った。

〇北田 俊輔1、彌冨 仁1、関 喜史2 (1. 法政大学、2. 株式会社Gunosy)

オンライン広告における広告クリエイティブの良し悪しは、一般的にユーザーがクリエイティブをクリックし、商品が購入される等の行動が起きる割合で評価できると考えられる。一方、そのようなユーザー行動は非常にノイズが多く不確実性が高い。また広告キャンペーンや広告大賞の潜在的な魅力等に左右される。本論文では、広告クリエイティブの評価のために、確率的広告クリエイティブ埋め込みを学習し、キャンペーン内の各広告クリエイティブを潜在空間のガウス分布として表現する新たな方法を提案する。我々の確率的埋め込みは、不確実性の高いユーザーの行動やキャンペーンに関連する複数の広告クリエイティブから適切な評価を実現する特徴を捉えることが可能である。 我々は株式会社Gunosyが提供した実際の20万件の広告クリエイティブを使用して評価を実施した。確率的埋め込みにより、テキストエンコーダー(LSTM、BERTなど)に関係なく、広告クリエイティブの配信パフォーマンスを正確にキャプチャできることを確認した。さらに、我々の提案は最先端モデルであるBERTを使用することにより、小さな不確実性で予測を実現することを確認した。

〇大曽根 宏幸1,2、張 培楠2 (1. 筑波大学、2. 株式会社サイバーエージェント)

日々増加する商品やサービスに対して、適切で魅力的な広告文を手作業で作成することは膨大な時間的・金銭的コストがかかるため、作業負荷の軽減が求められている。また、同じ広告を何度も提示するとユーザーの反応が著しく低下するため、多様な広告を制作する必要がある。AI により広告文を大量に自動生成することで、広告制作者の負担を軽減するとともに、広告の枯渇を回避する研究がなされているが、定型的な広告文が生成されてしまうことが課題となっている。我々は、作成する商品についての前提知識を考慮した多様な広告文を生成するため、大規模な日本語データで事前学習したTransformer を用いた広告キーワードに着目した手法を提案する。広告文に含まれるキーワードを抽出し、キーワードと広告文を条件づけた学習により、広告の特徴や前提知識を考慮した多様な広告文の生成を目指す。比較のため、生成文に対し、BLEU、distinct、キーワード出現率についての自動評価と、流暢性と関連性について人手評価を行った。これにより提案手法を用いることで、少ないデータの場合でも、キーワードの特徴を捉えた多様な生成が行えることがわかった。

〇佐竹 哉太1、山田 誠2,3、安井 翔太4、鹿島 久嗣2,3 (1. 京都大学大学院情報学研究科、2. 京都大学、3. 理化学研究所、4. 株式会社サイバーエージェント)

オンライン広告を配信する際の指標として、ユーザの興味・嗜好を推定するためのコンバージョン率(CVR)がよく用いられる。コンバージョンは広告表示の直後に生じるとは限らないため観測に時間が必要であるが、一方で期間限定の広告などの場合にはデータ収集に時間をかけづらいという問題もある。そのため多くの研究では全ての広告をまとめて単一のデータセットとして扱っている。しかしこうした手法では広告ごとの特性の違いを適切に学習することは難しい上、データサイズの小さい広告に不利な最適化が行われる可能性がある。本研究では、各広告に配慮した最適化を行うための手法を導入したマルチタスクDelayed Feedback Modelを提案する。提案手法は複数広告を同時に最適化する際のタスクの衝突を回避することができ、またサイズの小さいタスクの学習を補助することができる。実際の広告データを用いた実験では、提案手法が比較手法よりも良い性能を示すことを確認した。

招待講演

自然実験としてのアルゴリズム:広告・推薦産業の現在と未来への応用
(14:20 ~ 15:00)

成田 悠輔 (イェール⼤学)

機械学習アルゴリズムを利用した意思決定が広がっている。そこで重要になるのが、過去に使われたことのない新しい意思決定アルゴリズムの性能を予測することだ。正確な性能予測はよりよいアルゴリズムの発見につながる。この発表では、過去に使われたアルゴリズムが自然に蓄積したデータを用いて、未知のアルゴリズムの性能を予測する技法を提案する。この方法は幅広いアルゴリズムに適用可能で、使える場面は広告配信や推薦エンジンの設計だけでなく、価格設定・金融機関の審査のようなビジネスから、裁判の判決、データ駆動教育・医療、そして学校入試・労働市場設計やオークションなどの公共政策まで多岐にわたる。これらの例を見渡すことで、様々な社会制度・政策・ビジネスの評価・設計・予測を統一技術で行えることを示す。

オーガナイザ

関 喜史

(株式会社Gunosy)

株式会社Gunosy共同創業者
GunosyTechLab R&D チーム 上席研究員
東京大学大学院工学系研究科
博士後期課程修了
推薦システム、ユーザ行動分析が専門
2017年度言語処理学会論文賞
KDD2019, Recsys2019などに論文採択

安井 翔太

(株式会社サイバーエージェント)

株式会社サイバーエージェント AILab 経済学チームリーダー
Norwegian School of Economics MSc
Counterfactual ML, 経済学と計算機科学の融合が専門
AAAI, ICML, WWW等に論文採択
主著:『効果検証入門』(技術評論社、2020年)

福田 宏幸

(株式会社ちゃんフク)

株式会社ちゃんフク
代表取締役
東京大学大学院 新領域創成科学研究科
博士後期課程修了
専門はバイオインフォマティクス
ロッテ「Fit’s」等の広告制作
AIコピーライター「AICO」等のAI開発

熊谷 雄介

(株式会社博報堂DYホールディングス)

株式会社博報堂DYホールディングス マーケティングテクノロジーセンター 上席研究員

広告とAIオンライン懇談会 開催

6 / 9(水) 19:30~

申込みはこちら


※当日参加、途中入退室も可能です。