昨年から,言語処理学会30周年記念事業の一環として特別言語処理セミナーを実施しております.関連する分野ではあるけれど,実際に言語処理を自ら行うのは難しい,ご自身の研究で使ってみたい,という方を対象にして,セミナーを企画しました.昨年度,主に言語学関連の研究者を対象にして開催し,大好評であった「言語分析のための言語処理・深層学習」について,内容を改訂・拡充した2回目のセミナーを実施いたします.
永田亮先生(甲南大学/理研AIP/産総研)
川崎義史先生(東京大学)
内田諭先生(九州大学)
更新情報
開催概要を掲載しました(2025/08/01)
2025年9月13日13:30〜18:00(初級編)
2025年9月14日09:00~17:00(中級編)
東京大学 駒場Iキャンパス KOMCEE East K212教室
〒153-8902
東京都目黒区駒場3-8-1
https://www.c.u-tokyo.ac.jp/info/about/visitors/maps-directions/index.html
(オンライン配信はございません。)
次の条件を全て満たす方
・実習に使用するノートPCを持参できる方
・Googleアカウントをお持ちの方
・18歳以上(ただし,基礎編は理工系の大学など所属組織でプログラミング教育を受けられる方を除く.また,高校生も除く)
参加申し込み
https://forms.gle/3vxy4QPjpdLrAbcV7
にて参加受付を受け付けます.会場およびハンズオンのサポートの都合上,セッションごとに定員(40名)を設けております.一部のセッションのみの参加も可能です.申込締切は8/29です.
言語処理学会会員
学生会員・一般・シニア・賛助会員(3名まで) 無料
言語処理学会非会員
学生 無料
一般 15,000円(参加セッション数にかかわらず同一の参加費となります)
参加費のお支払い方法(言語処理学会非会員 一般の方のみ)
振込取扱票は1枚につき, 1名様分の送金にご利用ください.
振込取扱票の通信欄には, 以下の2点を必ず明記してください.
(1)参加者氏名
(2)所属機関名
送金手数料は申込者がご負担くださいますようお願いいたします.
振込口座は以下の通りです.
口座番号:00940-9-324358
加入者名:言語処理技術セミナー
なお, 銀行振込として, インターネットバンキング等から, 下記の口座宛にお支払いいただくことも可能です.
その際は必ず, 振込人と参加者氏名を一致させてください.
難しい場合は, 別途入金通知(日付と金額, 参加者氏名)を下記問合せ窓口(中西印刷)までご送付いただきますようお願いいたします.
銀行名:ゆうちょ銀行
支店名:〇九九(ゼロキュウキュウ)店
預金種別:当座
口座番号:0324358
口座名義:言語処理技術セミナー
ゲンゴショリギジュツセミナー
なお, お申込み後にキャンセルされます場合は, 参加申し込みの締切日までに下記問合せ窓口(nlpseminar@nacos.com)までお知らせください.
講演内容
本セミナーでは,主に,何らかの言語の分析をする人を対象にして,言語処理と深層学習に関する超入門講座を実施します.座学と実習をミックスすることで,プログラミング初心者にも取り組みやすいセミナーを目指します.まず,本講座に必要となるPythonの入門からはじめ,ごく簡単な言語分析を体験してもらいます.その後,深層学習に基づいた言語分析で強力なツールとなる単語ベクトルを導入し,より深い言語分析に挑戦します.なお,実習は,参加者ご自身の持ち込みノートPCで行っていただきます.
当日スケジュール
2025年9月13日(土)
13:30 – 13:40 オープニング
13:40 – 16:30 基礎編: 自然言語処理のためのPython超入門(内田先生)
17:00 – 18:00 交流会(駒場Iキャンパス KOMCEE West MMホール)
2025年9月14日(日)
9:00 – 12:30 中級編1: 頻度分布分析入門(川崎先生)
12:30 – 13:30 (昼休み)
13:30 – 17:00 中級編2: 言語モデルから得られる単語ベクトルを応用した意味変化検出ツールの作成(永田先生)
(途中適宜休憩をはさみます)
基礎編「自然言語処理のためのPython超入門」
内田 諭 先生(九州大学)
本ワークショップでは、Python未経験者を対象に、自然言語処理に必要なプログラミングの基礎をやさしく解説します。変数の型(リストや辞書など)や、for文やif文といった基本的な文法を理解することから始め、最終的には任意のファイルを対象に「英単語の品詞別頻度表を作成する」ことを目指して、ハンズオン形式で学習を進めていきます。
略歴
2013年に東京大学大学院総合文化研究科言語情報科学専攻で博士号(学術)を取得.東京外国語大学特任講師を経て,現在,九州大学大学院言語文化研究院准教授.専門は認知意味論,コーパス言語学,英語教育.
中級編1「頻度分布分析入門」
川崎 義史 先生(東京大学)
中級編1では、基礎編で学んだ内容を踏まえ、テキストデータの古典的な分析手法の習得を目指します。具体的には、単語長、文長、語彙の豊かさ、Zipfの法則、パープレキシティなど、言語要素の頻度分布に基づいた分析手法を扱います。実習として、以下の論文の再現(一部)に取り組みます。
川崎義史、永田亮、高村大也、大谷直輝.(2025).「クレオールは計量的に峻別できるか?」.『言語処理学会 第31回年次大会 発表論文集』、2025年3月、pp.138–143.
https://www.anlp.jp/proceedings/annual_meeting/2025/pdf_dir/E1-1.pdf
略歴
東京大学大学院 総合文化研究科 言語情報科学専攻 准教授。2016年に同専攻で博士(学術)を取得。同専攻講師を経て、2022年より現職。スペイン語史、計量文献学、計算ロマンス語学の研究に従事。
中級編2「言語モデルから得られる単語ベクトルを応用した意味変化検出ツールの作成」
永田 亮 先生(甲南大学/理研AIP/産総研)
中級編2では,単語の意味を扱うことを学びます.具体的には,二つのコーパスにおいて,単語の意味がどの程度異なるかを定量化する手法(永田+, 2024)の実装に取り組みます.最近の深層学習に基づいた言語モデルでは,単語を予測する際に,副産物として単語ベクトルが得られます.単語ベクトは,対応する単語の意味や用法を反映することが知られています.同手法では,単語ベクトルの散らばり度合いに基づいて,単語の意味の広がりを計測します.計測された意味の広がりを二つのコーパス間で比較することで,各単語の意味の変化の度合いを定量化します.まずは,当該論文のアルゴリズムを概観し,その後,簡易化したアルゴリズムの実装に取り組みます.
永田+ 2024
永田亮,高村大也,大谷直輝,川崎義史(2024).「意味の集中度に基づいた意味変化検出」.『言語処理学会 第30回年次大会 発表論文集』、2024年3月,pp.1622–1627.
https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/E6-4.pdf
(英語になりますが,次の文献のほうが情報が多くわかりやすいかもしれません)
Ryo Nagata, Hiroya Takamura, Naoki Otani, and Yoshifumi Kawasaki. 2023. Variance Matters: Detecting Semantic Differences without Corpus/Word Alignment. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, pages 15609–15622.
https://aclanthology.org/2023.emnlp-main.965/
略歴
甲南大学知能情報学部准教授.2005年三重大学大学院博士後期課程修了.兵庫教育大学助手,甲南大学講師を経て,2012年より現職.語学学習支援のための言語処理,言語分析のための言語処理と深層学習の研究に従事.理化学研究所AIPセンターおよび産業技術総合研究所客員研究員.言語処理学会理事.
実行委員長:小町守(一橋大学)
実行委員:石井雄隆(千葉大学)
馬緤美穂(LINEヤフー株式会社)
山岸駿秀(株式会社マネーフォワード)
吉田光男(筑波大学)
中西印刷㈱ 言語処理技術セミナー担当 <nlpseminar@nacos.com>