Technical WS for Fieldworkers

言語に関する情報技術を学ぶオンラインワークショップです。

開催のお知らせを受け取りたい場合は nakagawanatuko *at* gmail.com までメールください。Google Calendarも公開しています。


Wordで論文を書く (上級者向け)

日時: 2021/8/17 13時から

発表者: 中川奈津子 (国立国語研究所)

YouTubeで配信します

講習中の質問は https://app.sli.do/event/qbyzzakv にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

【内容】

スタイルを指定して、書式やインデント、番号を自動で付与する。また節、例文番号などを自動参照する。

【準備していただくもの】

Microsoft Word

音声データのテキストアノテーションを無料ソフトで(できるだけ)自動化する

日時: 2021年 3月8日 13:00-15:00

発表者: 松浦年男 (北星学園大学)

YouTubeで配信します : https://youtu.be/zoiy_DaNZsQ

講習中の質問は https://app.sli.do/event/aai3uham にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

【内容】

タイトルまんまです。松浦のブログ記事 (https://researchmap.jp/blogs/blog_entries/view/77194/a76a4fa7833f85f86f668f1f1f1972f9?frame_id=745564&fbclid=IwAR1FUPvQ19_X_vX6n3mWvfdH4aPiL5f_kV5fCuoSqmRBkSGr52FQH6pqTaI) に沿って手を動かして、日本語の音声データからテキストの書き起こし、音素への変換、時間情報の付与までをなるべく自動処理でやります。講師自信そこまで個々のプログラムに関する知識はありません。

使用ソフト、プログラム

  • Julius (本体と音声認識パッケージ,必須)

  • Python (Praatで読めるようにするには必須)

  • Google ChromeとGoogleアカウント (任意だけどあると便利)

  • Perl (Windowsのみ要インストール)

  • エディタ (必須)

論文を書くためのTeX 入門 第2部

日時: TBA

発表者: 加藤幹治(東京外国語大学/日本学術振興会)

YouTubeで配信します

講習中の質問は https://app.sli.do/event/lzluqtk6 にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

【内容】

前回の講習で扱えなかった部分を扱います。参照文献の自動化、図表の挿入、マクロの扱い方を扱う予定です。

【準備していただくもの】

Cloud LaTeX https://cloudlatex.io/ のアカウントを作成しておいてください。

【資料】

TBA

論文を書くためのTeX 入門(終了・録画公開)

日時: 2020/10/4 (日) 13:00から 1時間半程度

発表者: 加藤幹治(東京外国語大学/日本学術振興会)

YouTubeで配信します https://youtu.be/JWv9WVvYse0

講習中の質問は https://app.sli.do/event/lzluqtk6 にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

【内容】

この講習会では、TeXというソフトウェアを用いて学術論文の執筆をよりきれいに、より素早く行う方法を解説します。TeXを用いることで構造を意識した文書を書けるようになります。学位論文の執筆を控えている学生にも有意義なソフトウェアです。

基本的な文書の作成と言語学の論文で使う表現について扱う予定です。ウェブブラウザ上でTeXを動かせるサービスを用いて説明します。TeXにはいろいろな派生がありますが、今回はXeLaTeXについて扱います。

【準備していただくもの】

Cloud LaTeX https://cloudlatex.io/ のアカウントを作成しておいてください。

【資料】

https://www.dropbox.com/sh/5etvknavh7ypm1m/AAAipos0S6AQHIXgakOR7EEVa?dl=0

ELAN講習会(終了・録画公開)

日時: 2020/8/21 (金) 13:00から 1時間半程度

発表者: 木本幸憲(兵庫県立大学)

YouTubeで配信します https://youtu.be/a4SqxhLGn5Q

講習中の質問は https://app.sli.do/event/dc4fkejj にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

参考文献:『ELAN入門』(ひつじ書房)

ELAN: https://archive.mpi.nl/tla/elan/download

講習で使うファイル: https://www.dropbox.com/sh/vtswxs5oz3z0oi9/AAAT4_7yWDXkTedbGx5CJY2ga?dl=0

【内容】

主にフィールドワークに必要なELANの使い方を、メディアファイルをどう取り込むかという基礎的な内容から、単語分割、コーパスとしての用い方など発展的な内容まで取り扱います。

Field Linguist’s Toolboxとコーパス分析ツールの初歩 (終了・録画公開)

日時: 2020/7/18 (日) 13:00から 1時間半程度

発表者: 宮川創 (関西大学)

YouTubeで配信します https://youtu.be/i_isVre2W0w

講習中の質問は https://app.sli.do/event/oye70rq7 にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

講義資料: 講義資料へのリンク


【内容】

本ワークショップでは、言語資料のインターリニアグロスを自動で作ることができる形態素解析が組み込まれたソフトウェア・Field Linguist's Toolboxを一通り動かしてみたあと、Voyant Toolsなど簡易コーパス分析・視覚化ができるウェブアプリを学習します。

検索と置換 (正規表現) を用いたテキスト整形 (終了・録画公開)

日時: 2020/6/21(日) 13:00から 1時間半程度

発表者: 加藤幹治 (東京外国語大学大学院)

YouTubeで配信します https://youtu.be/CLixKgfWQSo

講習中の質問は https://app.sli.do/event/hrniihsx にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。


【用意していただくもの】

◆テキストファイルのDL https://gofile.io/d/ttu1x2

◆正規表現が使えるエディタ


【内容】

 テキストファイルの加工する際に、所定のフォーマットに従って一括置換したり、細かい表記ゆれや「ゴミ」を削除したりする場面があります。本WSでは、そのような場面において、正規表現の検索・置換を用いてテキストデータ (辞書、談話資料、論文 etc.) を手早く加工する方法を説明します。

 正規表現をある程度知っていることが望ましいので、「言語データ検索WS」(https://www.youtube.com/watch?v=2U6Xtud-8po&feature=youtu.be) を見ていただくとスムーズです

辞書づくりWS (終了・録画公開)

日時: 2020/5/24 (日) 13:00から (1時間半程度)

発表者: 中川奈津子 (国立国語研究所)

YouTubeで配信します https://youtu.be/qHpSVz6mqmw

講習中の質問は https://app.sli.do/event/8m3w90ij にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

加治工真市著『鳩間方言辞典』の編集をお手伝いした経験をもとに、エクセルで単語と例文を整理し、それを紙の辞書に変換する工程を、実際に画面を見せながら説明します。項目・例文入力をエクセルだけで完結させ、最後にTeX (Overleaf) に貼り付けるだけでできる紙の辞書づくりを提案します。紙版の校正をなくし、(電子データとしてより重要な) エクセルで校正することでエクセルデータを最新に保てます。エクセルで出来上がったものを貼り付けるだけなのでTeXの前提知識は一切不要です。もちろん知識があれば自分で改変して使うことができます。

言語データ検索WS (終了・録画公開)

日時: 2020/5/10 (日) 13:00から (一時間半程度を予定)

YouTubeで録画を公開しています: https://youtu.be/2U6Xtud-8po

講習中の質問は https://app.sli.do/event/ecxwvbxq にて受け付け、講師が随時反応します。匿名でも質問・コメント可能です。

準備すること:

  • コンピュータ (Windows, Macなど)

  • VSCodeをインストールする (メモ帳みたいなやつです)

  • データ (日本語諸方言コーパス): Slackに参加していただくと見られます。自分でダウンロードして作る方法もあります。(便利なツールなど)


第一部: 正規表現 (東京外国語大学大学院/日本学術振興会特別研究員 加藤幹治)

正規表現を使って言語データから幅を持たせた検索を行う方法を学びます。例えば、テキストの中から「お~になる」のような構文だけを抜き出すには通常の検索ではうまくいきませんが、正規表現で「お.*?になる」と検索すれば、「お書きになる、お知りになる」などが簡単に抜き出せます。


第二部: コーパス検索の手法 (国立国語研究所 中川奈津子)

さらに多くのファイルの用例採集の手間を省くための方法を学習します。第一部で覚えた正規表現を使って「行う」「行なう」「おこなう」のような表記揺れや、「書かない」「書きます」「書く」「書けば」「書こう」のような各語形を複数のファイルから一度に検索して、各方言の違いを見ます。基本的なパソコンの動作を知っていれば分かる超初心者向けです。