◆◇技術開発部会:自然言語処理分科会セミナーのご案内◇◆
ALAGIN 技術開発部会 自然言語処理分科会では、言語処理研究の最前線で
ご活躍の若手の先生方を講師としてお招きして、合計4回、5日間にわたるセミナーを
以下の通り開催いたしますのでご案内いたします。
特に、プログラミングや情報科学の知識はあるが自然言語処理に関してはあまり知らない
といった会員企業の研究者、開発担当者の皆様や、特別会員の研究室の学生の皆様を対象とした
セミナーとなる予定です。
奮ってのご参加をお待ち申し上げております。
===============
第1回セミナー
===============
「自動獲得知識に基づく頑健な日本語実テキスト解析」
Webの発展、およびそれに伴うブログ、SNSなどの一次情報源の爆発的増加によって、
新語、口語表現、非正規表現、顔文字など、さまざまな言語表現バリエーションが
テキスト中に溢れている。これらのテキストに対する実用的なアプリケーションを
構築するためには、言語表現バリエーションを頑健に処理できる解析システムが
必要となる。我々は、WebおよびWikipediaから、新語や固有名詞を含む辞書を
自動的に構築し、この辞書を用いた形態素解析システムを開発している。
このシステムは、連濁・オノマトペ・長音化などの非正規表記の自動認識機能も
備えており、幅広いドメインの文書を頑健に解析することができる。
また、Web70億文から自動構築した格フレーム辞書に基づく統計的な構文・
格解析システムを開発しており、係り受け・格関係を高精度に解析することができる。
本セミナーでは、一般公開しているこれらの形態素解析システム(JUMAN)、構文・
格解析システム(KNP)の詳細および使用方法について説明する。
※Windows(XP以降)のマシンをお持ち下さいますと、実際に解析システムを試しながら講義を受講していただくことが可能です。
●日時:平成24年11月13日(火) 10:00 - 16:30
●講師:河原 大輔氏 ・ 柴田 知秀氏 (京都大学)
【シラバス】
- Webからの知識の自動獲得
- Webからの語彙獲得とその分類
- Wikipediaからの語彙獲得
- Webコーパスに基づく分布類似度計算
- 格フレームの自動構築
- 形態素解析
- 形態素解析の仕組み
- 形態素解析の辞書
- 連濁・オノマトペ・非正規表現の自動認識
- 形態素解析の使い方(実習付)
- 構文・格解析
- 構文・格解析の仕組み
- 構文・格解析の使い方(実習付)
- 上記の知識・解析に基づくアプリケーション
===============
第2回セミナー
===============
「ソーシャルメディアの自然言語処理」
本セミナーでは、言語処理技術を用いたWebアプリケーションについて、
Twitterを例にして解説します。
近年、Twitterを材料とした多くのWeb応用アプリケーションが提案されています。
しかし、応用面を重視するあまり、深い自然言語処理など本格的な情報処理技術を導入した
サービスは少ないのが実情です。そこで、本セミナーでは「カゼミル」「インフルくん」
「流言情報クラウド」「スナイパー」など、自然言語処理を導入したWebサービスの事例を
紹介し,サービスを構築する際に必要なノウハウから,競争力の高いサービスに必須となる
言語処理の利活用について解説します。
※マシンをお持ち下さいますと、実際に課題データを試しながら講義を受講していただくことが可能です。
●日時:平成24年11月14日(水) 10:00 - 16:30
●講師:荒牧 英治氏(東京大学/JSTさきがけ)
【シラバス】
- 材料の分析:Twitterとその性質
- 必要な技術:Twitter処理と関連のある自然言語処理技術
- 応用事例
- 応用事例:医療データを例に
===============
第3回セミナー
===============
「機械翻訳」
コンピュータによる自動翻訳、いわゆる機械翻訳は長年の夢であり、
自然言語処理の最初の応用先の1つである。1990~2000年代で著しい進化を遂げ、
言葉の壁がなくなる日が近づきつつある。
本セミナーでは機械翻訳、特に日英・英日翻訳の様々な課題について触れてから、
機械翻訳技術はこの問題にどのように対処しているかを解説する。
まずは10年前から広く使われているフレーズベース翻訳を説明し、
統語や階層的フレーズ、前並べ替えなど、最先端の技術も紹介する。
また、これらの技術を実装したオープンソースツールを使って自作の翻訳システムを
作成する場合の手順、落とし穴などについても紹介する。
※LinuxやMacマシンをお持ち下さいますと、実際に翻訳システムの構築を体験しながら講義を受講していただくことが可能です。
●日時:平成25年1月17日(木) - 18日(金) 10:00 - 16:30
●講師:グラム・ニュービッグ氏(奈良先端科学技術大学院大学)
【シラバス】
- 機械翻訳を実現するには何が必要?
- かな漢字変換(機械翻訳の簡易版として)
- フレーズベース統計的機械翻訳
- フレーズベースモデルの構築
- フレーズベース翻訳の訳文生成(デコーディング)
- 翻訳の評価
- チューニング
---------------------------------------------------
- 構文解析
- 階層的フレーズベース翻訳
- 統語情報の導入
- 前並べ替え
- 機械翻訳とビッグデータ
- これからの機械翻訳
===============
第4回セミナー
===============
「頑健な自然言語処理に向けた誤り検出・訂正(仮)」
統計的手法の登場によって、形態素解析や構文解析といった自然言語処理の
基盤技術が急速に進歩しました。新聞記事を対象にした自動単語分割の精度は
99%を超え、広く使われるようになりました。
しかし、ブログやSNSやTwitterなどのウェブテキストやメールなど、
くだけた表現や新語、スペル誤りが頻出するテキストを対象とした
解析はまだ発展途中です。
また、第二言語学習者の書く作文のように、スペル誤りだけでなく
文法誤りも混在するテキストを頑健に解析する技術は少ないのが現状です。
そこで、本セミナーでは、自然言語処理技術を用いてテキストの誤り検出・
訂正を行なうサービスを紹介し、その裏側で使われている理論を解説します。
また、誤り訂正を用いた頑健な自然言語処理に向けた課題についても議論します。
●日時:平成25年3月7日(木) 10:00 - 16:30
●講師:小町 守氏(奈良先端科学技術大学院大学)
※Mac OS X が搭載されているマシンをお持ち下さいますと、実際に解析システムを試しながら講義を受講していただくことが可能です。
【シラバス】
- 誤り検出・訂正の基礎知識
- スペル誤り訂正: 編集距離とノイジーチャネルモデル
- 文法誤り訂正: 大規模データと機械学習
- 誤り訂正のための大規模知識獲得
- 英語学習者の作文誤り検出・訂正
- 英語学習者の作文誤りの特徴と課題
- 意味解析と誤り訂正: 前置詞誤り検出・訂正
- 談話解析と誤り訂正: 時制誤り検出・訂正
- 日本語学習者の作文誤り検出・訂正
- 日本語学習者の作文誤りの特徴と問
- 形態素解析と誤り訂正: 系列ラベリングと誤り検出・訂正
- 構文解析と誤り訂正: 格助詞誤り検出・訂正
- 誤り訂正と頑健な自然言語処理
------------------------------------------------------------------
●会場:(財)テレコム先端技術支援センター(SCAT)本部5階会議室
〒160-0022 東京都新宿区新宿1-20-2 小池ビル
最寄り駅:東京メトロ丸の内線 新宿御苑前駅 【地図】
●定員: 各60名
●参加費: 無料
●備考:部分参加(例えば第1回のみの参加など)も可能です。
●申込み: 以下のフォームにて必要事項をご記入の上、
info@alagin.jp
までご送信ください。
※申し込み多数の場合は、先着順とさせていただきます。
************申込締切日******************
第1回・第2回 11/ 2(金)
第3回 1 / 7(月)
第4回 2 /25(月)
**************************************
=======自然言語処理分科会セミナー参加申し込みフォーム=======
(★のうち非該当のものがあれば削除ください)
★第1回自然言語処理分科会セミナーに参加します。
★第2回自然言語処理分科会セミナーに参加します。
★第3回自然言語処理分科会セミナーに参加します。
★第4回自然言語処理分科会セミナーに参加します。
・会員名(企業の場合は社名):
・参加資格:正会員 特別会員
・参加者のお名前・ふりがな:
・MACアドレス(PC持ち込みの方):
※実際に参加される方のお名前をご記入ください。
※法人、団体の場合は、10名まで参加が可能です。
※特別会員の場合は、特別会員以外にも9名まで学生の参加が可能です。
特別会員が参加しない場合は、学生10名まで参加が可能です。
<ご要望、ご意見記入欄>
============== 申し込みフォーム、ここまで ==============
●問い合わせ先:ALAGIN事務局 info@alagin.jp
|