# 言語資源ワークショップ 2016
<https://clrd.ninjal.ac.jp/lrw2016.html>
> 国立国語研究所言語資源開発センターでは、2011年度より年2回、計8回にわたって「コーパス日本語学ワークショップ」を開催しました。このワークショップの後継として2016年度より年1回「言語資源ワークショップ (Language Resources Workshop: LRW)」を開催いたします。
<https://clrd.ninjal.ac.jp/lrw2016-programme.html>
アブストラクト集(pdf):<https://clrd.ninjal.ac.jp/lrw/LRW2016_abstract.pdf>
言語資源活用ワークショップ2016発表論文集: <https://repository.ninjal.ac.jp/search?page=1&size=20&sort=custom_sort&search_type=2&q=244>
[[语言资源活用交流会]](語彙資源活用シンポジウム),更有意思。
## 有意思的论文
> 『日本語諸方言コーパス』の構築について
> 発表では,『日本語諸方言コーパス』の基本設計やデータ整備上の問題点,コーパスの試験的な活用について報告する。
『日本語諸方言コーパス』の基本設計やデータ整備上の問題点
> 発話文自動生成のための日本語表現文型辞書の作成
日本語表現文型辞書
> 機械翻訳用超大規模辞書データ資源
> 春遍雀來(日中韓辭典研究所)
知り合いな
> 多重の読みを持つテキストのコーパス化
多重の読み
> 日本語コーパスの包括的検索環境の実現に向けて
> 本発表では,検索対象となる予定のコーパスを紹介した後に包括的検索環境の実現に向けてどのような問題があるかを検討し,解決の方向性を探る。
> 『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討---近松コーパスを例として---
> 具体的には類似ドメインの汎用解析用辞書
> から始め,段階的に学習用コーパスを限定していく追加学習を繰り返すことで,対象となる資料に特化した解析用辞書を構築する。今回は,近世上期上方資料である近松門左衛門の世話物、浄瑠璃を対象とし,『洒落本解析用 UniDic』から『近松解析用 UniDic』の構築について述べる。
Unidicに追加
> 言語資源の設計・再設計と言語資源を活用した実習授業の設計
> このコーパスのモダリティラベル体系は,最初の設計から 7 回も改訂され,今に至っている。各々の再設計が必要になった理由について,言語学的観点と工学側からの要請を軸に話したい。2 つめのトピックは,計算言語学や自然言語処理に興味を持ってもらえるような実習授業の設計である。
ラベルの改訂の理由
> 全文検索システム『ひまわり』における言語分析支援機能の拡張
全文検索
> 『日本語日常会話コーパス』収録の進捗状況
> 本発表では,こうして定めた収録方法の概要を述べるとともに,これまでに終了した 13 名の調査協力者による約 200 時間の収録について進捗状況や生じた問題などを報告する。
収録について生じた問題
> 形態素解析ソフトウェア 『Web茶まめ』の改良とWeb APIの試作
> 外部の Web サイトやアプリケーションは,試作した WebAPI を用いて『Web 茶まめ』サーバと HTTP 通信を行うことで,『Web 茶まめ』の機能を利用可能となる。
Web茶まめAPI TODO