第19回YANSシンポジウムにゴールドスポンサーとして参加しました — HACK The Nikkei (original) (raw)

9 月 4〜6 日に大阪・梅田で開催された「第19回YANSシンポジウム」に、日本経済新聞社の研究開発部署「日経イノベーション・ラボ」がゴールドスポンサーとして協賛しました。 日経からは 6 人の社員が現地に赴き、ハッカソンを含めたプログラムに参加しました。 理研・NAIST との共同研究に関するポスター発表を行った他、スポンサー賞も授与しました。

ハッカソン

言語処理学会 30 周年記念事業として「YANS 分野交流ハッカソン」が初日に開催されました。 参加者は事前アンケートの結果に基づいて大喜利または川柳のどちらかの部門に振り分けられ、お題に応じて回答するシステムを 4 時間で実装しました。 日経からは情報サービスユニットの櫻井と日経イノベーション・ラボの大村が参加し、櫻井が所属したチームはライブ人手評価で最高スコアを獲得して優秀賞を受賞しました。

大喜利部門 優秀賞
チーム Say*2 Do*2(大塚 晴貴(愛工大), 高橋 利孔(はこだて未来大), 宮岡 佑弥(慶応大), 峯 悠大(NAIST), 塚越 柚季(東大), 櫻井 亮佑(日経))

ポスター発表

3 日目のポスターセッションでは、日経から共著の研究発表がありました。 発表タイトルは「企業沿革のグラフ構造化に向けた企業変遷イベント抽出タスクの構築と分析」で、理化学研究所(理研)と奈良先端科学技術大学院大学(NAIST)との共同研究です。 これまでの成果物は言語処理学会の論文誌に採択されており、更なる発展を見据えての取り組みの一つです。

澤田 悠冶, 安井 雄一郎, 大内 啓樹, 渡辺 太郎, 石井 昌之, 石原 祥太郎, 山田 剛, 進藤 裕之 (2024).
企業名の類似度に基づく日経企業IDリンキングシステムの構築と分析. 自然言語処理, 2024, 31巻, 3号.

聴講参加者としては、約 200 ものポスター発表を通じて、自然言語処理に関する多種多様な研究を堪能しました。 参加した 6 人の社員はそれぞれの興味関心があり、研究開発だけでなく事業活用の観点も踏まえて、多くの発表を聴講しました。

スポンサーとして

ゴールドスポンサーとして、スポンサーブース展示・スポンサーセッション登壇・スポンサー賞授与を担当しました。

スポンサーブース展示

2、3 日目にはスポンサーブースで、日経の自然言語処理に関する取り組みを紹介するポスターを展示しました。展示したポスターは公開済みですので、ご関心あれば是非ご覧ください。

スポンサーセッション登壇

2 日目のスポンサーセッションで、以下の資料を用いて石原が 1 分間の発表を担当しました。

yans2024_sponsor_session

スポンサー賞授与

3 日目のクロージングでは、以下の発表に日本経済新聞社日経イノベーション・ラボ賞を授与しました。

[S2-P15] 語順に制約されない大規模言語モデルの知識編集
石垣 龍馬 (東京電機大), 鈴木 順大 (東京電機大), 酒造 正樹 (東京電機大), 前田 英作 (東京電機大)

この研究は、英語をはじめとする SVO 言語を前提とした大規模言語モデルの知識編集の既存手法を拡張し、任意の語順の言語に適用可能とした手法を提案しています。 日経でも独自の大規模言語モデルの構築に取り組む上で経時変化する関係知識への対処が課題となっており、語順の制約を外す提案手法の発想や日本語での実験結果に大きな有用性を感じました。 今後の更なる発展への期待も込めて、スポンサー賞に選定しました。

スポンサー賞の選考は、日経イノベーション・ラボに所属する石原と大村が主に担当しました。 選考では、事前に利益相反を踏まえて候補を絞り込んだ後、タイトルから日経の事業における有用性を推測し、優先的にポスター発表を聴講する約 50 件の発表を選びました。 そして実際にポスター発表を聴講した後、お互いに数件の賞候補を持ち寄り、協議の結果として当該の発表への授与を決めました。 最終選考では、以下の 7 件の発表も賞候補に挙がりました。

[S1-P10] 不均衡最適輸送を用いた意味変化検出
岸野 稜 (京大), 山際 宏明 (京大), 永田 亮 (甲南大/理研), 横井 祥 (東北大/理研), 下平 英寿 (京大/理研)

[S1-P23] 強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上
齋藤 幸史郎 (東工大), 小池 隆斗 (東工大), 金子 正弘 (MBZUAI/東工大), 岡崎 直観 (東工大)

[S2-P24] 有価証券報告書を対象とした質問応答タスクのデータセット構築とLLMを用いた手法の評価
佐藤 栄作 (小樽商大), 木村 泰知 (小樽商大)

[S2-P12] データセット共有基盤を用いた参加型コードLLM開発の提案
伊東 和香 (日本女子大), 小原 有以 (日本女子大), 西潟 優羽 (日本女子大), 佐藤 美唯 (日本女子大), 相馬 菜生 (日本女子大), 倉光 君郎 (日本女子大)

[S3-P08] Attentionに基づく大規模言語モデルのHallucination検出手法の検討
小笠 雄也 (阪大), 梶原 智之 (愛媛大), 荒瀬 由紀 (東工大)

[S4-P22] 大規模言語モデルに対する漏洩検出への敵対的なデータ隠蔽
高橋 侑成 (東工大), 馬 尤咪 (東工大), 金子 正弘 (MBZUAI/東工大), 岡崎 直観 (東工大)

[S5-P14] 言語モデルの日本語道徳理解能力の評価データセットの構築
竹下 昌志 (北大), ジェプカ ラファウ (北大)

副賞として、石垣さんらには後日「日経社員が選ぶ書籍詰め合わせ」を贈呈します。 日経 BP から出版された書籍や、日経社員が執筆した技術書、その他自然言語処理に関する名著など、20 冊程度をまとめてお贈りする予定です。

おわりに

YANS シンポジウムのスポンサーは日経として初でしたが、非常に有意義な時間を過ごすことができました。 運営、発表者、参加者の皆様に、改めてお礼申し上げます。

日本経済新聞社はウェブやメディアに関連する先端技術を探究しつつ、積極的な事業活用に挑戦しています。 メディアの未来を作る仕事に関心のある方は、是非お気軽にご連絡ください。 インターンやカジュアル面談なども募集中です。