news シナモンAIからのお知らせ

  • ニュース

自然言語処理分野のトップ国際会議「EMNLP 2023」のIndustry Track部門に論文採択

論文原題:Towards Safer Operations: An Expert-involved Dataset of High-Pressure Gas Incidents for Preventing Future Failures

 当社は、大規模言語モデル(LLM)を応用した製造業におけるトラブルサーチソリューションを開発する、当社の 「IncidentAI」 研究チームによる論文 『より安全な運用へ向けて:事故を未然に防ぐためのナレッジを活用した高圧ガス事故データの活用』 が、自然言語処理分野のトップ国際会議「EMNLP 2023」の Industrial Track部門 に採択されたことをお知らせします。

 EMNLP(Empirical Methods in Natural Language Processing)は、世界中のトップ企業や研究員、開発者が多数参加する、自然言語処理分野(NLP)の最難関国際会議で知られています。この度採択された 「Industry Track部門」 は、製造分野におけるNLPを応用した革新的なアプリケーションを発表するセッションで、特に今年度は急速に発展する大規模言語モデルの実用性のあるアプリケーションに関する論文の投稿が奨励されるなど、大きな注目を集めていました。

当社では引き続き、ドメインナレッジ(業界・企業の持つ特有知識や知見)を有効活用していくための研究開発を強化するとともに、ビジネスシーンでの実用的なAIソリューションを提案してまいります。

研究概要:ドメインナレッジを活用したデータセットが事故防止に有益であることを証明
 これまで、AI開発において一般的に入手しやすいコーパス(自然言語の大規模なデータベース)では、製造分野における安全予測へのAI活用は、専門的な知識を必要とする実務での利用に足る情報整理がなされていないため難しいとされていました。今回発表の論文では、シナモンAIの研究チームが企業や専門家とともに構築したデータセットが、高圧ガスプラントの事故報告の分析に有益であることが証明されています。本データセットは、実際の事故報告データ*を元にしており、専門家により構築されたデータセットが、事故を予防する安全予測分野において、実用的なシステムとして稼働することが分かりました。

 当社研究チームは、固有表現認識(NER)、原因結果抽出(Cause & Effect)、情報検索(IR)の3つタスクを活用し、データセットの構築を行いました。これらのデータセットを活用することで、自然文(話し言葉のような文章)で記載された事故情報の構造化・分析・活用を一貫して実現することができます。今回の論文より、事故報告や事故予防の解析のみならず、様々な専門知識を必要とする用途において、NLP技術の適用範囲が大きく広がることが証明されました。

*高圧ガス保安協会が 2022 年に発行した高圧ガス事故に関する一般公開されている報告書から収集
※論文で発表したデータセットはコチラのページで公開されています。