高精度な英文特許自動翻訳サービスをセキュアなクラウド環境で提供知財ニュース

情報通信研究機構、みらい翻訳、日本特許翻訳、化学情報協会は、高精度でセキュアな英文特許自動翻訳サービスを開発した。外国公報全体を表や数式、図も含めて正確な日本語に翻訳し、セキュアなクラウド環境を通じて提供する。

» 2017年02月01日 09時00分 公開
[MONOist]

 情報通信研究機構(NICT)、みらい翻訳、日本特許翻訳、化学情報協会は2017年1月18日、高精度でセキュアな英文特許自動翻訳サービスを開発したと発表した。提供開始は同年4月からを予定している。

 NICTは、特許庁との協力合意に基づく研究成果を生かして、従来の10倍以上を超える3.5億文の日英特許対訳データを構築した。また、NICTの持つ「語順変換と訳語選択の独立実行による統計翻訳技術」をさらに改良し、コアとなる自動翻訳エンジンを開発した。

 みらい翻訳は、この英日特許自動翻訳エンジンを、同社データセンター内に設置した翻訳サーバを用いて、セキュアなクラウドサービスとして提供する。さらに日本特許翻訳では、特許特有の長文を解析し、これに「訳抜け」を防止し高精度な文章を生成するMT Plus技術を適用して、特許公報の表記通りの正確な日本語訳を提供する。

 今回開発した自動翻訳エンジンでは、MT Plus技術と化学情報協会の化合物表記翻訳システムを連携させて、従来の統計的自動翻訳エンジンでは正確な翻訳が難しかった重要低頻度語の問題を改善。主に、医薬/化学分野の文献や物質検索、特許調査などに必要な化合物表記の厳密な翻訳が可能になった。さらに、米国特許商標庁、欧州特許庁などの外国公報XMLに準拠し、テキストだけでなく、表や数式、図を含めた外国公報全体を正確に翻訳できるようになっている。

 みらい翻訳と日本特許翻訳は、2017年4月から米国特許公報、欧州特許公報、国際出願公報の英日自動翻訳サービスを提供する。NICTでは、多分野・多言語での長文翻訳の品質をさらに改善する研究を進めるとしている。

photo 英文特許自動翻訳サービスのイメージ図

Copyright © ITmedia, Inc. All Rights Reserved.