コラム

Japio「AI翻訳サービス」体験レポート

はじめに

 皆様、お疲れ様です。nasaです。

 この度、Japio様(日本特許情報機構 様)から、当ブログを通じて連絡を頂きまして、「AI翻訳サービス」のモニター調査のお誘いをうけました。

 Japio様、ありがとうございます!

 そこで、この「AI翻訳サービス」の体験レポートを、当ブログで報告させて頂こうと思います。尚、同一内容の記事を note にも掲載予定です。ご承知おき下さい。

AI翻訳サービスの概要

 ではまず、「AI翻訳サービス」の概要からご紹介していきます。

 最初に注意点を1つ言っておきますと、この「AI翻訳サービス」は、単独のサービスではありません。「Japio世界特許情報全文検索サービス」という特許調査に用いるサービスのオプションサービスとなります。ですので、「AI翻訳サービス」を使用したいのであれば、「Japio世界特許情報全文検索サービス」を契約する必要があります。ただ、後に紹介しますが、「AI翻訳サービス」の機能を制限した無料サービスもあるので、試す程度にはどなたでも使うことができます。

 また、さらに、2021年4月より「Japio-AI翻訳」がリリースされました。これは「AI翻訳サービス」と同一内容のもので、オプションではなく単独サービスとなります。あくまでも、ここでの紹介は「Japio世界特許情報全文検索サービス」のオプションサービスでのレポートとなりますので、「Japio-AI翻訳」とは異なる部分があるかもしれません。あしからず。

 さて、概要を見ていきましょう。

 この「AI翻訳サービス」には、4つのポイントがあるようです。以下に、HPから抜粋したものを示していくと、

【ポイント1】(HPから抜粋)
 ・特許公報特化型AIエンジンにより、更に向上した翻訳品質
 ・特許公報の構文の正確性や流暢さが飛躍的に向上
 ・独自開発の言語資源とノウハウにより、特許特有表現も更に読みやすく

 ⇒ AI翻訳エンジンには、Transformer方式を採用しているとのことで、旧世代のSequence to Sequence方式を採用したAI翻訳エンジンよりも翻訳精度が向上しているとのこと。また、Japio独自のノウハウによりクリーンアップされた特許対訳コーパスにてAI学習させたので、より正確な訳文の生成が可能になったようです。さらに、独自開発しているXML翻訳フレームワークX(クロス)-STEP(ステップ) ® (XML Translation Framework with State-of-the-art Translation Engines and Automatic Claim Pre-editor)を適用させて特許特有表現の質の向上を図ったことや、AI翻訳と統計翻訳とのハイブリッドエンジンにすることで、訳抜けや訳語の繰り返しなどを低減させているとのことです。


【ポイント2】(HPから抜粋)
 ・多言語翻訳に対応


 ⇒ 対応言語の方向は、「英語 ⇒ 日本語」、「中国語(簡体字・繁体字) ⇒ 日本語」、「ドイツ語 ⇒ 日本語」、「日本語 ⇒ 英語」の4つとなっています。


【ポイント3】(HPから抜粋)
 ・各種出力形式に対応(PDF、Excel、txt)


 ⇒ 段落毎の対訳形式となっているPDF、訳文のみのPDF、段落毎の対訳形式となっているExsel、原文と訳文が記載されているtxtの4種類があります。詳細は後の動画内で紹介しています。


【ポイント4】(HPから抜粋)
 ・公報翻訳では、テキストのハイライト機能により、目的単語を素早く把握


 ⇒ 原文および訳文の単語をハイライトさせることができます。ハイライトできる単語数は10個までとなっています。こちらも、後の動画内で簡単に紹介しています。

 以上が、4つのポイントとなります。

 ところで、先ほど『「AI翻訳サービス」の機能を制限した無料サービスもある』といいましたが、それがこちらになります(リンク付き)。

 Japio-AI翻訳(無料版)

 こちらは、どなたでも利用できますが制限があります。それは、ファイル出力には対応していないことと、入力文字数が「200文字」までという制限です。1つのセンテンスを翻訳できる程度なので、お試し程度といったところでしょうか。また、「ドイツ語 ⇒ 日本語」は対応しておらず、「AI翻訳サービス」にはなかった「フランス語 ⇒ 日本語」と「ロシア語 ⇒ 日本語」が追加されています。

 それと、気になる利用料ですが、「Japio世界特許情報全文検索サービス」の定価の20%とのことです。業者毎に価格が分かれていて、月額にして、一般事業者は6000円、調査事業者は18000円、アカデミックは3000円のオプション料金が加算されるようですね。他の有料AI翻訳の多くは、月または年毎に利用文字数制限が設定されている中で、Japioの「AI翻訳サービス」はそのような制限がないので、なかなか魅力的かと思います。

 そして、単独サービスである「Japio-AI翻訳」の利用料ですが、月額11000円となるようです。さらに月当たりの文字数制限があり、1ヶ月で100万文字まで。個人が翻訳で使うことを想定すると、十二分の文字数かと思われます。ただし、月額は安くはないですね。他社の専門分野のエンジンを搭載したサービスと比較すると、月当たりの利用可能文字数が多いことは確かです。

AI翻訳サービスの使用感

 次に、「AI翻訳サービス」の使用感を紹介したいと思います。触ってみた感触としては、シンプルで扱いやすいと感じました。基本的に「AI翻訳サービス」は、特許調査で外国語文献の内容を把握するためのものと思われるので、そのための機能は、備わっているのではないかという印象です。

 ただ、翻訳者目線からすると、扱いにくい部分もあります。例えば、ファイル翻訳機能がないことや、翻訳結果や出力ファイルがセンテンス毎に出力されないことです。他にも、用語登録機能や、翻訳メモリ機能、学習機能などあればと思いますが、そうなると利用料が大幅に高くなりそうですし、そもそも翻訳者用としてのオプション機能ではないと思われるので、必要のない機能なのかなと。そうは言ったものの、現在の仕様でも工夫すれば、翻訳にも役立てそうな気はしています。

 さて、実際に触ってみたところを動画に収めましたので、ご覧いただけたらと思います。ではどうぞ!



WO2016168723A1 を Japio「AI翻訳サービス」で翻訳してみた

 実際に翻訳させて、訳文を確認したいと思います。原文として使ったのは WO2016168723A1 の[0002]、[0007]、[0058]、[請求項1]となります。翻訳文のJP2018518797AAI翻訳サービスの生成文の差分(太文字で表示)に注目しながら、見てきたいと思います。

 表記上の注意として、
 []⇒ 翻訳文には有り、生成文には無いもの
 《》⇒ 翻訳文には無く、生成文に有るもの
 {}⇒ 翻訳文とは位置が異なるもの

 となっています。

 それでは、見ていきましょう。

[0002]
Cleaner forms of storing energy are in great demand.

【翻訳文】
クリーンな形態のエネルギー貯蔵は、大きな需要がある。

【生成文】
エネルギーを貯蔵する掃除機の形態が大いに要求されている。

・コメント
「Cleaner」が掃除機となってしまいました。AI翻訳では用語が不適切であることは、よくあることです。AI翻訳を使う上で注意すべき点の1つですね。それと、生成文が直訳調で、日本語として不自然ですが、意味を把握するには十分であるとも言えます。


Examples of clean energy storage include rechargeable lithium (Li) ion batteries (i.e., Li-secondary batteries), in which Li+ ions move from a negative electrode to a positive electrode during discharge.

【翻訳文】
クリーンエネルギーの貯蔵の例としては、放電中にLi+イオンが負極から正極に移動する充電式リチウム(Li)イオン電池(即ち、Li二次電池)が挙げられる。

【生成文】
清浄なエネルギー[の]貯蔵の例[としては]は、放電中にLi[+]イオンが負極から正極に移動する《再》充電可能なリチウム(Li)イオン電池(すなわちLi二次電池)を含む

・コメント
「Li+」の「+」が抜けていますね。こういった記号は抜けることがあるので注意が必要です。また、「include」を「~を挙げる、~が挙げられる」と訳すことがありますが、AI翻訳では「~を含む」という訳語をあてることが多いと思われます。もし積極的に「~を挙げる、~が挙げられる」としたければ、カスタマイズ可能な翻訳エンジンを使用する必要がありそうです。


In numerous applications (e.g., portable electronics and transportation), it would be advantageous to use a solid state Li ion battery which includes solid state materials such as solid state electrolytes as opposed to one that includes liquid components, (e.g., flammable liquid electrolytes).

【翻訳文】
多数の適用例(例えば、携帯型電子機器及び輸送機関)では、液体成分(例えば、可燃性液体電解質)を含む電池とは対照的な固体材料、例えば、固体電解質を含む固体Liイオン電池を使用することが有利であろう。

【生成文】
多くの用途(例えば、携帯用エレクトロニクスおよび輸送)では、液体成分(例えば、可燃性液体電解質)を含むものとは対照的固体電解質などの固体材料を含む固体Liイオン電池を使用することが有利であろう。

・コメント
生成文の「携帯用エレクトロニクスおよび輸送」の「および」ですが、このような接続詞は、AI翻訳では、漢字と平仮名で表記がゆれることがあります。AI翻訳によっては、漢字または平仮名に指定できるものもありますが、注意すべき点の1つです。なお「as opposed to」の訳は、「生成文」の方が良さそうですね。


Using entirely solid state components improves battery safety and energy density, the latter of which is due in part to reduced electrode and electrolyte volume and weight.

【翻訳文】
完全に固体の成分を使用することにより、電池の安全性及びエネルギー密度が向上する。このエネルギー密度の向上の一因は、電極及び電解質の体積及び重量の減少によるものである。

【生成文】
完全に固体の状態の構成要素を使用すると、電池の安全性およびエネルギー密度が改善され後者は、部分的には、電極および電解質の体積および重量減少することによる

・コメント
翻訳文は、関係代名詞で文を分けているようです。生成文では、1文となるようにしていますね。どのAI翻訳も基本的に、関係代名詞で文を分けることはしないと思います。


[0007]
The present disclosure relates generally to the fabrication of components for lithium rechargeable batteries.

【翻訳文】
本開示は、一般に、リチウム充電式電池用の成分の製造に関する。

【生成文】
本開示は、概して、リチウム再充電可能電池用の部品の製造に関する。

・コメント
先にも言いましたが、AI翻訳では用語をよく間違えます。ここでは、「成分」と「部品」との違いがありますが、この文だけでは判断できませんね。どちらも合っているように思えます。この用語を決定するには、文脈から判断することになると思いますが、大まかな意味を理解するには十分であるともいえます。


Specifically, the present disclosure relates to the fabrication of setter plates which include lithium stuffed garnet oxides and to the use of these setter plates to sinter solid electrolytes or solid electrodes for lithium rechargeable batteries.

【翻訳文】
特に、本開示は、リチウム充填ガーネット酸化物を含むセッタープレートの製造、及びリチウム充電式電池用の固体電解質又は固体電極を焼結するためのこれらのセッタープレートの使用に関する。

【生成文】
特に、本開示は、リチウム充填ガーネット酸化物を含むセッタープレートの製造、およびリチウム再充電可能電池用の固体電解質または固体電極を焼結するためのこれらのセッタープレートの使用に関する。

・コメント
「生成文」をいくつか見てきましたが、直訳調ではありますが、文構造に沿った明細書として読める訳文が生成されていますね。もちろん用語の間違いはありますが、特に、専門分野の特許を読む場合は、多少の用語の違いがあろうとも、容易に間違いを脳内変換し、正しく意味を捉えられるのではないかと思います。


In some examples, the setter plates described herein are useful for preparing thin, dense films of lithium-stuffed garnet oxides which are highly Li+ ion conductive and have a low area- specific resistance (ASR).

【翻訳文】
一部の例では、本明細書で説明されるセッタープレートは、Li+イオン伝導率が高くて、低い面積当たりの抵抗(ASR:area-specific resistance)を有するリチウム充填ガーネット酸化物の高密度薄膜の形成に有用である。

【生成文】
いくつかの例では、本明細書に記載されるセッタープレートは、高度にLi イオン伝導性であり、低い面積比抵抗(ASR)を有するリチウムスタッフ化ガーネット酸化物の薄く高密度のフィルム調製するのに有用である。

・コメント
生成文ですが、意味を把握するだけならば、それなりに使えそうな訳です。ただ、翻訳するまでは行かないまでも、もっと正確に意味を把握したい場合は、何らかの工夫が必要ですね。具体的方法は、別の機会にご紹介したいと思います。


[0058]
Ion (e.g., Li+) mobility is typically lower in solid state electrolytes compared to ion mobility in conventionally used, flammable, liquid electrolytes.

【翻訳文】
イオン(例えば、Li+)移動度は、典型的には、従来使用されている可燃性液体電解質のイオン移動度と比較して固体電解質で低い。

【生成文】
イオン(例えば、Li )移動度は、一般に、従来使用されている可燃性《の》液体電解質におけるイオン移動度と比較して《、》固体電解質においてより低い。

・コメント
ここでも「Li+」の「+」が抜けているのですが、どうやら訳文を生成するときに使った原文に「+」が入っていなかったようです。この生成文は、特許文献番号を入力して生成させたものですが、「+」上手く認識されていないようです。


To compensate for this lower ion mobility, the solid electrolyte dimensions, such as the thickness of a film, are reduced (from approximately 200 microns or 100 microns to approximately 50 microns or 10 microns) so that a significantly reduced ion migration distance through the solid state electrolyte (compared to the conventional liquid electrolyte) compensates for the lower mobility.

【翻訳文】
この低いイオン移動度を補うために、固体電解質の寸法、例えば、膜の厚みが、(従来の液体電解質と比較して)該固体電解質を通るイオン移動距離の著しい短縮が低い移動度を補うように(約200μm又は100μmから約50μm又は10μmに)減少されている。

【生成文】
この《より》低いイオン移動度を補償するために、膜の厚さなどの{固体電解質[の]寸法を}{縮小し(約200ミクロンまたは100ミクロンから約50ミクロンまたは10ミクロン)}それにより、(従来の液体電解質と比較して)固体電解質を通るイオン移動距離を著しく減少させてより低い移動度を補償する

・コメント
「so that」の訳し方の違いにより、言葉の並びが大きく変わっています。こういった代表的な構文の生成パターンを把握しておくと、AI翻訳を一層使いこなせるのではないかと思います。


The result is a solid state electrolyte that provides energy delivery rates (i.e., power) comparable to, or superior to, energy delivery rates of secondary batteries using flammable, liquid electrolytes.

【翻訳文】
この結果、可燃性液体電解質を使用する二次電池のエネルギー送出量に相当する又は上回るエネルギー送出量(即ち、出力)を提供する固体電解質となる。

【生成文】
その結果、可燃性液体電解質を使用する二次電池のエネルギー送達速度匹敵する、またはそれより優れたエネルギー送達速度(すなわち電力)を提供する固体電解質が得られる

・コメント
これまで「and」や「or」などの接続詞が、何度か登場してきましたが、仮名が「平仮名」で生成され続けていますね。もしかしたら、接続詞は平仮名で訳出しやすくなっているのかもしれません。なお、AI翻訳では「です、ます調」や「である調」とで、揺らぐことが多いことと思いますが、この「AI翻訳サービス」では「である調」で統一しているとのコメントをJapio様より伺っています。


1.
A setter plate for fabricating solid electrolytes of a rechargeable battery, the setter plate comprising:
 a Li-stuffed garnet compound characterized by the formula LixLayZrzOt Α1203, wherein 4<x< 10, Ky<4, Kz<3, 6<t<14, 0<q≤l;
 a surface defined by a first lateral dimension from 2 cm to 30 cm and a second lateral dimension from 2 cm to 30 cm; and
 a thickness from 0.1 mm to 100 mm.

【翻訳文】
充電式電池の固体電解質を製造するためのセッタープレートであって:式LixLayZrzOt・qAl2O3(式中、4<x<10、1<y<4、1<z<3、6<t<14、0≦q≦1)によって特徴付けられるLi充填ガーネット化合物;2 cm~30 cmの第1の横寸法及び2 cm~30 cmの第2の横寸法によって画定された表面;並びに0.1 mm~100 mmの厚みを有する、前記セッタープレート。

【生成文】
二次電池の固体電解質を製造するためのセッタプレートであって、セッタープレートは以下を含むことを特徴とする:式LixLayZrzOt Α1203によって特徴付けられるLi緩衝ガーネット化合物であって{4<x<10、K y<4、Kz<3、6<t<14、0<q≦1である、}ガーネット化合物;2cm~30cmの第1の横寸法及び2cm~30cmの第2の横寸法によって画定される表面;また、厚さは0.1mm~100mmである

・コメント
特許請求の範囲の翻訳は、AI翻訳では、なかなか難しいものがあります。そのため、請求項用にカスタマイズした翻訳エンジンを備えるAI翻訳もあります。Japioの「AI翻訳サービス」もその1つで、「~ comprising: 」は「以下を含むことを特徴とする」といったように、クセのようなものがあります。このようなクセも把握しながら、上手くAI翻訳を活用したいですね。


最後に

 如何だったでしょうか。私の感想は、翻訳文としてはそのまま使うことができないのは当然ですが、内容把握には十分な訳質であると感じました。やはり、特許に限定していることもあり、特許に関しては、汎用的なGoogleやDeepLよりも訳質は良いのではないかと。

 そして、もし翻訳に活用するとなると、理想的には、編集機能、用語登録機能、翻訳メモリ機能の搭載や、出力形式の調整などが必要であると思います。ただ、現状でも工夫次第では何かと使えそうですし、翻訳対象の外国語の類似特許を翻訳して内容を確認するには、大いに活躍してくれそうです。

 何にせよ、Japio の「AI翻訳サービス」には、好印象を持っています。このレポートには掲載していませんが、他のAI翻訳エンジンと比較した結果、訳質は良い方であるし、他のAI翻訳エンジンと良い意味で違った結果を示してくれます。使い方によっては、良い相棒になりそうな予感がしました。

 最後に、Japio様、試用IDを発行して頂き、誠にありがとうございました。

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

コラムカテゴリー

PAGE TOP