AI解析サービス【AMATERAS RAY】を触ってみた

 こんにちは。新型コロナウイルス感染拡大による3回目の緊急事態宣言が延長され、季節は梅雨となりました。外出する機会は少ないものの、紫陽花が色鮮やかに咲いているのを見ると、梅雨も悪くはないなと思う今日この頃です。

 さて、今回はAIデータ解析サービス「AMATERAS RAY」の概要と触ってみての感想をまとめました。 新型コロナウイルスの流行により在宅勤務を余儀なくされ、DXが推し進められている昨今。AIはこれまで以上に注目を集めています。筆者が所属するプロジェクトのクライアントともAIが話題に上がり、身近ですぐに構築できるAIを探していたところ、「AMATERAS RAY」という便利サービスを発見したので早速試してみました。

「AMATERAS RAY」とは?

 「AMATERAS RAY」とは、機械学習を用いて学習用データから最適な予測結果を算出する、aiforce solutions社のAIデータ解析サービスです。

 機械学習とは、学習させたいデータを解析し、その結果を学習する技術のことで、学習した結果を基に予測や分類をすることができます。機械学習には大きく「教師あり学習」「教師なし学習」「強化学習」の3つがあり、AMATERAS RAYでは「教師あり学習」が利用されています。

 AMATERAS RAYは専門知識を必要とせず、3ステップで予測結果を算出することができるため、営業部門や生産管理部門、マーケティング部門だけでAIを活用することができます。また、価格も月20万円~と比較的安価のため、導入しやすいメリットもあります。

「AMATERAS RAY」導入企業と実績

 では、AMATERAS RAYはどのような企業へ導入されているのでしょうか。現在は、小売業から製造業まで幅広い業種の20を超える企業に導入されています。ここでは大企業2社の導入実績を見ていきましょう。

B-Rサーティワンアイスクリーム株式会社:商品ごとの出荷量予測

商品の生産管理・在庫管理を行うため外部のデータ分析サービスを導入していたが、AMATERAS RAYで内製化することで、データ分析サービスの外部委託費の大幅な削減と、出荷量構成比の予測頻度の改善を達成。AMATERAS RAYに実装されている最先端のアルゴリズムであるLGBM(決定木アルゴリズム)を利用し、予測の誤差を「0.0069以下」に抑えた高精度な予測を実現。

本田技研工業株式会社:知財権利維持の業務量削減

知的権利維持のためには、毎年各国の特許庁に「年金」と呼ばれる維持費を支払う必要があり、膨大なコストがかかる。約5万件の知財権利の要不要判断業務量削減のため、AMATERAS RAYを導入。その結果、約5万件を人手で判断していたものが、1万4500件に減り、業務量70%削減に繋がった。

「AMATERAS RAY」を触ってみた

 それでは、AMATERAS RAYで桜の開花日予測を行い、精度を確かめたいと思います。

 地方7都市(札幌・仙台・東京・名古屋・大阪・広島・福岡)の2000~2020年までの2~4月の平均気温・最高気温・2/1から開花日までの日数のデータを読み込ませて学習させ、2021年2月1日から桜の開花日までの日数を予測させます。AMATERAS RAYで予測した桜の開花日までの日数から開花日を算出し、実際の開花日と比較します。

各情報は気象庁のHP(https://www.jma.go.jp/jma/index.html)を参照しています。

 

 初めに、AMATERAS RAYでは「学習用データ」と「予測用データ」が必要となります。それぞれのデータには、以下の情報が記載されている必要があります。

    • 目的変数 … 予測させたい対象のこと。(今回は、2/1から開花日までの日数)
    • 説明変数 … 目的変数を求めるために必要な情報のこと。(今回は、2~4月の平均気温と最高気温と都市名)
    • インデックス … データをナンバリングすること。

 上記3つのデータを記載した学習用データと予測用データは以下のように作成しました。

・学習用データ

 

・予測用データ

 

 それでは実際にAMATERAS RAYに学習用データと予測用データを読み込ませていきましょう。

AMATERAS RAYにログインすると、このような画面が出てきます。

 

画面左上の「新しくプロジェクトを作成する」ボタンをクリックし、プロジェクトを作成します。

学習用データは最低100件は必要だそうで、今回はこのデータを作成するのに苦労しました。

 

Fileには先程の学習用データを選択し、プロジェクト名は「桜の開花日予測」と入力し、「作成」ボタンをクリックします。

 

無事プロジェクトが作成されました。

※因みに、プロジェクトを作成することができるファイルの拡張子は「.csv」「.xlsx」「.xls」「.atm」のいずれかとなります。

 

作成したプロジェクトを選択するとこのような画面になります。

 

「INDEX」はIndexに、「2/1から開花日までの日数」は目的変数に設定します。

また、AMATERAS RAYが学習用データとして扱うことができるのは、データ型が「数値」または「カテゴリ」のもののみのため、データ型が「日付型」の「開花日」については、今回は不使用とします。

以上で学習用データの設定が終了しました。

 それでは学習用データをAMATERAS RAYに読み込ませて学習させていきます。

まずはAIモデル構築画面を表示します。

 

 AMATERAS RAYには12のアルゴリズムが設定されており、学習用データに応じて最適なアルゴリズムを選択することができます。設定されているアルゴリズムは以下です。

    • SVR … 汎用性が高く、非常に優れたアルゴリズム。ただし時間がかかる。
    • KNeighbor … 近傍点の数から多数決で予測する、古典的かつシンプルなアルゴリズム。
    • Lasso … 線形回帰の一種で、L1正則化を使用し、特徴量を絞り込んで学習する。
    • Ridge … 線形回帰の一種で、L2正則化を使用することで過学習を抑制する、信頼度の高いアルゴリズム。
    • ElasticNet … 線形回帰の一種でL1正則かとL2正則かの特徴を併せ持つ。
    • BayesianRidge … 線形回帰の一種で、ベイズの定理を使用した確立的手法を採る。
    • RandomForest … 決定木の一種で、弱い学習器を集めて統合することで、高い汎化性能を発揮する。
    • AdaBoost … 決定木の一種で、弱い学習器を連続させることで、一つ前の学習器を修正するように学習する。
    • GradienBoosting … 勾配ブースティングの一種で、勾配法を使って誤差を最小化するように学習する。
    • XGBoost … 勾配ブースティングの一種で、高速・高性能なアルゴリズム。
    • DeepLeaning … 学習するレイヤーを深くすることで、理論上あらゆる数式を近似できる。
    • LightGBM … 勾配ブースティングの一種で、高速で高い精度を安定して出すことができる。

 

 今回は全てのアルゴリズムを選択し、「学習を実行する」をクリックして、学習させます。

 

学習中は中心がぐるぐると回転しています。

 

学習が終了するとこんな画面になります。今回学習にかかった時間は約3分でした。非常に速いですね。

 

 次に、学習させた全てのアルゴリズムについて、ホールドアウト検証を行います。ホールドアウト検証を行うことで、それぞれのアルゴリズムの詳細を確認することができます。

 

 ホールドアウト検証が終了し、各アルゴリズムの詳細が表示されました。学習精度が高いアルゴリズム順に上から表示されます。

 

 今回最も学習精度が高いアルゴリズムは「RandomForest」だったので、このモデルをデプロイします。

 

 最後に「データ予測」画面を開き、予測用データを読み込ませます。

 

今読み込ませたファイルを選択し、予測を開始します。

 

予測開始からほんの数秒で予測結果データが出力されました。非常に速いです。

 

そしてこの予測結果をダウンロードします。

 

ダウンロードした予測結果データを開くと、このような感じです。

 

AMATERAS RAYで予測した桜の開花日と実際の開花日を比較した結果がこちらになります。

 

なんと、仙台と名古屋のAMATERAS RAYによる開花日予測は実際の開花日と一致しました!

その他の地点について、7分の5が誤差3日以内、また、広島と福岡について最大誤差6日と他の地点と比較し誤差は大きいように感じますが、ウェザーニューズ(https://weathernews.jp/s/topics/202102/040075/)は広島が3/23、福岡が3/20と予測しているため、AMATERAS RAYの誤差の方が小さく、精度が高いことが分かります。

 予測精度を上げるためにはどうしたら良いか、Part2で試行錯誤したいと思います。

終わりに

 今回はAMATERAS RAYで桜の開花日を予測してみましたが、いかがでしたでしょうか。

 筆者自身、AIは難易度が高く難しいイメージを持っていましたが、AMATERAS RAYを使用することでこんなにも簡単にAIを使うことができ、なおかつ、その精度の高さに驚きました。学習用データが最低100件以上必要ということで、少々大変だと感じる部分はありましたが、AMATERAS RAYにはそれ以上のメリットがあると思います。

 AMATERAS RAYだけではなく、弊社でもAI推進を行っておりますので、少しでもAIについて興味がある方は是非ご連絡ください

 長くなりましたが、最後まで読んでくださり、ありがとうございました。

関連記事

もっと知りたい方はこちら


ページトップ