【AIF-C01】モデル・アルゴリズム・フレームワーク・ライブラリ知識まとめ(勉強ログ#4)

AWS AI Practitioner

※本記事はAIF-C01の資格試験対策用に私が勉強した内容を備忘録として残したものです。想定問題を解いていて重要だ、ここは忘れそうだと感じた部分をまとめています。網羅的な解説記事ではありませんのでご容赦ください。

はじめに

さて今回は、AIF-C01(AWS Certified AI Practitioner)の資格試験対策として、モデル・アルゴリズム・フレームワーク・ライブラリについてまとめたいと思います。

資格試験に受かることだけを目標に、ポイントだけ抑えた記事となっていますので、気になった個所はより深く調べてみてくださいね。

それでは見ていきましょ~。

オススメ試験対策

試験対策にオススメなUdemy講座も載せておきますね。

基本的には過去問のみです。

とにかく問題を解きまくる!分からないところは私の勉強ログで知識を補填する。このようなサイクルで回してもらえるとすごく嬉しいです~。

目指せ試験合格!

モデル・アルゴリズム・フレームワーク・ライブラリ

サポートベクターマシン(SVM)

サポートベクターマシン(SVM)は、主に分類タスクに用いられる教師あり学習アルゴリズムです。

SVMは、データポイントを分類するために最適な境界線(ハイパープレーン)を見つけ、クラス間のマージンを最大化することで高い分類精度を実現します。

非線形分離が必要な場合は、カーネル法を使用して柔軟な分離を行います。

ハイパープレーンは異なるクラスのデータを分離するための境界線(または境界面)として利用されます。

SVMは、各クラス間のマージン(境界から最も近いデータ点までの距離)を最大化するように最適なハイパープレーンを求めることで高い分類精度を達成します。

最適なハイパープレーンは、誤分類が最小限になるように決定され、データの分布状況を反映して位置や傾きが調整されます。

MXNet

MXNetは、ディープラーニングのための柔軟で高速なオープンソースフレームワークです。

画像分類や物体検出、自然言語処理など幅広いタスクに対応しており、スケーラブルな分散トレーニング機能から効率的なモデル開発と実装をサポートします。

BlazingText

BlazingTextは、Amazonが提供するテキスト分類およびテキスト埋め込み生成に特化したライブラリです。

高速なトレーニングと推論が可能で、大規模なテキストデータを用いたタスクにおいて優れたパフォーマンスを発揮します。

Object2Vec

Object2Vecは、オブジェクトの属性や関係性をベクトル表現に変換する技術です。

Object2Vec = Object to Vector = オブジェクトをベクトルに

これにより、オブジェクト間の類似性や関係性を定量的に捉えることができ、レコメンデーションや検索など、さまざまな応用が可能になります。

XGBoost

XGBoostは、ブースティング手法に基づくアンサンブル学習アルゴリズムです。

複数の弱い予測モデル(主に決定木)を組み合わせて、より高い精度の強力なモデルを作成します。

大量のデータに対して高速に学習でき、分類や回帰タスクで高い性能を発揮します。

確率的勾配降下法(SGD)

確率的勾配降下法(SGD:Stochastic Gradient Descent)は、最適化アルゴリズムの一つで、モデルのパラメータを更新する際に、全データセットではなくランダムに選んだ単一のサンプルまたはミニバッチを用いて勾配を計算します。

これにより、毎回の更新計算が高速になり、計算コストが低減されるとともに、局所最適解に陥りにくいという利点があります。

しかし、サンプル単位の更新はノイズが多く、学習が不安定になることもあるため、通常はミニバッチ学習と組み合わせて使用されます。

SGDは、学習率やミニバッチサイズなどのハイパーパラメータの調整が重要で、これらの設定により、最適な収束速度と性能を達成することが可能です。

部分依存プロット(PDP)

部分依存プロット(PDP:Partial Dependence Plot)とは、機械学習モデルの特定の特徴量が予測にどのように影響するかを可視化する手法です。

他の特徴量の影響を平均化することで、対象特徴量の値が変化した際の予測値の変動を示します。

これにより、モデルのブラックボックス性を低減し、特徴量の寄与や効果の方向性、非線形性を直感的に把握することが可能です。

ただし、特徴量間の相関が強い場合には解釈が難しくなる点に注意が必要です。

ランダムカットフォレスト(RCF:Random Cut Forest)

ランダムカットフォレストは、異常検知に特化した教師なし学習アルゴリズムです。

データポイント間の関係性を捉えるために、ランダムに決定木(フォレスト)を構築し、各データが木構造内でどの位置にあるかを評価することで、通常のパターンから大きく逸脱する異常なデータポイントを識別できます。

大規模かつ高次元なデータにも対応し、オンライン学習が可能なため、継続的に流入するデータ環境でリアルタイムの異常検知に適しています。

最後に

さて今回は、AIF-C01(AWS Certified AI Practitioner)の資格試験対策として、モデル・アルゴリズム・フレームワーク・ライブラリについてまとめました。

あくまでも私の備忘録ですが、このメモが皆さんのお役に立てればとても嬉しいです!是非この記事を読んで資格に合格できた!!等あれば励みになりますのでコメントください~。

前回まとめた記事はこちらです。

本ブログでは、AIF-C01以外の勉強記事もあげていますのでそちらも是非!!

コメント

タイトルとURLをコピーしました