人工知能技術に関して全般的に使ったことがある段階になりたいとおもい、これから学ぶ内容や学んだことも含めてまとめてみました。そして宣言することによって学ぶ環境を作る・決意を固まるであろうと思い、記事にしました。
自分が学びたい分野
- 画像認識
- 音声認識
- 自然言語処理
この3つに関して触れておきたいと思い、その第1弾として自然言語処理をBERTまで学んでみました。
その第2弾として画像認識に関して学びたいと思います。
画像認識に関して
画像認識の中でも
- データの前処理
- データの拡張
- CNNに関して
- 物体(画像)識別タスク
- 物体検出タスク
- セグメンテーションタスク
- 姿勢推定タスク
- 生成モデル
の順で学んでいけたらいいなと思っています。
データセット
- MNIST:手書き数値の画像データ
- CIFAR:主に画像認識を目的としたディープラーニングのチュートリアルで使われているデータセット。CIFAR-10は10クラス(種類)の5万枚の訓練データ用(画像とラベル)1万枚のテストデータ用(画像とラベル)からなる。100クラスのCIFAR-100もある。
- Fashion-MNIST:学習用に6万枚、テスト用に1万枚用意された10種類に分類できる衣類品画像のデータセット。
などを使っていければなと思っています。
まとめ
頑張ってセグメンテーションタスクや画像生成タスクができるようになります。(願望)