Python – MNISTを使う

このエントリーをはてなブックマークに追加
Pocket
LINEで送る

機械学習で使えるサンプル画像の有名なのがMNISTだそうです。0-9までの手書き文字画像と、正解ラベルデータが、トレーニング用とテスト用で分けられています。
http://yann.lecun.com/exdb/mnist/

バイナリデータになっていて、画像等は全部データとしてつながっているらしい。機械学習は画像を数値として扱う必要があります。

参考:https://github.com/oreilly-japan/deep-learning-from-scratch/blob/master/dataset/mnist.py

Pythonでダウンロード・読み込み

ダウンロード

読み込み

gzipを使います。

試しに画像データを読み込んで1つ表示させてみます。

手書きの5っぽい画像が表示されました。
load_mnist関数は、gzipで読み込んで、np.frombufferというので、Numpyの配列に格納してます。data.reshapeで、画像サイズの784ずつに配列を分割してます。
784ずつに分割された配列で実際には機械学習すればいいと思います。実際の画像にするために、さらに1つの画像の縦横に合わせて配列を変換してます。

このエントリーをはてなブックマークに追加
Pocket
LINEで送る

Be the first to commenton "Python – MNISTを使う"

Leave a comment

Your email address will not be published.


*