更新履歴

  • 2020/9/22 2020年度版に更新
  • 2020/10/09 手書き数字画像認識コンテストの追記

はじめに

京都大学工学部情報学科計算機科学コース3回生後期後半(2020/10/1-2020/11/13)の期間に行われる,画像認識の実験および演習に関するページです.対象学生は計算機科学コースの3回生相当(の2分の1±α)です.
本演習では,計算機によるパターン情報処理の一例として,画像に対する認識技術,特にニューラルネットワークを用いた画像認識技術をプログラミング演習を通して学びます.具体的には,手書き数字の認識・物体認識を題材とし,
データの取り扱い,ニューラルネットワークによる多クラス識別器の学習と利用に必要な基礎技術を習得することを目標とします.

ヒント集

(随時追加していきます。)

  • mnistの各画素は0〜255の整数になっています。ニューラルネットに入力する前に0〜1になるよう正規化しておくと学習がうまくいきやすいです

電子化テキスト

電子化テキストはPandAにて配布します.

担当

  • 教員:准教授 飯山将晃(内線:9062),助教 下西慶
  • TA:藤村友貴(飯山研D3), 住江祐哉(飯山研M1)(内線:9065)

連絡先

le4dip_at_mm.media.kyoto-u.ac.jp

※_at_ を@に変更してください.

日程

10/1, 10/2, 10/8, 10/9, 10/15, 10/16, 10/22, 10/23, 10/29, 10/30, 11/5, 11/6, 11/12, 11/13

評価方法

本演習履修者に対しては,課題についてレポートを提出してもらうと共に,
途中で課題進捗状況の報告(デモ)をしてもらいます.
成績は,レポート・デモ・出席点によって評価します.
必修課題のレポートを提出し,遅刻・欠席が総演習時間の1/4に達していないことが合格の最低条件となります.

  • 課題1から課題4が必修課題です.
  • その他にも発展課題があります.どの順番で行っても構いませんし,行わなくても(出来なくても)構いません.提出した場合には,加点法で成績評価します.
  • 演習期間中に2回デモを行って頂きます.課題進捗状況を報告して下さい.今年度はzoomの画面共有を用いて行います.
  • レポートには,課題内容,作成したプログラムの説明,実行結果,工夫点,問題点を記述して下さい.これとは別にソースファイルを添付して下さい.レポートは報告書の形式を要求します.くだけた文体,支離滅裂な文章については低評価となります.
  • 課題内容については予定です.皆さんの進捗次第で変更する可能性があります.
  • レポートは,PDF形式に変換したファイルをPandAからアップロードしてください.

課題

課題1

期限:2020/10/23 17:00(JST)

  • MNIST の画像1 枚を入力とし,3 層ニューラルネットワークを用いて,0~9 の値のうち1 つを出力するプログラムを作成せよ.
  • 【デモ】10/23の13:00より1回目のデモを行ってもらいます.出来上がったところまでを説明・実演してください.

課題2

期限:2020/10/30 17:00(JST)

  • [課題1] のコードをベースに,ミニバッチ(=複数枚の画像)を入力可能とするように改良し,さらにクロスエントロピー誤差を計算するプログラムを作成せよ.
  • レポートに記載する内容は,課題1レポートからの差分だけでOKです.(課題1レポートと比較すると分量は少なくなるはずです)

課題3

期限:2020/11/12 17:00(JST)

  • [課題2] のコードをベースに,3 層ニューラルネットワークのパラメータを学習するプログラムを作成せよ.(電子化テキスト4.3.5)
  • レポートに記載する内容は,課題2レポートからの差分だけでOKです.
  • 【デモ】11/13の13:00より2回目のデモを行ってもらいます.出来上がったところまでを説明・実演してください.

課題4・発展課題

期限:2020/11/26 13:00(JST)

  • MNIST のテスト画像1 枚を入力とし,3 層ニューラルネットワークを用いて,0~9 の値のうち1 つを出力するプログラムを作成せよ.
  • このレポートの内容が成績評価の大きなウェイトを占めます.工夫点・問題点については,課題3からの差分だけではなく,これまでに取り組んだ内容をすべてを総括して記述してください.

手書き数字画像認識コンテスト

実装した3層ニューラルネットワークを用いて手書き数字画像認識のコンテストも行います.詳細やランキングはこちらから.