けやみぃアーカイブ

CV勉強中の大学生のアウトプットです

【PyTorch】Mixed Precision (autocast) での an illegal memory access was encountered / 処理が遅い問題

PyTorchのバージョンは1.13.0です. PyTorchのMixed Precisionを試した時に起こった現象と解決した方法についてのメモです. 現在のPyTorchでMixed Precisionを行うには,以下のように with torch.autocast("cuda", torch.float16): で囲むことで勝手に半精…

【論文紹介】Latent Image Animator

記事タイトルをクリックして記事ページに移動すると数式が正しく表示されます 【6/20追記】実装が公開されたので、実装から読み取れる情報を追記しました。 タイトル:Latent Image Animator: Learning to Animate Images via Latent Space Navigation arXiv…

マスクをつけた顔画像の検出

自分の時はググってもあまり情報が出てこなかったので、一応ブログに残しておく。 先に結論 MTCNNそのまま使えばOKだった。 やりたいこと ある画像に対して、 マスクを着けている顔領域を検出する 更にランドマークを検出し、目が水平になるように画像を回転…

StyleGAN2で顔ランドマーク座標を指定して画像生成【後編】

GAN

前回はキーポイントを指定した際に他の顔属性も変わってしまっていたので,顔属性を保持しながらキーポイントを変化させるために属性推定器を学習させます. データ 顔属性 やはりラベル付きのデータが欲しいので,CelebAを使います.CelebAのラベルは40種類…

StyleGAN2で顔ランドマーク座標を指定して画像生成【前編】

GAN

PFNから発表された Surrogate Gradient Field for Latent Space Manipulation という論文の再現実装をしてみました.どんな論文かは以下の図を見てもらえるとわかるかと思います.上段は属性(年齢や性別など)を指定してStyleGAN2で生成した画像です.中段で…

PyTorchの異なるバージョン間での重み変換

なんやかんや複雑な事情で、学習時と推論時のPyTorchのバージョンが違った時の対処法です。特に学習時のバージョンの方が新しいと、推論する時に古いバージョンでは学習済みモデルを読み込んでくれないことがあるかと思います。まあ推論環境のPyTorchをアッ…

大人数の顔認識ができるシステムを作りたい

大人数の顔認識ができるシステムを作りたい!!!!!!!!!!! と思ってこんな感じのシステムを作りました。djangoを使って実装しています。現時点では150人ほどの識別ができるはずです。 始まり編 ネットにあふれている「顔認識してみた」系の記事は、…

MTCNNをPyTorchで試してみる

深層学習ベースの顔検出アルゴリズム、MTCNNをPyTorchで試してみました。

物体検出アルゴリズムSSDで顔検出に挑戦(続き)

このQiitaの記事の続きです。 qiita.com Qiitaのアカウントを2つ登録してると思い込んで片方だけ退会しようとしたら、実際はアカウントは1つでこの記事を書いたアカウントも消えてしまったのでブログ開設してみました。 先に言ってしまうと今回もうまくいな…