Fooocusを作った研究者 Lvmin Zhang に迫る #Fooocus
これまで数回に渡ってお手軽に高画質な画像が生成できるツール「Fooocus By lllyasvil」をフォーカスしてきました。
今回はこの「Fooocus」の作者はどんな人物なのか、リサーチしてみました。
Fooocusをつくた人はどんな人物なのか
「Fooocus」の開発者「 Lvmin Zhang さん」(GitHubアカウント: lllyasviel)は「Style2Paint」という色を塗るAIも古くから取り組まれている、中国出身の若き研究者です。現在はアメリカのスタンフォード大学の博士課程の学生さんのようです。
https://lllyasviel.github.io/Style2PaintsResearch/
実は Lvminさんは「Fooocus」や「Style2Paint」だけではなく「ControlNet」の作者でもあります。先日2023年10月2~6日にパリで開催されたコンピュータビジョンの国際会議「ICCV2023」において、ControlNetの論文が最優秀論文賞ベストペーパー(Marr Prize)の1つに選出されました。
25,221人以上の著者のトップということなので、これはかなりすごい。
International Conference on Computer Vision 「ICCV2023」
公式資料のダウンロードはこちら
https://iccv2023.thecvf.com/iccv2023.opening.slides-38--MTI.php
コンピュータビジョンの世界では中国がずば抜けて強い状況ですね。
こちらに日本の産業技術総合研究所(AIST)の上級主任研究員、片岡裕雄先生による「ICCV2023レポート」があるので、AIやコンピュータビジョンの学会や国際会議に興味のある方はこちらの資料もオススメです。
https://hirokatsukataoka.net/temp/presen/231006ICCV%202023%20Report%20(Release%20Ver.).pdf
受賞スライドはこちら。
Lvminさんの自己紹介サイトを訪ねてみました。
X(Twitter) https://twitter.com/lvminzhang
LvminのGitHubと研究ページ
ちなみに趣味はゲーム開発だそうです
「Style2Paint」の研究ページを振り返ると2017年には現在のStable Diffusionの内部でも使われているU-netとGANを使ったアニメ風スケッチの画風転移学習の研究が発表されています。
早稲田大学のシモセラ エドガー先生とも共同研究があり、遊び心と日本のイラストレーション文化をよく研究されている人物であるということは覚えておくと良いと思います。
次回は「Fooocus」の最新機能について紹介したいと思います!
応援してくださる皆様へ!💖 いただいたサポートは、より良いコンテンツ制作、ライターさんの謝礼に役立てさせていただきます!