【脱線】MacPro Early2009(A1289)をメンテナンス9 生成AIへの道5 GTX1060

【脱線】MacPro Early2009(A1289)をメンテナンス9 生成AIへの道5 GTX1060

MacPro Early2009で玄人志向のRTX3050が使えないことが分かってしまった。(´・ω・`)

でも、折角Early2009を手に入れたんだから何とか活用したぁい!!ということで、グラボをGTX970に戻して、Stable Diffusionでの512×512生成時間を測定。1分22秒で生成できた。
因みに、MacPro Early2008 + GTX970では2分10秒。

〇Geforce GTX970 4GByte(PCIe 3.0 x 16)
MacPro Early2008 PCIe 1.1 x 16動作 2分10秒
MacPro Early2009 PCIe 2.0 x 16動作 1分22秒

これは、Mojaveに入っていたファームウェアにより、PCIe 3.0ボードがPCIe 2.0動作できたため、Early2009では倍速動作になったと推測できる。ホントは予算があれば、RTX3060とか、RTX2080とか取り付けたいところではあるが、40,000円とかをポンと支払える能力が今月は無い・・・

ものすごく不完全燃焼感があったので、Geforce GTX1060(6GByte)の中古を9,800円で買ってしまった。<=ヤスモノガイ ノ ゼニウシナイ的な

そいで、Stable Diffusionで512×512生成

〇Geforce GTX1060 6GByte(PCIe 3.0 x 16)
MacPro Early2009 PCIe 2.0 x 16動作 1分13秒

うっ、GTX970と変わらん?GTX1060はもっと出来る子のハズ!、そこでStable Diffusionの起動パラメータを見直し。

GTX970のVRAMは4GByte、GTX1060のVRAMは6GByteなのでStable Diffusionの起動パラメータの–lowvramを–medvramに変更してリトライ

〇Geforce GTX1060 6GByte(PCIe 3.0 x 16)
MacPro Early2009 PCIe 2.0 x 16動作 12秒

すんごく速くなった!!、やはりVRAMサイズって重要

因みに、今使っているオプションはこちら、

COMMANDLINE_ARGS=–medvram –always-batch-cond-uncond –opt-split-attention –xformers

但し、初回起動時はこのオプションだと、model読み込み時にメモリ不足エラーとcuda testエラーが発生するので、初回起動時のみ以下のオプションとし、適当なmodelを一つ読み込ませておく。その後、一旦Stable Diffusionを終了させ、上記オプションに切替えて、StableDiffusionを起動すると、我が家では爆速?環境になっている。

COMMANDLINE_ARGS=–lowvram –always-batch-cond-uncond –opt-split-attention –xformers –skip-torch-cuda-test

Early2008で同じオプションをGTX970に適用すると、2分10秒=>25秒と速くなった。もう、RTX3050のアリガタミが・・・・

まとめ、512×512生成時

MacPro Mid 2006 RTX3050 PCIe1.1x 8動作 13秒
MacPro Early2008 GTX 970 PCIe1.1×16動作 2分10秒
MacPro Early2008 GTX 970 –medvram    25秒
MacPro Early2009 GTX 970 PCIe2.0x16動作 1分22秒
MacPro Early2009 GTX1060 PCIe2.0x16動作 12秒
G-Tune DGI7G70 RTX4070 PCIe4.0x16動作 3.42秒
(???ミナカッタコトニしよう)

??、GTX1060のほうがPCIe1.1動作のRTX3050よりハヤイよぉ!!!

アア、コンナコトナラバ、GTX1060ノ隣ニナランデイタGTX1070 Super Jetstream 8GByte(11800)ニシテオケバ良カッタ・・・。Wikiにヨレバ、GTX1060GTX980相当の性能、GTX1070GTX980Ti相当の性能だそうな。っていうか、Early2009にRTX3060とかRTX2080とか挿すと無茶苦茶速いのでは?

StableDiffusionとは関係ないが、FinalFantasy xivベンチマークを実施、比較する。解像度は1280×720で計測

MacPro Mid 2006 RTX3050 PCIe1.1x 8動作
スコア:4106(普通)
MacPro Early2008 GTX 680 PCIe2.0x16動作
スコア:7106(やや快適)
MacPro Early2009 GTX 970 PCIe2.0x16動作
スコア:12778(とても快適)
MacPro Early2009 GTX1060 PCIe2.0x16動作
スコア:12928(とても快適)
G-Tune DGI7G70 RTX4070 PCIe4.0x16動作
スコア:31024(とても快適 ミナカッタコトニ)

ん~Stable Diffusionの結果とFainalFantasyベンチの結果は必ずしもイコールではない・・・

んでもって、Stable Diffusionの成果娘がこちら!それなりに苦労したので呪文は内緒で。

画像の大半はStable Diffusion成果娘 越前屋米子18歳の部屋に移動しました。よかったら米子に会ってやってくださいまし。

さらに、今回のStable Diffusionの影響がこちら、1台しかなかったMacProが3台に分裂・・・・