GPUは頻繁に使用すると摩耗しますか?

GPUは頻繁に使用すると摩耗しますか?

集中的なゲーム、GPUコンピューティング、グラフィックレンダリング、Folding @ home、またはGPUでの暗号マイニングを計画している場合は、GPUが頻繁に使用されると摩耗するのではないかと心配するかもしれません。しかし、そうなるでしょうか?調査します。

はい、でも難しいです

グラフィックカードの寿命についてインターネットで見つけた情報の多くは逸話的であり、その数は誰に尋ねるかによって大きく異なる可能性があります。過去10年間にリリースされた何百もの異なるグラフィックカードモデルでは、そのような大きく異なるカードのデータを単なる一般化に絞り込むことは困難です。

これまでにわかっていることは次のとおりです。ドイツの小売業者の2020年のレポートによると、最新のグラフィックカードの全体的な故障率は約2〜5%です(小売業者への返品で測定)。そして2021年、Nvidiaはまだ約9〜10年前のカード(GTX 600シリーズなど)のドライバーアップデートをリリースしていたので、巧妙に作成されたGPUカードの10年を期待できますが、これらは外れ値である可能性があります。わかります。さらに。

数に関係なく、ここでは重い物理学が働いています。GPUカードで使用される材料とコンポーネントは魔法ではありません。使用するほど、摩耗が早くなり、完全に故障する可能性が高くなります。したがって、集中的に使用すると平均余命に影響します。

GPUカードに不具合が発生するかどうかは、GPUの使用頻度、回路の温度変動の性質と程度、カードのオンとオフの回数、クリーン度など、まったく異なる変数によって異なります。動作環境はです。

GPUカードは多くの部品を含む複雑なデバイスであるため、各部品が独自の方法で故障または劣化する可能性があります。GPUカードのいくつかの主要な部分を見て、時間の経過とともに頻繁に使用するとどのように摩耗するかを確認します。

まず最初に:冷却ファン

そもそも故障する可能性のあるグラフィックカードのすべての部品の中で、物理的な可動部品である冷却ファン(または複数のファン)を指す必要があります。ファンは、GPUチップから熱風を(ヒートシンクを使用して)引き離すことでGPUを冷却し、GPUが機能し続けることができるようにします。

なぜ熱が悪いのですか?十分な熱があると、トランジスタが正しく機能しなくなります。つまり、GPUカードが機能しなくなります。さらに熱がかかると、カードのマイクロ回路のトランジスタが修復不能な損傷を受ける可能性があります。

時間の経過とともに、冷却ファンはほこりで詰まることが多く、空気を効率的に移動する能力が低下します。または、内部潤滑が失敗すると、ファンが完全に機能しなくなる可能性があります。スクリプトを使用すると、GPUの温度が上昇します。

各GPUは、GPUの速度を低下させて動作温度を下げる熱スロットリングにより、過熱から自身を保護します。これにより、パフォーマンスが大幅に制限されます。したがって、GPUの動作が通常よりも突然大きくなる(ファンの回転が速くなる)か、パフォーマンスが低下する場合は、GPUの冷却ファンとヒートシンクを圧縮空気で完全に清掃してください。

GPU冷却ファンが完全に故障した場合、コンピューター部品のサプライヤーから同様のファンを見つけることができれば、通常は交換できます。

別の容疑者:サーマルペーストの不良

各ヒートシンクとGPUチップの間には、パテやペーストなどの熱伝導性材料の層があり、GPUチップからヒートシンクに熱を伝達するのに役立ちます。

時間の経過とともに、サーマルペーストはひび割れたり、効果を失ったりする可能性があります。これが発生すると、ヒートシンクが効率的に冷却されず、GPUの温度が上昇します。上記のファンのセクションで見たように、GPUの温度が高いと熱スロットリングが発生し、GPUの速度が低下します。

この場合の最善の解決策は、サーマルペーストを自分で交換することです。コンピュータハードウェアベンダーからサーマルペーストを購入できます。

他の部品の故障、はんだ付け

GPUチップに加えて、グラフィックカードには、コンデンサ、抵抗器、メモリチップなど、他の数十の電子部品が含まれます。これらのいずれも、頻繁な使用または過度の熱への暴露により失敗する可能性があります。他のものより失敗する可能性が高いものもあります。

特に、コンデンサは時間の経過とともにフェイルオーバーします。それらは頻繁な温度変動に敏感であり、それらのいくつかは最初の生産で欠陥があります。コンデンサの問題のトラブルシューティングに精通している場合は、同等の交換部品があれば、GPUカードの故障したコンデンサを交換できる可能性があります。

さらに、チップとコンポーネントをGPUカード回路基板に接続するはんだは、頻繁な温度変化、乱暴な取り扱い、不適切な保管、または過熱により、時間の経過とともに経年劣化および亀裂が発生する可能性があります。そうです、GPUを頻繁に使用すると、はんだ接合が失敗するリスクが高まる可能性があります。不良はんだ接合部の修理は技術的に困難な場合がありますが、不可能ではありません。

GPUチップ自体の障害

したがって、疑問が残ります。GPUチップは、頻繁に使用すると時間の経過とともに摩耗する可能性がありますか?理論的には、極端な状況下では、答えは「はい」です。ただし、グラフィックカードの別のコンポーネントがそのずっと前に故障する可能性があります。

ビデオカードのGPUチップには、シリコンにエッチングされた数百万または数十億のトランジスタが含まれています。トランジスタは時間の経過とともに劣化し、パフォーマンスに影響を与えます。十分な数のトランジスタが故障すると、チップは故障します。

半導体工学によると、トランジスタが経年劣化(そのうちの1つは熱)によって故障する主な理由はいくつかあり、チップ上の要素が小さいほど、エラーが発生する可能性が高くなります。専門家は、今日製造されたコンピューターチップは、1990年代に製造されたチップほど長くは続かないと考えていますが、テクノロジーが非常に新しいため、正確な寿命を予測することは依然として推測です。

NVIDIAは現在、消費者向けグラフィックカードの  MTBF (Mean Time Between Failures)レーティングを公開していませんが、一部の産業用およびビジネス用グラフィックアクセラレータについては公開しています。たとえば、Tesla K20X GPUアクセラレータのデータシートには、カードのMTBF(35°C / 95F)は「制御されていない環境」で14。7年、「制御された環境」で23。8年であると記載されています。(一般に、産業用グラフィックスハードウェアは、民生用グラフィックスハードウェアよりも信頼性が高く、頻繁な使用に耐えることができると考えられていることに注意してください。)

興味深いことに、この理論上の数値を現場で得られた正確なデータと比較することができます。GPUの寿命に関する数少ない実証的研究の1つは、オークリッジ国立研究所が執筆した「タイタンスーパーコンピューターでのGPUの寿命:生存と信頼性の分析」というタイトルの2020年の論文に基づいています。この論文は、現在引退したCray XK7 Titanスーパーコンピューターでほぼ7年間(2012-2019)使用された18,688のNvidia K20XKeplerGPUカードの信頼性を報告しています。

接続の問題によるいくつかの初期障害の後、XK7グラフィックカードは、多くの障害が発生し始めた2016年(約3〜4年)まで、比較的信頼性が高いことがわかりました。しかし、あなたは何を知っていますか?彼らは、カードの最初のバッチ(交換前)の障害のほとんどを、GPUチップ自体ではなく、グラフィックカードのPCB上の障害のある抵抗にまでさかのぼりました。全体として、この調査の著者は、頻繁に使用されるK20XグラフィックカードのMTBFは約3年(Nvidiaのデータシートに記載されている14〜23年ではない)であり、コア内の最もホットなカードのいくつかが最初に故障することを発見しました。彼らは、「GPUの信頼性は熱放散に依存する」と結論付けました。

そのため、グラフィックカードを(当時)世界最大のスーパーコンピューターの1つと同じくらい激しく使用すると、GPUチップ自体が故障するずっと前に、消耗が早くなり、ファンや抵抗などの他のコンポーネントが故障する可能性が高くなります。あなたが得る長さは、私たちが予測できない要因に依存します。

結局のところ、熱は敵です

結局、私たちが読んだすべての情報源から、GPUカードがどれだけ長く続くかを決定する上で最も重要な要素は、それがどれだけ熱いかということです。カードが高温になるほど、すべてのコンポーネントの劣化が速くなります。また、カードの温度が高いほど、パフォーマンスが低下し、壊滅的な障害を防ぐことができます。良好な冷却により、カードの寿命が延び、カードのパフォーマンスが向上します。

したがって、暗号通貨やゲームに興味があるかどうかにかかわらず、グラフィックカードがクリーンなファンと効果的なサーマルペーストで十分に涼しく保たれている限り、運が良ければ長持ちする高性能カードがおそらくあります古いものとして更新します。

中古GPUの購入を検討している場合は、所有者がGPUをどのように処理して使用したかなど、その履歴を確実に考慮する必要があります。より頻繁に使用されるカード(現在機能しているカード)は、短期的には正常に機能する可能性が高くなりますが、長期的には失敗する可能性が高くなります。カードの寿命を正確に特定することはできませんが、頻繁に使用すると、グラフィックカードの消耗が早くなります。

幸運を!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です