由人工智慧驱动的设计应用
本文原文由张贴
英文原文:
在每顆晶片中,功耗始終是進行中且待解決的問題,長期以來,设计工程師必須同時仰賴經驗與知識來解決這個難題,一般必須等到矽晶片完成後,才能以實際軟體工作量執行功耗分析。然而,如此一來為時已晚,因為解決矽後(post-silicon)功耗變成昂貴且耗時。在這篇文章中,我將先說明如何先期在數小時內快速獲得十億閘級(billion-gate)设计之可行功耗验证結果。藉由這項功能,可發現峰值功率(peak power)關鍵區域與時間範圍,從而優化RTL和軟體。
進行矽後功耗分析將導致遺失關鍵高功耗情況之風險,因而可能讓成本增加與出現产物採用相關疑問。功耗造成的問題有哪些?如果设计沒有考量到所要的功耗目標,客戶可能就會選擇與其他晶片供應商合作。或者,系統设计人員可能被迫降低晶片效能,以保持目標功耗,然而這樣的權衡卻不利於那些仰賴快速運算效能的應用。接下來,讓我們仔細研究需要精準功耗分析的SoC應用領域。
傳統圖形處理器應用是大家相對熟悉的,然而其在功耗分析上並沒有比較容易。以筆記型電腦的圖形處理器為例,它可在一段時間內在某些測量點上執行功耗分析。不過,隨著可能進行多達上千萬個時脈周期(clock cycles)時,這種方式顯然並不實用,這也是设计人員傳統上必須仰賴最佳功耗預估值的原因。
在人工智慧(础滨)晶片中,應用程序與用於AI應用和架構的軟體堆疊(software stack)都是全新領域,在功耗方面有著更多的挑戰。然而,優化 AI應用於功耗上仍有相當大的潛力。畢竟,能夠讓人工智慧晶片设计人員宣揚的優勢便是功耗效率與快速運算效能。
另一关键功耗应用就是5骋,其具有高效能与低延迟性。5骋应用涉及许多并行处理与高频问题,然而可用的功率有限,因此必须经过最佳化,确保其能有效率地运行,而这点在无线耳机晶片上体现得尤為明显。
数据中心,尤其超大規模的数据中心,需要以高速、高能效的晶片進行打造,以達到系統流通量(throughput)效能最大化。由於數十億閘級與複雜的軟體工作負載,数据中心的SoC必須能滿足特殊验证與軟體開發等要求。
像智慧型手機這類的行动装置,考量其小型化及對較長電池壽命的需求,無法使用太過耗電的晶片。然而,隨著行动装置工作負載越來越複雜,甚至高功耗的圖形處理器也必須能夠提供滿足這些工作負載的功率效能。
符合動態功耗要求變得越來越棘手,晶片设计人員通常將功耗視為首要的验证挑戰,其中動態功耗验证需要找到峰值功率或最大功率。然而,實際軟體工作量是造成關鍵功耗的主因。透過模拟雖然能識別出超出和低於功率預算的峰值功率,但在十億閘級设计上,因為以模拟方式考量的範圍太小,所以僅能靠運氣找到真正的關鍵功耗。因此,有一套签核工具(signoff tool)將提供精準功耗測量,但若用於錯誤的時間範圍上,设计人員將無法決定哪個範圍有最高功耗。
确认低功耗错误需要执行软体工作量,进行小测试并不会让实际工作量造成的功耗错误出现,因而需要的是:
高速模拟協助设计團隊能夠在设计初期進行功耗验证,讓功耗錯誤與SoC功耗目標遺失之風險最小化。的確,快速功耗模拟器就是軟硬體功耗验证問題的解方,可以在較廣大範圍提供較佳精準度。理想的模拟器能夠每天反覆多次執行大型實際工作量设计,如此一來,晶片设计人員就能事先洞悉其设计功耗概況。
考量数十亿闸级厂辞颁工作量,。由於具有最大运算效能,因此ZeBu Empower每天能夠重複進行多次模拟,數小時內即可提供可行的結果。依據獲得的功耗數據,軟硬體设计人員就能提早確認要改善動態與漏洩功率之區域。此外,ZeBu Empower採用ZeBu Server快速模拟硬體技術,以提供較短的整備時間。
ZeBu Empower也能在草榴社区 PrimePower engine輸入關鍵功耗區塊與時間範圍,以加速RTL功耗分析與閘極等級功耗签核。ZeBu Empower與PrimePower兩者均屬草榴社区軟體驅動(software-driven)低功耗解决方案的一部分;如下圖所示,低功耗解决方案提供端對端流程與方法,從架構分析到RTL功耗分析,再到SoC功耗分析與優化。
草榴社区軟體驅動低功耗解决方案針對減少IC整體動靜態功耗而设计。
在功耗、性能與面積(PPA)方程式之中,功耗可能是最具挑戰性;伴隨數十億閘極设计時,達到精準功耗之複雜性也隨之增加。不過,藉由新思科技的快速功耗模拟解决方案,设计團隊可以找出峰值功耗的關鍵區域與時間範圍,以將RTL與其軟體最佳化。運用新思科技完整低功耗流程之優勢,设计人員因而獲得能協助他們達到PPA目標的工具。鑑於GPU,AI,5G,数据中心和移動設備等應用程序的繁重工作量和性能要求,任何能夠提供更準確功耗概況的解决方案,都應在含在PPA工具包中讓设计工程師可任意使用。