草榴社区

AI加速: 利用新思科技 QIK和DSO.ai的「暖啟動」將Synaptics的四顯(Quad-Display)晶片遷移到ARC HS58x3

在這個步調快速的數位時代中,能掌握速度、效能和上市時間就是王道;晶片设计人員承受著提供高效能運算同時又不至於影響功耗效能的壓力。對即時數據處理和共享的持續需求正在推動晶片设计創新的界限。在這個背景下,我们重新審視從新思科技使用者大會(SNUG)得到的洞察見解,並進行翻新,進而探索以AI驅動的電子设计自動化 (EDA)如何革新晶片设计和遷移流程,使其更加高效並符合成本效益。

我们已经分享AI如何讓数位设计重新定位到更先進的製程節點,有助於限制或消除重新设计的需求。但是如何遷移那些仍然適用的現有设计到具有更強大功率能力的新處理器?同樣的AI技術能應用於這個挑戰嗎?Synaptics做到了。

Synaptics 是 DisplayLink 技術的開發者,該技術讓任何支持 USB 或 Wi-Fi 的電腦能夠輕鬆連接到任何顯示器,並提供通用的解决方案,適用於公司、家庭和嵌入式應用,其中顯示器的易連接效能夠提升生產力。該公司最新的DisplayLink DL-7400 是一款通用的顯示器對接解决方案,支援高達 4K @ 144 Hz 的超高解析度和刷新率,可從單台電腦同時輸出四個顯示器。透過任何USB甚至更舊的GPU支援2x 8K、4x 4K、5K/6K顯示;一個擴充基座滿足所有 IT 需求,配有2.5G 乙太网路和 IoT 引擎,還具有簽名加密韌體。

為滿足這種高效能運算需求,Synaptics 设计出DL-7400,其可在基於 ARCv3 指令集架構(ISA)的ARC HS58 32位元處理器上運行,並搭載高達 12 核心的同步叢集,具有最多 16 個硬體加速器,以及同步、高頻寬互連(800GB/s)和150多個 DSP 指令。然而,前幾代的 DL-7400 需要較低的處理能力運行在基於 ARCv2 ISA 的 ARC HS38 32位元處理器上,提供單一指令處理(single issue)、10-stage管道(pipeline)和雙/四核心實作。

础搁颁处理器迁移优化

ARC HS58 的升級為 DL-7400帶來數個必要領域的顯著改進:

  • HS58 的记忆体頻寬提升2.5 倍。
  • 壓縮速度比原來的更快 1.25 倍,而解壓縮速度則快了 1.12 倍。
  • 這款處理器能夠更快地執行儲存在记忆体中的大數據陣列的密集運算,執行相同指令數量的效能提高了 50%。
  • 最後,矽晶上量測時,HS58的效能表現平均提升 48%。

為能成功進行遷移,必須達成多項軟體和實作過程的挑戰。首先,因為在開發獨特和複雜軟體上已投入大量资源,因此軟體必須被保留,且最少量的變動更是關鍵。在實作方面,footprint必須與HS38相匹配,包括物理面積、針腳、位置和電源分配。在符合現有SoC要求的I/O時序和時脈延遲的同時,還需要減少動態漏電功率。為了在不需要完全重新设计的情況下實現ARC HS58處理器的所有優點,Synaptics轉而使用新思科技QuickStart Implementation Kit (QIK)、Fusion Compiler?和DSO.ai?。

草榴社区 QIK是一個完整的解决方案,包括一流的IP、知識庫、工具和方法論,以及服务和支援。QIK專為執行新思科技 IP而设计,由於其與IP设计、研發和方法論專家密切合作,可提供符合QoR目標的完整工作範例,包括推薦的流程和實作、ECO、签核、形式验证、核心配置和限制等指令,結合平面或分層流程,易於根據特定專案需求進行客製。

草榴社区 DSO.ai可自動探索多個设计空間,以優化效能、功耗和面積(PPA)指標,同時最小化目標應用的取捨權衡。它利用人工智慧在设计技術(design-technology)解决方案中巡航,藉由自動調整或微調设计的輸入(例如設定、限制、製程、流程、階層結構和知識庫)來尋找最佳的PPA目標。

針對新设计,草榴社区 DSO.ai在所謂的「冷啟動」中接受這些輸入,以確定主要的目標。然而,該解决方案從初始设计優化中學習,並將這些學習應用於衍生设计;因此AI引擎在尋找最佳優化策略以滿足目標規格時不再從「冷啟動」開始,而是從「暖啟動」,可節省5-10倍的運算资源。這項技術應用於遷移至新處理器中,將HS58的配置與建置在SoC中的原始HS38進行比較,然後將HS58设计透過QIK流程和草榴社区 DSO.ai的「暖啟動」,達到該處理器的最佳效能目標。

草榴社区 DSO.ai流程的「冷啟動」和「暖啟動」

使用草榴社区 DSO.ai不僅大幅降低週轉時間,並顯著減少時序要求違規,同時改善功耗和功耗漏電,超過單獨使用草榴社区 QIK所能達到的效果。草榴社区 DSO.ai降低23%的WNS(最差負時序餘量)、61%的TNS(總負時序餘量)以及降低92%Hold TNS(保持總負時序餘量);總功耗提升2.2%以及減少19.6%漏電功耗。

在使用 草榴社区 QIK 和 DSO.ai 時的成果

使用草榴社区 DSO.ai不僅大幅降低週轉時間,並顯著減少時序要求違規,同時改善功耗和功耗漏電,超過單獨使用草榴社区 QIK所能達到的效果。草榴社区 DSO.ai降低23%的藉由利用新思科技 Fusion Compiler 和 DSO.ai 的 AI驅動優化,Synaptics 團隊能夠顯著地縮短设计週轉時間,改善功耗,並最小化時序要求違規。將現有设计遷移到更先進的處理器,提供可行的解决方案,以因應高效能運算日益增加的需求和不斷壓縮的上市時程。

相關资源

下载Synaptics在SNUG SV 2024 的報告內容,以深入瞭解其相关技术发展歷程。

新思科技网路研讨会:使用人工智慧驱动技术实现最佳笔笔础目标