裸金属云:硬件调试、电源管理与市场生态解析
立即解锁
发布时间: 2025-08-24 01:57:29 阅读量: 2 订阅数: 4 

### 裸金属云:硬件调试、电源管理与市场生态解析
#### 硬件管理与调试的优势
在硬件管理方面,将机器集中放置具有显著优势。这样不仅简化了硬件维修和升级的物流流程,还降低了固件升级带来的风险,因为加载不兼容的固件可能会使机器无法正常运行。
#### 远程硬件调试
如今,实验室中的逻辑分析仪工作通过连接到计算机前端的仪器来完成。一旦仪器安装就位,工程师可以在办公桌前远程访问前端,进行实验和调试。这使得远程硬件调试成为可能,无论距离远近都能进行操作。例如,工程师既可以在实验室隔壁的办公室进行调试,也能从另一个大陆远程操作。在云服务提供商(CSP)进行高级系统芯片平台(ASCP)硬件开发任务时,工程师可以使用硬件即服务(HaaS)实验室提供商的平台进行硬件底层调试。关于由哪个实体来托管,这主要是由项目需求驱动的商业决策,可能是CSP开发者、制造特定平台的原始设计制造商(ODM),或者是专门提供实验室服务的第三方纯HaaS提供商。
#### 紧急默认功率上限(EDPC)算法
EDPC算法在原理上很简单,通过依次应用功率节流操作来快速降低功率需求,然后进行功率上限操作将功耗调整到预设水平。但在实际中,其实现的验证过程非常复杂。例如,PSUALRT#信号通常要经过非门、与门和或非门才能到达PCH中的GPIO31引脚,而这些门通常不是离散的,更可能嵌入在基板复杂可编程逻辑器件(CPLD)中,其正常运行依赖于CPLD的实现。此外,基板管理控制器(BMC)驱动EDPC,工程师必须确保CPLD中的门延迟、BMC中的处理延迟以及可能的实现伪像不会导致数字域中出现振荡或未定义状态等不良行为。
EDPC功率管理算法在数字和模拟域都能工作。来自电源和BMC的数字信号以及BMC发出的智能平台管理接口(IPMI)编程命令通过调节CPU频率来调整平台功耗。平台在电源直流(DC)侧的瞬时功耗是直流总线电压(VCC)和流入平台的电流的乘积。
实际物理因素限制了这种变化的速度。存储能量是一个重要考虑因素,并联电容和对地电容限制了VCC的变化速度,串联电感则限制了电流的变化速度。系统中分布着并联电容和串联电感,如果没有适当的调整,存储的能量会在电容和电感组件之间来回移动,导致功率振荡,这种情况在早期原型中经常出现,尤其在状态转换时,如BMC在启用EDPC功率上限后释放功率节流时。作为算法调整的一部分,工程师必须确保在所有条件下每次激活EDPC时都能适当抑制功率振荡。
#### 算法调整的挑战与解决方案
算法调整是一项交互式活动,既困难又耗时。在传统设置中,拥有平台的CSP、构建平台的ODM和技术提供商各自独立工作,其他利益相关者必须先验证某个实体观察到的异常情况,才能开始分析问题。
由于每个实体都有自己的内部流程,技术提供商可能坚持在参考平台上重现问题后才开始解决工作。如果参考平台不支持CSP正在开发的ASCP功能,就会陷入僵局,使各方都不满意。而HaaS实验室的通用调试平台可以解决这些问题。首先,HaaS实例代表了CSP、技术提供商和ODM各方共同构建ASCP的承诺,技术提供商同意在ASCP上进行项目交互,而不是在可能不适合项目的预定义参考平台上。其次,一旦隔离出异常情况并确定触发条件,其他合作伙伴无需重现问题,他们可以直接观察问题,因为他们可以访问同一台机器,具有相同的可见性,还可以使用同一台机器尝试解决方案。对于难以重现的问题,原本可能需要数月才能解决,现在只需数周甚至数天即可完成。
#### 调试平台的设置与实验准备
设置通用调试平台和目标实验需要专业技术工作。实验室工作人员可以分析被测系统(SUT)的CAD图,并焊接合适的测试点。在某些情况下,监控的逻辑信号可以从XDP调试端口获取,但大多数情况下,对电路板进行详细调试需要自定义测试点。选择合适的测试点是一个繁琐的过程,目标逻辑信号可能隐藏在基板内层的走线中,需要监控其他能反映主要目标信号行为的信号。
例如,在一个特定的电路板实验中,工程师研究了测试点T1、T7、T8和T9之间信号的相对时序。T8和T9的逻辑值预期跟随T1的逻辑值变化,当T1从高电平转换到低电平时,T8和T9按预期转换,但当T1从低电平转换到高电平时,T9需要几百毫秒才能恢复,这种异常行为在正常情况下很难调试,因为只能看到端点的情况,而通过仪器可以在中间任何位置进行探测,消除了猜测的过程。不过,识别测试点并实际焊接仍然是一个耗时的过程,且存在损坏电路板的风险。工程师采用迭代过程,每次小心地添加几个测试点,运行实验,直到确定中间信号的行为,找出导致异常行为的根本原因。
对于数字域的分析,实验室工作人员可以构建适当的软件驱动程序、定序器、触发器和状态机,用于在数字和模拟域中捕获事件,并将信号输入逻辑分析仪或示波器。这通常是实验室工作人员和客户之间高度交互的过程。一旦仪器安装就位,就可以设置为远程访问,进行一系列试验,或者满足客户进行机密实验的需求。
在进行实验之前,准备、配置和部署支持实验的环境可能需要大量时间。即使所有运行组件都已到位,某些实验仍需要将系统调整到特定状态,这需要花费大量时间和精力。由于原型的脆弱性,可能每次测试都需要重启应用程序,甚至重新加载操作系统或固件。例如,基板或芯片中嵌入式微控制器的操作系统等固件可能存储在SPI闪存芯片中,更新固件需要从机器中物理移除芯片,并在工作台上重新编程。如果机器安装在机架中,则需要将机器从机架中取出,使用外部闪存编程器重新刷新芯片。
HaaS实验室支持通过Galileo开发板远程控制的可切换插座来安装SPI芯片,这样可以将SPI芯片引脚重定向到闪存编程器进行远程刷新,然后再连接回SUT进行实验。只要闪存编程器允许通过前端机器应用程序进行远程控制,对其没有特定要求,应用程序可以运行在同一用户前端机器或专门用于工具的单独虚拟机中。
为了最小化专有信息泄露,不想留下任何状态的用户可以将USB重定向到本地工作站或从本地工作站的文件中加载。用户在完成工作后擦除SPI芯片,这样图像的比特数据要么在用户的实际控制之下,要么仅在用户积极工作时存在于SUT中。串行重定向
0
0
复制全文
相关推荐









