内存模型之白话入门

本文探讨了程序员在理解多处理器共享内存模型时常见的误区,分析了现代CPU和编译器如何通过重排序等手段破坏程序员心目中的理想模型,以及由此可能导致的多线程程序错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 
程序员眼中的多处理器共享的内存: 
  
     作为一个程序员,很容易把多处理器的内存想象成这样:每个处理器的 load & store会按照program order执行;内存在同一时刻只能接受一个处理器的load/store。 
  
     毫无疑问,程序员们非常喜欢这个模型,它与单处理器下的内存模型是一致的,这是我们最习惯的编程方式,而且为单处理器写出的多线程程序可以很安全的拿到多处理器上运行。  
  
     但是,这个模型的性能很差,阻止了很多的CPU和编译器的优化,为了获得高效率,几乎所有编译器和CPU都在不同程度上破坏了这个模型。 
  
CPU和编译器对这个模型的破坏: 
  
     现代的CPU基本上都支持out-of-order execution、multiple instruction issue和memory reorder buffer(write buffer),这就使得load & store的program order无法保证。当然啦,这种reorder是在不影响程序正确性的前提下进行的,但是CPU只能保证当前thread的正确性,没有顾及对其他CPU上的thread的影响。  
  
     此外,在NUMA的机器(现在高端的x86也有NUMA的机器)上,一个CPU对不同的memory module的访问延迟是不同的。所以即使两个store按照program order被执行,它们完成(被其他的CPU看到)的顺序也会被改变。  
  
     很多的编译优化也会打乱load/store的program order(甚至把变量装在register中而移除相应的load & store )。这些优化包括:code motion、register allocation、common sub-expression elimination、 software pipelining等等。与CPU的out-of-order一样,编译器的out-of-order只会保证当前thread的正确性,没有顾及对其他thread的影响。  
    
一些具体的会出错例子:  
  
初始状态:flag1=flag2=0  
Thread 1 on processor 1:  
       flag1=1;  
       if (flag2==0) then  
            enter critical section  
   
Thread 2 on processor 2:  
       flag2=1;  
       if (flag1==0) then  
             enter critical section  
  
由于编译器或是CPU可能会在thread 1上先load flag2再store flag1;在thread 2上先load flag1再store flag2,从而使两个thread同时进入critical section!    
  
初始状态:B=0  
Thread1 on processor 1:  
        A=1000;  
        B=1;  
   
Thread2 on processor 2:  
        while(B!=1);  
        C=A;  
  
由于CPU或是编译器可能会reorder thread1中对A、B的store,C的值不一定是1000。更可能的情况是编译器会把B的值装在register中,而使thread2进入一个死循环!  
    
     下面我们看一个更加复杂,并且更加现实的例子:  
Singleton* Singleton::instance () {  
if (pInstance == 0) {  
     Lock lock;  
     If (pInstance == 0) {  
         pInstance = new Singleton();  
     }  
}  
return pInstance;  
}  
     这是一段用double checked locking来实现singleton的经典代码,使用它的程序不计其数,但是它有bug:它不是thread-safe的!甚至在单处理器上,也不能保证正确工作。  
     按照program order,CPU应该先调用Singleton的constructor(一般来说,里面会包含一些store),然后再赋值给pInstance(一个store)。但是编译器可能会inline Singleton(),然后reorder这些store,使得Singleton的constructor还没有执行完,pInstance的值已经不再等于0,造成的结果就是其他的thread会得到一个不完整的Singleton! 即使编译器不做任何的reorder,CPU也有能做同样的事情!  
内容概要:本文档详细介绍了基于Python的在线二手电子产品回收系统的设计与实现。项目旨在通过构建一个可靠、安全、透明的平台,提高废旧电子产品的回收率,推动资源的合理再利用,提供安全可靠的交易平台,加强环保意识,促进二手市场的发展,并实现数据驱动的智能化服务。项目面临的主要挑战包括废旧电子产品的检测与评估、信息不对称与交易风险、市场需求的预测与定价、用户体验优化及平台的安全性与数据保护。解决方案涵盖智能化评估与回收定价、高效的二手产品处理流程、完善的售后保障体系、创新的市场需求分析、全程透明化与安全性保障以及定制化用户体验。系统采用微服务架构,包括用户管理、商品评估、交易管理、数据分析、支付与结算等模块。项目还涉及前端界面设计、API接口开发、数据库设计与实现、模型训练与优化、部署与应用等方面。 适合人群:具备一定编程基础,特别是对Python和Web开发有一定了解的研发人员,以及对二手电子产品回收和环保事业感兴趣的从业者。 使用场景及目标:①帮助用户方便地将闲置电子产品回收、交易或再利用,提高废旧电子产品的回收率;②通过智能化的数据分析为用户提供价格评估、市场需求分析等服务,提高回收效率;③提供安全可靠的交易平台,确保交易的公平性和安全性;④推动二手市场的健康发展,为消费者提供经济实惠的产品选择;⑤增强公众的环保意识,推动社会向绿色、低碳方向发展。 其他说明:本文档不仅提供了系统的功能模块设计、数据库表结构、API接口规范,还展示了具体代码实现和GUI界面设计,为开发者提供了全面的技术参考。此外,项目强调了数据安全和隐私保护的重要性,确保平台在运行过程中能够有效保护用户信息。项目未来改进方向包括增强模型的精准度、拓展国际市场、提供更多支付和融资选项、跨平台数据集成与分析、更加智能的回收流程以及强化社交化与社区功能。
内容概要:本文档详细介绍了基于C语言和单片机设计的固态继电器驱动空调温控系统,涵盖了从硬件电路设计、程序设计、GUI设计到代码详解的完整流程。项目旨在实现高效精准的温度控制、提升系统可靠性和寿命、灵活的参数设置和人机交互、降低能耗、模块化设计便于扩展与维护,以及促进智能家居与工业自动化发展。项目通过高精度温度采集与滤波算法、固态继电器驱动与保护电路设计、滞环控制算法、多层次软件模块化设计等创新点,确保系统的高效节能、智能化和高可靠性。; 适合人群:具备一定单片机和C语言编程基础的研发人员,尤其是从事嵌入式系统设计、智能家居和工业自动化领域的工程师。; 使用场景及目标:①实现高效精准的温度控制,确保室内温度维持在理想范围;②提升系统可靠性和寿命,减少故障率和维护成本;③支持灵活的参数设置和用户友好的人机交互界面,提升用户体验;④降低能耗,实现节能控制,推动绿色建筑和节能环保产业的发展;⑤通过模块化设计,便于后续功能升级和系统扩展,如远程监控、数据分析等智能化功能。; 其他说明:项目设计充分考虑了实际应用中的挑战,如温度采集的精度与稳定性、电气兼容性、系统响应速度与控制稳定性、软件设计的资源优化与抗干扰等,提出了针对性的解决方案。系统不仅适用于家庭智能空调,还能广泛应用于工业、商业建筑、医疗环境及农业温室等多个领域。未来改进方向包括智能温度预测与自适应控制、多传感器融合技术应用、远程监控与云平台集成、低功耗与绿色节能优化等。通过该系统,不仅能够精确控制室内温度,保障舒适环境,还能有效节能,延长设备使用寿命,具有重要的实际应用价值和推广意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值