宁夏一站式网站建设企业整站网站模板下载

张小明 2026/1/13 7:05:48
宁夏一站式网站建设,企业整站网站模板下载,微信广告推广如何收费,网上营销手段一、循环展开 什么是循环展开#xff1f;为什么要循环展开#xff1f;可能对不少的程序员来说#xff0c;循环展开,loop unrolling。它是一种编译器优化的技术#xff0c;它的本质是通过减少条件分支和运行时的pipeline停顿来提升性能#xff0c;并有可能提高缓存的命中率…一、循环展开什么是循环展开为什么要循环展开可能对不少的程序员来说循环展开,loop unrolling。它是一种编译器优化的技术它的本质是通过减少条件分支和运行时的pipeline停顿来提升性能并有可能提高缓存的命中率。C中的循环展开相对于其它语言来说可能操作更具有灵活性。这种优化一般应用于循环的迭代次数相对较少而且每次迭代计算量较大的情况。网上有些资料把其称为短循环。二、循环展开的方式和分析一般来说循环展开的方式主要有两个方向即手动展开和自动展开。手动展开依赖开发者自己把循环按实际的场景进行展开而自动展开依赖于编译器及其它辅助的技术。手动循环展开手动循环展开非常好理解就是将循环体的操作的代码人工操作多次这样就会减少循环执行的次数。当然这需要开发者自己仔细衡量并平衡相关的代价。如下面的例子for(inti0;i16;i){arr[i]i*2;}// 展开5次for(inti0;i4;i4){arr[i]i*2;arr[i1](i1)*2;arr[i2](i2)*2;arr[i3](i3)*2;arr[i4](i4)*2;}说简单些就是ctrlc,ctrlv大法。强调一下之所以称之为短循环一般是循环次数不太大16次以下时才有优势。其实就是分支预测耗时大于循环消耗时才有优势。也可以使用switch中的fallthrough方法voidworking(intn,int*a,int*b){if(n0||n16){return;}switch(n){casen:a[n]b[n]*2;...case2:a[1]b[1]*2;case1:a[0]b[0]*2;case0:break;}}自动循环展开自动循环展开一般有两种情况1 使用编译优化选项如在编译时增加-O2 或-O3注意O大写小写表示输出选项2使用预编译展开选项即在代码中使用#pragma GCC unroll N或“#pragma unroll”,但需要注意这个N是一个具体数值。另外循环中判断退出的大小值建议是一个常量否则可能无法进行完全展开而只进行部分展开。#pragmaGCC unroll4for(inti0;i4*n;i){arr[i]i*2;}部分展开的意思是上面的4*n如果换成任意数可能不是5的倍数那么编译器就会展开5的倍数部分而余下则不展开直接循环。其实就是能快一点是一点。这叫做循环剥离部分展开loop peelingPartial Unrolling。循环展开之所以能提升性能主要就在于通过展开减少了循环控制中的条件判断和指令跳转减少流水线的扰动提高了CPU指令执行的并行机会。减少了变量迭代更新的次数包括加减等操作。而循环内大的数据计算又可能导致内存缓存的命中率有可能提升只是有可能毕竟相邻数据多了这样就有了提高性能的前提和基础。循环展开需要实际情况进行恰当的应用因为循环展开的结果未必能完全保证提升性能或者说达不到优化的目的。主要原因在于面对过长的循环且内部复杂时过度的展开可能引起严重的代码膨胀有点类似于内联和模板啊。而如果代码的大小超过了缓存的容量就需要不断的去内存取指。这样反而可能导致性能的下降。其次过多的展开导致寄存器的大占用会导致CPU的寄存器耗尽不断的将相关的数据转移到内存降低性能。当然还有些循环是不适合循环展开的比如循环过少或循环内存在在很复杂的分支条件等此时的循环展开其实是没有什么优化的余地的。综合上述在进行循环优化时一定要仔细考虑不要为了展开而展开。一定要从最终的性能测试结果出发有根据的进行循环展开的优化。三、循环展开的缺点循环展开时编译器无法对过长的循环进行完全的展开但可以进行部分展开或开发者自行利用手动再加一些编译期优化代码技术进行运行时的动态处理。这就增加了对开发者的要求。其主要的缺点有最直观就是代码变得不易理解和维护过多的展开有可能导致性能降低的情况如内存数据的读写和数据的溢出到内存包括代码膨胀导致的溢出循环展开的优化的兼容性低。不同的硬件平台、编译平台和系统可能导致不同的结果在现代的CPU中使用SIMD反而可能会有更好的效果所以在编译时提供能够自动向量化的标记-O3 -marchnative反而可能会有更好的效果。四、循环展开的高级用法循环展开除了前面提到的方法还可以使用模板技术和c17以后的新的方式来进行模板或元编程方式看代码templateintNstructuLoop{templatetypename Fstaticvoidinvoke(F func){uLoopN-1::invoke(func);func(N-1);}};// 终止递归的特化条件templatestructuLoop0{templatetypename Fstaticvoidinvoke(F func){}};intarr[10];uLoop16::invoke(arr);使用常量表达式或索引展开使用新标准的代码templateintNvoidunrollTest(intn,float*a,constfloat*b){if(Nn){a[N-1]b[N-1]*2;}ifconstexpr(N1){unrollTestN-1(n,a,b);}}voidworking(intn,float*a,constfloat*b){if(n8){unrollTest8(n,a,b);}}//std::make_index_sequence#includeutility#includearraytemplatetypename T,std::size_t...idvoidunrollInvoke(T*arr,std::index_sequenceid...){((arr[id]id*2),...);// 折叠表达式}templatestd::size_tNvoidunrollDemo(std::arrayint,Narr){unrollInvoke(arr.data(),std::make_index_sequenceN{});}std::arrayint,16arr;unrollDemo(arr);另外顺道提到一下实际开发中也可以利用宏展开的方式进行循环展开的优化但宏的应用不是特别推荐的方法大家有兴趣可以自行查找相关的资料即可。五、总结循环优化在现在的技术看来应该不是一个好的优化方法。当然在某些情况下还是有可能有着不错的优化结果的。这就看开发者对选择的循环展开大小、边界控制等的整体把握了。不过推荐还是使用编译器进行处理并尽量采用SIMD等现代的并行技术。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

衡阳网站建设价格怎么下载浏览器上的视频

PowerShell自动化脚本与DSC配置实践指南 1. 脚本函数共享与自动化 在构建自动化脚本系列时,可在多个脚本间共享大型重复函数,以减小脚本整体大小。这不仅降低了单个脚本的复杂性,而且在改进这些大型重复函数时,只需在一处进行更新,提高了脚本编写效率,使脚本更可靠。 …

张小明 2025/12/26 2:06:57 网站建设

免费网上商城系统seo搜索引擎优化实战

(抱紧保温杯在星巴克敲键盘版) 各位同行好!我是上海某咖啡馆野生.NET程序员刚搞懂IIS怎么念的代码民工秃头预备役。最近接了个"史诗级"外包项目,客户要求实现20G文件夹上传下载,现在每天的状态be like&#…

张小明 2025/12/29 6:49:15 网站建设

武城网站建设费用怎么评价网站做的好坏

好的,我们来详细、系统地解释归并算法(Merge Algorithm)及其核心逻辑。 基本概念 归并算法(Merge Algorithm)是将两个或两个以上已经有序的序列合并成一个新的有序序列的过程。它是归并排序(Merge Sort&…

张小明 2026/1/11 18:15:16 网站建设

九狐建设网站网站的推广费用票可以做抵扣吗

深度学习开发者们,你是否曾因模型在不同框架间的兼容性问题而头痛不已?从TensorFlow到PyTorch的迁移成本,从训练到部署的性能损耗,这些困扰开发者的难题在Keras 3中得到了完美解决。本文将带你深入理解Keras 3的多后端架构设计&am…

张小明 2025/12/26 2:05:17 网站建设

土地违法建设投诉网站深圳优秀网页设计

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 为电商平台开发一个client_plugin_auth解决方案,需要处理以下场景:1. 用户登录态维护 2. 支付接口的敏感操作二次验证 3. 第三方物流API的认证集成 4. 管理员…

张小明 2025/12/29 0:04:56 网站建设

如何申请网站空间和注册域名平台网站建设设计

概述 (Overview) Nmap (“Network Mapper”) 是一款开源且功能强大的网络扫描工具,广泛用于网络发现和安全审计。它利用原始 IP 报文来发现网络上的主机、探测这些主机开放的端口、确定端口上运行的服务及其版本、推测目标操作系统,并可通过 Nmap 脚本引…

张小明 2025/12/26 2:04:10 网站建设