C++代码编译过程中,为x86和ARM架构生成的可执行文件会有明显的差异,这是因为这两种架构使用不同的指令集。

x86代表英特尔的32位和64位个人计算机指令集架构。

ARM是一种主要用于移动设备、平板电脑和嵌入式系统的32位架构。

 

以下是一个简单的C++代码示例,它可以输出"Hello World":

#include <iostream>
 
int main() {
    std::cout << "Hello World" << std::endl;
    return 0;
}

 

为了在x86和ARM架构上编译这段代码,可使用gcc或g++编译器,并使用-march标志指定目标架构。例如:

# 为x86编译
g++ -march=x86 -o hello_x86 hello.cpp
 
# 为ARM编译
g++ -march=arm -o hello_arm hello.cpp

 

这将生成两个可执行文件:hello_x86hello_arm

这两个文件在二进制级别上会有不同,因为它们针对不同的处理器架构。

请注意,-march选项是告诉编译器生成针对特定CPU架构(ARM、x86)的代码,这可能导致性能优化不是跨架构通用的。如果想要生成能够在两种架构上运行的“可移植”可执行文件,可省略-march选项,或者使用它为特定架构生成代码,然后使用工具进行测试,例如:QEMU

 

 

gcc/g++:-march和-mtune 使用区别

使用示例:
1. -march=armv7-a -mtune=cortex-a8
2. -march=armv6 -mcpu=arm1176jzf-s -mtune=s3c6410
3. -march=i686 -mtune=pentium4

像第三行的 -march=i686 -mtune=pentium4,这是为奔腾4处理器优化选项编译出来的程序,可在任何i686上都可以运行。如果指定了-march=pentium3,那么只能在 pentium3 及以下版本可运行,但不可在奔腾4处理器上运行的,原因是 -mtune=pentium4 是向低版本兼容的,但低版本(pentium3)编译后不能在高版本(pentium4)上运行

 

从使用上来看,ARM和X86架构的可执行程序肯定是不通用的,

但是,如果源码编译,环境类似,相同的源码可以直接移植。

例如:如下程序 donut.cpp

#include <stdio.h>
#include <math.h>
#include <cstring>
#include <unistd.h>
 
int main() {
    float A = 0, B = 0;
    float i, j;
    int k;
    float z[1760];
    char b[1760];
    printf("\x1b[2J");
    for (;;) {
        memset(b, 32, 1760);
        memset(z, 0, 7040);
        for (j = 0; j < 6.28; j += 0.07) {
            for (i = 0; i < 6.28; i += 0.02) {
                float c = sin(i);
                float d = cos(j);
                float e = sin(A);
                float f = sin(j);
                float g = cos(A);
                float h = d + 2;
                float D = 1 / (c * h * e + f * g + 5);
                float l = cos(i);
                float m = cos(B);
                float n = sin(B);
                float t = c * h * g - f * e;
                int x = 40 + 30 * D * (l * h * m - t * n);
                int y = 12 + 15 * D * (l * h * n + t * m);
                int o = x + 80 * y;
                int N = 8 * ((f * e - c * d * g) * m - c * d * e - f * g - l * d * n);
                if (22 > y && y > 0 && x > 0 && 80 > x && D > z[o]) {
                    z[o] = D;
                    b[o] = ".,-~:;=!*#$@"[N > 0 ? N : 0];
                }
            }
        }
        printf("\x1b[H");
        for (k = 0; k < 1761; k++) {
            putchar(k % 80 ? b[k] : 10);
            A += 0.00004;
            B += 0.00002;
        }
        usleep(30000);
    }
    return 0;
}

在ARM和X86平台上,运行结果几乎一致!

 

编译过程都是:

g++ donut.cpp -o donut

生成文件大小:

arm→13.5 KB (13,856.00 字节)

x86→ 16.0 KB (16,384 字节)

很多软件都支持多平台,例如:Windows  .exe、Ubuntu .deb、CentOS .rpm、MacOS .dmg、tar.gz、ARM 32 bit、ARM 64bit

 

ARM 与 X86 架构区别

X86 指 Intel 处理器家族,从 8086 开始,随后发布 80186、80286、80386、80486、Pentium 和 Xeon 等。X86 中的 86 表示其早期处理器的最后 2 位数字

ARM 最初由 ARM Holdings 以 Acorn RISC Machine 起家,开发了 ARM、ARM2 32 位处理器,其晶体管数量最少,功耗/散热更低。 X86 主导台式机、工作站、笔记本电脑和服务器市场,最初的芯片是 16 位,后来的版本是 32 位和 64 位。ARM 在速度和长电池寿命方面超过了英特尔处理器。 与 Apple 和 VLSI 合作推出了一家新公司 Advanced RISC Machines。 ARM 处理器广泛用于移动设备。

 

1、指令系统

ARM 处理器属于精简指令集计算 (RISC) 架构

指令集架构 (ISA) 定义了处理指令、访问内存、管理 IO 的方式,并将处理器与程序员连接起来以生成高效的代码。

RISC 是同类中最新的一种,其中活动被拆分(简化)为简单指令,一条指令在一个时钟周期内执行,数百万条此类指令在一秒钟内以更快的速度处理。

虽然它必须执行多条指令,但由于其强大的处理器和流水线,整体速度更高。

X86 处理器遵循复杂指令集计算 (CISC) 架构

复杂的指令在多个时钟周期中的单个步骤中处理。它使用可用内存在一个步骤中处理多条指令,更注重处理效率。

它使用更多的寄存器来完成多个任务,实现了高吞吐量和性能

 

2、应用场景

处理器的选择取决于计算机将用于的应用程序。对于 IOT 应用(物联网),ARM 处理器是正确的选择,因为嵌入式系统需要连接到所有设备,而且它应该小。

需要具有成本节约动机的单板计算机,ARM 是最佳选择。对于不需要特殊显示器的节俭应用,ARM 也是理想的选择。

需要强大的服务器平台、计算数据中心等, X86 的应用程序是正确的选择。

 

 

参考推荐:

ARM、x86 架构开发入门

ARM、X86/Atom、MIPS、PowerPC

程序员应当更新现代CPU的知识

为什么寄存器比内存更快

C语言编译全过程剖析

C++用new和不用new创建类对象区别

Android生态系统的5年演进史