内联汇编,顾名思义,一种语言的内部使用汇编,一般的语言是不能直接操作寄存器的,而汇编可以,所以在这种语言内部以某种方式嵌入汇编代码来提升能力,一般来说也就是 c/c++ 使用内联汇编比较多,本文用的 c 语言来叙述,废话不再多说,直接来看。
//关键字的宏定义
#define __asm__ asm
#define __volatile__ volatile
//内敛汇编基本形式
asm [volatile] ("汇编代码/指令");
asm 同 __asm__(两根下划线),用来申明内联汇编表达式
volatile 同 __volatile__,可选项,它会告诉编译器不要优化代码,保持原样
汇编代码得好好说道说道,有着以下规则:
指令必须用双引号括起来,里面可以是一条指令也可以是多条指令甚至没有指令,多条指令的话需要用分割符隔开,一般就是用 ';'
asm (""); // ✔
asm ("movl $1, %eax"); // ✔
asm ("movl $1, %eax; pushl %eax"); // ✔
可以有多对双引号,里面有着一条或多条指令,成对双引号之间也需要隔开,最后一对双引号之间的最后一条指令后面不需要分隔符
asm ("movl $1, %eax;""pushl %eax"); // ✔
一对双引号之间不能跨行,若要跨行,在结尾用 '\' 转义
asm ("movl $1, %eax; \
pushl %eax"); // ✔
其实不论多少对双引号,编译器在处理的时候都要合并到一起,所以基本规则就是,指令在双引号之间,指令之间用分隔符隔开。这样说内联汇编的基本形式还是挺简单的吧,下面来看内联汇编最重要的扩展形式
asm [volatile] ("Instruction list":Output:Input:Clobber/Modify)
扩展形式多了三部分,其中每部分都可以省略,假设前面部分省略为空,如果后面部分非空,则这个后面部分前面的冒号不能省略,如果后面部分也省略为空,那么前面的冒号可省略。比如说 Output 和 Input 部分为空,Clobber/Modify 部分非空,那么 Output 和 Input 前面的冒号不能省略,反之则能省略,退变成基本形式。冒号省略与否的问题主要是给编译器看的,要让编译器分清楚哪部分属于哪部分。
基本形式的寄存器前面只有一个 %,而扩展形式的寄存器需要使用两个 %%,这是因为扩展性是经常使用占位符,使用一个 % 后面跟上数字或名称来表示占位符,后面再详述。
格式:"约束"(c 变量名)
上面的引号和圆括号都是必须的,不是文章中的特殊标识。上面的意思就是说汇编指令的结果按照某种约束/方式传给 c 变量。具体的约束形式后面详述。
变量名可能有多个,则用下面的形式:"约束1"(c 变量1), "约束2"(c 变量2) ...
格式:"约束"(c 变量名)
意为某 c 中的数据按照某种约束输入给汇编使用,一般就是将某 c 变量传给某个寄存器。有关多个变量的情况写法同 Output,具体的约束也后面详述。
另外内联汇编的用法挺多,上面所写的格式可能不太准确但也没什么错,因为最主要的用法就是使用约束将 c 中的变量和寄存器联系起来。更多的用法我们后面慢慢来看。
指定此项会通知编译器可能会破坏寄存器/内存里面的数据,然后编译器就会将这些可能被破坏的内存和寄存器提前保护起来。
一般的,如果在 Output 和 Input 部分指定了寄存器约束,那么编译器一定知道该寄存器被改变了,那么就不用申明。
寄存器约束就是要求编译器使用哪个寄存器,将 Output 和 Input 的变量约束到哪个寄存器。常见的寄存器约束如下:
看个简单例子:
int main()
{
int in_a = 1, in_b = 2;
int out_sum;
asm ("addl %%ebx, %%eax":"=a"(out_sum):"a"(in_a),"b"(in_b));
printf("The result is %d\n", out_sum);
}
//The result is 3.
这是一个简单的用汇编写的加法程序,输入 in_a = 1, in_b = 2,输出 out_sum = 3,是用指令 addl 实现的,来具体分析分析:
这里 output 和 input 部分使用了同一个约束 "a",这会造成混乱吗?不会,因为照着逻辑走一遍程序,in_a 的值传给 eax,in_b 的值传给 ebx,算出来的结果还是放在 eax,再将其中的结果传给 out_sum,所以不会造成混乱数据出错的情况。
内存约束是将 c 变量的地址作为汇编代码的操作数,不需要寄存器作为中转,直接进行内存读写。
主要的内存约束就是 "m" 了,表示使用系统支持的任何一种内存形式而不借助于寄存器,来看个例子:
int main()
{
int in_a = 1, in_b = 2;
asm("movl %0, %1"::"a"(in_a),"m"(in_b));
printf("in_a is %d, in_b is %d.\n", in_a, in_b);
//in_a is 1, in_b is 1.
in_a = 1; in_b = 2;
asm("movl %0, %1"::"a"(in_a),"b"(in_b));
printf("in_a is %d, in_b is %d.\n", in_a, in_b);
//in_a is 1, in_b is 2.
in_a = 1; in_b = 2;
int out_a, out_b;
asm("movl %0, %1":"=a"(out_a),"=b"(out_b):"a"(in_a),"b"(in_b));
printf("in_a is %d, in_b is %d, out_a is %d, out_b is %d.\n", in_a, in_b, out_a, out_b);
//in_a is 1, in_b is 2, out_a is 1, out_b is 1.
}
第一个例子和第二个例子结合起来看,%0 和 %1 为占位符,分别引用 in_a 和 in_b。
第一个例子中 in_b 使用的内存约束,所以 movl 操作直接操作的是 in_b 所在的内存,将 eax 的值移到 in_b 所在的内存,所以 in_b 本身的值变成 1。
第二个例子中 in_b 也是用的寄存器约束,所以 movl 操作的是寄存器 eax, ebx,将 eax 的值移到 ebx,但 in_b 所在的内存不受影响,所以本身的值不变还是 2。
第三个例子在第二个例子上增加 Output 部分,将寄存器的值输出,会发现寄存器的值变了,这个例子只是作为对照来看。从上面几个例子来看,会发现寄存器约束和值传递类似,内存约束和传指针类似。
立即数在 c 中只能作为右值,所以这只属于 Input 部分。立即数约束在传值的时候不需要借助内存和寄存器,主要约束如下:
举个例子如下:
asm volatile ("movl %0, %%eax"::"i"(100));
%0 就是占位符,使用一个 % 其后跟 0 表示引用第 0 个操作数,在这里就是立即数$,也就是说这里的100,通过 i 来约束表整数。
CPU 能够直接使用的数据就存放在三个地点,寄存器中,内存中,还有指令中的立即数,这就与三种约束对应起来。c 代码和汇编代码要建立联系,要交互,就要传输数据,数据存放地儿就那三个,所以就有了这三种约束。
”0,1,2,3,4,5,6,7,8,9“,也只用在 Input 部分,表示与 Output 和 Input 中第 n 个变量使用相同的寄存器或内存。
同样的看个例子来理解:
int main()
{
int in_a = 1, in_b = 2;
int out_sum;
asm("addl %1, %0":"=a"(out_sum):"b"(in_b),"0"(in_a));
printf("The result is %d.\n", out_sum);
}
同样的加法程序,只是这里的输入部分的 in_a 使用的是通用约束 "0" ,表示分配给 in_a 的寄存器跟第 0 个(out_sum) 使用相同的寄存器 eax。
"=" 前面每个例子基本都有,就不看了,来看个关于 "+" 的例子:
int main()
{
int io_a = 1, in_b = 2;
asm("addl %%ebx, %%eax":"+a"(io_a):"b"(in_b));
printf("The result is %d.\n", io_a);
//The result is 3.
}
这个例子就表示 io_a 既是输入对象,又是输出对象,所以省略了 io_a 在 Input 部分的申明。io_a 先被当作输入对象读入,汇编代码运算出结果后又被当作输出对象输出。
占位符前面已经用过很多次了,这里再具体看看,占位符可以分为两种:序号占位符,名称占位符
对 Output 和 Input 部分出现的操作数从左往右依次从 0~9 编号,然后在汇编代码部分使用 %0~9 来引用。这里的占位符用一个 % 来表示,所以汇编代码直接使用寄存器的话需要用 %% 来表示。
名称占位符,顾名思义,不是用序号,而是给操作数取个名字。
在 Output 和 Input 部分的格式:[名称]"约束"(变量),在代码中引用的格式:%[名称]
看个例子:
int main()
{
int io_a = 1, in_b = 2;
asm ("addl %[inb], %[out]":[out]"=a"(out_sum):"0"(in_a),[inb]"b"(in_b));
printf("The result is %d.\n", io_a);
//The result is 3.
}
应该很简单就不解释了,与序号占位符没多大区别,只是没有顺序要求,而是使用名称来定位。
本文的剩余部分来解决 xv6 中涉及内联汇编的部分,顺带讲述一些相关指令的用法
in 指令用法:
in port, %al
in port, %ax
out %al, port
out %ax, port
in 表示从端口 port 读取一个字节的数据到 al,或者从端口 port 读取一个字的数据到 ax,out 反着来。具体使用 al 还是 ax,是要看 port 对应的寄存器位宽。port 可以使用立即数的方式,范围为 0~255,也可以使用寄存器 dx 指定,此时范围 0~65535。
static inline uchar inb(ushort port) //从端口port读入一个字节
{
uchar data; //一字节的数据
asm volatile("in %1, %0" : "=a" (data) : "d" (port)); //port输入部分,指出端口,data输出部分,作为返回值
return data;
}
先说两个寄存器,esi:源变址寄存器,edi:目的变址寄存器,字符串操作的过程中,esi 作为源地址,edi 作为目的地址。其实还应指定段寄存器,但是由于平坦模式的存在,两个段的段基址都为 0,所以就是 esi 作为源地址,edi 作为目的地址。
常见的字符串操作指令如下:
movs,把 esi 指向的内存数据复制到 edi 指向的内存单元处。
ins:从端口 dx 读入的数据存放到 edi 指向的内存单元处,outs:esi 指向的内存数据送到端口 dx 中去
lods:将 esi 指向的内存数据送到 al/ax/eax 中去,stos:将 al/ax/eax 中的数据送到 edi 指向的内存单元
以上指令通常配合 rep 重复指令一起使用,每执行依次,根据 eflags 寄存器的 DF 位修改 esi 和 edi 的值
cld 指令,将 eflags 寄存器的 DF 位清零,在字符串操作中使变址寄存器 ESI 或 EDI 的值自动增加,字符串从前往后处理,增加的具体数字依每次执行操作的字节数而定。std 指令与 cld 相反。
重复,循环指令,循环次数为 ecx 存放的值,当 ecx 减到 0 时停止
联合内联汇编来看上述指令的例子:
static inline void
insl(int port, void *addr, int cnt) //从端口port读4*cnt个字节到地址addr
{
asm volatile("cld; rep insl" : //清零 DF 位,重复指令 insl
"=D" (addr), "=c" (cnt) : //addr目的地址绑定寄存器edi,cnt循环次数绑定ecx
"d" (port), "0" (addr), "1" (cnt) : //port端口绑定dx,addr,cnt同上
"memory", "cc"); //改变了内存,改变了eflags寄存器
}
重复执行 insl 指令来读取多个字节的数据到目的地址,具体操作顺序是先读目的地址和循环次数,insl 每次执行后再更新 addr,cnt 的值,所以 addr 和 cnt 是又读又写的,因此 Output 和 Input 部分都存在 addr 和 cnt。期间改变了内存和 eflags 寄存器,所以内联汇编的最后一部分申明 "cc" 和 "memory"。
static inline void stosb(void *addr, int data, int cnt) //stos指令是将eax中的数据送到地址addr去
{
asm volatile("cld; rep stosb" : //清零DF,重复指令stosb
"=D" (addr), "=c" (cnt) : //addr目的地址绑定寄存器edi,cnt循环次数绑定ecx
"0" (addr), "1" (cnt), "a" (data) : //addr,cnt同上,data为输入数据传给寄存器eax
"memory", "cc"); //改变了内存,改变了eflags寄存器
}
重复 stosb 指令,每次将传到寄存器 eax 的数据传送 1 字节到 addr 处,每次执行完后更新 addr 和 cnt 的值。其他的基本同上,就不赘述了。
来看 xv6 字符串函数 memset,就是用 stos 指令实现的:
void* memset(void *dst, int c, uint n) //将从地址dst开始的n个字节设置为c
{
if ((int)dst%4 == 0 && n%4 == 0){ //如果以 4 字节对齐,可以使用stosl的封装函数,每次传送4字节,重复n/4次
c &= 0xFF;
stosl(dst, (c<<24)|(c<<16)|(c<<8)|c, n/4);
} else //否则就是用stosb的封装函数,每次只传送1字节,重复n次
stosb(dst, c, n);
return dst;
}
回到内联汇编上来,再来看 xv6 中几个典型的例子:
static inline uint readeflags(void) //返回eflags寄存器
{
uint eflags;
asm volatile("pushfl; popl %0" : "=r" (eflags));
return eflags;
}
pushfl 压入eflags,popl弹出栈顶数据(eflags)到 %0 引用的通用寄存器 r。然后该寄存器的值再传给 eflags(变量)。
static inline uint xchg(volatile uint *addr, uint newval) //交换*addr和newval,返回*addr
{
uint result;
// The + in "+m" denotes a read-modify-write operand.
asm volatile("lock; xchgl %0, %1" :
"+m" (*addr), "=a" (result) :
"1" (newval) :
"cc");
return result;
}
先来说说指令,lock 是一个前缀指令,它会将后面的指令变成原子指令,原子性懂吧不解释了。
xchg 指令交换两个操作数的值,至少有一个操作数的指令为寄存器。
因此上面的内联汇编中 *addr 使用了内存约束, result 就必须使用寄存器约束了,*addr 和 newval 都是既读又写的,*addr 就直接使用修饰符 "+" 来表示了,所以在 Input 部分不用再出现 *addr,而 result 使用寄存器约束,用 "=" 来修饰表写,所以 Input 部分还需要 newval 来绑定相同寄存器表读。
该内联汇编也可以如下来写:
uint result = newval;
asm volatile("lock; xchgl %0, %1" :
"+m" (*addr), "+a" (result) ::
"cc");
return result;
将两者都变成用 "+" 来修饰,如此 Input 部分便不用再申明,已经测试,效果是一样的。
xchg 这个指令的确是将两个操作数的值交换,但是封装的这个 uint xchg(volatile uint *addr, uint newval) 函数并不是将两者之间互换,而是一个单纯的原子性的赋值函数 *addr = newval。为啥?不是用了 xchg 指令吗?原因就在于一个用的内存约束,直接修改的内存,所以值发生变化,而另一个使用寄存器约束,使用 xchg 指令只是使该寄存器的值改变了,但并没有实际改变 newval 的值,就跟写 switch 函数的时候用值传递并不会实际交换一样的道理。
好啦,本文到这儿就结束了,本文主要讲述了内联汇编和一些指令的使用。然后解决了 xv6 里面一些用内联汇编实现的功能函数,也就是 x86.h 那个文件里面的函数,还有一些函数就没一一拿出来举例了,都类似或者更简单,把本文举出来的弄清楚,其他的应该没什么问题。
OK 就到这儿了,有什么问题错误还请批评指正,也欢迎大家来同我讨论交流学习进步。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/oaGTPIGJi6NrFEJmUjqgaQ
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。