童年神机小霸王原理(五)滚屏渲染2

发表于 2年以前  | 总阅读数:396 次

Render&Scroll

本文继续来说滚屏渲染,讲述每条 Scanline 每个周期具体干些什么事情以及一些高级玩法,屏幕分割技术,看看前面所说的大片级效果是如何制作的。

还是先来看渲染部分,PPU (NTSC TV)每一帧渲染 262 条 scanlines,每条 scanline 又持续 341 个时钟周期,

对此,wiki 上有一张很详细的图,看懂了,就大致明白了:

上面一排数字表示周期,左边一列数字表示第几条 Scanline,也可以当作坐标来看,(scanline,cycle),下面来详细地解读一下上图

scanline 0-239

这是可见的 240 条 scanlines,每个周期干的事情如下:

cycle 0

渲染的帧分奇偶,如果是奇数帧,这个周期直接跳过,如果是偶数帧,这个周期什么都不做 idle。奇数帧跳过一个周期是为了补偿物理信号输出方面的缺点,使其有更好的画面显示(emm具体的这方面不太懂,有知道的还请指教)

cycle 1 - 256

这 256 个周期循环往复取 4 个数据:

  • NameTable 中的 tile 索引
  • AttributeTable 中的颜色信息
  • 根据 tile 索引取 tile 低位
  • 根据 tile 索引取 tile 高位

每个数据花费 2 个周期,4 个数据 8 个周期取完,这刚好与 shift 寄存器每 8 个周期重新装载吻合

cycle 8/16/24...

每 8 个周期,增加寄存器 v 中 X 坐标值:

if ((v & 0x001f) == 31){
    v &= ~0x001f;
    v ^= 0x400;    //切换NameTable
}else
    v += 1;

如果 v 的 X 坐标值小于 31,那么 X 直接加 1,如果等于 31,X 值归零,切换横向 NameTable,举个例子:

v 跟 0x400 进行异或运算,使得 NN 部分从 00->01 或者 01->00,10->11,11->10,四个 NameTable 的逻辑布局图前文说过,这里再来看一下:

0x2000 表示 NameTable 00,0x2400 表示 NameTable 01,0x2C00 表示 NameTable 10,0x2800 表示 NameTable 11,所以横向切换 NameTable 就是在水平方向相邻的两个 NameTable 之间切换。

cycle 256

在第 256 个时钟周期,增加 v 的 Y 坐标值,表示这一行像素数据已经取完,该准备下一行的数据了,所以增加 Y 的值,Y 值增加稍显复杂,来看伪代码:

if ((v & 0x7000) != 0x7000){       // if fine Y < 7
  v += 0x1000                      // increment fine Y
}else{
  v &= ~0x7000                     // fine Y = 0
  int y = (v & 0x03E0) >> 5        // let y = coarse Y
  if (y == 29){
    y = 0                          // coarse Y = 0
    v ^= 0x0800                    // switch vertical nametable
  }else if (y == 31){
    y = 0                          // coarse Y = 0, nametable not switched
  }else{
    y += 1                         // increment coarse Y
  }
  v = (v & ~0x03E0) | (y << 5)     // put coarse Y back into v
}

如果 fine_y < 7,那么之间 fine_y ++

如果 fine_y = 7,那么说明该切换纵向的下一个 tile 了,且 fine_y 回到 0,表示从新 tile 的第一行开始,此时还要检查 coarse_y,看看是否需要切换纵向 NameTable,纵向有 240 条可见 scanlines,即 个 tile,即 30 行之前是 NameTable,剩下的两行是 AttributeTable:

  • 如果 coarse_y < 29,那么 coarse_y ++ 即可
  • 如果 coarse_y = 29,那么 coarse_y 归 0,切换纵向 NameTable,道理同切换横向 NameTable 不再多说
  • coarse_y 是可以设置成 [30, 31],这样会把 AttributeTable 中的内容当作 NameTable,理论上是错误无效的,不过也有这么干的。这种情况 coarse_y 直接归 0,不切换 NameTable

cycle 257

这个周期将 t 的 X 坐标值复制到 v 中,为什么呢?可以这样理解,现在这一行我们已经处理完了,该准备处理下一行了。cycle 256 已经使得 Y 指向下一行了,这里还需要使得 X 指向”行首“,这里的行首就是向 0x2005 写入的 X 坐标值,表示水平方向从哪开始渲染

cycle 257-320

精灵相关,见后

cycle 321-336

下一行背景需要的 2 个 tile,并且加载到 shift 寄存器。同样的是那 4 个数据:

  • NameTable byte
  • NameTable byte
  • PatternTable tile low
  • PatternTable tile high

同样每个取每个数据 2 周期,4 个数据 8 周期,总共 16 个周期,取两轮与 2 个 tile 吻合。

cycle 337-340

这 4 个周期取两个数据:

  • NameTable byte
  • NameTable byte

用处不明,mapper MMC5 会用到,但基本上这个没什么用。

Post-render(240)

scanline 240 为 post-scanline,不干什么事,空闲

V_Blank(241-260)

scanline 241-260 这 20 条 scanline 为 V_Blank 时间,这段时间的第一个(从0计数)周期设置产生 NMI 中断。这段时间内 PPU 不会访存,所以程序可以安全地访问 VRAM,这段时间也就是 CPU 来处理 NMI 中断的。前文曾提过,NMI 期间就可以重新填充 NameTable 来加载新的场景,设置 0x2005 scroll 寄存器来控制滚屏等等

pre-render(-1or261)

scanline -1 或者 261 用作预渲染,一般模拟的时候当作 -1 来模拟较为方便。它的主要作用是为下一行做准备,这一行是不会渲染输出的,只是访存取数据。从图上可以看出与其他可见行没多少不同,直接来看不同的周期:

cycle 1

这个周期清除一些标志位:V_Blank,sprite 0 还有 sprite overflow,

cycle 280-304

每个周期将 t 的 Y 坐标值复制到 v

visible and pre scanline

这里对应着那张图的最后一行,描述可见的 240 条 scanline 和 预渲染的 1 条 scanline

cycle 1

同样的空闲

cycle 1-64

清空 Secondary OAM,指的是将 Secondary OAM 初始化为 0xFF

cycle 65-256

为下一行的精灵做评估,就是说计算下一行将会有哪些精灵需要渲染。

奇数 cycle 从 Primary OAM 读取数据,偶数 cycle 向 Secondary OAM 写数据

下面来看具体怎么评估,伪代码如下:

struct SPRITE_ENTRY{
    unsigned char y;          //y坐标
    unsigned char id;         //使用的tile索引
    unsigned char attribute;  //该精灵的属性
    unsigned char x;          //x坐标
}

struct SPRITE_ENRY POAM[64];  //Primary OAM 64个精灵,每个精灵4个属性byte
struct SPRITE_ENTRY SOAM[8];  //Second OAM

int sprite_cnt = 0;   //目前已经评估了下一行有多少个精灵
int OAM_entry = 0;    //评估第几个精灵

// int scanline;   //当前正渲染第几条 scanline
// unsigned char control;  //control 寄存器里面的值

while(OAM_entry < 64){
    int diff = scanline - POAM[OAM_entry].y;
    int sprite_high = control.sprite_size ? 16 : 8;   //获取精灵的高度,是8*8的还是8*16的
    if(diff >= 0 && diff < sprite_high){   //如果该精灵在下一行上
        if(sprite_cnt < 8){     //如果精灵计数小于8,加进SOAM
            memcpy(&SOAM[sprite_cnt], 
                   &POAM[OAM_entry], 
                   sizeof(struct SPRITE_ENTRY));
        }
        sprite_cnt++;
    }
    OAM_entry++;
}

私以为伪码还是挺清晰的,不太明白的话再来看看示意图:

cycle 257-320

取下一行精灵需要的数据,同样的是那 4 个数据:

  • Garbage NameTable byte
  • Garbage NameTable byte
  • PatternTable tile low
  • PatternTable tile high

同样的每个数据需要花费 2 个周期,这里有朋友可能会发现,Garbage NameTable byte?NameTable 里面存放的是背景 tile 索引,而不是精灵的,精灵使用的 tile 索引存放在 OAM,之所以这里取精灵需要的 tile 也是这么个形式,是为了精灵可以重用背景的电路

这里总共花费 64 个周期,,与每一行支持的精灵数 8 吻合。

屏幕分割

到此每条 scanline 每个周期干啥说完了,下面来说一些高级玩法,就是屏幕分割技术。

split X scroll

split X scroll 需要用到 sprite 0 hit,主要的作用可以用来制作静止的分数,血条等等,举个马里奥的例子:

深色部分是不会像下面浅色部分滚屏的,感觉上面和下面分割开来,且只有水平方向的分割,所以叫做 split X scroll,下面来看看是如何实现的。

I sprite 0 hit

先来了解什么叫做 sprite 0 hit,sprite 0 hit 就是说如果第 0 个精灵的不透明像素与背景不透明像素重合的话,就将 0x2002 PPUSTATUS 状态寄存器的 bit6 置 1,表示触发了 sprite 0 hit

这有什么作用?它是 PPU 与 CPU 同步的一种手段,当 V_Blank 触发 NMI 时,CPU 只是知道当前帧渲染完了,准备下一帧,这个时间同步不精细。于是创造一个 sprite 0 hit,编程人员将 sprite 0 放在一个特定位置,当触发 sprite 0 hit 时,CPU 就知道,哦,原来渲染到这条 scanline 了

我们就可以利用这个特性来实现 split X scroll,我们就以超级马里奥为例子,来看 split X scroll 如何实现的。

II Implement

首先看超级马里奥的 sprite 0 在哪儿:

这是游戏刚开始的“两个”精灵,其中上面那个就是 sprite 0,具体在哪儿?

具体的,就是在金币的下方,金币是背景,且不是使用的通用背景色,sprite 0 也不是透明色,所以每一帧渲染到这一行的 sprite 0 所在的位置时就会触发 sprite 0 hit。

之后就在 NMI 的中断处理程序中做文章:

NMI:
    LDA #$00
    STA $2006        ; 清理VRAM addr,也就是 t v 清0
    STA $2006

    LDA #$00         ; 设置滚屏地址为0,也就是先让分数条等不滚动
    STA $2005
    STA $2005

    LDA #%10010000   ; 使能NMI和选取NameTable
    STA $2000

这部分主要就是先清空寄存器 v 中存放的 VRAM 地址,然后设置滚屏地址为 0,即不滚屏。

WaitNotSprite0:
    lda $2002
    and #%01000000
    bne WaitNotSprite0   ; 等待sprite0 标志位清0

上述我们已经知道预渲染期间是会清零标志位的,其中就包括 sprite0。

WaitSprite0:
  lda $2002
  and #%01000000
  beq WaitSprite0      ; wait until sprite 0 is hit

然后这里就等待 sprite 0 hit

  ldx #$10
WaitScanline:
  dex              ; 递减
  bne WaitScanline ; 等待sprite0这一行渲染完成

  LDA scroll       ; 设置水平滚屏地址
  STA $2005        
  LDA #$00         ; 纵向不滚屏
  STA $2005

触发 sprite 0 hit 之后,我们要先等待 sprite 0 所在的这一行渲染完成,经验值大概 16 次运算(上述递减)就差不多了。

之后将新的滚屏地址写进 0x2005 即寄存器 t 里面去,这就完成了 split X scroll。

可能有朋友疑惑为什么能行,这里就联系上面讲述的内容,每条 scanline 的 257 cycle,会重新将 t 中的 X 坐标复制到 v 中,所以实现了在渲染中途改变滚屏地址,实现 split X scroll。

这里再总结一下如何实现 split X scroll:

  1. 设置滚屏地址为 0,主要是为了状态条不滚动
  2. 等待清除 sprite 0 标志位
  3. 等待触发 sprite 0 hit
  4. 延迟一会儿,等待 sprite 0 所在行渲染完成
  5. 重新设置滚屏地址

这里可能有朋友疑惑,为什么要先等待 sprite 0 not hit 然后再等待 sprite 0 it,这里我们假设没有等待 sprite 0 not hit,那么 V_Blank 期间会一直检测到 sprite 0 hit,但实际上这只是当前帧的 sprite 0 hit,下一帧的 sprite 0 hit 还没到,所以需要等待 sprite 0 not hit

split X/Y scroll

sprite X scroll 总的来说还是简单,设置滚屏地址只需要写 0x2005 就行了,但是如果想要在纵向也滚屏,那么只写 0x2005 就行不通了。因为每一行的 257 只会将 t 的 X 坐标值复制到 v,不会复制 Y 坐标值,预渲染会复制 Y 坐标值,但是每一帧只有一条预渲染 scanline,这时复制 Y 坐标值并不能实现渲染中途更改 Y 坐标值

所以得另想它法,在前文滚屏渲染基础部分我们说过连续两次向 0x2006 写入数据后,t 中全部数据都会复制一份到 v。因此我们利用 0x2005 和 0x2006 来实现 split X/Y scroll

这里又因为 0x2005 和 0x2006 共享 w 和 t,且两者写入数据方式不太一样,具体的话我再放一遍图片,详细情况可以看前文:

正因为两者写入数据的差异,所以有如下所示的写入顺序和方式:

  1. NameTable number << 2 to 0x2006
  2. scroll Y to 0x2005
  3. scroll X to 0x2005
  4. ((Y & 0xF8) << 2) | X >> 3

当然也可以不这样,wiki 上还列出的有另外的方式,但是这种比较简单,有兴趣的话可以模拟走一遍,如此的确是能将 X/Y 写进 t 然后复制到 v 的,这里直接看 wiki 上给出的一个例子理解一下这个过程:

这种方式会立即设置 v,加之前面我们知道每一行有的周期会增加 X 有的周期会增加 Y,所以写入时间很重要。通常最后一个写入要在 H_Blank,前面我们多次提到垂直消隐 V_Blank,其实也还有个水平消隐 H_Blank,它发生在一条 scanline 末尾,通常将 cycle 257-320 视作 H_Blank

cycle 256 会增加 Y 的值,所以如果在 256 之前写入,那么实际写入 0x2006 的值应为 Y-1,具体有没有一个什么参照使得写入时间确定呢?应该是没得的,我目前没发现相关资料,看到的代码都是经验值,可以使用 sprite 0 hit 来大致确认,但精确参照应该是没得的,这里有份大佬的代码,有兴趣的可以看一眼:


    ;Write nametable bits to t.
    lda splitNT
    asl    
    asl
    sta PPUADDR

    ;Write y bits to t.
    lda splitY
    sta PPUSCROLL

    ;The last write needs to occur during horizontal blanking
    ;to avoid visual glitches.
    ;HBlank is very short, so calculate the value to write now, before HBlank.

    and #$F8
    asl
    asl
    sta tmp

    lda splitX
    ;Write the X bits to t and x.
    sta PPUSCROLL       

    ;Finish calculating the fourth write.
    lsr
    lsr
    lsr
    ora tmp

    ;Wait for HBlank.
    ldx #06     ;How long to wait. Play around with this value 
                ;until you don't have a visual glitch.
loop:
    dex
    bne loop

    ;Write to t and copy t to v.
    sta PPUADDR

这份代码的意思就是上述所说的 4 次写入,只是增加了个等待 H_Blank,就不具体解释了。

好了本文就讲述这些,主要继续滚屏渲染的话题,有什么还请批评指正。

本文由哈喽比特于2年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/NDPu0fS1XyUbwmu44zUiUg

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »
 相关文章
Android插件化方案 5年以前  |  237228次阅读
vscode超好用的代码书签插件Bookmarks 2年以前  |  8063次阅读
 目录