gxvtx_lxrej.s
21.7 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
/*---------------------------------------------------------------------*
Copyright (C) 1998, Nintendo.
File gxvtx_lxrej.s
Coded by Yoshitaka Yasumoto. Feb 25, 1998.
$Id: gxvtx_lxrej.s,v 1.1.1.1 2002/05/02 03:29:11 blythe Exp $
*---------------------------------------------------------------------*/
#!Reserved (0,11,12,22,23,24,25,26,27,31)
#!Reserved (v0,v1,v29,v30,v31)
#define NO_CLAMP_Z /* No Clamp */
#---------------------------------------------------------------------
# caseLXRej_G_VTX
# 頂点データをロードして, 座標変換を行なう.
# Fast3D/F3DEX とは異なり, 頂点キャッシュ領域へ直接 DMA 転送
# を行ない, その後変換する. Vtx 構造体データは 16 Bytes/Vtx
# で頂点キャッシュは 40 Bytes/Vtx なので, 処理対象の頂点キャ
# ッシュ領域の最終位置へ DMA 転送し, 変換処理を行なう.
#
# Level 2 から GBI が変更になったので注意すること.
# +------------+------+-----+-----+------+------------+
# | G_VTX | 0000 | n | 0000 | (v0+n)*2:8 |
# +-----+------+------+-----+-----+------+------------+
# | | Seg | Address |
# +-----+------+------------+------------+------------+
#
# この仕様から gfx0 の b31-24 と b7-0 は 0x00 ではない
# ことが確定しているので, これを利用して LIGHT/MULMP フラグ
# の書き換えを行なう.
#---------------------------------------------------------------------
caseLXRej_G_VTX:
#-------------------------------------------------------------
# DMA 転送開始
#-------------------------------------------------------------
AssignForDMAproc
FixedAssign(num, 1)
lhu dmem_adrs, RSP_SUBMOD_POINTS(gfx0)
jal AdrsFixup # dram_adrs の設定
lhu num, RSP_DLINPUT_BOTTOM-7(dinp)
andi dmem_adrs, dmem_adrs, 0xff8 # 8 バイト境界へ
sub dmem_adrs, dmem_adrs, num
jal DMAread # dmem_adrs は必ず正なので READ 動作
addi dma_len, num, -1
#-------------------------------------------------------------
# DMA 転送待ちを利用してパラメータを取得する
# gmode_h: Geometry Mode フラグの上位 16 bit
# num: 処理頂点数x2
# dest: 変換値の出力ポインタ
# src: Vtx 構造体へのデータポインタ
#-------------------------------------------------------------
FixedAssign(src, 14) /* gxlight_lxrej.s と共用 */
FixedAssign(dest, 15)
FixedAssign(lstat, 13) /* gxlight_lxrej.s と共用 */
FixedAssign(gmode_h, 5) /* gxlight_lxrej.s と共用 */
FixedAssign(lighton, 6) /* gxlight_lxrej.s と共用 */
lhu gmode_h, RSP_LSTAT_RENDER(zero)
srl num, num, 3 # num=n*2 を代入
sub dest, gfx0, num # v0*2 の計算
lhu dest, RSP_SUBMOD_POINTS(dest)
_mov (src, dmem_adrs)
EndAssignForDMAproc
#-------------------------------------------------------------
# Geometry Mode を調べ, Light が ON ならライトの処理ルーチン
# へ Jump する. このとき Light モジュールを Overlay する可能
# 性がある.
# ライトの変換処理ルーチンで v8-v18,19-20,gfx1,
# sys0,sys1,return が破壊される.
# DMA 転送待ちを利用してパラメータを取得する
# mulmpcalc: MPMTX 計算が必要かのフラグ
# lstat: LSTAT 領域の先頭ポインタ(XfmLight でも設定)
# fogon: Fog 処理をするかどうか (0 or 8)
# XfmLight において lighton にライトデータの最終位置が代入
# される. (RSP_LSTAT_LIGHT_NUM + RSP_SAVE_L0OKATX)
#-------------------------------------------------------------
FixedAssign(fogon, 7)
FixedAssign(mulmpcalc, 8)
lbu mulmpcalc, RSP_LSTAT_MULMP_FLAG(zero)
andi lighton, gmode_h, G_LIGHTING_H
bne lighton, zero, caseLXRej_XfmLight
andi fogon, gmode_h, G_FOG_H /* Delay */
#-------------------------------------------------------------
# MMtx と PMtx を掛け合わせる必要があるかを判定し,
# 不要なら SKIP する.
# フラグに 0 以外の値を代入し処理済みにする.
# gfx0 の最下位バイトは 0 でないのでこれで OK
#-------------------------------------------------------------
caseLXRej_G_VTX_MulMP:
bne mulmpcalc, zero, caseLXRej_G_VTX_GetMtx
sll fogon, fogon, 3 /* 8 倍する */
sb gfx0, RSP_LSTAT_MULMP_FLAG(zero) # フラグを非 0 にする
EndAssign(mulmpcalc, 8)
#-------------------------------------------------------------
# MMtx と PMtx との乗算処理を行ない, MPMtx を計算する.
# sys0,sys1,$20 が破壊される
#-------------------------------------------------------------
FixedAssign(mpmtx, 19)
FixedAssign(mmtx, 20)
FixedAssign(pmtx, 21)
_li (pmtx, RSP_GSTAT_PMTX)
_li (mmtx, RSP_GSTAT_MMTX)
jal math_MatCat
_li (mpmtx, RSP_GSTAT_MPMTX)
EndAssign(mpmtx, 19)
EndAssign(mmtx, 20)
EndAssign(pmtx, 21)
#-------------------------------------------------------------
# MPMtx を取得する.
# ViewPort の設定値の取得
# FogFactor の値の取得 (vpscale[3|7],vptrans[3|7] へ代入)
# PerpsNorm の値の取得 (txscale[4] へ代入)
# ClipBox の値の取得 (txscale[5] へ代入)
# Fog 計算用パラメータ vpfog の取得
# [3|7] のみ 0x0001 となっている. その他は 0x0000
# Clipボックスの係数/Texture のスケール値の取得 [2|3|6|7] へ
#-------------------------------------------------------------
caseLXRej_G_VTX_GetMtx:
FixedAssign(mtx0, v8)
FixedAssign(mtx1, v9)
FixedAssign(mtx2, v10)
FixedAssign(mtx3, v11)
FixedAssign(mtf0, v12)
FixedAssign(mtf1, v13)
FixedAssign(mtf2, v14)
FixedAssign(mtf3, v15)
FixedAssign(vpscale, v16)
FixedAssign(vptrans, v17)
FixedAssign(txscale, v18)
FixedAssign(vpfog, v19)
Assign(vpscaleR, v2)
Assign(vptransY,v20)
FixedAssign(dest2, 8)
FixedAssign(dest2x, 10)
#define pNorm txscale[4]
#define clipBox txscale[5]
_li (lstat, RSP_LSTAT_OFFSET)
ldv vpscale[0], RSP_GSTAT_VIEWPORT_SC(zero)
ldv vpscale[8], RSP_GSTAT_VIEWPORT_SC(zero)
llv vtmp[0], oRSP_LSTAT_FOG_FACTOR(lstat)
#ifdef NOSUBPIX
vadd vptransY, vone, _0x0001 ldv vptrans[0], RSP_GSTAT_VIEWPORT_TX(zero)
/* Resv */ ldv vptrans[8], RSP_GSTAT_VIEWPORT_TX(zero)
vlt vpfog, vconst0, _0x7f00 /* Resv */
vsub vpscaleR, vzero, vpscale llv txscale[4], oRSP_LSTAT_TEX_SCALE(lstat)
vmrg vpscale, vpscale, vtmp[0] llv txscale[12], oRSP_LSTAT_TEX_SCALE(lstat)
vmrg vpfog, vzero, _0x0001 llv txscale[8], RSP_GSTAT_VPERSPNORM(zero) # lsv では不届
vadd vptransY, vptrans, vptransY lsv txscale[10], oRSP_LSTAT_CLIPSELECT+6(lstat)
vmrg vptrans, vptrans, vtmp[1] addi dest2, outp, 80
vmov vpscale[1], vpscaleR[1] lqv mtx0[0], RSP_GSTAT_MPMTX+ 0(zero)
vmov vpscale[5], vpscaleR[1] lqv mtx2[0], RSP_GSTAT_MPMTX+16(zero)
vmov vptrans[1], vptransY[1] lqv mtf0[0], RSP_GSTAT_MPMTX+32(zero)
vmov vptrans[5], vptransY[1] lqv mtf2[0], RSP_GSTAT_MPMTX+48(zero)
#else
ldv vptrans[0], RSP_GSTAT_VIEWPORT_TX(zero)
/* Resv */ ldv vptrans[8], RSP_GSTAT_VIEWPORT_TX(zero)
vlt vpfog, vconst0, _0x7f00 /* Resv */
vsub vpscaleR, vzero, vpscale llv txscale[4], oRSP_LSTAT_TEX_SCALE(lstat)
vmrg vpscale, vpscale, vtmp[0] llv txscale[12], oRSP_LSTAT_TEX_SCALE(lstat)
vmrg vpfog, vzero, _0x0001 llv txscale[8], RSP_GSTAT_VPERSPNORM(zero) # lsv では不届
lsv txscale[10], oRSP_LSTAT_CLIPSELECT+6(lstat)
vmrg vptrans, vptrans, vtmp[1] addi dest2, outp, 80
vmov vpscale[1], vpscaleR[1] lqv mtx0[0], RSP_GSTAT_MPMTX+ 0(zero)
vmov vpscale[5], vpscaleR[1] lqv mtx2[0], RSP_GSTAT_MPMTX+16(zero)
lqv mtf0[0], RSP_GSTAT_MPMTX+32(zero)
lqv mtf2[0], RSP_GSTAT_MPMTX+48(zero)
#endif
vadd mtx1, mtx0, _0x0000 ldv mtx1[0], RSP_GSTAT_MPMTX+ 8(zero)
vadd mtx3, mtx2, _0x0000 ldv mtx3[0], RSP_GSTAT_MPMTX+24(zero)
vadd mtf1, mtf0, _0x0000 ldv mtf1[0], RSP_GSTAT_MPMTX+40(zero)
vadd mtf3, mtf2, _0x0000 ldv mtf3[0], RSP_GSTAT_MPMTX+56(zero)
ldv mtx0[8], RSP_GSTAT_MPMTX+ 0(zero)
ldv mtx2[8], RSP_GSTAT_MPMTX+16(zero)
ldv mtf0[8], RSP_GSTAT_MPMTX+32(zero)
jal DMAwait
ldv mtf2[8], RSP_GSTAT_MPMTX+48(zero)
EndAssign(vpscaleR, v2)
EndAssign(vptransY,v20)
#-------------------------------------------------------------
# 頂点データ (x,y,z) を vin12 へ代入する.
#-------------------------------------------------------------
FixedAssign(vin12i, v20)
ldv vin12i[0], 0(src)
ldv vin12i[8], 16(src)
addi dest2x, dest2, 4
#-------------------------------------------------------------
# 頂点変換ループ開始
#-------------------------------------------------------------
caseLXRej_G_VTX_Loop:
FixedAssign(lptr, 9)
FixedAssign(ldir1, v2)
FixedAssign(normX, v7)
FixedAssign(st12, v22) /* gxlight_ex.s と共用 */
FixedAssign(vout12f, v23)
FixedAssign(vout12i, v24)
FixedAssign(vscn12i, v25) /* gxlight_ex.s と共用 */
FixedAssign(vscn12f, v26)
FixedAssign(vfog12, v27) /* gxlight_ex.s と共用 */
#-------------------------------------------------------------
# MP 行列を頂点座標に乗ずる
# スケーリング前のテクスチャ座標値をロードする
# 必要ならライト処理を行なう
#-------------------------------------------------------------
vmudn vtmp, mtf3, _0x0001 lw sys0, 28(src) # Clr2 のコピー
vmadh vtmp, mtx3, _0x0001 llv st12[12], 8(src)
vmadn vtmp, mtf0, vin12i[0h] _mov (lptr, lighton)
#ifdef ALPHA_LIGHTING
vmadh vtmp, mtx0, vin12i[0h] lqv ldir1[0], 32(lptr)
#else
vmadh vtmp, mtx0, vin12i[0h] lpv ldir1[0], oRSP_LSTAT_LIGHT_DIR_M+0(lptr)
#endif
vmadn vtmp, mtf1, vin12i[1h] sw sys0, 8(src)
vmadh vtmp, mtx1, vin12i[1h] lpv normX[0], 8(src)
vmadn vout12f, mtf2, vin12i[2h] bne lighton, zero, caseLXRej_Lighting
vmadh vout12i, mtx2, vin12i[2h] /* Delay */
#-------------------------------------------------------------
# 前ループの FOG フォグ値のクランプ
#-------------------------------------------------------------
vge vfog12, vscn12i, _0x7f00 llv st12[4], 24(src)
EndAssign(lptr, 9)
EndAssign(ldir1, v2)
EndAssign(normX, v7)
#ifdef NOSUBPIX /* LXRej */
#-------------------------------------------------------------
# 前ループの Y 座標のサブピクセルのマスク
#-------------------------------------------------------------
caseLXRej_G_VTX_Return:
Assign(yscn12i, v2)
vand yscn12i, vscn12i, _0xfffc /*S*/
#-------------------------------------------------------------
# w に PerspNorm(=n) の値を乗する.
# これにより 1/w の値を求めるときの
# Overflow を防止する.
# 前ループのスクリーン座標値の出力
#-------------------------------------------------------------
Assign(cflag, 2)
Assign(W12f, v3)
Assign(W12i, v4)
vmudl vtmp, vout12f, pNorm addi num, num, -2*2 # num 値を減算する
#ifndef NO_CLAMP_Z
vmadm W12i, vout12i, pNorm ssv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1(dest2) /*Xs2*/
vmadn W12f, vzero, _0x0000 ssv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest2) /*Xs1*/
#else
vmadm W12i, vout12i, pNorm sdv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1-4(dest2x) /*XZs2*/
vmadn W12f, vzero, _0x0000 sdv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest2) /*XZs1*/
#endif
#----------------------------------------------
# クリップ用パラメータ作成
#----------------------------------------------
Assign(vclip12f, v5)
Assign(vclip12i, v6)
vmudn vclip12f, vout12f, clipBox ssv vscn12f[12],oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
vmadh vclip12i, vout12i, clipBox ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest2) /*Zsf1*/
#----------------------------------------------
# 1/nw の値を Newton 法で求める (1)
# vrcph/l で求めるのは 1/2X の値
# (R=1/X)
# 1/X = R*(2-R*X) = R/2*(4+R/2*X*(-4))
#----------------------------------------------
Assign(invW12f, v7)
Assign(invW12i, v21)
/*Resv*/ sub sys0, dest2, fogon # Fog=OFF なら Ys の位置に書き込む.
caseLXRej_G_VTX_Return1:
vrcph vtmp[0], W12i[3] /*Resv*/
vrcpl invW12f[3], W12f[3] /*Resv*/
caseLXRej_G_VTX_Return2: sbv vfog12[15], oRSP_POINT_A-RSP_POINT_LEN*1+8(sys0) /*FOG2*/
#----------------------------------------------
# Z 値を 0 以上でクランプする
#----------------------------------------------
#ifndef NO_CLAMP_Z
Assign(zscn12i, v28)
vge zscn12i, vscn12i, _0x0000 /*S*/
#endif
vrcph invW12i[3], W12i[7] sbv vfog12[7], oRSP_POINT_A-RSP_POINT_LEN*2+8(sys0) /*FOG1*/
vrcpl invW12f[7], W12f[7] ssv yscn12i[10], oRSP_POINT_YS-RSP_POINT_LEN*1(dest2) /*Ys2*/
vrcph invW12i[7], _0x0000 ssv yscn12i[2], oRSP_POINT_YS-RSP_POINT_LEN*2(dest2) /*Ys1*/
EndAssign(yscn12i, v2)
EndAssign(vfog12, v27)
#else /* EXRej */
caseLXRej_G_VTX_Return:
#-------------------------------------------------------------
# w に PerspNorm(=n) の値を乗する.
# これにより 1/w の値を求めるときの
# Overflow を防止する.
# 前ループのスクリーン座標値の出力
#-------------------------------------------------------------
Assign(cflag, 2)
Assign(W12f, v3)
Assign(W12i, v4)
vmudl vtmp, vout12f, pNorm /*S*/
vmadm W12i, vout12i, pNorm /*S*/
vmadn W12f, vzero, _0x0000 addi num, num, -2*2 # num 値を減算する
#----------------------------------------------
# クリップ用パラメータ作成
#----------------------------------------------
Assign(vclip12f, v5)
Assign(vclip12i, v6)
vmudn vclip12f, vout12f, clipBox sub sys0, dest2, fogon # Fog=OFF なら Ys の位置に書き込む.
vmadh vclip12i, vout12i, clipBox sbv vfog12[15], oRSP_POINT_A-RSP_POINT_LEN*1+8(sys0) /*FOG2*/
#----------------------------------------------
# Z 値を 0 以上でクランプする
#----------------------------------------------
#ifndef NO_CLAMP_Z
Assign(zscn12i, v28)
vge zscn12i, vscn12i, _0x0000 /*S*/
#endif
#----------------------------------------------
# 1/nw の値を Newton 法で求める (1)
# vrcph/l で求めるのは 1/2X の値
# (R=1/X)
# 1/X = R*(2-R*X) = R/2*(4+R/2*X*(-4))
#----------------------------------------------
Assign(invW12f, v7)
Assign(invW12i, v21)
vrcph vtmp[0], W12i[3] sbv vfog12[7], oRSP_POINT_A-RSP_POINT_LEN*2+8(sys0) /*FOG1*/
#ifndef NO_CLAMP_Z
vrcpl invW12f[3], W12f[3] slv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1(dest2) /*XYs2*/
vrcph invW12i[3], W12i[7] slv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest2) /*XYs1*/
#else
vrcpl invW12f[3], W12f[3] sdv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1-4(dest2x) /*XYZs2*/
vrcph invW12i[3], W12i[7] sdv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest2) /*XYZs1*/
#endif
vrcpl invW12f[7], W12f[7] ssv vscn12f[12],oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
vrcph invW12i[7], _0x0000 ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest2) /*Zsf1*/
EndAssign(vfog12, v27)
#endif
#----------------------------------------------
# クリップ判定 (1)
# n*W と X,Y,Z,-X,-Y,-Z を比較
#----------------------------------------------
#ifndef NO_CLAMP_Z
vch vtmp, vout12i, vclip12i[3h] ssv zscn12i[12],oRSP_POINT_ZS-RSP_POINT_LEN*1(dest2) /*Zs2*/
vcl vtmp, vout12f, vclip12f[3h] ssv zscn12i[4], oRSP_POINT_ZS-RSP_POINT_LEN*2(dest2) /*Zs1*/
EndAssign(zscn12i, v28)
#else
vch vtmp, vout12i, vclip12i[3h] /*S*/
vcl vtmp, vout12f, vclip12f[3h] /*S*/
#endif
EndAssign(vclip12f, v5)
EndAssign(vclip12i, v6)
#----------------------------------------------
# 1/nw の値を Newton 法で求める (2)
#----------------------------------------------
Assign(vcolor, v2)
vmudl vtmp, W12f, invW12f ldv vcolor[0], 8(src) # カラー値の取得
vmadm vtmp, W12i, invW12f /*-*/ cfc2 cflag, $vcc # Reject 判定値取得
vmadn W12f, W12f, invW12i sra sys0, num, 31 # dest+=20,dest2=dest とする.
vmadh W12i, W12i, invW12i andi sys0, sys0, RSP_POINT_LEN # もしnum<0 なら出力を重ねる.
#----------------------------------------------
# Z 値の W へのコピー (1)
# $vcc = 01110111 となり [3|7]=0
#----------------------------------------------
vlt vtmp, vconst0, _0x7f00 addi dest, dest, RSP_POINT_LEN*2
#----------------------------------------------
# 1/nw の値を Newton 法で求める (3)
#----------------------------------------------
Assign(vrej12i, v5)
vmudh vtmp, vone, _0x0004 sub dest2, dest, sys0
vmadn W12f, W12f, _0xfffc /*-*/ andi sys0, cflag, 0x0707
vmadh W12i, W12i, _0xfffc /*-*/ andi sys1, cflag, 0x7070
EndAssign(cflag, 2)
#----------------------------------------------
# Z 値の W へのコピー (2)
#----------------------------------------------
vmrg vout12f, vout12f, vout12f[2h] /*-*/ mtc2 sys0, vrej12i[0]
vmrg vout12i, vout12i, vout12i[2h] /*-*/ mtc2 sys1, vrej12i[8]
#----------------------------------------------
# 1/nw の値を Newton 法で求める (4)
#----------------------------------------------
vmudl vtmp, W12f, invW12f /*S*/
vmadm vtmp, W12i, invW12f addi src, src, 32 # src ポインタ加算
vmadn invW12f, W12f, invW12i slv vcolor[0], oRSP_POINT_R-RSP_POINT_LEN*1(dest2) /*Clr2*/
vmadh invW12i, W12i, invW12i slv vcolor[4], oRSP_POINT_R-RSP_POINT_LEN*2(dest) /*Clr1*/
EndAssign(vcolor, v2)
EndAssign(W12f, v3)
EndAssign(W12i, v4)
#----------------------------------------------
# テクスチャ座標値のスケーリング
#----------------------------------------------
vmudm st12, st12, txscale /*S*/
/*V*/ /*S*/
#----------------------------------------------
# 透視変換を行なう (x,y,z を w で割る)
# 1/nW を (x,y,z) に掛ける
#----------------------------------------------
vmudl vtmp, vout12f, invW12f[3h] /*S*/
vmadm vtmp, vout12i, invW12f[3h] /*S*/
vmadn vout12f, vout12f, invW12i[3h] /*S*/
vmadh vout12i, vout12i, invW12i[3h] ssv invW12f[14],oRSP_POINT_INVWF-RSP_POINT_LEN*1(dest2)/*invWf2*/
#----------------------------------------------
# Reject 判定値を計算する
# vrej12i が正なら 0x7fff
#----------------------------------------------
veq vtmp, vzero, vrej12i[0h] ssv invW12f[6], oRSP_POINT_INVWF-RSP_POINT_LEN*2(dest) /*invWf1*/
vmrg vrej12i, vzero, _0x7fff ssv invW12i[14],oRSP_POINT_INVWI-RSP_POINT_LEN*1(dest2)/*invWi2*/
#----------------------------------------------
# PerspNorm を掛け, (x/w,y/w,z/w) を求める
#----------------------------------------------
vmudl vtmp, vout12f, pNorm ssv invW12i[6],oRSP_POINT_INVWI-RSP_POINT_LEN*2(dest)/*invWf1*/
vmadm vout12i, vout12i, pNorm slv st12[4], oRSP_POINT_S-RSP_POINT_LEN*1(dest2) /*ST2*/
vmadn vout12f, vzero, _0x0000 slv st12[12], oRSP_POINT_S-RSP_POINT_LEN*2(dest) /*ST1*/
EndAssign(st12, v22)
EndAssign(invW12f, v7)
EndAssign(invW12i, v21)
#----------------------------------------------
# スクリーン座標系に変換する
# fog 値の計算も同時に行なう.
# このときの fog 計算値は 0x7f00 を
# 加算している.
#----------------------------------------------
vmudh vtmp, vrej12i, _0x7fff ldv vin12i[0], 0(src) # 次の頂点データ1ロード
vmadh vtmp, vptrans, _0x0001 ldv vin12i[8], 16(src) # 次の頂点データ2ロード
vmadh vtmp, vpfog, _0x7f00 addi dest2x, dest2, 4
vmadn vscn12f, vout12f, vpscale bgtz num, caseLXRej_G_VTX_Loop
vmadh vscn12i, vout12i, vpscale /*Delay*/
EndAssign(vrej12i, v5)
#----------------------------------------------
# フォグ値のクランプ
# Y 座標のサブピクセルのマスク
#----------------------------------------------
Assign(vfog12, v2)
Assign(yscn12i, v3)
Assign(zscn12i, v28)
#ifdef NOSUBPIX /* LXRej */
/*V*/ sub sys1, dest2, fogon
/*V*/ sub sys0, dest, fogon
/*V*/ /*S*/
# ifndef NO_CLAMP_Z
vge zscn12i, vscn12i, _0x0000 ssv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1(dest2) /*Xs2*/
vge vfog12, vscn12i, _0x7f00 ssv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest) /*Xs1*/
vand yscn12i, vscn12i, _0xfffc ssv vscn12f[12], oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
/*V*/ ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest) /*Zsf1*/
/*V*/ ssv zscn12i[12], oRSP_POINT_ZS-RSP_POINT_LEN*1(dest2) /*Zs2*/
/*V*/ ssv zscn12i[4], oRSP_POINT_ZS-RSP_POINT_LEN*2(dest) /*Zs1*/
# else
vge vfog12, vscn12i, _0x7f00 sdv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1-4(dest2x)/*XZs2*/
vand yscn12i, vscn12i, _0xfffc sdv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest) /*XZs1*/
/*V*/ ssv vscn12f[12], oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
/*V*/ ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest) /*Zsf1*/
# endif
/*V*/ sbv vfog12[15], oRSP_POINT_A-RSP_POINT_LEN*1+8(sys1) /*FOG2*/
/*V*/ sbv vfog12[7], oRSP_POINT_A-RSP_POINT_LEN*2+8(sys0) /*FOG1*/
/*V*/ ssv yscn12i[10], oRSP_POINT_YS-RSP_POINT_LEN*1(dest2) /*Ys2*/
/*V*/ j GfxDone
/*Delay*/ ssv yscn12i[2], oRSP_POINT_YS-RSP_POINT_LEN*2(dest) /*Ys1*/
#else /* EXRej */
/*V*/ /*S*/
/*V*/ /*S*/
/*V*/ /*S*/
# ifndef NO_CLAMP_Z
vge zscn12i, vscn12i, _0x0000 slv vscn12i[8], oRSP_POINT_XS -RSP_POINT_LEN*1(dest2) /*Xs2*/
vge vfog12, vscn12i, _0x7f00 slv vscn12i[0], oRSP_POINT_XS -RSP_POINT_LEN*2(dest) /*Xs1*/
/*V*/ ssv vscn12f[12], oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
/*V*/ ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest) /*Zsf1*/
/*V*/ ssv zscn12i[12], oRSP_POINT_ZS -RSP_POINT_LEN*1(dest2) /*Zs2*/
/*V*/ beq fogon, zero, GfxDone
/*Delay*/ ssv zscn12i[4], oRSP_POINT_ZS -RSP_POINT_LEN*2(dest) /*Zs1*/
/*V*/ sbv vfog12[15], oRSP_POINT_A -RSP_POINT_LEN*1(dest2) /*FOG2*/
/*V*/ j GfxDone
/*Delay*/ sbv vfog12[7], oRSP_POINT_A -RSP_POINT_LEN*2(dest) /*FOG1*/
# else
vge vfog12, vscn12i, _0x7f00 sdv vscn12i[8], oRSP_POINT_XS-RSP_POINT_LEN*1-4(dest2x)/*XZs2*/
/*V*/ sdv vscn12i[0], oRSP_POINT_XS-RSP_POINT_LEN*2(dest) /*XZs1*/
/*V*/ ssv vscn12f[12], oRSP_POINT_ZSF-RSP_POINT_LEN*1(dest2) /*Zsf2*/
/*V*/ beq fogon, zero, GfxDone
/*Delay*/ ssv vscn12f[4], oRSP_POINT_ZSF-RSP_POINT_LEN*2(dest) /*Zsf1*/
/*V*/ sbv vfog12[15], oRSP_POINT_A-RSP_POINT_LEN*1(dest2) /*FOG2*/
/*V*/ j GfxDone
/*Delay*/ sbv vfog12[7], oRSP_POINT_A-RSP_POINT_LEN*2(dest) /*FOG1*/
# endif
#endif
EndAssign(yscn12i, v3)
EndAssign(zscn12i, v28)
EndAssign(num, 1)
EndAssign(src, 14)
EndAssign(dest, 15)
EndAssign(gmode_h, 5)
EndAssign(lighton, 6)
EndAssign(fogon, 7)
EndAssign(dest2, 8)
EndAssign(dest2x, 10)
EndAssign(lstat, 13)
EndAssign(mtx0, v8)
EndAssign(mtx1, v9)
EndAssign(mtx2, v10)
EndAssign(mtx3, v11)
EndAssign(mtf0, v12)
EndAssign(mtf1, v13)
EndAssign(mtf2, v14)
EndAssign(mtf3, v15)
EndAssign(vpscale, v16)
EndAssign(vptrans, v17)
EndAssign(txscale, v18)
EndAssign(vpfog, v19)
EndAssign(vin12i, v20)
EndAssign(vout12f, v23)
EndAssign(vout12i, v24)
EndAssign(vscn12f, v26)
EndAssign(vscn12i, v25)
EndAssign(vfog12, v2)
/*======== End of gxvtx_lxrej.s ========*/