Files
2025-07-31 17:53:14 +08:00

222 lines
7.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
front: https://nie.res.netease.com/r/pic/20210728/5a263f49-e1f3-4a9a-96b3-307b11848590.png
hard: 进阶
time: 30分钟
---
# Shader优化
## 前言
为了做出更加炫酷的效果我们往往会自定义材质然后定义自己的Shader或者直接重写替换原版Shader特别是目前的很多光影MOD基本都需要对Shader进行修改。Shader与GPU性能密切相关Shader写得好能让配置不是很高的玩家也能流畅体验炫酷的效果。写得不好则可能导致高端机也很卡。
## 尽量少用 if else 条件语句
GPU是并行处理逻辑的采用SIMD单指令多数据结构, 同一段代码同一时刻会被多个GPU的处理单元同时处理这段代码的执行耗时取决于会被执行到的时间最长的代码。为了充分发挥GPU的并行性我们尽量少用条件分支逻辑让所有GPU处理单元都执行相同的代码。
if else的写法如果底下逻辑不多大部分可以合并则常常可以改用step()函数进行优化
step(a,b)的功能为:
```glsl
b >= a则返回1,否则返回0
```
所以如果有这么一个写法:
```glsl
if(r >= 0.5)
{
r = 0.6;
}else{
r = 0.4;
}
```
则应该写成:
```glsl
r = 0.4 + step(0.5, r) * (0.6 - 0.4);
```
逻辑上相当于若r >= 0.5 ,则:
```glsl
r = 0.4 + 1 * 0.2 = 0.6;
```
否则r < 0.5则:
```glsl
r = 0.4 + 0 * 0.2 = 0.4;
```
由此即可消去if else语句
- 错误写法:
(if else大量使用)
```python
// 简单的卡通着色例子把连续的颜色值映射到几个特殊的离散的值上面
//根据传入的颜色值取得一个新的颜色值, 这里为了展示简单我们用仅用一个通道进行举例
void main()
{
color.r = getNewRedColor(color.r);
...(省略无关代码)
}
float getNewRedColor(float r)
{
float newR;
if(r >= 0.6)
{
newR = 0.8;
}else if(r >= 0.3)
{
newR = 0.5;
}else{
newR = 0.1;
}
return newR;
}
```
- 正确写法:
(分开每帧只处理5个)
```python
// 简单的卡通着色例子把连续的颜色值映射到几个特殊的离散的值上面
//根据传入的颜色值取得一个新的颜色值, 这里为了展示简单我们用仅用一个通道进行举例
void main()
{
color.r = getNewRedColor(color.r);
...(省略无关代码)
}
float getNewRedColor(float r)
{
float newR = 0.0;
newR = newR + step(0.6, r) * 0.8;
newR = newR + step(0.3, r) * step(r, 0.6) * 0.5;
newR = newR + step(r, 0.3) * 0.1;
return newR;
}
```
## 循环语句
for, while这类的循环语句内部实现其实也会有条件判断if else语句并行性比较低所以如果可以不用尽量不用但这并不是让大家去复制粘贴多少次代码这没有意义则是尽量从逻辑上避免循环逻辑的出现如果实在需要使用则建议循环体内不要做太多耗性能的操作
除此之外循环变量一定要记得初始化变量的初始值在不同设备上有时候是不一样的, 比如int的初始值并不一定在所有设备上都是0
- 错误写法:
(循环变量i没有初始化)
```python
for(int i; i < 5; i ++)
{
func();
}
```
在一些设备上i的值会被初始化为0循环5次没有问题但在一些设备上i的默认值可能是一个没有意义的数甚至是负数例如是2147483648上面循环则会循环超级多次玩家会直接卡到动不了
- 正确写法:
(分开每帧只处理5个)
```python
//这里i一定要给一个默认值
for(int i = 0; i < 5; i ++)
{
func();
}
```
## 精美贴图开关
开关在游戏中的位置设置->视频->精美贴图
开发者可根据玩家是否开启精美贴图执行不一样的shader逻辑。这里需要声明两个文件materials/sad.json 和 materials/fancy.json。我们先看下原版中两个文件的内容
```python
sad.json:
[
{"path":"materials/sad.material"},
{"path":"materials/entity.material"},
{"path":"materials/terrain.material"},
{"path":"materials/portal.material"},
{"path":"materials/barrier.material"},
{"path":"materials/wireframe.material"}
]
fancy.json:
[
{"path":"materials/fancy.material", "+defines":["FANCY"]},
{"path":"materials/entity.material", "+defines":["FANCY"]},
{"path":"materials/terrain.material", "+defines":["FANCY"]},
{"path":"materials/hologram.material"},
{"path":"materials/portal.material", "+defines":["FANCY"]},
{"path":"materials/barrier.material"},
{"path":"materials/wireframe.material"}
]
```
开启精美贴图的时候会加载下面的材质不开启的话加载上面的材质。我们用一个材质进行举例比如sad和fancy中都有的terrain.material材质fancy中不同在于额外定义了FANCY字段则在Shader中可以这样写
```python
void main()
{
#ifdef FANCY
//这里可以做更多的逻辑渲染更好的效果
renderBeautiful();
#else
// 这里是关闭了精美贴图这里不应该执行过多逻辑只需要提供简单的显示效果就可以了
renderSimple();
#endif
}
```
## 降低精度
通常来说我们写的shader不需要过于关注精度因为大部分情况下性能瓶颈不在这里但一些过于复杂大部分玩家都说卡的MOD建议可以考虑在精度方面做一些优化。
shader中变量精度越低GPU运算越快精度分为3档关键字分别为
```glsl
低:lowp
中:mediump
高:highp
```
int整数建议256内的整数使用lowp, 1024内的整数使用mediump其它情况则使用highp
float(浮点)建议256内的浮点数使用lowp, 16384内的浮点数使用mediump其它情况则使用highp
默认精度:
```glsl
顶点着色器中float, int均为highp
像素着色器中int为mediumpfloat根据设备不同无默认精度
```
声明方法例子(直接把精度关键字加在变量类型前面)
```glsl
lowp float color
```
## 移除无用变量与逻辑
部分开发者编写Shader的时候可能会偷下懒从自己以前写的代码里面复制粘贴过来但这部分代码可能有很多逻辑或者变量都没有用上导致大量的运算是无意义浪费性能的需要去掉。
- 错误写法:
(包含大量无用逻辑)
```python
void main()
{
//这里声明多个变量又或许是从其它地方复制过来具体值先省略
A = ...;
B = ...;
C = ...;
//这里只用了变量AB和C都没有用到
DoSomeThingWithA(A);
return;
}
```
- 正确写法:
(删除无用逻辑)
```python
void main()
{
//只留下A把其它没用上的都删除掉
A = ...;
//这里只用了变量AB和C都没有用到
DoSomeThingWithA(A);
return;
}
```
## 分级做多个MOD版本
开发者可根据Shader复杂度上架不同版本举个例子例如可以有“网易光影低配版” “网易光影高配版”,玩家看名字就大概知道对性能有不同的要求了,让玩家下载时自行选择。