当前位置:网站首页>用DirectX12绘制一个几何体的程序详述
用DirectX12绘制一个几何体的程序详述
2022-08-03 05:26:00 【quaintSenator】
前言
本文运用D3D游戏开发实战(红龙书)第六章的绘制盒子例程,详细探讨一下这个绘制立方体的程序。理解这个程序后,我们再进一步探讨如何在D3D程序中进行一些功能的修正,从而改出一个基于D3D的渲染程序。
零 BoxApp的调试
按照书本指导新建项目(注意书本中的VS版本把创建的项目称为C++Win32应用,而我的版本已经变成了C++Windows桌面应用而无法查到创建win32项目的选项),这里用的是VS2021,和当初的范例已经有了较大的差异,导致第一个程序就差点微笑中打出gg。
新建项目myd3d,可以看到其中有相当量的初始代码。
可以看这篇文章D3D游戏开发实战,是大佬对红龙书的一个翻+抄,可以找到这个程序的调试过程。
链接DirectX库
如果严格按照书中的步骤,这部分#pragma指令是已经包含在Common/d3dApp.h当中的。所以无需把这段代码敲到任何地方;
添加源代码并构建项目
这部分很容易因为VS的文件操作不当出现错误。如果复制文件到VS左侧的层次资源管理器窗口,其实会传达所传递文件的引用而非文件的复制,也就是说实际上某个源文件想要访问同文件夹下的某个地址的兄弟文件,会发现那个路径下根本没有兄弟。这样就导致了文件之间的互引出现问题;而如果直接在文件资源管理器中进行复制,
这里建议很多时候配环境如果配出问题了可以大胆删掉从头来过,避免一些改动roll back的时候又造成更多问题(第一次配删了六七次)。
可以看到boxApp.cpp当中的include这样写道:
这其实规定了boxApp.cpp和所引用的其他头文件的相对位置。
我简单数了一下,首先复制一份git下来的d3d12book到任意位置,如果创建项目时根目录选择d3d12book,那么最终设置好后BoxApp.cpp的include相对路径正好是上图所示。
所以千万注意,如果以d3d12book文件夹为根目录创建了项目,不要复制任何Common中的头文件或者源文件。源文件已经能够根据相对位置直接访问Common(当然就算复制了仔细想想也不会出什么问题)。需要拷贝的是d3d12book\Chapter 6 Drawing in Direct3D\Box下的shader和BoxApp.h。我们在文件资源管理器下复制粘贴。
调试
复制后VS资源管理器中并没有显示新的文件,我们复制文件资源管理器内的“拷贝位置”的BoxApp.h和Shader。
Shader文件并不需要引入到VS资源管理器,可以直接通过相对路径来访问。
然后用同样的方式来添加Common中的各个头文件与源文件,这里也可以采用书中的办法,使用add items。注意,Common中的文件没有复制到myd3d项目文件当中,而是通过相对路径访问的——因此要把Common位置的文件复制到VS资源控制器内。
对比书中,完成后的VS资源管理器并没有自动生成的myd3d.cpp文件,但是运行时项目将会搜索同名的myd3d.cpp,找不到就会报错。我们姑且保留;同时我的Shader放在d3d12book\myd3d\myd3d位置,和BoxApp.cpp等源文件同级。
这里运行报错“&需求左值”,解决方案
我这里做了两处修改,一处是上面链接对应的文章所述,要把property-C+±语言-符合模式改为否,采取宽松的编译器审查标准,用于适配VS2015;
另一处是Debug设置,戳下图的Debug下箭-配置管理器,把下面的平台改为Win32(我在创建项目的时候死活也没有找到创建Win32项目的选项)
调试结果如下,还是很好看的:
一 BoxApp的规范
1.1 D3DApp类
D3DApp是一个规范了后续的程序如何工作的基类,它有六个基本的虚拟函数,见龙书4.5.3框架方法。 我们要做的就是编写一个派生类继承D3DApp类,override它的框架方法,包括MsgProc,CreateRtvAndDsvDescriptorHeaps,OnResize,Initialize,
D3DApp类有600多行,见龙书4.5.1D3DApp类的介绍。比较底层,完成了包括WinApi、和设备建立连接等工作,我们简单梳理一下它定义了哪些函数,他们分别干什么。
//D3DApp.h
class D3DApp
{
protected:
D3DApp(HINSTANCE hInstance);//用HINSTANCE的构造器
D3DApp(const D3DApp& rhs) = delete;
D3DApp& operator=(const D3DApp& rhs) = delete;//赋值构造器
virtual ~D3DApp();
public:
static D3DApp* GetApp();
//在D3DApp.cpp里维护了一个D3DApp类的指针,叫mApp
//事实上这个全局变量被做成了this。构造器构造D3DApp对象的时候就会mApp=this,而不能构造两次D3DApp对象,否则mApp == nullptr会被assert拦下抛出异常
//GetApp()返回mApp。注意mApp是一个指针
HINSTANCE AppInst()const;
//返回D3DApp对象的HINSTANCE实例。
//由于构造器要用到一个HINSTANCE参数做输入,构造时mhAppInst用于存放这个参数,构造完成后也保存。
HWND MainWnd()const;
//创建窗口CreateWindow的结果存在mhMainWnd局部变量,用于返回mhMainWnd获得窗口
float AspectRatio()const;
//return static_cast<float>(mClientWidth) / mClientHeight;宽高比
//下面的两个函数是4xMsaaState的读写器,
//查到这里的时候我透,我发现原来消息处理机制里面有一个按下F2开启抗锯齿的设计
//4xMsaaState是一个bool量用于表达四倍超采样抗锯齿是否开启,但是这里按了F2发现出错了后面在1.ex当中谈
bool Get4xMsaaState()const;
void Set4xMsaaState(bool value);
int Run();
virtual bool Initialize();
virtual LRESULT MsgProc(HWND hwnd, UINT msg, WPARAM wParam, LPARAM lParam);
protected:
virtual void CreateRtvAndDsvDescriptorHeaps();
virtual void OnResize();
virtual void Update(const GameTimer& gt)=0;
virtual void Draw(const GameTimer& gt)=0;
// Convenience overrides for handling mouse input.
virtual void OnMouseDown(WPARAM btnState, int x, int y){
}
virtual void OnMouseUp(WPARAM btnState, int x, int y) {
}
virtual void OnMouseMove(WPARAM btnState, int x, int y){
}
protected:
bool InitMainWindow();
bool InitDirect3D();
void CreateCommandObjects();
void CreateSwapChain();
void FlushCommandQueue();
ID3D12Resource* CurrentBackBuffer()const;
D3D12_CPU_DESCRIPTOR_HANDLE CurrentBackBufferView()const;
D3D12_CPU_DESCRIPTOR_HANDLE DepthStencilView()const;
void CalculateFrameStats();
void LogAdapters();
void LogAdapterOutputs(IDXGIAdapter* adapter);
void LogOutputDisplayModes(IDXGIOutput* output, DXGI_FORMAT format);
protected:
static D3DApp* mApp;
HINSTANCE mhAppInst = nullptr; // application instance handle
HWND mhMainWnd = nullptr; // main window handle
bool mAppPaused = false; // is the application paused?
bool mMinimized = false; // is the application minimized?
bool mMaximized = false; // is the application maximized?
bool mResizing = false; // are the resize bars being dragged?
bool mFullscreenState = false;// fullscreen enabled
// Set true to use 4X MSAA (?.1.8). The default is false.
bool m4xMsaaState = false; // 4X MSAA enabled
UINT m4xMsaaQuality = 0; // quality level of 4X MSAA
// Used to keep track of the 揹elta-time?and game time (?.4).
GameTimer mTimer;
Microsoft::WRL::ComPtr<IDXGIFactory4> mdxgiFactory;
Microsoft::WRL::ComPtr<IDXGISwapChain> mSwapChain;
Microsoft::WRL::ComPtr<ID3D12Device> md3dDevice;
Microsoft::WRL::ComPtr<ID3D12Fence> mFence;
UINT64 mCurrentFence = 0;
Microsoft::WRL::ComPtr<ID3D12CommandQueue> mCommandQueue;
Microsoft::WRL::ComPtr<ID3D12CommandAllocator> mDirectCmdListAlloc;
Microsoft::WRL::ComPtr<ID3D12GraphicsCommandList> mCommandList;
static const int SwapChainBufferCount = 2;
int mCurrBackBuffer = 0;
Microsoft::WRL::ComPtr<ID3D12Resource> mSwapChainBuffer[SwapChainBufferCount];
Microsoft::WRL::ComPtr<ID3D12Resource> mDepthStencilBuffer;
Microsoft::WRL::ComPtr<ID3D12DescriptorHeap> mRtvHeap;
Microsoft::WRL::ComPtr<ID3D12DescriptorHeap> mDsvHeap;
D3D12_VIEWPORT mScreenViewport;
D3D12_RECT mScissorRect;
UINT mRtvDescriptorSize = 0;
UINT mDsvDescriptorSize = 0;
UINT mCbvSrvUavDescriptorSize = 0;
// Derived class should set these in derived constructor to customize starting values.
std::wstring mMainWndCaption = L"d3d App";
D3D_DRIVER_TYPE md3dDriverType = D3D_DRIVER_TYPE_HARDWARE;
DXGI_FORMAT mBackBufferFormat = DXGI_FORMAT_R8G8B8A8_UNORM;
DXGI_FORMAT mDepthStencilFormat = DXGI_FORMAT_D24_UNORM_S8_UINT;
int mClientWidth = 800;
int mClientHeight = 600;
};
1.ex 一个解决不了的问题
非常奇怪,我查了BoxApp和D3DApp的MsgProc,确信这个程序的键盘消息处理只有这么多:
case WM_KEYUP:
if(wParam == VK_ESCAPE)
{
PostQuitMessage(0);
}
else if((int)wParam == VK_F2)
Set4xMsaaState(!m4xMsaaState);
而且上述的报错的确是在按下F2,抬起键盘导致WM_KEYUP发生的。
报错发生在:
ThrowIfFailed(mdxgiFactory->CreateSwapChain(
mCommandQueue.Get(),
&sd,
mSwapChain.GetAddressOf()));
mSwapChain求地址这一处。
这是因为Set4xMsaaState(!m4xMsaaState)会重新创建交换链:
void D3DApp::Set4xMsaaState(bool value)
{
if(m4xMsaaState != value)
{
m4xMsaaState = value;
// 用新的多采样设定来重建swap chain和buffer
CreateSwapChain();
OnResize();
}
}
MSDN的D3D开发文档对于IDXGIFactory::CreateSwapChain method (dxgi.h)有这样的记述:
[Starting with Direct3D 11.1, we recommend not to use CreateSwapChain anymore to create a swap chain. Instead, use CreateSwapChainForHwnd, CreateSwapChainForCoreWindow, or CreateSwapChainForComposition depending on how you want to create the swap chain.]希望用CreateSwapChainForHwnd等来代替CreateSwapChain。
//新旧函数的对比
HRESULT CreateSwapChainForHwnd(
[in] IUnknown *pDevice,
[in] HWND hWnd,
[in] const DXGI_SWAP_CHAIN_DESC1 *pDesc,
[in, optional] const DXGI_SWAP_CHAIN_FULLSCREEN_DESC *pFullscreenDesc,
[in, optional] IDXGIOutput *pRestrictToOutput,
[out] IDXGISwapChain1 **ppSwapChain
);
HRESULT CreateSwapChain(
[in] IUnknown *pDevice,
[in] DXGI_SWAP_CHAIN_DESC *pDesc,
[out] IDXGISwapChain **ppSwapChain
);
全篇改成CreateSwapChainForHwnd的过程中,由于DXGI_SWAP_CHAIN_DESC1的内容更少,删去了DXGI_SWAP_CHAIN_DESC sd当中的很多信息,包括
//sd.BufferDesc.RefreshRate.Numerator = 60;
//sd.BufferDesc.RefreshRate.Denominator = 1;
//sd.BufferDesc.Format = mBackBufferFormat;
//sd.BufferDesc.ScanlineOrdering = DXGI_MODE_SCANLINE_ORDER_UNSPECIFIED;
//sd.BufferDesc.Scaling = DXGI_MODE_SCALING_UNSPECIFIED;
最后导致程序甚至调不出窗口,CreateSwapChain一直报错。
我回溯到原本的代码,直到最后这个程序依然没有提供F2开启MSAA的Bug的解决方案。
二 D3DApp pipeline工作逻辑|必要的着色阶段
2.0 输入装配器阶段
包括三部分工作:输入顶点、设定图元拓扑和用索引指定图元。
2.1 顶点着色器阶段的必要工作(MVP transform)
世界变换model/world transform
一个美术建模好的物体,其顶点坐标是相对于物体自身的原点的,比如立方体的一个顶点为(0,0,0),剩下的顶点为(0,0,1) (0,1,0)之类。因此为了在屏幕上显示一个物体,首先要把局部坐标计算成世界坐标,这个过程通过给每个顶点右乘一个矩阵W来实现。这个矩阵叫做世界矩阵world matrix。
世界矩阵有两种办法获知:
情况一
我们知道局部原点的世界坐标Q
x轴从局部的(1,0,0)对应成世界坐标的
y轴从局部的(0,1,0)对应成世界坐标的
z轴从局部的(0,0,1)对应成世界坐标的
那么只要把他们都写成齐次坐标,原点是点另外三个是向量,排列就能形成世界矩阵:
注意上面的向量uvw都要单位化(除了原点坐标)
但是有时候求局部原点相对坐标也就算了,求三个轴的相对向量还是挺不直观的,所以也用情况二:
情况二
同上我们知道原点相对坐标Q,这样就能得到平移矩阵T
同时我们更是容易知道物体经过了怎样的缩放。
如果用三个轴的转角来描述旋转(欧拉角描述),有下面的结论但注意这里是右手系的结论,左手系Ry里sin 和 -sin要换一下
那么我们自然能推出局部坐标如何还原到世界坐标的旋转矩阵R(如果对三个轴先后旋转,只需要先后乘上对应的三个矩阵)
TIPS1 旋转矩阵的逆=其转置
TIPS2 欧拉角描述并不能描述所有的旋转过程
最后缩放阵S是更加好算的,那么我们的W=SRT,最终让顶点右乘矩阵W时,相当于先缩放、再旋转、再平移,从而回到世界坐标,并且归还了原点。
世界变换就是这样完成的。
观察空间变换view transform
注意不要和视口变换混淆,在顶点着色阶段,我们尚没有引入视口,仅仅在计算各个顶点的数据。
观察空间变换在龙书的翻译中称为取景变换,闫令琪老师的Games101称之为视图变换(闫老师同时把世界变换称之为模型变换model transform),无论是取景还是视图,他们的英文名称都是view transform。
Games101当中这样定义照相机:
这可以对应BoxApp当中的XMMATRIX view = XMMatrixLookAtLH(pos, target, up);
这其实和我们的理解吻合,因为求视图变换只需要知道照相机的位置、朝向和向上方向,我们其实就可以求出view matrix了。
所谓视图变换,是要把物体和照相机相对静止地进行平移、旋转,保证照相机处于标准状态:照相机位于原点,看向z正方向,摆正,up方向为y正方向(一个差异在于,Games101中描述的是右手系的标准状态,因此是look at -z方向;而龙书中是左手系,也就成了看向+z方向)。照相机可能位于一个任意位置、看向任意一个方向、并且歪斜至其up指向任意方向,这可能是游戏逻辑等决定的(比如人物在移动,人物看到的东西也自然发生了改变)。但是在操作中,我们希望先把整个世界伴随着相机一起平移旋转,从而让后面的计算简化。
XMMatrixLookAtLH是一个求视图变换的矩阵,输入当前的相机位置、相机焦点(看着的一个点)和相机上方向即可求得。
投影变换projection transform
整个投影变换在代码中只体现为调用一个函数:
XMMATRIX P = XMMatrixPerspectiveFovLH(0.25f*MathHelper::Pi, AspectRatio(), 1.0f, 1000.0f);
XMMATRIX XM_CALLCONV noexcept XMMatrixPerspectiveFovLH(
[in] float FovAngleY,//上下视场角
[in] float AspectRatio,//视口宽高比,从而可以算得左右视场角
[in] float NearZ,//近平面到视点的距离
[in] float FarZ//远平面到视点的距离
);
它完成了定义观察空间四棱台、变换顶点、规范化设备坐标、归一化深度等一系列工作。因此对于实用主义者,只要了解这个调用中,宽高比应该和交换链中buffer的宽高比保持一致,其余的各项数值其实是可以自己定义的(数据不合适也会出现问题,比如如果距离太小就不足以看到物体)
这里我把onRise里投影矩阵的计算参数改成了:
XMMATRIX P = XMMatrixPerspectiveFovLH(0.5f*MathHelper::Pi, AspectRatio(), 1.0f, 1000.0f);
这会导致上下视场角变大许多,从而整个视场横纵会等比扩展,这样物体看起来比一开始小了许多。当然试一试之后记得改回来。
投影变换实际的工作,就是把顶点的三维坐标投影到照相机投影平面的二维坐标。这个过程中丢失了一个维度z(注意之前的工作已经让照相机位于原点、up=y且看向+z),这将会作为深度数据继续保存。
投影分为透视和正交两种方案。正交投影更为简单,直接撇去z,x’=x y’=y;这里讨论透视投影prospective projection。
如图,利用相似三角形就能求出(x’,y’)
最终会得到整体的投影矩阵:
给顶点向量(x,y,z,1)右乘投影矩阵,得到的结果为:
这个结果包含了对xy到平面的相似三角映射、NDC映射(最终的一切顶点都必须成为规格化设备坐标NDC,满足下式)
而最后这个坐标还不是齐次坐标,应当为每个数除以z,这被称为透视除法。
2.2 裁剪
简单介绍一下Sutherland-Hodgman算法:
多边形裁剪一:Sutherland-Hodgman算法
手绘了一个例子:
空间三角形的裁剪是比较清楚的。裁剪的意义在于,平截头体以外的内容是照相机所看不到的,既然看不到那么就无须进一步消耗资源去渲染。我们将他们按照平截头体全部裁剪舍去。
注意,空间三角形有可能被裁剪成空间四边形。
2.3 光栅化阶段
视口变换
通过透视除法,把2D的顶点坐标变换到视口矩形中。
背面剔除,绕序
v0,v1,v2以顺时针顺序环绕,那么这个三角面将会朝向我们。规定以左手顺序叉乘所得结果<0,或者说顺时针绕序的三角形为正向,所有背面朝向的三角形在这里都会被剔除。这会在光栅器状态当中重点提到。
顶点属性插值
最重要的部分,如何从顶点到面。即使拥有顶点的颜色和光照,我们画出的图形最终也会是几个有颜色的像素。
在最简单的方案里,所有三角形内的像素,其颜色均按重心坐标插值三个顶点的属性。
2.4 像素/片元着色器阶段
三 BoxApp in Rendering pipeline
阅读BoxApp的过程中,遇到不认识的关键字可以逐级查找:BoxApp.h D3DApp.h MathHelper.h
3.1 输入布局描述
D3D编程是相当底层、具有很高开放度的编程。指定顶点之前,D3D允许用户自己声明如何定义和规范顶点。联系图形学知识,我们可以想到,顶点可以是简单的世界坐标+颜色,可以是世界坐标+法线+纹理等等,顶点存放什么数据根据用户说明来决定,保证了性能和功能可扩展性。
因此,我们可以看到任何自己写的xxApp程序,在非常靠前的位置都需要定义结构vertex:
同时应该通过描述符来告知GPU如何阅读输入的数据。格局打开,输入装配器阶段输入的数据可不止顶点数据(或者说不一定只有顶点数据)。
typedef struct D3D12_INPUT_LAYOUT_DESC {
const D3D12_INPUT_ELEMENT_DESC *pInputElementDescs;
//一组描述符,形成一数组。这些描述符都是D3D12_INPUT_ELEMENT_DESC类型,定义如下
UINT NumElements;
//上面的数组中有多少类型的输入布局,或者说是数组长度。
} D3D12_INPUT_LAYOUT_DESC;
typedef struct D3D12_INPUT_ELEMENT_DESC {
LPCSTR SemanticName;
UINT SemanticIndex;
DXGI_FORMAT Format;
UINT InputSlot;
UINT AlignedByteOffset;
D3D12_INPUT_CLASSIFICATION InputSlotClass;
UINT InstanceDataStepRate;
} D3D12_INPUT_ELEMENT_DESC;
龙书居然详细介绍了D3D12_INPUT_ELEMENT_DESC 里各个成员的用途。注意,每个D3D12_INPUT_ELEMENT_DESC 对象都描述一种输入元素。
SemanticName
The HLSL semantic associated with this element in a shader input-signature. (官翻-着色器输入签名里,会有一个HLSL语言的语义和此输入元素一一映射。)归根到底是一个字符串(这也是为什么类型是LPCSTR)。语义semantic的重要功能在于,他能把自定义的vertex结构里的成员一一对应到顶点着色器的输入签名当中。input signature输入签名 可以类比函数的函数签名,是函数名+参数表形成的一串东西。
这个东西就厉害了,这其实是在做C++到Shader的转换,打通任督二脉了属于是。这里的技术在
SemanticIndex
见图中,语义相同的tex0和tex1可以加上索引[0] 和[1]来进一步标识,这样语义能够更贴合实际含义地表达,而不必考虑重复问题,允许多个shader参数采用一样的语义,不同的索引。
注意,纵使没有索引,SemanticName=“TEXCODE”也会被默认地翻译成TEXCODE0,索引为0和不使用索引都会被翻译成TEXCODE0,从而意义是一样的。
Format
是老生常谈的DXGI_FORMAT了,表示存标量还是二维向量还是三维向量还是四维向量,每一维是多长的数,是浮点型还是整形。类型太多了,可以见MSDN介绍:
DXGI_FORMAT官方文档介绍
比较常见的是:
这里的格式应当与elements一一对应,也就是说输入布局中的任何一种输入元素,都应该只有一个FORMAT,如果需要其他FORMAT,就应该在输入布局中事先定义好对应FORMAT的元素。
InputSlot
输入槽个数。
Data enters the IA stage through inputs called input slots, as shown in the following illustration. The IA stage has n input slots, which are designed to accommodate up to n vertex buffers that provide input data. Each vertex buffer must be assigned to a different slot; this information is stored in the input-layout declaration when the input-layout object is created. You may also specify an offset from the start of each buffer to the first element in the buffer to be read.
数据从输入槽进入输入装配器,就像下图这样。输入装配器阶段有n个输入槽,被设计成匹配至多n个顶点缓冲区。每个顶点缓冲区必须绑定到不同的输入槽。顶点缓冲区绑定到哪一个输入槽这一信息被存在输入布局声明里,一旦输入布局声明完毕,就不能再改写。也可以指定一个特定的偏移量,让每个顶点缓冲区从偏移位置开始读取。
The next two parameters are the input slot and the input offset. When you use multiple buffers, you can bind them to one or more input slots. The input offset is the number of bytes between the start of the buffer and the beginning of the data.
下面两个参数是输入槽偏移量和输入槽类,使用多个顶点缓冲器的时候,可以把这些顶点缓冲器绑定到特定的输入槽上。(我的理解是,输入槽还是不允许buffer共享的)输入偏移指的是buffer起始位置到开始读取位置的偏移的字节量。
AlignedByteOffset
还是回到刚才的这张图里,我们看到第五个参数分别是0,12,24,32
这对应AlignedByteOffset,表示C++结构体里每个成员从输入buffer中的多少偏移位置开始读取。显然,这里告诉我们pos作为XMFLOAT3,三维的浮点向量,其每一浮点数位都占了4个字节,最终导致Normal量从12偏移位置才开始读取。InputSlotClass
12章中介绍了实例化技术,不采用实例化技术时一律填写
D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA
InstanceDataStepRate
不采用实例化技术时一律填写0
看一下BoxApp当中的输入布局描述:
void BoxApp::BuildShadersAndInputLayout()
{
HRESULT hr = S_OK;
mvsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, "VS", "vs_5_0");
mpsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, "PS", "ps_5_0");
mInputLayout =
{
{
"POSITION", 0, DXGI_FORMAT_R32G32B32_FLOAT, 0, 0, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 },
{
"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 0, 12, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 }
};
//可见,我们的立方体项目中只需要位置和颜色即可。
}
3.2 输入缓冲区input buffer
这一节看书的时候真的给我整吐了,为了完成顶点数据从主存到GPU显存的传输,在这一节里作者介绍了大量的工作,而并没有给出详细的分类,以致于整整七八页全是代码和细节。
输入缓冲区没有一个对应的代码类或者结构与之对应,它就是一个buffer资源,只不过用途上是用于输入,因此称之为input buffer。这部分的核心任务是以渲染管线的规范(现在处在输入装配器阶段)输入一套顶点数据,并将之最终传递给GPU。
I 缓冲区buffer & 创建buffer的DESC
缓冲区是最简单的GPU资源。其不支持多维、不支持mipmap、不支持过滤器、不支持MS多采样。
由于缓冲区是资源的一种,其使用ID3D12_RESOURCE_DESC来描述。
D3D12里,所有资源都用ID3D12_RESOURCE_DESC描述。
typedef struct D3D12_RESOURCE_DESC {
D3D12_RESOURCE_DIMENSION Dimension;
UINT64 Alignment;
UINT64 Width;
UINT Height;
UINT16 DepthOrArraySize;
UINT16 MipLevels;
DXGI_FORMAT Format;
DXGI_SAMPLE_DESC SampleDesc;
D3D12_TEXTURE_LAYOUT Layout;
D3D12_RESOURCE_FLAGS Flags;
} D3D12_RESOURCE_DESC;
具体是何种资源用Dimension成员来标识。这里的buffer资源,标识成Dimension=D3D12_RESOURCE_DIMENSION_BUFFER,而2d纹理标识成Dimension=D3D12_RESOURCE_DIMENSION_TEXTURE2D
而我们构建这个资源描述符时使用这个函数:
static inline Buffer(UINT64 width, D3D12_RESOURCE_FLAGS flags = D3D12_RESOURCE_FLAG_NONE, UINT64 alignment = 0)
Specifies a function that initializes the following parameters:
UINT64 width
(opt) D3D12_RESOURCE_FLAGS flags = D3D12_RESOURCE_FLAG_NONE
(opt) UINT64 alignment = 0
这种写法里,buffer函数会返回一个CD3DX12_RESOURCE_DESC 对象,相当于就能起到构造器的效果。要这样写是因为很多资源的内容差异较大,于是就设计了一个C++帮助结构CD3DX12_RESOURCE_DESC ,派生自D3DX12_RESOURCE_DESC 结构,专门定义了许多种资源的对应构造函数(实际上却不是构造函数,就比如上面的buffer函数)
实用主义的概括:日后创建buffer类资源的描述符不必再一项一项写,只要写Buffer(bytesize)即可,bytesize是buffer资源的字节量,其他内容由Buffer()函数填写默认值。注意调用时候写上名字空间——CD3DX12_RESOURCE_DESC::Buffer()
II 使用默认堆
一个几何体是否会在每一帧之中变化?有很多情况下,几何体本身的结构是不会发生变化的,比如我们这里的绘制立方体,比如游戏中的山石、地形、建筑物等。这种几何体被称为静态几何体static geometry。
D3D中设计了堆Heap,用于存放一批同类的资源。比如各种资源都需要描述符DESC来描述,D3D就设计了描述符堆来存放各种描述符。谈论Buffer非常重要的一个问题,就是Buffer资源作为一种资源,要丢到哪个具体的堆里。龙书中指出,对于静态几何体,使用默认堆D3D12_HEAP_TYPE_DEFAULT能够大大优化性能。
而使用什么堆,是通过在创建资源的时候告诉创建函数放在哪个堆里(谢天谢地我们不用自己再创建堆),主要是通过参数,比如:&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT)来完成(这里表示这个创建的资源要放在默认堆)
III 上传缓冲区upload buffer&上传堆upload heap
顶点数据是从哪里获得的?最一开始,这些顶点数据写在代码里。随着代码的编译,这些顶点数据属于CPU和主存储器,而并不能让GPU直接访问。输入缓冲区input buffer归根到底是一段内存,而GPU不能访问内存(事实上现在已经有技术可以做到这件事)。我们使用upload buffer上传缓冲器。而为了这个buffer我们也要选定堆来堆放,它使用的是对应的upload heap。这个概念专门用于把主存内容传给显存。
总结 I~III,CreateDefaultBuffer
到这里我们明确了,我们创建资源input buffer,这个创建的内部就要完成这样一些事:
①创建实际的默认缓冲区资源,采用默认堆,通过CreateCommittedResource
②创建中介的上传缓冲区,采用上传堆,通过CreateCommittedResource
此外还要做:
③描述默认缓冲区想要存放怎样的数据
④动手传输,使用UpdateSubresources
Microsoft::WRL::ComPtr<ID3D12Resource> d3dUtil::CreateDefaultBuffer(
ID3D12Device* device,
ID3D12GraphicsCommandList* cmdList,
const void* initData,//数据
UINT64 byteSize,//所建buffer字节数
Microsoft::WRL::ComPtr<ID3D12Resource>& uploadBuffer)
{
ComPtr<ID3D12Resource> defaultBuffer;
// 创建实际的默认缓冲区资源
ThrowIfFailed(device->CreateCommittedResource(
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT),
D3D12_HEAP_FLAG_NONE,
&CD3DX12_RESOURCE_DESC::Buffer(byteSize),
D3D12_RESOURCE_STATE_COMMON,
nullptr,
IID_PPV_ARGS(defaultBuffer.GetAddressOf())));
//end
// 为了拷贝主存数据给默认缓冲器,还必须构建一个处于中介位置的上传缓冲区
ThrowIfFailed(device->CreateCommittedResource(
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD),
D3D12_HEAP_FLAG_NONE,
&CD3DX12_RESOURCE_DESC::Buffer(byteSize),
D3D12_RESOURCE_STATE_GENERIC_READ,
nullptr,
IID_PPV_ARGS(uploadBuffer.GetAddressOf())));
// 描述默认缓冲想要复制的资源,这里定义的量称为子资源数据
D3D12_SUBRESOURCE_DATA subResourceData = {
};
subResourceData.pData = initData;
subResourceData.RowPitch = byteSize;
subResourceData.SlicePitch = subResourceData.RowPitch;//对于buffer而言,row slickpitch都等于想要复制的数据的字节数
//这里是将数据拷贝到默认buffer的流程。UpdateSubresources辅助函数会把
//主存拷贝到中介的上传堆, 之后ID3D12CommandList::CopySubresourceRegion
//把数据拷贝到mbuffer
cmdList->ResourceBarrier(1, &CD3DX12_RESOURCE_BARRIER::Transition(defaultBuffer.Get(),
D3D12_RESOURCE_STATE_COMMON, D3D12_RESOURCE_STATE_COPY_DEST));
UpdateSubresources<1>(cmdList, defaultBuffer.Get(), uploadBuffer.Get(), 0, 0, 1, &subResourceData);
cmdList->ResourceBarrier(1, &CD3DX12_RESOURCE_BARRIER::Transition(defaultBuffer.Get(),
D3D12_RESOURCE_STATE_COPY_DEST, D3D12_RESOURCE_STATE_GENERIC_READ));
// 注意,不能手动在这时销毁updateBuffer,这是因为命令列表中的复制可能尚未excute,
//只有调用此函数的单位确认复制完成时才能释放updateBuffer(c++经典内存管理困境)
return defaultBuffer;
}
③描述子资源的内容是好理解的,但是我们看到代码④部分是三个调用,这里是这样的:
第一次ResourceBarrier,告知资源状态从common转变为copy dest,也就是default buffer从common状态改为copy dest状态,即将作为拷贝的源;
而后UpdateSubresources
UINT64 inline UpdateSubresources(
_In_ ID3D12GraphicsCommandList *pCmdList,
_In_ ID3D12Resource *pDestinationResource,
_In_ ID3D12Resource *pIntermediate,
_In_ UINT FirstSubresource,
_In_ UINT NumSubresources,
UINT64 RequiredSize,
_In_ const D3D12_PLACED_SUBRESOURCE_FOOTPRINT *pLayouts,
_In_ const UINT *pNumRows,
_In_ const UINT64 *pRowSizesInBytes,
_In_ const D3D12_SUBRESOURCE_DATA *pSrcData
);
UpdateSubresources指定了从哪个源资源pDestinationResource、向哪个中介资源pIntermediate、从源的第几个FirstSubresource子资源开始、资源中的子资源数量NumSubresources、子资源数组*pSrcData,表明了传输开始。这样做的结果是中介的上传buffer拿到数据。
第二次ResourceBarrier,表明defaultBuffer结束了传输,正应把状态从copy dest改为GENERIC_READ。MSDN说D3D12_RESOURCE_STATE_GENERIC_READ状态是上传堆所需的初始状态,应当尽力避免使用这个资源状态但是这里要求defaultBuffer转化为D3D12_RESOURCE_STATE_GENERIC_READ是为什么我也不理解……
终于可以看一下我们的方盒几个角上的颜色是从哪写进来的了,我们大概能预感到面上的渐变色无非是用顶点颜色插值出来的,那么盒子看起来是什么颜色的最关键的输入就是这八个角的颜色了。
void BoxApp::BuildBoxGeometry()
{
std::array<Vertex, 8> vertices =
{
Vertex({
XMFLOAT3(-1.0f, -1.0f, -1.0f), XMFLOAT4(Colors::White) }),
Vertex({
XMFLOAT3(-1.0f, +1.0f, -1.0f), XMFLOAT4(Colors::Black) }),
Vertex({
XMFLOAT3(+1.0f, +1.0f, -1.0f), XMFLOAT4(Colors::Red) }),
Vertex({
XMFLOAT3(+1.0f, -1.0f, -1.0f), XMFLOAT4(Colors::Green) }),
Vertex({
XMFLOAT3(-1.0f, -1.0f, +1.0f), XMFLOAT4(Colors::Blue) }),
Vertex({
XMFLOAT3(-1.0f, +1.0f, +1.0f), XMFLOAT4(Colors::Yellow) }),
Vertex({
XMFLOAT3(+1.0f, +1.0f, +1.0f), XMFLOAT4(Colors::Cyan) }),//青
Vertex({
XMFLOAT3(+1.0f, -1.0f, +1.0f), XMFLOAT4(Colors::Magenta) })//平红色
};
std::array<std::uint16_t, 36> indices =
{
// front face
0, 1, 2,
0, 2, 3,
// back face
4, 6, 5,
4, 7, 6,
// left face
4, 5, 1,
4, 1, 0,
// right face
3, 2, 6,
3, 6, 7,
// top face
1, 5, 6,
1, 6, 2,
// bottom face
4, 0, 3,
4, 3, 7
};
const UINT vbByteSize = (UINT)vertices.size() * sizeof(Vertex);
const UINT ibByteSize = (UINT)indices.size() * sizeof(std::uint16_t);
//************————————————————————————————————
mBoxGeo = std::make_unique<MeshGeometry>();
mBoxGeo->Name = "boxGeo";
ThrowIfFailed(D3DCreateBlob(vbByteSize, &mBoxGeo->VertexBufferCPU));
CopyMemory(mBoxGeo->VertexBufferCPU->GetBufferPointer(), vertices.data(), vbByteSize);
ThrowIfFailed(D3DCreateBlob(ibByteSize, &mBoxGeo->IndexBufferCPU));
CopyMemory(mBoxGeo->IndexBufferCPU->GetBufferPointer(), indices.data(), ibByteSize);
//关注下面
mBoxGeo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(),
mCommandList.Get(), vertices.data(), vbByteSize, mBoxGeo->VertexBufferUploader);
//end
mBoxGeo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(),
mCommandList.Get(), indices.data(), ibByteSize, mBoxGeo->IndexBufferUploader);
mBoxGeo->VertexByteStride = sizeof(Vertex);
mBoxGeo->VertexBufferByteSize = vbByteSize;
mBoxGeo->IndexFormat = DXGI_FORMAT_R16_UINT;
mBoxGeo->IndexBufferByteSize = ibByteSize;
SubmeshGeometry submesh;
submesh.IndexCount = (UINT)indices.size();
submesh.StartIndexLocation = 0;
submesh.BaseVertexLocation = 0;
mBoxGeo->DrawArgs["box"] = submesh;
}
看这段之前先陶醉一下,按照输入颜色八个角的颜色分别是白黑红绿蓝黄青品(品红),对应一下输出结果(之前这段太长了自娱自乐一下了属于是):
言归正传,上面这段是BoxApp中的重要步骤BuildBoxGeometry(),主要是建立Box的几何体,输入了顶点数据和索引(索引会在3.3部分谈论)
在这里我们详细看一下刚才着重讲了半天的CreateDefaultBuffer的调用部分:
std::array<Vertex, 8> vertices =
{
Vertex({
XMFLOAT3(-1.0f, -1.0f, -1.0f), XMFLOAT4(Colors::White) }),
Vertex({
XMFLOAT3(-1.0f, +1.0f, -1.0f), XMFLOAT4(Colors::Black) }),
Vertex({
XMFLOAT3(+1.0f, +1.0f, -1.0f), XMFLOAT4(Colors::Red) }),
Vertex({
XMFLOAT3(+1.0f, -1.0f, -1.0f), XMFLOAT4(Colors::Green) }),
Vertex({
XMFLOAT3(-1.0f, -1.0f, +1.0f), XMFLOAT4(Colors::Blue) }),
Vertex({
XMFLOAT3(-1.0f, +1.0f, +1.0f), XMFLOAT4(Colors::Yellow) }),
Vertex({
XMFLOAT3(+1.0f, +1.0f, +1.0f), XMFLOAT4(Colors::Cyan) }),//青
Vertex({
XMFLOAT3(+1.0f, -1.0f, +1.0f), XMFLOAT4(Colors::Magenta) })//平红色
};
const UINT vbByteSize = (UINT)vertices.size() * sizeof(Vertex);
mBoxGeo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(),
mCommandList.Get(), vertices.data(), vbByteSize, mBoxGeo->VertexBufferUploader);
vertex的定义我们在输入布局讲过,
我再把参数表贴在这里
ID3D12Device* device,
ID3D12GraphicsCommandList* cmdList,
const void* initData,//数据
UINT64 byteSize,//所建buffer字节数
Microsoft::WRL::ComPtr<ID3D12Resource>& uploadBuffer
那么设定了CreateDefaultBuffer的参数vbByteSize,表示的就是buffer的字节数了。
你可能会问,为什么这里的buffer字节数是vbByteSize 。阅读这里的时候注意不要脑补认为CreateDefaultBuffer是一个把参数当成迭代器的过程。vbByteSize事实上就等于整个顶点数组的字节大小,用array的size=8乘以(UINT)vertices.size()=(12+16)(好像是这么大吧我记不得了),createDefaultBuffer于是也一次性地把整个buffer的数据全部传送了。
IV 渲染管线上的顶点缓冲-视图
为了把顶点缓冲区绑定到渲染管线,还要创建一个概念名叫view 视图。(看到这里我不知道你是不是开始崩溃了 我写的时候肯定比你看得更崩溃 简简单单一个小盒子的程序 甚至我们都已经撇开窗口过程消息处理这些part不看了,小小一个阶段就这么多内容是不是太困难了 唉但是D3D属于学图形学比较治标治本的一种切入点,难度和收益是并存的)
顶点缓冲vertex buffer对应的视图叫VBV vertex buffer view,顶点缓冲视图。RTV,render target view 需要描述符,而VBV甚至不需要描述符。VBV用类型D3D12_VERTEX_BUFFER_VIEW定义。
typedef struct D3D12_VERTEX_BUFFER_VIEW {
D3D12_GPU_VIRTUAL_ADDRESS BufferLocation;//视图对应的buffer的GPU虚拟地址
UINT SizeInBytes;//顶点缓冲区的字节数
UINT StrideInBytes;//每个顶点元素的字节数
} D3D12_VERTEX_BUFFER_VIEW;
d3dutil.h中定义了VertexBufferView(),用于生成VBV。
D3D12_VERTEX_BUFFER_VIEW VertexBufferView()const
{
D3D12_VERTEX_BUFFER_VIEW vbv;
vbv.BufferLocation = VertexBufferGPU->GetGPUVirtualAddress();
vbv.StrideInBytes = VertexByteStride;
vbv.SizeInBytes = VertexBufferByteSize;
return vbv;
}
查询d3dutil.h会发现,VertexByteStride和VertexBufferByteSize在这里都等于0。事实上,VertexBufferGPU实现了ID3D10Blob,可以利用ID3D10Blob::GetBufferSize()来查询大小。
V 渲染管线上的顶点缓冲-输入槽绑定
ID3D11DeviceContext::IASetVertexBuffers(),字面意思是设置顶点缓冲,事实上的工作是把顶点缓冲区与渲染管线上的输入槽绑定
void IASetVertexBuffers(
[in] UINT StartSlot,
[in] UINT NumViews,
[in, optional] const D3D12_VERTEX_BUFFER_VIEW *pViews
);
StartSlot
从第几号输入槽开始绑定。第一个顶点缓冲器将会绑定到这个下标的输入槽。注意输入槽的上限可能是16个或32个,根据功能级别有所不同,可以通过D3D11_IA_VERTEX_INPUT_RESOURCE_SLOT_COUNT 查到。NumViews
pViews数组中的视图数*pViews
数组,存放着所有顶点缓冲器的各自的视图。
写到这里,我发现一个问题,这里视图View和顶点缓冲器的对应关系是不明显的。最终绑定输入槽的仅仅是视图的数组,而从上面的代码并不能看出视图view和顶点缓冲器又如何的对应关系。IASetVertexBuffers把输入槽和vbv绑定起来;那么谁将vbv和vertex buffer对应起来呢?
我的一个猜测是,按照顺序对应。第一个view对应第一个vertex buffer,以此类推。后面我们再设计办法验证这个猜测。
VI 绘制顶点
void DrawInstanced(
[in] UINT VertexCountPerInstance,
[in] UINT InstanceCount,
[in] UINT StartVertexLocation,
[in] UINT StartInstanceLocation
);
VertexCountPerInstance
每个实例的顶点数目InstanceCount
实例数量,目前尚未使用实例化技术,因此实例数目恒为1StartVertexLocation
vertex buffer中第一个要绘制的顶点的索引,倘若要绘制其中所有的顶点就设定为0StartInstanceLocation
同样不使用实例化,这里填0
调用后,顶点缓冲器当中的[StartVertexLocation]~[StartVertexLocation+VertexCountPerInstance-1]顶点将会被绘制。
绘制是需要知道图元拓扑的,图元拓扑即输入的顶点如何理解。一串顶点,可以理解成每三个一组形成三角形,也可以每两个一组形成线段,等等等等。而图元拓扑是在绘制指令之前就应当设定好的,使用:
ID3D12GraphicsCommandList::IASetPrimitiveTopology()
3.3 索引缓冲区index buffer
坏消息是我们还要建立另一套buffer、view系统。好消息是这类buffer也是默认buffer,执行的手续与input buffer 完全一致。唯一的不同是index buffer形成的view 名叫index buffer view IBV,索引缓冲视图。
使用索引的机制和原理可以看龙书5.5.3,使用过Unity Mesh的,或者有美术经验的同学应该是清楚的。我们要绘制一个立方体,以三角形为图元,就需要12个三角形。这些三角形使用的顶点是相互重复的,如果我们重复声明顶点就要36个顶点。这36个顶点事实上只是对于八个事实点的复用,我们大可不必建立36个顶点,而是直接使用索引。
回到上面的BuildBoxGeometry(),
std::array<std::uint16_t, 36> indices =
{
// front face
0, 1, 2,
0, 2, 3,
// back face
4, 6, 5,
4, 7, 6,
// left face
4, 5, 1,
4, 1, 0,
// right face
3, 2, 6,
3, 6, 7,
// top face
1, 5, 6,
1, 6, 2,
// bottom face
4, 0, 3,
4, 3, 7
};
const UINT ibByteSize = (UINT)indices.size() * sizeof(std::uint16_t);
mBoxGeo = std::make_unique<MeshGeometry>();
mBoxGeo->Name = "boxGeo";
ThrowIfFailed(D3DCreateBlob(vbByteSize, &mBoxGeo->VertexBufferCPU));
CopyMemory(mBoxGeo->VertexBufferCPU->GetBufferPointer(), vertices.data(), vbByteSize);
ThrowIfFailed(D3DCreateBlob(ibByteSize, &mBoxGeo->IndexBufferCPU));
CopyMemory(mBoxGeo->IndexBufferCPU->GetBufferPointer(), indices.data(), ibByteSize);
mBoxGeo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(),
mCommandList.Get(), indices.data(), ibByteSize, mBoxGeo->IndexBufferUploader);
mBoxGeo->IndexFormat = DXGI_FORMAT_R16_UINT;
mBoxGeo->IndexBufferByteSize = ibByteSize;
}
注意,如果使用索引,在3.2的绘制顶点阶段就不要使用DrawInstanced()函数了,改为使用DrawIndexedInstanced()
void DrawIndexedInstanced(
[in] UINT IndexCountPerInstance,
[in] UINT InstanceCount,
[in] UINT StartIndexLocation,
[in] INT BaseVertexLocation,
[in] UINT StartInstanceLocation
);
其实大同小异,IndexCountPerInstance
每个实例将要绘制的索引数量InstanceCount
实例数量=1StartIndexLocation
从index buffer第几个索引开始BaseVertexLocation
索引偏移,索引[0]对应的是顶点里的第几号,不偏移就用0InstanceCount
不用实例,设为0
3.4 顶点着色器VS示例
注意到,我们的项目文件当中是有Shaders文件夹的。关于Shader可以看我主页的其他文章。
可以看到,其中有一个名为color.hlsl的shader,其编译成两个cso文件,也就是我们下面要编写的vs着色器和ps着色器。
(本以为学习dx,就不必再学shader了。是我太天真了)
顶点着色和像素着色都是必要的渲染管线阶段,而他们的工作在这一部分不再由d3d C++代码呈现。
void BoxApp::BuildShadersAndInputLayout()
{
HRESULT hr = S_OK;
mvsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, "VS", "vs_5_0");
mpsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, "PS", "ps_5_0");
mInputLayout =
{
{
"POSITION", 0, DXGI_FORMAT_R32G32B32_FLOAT, 0, 0, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 },
{
"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 0, 12, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 }
};
}
两个shader分别被编译成mvsByteCode mpsByteCode (字节码),他们而后会被BuildPSO()使用。
cbuffer cbPerObject : register(b0)
{
float4x4 gWorldViewProj;
};
struct VertexIn
{
float3 PosL : POSITION;
float4 Color : COLOR;
};
struct VertexOut
{
float4 PosH : SV_POSITION;
float4 Color : COLOR;
};
VertexOut VS(VertexIn vin)
{
VertexOut vout;
// 转换成齐次裁剪空间.
vout.PosH = mul(float4(vin.PosL, 1.0f), gWorldViewProj);
// 把顶点色彩原封不动传给PS
vout.Color = vin.Color;
return vout;
}
float4 PS(VertexOut pin) : SV_Target
{
return pin.Color;
}
回顾3.1 输入布局描述中提到,可以通过输入元素描述符D3D12_INPUT_ELEMENT_DESC 来指定语义,这正是与顶点shader配合使用。上代码中的
float3 PosL : POSITION;
float4 Color : COLOR;
其后的大写字符就是语义。
顶点着色器代码里其实只干了一件事儿,逐个定点乘以MVP矩阵。MVP矩阵我们已经在2.1部分介绍。那么问题来了,顶点着色器代码里没有赋值这个矩阵的过程,我们在C++代码里也找不到。着色器代码是如何和C++代码通信的?
这就要说到3.6常量缓冲区了。
3.5 像素着色器PS示例
float4 PS(VertexOut pin) : SV_Target
{
return pin.Color;
}
值得一提的是,SV_Target也是一个语义,表示返回值类型应当与渲染目标格式RENDER_TARGET_FORMAT保持一致,返回数据也会存放在渲染目标render target当中。
3.6 常量缓冲区constant buffer
这里解决之前提到的,着色器和C++如何交换信息。
cbuffer cbPerObject : register(b0)
{
float4x4 gWorldViewProj;
};
//……
VertexOut VS(VertexIn vin)
{
VertexOut vout;
// 转换成齐次裁剪空间.
vout.PosH = mul(float4(vin.PosL, 1.0f), gWorldViewProj);
// 把顶点色彩原封不动传给PS
vout.Color = vin.Color;
return vout;
}
这当中着色器有两处信息是无从获知的:
①输入格式
②需要知晓的变量gWorldViewProj
输入格式在3.1输入布局描述中交代。比如对于我们上面的shader,其对应的输入布局描述在:
mInputLayout =
{
{
"POSITION", 0, DXGI_FORMAT_R32G32B32_FLOAT, 0, 0, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 },
{
"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 0, 12, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 }
};
这与着色器定义的输入签名是匹配的:
struct VertexIn
{
float3 PosL : POSITION;
float4 Color : COLOR;
};
(事实上,输入布局与着色器内定义的输入是否匹配,会在渲染管线状态的工作中检查。这部分的工作详见3.9流水线状态对象)
而gWorldViewProj则是放在常量缓冲区中。
迟迟没有介绍这一段其实根本看不懂的着色器代码:
cbuffer cbPerObject : register(b0)
{
float4x4 gWorldViewProj;
};
cbuffer就是常量缓冲区constant buffer。这里建立了一个名为cbPerObject的常量缓冲区,其中存放了一个gWorldViewProj的4x4矩阵。
常量缓冲区应当使用上传堆upload heap。
常量缓冲区的大小必须是硬件最小分配空间256Bytes的整数倍。
作为buffer,常量缓冲也有自己的视图。视图可以理解为buffer绑定到渲染管线的一个一一对应的键。
3.6.1 常量缓冲区的上传buffer
struct ObjectConstants
{
DirectX::XMFLOAT4X4 WorldViewProj = MathHelper::Identity4x4();
};
//step1 规定常量缓冲区内容格式
UINT mElementByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof(ObjectConstants));
//step2按256B计算规范cb的大小
ComPtr<ID3D12Resource> mUploadCBuffer;
device->CreateCommittedResource(
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD),
D3D12_HEAP_FLAG_NONE,
&CD3DX12_RESOURCE_DESC::Buffer(mElementByteSize * NumElements),
D3D12_RESOURCE_STATE_GENERIC_READ,
nullptr,
IID_PPV_ARGS(&mUploadCBuffer));
//step3创建资源,使用上传堆,资源状态为GENERIC_READ,分配给mUploadCBuffer
这里的MathHelper::Identity4x4()是初始化成单位矩阵的一个函数
static DirectX::XMFLOAT4X4 Identity4x4()
{
static DirectX::XMFLOAT4X4 I(
1.0f, 0.0f, 0.0f, 0.0f,
0.0f, 1.0f, 0.0f, 0.0f,
0.0f, 0.0f, 1.0f, 0.0f,
0.0f, 0.0f, 0.0f, 1.0f);
return I;
}
DX12推行着色器模型5.1(shader model,SM5.1),这里可以把常量缓冲区定义在shader里:
struct ObjectConstants
{
float4x4 gWorldViewProj;
uint matIndex;
};
ConstantBuffer<ObjectConstants> gObjConstants : register(b0);
3.6.2 更新常量缓冲区
我们提到,案例里的cb是用来存放MVP矩阵的,在立方体演示程序中,我们可以人为去拖动视角,因此MVP矩阵在每一帧里是需要update的。这就需要设计cb的更新办法。首先,通过Map获得欲更新资源的指针:
ComPtr<ID3D12Resource> mUploadBuffer;
BYTE* mMappedData = nullptr;
mUploadBuffer->Map(0, nullptr, reinterpret_cast<void**>(&mMappedData));
MSDN对ID3D12Resource::Map method的解释如下:
Gets a CPU pointer to the specified subresource in the resource, but may not disclose the pointer value to applications. Map also invalidates the CPU cache, when necessary, so that CPU reads to this address reflect any modifications made by the GPU.
获取资源中指定子资源的 CPU 指针,但不能将指针值透露给应用程序。必要时, Map还会使 CPU 的cache禁用,以便 CPU 对该地址的读取反映 GPU 所做的任何修改。(主要看第一句)
换言之,运用Map我们从一个ComPtr<ID3D12Resource>
资源COM指针,得到了其子资源的C++指针(地址)。
之后,我们利用memcpy函数将数据从主存复制到常量缓冲区:
memcpy(mMappedData, &data, dataSizeInBytes);
拷贝完成后取消映射。所谓取消映射,其实是销毁在Map阶段获得的C++指针。
if(mUploadBuffer != nullptr)
mUploadBuffer->Unmap(0, nullptr);
mMappedData = nullptr;
3.6.3 UploadBuffer.h
作者封装了一个upload buffer类,其中最重要的除了构造和析构,我认为是CopyData方法,用来更新缓冲区内的特定元素。
void CopyData(int elementIndex, const T& data)
{
memcpy(&mMappedData[elementIndex*mElementByteSize], &data, sizeof(T));
}
3.6.4 CB的DESC
我们在最初就提到,DESC使用的最初动机就是用来向pipeline描述资源,并将其绑定到pipeline。DESC都需要放到特定的堆里,比如之前提到使用默认堆的输入缓冲区就要绑定到默认堆,而upload buffer要使用上传堆等等等等。不过之前使用两类堆都没有自己创建堆,而是直接在DESC里讲明要放进哪个堆:
ThrowIfFailed(device->CreateCommittedResource(
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT),
D3D12_HEAP_FLAG_NONE,
&CD3DX12_RESOURCE_DESC::Buffer(byteSize),
D3D12_RESOURCE_STATE_COMMON,
nullptr,
IID_PPV_ARGS(defaultBuffer.GetAddressOf())));
而这里的常量缓冲区,其堆需要我们手动创建。
D3D12_DESCRIPTOR_HEAP_DESC cbvHeapDesc;
cbvHeapDesc.NumDescriptors = 1;
cbvHeapDesc.Type = D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV;
//新堆描述符提到,这个堆属于CBV_SRV_UAV三联堆
cbvHeapDesc.Flags = D3D12_DESCRIPTOR_HEAP_FLAG_SHADER_VISIBLE;
//这里对于cbv Heap,千万要设定flag=shader_visible,表示这个常量区能让shader去读取
cbvHeapDesc.NodeMask = 0;
ComPtr<ID3D12DescriptorHeap> mCbvHeap
md3dDevice->CreateDescriptorHeap(&cbvHeapDesc,
IID_PPV_ARGS(&mCbvHeap));
3.6.5 根签名root signature & 描述符表 &CBV
回顾输入装配器阶段,我们提到为vertex buffer绑定输入槽,采用了ID3D11DeviceContext::IASetVertexBuffers()方法。这一方法的参数为:
void IASetVertexBuffers(
[in] UINT StartSlot,
[in] UINT NumViews,
[in, optional] const D3D12_VERTEX_BUFFER_VIEW *pViews
);
实际上是把各个顶点buffer对应的VBV一一绑定到用下标指定的连续几个输入槽上。
槽slot,我的理解是渲染管线用于绑定资源而设计的一个概念,渲染管线在不同阶段要做不同的事情,会接触大量的资源,为了保证数据安全、厘清数据的具体用途和理解方式,数据必须形成view视图,并且与槽对应才能被pipeline最终使用。
在前面的着色器代码里,我们能看到:
cbuffer cbPerObject : register(b0)
{
float4x4 gWorldViewProj;
};
迟迟没有解释,这里的register(b0)是什么意思?
学完本节,我们就能够知道shader当中的b0在什么时候以何种手段与C++程序匹配。
在上面的着色器程序段里,cbuffer cbPerObject是我们定义的一个常量缓冲区,其中存放了一个4x4的矩阵;
书中还给出了大量的例子。
// 将纹理资源绑定到纹理寄存器槽0
Texture2D gDiffuseMap : register(t0);
// 把下列采样器资源依次绑定到采样器寄存器槽0~5
SamplerState gsamPointWrap : register(s0);
SamplerState gsamPointClamp : register(s1);
SamplerState gsamLinearWrap : register(s2);
SamplerState gsamLinearClamp : register(s3);
SamplerState gsamAnisotropicWrap : register(s4);
SamplerState gsamAnisotropicClamp : register(s5);
// 将常量缓冲区资源(cbuffer)绑定到常量缓冲区寄存器槽0
cbuffer cbPerObject : register(b0)
{
float4x4 gWorld;
float4x4 gTexTransform;
};
// 绘制过程中所用的杂项常量数据
cbuffer cbPass : register(b1)
{
float4x4 gView;
float4x4 gProj;
[...] // 为篇幅而省略的其他字段
};
// 绘制每种材质所需的各种不同的常量数据
cbuffer cbMaterial : register(b2)
{
float4 gDiffuseAlbedo;
float3 gFresnelR0;
float gRoughness;
float4x4 gMatTransform;
};
//常量和杂项一般使用b#,sample采用s#,纹理和渲染对象资源用t#
在渲染开始前,C++程序绑定到渲染管线上的资源(通过视图)会被映射到着色器的对应输入寄存器。一言以蔽之,根签名是对“shader需要的输入的陈述”,可以理解成函数的参数,只是根签名是写在C++程序里的。
和函数签名一样,根签名是一个参数的集合,这种参数叫做根参数root parameter。根参数可以是三种形式:根常量(root constant)、根描述符(root descriptor)或者描述符表(descriptor table)。我们这里只使用描述符表。
1 定义描述符表,形成描述符表数组
CD3DX12_DESCRIPTOR_RANGE cbvTable;
cbvTable.Init(
D3D12_DESCRIPTOR_RANGE_TYPE_CBV,
1, // 表中的描述符数量
0);// 将这段描述符区域绑定至此基准着色器寄存器(base shader register)
所谓的描述符表,其实是CD3DX12_DESCRIPTOR_RANGE 类,翻译成描述符区域更为妥帖。
从Init的结构可以看出,描述符表在创建的时候,需要给定描述符类型、范围,以及这段描述符区域绑定到的基准着色器寄存器号。
之前着色器中使用的register(b0)表示0号基准着色器寄存器。这是由描述符属于CBV描述符决定的,CB常量缓冲区都采用base shader register。
2 把根参数分别init成描述符表
slotRootParameter[0].InitAsDescriptorTable(
1, // 描述符区域的数量
&cbvTable); // 指向描述符区域数组的指针
由于我们的根参数只有一个,只需要对slotRootParameter[0]创建描述符表。
static inline InitAsDescriptorTable(
D3D12_ROOT_PARAMETER &rootParam,
UINT numDescriptorRanges,
const D3D12_DESCRIPTOR_RANGE* pDescriptorRanges,
D3D12_SHADER_VISIBILITY visibility = D3D12_SHADER_VISIBILITY_ALL)
3 用构造器构造根签名DESC
注意用词,这里还没有create根签名。create特指对device调用create函数。
// 根签名由一组根参数构成
CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(1, slotRootParameter, 0, nullptr,
D3D12_ROOT_SIGNATURE_FLAG_ALLOW_INPUT_ASSEMBLER_INPUT_LAYOUT);
我们的根参数数组只有一个元素,因此只能指定numParameters=1
在作业集中,我们尝试使用更复杂的根签名。
构造器CD3DX12_ROOT_SIGNATURE_DESC():
CD3DX12_ROOT_SIGNATURE_DESC(UINT numParameters,
const D3D12_ROOT_PARAMETER* _pParameters,
UINT numStaticSamplers = 0,
const D3D12_STATIC_SAMPLER_DESC* _pStaticSamplers = NULL,
D3D12_ROOT_SIGNATURE_FLAGS flags=D3D12_ROOT_SIGNATURE_FLAG_NONE)
//Creates a new instance of a CD3DX12_ROOT_SIGNATURE_DESC, initializing the following parameters:
//UINT numParameters
//D3D12_ROOT_PARAMETER* _pParameters
//最后三个参数可选填
4 序列化根签名
序列化根签名D3D12SerializeRootSignature()用于执行序列化,把根签名描述的输入布局转化成序列化数据格式,以ID3DBlob接口表示。必须先序列化,再创建根签名。
ComPtr serializedRootSig = nullptr;
ComPtr errorBlob = nullptr;
HRESULT hr = D3D12SerializeRootSignature(&rootSigDesc,
D3D_ROOT_SIGNATURE_VERSION_1,
serializedRootSig.GetAddressOf(),
errorBlob.GetAddressOf());[15]
HRESULT D3D12SerializeRootSignature(
[in] const D3D12_ROOT_SIGNATURE_DESC *pRootSignature,
//根签名描述符的指针
[in] D3D_ROOT_SIGNATURE_VERSION Version,
//
[out] ID3DBlob **ppBlob,
//序列化结果存放与这个指针
[out, optional] ID3DBlob **ppErrorBlob
//序列化出错后跳到这个指针
);
5 create根签名
ThrowIfFailed(md3dDevice->CreateRootSignature(
0,
serializedRootSig->GetBufferPointer(),
serializedRootSig->GetBufferSize(),
IID_PPV_ARGS(&mRootSignature)));
HRESULT CreateRootSignature(
[in] UINT nodeMask,
//单核情况,设定为0,多核情况表示物理适配器节点
[in] const void *pBlobWithRootSignature,
//序列化指针,需要GetBufferPointer()把ID3DBlob**转化成void*
[in] SIZE_T blobLengthInBytes,
REFIID riid,//opt
[out] void **ppvRootSignature
//create后返回这个指针
);
3.7 编译着色器
不做过多介绍,DX提供的命令行工具FXC就可以编译着色器。详见龙书对应章节。
3.8 光栅器状态
前方高能:
你可能本能地觉得,要把我们原本的程序改成这样的框,估计是要修改很多代码吧?大概是要删掉接近一两百行的代码、重写对应的逻辑吧?
其实不是的,这里我们只改了BoxApp.cpp的两行代码。这个效果是通过修改RasterizerState,也就是光栅器状态来实现的。
psoDesc.RasterizerState.FillMode = D3D12_FILL_MODE_WIREFRAME;
psoDesc.RasterizerState.CullMode = D3D12_CULL_MODE_NONE;
//实际上我只加了这两句话
我们回顾一下之前已经介绍了输入装配器阶段、顶点着色和像素着色阶段。当然,顶点着色固然比较清楚,而像素着色的shader程序其实就是一句废话:
float4 PS(VertexOut pin) : SV_Target
{
return pin.Color;
}
这样一来,我们的插值的逻辑在哪里呢?每个像素显示什么颜色如何确定呢?这个问题在3.9章节结束后就能找到答案。
D3D12_RASTERIZER_DESC 是光栅器描述符,用于指定渲染中最关键的几个设置:
typedef struct D3D12_RASTERIZER_DESC {
D3D12_FILL_MODE FillMode;
D3D12_CULL_MODE CullMode;
BOOL FrontCounterClockwise;
INT DepthBias;
FLOAT DepthBiasClamp;
FLOAT SlopeScaledDepthBias;
BOOL DepthClipEnable;
BOOL MultisampleEnable;
BOOL AntialiasedLineEnable;
UINT ForcedSampleCount;
D3D12_CONSERVATIVE_RASTERIZATION_MODE ConservativeRaster;
} D3D12_RASTERIZER_DESC;
FillMode
渲染模式,有线框渲染D3D12_FILL_MODE_WIREFRAME = 2和实体渲染D3D12_FILL_MODE_SOLID = 3两个选项。我们最初画出的立方体采用实体渲染,而刚刚的线段效果则是线框模式。默认采用实体模式。CullMode
指定背面剔除。D3D12_CULL_MODE_NONE = 1,表示不剔除
D3D12_CULL_MODE_FRONT = 2,表示剔除正面三角形
D3D12_CULL_MODE_BACK = 3,表示剔除背面三角形FrontCounterClockwise
指定绕序。counter clockwise表示逆时针,也就是说此bool值为true表示逆时针绕序为正面三角形。也就是说,按照我们前面的习惯,应该设定FrontCounterClockwise=false。DepthBias
DepthBiasClamp
SlopeScaledDepthBias
均是关于尚未介绍过的depth bias深度偏差。暂不论,统统采用默认值。包括后面的几个值也暂时不说。
psoDesc.RasterizerState.FillMode = D3D12_FILL_MODE_WIREFRAME;
psoDesc.RasterizerState.CullMode = D3D12_CULL_MODE_BACK;
//背面剔除的线框
采用了背面剔除后的线框效果如图:
3.9 流水线状态对象PSO pipeline state object
上一节提到了psoDesc这个量,其实就是流水线状态对象的描述符。
PSO的描述符是D3D12_GRAPHICS_PIPELINE_STATE_DESC。可见下面的代码,其几乎堪称最大的内容最多的一个描述符了:
typedef struct D3D12_GRAPHICS_PIPELINE_STATE_DESC
{
ID3D12RootSignature *pRootSignature;
D3D12_SHADER_BYTECODE VS;
D3D12_SHADER_BYTECODE PS;
D3D12_SHADER_BYTECODE DS;
D3D12_SHADER_BYTECODE HS;
D3D12_SHADER_BYTECODE GS;
D3D12_STREAM_OUTPUT_DESC StreamOutput;
D3D12_BLEND_DESC BlendState;
UINT SampleMask;
D3D12_RASTERIZER_DESC RasterizerState;
D3D12_DEPTH_STENCIL_DESC DepthStencilState;
D3D12_INPUT_LAYOUT_DESC InputLayout;
D3D12_PRIMITIVE_TOPOLOGY_TYPE PrimitiveTopologyType;
UINT NumRenderTargets;
DXGI_FORMAT RTVFormats[8];
DXGI_FORMAT DSVFormat;
DXGI_SAMPLE_DESC SampleDesc;
}
上一节光栅器状态用到的D3D12_RASTERIZER_DESC 仅仅是PSO的一个成员。*pRootSignature
指向一个与此PSO相绑定的根签名的指针。该根签名一定要与此PSO指定的着色器相兼容。所谓兼容,是指PSO将会在create时检查各个着色器指定的输入与pRootSignature的输入是否一一对应。如果不能匹配,则会让PSO create抛出异常VS
填入顶点着色器编译出的bytecode。PS
填入像素着色器编译出的bytecode。
VS和PS的填写一般用这样的格式:
psoDesc.PS =
{
reinterpret_cast<BYTE*>(mpsByteCode->GetBufferPointer()),
mpsByteCode->GetBufferSize()
};
StreamOutput
本例中没填,由于初始化成了全0空间,这一项也会设置成0BlendState
混合状态,暂时填D3D12_DEFAULTSampleMask
这里采用了UINT_MAX=0xffffffff,表示不做屏蔽。UINT有32个位,这里分别表示多采样的
RasterizerState
上节介绍的光栅器状态。可以用
RasterizerState = CD3DX12_RASTERIZER_DESC(D3D12_DEFAULT)来填写默认值。DepthStencilState
深度/模板状态。暂时填D3D12_DEFAULTInputLayout
输入布局。输入装配器阶段介绍,这里用这句话指定:
psoDesc.InputLayout = {
mInputLayout.data(), (UINT)mInputLayout.size() };
回顾一下当初的输入布局指定,详见上面的3.1:
void BoxApp::BuildShadersAndInputLayout()
{
HRESULT hr = S_OK;
//...
mInputLayout =
{
{
"POSITION", 0, DXGI_FORMAT_R32G32B32_FLOAT, 0, 0, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 },
{
"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 0, 12, D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 0 }
};
}
PrimitiveTopologyType
图元拓扑,这里采用D3D12_PRIMITIVE_TOPOLOGY_TYPE_TRIANGLE。
typedef enum D3D12_PRIMITIVE_TOPOLOGY_TYPE {
D3D12_PRIMITIVE_TOPOLOGY_TYPE_UNDEFINED = 0,
D3D12_PRIMITIVE_TOPOLOGY_TYPE_POINT = 1,
D3D12_PRIMITIVE_TOPOLOGY_TYPE_LINE = 2,
D3D12_PRIMITIVE_TOPOLOGY_TYPE_TRIANGLE = 3,
D3D12_PRIMITIVE_TOPOLOGY_TYPE_PATCH = 4
}
NumRenderTargets
渲染目标数量。本例为1RTVFormats[8]
渲染目标视图格式的数组。本例中只有一个渲染目标,也就只有一个渲染目标格式。渲染目标视图格式应该与交换链中的back buffer格式匹配。DSVFormat
DSV的格式。
//d3dApp.h
DXGI_FORMAT mDepthStencilFormat = DXGI_FORMAT_D24_UNORM_S8_UINT;
//BoxApp.cpp
psoDesc.DSVFormat = mDepthStencilFormat;
深度模板视图部分的内容尚未系统介绍。SampleDesc
对采样的描述。书第四章详细介绍过,这里采用:
//回顾,查询设备支持的质量级别
//d3dApp.cpp
bool D3DApp::InitDirect3D(){
//...
msQualityLevels.Format = mBackBufferFormat;
msQualityLevels.SampleCount = 4;
msQualityLevels.Flags = D3D12_MULTISAMPLE_QUALITY_LEVELS_FLAG_NONE;
msQualityLevels.NumQualityLevels = 0;
ThrowIfFailed(md3dDevice->CheckFeatureSupport(
D3D12_FEATURE_MULTISAMPLE_QUALITY_LEVELS,
&msQualityLevels,
sizeof(msQualityLevels)));
m4xMsaaQuality = msQualityLevels.NumQualityLevels;
}
//BoxApp.cpp
psoDesc.SampleDesc.Count = m4xMsaaState ? 4 : 1;
psoDesc.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) : 0;
最后来看一下完整的PSO构建过程:
void BoxApp::BuildPSO()
{
D3D12_GRAPHICS_PIPELINE_STATE_DESC psoDesc;
ZeroMemory(&psoDesc, sizeof(D3D12_GRAPHICS_PIPELINE_STATE_DESC));
psoDesc.InputLayout = {
mInputLayout.data(), (UINT)mInputLayout.size() };
psoDesc.pRootSignature = mRootSignature.Get();
psoDesc.VS =
{
reinterpret_cast<BYTE*>(mvsByteCode->GetBufferPointer()),
mvsByteCode->GetBufferSize()
};
psoDesc.PS =
{
reinterpret_cast<BYTE*>(mpsByteCode->GetBufferPointer()),
mpsByteCode->GetBufferSize()
};
psoDesc.RasterizerState = CD3DX12_RASTERIZER_DESC(D3D12_DEFAULT);
psoDesc.BlendState = CD3DX12_BLEND_DESC(D3D12_DEFAULT);
psoDesc.DepthStencilState = CD3DX12_DEPTH_STENCIL_DESC(D3D12_DEFAULT);
psoDesc.SampleMask = UINT_MAX;
psoDesc.PrimitiveTopologyType = D3D12_PRIMITIVE_TOPOLOGY_TYPE_TRIANGLE;
psoDesc.NumRenderTargets = 1;
psoDesc.RTVFormats[0] = mBackBufferFormat;
psoDesc.SampleDesc.Count = m4xMsaaState ? 4 : 1;
psoDesc.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) : 0;
psoDesc.DSVFormat = mDepthStencilFormat;
ThrowIfFailed(md3dDevice->CreateGraphicsPipelineState(&psoDesc, IID_PPV_ARGS(&mPSO)));
}
边栏推荐
- Phase Vocoder的补充完善,Matlab音频变速不变调、变调不变速
- ZEMAX | How to rotate any element around any point in space
- 自监督论文阅读笔记 Self-Supervised Visual Representation Learning with Semantic Grouping
- ue4学习日记2(项目迁移,画刷,附材质)
- 二分查找1-实现一个二分查找
- 【C语言】二分查找
- ue4入门学习笔记1(操作界面)
- 电子元器件的分类有哪些?
- page fault-页异常流程
- pandoc -crossref插件实现markdwon文档转word后公式编号自定义
猜你喜欢
随机推荐
2-php学习笔记之控制语句,函数
【七夕特效】 -- 满屏爱心
关于芯片你了解吗?
C语言中打印字符数组出现乱码的问题(烫烫烫)
【第三周】ResNet+ResNeXt
g++ parameter description
BurpSuite 进阶玩法
数组与字符串13-两数之和等于目标数
设备树解析源码分析<devicetree>-1.基础结构
servlet learning (7) ServletContext
嵌入汇编-1 格式讲解
ZEMAX | 绘图分辨率结果对光线追迹的影响
零基础小白想往游戏建模方向发展,3D游戏建模好学嘛?
ucosII OSMemCreate()函数的解析
队列方法接收串口的数据
自监督论文阅读笔记DisCo: Remedy Self-supervised Learning on Lightweight Models with Distilled Contrastive
稳压二极管的工作原理及稳压二极管使用电路图
double型数据转字符串后通过MCU串口发送
POE交换机全方位解读(中)
ucos任务调度原理