龙空技术网

技嘉RTX 3090 Ti评测 它来晚了吗?

中关村在线 1056

前言:

如今姐妹们对“单应矩阵分解求rt”大致比较关注,咱们都想要分析一些“单应矩阵分解求rt”的相关知识。那么小编也在网上搜集了一些有关“单应矩阵分解求rt””的相关文章,希望各位老铁们能喜欢,朋友们快快来了解一下吧!

作为RTX 30系最强显卡,虽几经波折,现在终于和我们见面了。今天为大家带来的是技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G评测。

本次RTX 3090 Ti的发布与其他RTX 30系显卡都有所不同,首先全部AIC都采用了全新的单16pin供电接口,我们大致猜想,这应该也是为后续RTX 40系显卡发布的一次“练兵”。其次,大部分厂商都为这次新显卡的发布重新设计了外观,包括本次评测的魔鹰同样在列。

规格方面,RTX 3090 Ti毫不意外的采用了满血GA102核心,84组SM单元,比RTX 3090多了2组,同时频率和功耗也都有所增高。换来的则是相当暴力的性能提升,这一点我们在后面测试的时候展开细说。

这张RTX 3090 Ti拥有24GB大显存,依然定位于内容创作者。但如果你就是有钱,不在乎性价比,就要最好的,这张RTX 3090 Ti在游戏方面的表现同样有非常高的提升。

技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G

技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G这张显卡的售价为15999元,相比RTX 3090来说,售价基本相同,还挺“划算”,毕竟性能提升非常大。

在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:

1.新16pin供电设计,采用新ATX3.0电源标准,通过附赠转接线可兼容旧型号电源;2.24GB大显存,轻松应对8K HDR游戏及内容创作软件3.支持ECC校验,增加专业软件领域稳定性4.1905MHz高频率,高于官方1860MHz标准频率

很多用户感觉这张显卡会不会来的太晚了些?距离RTX 30系显卡的发布已经过去了将近两年,而RTX 40系的新品也是箭在弦上。

但NVIDIA官方已经宣布,即便日后发布RTX 40系显卡,RTX 30系也将同时售卖。所以猜测,两代显卡在价格和性能方面不会出现太多重叠,而像RTX 3090 Ti这种TITAN级别的显卡,更不会参与游戏卡的竞争,所以它所面对的仍然是RTX 40系内容创作卡。

01 NVIDIA Ampere架构的 满血GA102核心

技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G显卡采用了NVIDIA Ampere架构,我们首先来看一下这次的GA102核心。

RTX 3090 Ti算力对比TITAN RTX

相较于上一代Turing RTX架构的,NVIDIA Ampere架构在算力上有着成倍的增长,GeForce RTX 3090 Ti的着色器性能达到40 TFLOPS单精度性能,而搭载NVIDIA Turing架构的TITAN为16.3 TFLOPS。

RT Core达到78 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达320 Tensor TFLOPS

RTX 3090 Ti显存对比TITAN RTX

同时在显存方面,RTX 3090 Ti也采用了24GB GDDR6X显存,显存频率达到了21 Gpbs,带宽则是史无前例的1 TB/s,让这款显卡可以畅玩8K 60帧游戏。

RTX 3090 Ti所采用的GA102核心

GA102的完整核心图NVIDIA在RTX 3080发布时就已经公布,现在终于有显卡应用到了未阉割的GA102。完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器),CUDA数量为10752个。下面我们再来看看几款显卡的核心参数对比。

GA102核心拥有280亿(28000 million)个晶体管,628m㎡的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。

02 技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G概览

首先开箱,在配件方面,除了常见的金属显卡支架外,由于本次在非公版显卡中首次搭载了单16pin供电接口,所以还配备了一根单12pin转8pin*3的转接线,不过两头都接上后,这一段会“支棱”着,装在机箱里还是比较明显的。

包装内配件

目前Intel已经发布了ATX电源3.0的新标准,就是需要有新的单16pin的显卡供电,目前已经有部分旗舰电源应用到,但普及尚需要些时间。不过相信不久后即便是RTX 3090 Ti的450W功耗,只接一根外接供电就够了。

技嘉RTX 3090 Ti 魔鹰24G

技嘉RTX 3090 Ti 魔鹰24G的外观进行了重新设计,相较之前的魔鹰,整体更“丰满”了一些,导流罩整体采用黑色和银色点缀,整体为金属拉丝工艺。显卡尺寸为331×150×70mm,占用3槽空间。相较于其他RTX 30系产品来说,仍然属于“巨无霸”级别。

技嘉RTX 3090 Ti 魔鹰24G风扇特写

并且由于这款显卡更是定位旗舰游戏,在散热方面也更加下功夫,三个主动散热风扇均采用了100mm刀刃式风扇,搭配正逆转功能,可在相同的风扇转速下获得更大的进气量。同时风扇内部的双滚珠轴承结构比传统结构具有更好的耐热性和效率。

技嘉RTX 3090 Ti 魔鹰24G侧面特写

内部的主动散热部分,技嘉RTX 3090 Ti 魔鹰24G采用均热板直触技术,加上8根复合式热管的引导效果,能提供更高的散热效率。

技嘉RTX 3090 Ti 魔鹰24G背板展示

技嘉RTX 3090 Ti 魔鹰24G的金属背板相较RTX 30系的其他几款产品有所不同,为了配合此次的“异形”PCB板,采用了大面积镂空的进气格栅,更有利于热空气排出。

单16pin供电接口

技嘉RTX 3090 Ti 魔鹰24G是首次采用单16pin接口的非公型号,从视觉效果来看,更简洁更美观。目前新的PCIe 5.0的电源规范为12+4pin的完整供电,其中最上面的4pin为讯号线,用于检测12V功耗是否可以满足显卡使用,新一代支持这个标准的电源会自带16Pin的供电线。所以目前全部采用8*3pin转12pin的转换线。

DP1.4a*3+HDMI 2.1

视频输出接口依旧采用了DP1.4a*3+HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。

03 3DMARK理论性能测试

首先介绍一下测试平台,为了保证此次评测能够发挥3DMARK理论性能测试显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,并且将内存容量提升至32GB,具体如下:

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,技嘉RTX 3090 Ti 魔鹰24G采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10752个CUDA,Boost频率达到1905MHz,相较公版的1860MHz有较大提升。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了1008.4 GB/s,光栅单元和纹理单元为112和336。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,测试结果大大超出了我们的预期,本以为RTX 3090 Ti的成绩会像RTX 3080 Ti到RTX 3090的跨度,没想到提升如此大。

技嘉RTX 3090 Ti 魔鹰24G相较RTX 3090综合提升12%,作为本代Ti后缀的型号,除了RTX 3060 Ti,3090 Ti是提升最大的,而且这还是在没有更换核心的情况下。

3D MARK TS套装测试

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,技嘉RTX 3090 Ti 魔鹰24G相较RTX 3090提升约为11%。

3D MARK 光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,技嘉RTX 3090 Ti 魔鹰24G相较RTX 3090提升约为12.7%。

综合来看,RTX 3090 Ti相较RTX 3090的提升几乎相当于更换了芯片,但其实两个型号的芯片只相差2组SM单元,更多的是暴力提升了功耗和核心频率,但结果也显而易见。

04 游戏性能测试

在游戏性能测试中,我们选择了《地平线5》、《刺客信条:英灵殿》、《无主之地3》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

虽然这张RTX 3090 Ti显卡并不是为游戏玩家所准备,但此次大幅度的理论性能提升,也不禁让人好奇,在游戏中这张卡会有怎样的表现。

《地平线5》游戏测试

首先在《地平线5》中,技嘉RTX 3090 Ti 魔鹰24G显卡的1080P成绩相较RTX 3090再提升4%;2K分辨率成绩提升3%;4K分辨率成绩提升5%。

《刺客信条:英灵殿》游戏测试

在《刺客信条:英灵殿》中,可能由于驱动版本的更新和游戏更新,所有跑分相较以前的成绩均有大幅度提升,我们以本次跑分成绩为准。

技嘉RTX 3090 Ti 魔鹰24G的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升13%;4K分辨率成绩提升9%。

《无主之地3》游戏测试

《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,技嘉RTX 3090 Ti 魔鹰24G的1080P成绩相较RTX 3090提升14%;2K分辨率成绩提升7%;4K分辨率成绩提升7%。

《光明记忆:无限》游戏测试

《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。

技嘉RTX 3090 Ti 魔鹰24G的1080P成绩相较RTX 3090提升7%;2K分辨率成绩提升12%;4K分辨率成绩提升15%。

不过即便强如RTX 3090 Ti,在4K分辨率下也没有达到60帧。《光明记忆:无限》的benchmark测试似乎将光线追踪用到了极致。

《边境》游戏测试

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

技嘉RTX 3090 Ti 魔鹰24G的1080P成绩相较RTX 3090提升7%;2K分辨率成绩提升9%;4K分辨率成绩提升10%。

在整体游戏方面,NVIDIA官方给出的游戏数据是在标频情况下提升约为4-8%,而我们测试的技嘉RTX 3090 Ti 魔鹰24G在1905MHz频率下,综合提升约为10%,与理论成绩基本相符。

所以尽管RTX 3090 Ti的定位依然是内容创作显卡,但它的性能提升是实实在在的,如果不考虑性价比的话,入手一张绝对是本代最强游戏卡。

05 专业软件测试

除了光线追踪的强化,NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。

同时,显卡的一个重要指标是显存容量和位宽,显存位宽越大,表示单位时间显卡能处理的数据的越多,RTX 3090 Ti拥有384bit 位宽,带宽为 1008.4 GB/s,以及24GB大显存,这都为内容创作提供了更好地助力。

NVIDIA控制面板中新增ECC开启功能

另外此次RTX 3090 Ti也是NVIDIA在RTX 30系中首次为消费级显卡开启ECC显存校验,开启这一功能后,显卡性能会有所下降,但稳定性会增加,更有助于在专业软件中长时间稳定工作。

NVIDIA Omniverse

在此次GTC 2022大会中NVIDIA也正式向开发者推出NVIDIA Omniverse实时设计协作和模拟平台,它可轻松构建自定义工具,以简化、加速和改进其开发工作流。更多关于Omniverse的使用体验和链接方法,可以参考笔者之前的文章“NVIDIA Omniverse体验 老板监工神器”,这里就不过多讲解了。

上图为笔者使用SPECviewperf 13这款工业、专业软件跑分测试。对比显卡为本代的游戏旗舰RTX 3080 Ti和生产力工具旗舰RTX 3090 Ti。

从结果来看,两款显卡相差不大,但测试环境都是在不爆显存的情况下得来,毕竟RTX 3080 Ti同样使用的GA102芯片,也是本代最强的游戏旗舰卡。另外如果在更高分辨率下的渲染中,大显存的优势才会突显,当显存溢出时,通常不像游戏只是卡不卡的问题,而是能不能用的问题。

KeyShot 9测试

KeyShot 意为“The Key to Amazing Shots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的 3D 渲染影像。

KeyShot 9有预设模型,进入软件后直接点击渲染,为了更考验大显存所带来的帮助,我们直接将渲染分辨率改为预设的7680×7680方形8K尺寸。

同时在选项中,选择GPU渲染,可以看到目前正在采用RTX 3090 Ti进行渲染,而GPU使用量为100%

技嘉RTX 3090 Ti 魔鹰24G渲染时间为1分43秒

在预设模型的渲染中,可以看到整个过程的渲染时常为1分43秒,其中在渲染时的显存占用为17.1GB,已经远远超出了RTX 3080 Ti的12GB,也让笔者不由得期待超出显存后会是什么样。

RTX 3080 Ti渲染崩溃

在使用RTX 3080 Ti后,由于渲染8K分辨率图片的显存严重溢出,会导致软件无法渲染,直接崩溃。虽然在KeyShot 9中软件崩溃没有比较明显的提示,但通过这重叠的窗口用户也能大体看出端倪了。

DaVinci(达芬奇)测试

DaVinci(达芬奇)是世界上专业8K编辑的唯一解决方案,集成颜色校正,视觉效果,音频编辑在一个软件中。

首先在偏好选项中,取消勾选自动的GPU配置,指定使用技嘉RTX 3090 Ti 魔鹰24G显卡。

导入一段高清的8K素材后,在运动特效中增加时域降噪、时域阈值以及运动模糊的参数,下面先来看RTX 3090 Ti的演示效果。

这一段8K素材的可调色空间非常大,笔者增加了一层电影滤镜,可以看到在使用RTX 3090 Ti时,可以在实时预览时达到非常流畅的程度。

RTX 3080 Ti预览崩溃

在分辨率越高的情况下,实时预览对显卡显存的要求也就越高,RTX 3080 Ti采用12GB显存会出现报错,这就是因为显存不够。

在显存不够报错的情况下,解决办法基本只有创建代理进行剪辑,不过这样无法展示素材的最真实效果,所以在超高分辨率下,拥有24GB大显存的RTX 3090 Ti拥有绝对优势。

Blender测试

Blender是一个免费开放源码的3D创作套件。它支持整个三维编辑-建模,索具,动画,模拟 渲染,合成,运动跟踪,视频编辑和2D动画编辑。

首先还是设置渲染设备,Blender默认使用CPU渲染,这里选择RTX 3090 Ti。

在软件内的渲染设置内,勾选两项降噪,并且为了增加渲染时常,我们将采样率提升至400,渲染分辨率提升为200%。

技嘉RTX 3090 Ti 魔鹰24G渲染时长为1分21秒

RTX 3080 Ti渲染时常为1分29秒

在第一组测试中,技嘉RTX 3090 Ti 魔鹰24G的渲染时常为1分21秒,RTX 3080 Ti的渲染时常为1分29秒,单独来看差异似乎不大,不过我们对比的为RTX 3080 Ti显卡,刨除显存的因素,这也是一张旗舰游戏显卡,算力非常强悍。

技嘉RTX 3090 Ti 魔鹰24G 渲染时长为1分40秒

RTX 3080 Ti渲染时常为1分49秒

第二组对比中为一段900帧的循环动画,并且分为第三人称视角和第一人称视角双镜头。这组对比中,单帧的差距仍然为9秒。

不过可能是自带运动模糊,增加了一定的显存使用率,所以在渲染时RTX 3080 Ti偶尔有报错的情况,只能重新渲染。

技嘉RTX 3090 Ti 魔鹰24G 渲染时长为1分32秒

RTX 3080 Ti渲染时常约为1分39秒

在同一帧下,第一人称视角与之前的时间基本相同,这里不做过多阐述。

在这段动画中,我们按照每帧渲染时间相差18秒(双镜头)来计算,一段900帧的动画渲染时常就会相差16200秒,等于270分钟或者4.5小时。

如果按1秒24帧来计算,那么这段动画也只有37秒左右。而在大型的动画电影中,庞大的数据量往往需要电脑夜以继日的渲染,即便是崩溃一次,可能也会浪费很久的时间,所以大显存在内容创作领域的优势显而易见。

06 功耗及温度测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

功耗测试

技嘉RTX 3090 Ti 魔鹰24G经过我们的实测在满载状态下单卡功耗为414W左右,但是可以看到下面新增的TDP项,GPU满载也只达到了86%的水平。所以根据这个来计算,如果达到100% TDP,实际为480W左右。

温度测试

温度方面,本次的技嘉RTX 3090 Ti 魔鹰24G经过25分钟左右的拷机,温度稳定为63℃左右,峰值达到65℃。另外显存温度为68℃,比核心温度还要低很多,可以说内部重要区域散热做得非常到位。

07 它来晚了吗?

对于RTX 3090 Ti的实测数据,相信大家还是比较意外的,毕竟本代的Ti系列除了RTX 3060 Ti,还没有性能提升如此大的。

虽然只差2组SM单元,但频率的大幅提升和功耗增加,这种简单粗暴的方式对于性能提升的影响显而易见。

另外很多用户感觉这张显卡会不会来的太晚了些?距离RTX 30系显卡的发布已经过去了将近两年,而RTX 40系的新品也是箭在弦上,现在发布RTX 3090 Ti寓意何为?

技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G

首先个人猜测,这款RTX 3090 Ti更像是RTX 3090的改进版。在散热方面,由于RTX 3090采用了单颗容量1GB的显存,所以PCB版双面均有排布,发热量巨大,也更不好设计散热方案。

而本次的RTX 3090 Ti则采用了单颗2GB的显存,这也是为什么大家看到本次的RTX 3090 Ti拷机温度更容易控制。

另外NVIDIA官方已经宣布,即便日后发布RTX 40系显卡,RTX 30系也将同时售卖。所以个人猜测,两代显卡在价格和性能方面不会出现太多重叠,而像RTX 3090 Ti这种TITAN级别的显卡,更不会参与游戏卡的竞争。

所以它所面对的仍然是RTX 40系内容创作卡,大概率下一代的TITAN级别产品会更贵。

另外对比此前发布的RTX A6000显卡,不难发现两款产品其实采用了完全相同的核心,都是GA102,都是10752个CUDA,甚至Boost频率都是1860MHz,而目前RTX A6000在京东的售价为34799元,那么这两款产品到底有什么区别?

RTX A6000参数一览

显存方面,RTX 3090 Ti相比RTX A6000少了24GB显存,但由于采用了GDDR6X显存,带宽更高了,整体速度更快。原本专业卡独有的ECC显存校验,本次在RTX 3090 Ti中也得到了支持。不过vGPU显存是不支持的,这也是RTX A6000在专业卡上得天独厚的优势。

游戏方面,其实RTX A6000也有着不错的表现,如果你真的有钱,买一张A6000来打游戏也不是不可以,但它的帧数应该会比RTX 3090 Ti更低,同时散热表现也没有那么好。

但专业卡的长处在于各大专业软件的兼容和适配,以及内部调校。如Catia以及SW等软件针对专业卡都有非常好的优化,不过我们常见的3DSMAX和MAYA等软件,即使是消费级的RTX 3090 Ti同样有着出色的性能和稳定性表现。

技嘉GeForce RTX 3090 Ti GAMING OC魔鹰 24G

RTX 3090 Ti这张显卡的定位依旧是主内容创作者,尽管NVIDIA在各方面的宣传都没有提及游戏性能,但不可否认的是,此次RTX 3090 Ti在理论和游戏测试性能有着大幅度提升,均达到10%左右。

如果你想用它来打游戏,不追求性价比,只要极致性能,那么买一张也没什么问题。

技嘉RTX 3090 Ti 魔鹰24G这张卡在外观上进行了重新设计,相较于原来的魔鹰,整体黑色的造型更简约,但受制于散热效果的要求,显卡本身的厚度有所增加。所以这张显卡在散热方面的表现也让人印象深刻,在发热量最高的显存上,也只有68℃。

目前这张技嘉RTX 3090 Ti 魔鹰24G显卡的售价为15999元,其实相比目前RTX 3090的市价13999元来说,还是比较有性价比的。

标签: #单应矩阵分解求rt