Un buen rendimiento es crítico al éxito de muchos juegos. Abajo hay algunas guías simples para maximizar la velocidad de la renderización gráfica de su juego.
Las partes gráficas de su juego pueden tener principalmente un precio en dos sistemas del computador: el GPU o el CPU. La primera regla de cualquier optimización es encontrar dónde el problema de rendimiento está; ya que las estrategias para optimizar el GPU vs. el CPU son bastantes diferentes (y puede inclusive ser opuestas - es bastante común hacer que el GPU trabaje más mientras se optimice para el CPU, y vice versa).
Problemas típicos y maneras de revisarlos:
Problemas menos comunes:
Para renderizar cualquier objeto en la pantalla, el CPU tiene mucho trabajo que hacer: trabajar qué luces afecta ese objeto, configurar el shader y los parámetros del shader, y enviar comandos de dibujo al driver gráfico, que luego prepara los comandos para que sea enviado a la tarjeta gráfica.
Todo este uso del CPU “por objeto” es intensivo a los recursos, por lo que si usted tiene muchos objetos visibles, esto se puede agregar. Por ejemplo, si usted tiene miles de triángulos, es mucho más fácil en el CPU si todos están en un mesh, en vez de un mesh por triángulo (agregando hasta 1000 meshes). El precio de ambos escenarios en el GPU es muy similar, pero el trabajo hecho por el CPU para renderizar mil objetos (en vez de uno) es significativamente mayor.
Reduzca la cuenta visible de objetos. Para reducir la cantidad de trabajo que el CPU necesita hacer:
Combine los objetos juntos para que cada mesh tenga al menos varios cientos de triángulos y utilice solo un Material para el mesh entero. Es importante que tenga en cuenta que combinar dos objetos que no compartan un material no le da a usted ningún incremento de rendimiento. La razón más común para tener múltiples materiales es que dos meshes no compartan la misma textura; entonces para optimizar el rendimiento del CPU, usted debe asegurarse que cualquier objeto que usted combine comparta las misma texturas.
Cuando se utilice muchas pixel lights (luces de pixel) en el Forward rendering path, hay situaciones dónde combinar objetos no tiene sentido. Ver la sección de rendimiento de Iluminación abajo para aprender a cómo manejar esto.
Use OnDemandRendering to improve CPU performance by controlling your application’s rendering speed.
You might want to lower the frame rate in the following scenarios:
Adjusting the rendering speed helps you manage power usage and device thermals to maximize battery life and prevent CPU throttling. It works particularly well with the Adaptive Performance package. Even though frames don’t render as often, the application still sends events to scripts at a normal pace (for example, it might receive input during a frame that isn’t rendered). To prevent input lag, you can call OnDemandRendering.renderFrameInterval = 1
for the duration of the input so that movements, buttons, etc. still appear to be responsive.
Situations that are very heavy in areas such as scripting, physics, animation, but not rendering, don’t benefit from using this API. Your application’s visuals might stutter with minimal impact on power usage.
Note: VR applications don’t support On Demand Rendering. Not rendering every frame causes the visuals to be out of sync with head movement and might increase the risk of motion sickness.
There are two basic rules for optimizing the geometry of a Model:
Tenga en cuenta que el número de vértices que el hardware de gráficas tiene que procesar usualmente no es lo mismo que el número reportado por una aplicación 3D. Las aplicaciones de modelado usualmente muestran la cantidad de puntos de esquina distinos que componen el modelo (conocido como la cantidad de vértices geométricos). Sin embargo, para una tarjeta gráfica algunos vértices geométricos necesitan ser divididos en dos o más vértices lógicos por propósitos de renderización. Un vértices debe estar dividido si tiene múltiples normales, coordenadas UV o colores de vértice. En consecuencia, la cuenta de vértices en Unity es usualmente superior que la cuenta dada por la aplicación 3D.
While the amount of geometry in the Models is mostly relevant for the GPU, some features in Unity also process Models on the CPU (for example, Mesh skinning).
For more tips on improving performance while creating Assets in 3D applications outside of Unity, see Modeling characters for optimal performance.
La opción más rápida es siempre crear una iluminación que no necesite ser calculada en absoluto. Para hacer esto, utilice Lightmapping para “bake” la iluminación estática solamente una vez, mas bien de calcular esto cada frame. El proceso de generar un ambiente lightmapped toma solamente un poco más que colocar una luz en la escena en Unity, pero:
En muchos casos usted puede aplicar varios trucos simples en vez de agregar varias luces extra. Por ejemplo, en vez de agregar una luz que brilla directamente a la cámara para darle un efecto de Rim Lighting , agregue un cálculo dedicado Rim Lighting
directamente a sus shaders (ver Surface Shader Examples para aprender a cómo hacer esto).
También ver: Forward rendering
La iluminación dinámica por pixel agrega un trabajo significante de renderizado a cada pixel afectado, y puede llevar a objetos siendo renderizados en múltiples pases. Evite tener más de una una Pixel Light iluminando cualquier objeto sencillo en dispositivos menos poderosos, como móviles o GPUs de PCs de baja gama, y utilice lightmaps para iluminar objetos estáticos en vez de calcular su iluminación cada frame. La iluminación dinámica por vértice puede agregar trabajo significante a las transformaciones de vértice, entonces intente evitar situaciones dónde hay varias luces iluminando un solo objeto.
Evite combinar meshes que están lo suficiente lejos para ser afectados por diferentes conjuntos de pixel lights. Cuando usted utilice la pixel lighting, cada mesh tiene que estar renderizado tantas veces que haya pixel lights iluminándolo. Si usted combina dos meshes que están muy lejos, esto aumenta el tamaño efectivo del objeto combinado. Todas las pixel lights que iluminan cualquier parte de este objeto combinado son tomados en cuenta durante el renderizado, por lo que el número de pases que se debe hacer para renderizar el objeto combinado es la suma de la cantidad de pases para cada uno de los objetos separados, por lo que nada se gana al combinar los meshes.
During rendering, Unity finds all lights surrounding a mesh and calculates which of those lights affect it most. The settings on the Quality window are used to modify how many of the lights end up as pixel lights, and how many as vertex lights. Each light calculates its importance based on how far away it is from the mesh and how intense its illumination is - and some lights are more important than others purely from the game context. For this reason, every light has a Render Mode setting which can be set to Important or Not Important; lights marked as Not Important have a lower rendering overhead.
Ejemplo: Considere un juego de manejar en la que el carro del jugador está manejando en la oscuridad con los faros de luz prendidos. Los faros de luz son probablemente la fuente de luz más significante que hay en el juego, por lo que su Render Mode debería estar configurado a Important. Puede que haya otras luces en el juego que son menos importantes, como las luces traseras de los otros carros o faros de luz, y que no mejoran el efecto visual al ser pixel lights. El Render Mode para esas luces con seguridad se pueden configurar como Not Important para evitar que se gaste capacidad de renderizado en lugares dónde no tiene casi beneficio.
Optimizar iluminación por pixel ahorra trabajo para el CPU y GPU: el CPU tiene menos draw calls que hacer, y el GPU tiene menos vértices que procesar y pixeles para rasterizar para todos los objetos adicionales de renderizado.
Use Compressed textures to decrease the size of your textures. This can result in faster load times, a smaller memory footprint, and dramatically increased rendering performance. Compressed textures only use a fraction of the memory bandwidth needed for uncompressed 32-bit RGBA textures.
Siempre habilite Generate mipmaps para texturas utilizadas en una escena 3D. Una textura mipmap le permite al GPU utilizar una resolución de textura menor para triángulos pequeños. Esto es parecido a cómo la compresión de textura puede ayudar a limitar la cantidad de datos de textura transferidos cuando el GPU está renderizando.
La única excepción para esta regla es cuándo un texel (píxel de textura) es conocido de mapear 1:1 al píxel de la pantalla renderizada, tal como elementos UI o en un juego 2D.
Hacerle cull (omitir/cortar) a los objetos involucra hacer de ellos invisibles. Esta es una manera efectiva de reducir ambas la carga del CPU y GPU.
En muchos juegos, una manera rápida y efectiva de hacer esto sin comprometer la experiencia del jugador es cull objetos pequeños de manera más agresiva que las más grandes. Por ejemplo, las rocas pequeñas y el escombro pueden volverse invisibles en distancias grandes, mientras que los edificios más grandes todavía serían visibles.
Hay un número de maneras en que se puede lograr:
Utilice el sistema Level Of Detail
Configure manualmente las distancias per-layer culling en la cámara
Coloque objetos pequeños en una layer (capa) separada y configure sus distancias cull per-layer utilizando la función script Camera.layerCullDistances
Las sombras en tiempo real son bonitas, pero pueden traer un impacto mayor en el rendimiento, en términos de draw calls extra para el CPU y un procesamiento extra en el GPU. Para más detalles, ver la página acerca del Light Performance (rendimiento de iluminación)
Las diferentes plataformas que hay tienen diferentes capacidades de rendimiento; el GPU de un PC de alta gama puede manejar más en términos de gráficos y shaders que un GPU móvil de baja gama. Lo mismo es cierto incluso en una sola plataforma, un GPU rápido es una docena de veces más rápido que un GPU integrado más lento.
El probable que el rendimiento en las plataformas móviles y los Pcs de baja gama sea mas bajo que en su maquina de desarrollo. Se recomienda que usted optimice manualmente sus shaders para reducir los cálculos y lectura de texturas, con el fin de mantener un buen rendimiento a través de las maquinas GPU de baja gama. Por ejemplo, algunos Shaders integrados en Unity tienen equivalentes “móviles” que son mucho más rápido, pero tienen algunas limitaciones o aproximaciones.
Abajo hay algunas guías para tarjetas gráficas de baja gama para móviles y PC:
Transcendental mathematical functions (such as pow
, exp
, log
, cos
,
sin
, tan
) are quite resource-intensive, so avoid using them where possible. Consider using lookup textures as an alternative to complex math calculations if applicable.
Evite escribir sus propias operaciones (como lo son normalize
, dot
, inversesqrt
). Las opciones integradas de Unity aseguran que el driver pueda generar mejor código. Recuerde que la operación Alpha Test (discard
) hace que su fragment shader sea más lento.
Mientras que la precisión (float
vs half
vs fixed
) de variables
floating point en su mayoría son ignorados en GPUs de escritorios, es bastante
importante que obtenga un buen rendimiento en GPUs móviles. Ver la
página Shader Data Types and Precision
para detalles.
Para detalles adicionales acerca del rendimiento del shader, ver la página Shader Performance
Static
en un objeto que no se mueva para permitir optimizaciones internas como static batching.pixel light
(preferiblemente directional) afectando su geometría, en ves de varios.half
cuando sea posible.pow
, sin
y cos
en pixel shaders.