Resolución de imagen

la carrera del tamaño

Mayor resolución de imagen no siempre es sinónimo de mayor calidad. En el mercado podemos encontrar, a precio de una cena con amigos, cámaras de resolución 4K. Estas cámaras proporcionan un tamaño de imagen muy grande pero es probable que su forma de representar el color, la sensibilidad a la luz o el tipo de compresión que utilizan en sus vídeos deje bastante que desear frente a alguna cámara con buena óptica y resolución HD (una cuarta parte del 4K). Además, los archivos de alta resolución ocuparán más espacio en tus discos duros y, quizá, sin un buen resultado.

En otros artículos abordamos temas como la compresión y la colorimetría o las proporciones del fotograma cinematográfico. Hoy hablamos de resolución de imagen.

Un poco de historia

1873. Una estación de telégrafos irlandesa. El operador de telégrafo Joseph May comienza a sufrir irregularidades en sus lecturas con selenio metálico. Analizando los instrumentos y el ambiente descubre que la incidencia de la luz cambia la resistencia eléctrica del material de manera proporcional a la intensidad de dicha luz. Este hallazgo permitía crear una corriente eléctrica análoga a la luminosidad.

En Alemania, una década después, Paul Nipkow aprovechaba el descubrimiento para patentar el disco de Nipkow. El susodicho invento utilizaba una lente para impregnar secuencialmente, en pequeñas perforaciones con células de selenio, distintos puntos de una imagen. La corriente eléctrica de este primer disco emisor pasaba a un segundo disco receptor dónde una fuente luminosa reproducía la impresión fotoeléctrica. Hasta aquí parece un simple invento para llevar una imagen fija a través de un cable eléctrico. Algo que ya había logrado mediante impulsos mecánicos el italiano Giovanni Caselli en 1862. Pero ambos discos giraban sincrónicamente. Es decir, cada revolución recogía, a través de sus perforaciones, el objeto completo a representar y lo reproducía. La secuencia de imágenes del objeto en movimiento se creaba mientras los discos seguían girando.

El disco de Nipkow

Todo esto viene a explicar que ya, en los primeros pasos de la televisión, la imagen se emitía mediante barrido. Un barrido que fragmentaba la imagen en líneas para transmitirlas por corriente electromagnética.

Anuncio impreso del televisor Kuba Komet

Anuncio impreso del televisor Kuba Komet

Televisión de diseño fabricada en Alemania desde 1957 hasta 1962

Esta proto-televisión daría paso a lo que se denominó televisiones mecánicas que, gracias a Logie Baird, se estrenaron con la emisión de la cara de un niño en 1926. Fueron mejorando la técnica llegando a emitir 25 imágenes, compuestas por 240 líneas, por segundo.

El tubo de rayos catódicos

Las televisiones mecánicas pasaron a un segundo plano en 1933 cuando Vladímir Zvorykin, el entonces director de la Radio Corporation of America (RCA), estrenó el iconoscopio. Pese a los continuos viajes de Zvorykin a los juzgados por problemas de patente contra Philo Farnsworth, su televisión eléctrica se convirtió en estándar televisivo de Estados Unidos hasta 1946.

El iconoscopio y las posteriores televisiones “de tubo” trabajan con rayos catódicos. Estos rayos son corriente eléctrica que se ubica en un tubo de vacío recubierto de fósforo. El fósforo se ilumina al contacto con los electrones. Si no hay variación en el campo eléctrico, los electrones viajarán sin chocar con el material luminiscente, en línea recta. Con oscilaciones electromagnéticas se produce luz en distinta intensidad dependiendo del número de electrones que entre en contacto con el fósforo.

Este proceso crea un punto de luz que, al moverse en líneas horizontales, irá generando el barrido de la imagen. Proceso que lleva el sentido de la lectura occidental: de izquierda a derecha y de arriba abajo.

El entrelazado

En las primeras televisiones de tubo de rayos catódicos (CRT), realizar este barrido completo producía algunos problemas técnicos. El fósforo de la pantalla perdía luminosidad con demasiada rapidez. Cuando se terminaba de formar toda la imagen, la parte superior de la misma empezaba a ennegrecer. El fósforo había perdido su propiedad lumínica. Además, la transmisión de toda esta información a la suficiente velocidad para engañar al ojo gracias a la persistencia retiniana, necesitaba mucho flujo de electricidad. La solución fue dividir la imagen en dos campos. Uno formaría las líneas pares y otro las impares. De esta manera el flujo de electricidad se reducía a la mitad y, al recorrer la pantalla en líneas intercaladas, dejaba de percibirse el problema del fósforo. Esta es la razón por la que existe vídeo entrelazado.

Vídeo entrelazado

Llegó el color (podéis ahondar en el tema en este otro artículo) y, tras varios sistemas con diferentes características, se establecieron tres patrones universales: NTSC, PAL y SECAM.

La señal de televisión

NTSC

En Estados Unidos se instauró el NTSC, siglas del comité que estableció las bases: National Television System Commitee. La corriente eléctrica en Norteamérica (y parte de Japón) es de 60 ciclos. Esto quiere decir que la corriente alterna cambia su polaridad de positivo a negativo 60 veces por segundo, generando una onda en esta fluctuación. Dicha onda almacenará la información lumínica (o de color) de forma análoga. Que la corriente estadounidense sea de 60Hz (hercio es igual a ciclos por segundo) fue relevante a la hora de establecer el patrón NTSC.

Al dividir los cuadros en dos campos, la frecuencia eléctrica permitía 30 impulsos por segundo, lo que se traduce en 30 fotogramas por segundo (fps). Cada segundo refresca 30 veces el campo par completo y otras 30 veces el impar completo. Realmente, para reducir las interferencias que surgían al incorporar el color, se redujo la velocidad a 29,97 fps. Se estableció que cada uno de esos campos tuviese 240 líneas, un total de 480 líneas más 45 que ejercen labores sincronía y barrido en negro (similar a las franjas de inter-negativo).

PAL

En Europa, Oriente Medio y partes de Asia y Sudamérica, la frecuencia eléctrica es de 50Hz. De ahí que el número de fotogramas del sistema PAL (Phase Alternated Line) sea 25fps. Este sistema está implantado en Europa occidental, Australia, China y Sudamérica. Su nombre indica el cambio de polaridad que realiza cada dos líneas para corregir problemas de representación del color que padecía el sistema NTSC. El sistema PAL cuenta con 625 líneas de las cuales 576 forman la imagen (en dos campos).

SECAM

El sistema de origen francés SECAM (Secuentiel Color à memoire) se ha adoptado en Japón y en algunos países de Europa del Este y África. Utiliza la misma frecuencia de muestreo que el PAL y el mismo número de líneas, aunque cambia su codificación de color.

A partir de aquí, los televisores siguieron evolucionando. Mejoran la frecuencia de muestreo mediante memorias que repiten cada campo. Se adaptaron al formato 16/9 pues tenía mejor aceptación entre el público. Con la alta definición, mejoran la resolución de imagen duplicando el número de líneas, a 1250 en Europa y 1050 en Estados Unidos. Hi-visión prescinde de información de transmisión que recrea según valores contiguos. Aparecen los televisores LCD que abandonan el tubo de imagen para representar la imagen con electrodos sobre una superficie de cristal líquido. Estos electrodos se verán cómo píxeles en la pantalla. Es decir, se deja de representar mediante líneas para hacerlo con puntos. Se seguirá el mismo proceso de lectura que si fuesen líneas, pero se fragmenta esta línea en pequeños puntos. Algo bastante más cercano al sistema digital.

Los sistemas de monitorización digital

Mientras tanto, los informáticos hacían su propia carrera tecnológica para monitorizar sus contenidos.

Las primeras tarjetas gráficas aparecieron en 1981 de la mano de IBM. Se estrenaron dos tipos. Las tarjetas MDA se reproducían en monitores de tubo y sólo representaban caracteres de texto de 9×14 píxels monocromos. Los monitores CGA podían representar 4 colores, aunque mediante distintos trucos como el intercalado de dos colores a altas frecuencias, se lograba mayor gama de color. Esta tarjeta tardó en adquirir cuota de mercado puesto que los usuarios de ordenadores no confiaban en el carácter lúdico de los mismos. Estos primeros monitores tenían mucho parpadeo y, el entrelazado, era muy incómodo a la hora de cargar gráficos o texto.

La gran revolución llegó en 1988 con los monitores VGA (Video Graphics Array). Se rediseñó el trabajo del monitor para un escaneo progresivo. Con una paleta de hasta 256 colores, se convirtió en estándar gráfico que evolucionaría hasta hoy.

Los primeros dispositivos soportaban una resolución de imagen de 720×400 píxeles en modo texto, de 640×480 píxeles reproduciendo 16 colores y 320×200 píxeles reproduciendo 256 colores. Lo que quiere decir que, dependiendo de la cantidad de colores que tuviese que representar, tenía mayor o menor resolución de imagen. En el caso de representar texto, la pantalla se compondría de puntos organizados en 400 líneas horizontales y 720 verticales. En cambio, los videojuegos se reproducían a 256 colores a una resolución de 200 píxeles horizontales por 320 verticales.

Expliquemos el proceso.

El vídeo digital

Tanto la fotografía como el vídeo en formato digital se representa mediante puntos con información cromática. Es decir, la imagen o el frame es fragmentado en puntos consecutivos y analizado. Cada punto tendrá su información de posición y color y, al colocarlos todos en orden y por la ley de proximidad, el ojo los percibirá como imagen única. A mayor número de puntos, mayor resolución de imagen.

Básicamente es el mismo sistema que utiliza la impresión en puntos por pulgada o la fotografía dependiendo del grano del negativo. En el caso digital, toda esta información se alberga mediante un conjunto de ceros y unos que expresan la información de cada punto.

La resolución de imagen

Teniendo todos estos conceptos sobre la mesa, podemos definir la resolución de imagen digital como el número de píxeles que componen una imagen fija. En el caso de imagen en movimiento, será el número de píxeles que componen cualquier fotograma del video. Hasta ahora las resoluciones de vídeo son constantes en cada archivo de vídeo.

Pantalla de inicio de Prince of Persia

en tarjeta CGA (arriba), EGA (mitad) y VGA (debajo)

Pantalla de inicio del clásico videojuego Prince of PersiaPantalla de inicio del clásico videojuego Prince of PersiaPantalla de inicio del clásico videojuego Prince of Persia

Esta resolución de imagen se expresa con dos números. El primero indica la resolución horizontal, el número de píxeles que hay de un lateral al contrario de la imagen, y el segundo la resolución vertical, el número de pixeles que hay desde la parte superior a la inferior de la imagen. Generalmente, las resoluciones tienden a ser más anchas que altas (exceptuando el caso de teléfonos móviles, vídeos cuadrados en redes sociales y algún que otro ejemplo) por lo que es fácil distinguir cuál es la resolución horizontal y cuál la vertical.

Cuando se habla de la resolución de una cámara, esta alude al número de píxeles capaz de captar. Si la resolución de la cámara es de 1600×1200, la multiplicación de ambos parámetros nos muestra que la cámara registra fotografías con 1920000 píxeles, que vendría expresado como 1’92 megapíxeles.

De lo analógico a lo digital

Con el avance tecnológico, los formatos de televisión analógica han tenido que ser adaptados a digital. Por ello, las resoluciones de los formatos SD (Standard Definition) se transformaron a medidas específicas. Ofrecer menor calidad o mayor que la que ofrecía la información electromagnética no era coherente. Se optó por adaptar el número de líneas de barrido de la señal a la cantidad de píxeles verticales.

Asumiendo que la proporción del cuadro televisivo es de 4/3 (horizontal/vertical), hallar el número de píxeles horizontales de una señal en PAL se resumía en lo que viene siendo “la cuenta de la vieja”:

\dfrac{4}{3} = \dfrac{X}{576}

Despejando la X, la resolución de una imagen en PAL resulta ser de 768×576.

En el caso de la señal NTSC, la resolución de imagen sería de 640×480. Claro que esta diferencia de tamaños no parecía agradar a los fabricantes que decidieron establecer un único estándar horizontal para ambas señales. De esta manera, los futuros televisores tendrían la misma cantidad de píxeles por línea y podrían reproducir ambas señales.

Se estableció que la resolución PAL y SECAM sería de 720×576 y la resolución NTSC de 720×480. Ahora, al menos, el ancho coincidía. Pero ¿no se perdía información en los laterales del PAL y faltaba información en el NTSC? Sin duda. Pero todo tiene solución y por ello, se estableció que los píxeles del sistema PAL fuesen ensanchados en proporción 1,06 y los del sistema NTSC fuesen encogidos horizontalmente en proporción 0,888. Ambos resultados de proporción provienen de dividir la anchura inicial entre 720 de la anchura final.

Estas resoluciones son las que utilizan, por ejemplo, los DVD.

Nomenclatura

Es por ello que debemos tener en cuenta distintos parámetros a la hora de distinguir una resolución de otra. Por un lado, la proporción de tamaño de los píxeles (1:1, 1:1,06, 1,0,88). Por otro, el vídeo entrelazado se representa con una i (por ejemplo: 720i) y el vídeo progresivo con una p (por ejemplo: 720p). Ambos formatos utilizados como ejemplo (720p y 720i) no se refieren al ancho de la pantalla, como cabría esperar según el estándar 720 que igualó la proporción horizontal de PAL y NTSC.

La carrera de las resoluciones

Como hemos visto en los ejemplos anteriores, en muchas ocasiones la proporción vertical de pixeles se omite. Se entiende que puede ser calculada según la proporción del fotograma, que tiende a establecerse como 16/9. Por ello, una resolución de imagen de 720p significará que su vertical es de 720 píxeles (y no su horizontal como en los formatos SD) y su horizontal de 1280 px (16:9×720).

Con la llegada del HD (High Definition) aparecieron nuevos estándares. Podemos encontrar tres tipos de resoluciones en esta señal. 720p (cuya resolución es 1280×720 en imagen progresiva), 1080i (1920×1080 en señal entrelazada) y 1080p, también llamada FullHD (1920×1080 en señal progresiva).

Ultra HD

Evidentemente, la carrera por mayor resolución de imagen no termina aquí. Resoluciones 4K y 8K son las reinas del mercado actual. Esta nomenclatura viene dada por el cine que utilizó resoluciones basadas en bytes de información para digitalizar sus negativos. Debido a que todos los fotogramas tenían un ancho fijo, pero su altura variaba en función del formato de cada película, tuvieron que establecer su clasificación según la horizontal. De esta manera se produjo una nueva diversificación con respecto a la televisión, que clasificaba los formatos en función de la vertical.

Para comprender el origen de la K tenemos que hablar de bytes. Un Kilobyte contiene 1024 bytes. Si hablásemos de resolución 1K asumiríamos que la horizontal de la imagen tiene una capacidad de 1024 bytes repartidos en 1024 píxeles. La vertical variará en función de la proporción de la imagen y de sus píxeles. Cuando hablamos de resolución 2K asumiríamos que la horizontal es de 2×1024, es decir, 2048 píxeles.

Cuando nos referimos a 4K, deberíamos hablar de 4096 píxeles de base, pero realmente, en televisión, esto no es así. Para adaptarse al estándar 1080 que se impuso con el HD, la proporción se fue multiplicando. Por ello, la resolución 4K tiene una altura de 1080×2, es decir, 2160 píxeles. Y, siendo la proporción 16/9, el ancho del frame es de 3840 píxeles, lo que no llega a coincidir con los 4096 que sería el estándar 4K cinematográfico. Aún así, a estas televisiones se las denomina UltraHD o 4K.

La resolución 6K tiene un tamaño de 6144×3160. Respecto al 8K, se multiplica por dos la resolución 4K. Así, el fotograma tendrá una resolución de imagen de 7680×4320 (4320p).

Por ahora, los nuevos televisores 10K, varían la proporción horizontal de resolución. Mantienen la resolución vertical proporcionando mejor definición en píxeles horizontales y un formato más panorámico.

Podríamos seguir analizando distintas resoluciones, pero la variedad de formatos actual llevaría un excesivo desarrollo. Habrá que seguir la actualidad tecnológica para entender futuros parámetros técnicos de resolución, averiguar sus proporciones y el contenido de información que albergan.

FormatoHorizontalVerticalMuestreo
VGA640480progresivo
NTSC720480entrelazado
NTSC real640480entrelazado
PAL/SECAM720576entrelazado
PAL real768576entrelazado
SVGA800600progresivo
HDV 720p1280720progresivo
HDV 1080i19201080entrelazado
Full HD19201080progresivo
2K20481080progresivo
UHD 4K38402160progresivo
UHD 8K76804320progresivo

Aplicación narrativa

Actualmente, los formatos son menos rígidos. Podemos encontrar vídeos de 1200×1200 para Facebook o Instagram o formatos verticales para teléfonos específicos. Conocer estos parámetros es necesario a la hora de abordar un proyecto audiovisual. Crear el contenido sin tener claro el formato final al que va dirigido puede traer muchos problemas. Saber el reproductor final de nuestro producto ayuda a la hora de planificar su narración, elegir los formatos adecuados de grabación y de postproducción.

Sobre el autor:

En esunvideo.com hablamos sobre la edición de video profesional. Repasamos las últimas noticias sobre sistemas de edición, cámaras de vídeo, formatos de grabación, festivales, tendencias artísticas, etcétera. Vive el mundo audiovisual con esunvideo.com