Introducción al Almacenamiento de Video
El video digital esta compuesto por muchas "frames", o imágenes (tambien fotogramas), de
video, con cada imagen siendo básicamente una fotografía, todos
mostradas en un rápida sucesión para crear la impresión de movimiento.
Además, usualmente hay una o más pistas de audio sincronizadas con el
video, y posiblemente también subtítulos del audio. Hay un
sinnúmero de maneras de formatear, almacenar, y transmitir video. En
esta unidad vamos a concentrarnos en los distintos aspectos y
componentes del video y algunas de los elementos básicos sobre cómo
trabaja un video.
Relación de Aspecto y Resolución
El video típicamente viene en uno de dos relaciones de aspecto: 4:3
(igual que fotografías típicas) 16:9 (o 17:9). 4:3 era un estándar
común para televisión, pero ha sido reemplazado por la televisión de
alta calidad (HD TV) que usa la relación de aspecto de 16:9. esta
relación más ancha se considera por lo generar una mejor para ser
observada por humanos. La razón para esto es que nuestros ojos están
ubicados hacia los lados de nuestra cabeza, y por tanto tenemos un
campo de vista más ancho hacia los lados que de arriba hacia abajo. La
relación de aspecto de 16:9 trabaja mejor para llenar ese campo de
vista natural.
Las siguientes son algunas de las resoluciones comunes usadas para
video, y algunos de los nombres asociados con ellas:
Formatos 16:9 - HD TV y Internet Video
1920x1080 - 1080p, 1080i, hd1080
1280x720 - 720p, hd720
1024x576 - 576p, WSVGA
854:480 - 480p, hd480
640:360 - 360p
463:240 - 240p
Formatos 4:3 - TV antiguo y Internet Video
768:576 - 576i, PAL
640:480 - VGA, 480i, NTSC
320:240 - QVGA
Formatos 17:9 - específicamente para películas en teatros de cine y
para edición de filmes
4096x2160 - 4k
2048x1080 - 2k
http://en.wikipedia.org/wiki/Aspect_ratio_(image)
http://es.wikipedia.org/wiki/Relación_de_aspecto
Entrelazamiento (Interlacing)
Puedes notar que muchas de las representaciones numéricas para los
formatos tienen una "p" o una "i" luego del número de línes de
resolución. Esto indica si el video es un scan progresivo o un scan
entrelazado ("i"nterlaced). Televisores antiguos y análogos usan
videos entrelazados para reducir a la mitad la cantidad de información
que necesitan enviar. el entrelazamiento trabaja alternando cúales
líneas se transmiten de cada imagen. En una imagen todas las líneas
impares se transmiten, y luego en la imagen inmediatamente siguiente
todas las líneas pares se transmiten. Si este entrelazamiento de
imágenes ocurre lo suficientemente rápido, puede lograr engañar el ojo
humano y hacerlo creer que está viendo imágenes enteras. Con una sola
excepción (1080i), todos los formatos de video modernos usan un scan
progresivo. El formato 1080i solo se usó como un truco de mercadeo de
la industria de televisión para hacer que la gente creyera que estaban
viendo video de calidad 1080 en sus televisores sin que las compañías
tuvieran que procesar video 1080p en su totalidad. En realidad, video
de calidad 720p se ve tan bien, si no mejor que el video 1080i,
especialmente para escenas de acción de mucho movimiento. Al crear
videos, el entrelazamiento se debe usar solamente si la intención es
usar el video en transmisiones de televisión análoga. Videos digitales
siempre deben usar scan progresivos, lo que también permite una
compresión más sencilla.
http://en.wikipedia.org/wiki/Interlaced_video
http://es.wikipedia.org/wiki/Exploración_entrelazada
Velocidades de Imagen (Frame Rates)
El número de imágenes mostradas por segundo, también llamado Velocidad
de Imagen (Frame Rate), es otra variable en la creación de video.
Típicamente en este curso vamos a estar usando 30fps (30 Frames per
Second, o Imágenes por Segundo), a menos que el material original sea
algo diferente.
Mientras mayor el frame rate, mejor se verá el video. Para un ejemplo
un poco exagerado de la diferencia entre dos frame rates, mira estas
dos versiones del mismo clip a 30fps
y luego a 5fps.
Los siguientes son frame rates en uso común, los números representan
fps (imágenes por segundo):
23.976 - película NTSC (24/1.001)
24 - Típico para películas
25 - Televisión/película PAL
29.97 - Televisión NTSC (30/1.001)
30 - Video Digital
48 - Película de Alta Velocidad
60 - Video Digital
http://en.wikipedia.org/wiki/Frame_rate
http://es.wikipedia.org/wiki/Imágenes_por_segundo
Formatos de Pixel
Hay muchos formatos diferentes usados para almacenar los pixeles de
un video (lo que también se le puede llamar el espacio de color de un
video). Esto puede ser muy complicado y no vamos a profundizar mucho en
los detalles sino más bien el siguiente es un resumen. Cuando
trabajamos en la unidad de fotos, asumimos que toda imagen estaba
representada en términos de valores RGB (8 bits cada uno, para un total
de 24 bits). ese formato es común también en video; sin embargo, hay
muchos otros más. Muchos de ellos se definen en términos de YUV: este
término define un canal de luminosidad (brillo y oscuridad) y dos
canales chroma (color). Esto más o menos puede reproducir todos los
colores del RGB de 24 bits. Sin embargo, cuando el ojo humano ve una
imagen, la parte de la imagen que recibe mayor atención es la claridad
y oscuridad (luminosidad) de la imagen. Aunque el color es importante,
no se requiere una gran cantidad de color para que la imagen se vea
completamente coloreada. Ya que la información sobre el color no es tan
importante para nuestros ojos, algunos de estos formatos adicionales
remueven porciones de los datos de color para ahorrar espacio. Formatos
comunes que podrás encontrar son
YUV4:2:2 (16 bits), YUV4:1:1 (12 bits), y YUV4:2:0 (12 bits).
No te preocupes sobre el significado de estos números; simplemente
recuerda que estos formatos existen y son usados comúnmente.
http://en.wikipedia.org/wiki/YUV
http://es.wikipedia.org/wiki/YUV