Introducción al Almacenamiento de Video

El video digital esta compuesto por muchas "frames", o imágenes (tambien fotogramas), de video, con cada imagen siendo básicamente una fotografía, todos mostradas en un rápida sucesión para crear la impresión de movimiento. Además, usualmente hay una o más pistas de audio sincronizadas con el video, y posiblemente también subtítulos del audio.   Hay un sinnúmero de maneras de formatear, almacenar, y transmitir video. En esta unidad vamos a concentrarnos en los distintos aspectos y componentes del video y algunas de los elementos básicos sobre cómo trabaja un video.

Relación de Aspecto y Resolución

El video típicamente viene en uno de dos relaciones de aspecto: 4:3 (igual que fotografías típicas)  16:9 (o 17:9).  4:3 era un estándar común para televisión, pero ha sido reemplazado por la televisión de alta calidad (HD TV) que usa la relación de aspecto de 16:9. esta relación más ancha se considera por lo generar una mejor para ser observada por humanos. La razón para esto es que nuestros ojos están ubicados hacia los lados de nuestra cabeza, y por tanto tenemos un campo de vista más ancho hacia los lados que de arriba hacia abajo. La relación de aspecto de 16:9 trabaja mejor para llenar ese campo de vista natural.

Las siguientes son algunas de las resoluciones comunes usadas para video, y algunos de los nombres asociados con ellas:

Formatos 16:9 - HD TV y Internet Video
1920x1080 - 1080p, 1080i, hd1080
1280x720 - 720p, hd720
1024x576 - 576p, WSVGA
854:480 - 480p, hd480
640:360 - 360p
463:240 - 240p

Formatos 4:3 - TV antiguo y Internet Video
768:576 - 576i, PAL
640:480 - VGA, 480i, NTSC
320:240 - QVGA

Formatos 17:9 - específicamente para películas en teatros de cine y para edición de filmes
4096x2160 - 4k
2048x1080 - 2k

http://en.wikipedia.org/wiki/Aspect_ratio_(image)
http://es.wikipedia.org/wiki/Relación_de_aspecto

Entrelazamiento (Interlacing)

Puedes notar que muchas de las representaciones numéricas para los formatos tienen una "p" o una "i" luego del número de línes de resolución. Esto indica si el video es un scan progresivo o un scan entrelazado ("i"nterlaced). Televisores antiguos y análogos usan videos entrelazados para reducir a la mitad la cantidad de información que necesitan enviar. el entrelazamiento trabaja alternando cúales líneas se transmiten de cada imagen. En una imagen todas las líneas impares se transmiten, y luego en la imagen inmediatamente siguiente todas las líneas pares se transmiten. Si este entrelazamiento de imágenes ocurre lo suficientemente rápido, puede lograr engañar el ojo humano y hacerlo creer que está viendo imágenes enteras. Con una sola excepción (1080i), todos los formatos de video modernos usan un scan progresivo. El formato 1080i solo se usó como un truco de mercadeo de la industria de televisión para hacer que la gente creyera que estaban viendo video de calidad 1080 en sus televisores sin que las compañías tuvieran que procesar video 1080p en su totalidad. En realidad, video de calidad 720p se ve tan bien, si no mejor que el video 1080i, especialmente para escenas de acción de mucho movimiento. Al crear videos, el entrelazamiento se debe usar solamente si la intención es usar el video en transmisiones de televisión análoga. Videos digitales siempre deben usar scan progresivos, lo que también permite una compresión más sencilla.

http://en.wikipedia.org/wiki/Interlaced_video
http://es.wikipedia.org/wiki/Exploración_entrelazada

Velocidades de Imagen (Frame Rates)

El número de imágenes mostradas por segundo, también llamado Velocidad de Imagen (Frame Rate), es otra variable en la creación de video. Típicamente en este curso vamos a estar usando 30fps (30 Frames per Second, o Imágenes por Segundo), a menos que el material original sea algo diferente.

Mientras mayor el frame rate, mejor se verá el video. Para un ejemplo un poco exagerado de la diferencia entre dos frame rates, mira estas dos versiones del mismo clip a 30fps y luego a 5fps.

Los siguientes son frame rates en uso común, los números representan fps (imágenes por segundo):
23.976 - película NTSC (24/1.001)
24 - Típico para películas
25 - Televisión/película PAL
29.97 - Televisión NTSC (30/1.001)
30 - Video Digital
48 - Película de Alta Velocidad
60 - Video Digital

http://en.wikipedia.org/wiki/Frame_rate
http://es.wikipedia.org/wiki/Imágenes_por_segundo

Formatos de Pixel

Hay muchos formatos diferentes usados para almacenar los pixeles de un video (lo que también se le puede llamar el espacio de color de un video). Esto puede ser muy complicado y no vamos a profundizar mucho en los detalles sino más bien el siguiente es un resumen. Cuando trabajamos en la unidad de fotos, asumimos que toda imagen estaba representada en términos de valores RGB (8 bits cada uno, para un total de 24 bits). ese formato es común también en video; sin embargo, hay muchos otros más. Muchos de ellos se definen en términos de YUV: este término define un canal de luminosidad (brillo y oscuridad) y dos canales chroma (color). Esto más o menos puede reproducir todos los colores del RGB de 24 bits. Sin embargo, cuando el ojo humano ve una imagen, la parte de la imagen que recibe mayor atención es la claridad y oscuridad (luminosidad) de la imagen. Aunque el color es importante, no se requiere una gran cantidad de color para que la imagen se vea completamente coloreada. Ya que la información sobre el color no es tan importante para nuestros ojos, algunos de estos formatos adicionales remueven porciones de los datos de color para ahorrar espacio. Formatos comunes que podrás encontrar son YUV4:2:2 (16 bits), YUV4:1:1 (12 bits), y YUV4:2:0 (12 bits).  No te preocupes sobre el significado de estos números; simplemente recuerda que estos formatos existen y son usados comúnmente.

http://en.wikipedia.org/wiki/YUV
http://es.wikipedia.org/wiki/YUV