Tema 1 – Representación y comunicación de la información

Introducción

Es posible hablar de infinidad de cosas dentro de este capitulo, sin embargo al ser el primero del temario y al existir otros más específicos sobre las redes de comunicaciones y la representación interna de datos, parece preciso enfocarlo hacia la presentación de técnicas para representar (entendiendo la palabra en el sentido amplio) y comunicar (en el sentido de ofrecer al usuario) información

1.1. Información

· Sólo aparece cuando se produce un proceso de comunicación.

· Los datos guardados en sistemas de almacenamiento no incorporan información hasta que no son transferidos a un receptor adecuado.

· La información depende del estado del receptor.

1.2. Estructura de un sistema elemental de información

· Transmisor (fuente): Genera el mensaje.

· Receptor: Recibe el mensaje y lo interpreta según su nivel de información anterior

· Medio o canal: vía de transmisión

· Mensaje: Se divide en Información + Ruido

En el estado optimo, todos los mensajes generables por el transmisor pueden circular por el canal y son entendibles por el receptor.

1.3. Alfabeto y Código

· Alfabeto Origen: Conjunto de signos de la fuente

· Alfabeto Imagen: Agrupaciones de símbolos como 0 y 1 (palabras de código) utilizados para representar el alfabeto origen.

· Código: Relación normalizada entre el conjunto de origen de los datos a representar y el conjunto imagen de las palabras de código utilizadas para su representación. P.e. ASCII.

2. Teoría Matemática de la Información

2.1. Reserva elemental de un código

Si un emisor puede transmitir “m” signos distintos, debe utilizar un código de transmisión con al menos “m” palabras de código.

n: nº de valores distintos (1, 0)

e: nº de símbolos de las palabras o agrupaciones de símbolos

clip_image002

clip_image004

2.2. Códigos con caracteres equiprobables

La aparición de cualquiera de sus caracteres es equiprobable y las palabras del código tienen todas igual longitud.

· clip_image006Poder de Decisión: Longitud en unidades de información. Número de decisiones que hay que tomar para identificar un elemento del conjunto origen. Número de bits.

· Rendimiento y Redundancia en la Codificación (exceso de poder de decisión del alfabeto fuente sobre la necesaria para representar el alfabeto fuente.

clip_image009
clip_image010

2.3. Códigos con caracteres NO equiprobables

La probabilidad de que aparezcan distintos elementos del conjunto origen es diferente.

Las palabras suelen codificarse con distinto número de símbolos.

· clip_image012Contenido de Información: Es una magnitud que da idea del nº de bits necesarios para la codificación de un valor con el fin de minimizar las decisiones binarias a tomar por el receptor para su identificación.

· clip_image014Entropia: Contenido medio de información si el simbolo “f”i ocurre con una probabilidad “Pi” para un código con “m” signos fuente.

· Rendimiento y Redundancia en la Codificación

clip_image017
clip_image018
clip_image019

3. Codificación de la Información

3.1. Introducción al Concepto de Código y Clasificación

· Pueden e existir hasta tres formas de representación de la información: la de la fuente, la del canal, y la del receptor.

· Código: conjunto de condiciones y convenios que permiten trasformar la información de una representación concreta a otra.

Se compone de:

– Un conjunto de reglas y convenios de transformación del alfabeto fuente.

– Un alfabeto nuevo que sustituirá al fuente.

Características deseables:

– Inequívoco – Completo

– Eficaz – Resistente al ruido

· Clasificación:

– Códigos de longitud fija o variable

– Códigos con detectores y correctores de errores

– Códigos sistemáticos y no sistemáticos: Algoritmos reversibles vs. Tabla de correspondencia.

3.2. Códigos de Longitud Variable

3.2.1. Problemática: Es preciso habilitar un procedimiento que permita separar una palabra de otra

3.2.2. Propiedades necesarias

· Código Bloque: Asignar a cada uno de los simbolos del alfabeto fuetne F a una secuencia fija de simbolos del alfabeto código C.

· No Singular: Todas las palabras código Ci deben ser distintas.

· Unívocamente Descodificable: A cualquier secuencia de longitud finita de signos fuente le corresponde una secuencia de palabras código única e irrepetible con otra secuencia de signos.

· Código Instantáneo: Es posible descodificar las palabras de una secuencia sin conocer los símbolos que le suceden.

3.2.3. Construcción mediante el Árbol de Fano

· Se utiliza una estructura arborescente como ayuda para la creación del código.

· Cuanto más cortas son las primeras palabras más largas habrán de ser las últimas.

Signo fuente

Palabra código

A

0

B

10

C

110

d

1110

3.2.4. Condición de código instantáneo. Inecuación de KRAFT.

· Condición necesaria y suficiente para que se pueda construir un código instantáneo con palabras de longitud l1, l2, etc.

n: nº de símbolos diferentes del alfabeto código

m: cardinal del alfabeto fuente

clip_image021

3.2.5. Códigos de HUFFMAN

· En canales sin ruido, la eficacia total se consigue con redundancia cero=código óptimo. Para una fuente dada no siempre es posible, pero habrá al menos un código cuya L sea mínima

Fuente Original

Signo

Probabilidad

A

1/2

B

1/4

C

1/8

D

1/8

4. Codificación en Presencia de Ruido

4.1. El Ruido y sus Efectos

· Elemento degradante del proceso de comunicación que produce errores en la información

clip_image023clip_image025

4.2. Estrategias de Codificación para la Protección

· Surge la necesidad de detectar los errores y/o corregirlos.

· En la mayoría de los sistemas, la protección pasa por la redundancia.

· A los bits necesarios para codificar la fuente se añaden varios bits de control.

· Equilibrio entre la capacidad de detección/corrección, velocidad, complejidad y coste.

4.3. Distancia de Hamming

· Nº de caracteres en que difieren dos palabras.

· Cuanto mayor sea más difíciles de confundir por efecto del ruido.

· La eficacia de un código en detección/corrección depende de la DH mínima

clip_image027clip_image029

4.4. Comprobación de paridad

4.4.1. Lineal de un bit

· Supone la adición de 1 bit cuyo valor depende de los otros (redundancia).

· Incapaz de detectar un nº par de errores, ni la posición del mismo

· Paridad Par/Impar: nº Par/Impar de bits a 1.

4.4.2. Por bloques o Bidimensional

· Consiste en encolumnar en forma matricial un determinado número de caracteres completando cada línea y cada columna con bits de paridad

· Tiene una distancia mínima de 3 por lo que puede detectar y corregir un error y detectar errores más complejos.

4.5. Códigos Cíclicos

· Incorporan como bits de control el resultado de un cálculo basado en la operación módulo.

· La eficiencia depende del polinomio generador G(x)

· Ej: CRC-12, CRC-16, CRC32

4.6. Códigos de HAMMING

· Codigos de control de paridad en el que los dígitos de paridad se intercalan en la palabra de manera que pueden identificar los posibles bits erroneos y su opsición.

· Distancia mínima de 3

5. Tratamiento Automático de la Información

5.1. Definición y Funciones Básicas

· Tratamiento automático de la información: Conjunto de procedimientos automatizados de recogida, elaboración, evaluación, almacenamiento, recuperación, condensación y distribución de informaciones dentro de una organización.

· Funciones Básicas:

– Entrada de datos

– Almacenamiento de datos

– Cálculo

– Presentación de la información

– Comunicaciones

5.2. Sistema Informático

· Según la ISO: “Aquel compuesto por equipos físicos, lógicos, y de personal que realiza funciones de entrada, proceso, almacenamiento, salida y control con el fin de llevar a cabo una secuencia de operaciones con datos”

· Compuesto por los Subsistemas Físico y Lógico.

5.3. Tendencias actuales en el TAI

· Sistemas Abiertos: Especificaciones establecidas por organismos de normalización o con un alto grado de aceptabilidad. Disponibles sin coste, no son propiedad de ningún único suministrador.

– Permiten interoperatividad, portabilidad y escalabilidad.

– Ventajas para el usuario: libertad de elección, protección de la inversión, mejor relación precio-rendimiento y garantía de comunicación y interoperatibilidad.

· Informática Distribuida cliente/servidor: Sistemas operativos de red con transparencia de ubicación, espacio de nombres, de comunicaciones, etc. Bases de datos distribuidas con información en ubicaciones diferentes, transparentes para el usuario de ubicación y forma de acceso. Seguridad e integridad.

· Tratamiento de la Información Orientado a Objetos: Generación de componentes reutilizables. BBDD O.O., Gestión distribuida de objetos: COM+, CORBA, etc.

q Representación de textos, sonidos, imágenes y valores numéricos.

q Un computador es una máquina que procesa, memoriza y transmite información

q La información se representa en el interior de la máquina de acuerdo con un código binario {0,1}

q Las operaciones aritméticas se efectúan en el sistema de numeración en base 2 (binar.)

q También se utilizan sistemas de numeración octal y hexadecimal para obtener códigos intermedios, ya que pueden transformarse directa y fácilmente a binario y viceversa.

q Un sistema de numeración en base b utiliza para representar los números un alfabeto A compuesto por b símbolos o cifras, todo número se expresa por un conjunto de cifras, contribuyendo cada una de ellas con un valor que depende de la cifra en sí y la posición que ocupe dentro del número.

q Sistema Binario: b=2, A={0,1}

q Representación en complementos:

o Para representar un número negativo se puede utilizar el complemento de ese número a la base o a la base menos uno del sistema de numeración utilizado.

o Este sistema de representación es de sumo interés en el caso de los computadores ya que al utilizarlo se reduce la complejidad de los circuitos de la ALU, al no ser necesarios circuitos específicos para estar, porque las sumas y restas quedan reducidas a sumas independientemente de los signos de los operandos.

o Complemento a 1: Basta con cambiar los unos por ceros y viceversa. Para restar 2 números binarios hay que sumar al minuendo el complemento a uno del sustraendo y la cifra que se arrastra del resultado.

o Complemento a 2: Basta con cambiar los unos por ceros y los ceros por unos y sumar 1 al resultado anterior. Para restar 2 números hay que sumar al minuendo el C2 del substraendo, descartando la cifra que se arrastra del resultado.

q Representación de textos:

o Se suelen introducir Caracteres alfabéticos, numéricos, especiales, gráficos y de control.

o Código DBCDIC (Extended Binary Coded Decimal Interchange Code): Utiliza n=8 bits para representar cada carácter. M=2^8=256 símbolos distintos

o Código ASCII (American Standard Code for Information Interchange): Utiliza 7 bits + un octavo de paridad. Existen ampliaciones orientadas a distintas áreas geográficas con caracteres especiales (p.e. ISO 8859-1 Latín 1).

o Inconvenientes de los anteriores:

§ Símbolos insuficientes para caracteres especiales.

§ Símbolos y códigos de 8 bits no estandarizados.

§ Basados en caracteres latinos, sin tener en cuenta otras culturas como las orientales.

o Código UNICODE: propuesto por un consorcio de empresas y entidades que trata de hacer posible escribir aplicaciones que sean capaces de procesar texto de muy diversas culturas.

§ Propiedades: Universalidad, Unicidad y Uniformidad

§ 16 bits = 65356 símbolos

q Representación de sonidos:

o Señal analógica que puede tomar cualquier valor dentro de un determinado intervalo continuo

o Por medio de un conversor D/A se muestrea y digitaliza, y se guardan los valores de dichas muestras.

o Parámetros: Frecuencia de muestreo y número de bits por muestra

q Representación de imágenes: Se adquieren mediante periféricos o se generan. Formas básicas de representación: Mapa de bits. Mapa de vectores

q Representación de datos numéricos:

o Datos de tipo entero: Enteros sin signo o con signo (signo y magnitud, complemento a uno o a dos). Si n=32 en C2, N max = 2^31

o Datos de tipo Real: N=M*BE

§ M:Mantisa B:Base E:Exponente

o Se guarda el signo, la Mantisa y el Exponente. La base suele establecerse a 2.

Publicado: marzo 24, 2019 por Laura Gonzalez

Etiquetas: tema 1 informatica