23
Regional Distrito Capital Sistema de Gestión de la Calidad GUIA DE APRENDIZAJE INTRODUCCIÓN A LAS BASES DE DATOS

Guia 1 BD - Introduccion BD - Aprendiz

Embed Size (px)

Citation preview

Page 1: Guia 1 BD - Introduccion BD - Aprendiz

Regional Distrito Capital Sistema de Gestión de la Calidad

GUIA DE APRENDIZAJEINTRODUCCIÓN A LAS BASES DE DATOS

Page 2: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 2 de 17

Control del Documento

Nombre Cargo Dependencia Firma Fecha

AutoresSandra Yanneth Rueda Guevara Instructor

Regional Distrito Capital

Febrero de 2011

Asesoría Pedagógica

Elizabeth ZuñigaFormadores Docentes

Regional Distrito Capital

RevisiónAprobación

Page 3: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 3 de 17

1. IDENTIFICACIÓN DE LA GUÍA DE APRENDIZAJE

PROGRAMA DE FORMACION: ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN - ADSI

PROYECTO ASOCIADO:

MODALIDAD DE FORMACION: Presencial

ACTIVIDAD DEL PROYECTO: Realizar el análisis de Base de Datos ( 1 Trimestre)

RESULTADOS DE APRENDIZAJE:

220501032 04 Valorar la incidencia de los datos en los procesos del macrosistema, tomando como referente el diccionario de datos y las miniespecificaciones, para la consolidación de los datos que intervienen, de acuerdo con parámetros establecidos.

TAREA DE APRENDIZAJE Y DURACION

• Narrar la evolución de las bases de datos y de los medios de almacenamiento.

• Conceptualizar la terminología de Base de Datos.

Duración de la guía de Aprendizaje: 4 horas

2. CARACTERIZACIÓN DE LA ACTIVIDAD DE APRENDIZAJE

2.1 Introducción

Las bases de datos se ingeniaron para dar solución de almacenamiento, al ingente volumen de información generado en las grandes empresas; era necesario que el registro de los datos se hiciera de forma rápida, sencilla y fiable; además que a su vez, pudieran acceder a ellos en cualquier momento sin la necesidad de trasladarse a las salas dedicadas a archivo documental.

Con el inicio de los programas informáticos, se logró almacenar datos en los archivos de los mismos, lo cual era más cómodo pero, aun así, tenían grandes dificultades para modificar registros, estructuras o simplemente buscar información.

Inicialmente vamos a conocer la evolución en el manejo de la información, incluyendo el grado de influencia de los medios de almacenamiento; además, estableceremos el vocabulario pertinente a bases de datos.

Page 4: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 4 de 17

2.2 Tarea de Aprendizaje

1. Consulte y conceptualice los siguientes términos para bases de datos:Base de datos, Base de datos Relacional, Dato, Tupla, Atributo, Registro, Tabla, Archivo, Dominio, clave, Llave primaria, Llave Foránea, Cardinalidad, Relación, Usuario, SGBD, SQL, escalabilidad, flexibilidad, portabilidad, conexión, persistencia, GUI, accesibilidad.

Haga un documento tipo diccionario y agregue 8 términos diferentes a los relacionados, selecciónelos por la dificultad de comprensión, que para usted represente, sus definiciones.

Base de datos:

2. Dibuje una tabla en la que señale: dato, tupla, atributo, registro; identifique sinónimos para estos conceptos. Por ejemplo sinónimo de Tupla es: fila.

3. Elabore una tabla con las ventajas y los inconvenientes de un SGBD.

4. Relacione 4 SGBD gratuitos y 4 licenciados, que se estén utilizando actualmente, incluya sus características e identifique si son libres.

5. Indique, haciendo investigación, a que se refiere el término “Arquitectura” en el contexto de Base de Datos.

6. Defina qué es un bit, un byte, un caracter.

7. Investigue y presente la historia de los sistemas de codificación de caracteres. (ASCII, Unicode, UTF-8, etc). Qué son los caracteres no imprimibles?

8. Construya la línea de tiempo de los medios de almacenamiento y la línea de tiempo de la generación de las bases de datos sistematizadas.

DE CONOCIMIENTO:

• Respuesta a preguntas sobre los cambios que ha tenido la forma en la que se almacenan datos.• Respuesta a preguntas sobre qué es una base de datos, dato, tabla, campo, registro.

DE PRODUCTO:

• Documento con el desarrollo de las actividades planeadas en la Guía 1 BD

2.3 Proceso de Aprendizaje

2.4 Ambientes de Aprendizaje

La actividad se debe desarrollar en un aula dispuesta con equipos de cómputo y acceso a Internet.

2.5 Evaluación del aprendizaje

Page 5: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 5 de 17

Para valorar el alcance del resultado de aprendizaje, se tendrá en cuenta:

La participación oportuna del aprendiz en el desarrollo de la actividad. Que el aprendiz optimice los recursos del aula en el desarrollo de las actividades propuestas y

este acorde con las normas institucionales. Que la respuesta a preguntas formuladas sobre el tema, durante el desarrollo de las

actividades propuestas, esté acorde con la lectura y el aprendiz aporte con información adicional, si es el caso.

2.6 Conclusiones

Se espera conseguir a través de la realización de esta actividad, las competencias necesarias para expresar con propiedad, conceptos sobre la evolución de las bases y los dispositivos de almacenamiento; además de la terminología propia para bases de datos.

2.7 Bibliografía

Tomado de: Bases de datos I. http://knocte.blogspot.com/2005/09/el-futuro-de-las-bases-de-datos.html http://www.monografias.com/trabajos11/basda/basda.shtml http://www.ati.es/novatica/2000/145/marpia-145.pdf http://www.ganimides.ucm.cl/aurrutia/doc_pdf/El%20Futuro%20de%20las

%20Bases%20de%20Datos.pdf. http://gigo.lacoctelera.net/post/2006/04/03/ascii-unicode-utf-8-y-

internacionalizacion http://v3.juque.cl/weblog//2006/01/25/ascii-unicode-utf8-y-la-iatarnaaianalizaaian-

parte-i.html

1. Investigación

Base de datos: Una base de datos son unas grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar fácilmente.

Base de datos Relacional: Una base de datos es el modelo más utilizado en la actualidad para implementar bases de datos ya planificadas relaciones entre los datos es guardar las tablas y relacionar los datos de ambas tablas y su nombre: modelo relacional.

Dato: Un dato es una representación simbólica y un atributo o característica de una entidad y describen hechos empíricos, sucesos y entidades.

Tupla: es una secuencia ordenada de objetos como una lista una tulpa también sirve para denominar no solo listas finitas que son capaces de ser descompuestos en un cierto número de componentes.

Atributo: Un Atributo es una una propiedad de un Objeto, elemento o archivo los atributos deben ser considerados más correctamente como metadatos. Un atributo es con frecuencia y en general una característica de una propiedad.

Page 6: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 6 de 17

Registro: Un registro representa un objeto único de datos implícitamente estructurados en una tabla. En términos simples, una tabla de una base de datos puede imaginarse formada de filas y columnas o campos. Cada fila de una tabla representa un conjunto de datos relacionados, y todas las filas de la misma tabla tienen la misma estructura.

Tabla en las bases de datos: se refiere al tipo de modelado de datos, donde se guardan los datos recogidos por un programa. Su estructura general se asemeja a la vista general de un programa de cálculo. Las tablas se componen de dos estructura.

Registro: es cada una de las filas en que se divide la tabla. Cada registro contiene datos de los mismos tipos que los demás registros. Ejemplo: en una tabla de nombres y direcciones, cada fila contendrá un nombre y una dirección.

Campo: es cada una de las columnas que forman la tabla. Contienen datos de tipo diferente a los de otros campos. En el ejemplo anterior, un campo contendrá un tipo de datos único, como una dirección, o un número de teléfono, un nombre, etc.

Archivo: es un conjunto de información binaria; es decir, un conjunto que va de 0 a 1. Este archivo puede almacenarse para mantener un registro de esta información. Un archivo de texto es un archivo que contiene caracteres almacenados en forma de octetos Este archivo se guarda en el disco duro con la forma: representa la extensión, la cual constituye una manera de reconocer el tipo de programa que se necesita para abrir el archivo.

Dominio: es una red de identificación asociada a un grupo de dispositivos o equipos conectados a la red Internet.

Clave: es una forma de autentificación que utiliza información secreta para controlar el acceso hacia algún recurso.

Llave primaria: se llama clave primaria a un campo o a una combinación de campos que identifica de forma única a cada fila de una tabla. Una clave primaria comprende de esta manera una columna o conjunto de columnas. No puede haber dos filas en una tabla que tengan la misma clave primaria.

Cardinalidad: es el número de tuplas que contiene ya que en las relaciones se van insertando y borrando tuplas a menudo, la cardinalidad de las mismas varían a menudo.

Usuario: Se denomina así a la persona que tiene derechos especiales en algún servicio de Internet por acreditarse en el mismo mediante un identificador y una clave de acceso, obtenidos con previo registro en el servicio, de manera gratuita o de pago. Normalmente, un usuario registrado tiene asignada una cuenta propia que mantiene información personalizada del usuario en el servidor, (como puede ser dirección de e-mail y espacio correspondiente).

SGBD: Los sistemas de gestión de bases de datos: son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.

Page 7: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 7 de 17

SQL: El lenguaje de consulta estructurado es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar diversos tipos de operaciones en estas. Una de sus características es el manejo del álgebra y el cálculo relacional permitiendo efectuar consultas con el fin de recuperar -de una forma sencilla- información de interés de una base de datos, así como también hacer cambios sobre ella.

Escalabilidad: la escalabilidad es la propiedad deseable de un sistema, una red o un proceso, que indica su habilidad para extender el margen de operaciones sin perder calidad, o bien manejar el crecimiento continuo de trabajo de manera fluida, o bien para estar preparado para hacerse más grande sin perder calidad en los servicios ofrecidos.

Conexión: Punto donde se realiza un enlace entre dispositivos o sistemas. También conexión hace referencia al enlace completo. Una conexión puede ser alambrada o inalámbrica, digital o analógica, virtual o real, etc. Por ejemplo, el acceso a internet es un tipo de conexión

Persistencia: Se llama “persistencia” de los objetos a su capacidad para guardarse y recuperarse desde un medio de almacenamiento. La persistencia en Base de Datos relacionales se suele implementar mediante el desarrollo de funcionalidad específica

Accesibilidad: accesibilidad es la cualidad de aquello que resulta accesible. El adjetivo accesible, por su parte, refiere a lo que es de comprensión o entendimiento sencillo. El concepto de accesibilidad, por lo tanto, se utiliza para nombrar al grado o nivel en el que cualquier ser humano, más allá de su condición física o de sus facultades cognitivas, puede usar una cosa, disfrutar de un servicio o hacer uso de una infraestructura.

2. SINONIMOS

PALABRAS SINONIMOSTUPLA REGISTROATRIBUTO CARACTERISTICA, CUALIDAD,

PROPIEDADREGISTRO FILA, TUPLADATO

3. VENTAJAS E INCONVENIENTES DE SGBDVENTAJAS INCONVENIENTESProveen facilidades para la anipulación de grandes volúmenes de datos ver objetivos). Entre éstas: Simplificanla programación de equipos de consistencia - Manejando las políticas de respaldo adecuadas, garantizan que los cambios de la base serán siempre consistentes sin importar si hay errores

- Típicamente, es necesario disponer de una o más personas que administren la base de datos, de la misma forma en que suele ser necesario en instalaciones de cierto porte disponer de una o más personas que administren los sistemas operativos. Esto puede. llegar a

Page 8: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 8 de 17

correctamente,etc. incrementar los costos de operación en una empresa. Sin embargo hay que balancear este aspecto con la calidad y confiabilidad del sistema que se btiene

4. SOFWARE SGBD GRATUITOS LICENCIADO

MySQLfor Windows 1.FileMaker (Versión de desarrollo)

PhpMyAdmin PostgreSQL SQLyog

ARQUITECTURA

La arquitectura a tres niveles del grupo ANSI, con su esquema conceptual, ha marcado una clara línea de investigación en el campo de las bases de datos. Aun cuando en trabajos y propuestas de normalización anteriores ya se había indicado la conveniencia de separar los tres niveles de estructuras, ninguno de estos estudios había tenido un impacto semejante al del esquema conceptual de ANSI. Consideramos, por tanto, de interés presentar dicha arquitectura.

Una de las primeras tareas del grupo de estudio consistió en buscar una terminología común e intentar desarrollar un vocabulario consistente y comprensible. Otro trabajo que se abordó desde las primeras etapas fue el análisis de los componentes

NIVELES DE ARQUITECTURA (Dato) La arquitectura se divide en tres niveles generales: interno,

conceptual y externo. Nivel Interno: es el más cercano al almacenamiento físico, es decir, el que

concierne a la manera como los datos se almacenan en realidad. Nivel Externo: es el más cercano a los usuarios, es decir, el que atañe a la

manera cómo cada usuario ve los datos. Nivel Conceptual: es un nivel de mediación entre los otros dos.

6. definicion

Bit : Se define un bit como la unidad de información más básica que se puede manejar en un ordenador pudiendo tomar uno de dos posibles estados: 1 ó 0. Dichos estados equivalen a activado o desactivado, abierto o cerrado, etc. dando lugar al sistema de numeración binario lo que facilita una mejor comprensión electrónica por parte de los transistores del

Page 9: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 9 de 17

ordenador. Es la unidad mas pequeña de información que utiliza un ordenador.

byte Un byte es la unidad fundamental de datos en los ordenadores personales, un byte son ocho bits contiguos. El byte es también la unidad de medida básica para memoria, almacenando el equivalente a un carácter.

Los términos Kilo (en Kilobyte, abreviado como K) y mega (en Megabyte, abreviado como M) se utilizan para contar bytes (aunque son engañosos, puesto que derivan de una base decimal de 10 números).

Carácter : Un carácter es un tipo de dato así como existen los datos numéricos 1,2,3,4..etclos strings que son datos parecidos a los caracteres, pero se diferencian porque son un conjunto de ellos como por ejemplo "hola","h","o","1","2"...etc. y los caracteres que son todos los símbolos posibles con los que puede contar un sting.

un carácter es una unidad de información que corresponde aproximadamente con una unidad o símbolo parecido, como los de un alfabeto  de la forma escrita de un lenguaje natural.

EJEMPLOS DE CARACTERES Letras minúsculas del alfabeto: { a, b, c, ..., x, y, z } Letras mayúsculas del alfabeto : { A, B, C, ..., X, Y, Z } Números (dígitos del Sistema Decimal): { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 } Caracteres especiales: { +, -, *, /, @, #, ñ, Ñ, á, é, ... Caracteres gráficos: { ♣, ♦, ♥, ♠, ... } Caracteres de control: { Salto de línea, Tabulador horizontal, ... }

LOS SISTEMAS DE CODIFICACIÓN DE ASCII

Binario Decimal Hex Abreviatura Repr AT Nombre/Significado

0000 0001 1 01 SOH ␁ ^AInicio de

Encabezado

0000 0010 2 02 STX ␂ ^B Inicio de Texto

0000 0011 3 03 ETX ␃ ^C Fin de Texto

0000 0100 4 04 EOT ␄ ^D Fin de Transmisión

0000 0101 5 05 ENQ ␅ ^E Consulta

0000 0110 6 06 ACK ␆ ^F Acuse de recibo

0000 0111 7 07 BEL ␇ ^G Timbre

Page 10: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 10 de 17

0000 1000 8 08 BS ␈ ^H Retroceso

0000 1001 9 09 HT ␉ ^I Tabulación horizontal

Binario Dec Hex Representación

0010 0000 32 20 espacio ( )

0010 0001 33 21 !

0010 0010 34 22 "

0010 0011 35 23 #

0010 0100 36 24 $

0010 0101 37 25 %

0010 0110 38 26 &

0010 0111 39 27 '

0010 1000 40 28 (

0010 1001 41 29 )

ASCII (acrónimo inglés de American Standard Code for Information Interchange — Código Estándar Estadounidense para el Intercambio de Información), pronunciado generalmente [áski] o [ásci] , es un código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comité Estadounidense de Estándares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estándares Nacionales, o ANSI) como una refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía. Más tarde, en 1967, se incluyeron las minúsculas, y se redefinieron algunos códigos de control para formar el código conocido como US-ASCII.

El código ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisión. A menudo se llama incorrectamente ASCII a otros códigos de caracteres de 8 bits, como el estándar ISO-8859-1 que es una extensión que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al inglés, como el español.

Page 11: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 11 de 17

Los caracteres de control ASCII

El código ASCII reserva los primeros 32 códigos (numerados del 0 al 31 en decimal) para caracteres de control: códigos no pensados originalmente para representar información imprimible, sino para controlar dispositivos (como impresoras) que usaban ASCII. Por ejemplo, el carácter 10 representa la función "nueva línea" (line feed), que hace que una impresora avance el papel, y el carácter 27 representa la tecla "escape" que a menudo se encuentra en la esquina superior izquierda de los teclados comunes.

El código 127 (los siete bits a uno), otro carácter especial, equivale a "suprimir" ("delete"). Aunque esta función se asemeja a otros caracteres de control, los diseñadores de ASCII idearon este código para poder "borrar" una sección de papel perforado (un medio de almacenamiento popular hasta la década de 1980) mediante la perforación de todos los agujeros posibles de una posición de carácter concreta, reemplazando cualquier información previa. Dado que el código 0 era ignorado, fue posible dejar huecos (regiones de agujeros) y más tarde hacer correcciones.

Caracteres imprimibles ASCII

El código del carácter espacio, designa al espacio entre palabras, y se produce normalmente por la barra espaciadora de un teclado. Los códigos del 33 al 126 se conocen como caracteres imprimibles, y representan letras, dígitos, signos de puntuación y varios símbolos.

El ASCII de siete bits proporciona siete caracteres "nacionales" y, si la combinación concreta de hardware y software lo permite, puede utilizar combinaciones de teclas para simular otros caracteres internacionales: en estos casos un backspace puede preceder a un acento abierto o grave (en los estándares británico y estadounidense, pero sólo en estos estándares, se llama también "opening single quotation mark"), una tilde o una "marca de respiración".

Rasgos estructurales Los dígitos del 0 al 9 se representan con sus valores prefijados con el valor

0011 en binario (esto significa que la conversión BCD-ASCII es una simple cuestión de tomar cada unidad bcd y prefijarla con 0011).

Las cadenas de bits de las letras minúsculas y mayúsculas sólo difieren en un bit, simplificando de esta forma la conversión de uno a otro grupo.

Otros nombres para ASCII

La RFC 1345 (publicada en junio de 1992) y el registro IANA de códigos de caracteres, reconocen los siguientes nombres alternativos para ASCII para su uso en Internet.

Page 12: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 12 de 17

ANSI_X3.4-1968 (nombre canónico) ANSI_X3.4-1986 ASCII US-ASCII (nombre MIME recomendado) us ISO646-US ISO_646.irv:1991 iso-ir-6 IBM367 cp367 csASCII

Unicode

_ _ ____ ____ ___ ___

__ _ _ __| |_ ____ /_\ / ___| / ___|_ _|_ _|

/ _` | '__| __|/ __ \ //_\\ \___ \| | | | | |

| (_| | | | |_| ___/ / ___ \ ___) | |___ | | | |

\__,_|_| \__|\____) /_/ \_\____/ \____|___|___|

El Estándar Unicode es un estándar de codificación de caracteres diseñado para facilitar el tratamiento informático, transmisión y visualización de textos de múltiples lenguajes y disciplinas técnicas además de textos clásicos de lenguas muertas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.

Unicode especifica un nombre e identificador numérico único para cada caracter o símbolo, el code point o punto de código, además de otras informaciones necesarias para su uso correcto: direccionalidad, capitalización y otros atributos. Unicode trata los caracteres alfabéticos, ideográficos y símbolos de forma equivalente, lo que significa que se pueden mezclar en un mismo texto sin la introducción de marcas o caracteres de control.

Este estándar es mantenido por el Unicode Technical Committee (UTC), integrado en el Unicode Consortium, del que forman parte con distinto grado de implicación empresas como: Microsoft, Apple, Adobe, IBM, Oracle, SAP, Google o Yahoo, instituciones como la Universidad de Berkeley, y profesionales y académicos a título individual. El Unicode Consortium mantiene estrecha relación con ISO/IEC, con la que mantiene un acuerdo desde 1991 con el objetivo de mantener la sincronización entre sus estándares que contienen los mismos caracteres y puntos de código.

Page 13: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 13 de 17

Alcance del estándar

Unicode incluye todos los caracteres de uso común en la actualidad. La versión 5.1 contenía 100 713 caracteres provenientes de alfabetos, sistemas ideográficos y colecciones de símbolos (matemáticos, técnicos, músicales, iconos...). La cifra crece en cada versión.

Unicode incluye sistemas de escritura modernos como: Árabe, Braille, Copto, Cirílico, Griego, Han (Kanji, Hanja y Hanzi), Japonés (Kanji, Hiragana y Katakana), Hebreo y Latino. Escrituras históricas menos y extintas para propósitos académicos, como por ejemplo: Cuneiforme, Griego antiguo, Lineal B micénico, Fenicio y Rúnico. Entre los caracteres que no forman parte de alfabetos se encuentran símbolos musicales y matemáticos, fichas de juegos como el dominó, flechas, iconos, etc. Además Unicode dispone de versiones predefinidas de la mayoría de combinaciones de letras y símbolos diacríticos en uso en la actualidad y define mecanismos de combinación de caracteres como forma de extensión. Unicode es un estándar en constante evolucion y nuevas escrituras y símbolos son agregados contínuamente. Otros alfabetos propuestos han sido descartados por distintas razones como por ejemplo el alfabeto Klingon.

Relación con otros estándares

Como ya se ha indicado, Unicode está sincronizado con el estándar ISO/IEC, conocido como UCS o juego de caracteres universal. Desde un punto de vista técnico, incluye o es compatible con codificaciones anteriores como ASCII7 o ISO 8859-1, los estándares nacionales ANSI Z39.64, KS X 1001, JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, GB 18030, HKSCS, y CNS 11643, codificaciones particulares de fabricantes de software como Apple, Adobe, Microsoft, IBM, etc. Además, Unicode reserva espacio para uso privado por fabricantes de software.6

Tipos de caracteres

Caracteres gráficos: Letras, signos diacríticos, cifras, caracteres de puntuación, símbolos y espacios.

Caracteres de formato: Caracteres invisibles que afectan al proceso del texto próximo. Ejemplos: U+2028 salto de línea, U+2029 salto de párrafo, U+00A0 no break space, etc.

Códigos de control: 65 códigos definidos por compatibilidad con ISO/IEC 2022. Son los caracteres entre en los rangos [U+0000,U+001F], U+007F y [U+0080..U+009F]. Interpretarlos es responsabilidad de protocolos superiores.

Page 14: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 14 de 17

Caracteres privados: Reservados para el uso fuera del estándar por fabricantes de software.

Caracteres reservados: Códigos reservados para su uso por Unicode. Son posiciones no asignadas.

Puntos de código subrogados: Unicode reserva los puntos de código de U+D800 a U+DFFF para su uso como códigos subrogados en UTF-16, en la representación de caracteres suplementarios.

No-caracteres: Son códigos reservados permanentemente para uso interno por Unicode. Los dos últimos puntos de cada plano U+FFFE y U+FFFF.

Caracteres descartados: Son caracteres que se retienen por compatibilidad con versiones anteriores, pero se debe evitar su uso.

UTF-8

(8-bit Unicode Transformation Format) es un formato de codificación de caracteres Unicode e ISO 10646 utilizando símbolos de longitud variable. UTF-8 fue creado por Robert C. Pike y Kenneth L. Thompson. Está definido como estándar por la RFC 3629 de la Internet Engineering Task Force (IETF). Actualmente es una de las tres posibilidades de codificación reconocidas por Unicode y lenguajes web, o cuatro en ISO 10646.

Sus características principales son:

Es capaz de representar cualquier carácter Unicode. Usa símbolos de longitud variable (de 1 a 4 bytes por carácter Unicode). Incluye la especificación US-ASCII de 7 bits, por lo que cualquier mensaje

ASCII se representa sin cambios. Incluye sincronía. Es posible determinar el inicio de cada símbolo sin

reiniciar la lectura desde el principio de la comunicación. No superposición. Los conjuntos de valores que puede tomar cada byte de

un carácter multibyte, son disjuntos, por lo que no es posible confundirlos entre sí.

Estas características lo hacen atractivo en la codificación de correos electrónicos y páginas web. El IETF requiere que todos los protocolos de Internet indiquen qué codificación utilizan para los textos y que UTF-8 sea una de las codificaciones contempladas. El Internet Mail Consortium (IMC) recomienda que todos los programas de correo electrónico sean capaces de crear y mostrar mensajes codificados utilizando UTF-8.

 

Page 15: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 15 de 17

8. lineas de tiempo

1980 1994 1997

1850 1865 1878 1960 1971 1980 1994 1997 1998 2003

2005

2005 2006 2009

Tarjeta perforada Cintas perforada

Cintas magnetica

disco duro interno

Disquete o disco flexibles

Cd o disco compacto

Disco duro externo

Unidad lomega zip

Compact flash

Dvd-1995

Multimedia card

Unidad lomega jaz

Memory stick

Page 16: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 16 de 17

Superdisc

Memoria sd

Microdrive

Smartmedia

Mini cd

Disco blu-ray

Memoria usb

GENERACIÓN DE LAS BASES DE DATOS SISTEMATIZADAS.

1965 1969 1971

1950 1960 1964 1966 1970 1980 1990 2000

Orígen de las cintas magnéticas

Inicio de las cintas magnéticas, para suplir las necesidades de información de algunas industrias

Uso de los discos

El uso de los discos ayudo a consultar información directamente (ahorro de tiempo)

la Creación del GUAM

 La primera empresa encargada del proyecto, NAA (North American Aviation), desarrolló unsoftware denominado GUAM (General Update Acces Method) basado en una estructura jerárquica.

Primera Base de Datos

Desarrolló IDS (Integrated Data Store), de General Electric

Information Management System (IMS)

Jerarquía conjunta de Base de datos y gestión de sistemas de información

Conferencia de Lenguajes en Sistemas de Datos (CODASYL)

Se estableció la primera especificación del modelo de base de datos de red

Conferencia de Lenguajes en Sistemas de Datos (CODASYL)

Fue la segunda publicación del modelo de bases de redes de Charles Bachman

Page 17: Guia 1 BD - Introduccion BD - Aprendiz

Sistema de Gestión de la Calidad

REGIONAL DISTRITO CAPITALCENTRO DE GESTIÓN DE MERCADOS, LOGÍSTICA Y TECNOLOGÍAS DE LA

INFORMACIÓN

GUIA INTRODUCCIÓN A LAS BASES DE DATOS

Fecha: julio de 2011Versión: 1Página 17 de 17

Modelos de las bases de redes

Las bases de datos relacionales con su sistema de tablas, filas y columnas, pudieron competir con las bases de datos jerárquicas y de red, ya que su nivel de programación era bajo y su uso muy sencillo.

Lenguaje SQL

Structured Query Language fué creado como ayuda para la toma de decisiones

World Wide Web

Lanzamiento del WWW

Sistemas de información Siglo XXI

En la actualidad existe gran cantidad de alternativas en línea que permiten hacer búsquedas orientadas a necesidades especificas de los usuarios, una de las tendencias más amplias son las bases de datos que cumplan con el protocolo Open Archives Initiative – Protocol for Metadata Harvesting (OAI-PMH) los cuales permiten el almacenamiento de gran cantidad de artículos que permiten una mayor visibilidad y acceso en el ámbito científico y general.