24
Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004 Finalmente hemos llegado al tema de Linux propiamente dicho, ya que como dijimos hace tiempo, lo que Linus Torvalds desarrolló (y aún lo hace) siendo estudiante, fue un pequeño pero autosuficiente núcleo (kernel) para el procesador 80386, el primer procesador de 32 bits verdadero en la gama de CPU compatibles con PC de Intel. El primer núcleo Linux liberado al público fue la versión 0.01, fechada 14 de mayo de 1991. Esta versión no trabajaba con redes, sólo se ejecutaba en procesadores Intel compatibles con el 80386 y hardware de PC, y contaba con soporte de drivers de dispositivos extremadamente limitado. El único sistema de archivos que se reconocía era el de Minix. No fue sino hasta el 14 de marzo de 1994 que apareció la siguiente versión de “hito”, Linux 1.0. Tal vez la función individual nueva más importante fue el trabajo con redes: 1.0 incluía soporte de los protocolos de redes TCP/IP estándar de UNIX. El núcleo 1.0 también incluía un sistema de archivos nuevo muy mejorado sin las limitaciones del sistema de archivos Minix original. En junio de 1996 apareció Linux 2.0, con la adición de dos nuevas capacidades importantes: soporte de múltiples arquitecturas, incluido un traslado a un sistema Alpha nativo de 64 bits, y soporte de arquitecturas multiprocesador. En enero de 1999 aparece Linux 2.2 con muchas mejoras y soporte para nuevos tipos de hardware 30 . En enero de 2001 aparece Linux 2.4 con mejoras en el soporte a multiprocesadores, dispositivos como el USB, y acceso directo al HW gráfico (2D, 3D). En muchos sentidos, el núcleo de Linux es el corazón del proyecto Linux, pero otros componentes constituyen el sistema operativo Linux completo. Mientras que el núcleo de Linux se compone exclusivamente de código escrito desde cero específicamente para el proyecto Linux, una buena parte del software de soporte que constituye el sistema Linux no es exclusivo de Linux, sino común a varios sistemas operativos tipo UNIX. En particular, Linux utiliza muchas herramientas desarrolladas como parte del sistema operativo BSD de Berkeley, el X Window System del MIT y el proyecto GNU de la Free Software Foundation. Características del núcleo El núcleo de Linux se implementa como un núcleo monolítico tradicional por razones de desempeño, pero su diseño es lo bastante modular como para permitir que la mayor parte de los controladores se cargue y descargue dinámicamente durante la ejecución. En su diseño global, Linux semeja cualquier otra implementación tradicional de UNIX que no sea en micronúcleo. Linux es un sistema multiusuario, multitarea, con un conjunto completo de herramientas compatibles con UNIX. Linux es un sistema multiusuario que ofrece protección entre procesos y ejecuta múltiples procesos bajo el control de un planificador de tiempo compartido. Los procesos recién creados pueden compartir partes selectas de su entorno de ejecución con sus procesos padres, lo que hace posible la programación multihilada (multithreaded). La comunicación entre procesos se apoya tanto en los mecanismos de System V 31 - colas de mensajes, semáforos y memoria compartida - como en la interfaz de sockets de BSD. El código del núcleo se ejecuta en el modo privilegiado del procesador con pleno acceso a todos los recursos físicos del computador. Linux llama a este modo privilegiado modo de núcleo. Bajo Linux, no se incorpora código en modo de usuario en el núcleo. Cualquier código de soporte del sistema operativo que no necesite ejecutarse en modo de núcleo se coloca en las bibliotecas del sistema. 30 El primer número cambia cuando se da una evolución importante, el segundo es la versión y el tercero la revisión. Las versiones pares son estables y la impares inestables. 31 Tenga en cuenta esta característica para seleccionarla al momento de compilar el núcleo. © Martín Silva 129 Módulo 9: Núcleo de Linux

Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Embed Size (px)

Citation preview

Page 1: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Finalmente hemos llegado al tema de Linux propiamente dicho, ya que como dijimos hace tiempo, lo que LinusTorvalds desarrolló (y aún lo hace) siendo estudiante, fue un pequeño pero autosuficiente núcleo (kernel) parael procesador 80386, el primer procesador de 32 bits verdadero en la gama de CPU compatibles con PC deIntel. El primer núcleo Linux liberado al público fue la versión 0.01, fechada 14 de mayo de 1991. Estaversión no trabajaba con redes, sólo se ejecutaba en procesadores Intel compatibles con el 80386 y hardware dePC, y contaba con soporte de drivers de dispositivos extremadamente limitado. El único sistema de archivosque se reconocía era el de Minix. No fue sino hasta el 14 de marzo de 1994 que apareció la siguiente versión de“hito”, Linux 1.0. Tal vez la función individual nueva más importante fue el trabajo con redes: 1.0 incluíasoporte de los protocolos de redes TCP/IP estándar de UNIX. El núcleo 1.0 también incluía un sistema dearchivos nuevo muy mejorado sin las limitaciones del sistema de archivos Minix original. En junio de 1996apareció Linux 2.0, con la adición de dos nuevas capacidades importantes: soporte de múltiples arquitecturas,incluido un traslado a un sistema Alpha nativo de 64 bits, y soporte de arquitecturas multiprocesador. En enerode 1999 aparece Linux 2.2 con muchas mejoras y soporte para nuevos tipos de hardware30. En enero de 2001aparece Linux 2.4 con mejoras en el soporte a multiprocesadores, dispositivos como el USB, y acceso directo alHW gráfico (2D, 3D).

En muchos sentidos, el núcleo de Linux es el corazón del proyecto Linux, pero otros componentes constituyenel sistema operativo Linux completo. Mientras que el núcleo de Linux se compone exclusivamente de códigoescrito desde cero específicamente para el proyecto Linux, una buena parte del software de soporte queconstituye el sistema Linux no es exclusivo de Linux, sino común a varios sistemas operativos tipo UNIX. Enparticular, Linux utiliza muchas herramientas desarrolladas como parte del sistema operativo BSD de Berkeley,el X Window System del MIT y el proyecto GNU de la Free Software Foundation.

Características del núcleo

El núcleo de Linux se implementa como un núcleo monolítico tradicional por razones de desempeño, pero sudiseño es lo bastante modular como para permitir que la mayor parte de los controladores se cargue y descarguedinámicamente durante la ejecución.

En su diseño global, Linux semeja cualquier otra implementación tradicional de UNIX que no sea enmicronúcleo. Linux es un sistema multiusuario, multitarea, con un conjunto completo de herramientascompatibles con UNIX.

Linux es un sistema multiusuario que ofrece protección entre procesos y ejecuta múltiples procesos bajo elcontrol de un planificador de tiempo compartido. Los procesos recién creados pueden compartir partes selectasde su entorno de ejecución con sus procesos padres, lo que hace posible la programación multihilada(multithreaded). La comunicación entre procesos se apoya tanto en los mecanismos de System V31 - colas demensajes, semáforos y memoria compartida - como en la interfaz de sockets de BSD.

El código del núcleo se ejecuta en el modo privilegiado del procesador con pleno acceso a todos los recursosfísicos del computador. Linux llama a este modo privilegiado modo de núcleo. Bajo Linux, no se incorporacódigo en modo de usuario en el núcleo. Cualquier código de soporte del sistema operativo que no necesiteejecutarse en modo de núcleo se coloca en las bibliotecas del sistema.

30 El primer número cambia cuando se da una evolución importante, el segundo es la versión y el tercero la revisión. Las versiones paresson estables y la impares inestables.

31 Tenga en cuenta esta característica para seleccionarla al momento de compilar el núcleo.

© Martín Silva 129

Módulo 9: Núcleo de Linux

Page 2: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Aunque diversos sistemas operativos modernos han adoptado una arquitectura de transferencia de mensajespara su núcleo, Linux conserva el modelo histórico de UNIX: el núcleo se crea como un solo binariomonolítico. La razón principal es para mejorar el desempeño: dado que todo el código y las estructuras de datosdel núcleo se mantienen en un solo espacio de direcciones, no se requieren conmutaciones de contexto32 cuandoun proceso invoca una función del sistema operativo o cuando se entrega una interrupción de hardware. Nosólo el código de planificación y memoria virtual central ocupan este espacio de direcciones; todo el código delnúcleo, incluido el de los drivers de dispositivos, sistemas de archivos y trabajo con redes, está presente en elmismo espacio de direcciones único.

Conmutación de contexto

En muchos sistemas operativos actuales el núcleo es un proceso; y por lo tanto la forma de acceder al sistemaoperativo es mediante un cambio de contexto. Sin embargo el núcleo de Linux NO es un proceso. En Linux elcambio de contexto se realiza bajo demanda. El núcleo (el proceso en ejecución, dentro del núcleo) ejecuta unainstrucción para cambiar a otra tarea (que también estará en el núcleo, en el punto en el que se quedó al ceder laCPU). Los procesos en Linux son corrutinas que se ceden el procesador de forma explícita.

32 Con el objeto de implementar el tiempo compartido, el sistema operativo restablece registros, variables internas y buffers y modificavarios parámetros como preparación para la ejecución del siguiente programa, a esto se lo llama conmutación de contexto, luego de la cualel siguiente programa continúa su ejecución a partir del punto en el que se había quedado.

© Martín Silva 130

Page 3: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

En la arquitectura i386 se pueden invocar hasta cuatro mecanismos distintos para desencadenar el cambio detarea "automáticamente". Sin embargo, por cuestiones de flexibilidad y seguridad, a partir de la versión 2.2 deLinux, el cambio de contexto está codificado paso a paso.

Módulos

El núcleo de Linux tiene la facultad de cargar y descargar secciones arbitrarias del código del núcleo cuando sele pide hacerlo33. Estos módulos de núcleo cargables se ejecutan en modo de núcleo privilegiado, y por ellotienen pleno acceso a todas las capacidades de hardware de la máquina en la que se ejecutan. En teoría, no hayrestricción respecto a lo que se permite a un módulo de núcleo hacer; típicamente, un módulo podríaimplementar un driver de dispositivo, un sistema de archivos o un protocolo de redes.

Hay varias razones por las que es conveniente tener módulos del núcleo. El código fuente de Linux es libre, asíque cualquier persona que desee escribir código del núcleo puede compilar un núcleo modificado y rearrancar elsistema para cargar esa nueva funcionalidad; sin embargo, volver a compilar, enlazar y cargar todo el núcleo esun ciclo demasiado laborioso como para realizarlo cuando se está desarrollando un nuevo driver. Si se usanmódulos del núcleo, no es necesario crear un nuevo núcleo para probar un nuevo driver; éste podría compilarsede forma independiente y cargarse en el núcleo que ya se está ejecutando. Desde luego, una vez que se escribeun nuevo driver, puede distribuirse como módulo para que otros usuarios puedan beneficiarse de él sin tenerque reconstruir sus núcleos.

33 Actualmente es así, en las versiones anteriores era necesario un proceso “demonio” llamado kerneld que se encargaba de la carga ydescarga de módulos.

© Martín Silva 131

Page 4: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Procesos e hilos

La mayor parte de los sistemas operativos modernos manejan tanto procesos como hilos (threads). Aunque ladiferencia precisa entre los dos términos suele variar de una implementación a otra, podemos decir que un hilo,también llamado proceso ligero (LWP, lightweight process), es una unidad básica de utilización de la CPU, yconsiste en un contador de programa, un juego de registros y un espacio de pila. El hilo comparte con sus hilospares la sección de código, sección de datos y recursos del sistema operativo como archivos abiertos y señales,lo que se denomina colectivamente una tarea34. Un proceso tradicional o pesado es igual a una tarea con unsolo hilo.

Podríamos intentar definir la distinción principal entre ambos: los procesos representan la ejecución deprogramas individuales, mientras que los hilos representan contextos de ejecución individuales peroconcurrentes dentro de un solo proceso que ejecuta un solo programa. Dos procesos individuales cualesquieratienen su propio espacio de direcciones independiente, aun si están usando memoria compartida para compartirparte del contenido (pero no todo) de su memoria virtual. En contraste, dos hilos dentro del mismo procesocomparten el mismo espacio de direcciones (no sólo espacios de direcciones similares: cualquier cambio que unhilo haga a la organización de la memoria virtual será visible de inmediato para los demás hilos del proceso,porque en realidad sólo hay un espacio de direcciones en el que todos se están ejecutando). Hay varias formasdistintas de implementar los hilos. Se puede implementar un hilo en el núcleo del sistema operativo comoobjeto propiedad de un proceso, o puede ser una entidad totalmente independiente. Los hilos no tienen queimplementarse en el núcleo; es posible hacerlo enteramente dentro del código de una aplicación o biblioteca conla ayuda de interrupciones de temporizador suministradas por el núcleo. El núcleo de Linux maneja de formasencilla la diferencia entre procesos e hilos: utiliza exactamente la misma representación interna para todos. Unhilo no es más que un proceso nuevo que por casualidad comparte el mismo espacio de direcciones que supadre.

Planificación de procesos

El planificador es el algoritmo responsable de repartir el uso del procesador o procesadores entre todos losprocesos activos del sistema. A pesar de la importancia que se le suele dar a los algoritmos de planificación enlos libros sobre sistemas operativos, en la práctica el código del planificador es pequeño y sencillo. Esimportante diferenciar entre el algoritmo de planificación propiamente dicho y el cambio de contexto. Elalgoritmo de planificación únicamente tiene que decidir cuál será el siguiente proceso que utilizará elprocesador (se elije un proceso ganador entre todos los que no están bloqueados). El cambio de contexto es elmecanismo que efectivamente pone en ejecución a un proceso. Esta operación es muy dependiente de laarquitectura del procesador sobre el que se esté ejecutando, por lo que se tiene que realizar a bajo nivel (enensamblador). Para poder planificar procesos, tenemos que saber qué es un "proceso". En todo sistemaoperativo un proceso está representado por una estructura de datos donde se guarda toda la informaciónrelevante de éste, el PCB (Process Control Block). En Linux, el PCB es una estructura llamadatask_struct en el archivo include/linux/sched.h. En ella aparece todo tipo de información sobrecada uno de los procesos. Inicialmente, la tabla de procesos era un vector de tamaño fijo de task_struct,con lo que el número máximo de procesos estaba limitado. Actualmente, la tabla de procesos es realmente unalista doblemente enlazada mediante next_task y prev_task.

Una vez que el núcleo llega a un punto de replanificación, debe decidir cuál proceso ejecutará a continuación.Linux tiene dos algoritmos de planificación de procesos independientes. Uno es un algoritmo de tiempocompartido para la planificación expropiativa (preemptive) justa entre múltiples procesos, y el otro estádiseñado para tareas en tiempo real en las que las prioridades absolutas son más importantes que laequitatividad. Por ejemplo los procesos de un grabador de CD-RW o un reproductor de música en MP3debería utilizar las políticas orientadas a procesos de tiempo real.

En el caso de procesos de tiempo compartido, Linux usa un algoritmo con prioridades basado en créditos.Cada proceso posee cierto número de créditos de planificación; cuando es preciso escoger una nueva tarea paraejecutarla, se selecciona el proceso que tiene más créditos. Cada vez que ocurre una interrupción de

34 No confundir con el concepto de tarea del intérprete de comandos bash.

© Martín Silva 132

Page 5: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

temporizador, el proceso que se está ejecutando en ese momento pierde un crédito; cuando sus créditos llegan acero, se suspende y se escoge otro proceso.

Si ningún proceso ejecutable tiene créditos, Linux realiza una operación de renovación de créditos en la que seañaden créditos a todos los procesos del sistema (no sólo a los que se pueden ejecutar) según esta regla:créditos=(créditos/2)+prioridad.

Este algoritmo tiende a combinar dos factores: el historial del proceso y la prioridad del proceso. Después deaplicarse el algoritmo, un proceso retendrá la mitad de los créditos que le habían quedado después de la últimaoperación de renovación de créditos, con lo que se conserva un antecedente del comportamiento reciente delproceso. Los procesos que se ejecutan todo el tiempo tienden a agotar sus créditos rápidamente, pero los quepasan una buena parte de su tiempo supendidos pueden acumular créditos a lo largo de varias renovaciones ypor consiguiente terminarán con una mayor cantidad de créditos después de una renovación. Este sistema decrédito da prioridad automáticamente a los procesos limitados por E/S, para los cuales es importante unarespuesta rápida.

Multiprocesamiento simétrico

El núcleo de Linux 2.0 fue el primer núcleo Linux estable que manejó hardware de multiprocesador simétrico(SMP, symmetric multiprocessor). Procesos o hilos individuales se pueden ejecutar en paralelo en procesadoresdistintos. Sin embargo, a fin de conservar los requisitos de sincronización no expropiable del núcleo, laimplementación de SMP en este núcleo impone la restricción de que sólo un procesador a la vez puede estarejecutando código en modo de núcleo. Esta situación puede llegar a cambiar en el futuro próximo con el actualdesarrollo del núcleo expropiable versión 2.5.

Gestión de memoria

La memoria es uno de los recursos más valiosos que administra el sistema operativo. Uno de los elementosprincipales que caracterizan un proceso es la memoria que utiliza. Ésta está lógicamente separada de la decualquier otro proceso del sistema, excepto los threads de un mismo proceso que comparten normalmente lamayor parte de la memoria que tienen asignada. Un proceso no puede acceder, ni accidentalmente, al espaciode memoria asignado a otro proceso, lo cual es imprescindible para la seguridad y estabilidad del sistema. EnLinux, además, un proceso tiene dos espacios de memoria: el espacio de memoria del usuario, único para eseproceso, y el espacio de memoria del núcleo, idéntico en todos los procesos.

La gestión de memoria en Linux tiene dos componentes. Primero, el sistema de gestión de memoria física seencarga de asignar y liberar páginas, grupos de páginas y bloques pequeños de memoria. El segundocomponente maneja la memoria virtual, que es memoria que tiene una correspondencia con el espacio dedirecciones de procesos en ejecución.

El termino de "memoria virtual" se asocia a dos conceptos que normalmente aparecen unidos:

1. El uso del almacenamiento secundario para ofrecer al conjunto de las aplicaciones la ilusión de tener másmemoria RAM de la que realmente hay en el sistema. Esta ilusión existe tanto a nivel del sistema, es decir,teniendo en ejecución más aplicaciones de las que realmente caben en la memoria principal, sin que por ellocada aplicación individual pueda usar más memoria de la que realmente hay, o incluso, de forma másgeneral, ofreciendo a cada aplicación más memoria de la que existe físicamente en la máquina.

2. Ofrecer a las aplicaciones la ilusión de que están solas en el sistema, y que, por lo tanto, pueden usar elespacio de direcciones completo. Esta técnica facilita enormemente la generación de código, puesto que elcompilador no tiene porque preocuparse sobre dónde residirá la aplicación cuando se ejecute.

Denominaremos paginación con intercambio a la primera técnica y memoria virtual a la segunda.

En la paginación con intercambio se da cabida a la ejecuci nő de más aplicaciones de las que pueden residirsimultáneamente en la memoria del sistema, y de mayor tamaño que la memoria disponible. Se dividen los

© Martín Silva 133

Page 6: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

procesos en fragmentos de tamaño fijo, intercambiando con el almacenamiento secundario sólo aquellosfragmentos que sean necesarios. Todos los fragmentos (páginas) pertenecientes a una aplicación no tienen porqué estar simultáneamente en memoria principal. Una aplicación puede tener más fragmentos de los que cabenen memoria principal.

Gestión de memoria física

El administrador primario de memoria física del núcleo de Linux es el asignador de páginas, el cual se encargade asignar y liberar todas las páginas físicas, además de que puede asignar intervalos de páginas contiguasfísicamente si se le solicitan. El asignador usa un algoritmo de montículo de compañeras para seguir el rastroa las páginas disponibles. Un asignador de montículo de compañeras aparea unidades adyacentes de memoriaasignable; de ahí su nombre. Cada región de memoria asignable tiene una compañera adyacente, y siempre quedos regiones compañeras asignadas quedan libres, se combinan para formar una región más grande. Esa regiónmayor también tiene una compañera con la que puede combinarse para formar una región todavía mayor.

División de memoria en un montículo de compañeras

Memoria virtual

El sistema de memoria virtual de Linux se encarga de mantener el espacio de direcciones visible para cadaproceso. Este sistema crea páginas de memoria virtual por solicitud y gestiona la carga de dichas páginas dedisco o su intercambio a disco si es necesario. Bajo Linux, el administrador de memoria virtual mantiene dosvistas distintas del espacio de direcciones de un proceso: como un conjunto de regiones individuales y como unconjunto de páginas.

Intercambio y paginación

Una tarea importante de un sistema de memoria virtual es reubicar páginas de la memoria física al disco cuandose necesita la memoria. Los primeros sistemas UNIX efectuaban esta reubicación intercambiando a disco elcontenido de procesos enteros a la vez, pero los UNIX modernos se apoyan más en la paginación: latransferencia de páginas individuales de memoria virtual entre la memoria física y el disco. Linux noimplementa el intercambio de procesos enteros; emplea exclusivamente el mecanismo de paginación.

Memoria virtual del núcleo

Linux reserva para su propio uso una región constante, dependiente de la arquitectura, del espacio dedirecciones virtual de cada proceso. Las entradas de la tabla de páginas que corresponden a estas páginas delnúcleo se marcan como protegidas, de modo que no pueden verse ni modificarse cuando el procesador estéoperando en modo de usuario.

Ejecución de programas de usuario

La ejecución de programas de usuario por el núcleo de Linux se dispara con la llamada al sistema exec. Estallamada ordena al núcleo ejecutar un programa nuevo dentro del proceso actual, sobreescribiendo por completo

© Martín Silva 134

Page 7: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

el contexto de ejecución actual con el contexto inicial del nuevo programa. La primera tarea de este servicio delsistema es verificar que el proceso invocador tenga permiso de ejecutar el archivo. Una vez comprobado eso, elnúcleo invoca una rutina de carga para iniciar la ejecución del programa. El cargador no necesariamente cargael contenido del archivo de programa en la memoria física, pero al menos establece la correspondencia entre elprograma y la memoria virtual.

Correspondencia entre los programas y la memoria

Bajo Linux, el cargador de binarios no carga un archivo binario en la memoria física. Más bien, se estableceuna correspondencia entre las páginas del archivo binario y regiones de la memoria virtual. Sólo cuando elprograma trata de acceder a una página dada se genera un fallo de página (page fault) que hace que se cargueesa página en la memoria física.

Sistemas de archivos

Linux retiene el modelo de sistema de archivos estándar de UNIX. En UNIX, un archivo no tiene que ser unobjeto almacenado en disco o que se trae por una red desde un servidor de archivos remoto. Más bien, losarchivos UNIX pueden ser cualquier cosa capaz de manejar la entrada o la salida de un flujo de datos. Losdrivers de dispositivo pueden aparecer como archivos, y el usuario también ve como archivos los canales decomunicación entre procesos o las conexiones de red.

El núcleo de Linux maneja todos estos diferentes tipos de archivos ocultando los detalles de implementación decualquier tipo de archivo individual detrás de una capa de software, el sistema de archivos virtual (VFS, virtualfile system).

El sistema de archivos virtual

El VFS de Linux se diseñó según los principios de la orientación a objetos, y tiene dos componentes: unconjunto de definiciones que definen el aspecto que puede tener un objeto archivo y una capa de software paramanipular dichos objetos. Los tres tipos principales de objetos definidos por el VFS son las estructuras deobjeto i-nodo y objeto archivo, que representan archivos individuales, y el objeto sistema de archivos, querepresenta todo un sistema de archivos.

© Martín Silva 135

Page 8: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

El sistema de archivos Linux ext2fs

El sistema de archivos de disco estándar que Linux emplea se denomina ext2fs por razones históricas. Linux seprogramó originalmente con un sistema de archivos compatible con Minix, a fin de facilitar el intercambio dedatos con el sistema de desarrollo Minix, pero ese sistema de archivos estaba muy restringido por lo límites de14 caracteres para los nombres de archivo y de 64 megabytes para el sistema de archivos. El sistema dearchivos Minix fue reemplazado por uno nuevo, que se bautizó como sistema de archivos extendido (extfs,extended file system). Un rediseño posterior de este sistema de archivos para mejorar el desempeño y laescalabilidad y añadir unas cuantas funciones que faltaban dio pie al segundo sistema de archivos extendido,ext2fs.

Ext2fs tiene mucho en común con el Sistema de Archivos Rápido (ffs) de BSD. Las diferencias principalesentre ext2fs y ffs atañen a políticas de asignación de disco. En ffs, el disco se asigna a los archivos en bloquesde 8 kilobytes, y los bloques se subdividen en fragmentos de 1 kilobyte para almacenar archivos pequeños obloques parcialmente llenos al final de un archivo. En contraste, ext2fs no usa fragmentos, sino que realizatodas sus asignaciones en unidades más pequeñas. El tamaño de bloque por omisión en ext2fs es de 1 kilobyte,aunque también se manejan bloques de 2 y 4 kilobytes. Para mantener un desempeño alto, el sistema operativodebe tratar de realizar la E/S en trozos grandes siempre que sea posible, agrupando solicitudes de E/Sadyacentes físicamente. El agrupamiento reduce el gasto extra por solicitud que los drivers de dispositivo,discos y controladores de disco en hardware incurren. Un tamaño de solicitud de E/S de 1 kilobyte esdemasiado pequeño para mantener un buen desempeño, por lo que ext2fs usa políticas de asignación diseñadaspara colocar bloques lógicamente adyacentes de un archivo en bloques de disco físicamente adyacentes, a fin depoder emitir una solicitud de E/S por varios bloques de disco en una sola operación.

Dentro de un grupo de bloques, ext2fs trata de mantener las asignaciones físicamente contiguas si es posible,reduciendo la fragmentación si puede. Ext2fs mantiene un mapa de bits de todos los bloques libres de un grupode bloques. Al asignar los primeros bloques de un archivo nuevo, ext2fs comienza a buscar un bloque libredesde el principio del grupo de bloques; al extender un archivo, continúa la búsqueda a partir del bloque que seasignó más recientemente al archivo.

El sistema de archivos Linux ext3fs

Esta es la versión con journalling del sistema de archivos extendido segundo (ext2fs), también llamado “ext3”.Podríamos traducir journalling como “libro diario”; este libro diario mantiene la pista de cualquier cambio quehaya sido hecho al sistema de archivos, de manera que ante una eventual caída del sistema se podrán recuperarlas modificaciones a partir de este “libro diario”. Prácticamente no será necesario ejecutar el reparador delsistema de archivos e2fsck al reiniciar el sistema. Es importante recordar que este journal trabaja a nivel delsistema de archivos, es decir que no hay que confundir su función con la que podría realizar una aplicación(supongamos un editor de texto) que recupera los cambios efectuados a un archivo a partir de un “archivojournal”. Este “libro diario” es un bloque específico adicional en el sistema de archivo “ext2”, por este motivoes posible transformar un sistema “ext2” a “ext3” sin mayores inconvenientes, el formato del “ext3” es idénticoal del “ext2” y se puede cambiar de uno a otro fácilmente. Este sistema de archivos está soportado en el núcleode Linux y puede compilarse como módulo.

El sistema de archivos proc de Linux

El VFS de Linux tiene la suficiente flexibilidad como para poder implementar un sistema de archivos que noalmacene datos persistentes en absoluto, sino que más bien proporcione una interfaz a otra funcionalidad. Elsistema de archivos de procesos de Linux, conocido como sistema de archivos proc, es un ejemplo de sistemade archivos cuyo contenido no está almacenado realmente en ninguna parte, sino que se calcula bajo demandasegún las solicitudes de E/S de archivo de los usuarios35.

35 Tenga en cuenta esta característica para seleccionarla al momento de compilar el núcleo.

© Martín Silva 136

Page 9: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

El sistema de archivos proc no es exclusivo de Linux, UNIX SVR4 introdujo un sistema de archivos proccomo una interfaz eficiente con el soporte de depuración de procesos del núcleo. Cada subdirectorio delsistema de archivos correspondía no a un directorio de disco, sino a un proceso activo del sistema actual. Unlistado del sistema de archivos revela un directorio por proceso, donde el nombre del directorio es larepresentación ASCII decimal del identificador de proceso (PID) único de ese proceso.

Linux implementa un sistema de archivos proc de este tipo, pero lo extiende considerablemente añadiendovarios directorios y archivos de texto adicionales bajo el directorio raíz del sistema de archivos. Estas nuevasentradas corresponden a diversas estadísticas relativas al núcleo y a los drivers cargados asociados. El sistemade archivos proc ofrece a los programas una forma de acceder a esta información en forma de archivos de textosimple, que se pueden procesar con la potentes herramientas que el entorno de usuario UNIX estándarproporciona. Por ejemplo, en el pasado el comando ps tradicional de UNIX para listar los estados de todos losprocesos en ejecución se ha implementado como proceso privilegiado que lee el estado de los procesosdirectamente de la memoria virtual del núcleo. Bajo Linux, esta orden se implementa como un programa sinprivilegios que sencillamente analiza sintácticamente y formatea la información de proc.

Entrada y salida

Para el usuario, el sistema de E/S de Linux es muy parecido al de cualquier UNIX. Esto es, hasta donde esposible, los drivers de dispositivos aparecen como archivos normales. Un usuario puede abrir un canal deacceso a un dispositivo de la misma forma como puede abrir cualquier otro archivo; los dispositivos puedenaparecer como objetos dentro del sistema de archivos. El administrador del sistema puede crear archivosespeciales dentro de un sistema de archivos que contengan refencias a un driver de dispositivo específico, y unusuario que abra tal archivo podrá leer del dispositivo al que hace referencia, y escribir en él. Usando el sistemade protección de archivos normal, que determina quién puede acceder a cuál archivo, el administrador puedeestablecer permisos de acceso para cada dispositivo.

Linux divide todos los dispositivos en tres clases: dispositivos por bloques, dispositivos por caracteres ydispositivos de red. Los dispositivos por bloques incluyen todos los dispositivos que permiten acceso aleatorioa bloques de datos de tamaño fijo totalmente independientes, incluidos los discos rígidos, discos flexibles y CD-ROM. Los dispositivos por bloques suelen usarse para almacenar sistemas de archivos, pero también se permiteel acceso directo a un dispositivo por bloques para que los programas puedan crear y reparar el sistema dearchivos que el dispositivo contiene. Los dispositivos por caracteres son casi todos los demás, con laimportante excepción de los dispositivos de red. Los dispositivos por caracteres no necesitan apoyar toda lafuncionalidad de los archivos normales. Por ejemplo, un parlante permitirá escribir datos en él, pero nomanejaría la lectura de datos de él. De forma similar, se podría manejar la búsqueda a una posicióndeterminada de un archivo en el caso de un dispositivo de cinta magnética, pero no tendría sentido en undispositivo de apuntar como un ratón. Los dispositivos de red se tratan de manera diferente que los dispositivospor bloques y por caracteres. Los usuarios no pueden transferir datos directamente a los dispositivos de red,sino que deben comunicarse indirectamente abriendo una conexión al subsistema de red del núcleo.

El trabajo con redes es un área de funcionalidad clave para Linux. No sólo apoya los protocolos estándares deInternet que se emplean para casi todas las comunicaciones UNIX-UNIX, sino que también implementa variosprotocolos nativos de otros sistemas operativos distintos de UNIX. En particular, dado que Linux seimplementó originalmente en PC, no en estaciones de trabajo grandes ni en sistemas de clase servidor, reconocemuchos de los protocolos que suelen usarse en las redes de PC, como AppleTalk de Apple e IPX de Novell.

Internamente, el trabajo con redes en el núcleo de Linux se implementa con tres capas de software:

� La interfaz de sockets.� Controladores de protocolos.� Drivers de dispositivos de red.

Las aplicaciones de usuario efectúan todas las solicitudes de trabajo con redes a través de la interfaz de sockets.

© Martín Silva 137

Page 10: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

¿Por qué compilar el núcleo?

La velocidad y eficiencia siguen siendo metas importantes del diseño de Linux, pero gran parte de los trabajosrecientes y actuales con Linux se han concentrado en un segundo objetivo importante del diseño: laestandarización. Uno de los precios que se pagaron por la diversidad de implementaciones de Unix que hayactualmente es que el código fuente escrito para una de ellas no necesariamente se compilará o ejecutarácorrectamente en otra. Aun si las mismas llamadas al sistema están presentes en dos sistemas Unix distintos, nonecesariamente se comportarán exactamente de la misma manera.

Los estándares POSIX son un conjunto de especificaciones de diferentes aspectos del comportamiento de unsistema operativo. Hay documentos POSIX para la funcionalidad común del sistema operativo y paraextensiones como hilos de procesos y operaciones en tiempo real. Linux se diseñó de modo que cumpliera conlos documentos POSIX pertinentes; al menos dos distribuciones de Linux han logrado la certificación POSIXoficial.

Básicamente tendríamos dos situaciones posibles por las que compilaríamos el código fuente del núcleo: paraactualizarlo o para personalizarlo o ceñirlo a nuestras necesidades.

Si tenemos un sistema GNU/Linux funcionando pero su núcleo está desactualizado, y además le agregamos alcomputador algún periférico de última generación, seguramente nuestro núcleo no lo reconocerá o no estarásuficientemente soportado. En esta situación será necesario actualizarlo a la última versión. Recordemos quebásicamente no es necesario actualizar el sistema completo, sino solamente el núcleo. Aunque esto último aveces es recomendable.

Los núcleos nuevos normalmente ofrecen la posibilidad de entenderse con más accesorios hardware (o sea,incluyen más controladores), se ejecutan más rápidamente, son más estables o corrigen errores de otrasversiones. Mucha gente se actualiza el núcleo para poder usar nuevos controladores que necesitan o librarse de“bugs” de la versión que usaban.

Pero si tenemos el último sistema GNU/Linux funcionando con el núcleo actualizado, es probable quequeramos personalizarlo o ceñirlo a nuestras necesidades. Las distribuciones de Linux generan un núcleo“genérico” con una serie de características que lo hagan factible de instalar en la mayor cantidad de máquinasposibles, con soporte para los dispositivos más difundidos en el mercado. De manera que no es raro encontrarque estos núcleos tienen soporte tanto para dispositivos PCMCIA (para poder ser instalados en notebooks

© Martín Silva 138

Page 11: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

portátiles) como para dispositivos SCSI (para poder ser instalados en equipos grandes y potentes que cumpliránla función de servidores) y para dispositivos IDE (para poder ser instalados en PC hogareñas). Generalmentelos núcleos han sido compilados para procesadores tipo 80386, y estos procesadores difícilmente se esténusando en estos días, sino más bien el 80586 o Pentium o superior. Obviamente el núcleo compilado para80386 no hace uso de las características más avanzadas del Pentium (ni qué decir del Pentium II, III, IV). Demanera que acá tenemos una muy buena oportunidad de compilar el núcleo adaptándolo a nuestro hardware.

Recordemos además que si logramos un núcleo compilado para nuestro procesador específico, tendrá mejordesempeño y velocidad, y podemos dejar compilados como módulos para el futuro a todos aquelloscontroladores del hardware que tal vez le incorporemos más adelante.

¿Cuánto espacio en disco necesito?

Según el “Kernel-HOWTO” la versión 2.0.10 del núcleo ocupaba, comprimida, 6 megabytes, pero aldescomprimir ocupaba unos 24 MB. Pero aquí no acaba la cosa: para compilar se necesita espacio paraarchivos temporales, dependiendo de la configuración que se elija. Por ejemplo, en un 386, con controlador dered de 3Com y cinco sistemas de archivos supone 30 MB. Si a esto añadimos las fuentes comprimidas, serán 36MB. Recordemos que en cada nueva versión se agregan gran cantidad de líneas de código, por ejemplo laversión 2.0 tiene unas 400.000 líneas de código, pero ya la 2.1 tiene unas 800.000.

Pero la versión 2.4.7 ocupa unos 100 MB, y la 2.4.18 unos 150 MB !!

¿Cuánto tarda en compilar?

Obviamente tarda mucho, según algunos muchísimo. Por supuesto que está en función directa con el tipo yvelocidad del procesador, la cantidad de memoria y la velocidad del disco rígido; en cuanto al hardware, y a lacantidad de opciones y módulos que hayamos seleccionado para compilar.

¿De dónde obtengo los fuentes?

Es muy importante obtener los fuentes de un lugar confiable. Es decir, del CD de la distribución queutilizamos, o de los sitios oficiales o sus “mirrors” o espejos autorizados. El sitio web oficial de los fuentes deLinux es http://www.kernel.org/ 36. Ahí se pueden obtener todas las versiones y están indicados los mirrorsautorizados, con copias idénticas al original. Decimos que es muy importante, porque sería desastroso siobtuviéramos una versión que ha sido alterada con mala intensión (lo cual si bien es difícil no es imposible). Otambién podríamos encontrarnos con una versión alterada para algún otro propósito o en desarrollo; de nuevo, sibien esto es difícil no es imposible.

Típicamente tienen el nombre linux-x.y.z.tar.gz, donde x.y.z es el número de versión y revisión. Las versionesse encuentran en directorios v1.1, v1.2 y v1.3 (-- Y 2.0 y 2.1--) .

También podemos optar por instalar los fuentes desde el CD de la distribución que utilizamos, en cuyo caso setratará de un paquete con formato “rpm” o “deb”, según si siguen el formato de Red Hat o Debian.

En cualquiera de los dos casos los fuentes deben quedar por debajo del directorio /usr/src. En él se crea undirectorio “linux” que contiene los fuentes37.

36 Se puede obtener de vía ftp desde ftp://ftp.kernel.org/pub/linux/kernel/ .37 A partir de la versión 2.4 se puede colocar en otro directorio, en el que uno tenga permiso de escritura.

© Martín Silva 139

Page 12: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Debemos notar que a veces el directorio linux es un enlace (link) a otro directorio, por ejemplo linux-2.2.14.Esto se hace para que podamos tener más de una versión de los fuentes. Es decir, luego podríamos crear undirectorio linux-2.2.16, donde colocaríamos esa versión, y cambiamos el enlace simbólico para que apunte alnuevo directorio. Recordemos que los programas que compilan los fuentes los buscan en el directorio /usr/src/linux, no importa si es un enlace o no.

Descompresión de los fuentes

A partir de ahora, toda la tarea la debe realizar el superusuario root. Deberemos cambiarnos al directorio /usr/src. Si ya existe el directorio linux, habrá que renombrarlo como explicábamos antes. Si los fuentes estánen formato .tar.gz, deberemos descompactarlo con los programas gzip y tar, como ya sabemos, o con tar y laopción z. El contenido del paquete se expandirá en /usr/src/linux. Y una vez creado, si queremos podemosoptar por transformarlo en un enlace o no.

Configuración del núcleo

En el directorio /usr/src/linux hay ahora un archivo README, que es muy importante que lo leamos. Laconfiguración se hace con el programa make, que acepta una de tres opciones en la línea de comando: config,menuconfig o xconfig. La primera invoca una sesión de preguntas y respuestas en la consola. En caso de quenos equivoquemos o cambiemos de idea, habrá que abortar con CTRL/C y empezar de nuevo desde el principio.

La segunda inicia una sesión con menúes desplegables y ventanas enlazadas sencillas en formato texto y color.Todas las opciones con <> indican que son modularizables, y las que están con [] indican que no sonmodularizables. Si queremos seleccionar una opción, deberemos tocar la barra espaciadora y aparecerá unasterisco indicando que ha sido seleccionada para ser incluída dentro del kernel. Si tocamos otra vez la barraespaciadora (o la tecla n) desaparece el asterisco indicando que dicha opción no está seleccionada. Finalmentepara las opciones que están entre <> podemos tocar la tecla m y aparecerá una M mayúscula para indicarnosque esa opción está seleccionada como módulo.

La tercera opción es para ser ejecutada dentro de una ventana xterm en un entorno X. Aparecerá una ventanacon botones, soporte para mouse, etc. Es muy intuitiva de utilizar; las opciones que serán incluídas en el núcleomonolítico tienen una y griega, m que será compilada como módulo y n que no será compilada. Obviamente esla más cómoda y la más bonita, sin embargo no olvidemos que tanto X como la compilación del kernel son dosoperaciones que consumen bastantes recursos de procesador y memoria principal. De manera que si estamoscon poco tiempo, ésta no es la mejor opción. Pero podríamos utilizarla sólo para la configuración, luego apagartodos los procesos X (cambiando de nivel de ejecución, por ejemplo) y compilar después.

© Martín Silva 140

Page 13: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Estas últimas dos opciones (menuconfig y xconfig) tienen además una pequeña ayuda en línea. No son muyextensas, pero se supone de alguna manera que si está compilando el núcleo, debería saber lo que está haciendoy por lo tanto no debería necesitar muchas explicaciones, ya que las opciones son obvias. ¿No es cierto?.

Además estas opciones tienen una respuesta por omisión, y generalmente es la respuesta adecuada.

Opciones de la configuración del núcleo

Code maturity level options

Algunas de las cosas que el núcleo de Linux soporta, pueden estar en estado de desarrollo aún, y lafuncionalidad, estabilidad o el grado de evaluación del mismo tal vez no sean suficientes para el uso general. Esel llamado “estado alfa” de desarrollo, y no es aconsejable su uso “en producción”. Sin embargo, está ahí paratodos aquellos que quieran intentar probarlo, para ver qué tal funciona, y eventualmente los más capacitadospodrán hacer algún tipo de aporte. Entonces a menos que tenga intención de probar software que todavía noestá maduro, debería responder que “No”, con lo cual, en adelante se le presentarán muchas menos opciones, esdecir, sólo la del software considerado “maduro”.

Loadable module support

Los módulos del núcleo son pequeñas piezas de código compilado que pueden ser insertados o extraídos, desdeel núcleo en ejecución. Los módulos pueden ser controladores de dispositivos (device drivers), sistemas dearchivos o distintos formatos de ejecutables binarios. Un núcleo modular es más eficiente porque solamenteestá cargado en memoria el código necesario. De manera que generalmente responderá “y” a esta opción.

Processor type and features

Es el tipo de procesador de su CPU. Esta opción se ofrece como optimización, ya que el compilador generarácódigo máquina para el procesador específico que usted elija aquí. Tenga en cuenta que el tipo elegido tienecompatibilidad “hacia adelante” pero no “hacia atrás”, vale decir que si usted elige “Pentium”, el núcleoejecutará en un “Pentium Pro”, pero no en un “80486”.

© Martín Silva 141

Page 14: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

General setup

Opciones generales tales como si queremos soporte en el núcleo para redes, soporte para el bus PCI, EISA,MCA o PCMCIA. A la comunicación entre procesos tipo “System V” seguramente responderáafirmativamente, ya que sino muchos programas no podrán ejecutar. La interface sysctl provee un medio paracambiar dinámicamente ciertos parámetros y variables del núcleo durante su ejecución sin necesidad derecompilar el núcleo o reiniciar el equipo, seguramente responderá que sí a esta facilidad. También podrá optarpor tener soporte en el núcleo para distintos formatos de programas ejecutables, tales como “a.out”, ELF yMISC. El primero es un tanto antiguo, ELF es el estándar de Linux y MISC se refiere a formatos de Java, DOS,Phyton o Emacs-Lisp; seguramente responderá que sí a estas opciones.

Binary emulation of other systems

Soporte en el núcleo para poder ejecutar programas binarios provenientes de SCO Unix, Unixware, Solaris,Wyse y otros. Generalmente no es necesario activar estas opciones.

Memory Technology Devices (MTD)

Se refiere a chips RAM o flash, generalmente usados en sistemas embebidos (embedded) o de estado sólido.Generalmente no es necesario activar estas opciones.

Parallel port support

Si quiere usar dispositivos conectados al puerto paralelo de su máquina, ya sea impresoras, dispositivos ZIP oun enlace PLIP (Parallel Line Internet Protocol), entonces deberá responder que “si”.

Plug and Play configuration

Plug and Play (PnP) es un estándar para periféricos que les permite ser configurados por software, asignándolesla IRQ u otros parámetros. Responda afirmativamente (“y”) si le gustaría que Linux configure sus dispositivosPnP, también debería responder afirmativamente a “ISA Plug and Play support” que es para soporte PnP para elbus ISA.

Block devices

Soporte para los dispositivos especiales por bloque, tales como disketteras, PS/2 con MCA y discos rígidosESDI (máquinas IBM), viejas controladoras de XT, dispositivos IDE externos que se conectan a través delpuerto paralelo (PARIDE), controladoras Compaq Smart Array, soporte para dispositivos loop, que permitenusar un archivo común como si fuera un dispositivo especial por bloque, esto permite por ejemplo montar unarchivo que contiene una imagen ISO 9660 antes de ser grabada en el CD, o uno que contenga una imagen dediskette con sistema de archivo DOS, vfat, Minix, ext2, etcétera. También se ofrece soporte para dispositivospor bloques de red (similar al anterior pero a través de una red en modelo cliente-servidor). Además podemosoptar por tener soporte para discos RAM. Todas estas opciones pueden ser marcadas como módulos (“m”).

Multi-device support (RAID and LVM)

© Martín Silva 142

Page 15: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Soporte para múltiples ejes (spindles) físicos a través de un único dispositivo lógico. Es requerido para RAID(combinar varias particiones de un disco rígido en un dispositivo de bloques lógico) y administración devolumenes lógicos (LVM).

Cryptography support (CryptoAPI)

Habilita en el núcleo el soporte para las API (Application Programming Interface) Criptográficas (encriptación).En caso de habilitarse luego se harán preguntas relativas a los distintos algoritmos de encriptación. No esnecesario habilitar estas funciones para usar aplicaciones que utilizan encriptación tales como PGP, SSL, etc.

Networking options

Distintas opciones para soporte de redes en el núcleo, tales como filtrado y fragmentado de paquetes (útil parafirewall), filtrado de sockets, soporte para TCP/IP, multicast de IP, Linux como router, túneles de IP sobre IP,IP móvil, túneles de IPv6 sobre IPv4, router de multicast, soporte para IPv6, soporte para VLAN's (IEEE802.1Q), para protocolo IPX de Novell, para protocolo Appletalk de Apple, para DECnet de Digital EquipmentCorporation (ahora comprada por Compaq), para el estándar IEEE 802.1d Ethernet Bridging, y una multitudmás de protocolos y controladores considerados “experimentales”, pero que pueden usarse muy bien. Casitodos pueden habilitarse como módulos.

Telephony support

Para placas de telefonía, que le permiten usar un teléfono común para aplicaciones de voz sobre IP. Puedecompilarse como módulo.

ATA/IDE/MFM/RLL support

Soporte para las unidades de almacenamiento masivo de bajo costo ATA (AT Attachment), (E)IDE((Enhanced) Integrated Disks Electronics) y ATAPI (ATA Packet Interface). Seguramente responderá que sí,salvo que su equipo solamente posea interfaces SCSI.

SCSI support

Si tiene un disco rígido, una unidad de cinta, una lectora de CD-ROM o cualquier otro dispositivo SCSI, tendráque responder que sí, pero luego se le preguntará de que placa se trata. Se puede compilar como módulo.

Fusion MPT device support

Para SCSI de alta performance, LSI Logic Fusion Message Passing Technology (MPT). Sólo si tiene esta placadebería responder afirmativamente.

I2O device support

La arquitectura Intelligent Input/Output permite a controladores de hardware dividirse en dos partes: un móduloespecífico de sistema operativo llamado OSM y un módulo específico de hardware llamado HDM. El OSMpuede “hablarle” a un gran rango de HDM's, e idealmente los HDM's son independientes del sistema operativo.Este controlador está disponible como módulo.

© Martín Silva 143

Page 16: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Network device support

Solamente deberíamos responder que no, si la computadora en cuestión no tendrá una placa de red de ningúntipo y en caso de tener un modem sólo lo utilizaríamos para UUCP (Unix to Unix Communication Protocol) oingreso a un BBS (Bulletin Board Service), ya que si planeamos conectarnos a Internet con el mismodeberíamos responder afirmativamente. Luego vienen una inmensa cantidad de controladores para Ethernet (10y 100 Mbps), Token Ring, FDDI, PPP, SLIP, LAN inhalámbricas, interfaces WAN y dispositivos de redPCMCIA. Estos controladores están disponibles como módulos.

Amateur Radio support

Soporte para placas de radioaficionados que funcionan bajo protocolo AX.25. Si tiene una placa de este tipodeberá responder afirmativamente.

IrDA (infrared) support

Las Infrared Data Associations especifican estándares para comunicaciones infrarojas inhalámbricas y estánsoportadas por la mayoría de las laptops y PDA's (Personal Digital Assistants). Pueden ser compiladas comomódulos.

ISDN subsystems

Las Redes Digitales de Servicios Integrados (Integrated Services Digital Networks) es un tipo especial deservicio telefónico digital con velocidades de 64 y 128 Mbps que se utilizan para transmisión de voz, datos yvideo en forma totalmente digital; es ideal para teleconferencias. Puede ser compilado como módulo.

Old CD-ROM drivers (not SCSI, not IDE)

Soporte para los viejos lectores de CD-ROM, antes de que aparecieran los IDE y los SCSI, de tecnologíapropietaria, y que a menudo venían en conjunto con una placa de audio, tales como Creative SoundBlaster,Panasonic, Sony, Matsushita, Mitsumi, Philips o Sanyo. Debería responder afirmativamente si tiene alguno deestos viejos lectores de CD-ROM. Pueden seleccionarse como módulos.

Input core support

Responda afirmativamente sólo si pretende habilitar alguna de las opciones de USB HID (Human InterfaceDevice). Para mayor información vea http://www.linux-usb.org/

Character devices

Soporte para todos los dispositivos especiales por caracteres: terminales, ratones, joysticks, ciertas unidades decinta lentas, watchdog que son placas para “despertar” la computadora en forma remota, algunas placas devideo on-board, dispositivos especiales PCMCIA y una gran variedad más de dispositivos. Puedenseleccionarse como módulos.

© Martín Silva 144

Page 17: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Multimedia devices

Soporte para distintas placas capturadoras de audio o video, y placas de radio FM. Pueden seleccionarse comomódulos.

Crypto Hardware support

Soporte para placas encriptadoras, por ejemplo Broadcom 5820 SSL. Pueden seleccionarse como módulos.

File systems

Soporte para distintos sistemas de archivos, tales como ext2, ext3, reiserfs, adfs, proc, Amiga FFS, BeOS BeFS,MSDOS, vfat, umsdos, jffs, iso9660, joliet, jfs, minix, ntfs, os/2, qnx4, udf, los de red: nfs, smb, ncp; y otrosmás. Pueden seleccionarse como módulos.

Console drivers

Controladoras para distintas consolas (por ejemplo VGA) en modo texto. Hay que responder afirmativamente ala que usaremos, que en el caso de una PC es la VGA.

Sound

Soporte para distintas placas de sonido: Creative, Ensoniq, ESS, Intel, S3, Trident, Pinnacle, VIA, OSS, ymuchas más menos conocidas. Pueden seleccionarse como módulos.

USB support

Universal Serial Bus (USB) es una especificación para un subsistema de bus serial que ofrece mas altasvelocidades y mas prestaciones que el puerto serial tradicional de la PC. Este bus suministra voltaje a losperiféricos y permite el intercambio “en caliente” (hot swap). Se pueden conectar hasta 127 periféricos USB aun único puerto USB en una estructura de árbol. El puerto USB es la raíz del árbol. Debe responderafirmativamente si su máquina tiene un bus USB. Los controladores específicos pueden ser compilados comomódulos.

Bluetooth support

Bluetooth es una nueva tecnología inhalámbrica de bajo costo, bajo consumo y corto alcance. Fue diseñadacomo reemplazo de cables y otras tecnologías de corto alcance como IrDA. Bluetooth opera en un rango deárea personal (Personal Area Network, PAN) que típicamente se extiende hasta 10 metros. Para mayorinformación vea http://www.bluetooth.com/

Kernel hacking

Según el README de Linus Torvalds “la configuración de 'kernel hacking' usualmente resulta en un núcleomas grande o mas lento (o ambos) y puede hacer el núcleo menos estable al configurar unas rutinas queactivamente tratan de romper código malo para encontrar problemas en el núcleo. De modo que deberíaresponder negativamente si quiere configurar un núcleo de producción”. Habría que acatar el consejo.

© Martín Silva 145

Page 18: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Library routines

Soporte para comprimir y descomprimir (zlib) en el núcleo. No es necesario para las aplicaciones quecomprimen como gzip, bzip2, etc. No confundir.

Save and exit

Quit without saving

Load configuration from file

Store configuration to file

Las opciones para salir guardando los cambios o salir abandonando. Alternativamente se puede guardar laconfiguración en un archivo distinto del habitual, si usted quiere tener un respaldo o una versión especial, yposteriormente cargarla.

Una vez pasada esta etapa de configuración el programa indica ''revise el archivo Makefile para opcionesadicionales'' creando un archivo Makefile. Es decir, que todo lo hecho hasta ahora, fue una pequeña “ayudita”para crear este archivo (y el oculto .config), que por otra parte, podríamos haberlo creado “a mano” con el editorde texto. Sólo haremos esto si necesitáramos realmente modificarlo a mano, pero en el 99.99% de los casosesto no es necesario. Sin embargo, es difícil resistir la curiosidad de al menos mirarlo.

Compilación del núcleo

Al terminar de configurar el programa indica las operaciones siguientes: ''make dep'' y ''make clean'', que son lasque ''hacen las dependencias'' y ''hacen la limpieza'', respectivamente.

Ahora que está preparada la configuración, viene el momento de compilar, sus opciones son:

� #make zImage38

� #make bzImage� #make zdisk� #make bzdisk� #make zlilo� #make bzlilo

Básicamente hay tres opciones, sólo que cada una de ellas tiene (o no) la letra ''b'' por delante. La ''b'' (de big) alprincipio es para núcleos grandes, que no caben en el primer megabyte (MB) de memoria RAM. La ''z'' indicaque está comprimido. Un núcleo comprimido se autodescomprime él mismo al arrancar.

Las primeras dos opciones son similares: compilarán el núcleo y lo dejarán en el subdirectorio arch/i386/boot/con el nombre zImage o bzImage. Son los núcleos compilados.

Las dos siguientes (zdisk y bzdisk) además de compilarlo, se copiará a un diskette que previamente hayamosdejado (desprotegido) en la diskettera. Esto es muy útil para cuando estamos probando y no deseamos arruinarun arranque que está funcionando bien. Este diskette de arranque con el nuevo núcleo me permitirá arrancardesde el mismo, y si todo sale bien, podemos pasar a las opciones siguientes, que hacen cambios masdefinitivos.

38 Como la compilación del núcleo genera una gran cantidad de mensajes por pantalla, podemos guardar los mensajes a medida que losvemos, a través de una tubería y el comando tee, de esta manera:

#make zImage 2>&1 | tee archivo.txt

© Martín Silva 146

Page 19: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Las últimas dos opciones, luego de compilar el núcleo, lo copia a ''/vmlinuz''. Es decir, al directorio ''raíz''. Yejecuta lilo para que la próxima vez que arranquemos, lo hagamos con este nuevo núcleo. Es muy importantever los mensajes finales de lilo, que no indiquen ningún error. Las opciones de compilación sin la “b” (de big)tienden a desaparecer en el futuro.

Como este proceso tarda mucho, podemos enviar el trabajo al background:

# nohup make bzImage &

Y obtener nuevamente el prompt, luego para ver como va la compilación:

# tail -f nohup.out

El comando nohup, ejecuta un comando de manera inmune a la señal SIGHUP, es decir, que aunque salieramosde nuestra sesión bash, el comando a la derecha de nohup seguiría ejecutando hasta finalizar. Toda su salida,en vez de ir a pantalla, está redirigida al archivo nohup.out.

Instalación del núcleo

El paso anterior funcionará si lilo está bien configurado en su sistema, es decir, el núcleo es /vmlinuz, lilo estáen /sbin, y su archivo de configuración en /etc/lilo.conf no tiene fallas ni incoherencias. Además renombra elnúcleo anterior a /vmlinuz.old.

Si, por ejemplo, no está de acuerdo en dejar el núcleo en /vmlinuz, sino en el directorio /boot/ y con un nombremás adecuado, deberá instalar el núcleo ''a mano'', moviendo /vmlinuz a /boot/vmlinuz-2.4.2-2, por ejemplo, siése fuera el número de versión. Y modificar /etc/lilo.conf como ya hemos visto antes:

image=/boot/vmlinuz-2.4.2-2label=nuevokernel...

Y ejecutando lilo para que efectúe los cambios necesarios.

Trabajando con módulos

La órdenes

#make modules#make modules_install

compilarán los módulos que hayamos seleccionado, y los instalarán en /lib/modules/(versión), es decir ennuestro ejemplo en /lib/modules/2.4.2-2/, creando la estructura de directorios necesaria. No olvidar ejecutar

#depmod -a

en cuanto hayamos arrancado con dicho núcleo (generalmente este comando está incluído en los scripts dearranque del sistema).

El núcleo de Linux está organizado siguiendo una arquitectura monolítica, en la cual, todas las partes del núcleodel sistema operativo (sistemas de archivos, manejadores de dispositivos o device drivers, protocolos de red,etc.) están enlazadas como una sola imagen (normalmente el archivo /vmlinuz) que es la que se carga y ejecutaen el arranque del sistema.

Esta estructura podría dar lugar a un sistema poco flexible, ya que cualquier funcionalidad que se le quisieraañadir al núcleo del sistema requeriría una recompilación completa del mismo. Aún así, la filosofía de fuenteslibres hace a Linux mucho más flexible que otros sistemas operativos en la que los fuente no están disponibles.

© Martín Silva 147

Page 20: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

No obstante, la recompilación total del núcleo puede resultar engorrosa en las fases de desarrollo de nuevosmanejadores de dispositivo, ampliaciones no oficiales del núcleo, etc.

Esta limitación desapareció con la incorporación, en la versión 2.0 de Linux, del soporte para la carga dinámicade módulos en el núcleo. Esta nueva característica permite la incorporación ''en caliente'' de nuevo código alnúcleo del sistema operativo, sin necesidad de reinicializar el sistema.

Los módulos son ''trozos de sistema operativo'', en forma de archivos objeto (.o), que se pueden insertar yextraer en tiempo de ejecución. Dichos archivos .o se pueden obtener directamente como resultado de lacompilación de archivo .c :

# gcc -c prog.c

Una vez desarrollado un módulo e insertado en el núcleo, su código pasa a ser parte del propio núcleo, y por lotanto se ejecuta en el modo supervisor del procesador (nivel de privilegio 0 en la arquitectura i386), con accesoa todas las funciones del núcleo, a las funciones exportadas por módulos previamente insertados, y a todo elhardware de la máquina sin restricciones.

La única diferencia con código enlazado en el núcleo es la posibilidad de extraer el módulo una vez que harealizado su labor o ha dejado de ser útil, liberando así todos los recursos utilizados.

Los comandos para trabajar con módulos

Ya hemos hablado del comando depmod, que maneja las descripciones de dependencias para móduloscargables del núcleo. La configuración general de los módulos se encuentra en el archivo /etc/modules.conf,que puede contener por ejemplo:

alias sound sbalias midi opl3alias eth0 ne2k-pcioptions opl3 io=0x388options sb io=0x220 irq=5 dma=1 dma16=5 mpu_io=0x330options ad1848 io=0x530 irq=11 dma=0,0

Las líneas ''alias'' le dan un nombre adicional a los módulos, por ejemplo, en la primera para dirigirnos almódulo sb (por SoundBlaster) podemos hacerlo por ese nombre o por el nombre ''sound''. El nombre ''eth0''para la primera interfaz Ethernet, es un sinónimo del módulo ''ne2k-pci''. Esto es muy útil porque si nuestraplaca NE2000 con bus PCI fuera nuestra tercera interfaz Ethernet podríamos haber puesto ''eth2''. Todas lasdirectivas ''options'' especifican las opciones necesitadas por un módulo.

El comando modprobe hace un manejo de alto nivel de módulos cargables, intentando hacer un ''sondeo'' delmismo. Todos estos comandos que veremos leen el archivo de configuración de módulos /etc/modules.conf.Por ejemplo, el comando

#modprobe sound

Intentará cargar en memoria el módulo cargable para el manejo de la placa de audio SoundBlaster, de acuerdocon la configuración que le hemos dado en el archivo /etc/modules.conf, este comando es equivalente a:

#modprobe sb io=0x220 irq=5 dma=1 dma16=5 mpu_io=0x330

El comando insmod instala un módulo cargable del núcleo, intenta enlazar un módulo en el núcleo que se estáejecutando al resolver todos los símbolos de la tabla de símbolos exportada del núcleo.

El comando lsmod lista los módulos cargados, también podemos verlos con

#cat /proc/modules

© Martín Silva 148

Page 21: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Con el comando rmmod descarga módulos previamente cargados.

Estos son básicamente (hay otros) los comandos que manipulan los módulos cargables del núcleo. Sinembargo, hay un programa que ejecuta como daemon o ''demonio'' que se llama kerneld39, y está encargado dela carga y descarga de módulos a medida que se los necesita.

La carga y descarga de módulos genera mensajes de registro (logs o bitácoras), que de acuerdo a cómo hayamosconfigurado al programa que administra los mensajes de error, precaución e información (programa syslogd yklogd), archivándolos en archivos específicos. Generalmente podremos ver estos logs, con el comando dmesg.

Notas bibliográficas

El sistema Linux es un producto de Internet; en consecuencia, la mayor parte de la documentación existentesobre Linux se puede obtener en alguna forma a través de Internet. Los sitios clave siguientes son referencia ala información más útil disponible:

� Las Páginas de Referencias Cruzadas de Linux en http://lxr.linux.no/ mantienen listados actualizados delnúcleo de Linux, que pueden navegarse a través de la Web y contienen referencias cruzadas completas.

� Linux-HQ en http://www.linuxhq.com/ es sede de una gran cantidad de información relacionada con losnúcleos Linux 2.0 en adelante. Este sitio también incluye vínculos a las páginas base de la mayor parte delas distribuciones, así como archivos de las principales listas de correo.

� El Proyecto de Documentación de Linux en http://www.tldp.org/ lista muchos libros sobre Linux que estándisponibles en formato fuente como parte del Proyecto de Documentación de Linux. El proyecto también essede de las guías Linux HOWTO: una serie de sugerencias y consejos relacionados con aspectos de Linux.

� La Kernel Hackers' Guide es una guía basada en Internet para los detalles internos del núcleo en general.

39 Obsoleto.

© Martín Silva 149

Page 22: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Trabajo Dirigido Nº 1

1. Compilaremos el núcleo tal como se ha indicado, es decir, instalando los fuentes desde un paquete tar, rpmo deb.

2. Elejimos el procesador en el cual vamos a compilar o uno anterior, soporte para módulos, y dejamos en elnúclo sólo las funcionalidades imprescindibles, el resto lo seleccionamos como módulo.

3. Al momento de compilar, podemos elejir las opciones que generan un diskette con el nuevo núcleo, parapoder arrancar con él y no alterar el arranque actual.

4. Si funciona bien nuestro núcleo del diskette, podemos ahora generar un núcleo que reconozca lilo para quequede automáticamente configurado.

5. Si logramos arrancar bien, procedemos a compilar e instalar los módulos.

© Martín Silva 150

Page 23: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Trabajo Dirigido Nº 2

A continuación ofrecemos un sencillo programa – el clásico “Hola, mundo” de Brian Kernighan & DennisRitchie – pero desde el núcleo de Linux. La función init_module nos va a permitir inicializar el módulo alinsertarlo en el núcleo (equivaldría a la función main de un programa en C). Complementariamente,cleanup_module se usará para liberar los recursos utilizados cuando se vaya a extraer.

/* hello.c * Copyright (C) 1998 by Ori Pomerantz * * "Hello, world" - the kernel module version. */

/* The necessary header files */

/* Standard in kernel modules */#include <linux/kernel.h> /* We're doing kernel work */#include <linux/module.h> /* Specifically, a module */

/* Deal with CONFIG_MODVERSIONS */#if CONFIG_MODVERSIONS==1#define MODVERSIONS#include <linux/modversions.h>#endif

/* Initialize the module */int init_module(){ printk("Hello, world - this is the kernel speaking\n");

/* If we return a non zero value, it means that * init_module failed and the kernel module * can't be loaded */ return 0;}

/* Cleanup - undid whatever init_module did */void cleanup_module(){ printk("Short is the life of a kernel module\n");}

Para compilar:$ gcc -Wall -DMODULE -D__KERNEL__ -DLINUX -c hello.cSe inserta como superusuario:# insmod hello.oY se extrae:# rmmod helloEl núcleo no dispone de salida estándar, por lo que no podemos utilizar la función printf(). A cambio, el núcleoofrece una versión de ésta, llamada printk(), que funciona casi igual.

© Martín Silva 151

Page 24: Módulo 9: Nœcleo de Linux - UTN Facultad Regional Mendoza · 2005-04-29 · ... el nœcleo de Linux es el corazón del proyecto Linux, pero otros componentes ... físicos del computador

Sistemas Operativos – Redes y Telecomunicaciones – I.T.U. Año 2004

Autoevaluación

1. Investigue: ¿En qué costos extra se incurre al crear y planificar un proceso, en comparación con el costo deun hilo clonado?.

2. Investigue: ¿Qué ventajas tiene el enlazado dinámico (compartido) de bibliotecas en comparación con elenlazado estático? Cite dos casos en los que sea preferible el enlazado estático.

3. Compare el uso de sockets para trabajo con redes con el uso de memoria compartida como mecanismo paracomunicar datos entre procesos dentro de un mismo computador. ¿Qué ventajas tiene cada método?¿Cuándo podría ser preferible cada uno?

4. El código fuente de Linux está ampliamente disponible en forma gratuita por Internet o de proveedores deCD-ROM. ¿Qué implicaciones tiene esta disponibilidad para la seguridad del sistema Linux?

5. La arquitectura del núcleo de Linux es� monolítica� cliente-servidor� microkernel

6. Y esto es así porque:� el desempeño de una arquitectura monolítica es mucho mas eficiente� una ventaja del modelo cliente-servidor es su adaptabilidad para usarse en sistemas distribuidos.� Los sistemas operativos modernos tienden a quitarle lo más que se pueda al núcleo llevandolo a

procesos de usuario para hacerlo mas eficiente y ordenado.7. ¿Cuál es el sitio web oficial de los fuentes de Linux?8. ¿En qué directorio deben quedar los fuentes?9. ¿Cuales son las tres opciones en la línea de comando para la configuración del núcleo? (¿Cuales son las tres

formas para configurarlo?)10. Una vez que está configurado ¿cómo generamos las dependencias?11. ¿Cómo compilamos una imagen grande comprimida y que quede almacenada en disquette?12. ¿Qué son los ''módulos''?13. Si hemos desarrollado un módulo para el núcleo, debemos reiniciar el equipo para que tome los cambios

� verdadero� falso

14. ¿Cómo compilamos e instalamos los módulos?15. ¿En qué archivo encontramos la configuración general de los módulos?16. ¿Con qué comando listamos los módulos que están cargados?17. ¿Cómo puedo sondear un módulo, para ver si puede cargarse, por ejemplo si quisiera detectar mi placa

SoundBlaster?18. ¿Cómo puedo eliminar un módulo cargado en memoria, por ejemplo descargando el controlador de sonido

SoundBlaster anteriormente cargado?

© Martín Silva 152