Universidad Tecnológica Introducción a la Programación
Trabajo Lenguaje Ensamblador
Nombre Alumnos: Carlos Pichaud José González Nombre Profesor: Marcelo Soto Fecha: 25 de Junio del 2008
Lenguaje ensamblador Este lenguaje fue usado ampliamente en el pasado para el desarrollo de software, pero actualmente sólo se utiliza en contadas ocasiones, especialmente especialmente cuando se requiere la manipulación directa del hardware o se pretenden rendimientos inusuales de los equipos.
Importancia del lenguaje ensamblador La importancia del lenguaje ensamblador radica principalmente principalmen te que se trabaja directamente con el microprocesador; por lo cual se debe de conocer el funcionamiento funcionamien to interno de este, tiene la ventaja de que en el se puede realizar cualquier tipo de programas que en los lenguajes de alto nivel no lo pueden realizar. Otro punto sería que los programas en ensamblador ocupan menos espacio en memoria.
Ventajas del Ensamblador La primera razón para trabajar con ensamblador ensamblador es que proporciona la oportunidad oportunidad de conocer más a fondo la operación de su PC, lo que permite el desarrollo de software de una manera más consistente.
La segunda razón es el control total de la PC que se tiene con el uso del mismo. Otra razón es que los programas de ensamblador son más rápidos, más compactos y tienen mayor capacidad que los creados en otros lenguajes. Por último el ensamblador permite una optimización ideal en los programas tanto en su tamaño como en su ejecución.
Desventajas Tiempo de programación.- Como es un lenguaje de bajo nivel requiere más instrucciones para realizar el mismo proceso, en comparación con un lenguaje de alto nivel. Por otro lado, requiere de más cuidado por parte del programador, pues es propenso a que los errores de lógica se reflejen más fuertemente en la ejecución. Programas fuente grandes.- Por las mismas razones que aumenta el tiempo, crecen los programas fuentes; simplemente requerimos más instrucciones primitivas para describir procesos equivalentes. Esto es una desventaja porque dificulta el mantenimiento de los programas, y nuevamente reduce la productividad de los programadores. Peligro de afectar recursos inesperadamente .- Que todo error que podamos cometer, o todo riesgo que podamos tener, podemos afectar los recursos de la maquina,
programar en este lenguaje lo más común que pueda pasar es que la máquina se bloquee o se reinicialize. Porque con este lenguaje es perfectamente posible (y sencillo) realizar secuencias de instrucciones inválidas, que normalmente no aparecen al usar un lenguaje de alto nivel. Falta de portabilidad.- Porque para cada máquina existe un lenguaje ensamblador; por ello, evidentemente no es una selección apropiada de lenguaje cuando deseamos codificar en una máquina y luego llevar los programas a otros sistemas operativos o modelos de computadoras.
Características •
Programar en lenguaje ensamblador es difícil de aprender, entender, leer, escribir, depurar y mantener, por eso surgió la necesidad de los lenguajes compilados.
•
A pesar de perder rendimiento en un proceso de compilación, en la actualidad la mayoría de las computadoras computadoras son suficientemente suficientemente rápidas.
•
•
El lenguaje ensamblador no es portable. Programar en lenguaje ensamblador lleva mucho tiempo.
•
Los programas hechos en lenguaje ensamblador son generalmente más rápidos. Al programar cuidadosamente en lenguaje ensamblador se pueden
crear programas de 5 a 10 veces más rápidos que con lenguajes de alto nivel. •
Los programas hechos en lenguaje ensamblador generalmente ocupan menos espacio. Un buen programa en lenguaje ensamblador puede ocupar casi la mitad de espacio que su contraparte en lenguaje de alto nivel.
•
Con el lenguaje ensamblador se pueden crear segmentos de código imposibles de formar en un lenguaje de alto nivel.
Ensambladores Un ensamblador crea código objeto traduciendo instrucciones mnemónicas mnemónicas a códigos operativos e interpretando los nombres simbólicos para direcciones de memoria y otras entidades. El uso de referencias simbólicas es una característica básica de los ensambladores, ensambladores, evitando tediosos cálculos y direccionamiento direccionamiento manual después de cada modificación del programa. La mayoría de los ensambladores también incluyen facilidades para crear macros, a fin de generar series de instrucciones cortas que se ejecutan en tiempo real, en lugar de utilizar subrutinas.
Los ensambladores son por lo general más fáciles de programar que los compiladores de lenguajes de alto nivel, y han estado disponibles desde la década de 1950. Los ensambladores ensambladores modernos, especialmente para arquitecturas arquitecturas basadas en RISC, como por ejemplo MIPS, SPARC y PA-RISC optimizan las instrucciones para explotar al máximo la eficiencia de segmentación del CPU. Los ensambladores de alto nivel ofrecen posibilidades de abstracción que incluyen: •
•
Control avanzado de estructuras. Procedimientos Procedimientos de alto nivel, declaración de funciones.
•
Tipos de datos que incluyen estructuras, registros, uniones, clases y conjuntos.
•
Sofisticado procesamiento de macros.
Lenguaje Un programa escrito en lenguaje ensamblador ensamblador consiste en una serie de instrucciones que corresponden al flujo de órdenes ejecutables que pueden ser cargadas en la memoria de una computadora. Por ejemplo, un procesador x86 puede ejecutar la siguiente instrucción binaria como se expresa en código de máquina:
•
Binario: 10110000 01100001 (Hexadecimal: 0xb061)
La representación equivalente en lenguaje ensamblador es más fácil de recordar: •
MOV al, 061h
Esta instrucción significa: •
Mueva el valor hexadecimal valor hexadecimal 61 (97 decimal) al registro "al".
El mnemónico "mov" es un código de operación u "opcode", opcode", elegido por los diseñadores diseñadores de la colección de instrucciones para abreviar "move" (mover). El opcode es seguido por una lista de argumentos o parámetros, completando una instrucción de ensamblador típica. La transformación del lenguaje ensamblador en código máquina la realiza un programa ensamblador, y la traducción inversa la puede efectuar un desensamblador. A diferencia de los lenguajes de alto nivel, aquí hay usualmente una correspondencia correspondencia 1 a 1 entre las instrucciones simples del ensamblador ensamblador y el lenguaje de máquina. Sin embargo, en algunos casos, un ensamblador puede proveer "pseudo instrucciones" que se expanden en un código de máquina más extenso a fin de proveer la funcionalidad necesaria. necesaria. Por ejemplo, para un código
máquina condicional como "si X mayor o igual que" , un ensamblador ensamblador puede utilizar una pseudoinstrucción pseudoinstrucción al grupo "haga si menor que" , y "si = 0" sobre el resultado de la condición anterior. Los ensambladores más completos también proveen un rico lenguaje de macros que se utiliza para generar código más complejo y secuencias de datos. Cada arquitectura de computadoras tiene su propio lenguaje de máquina, y en consecuencia su propio lenguaje ensamblador. Los ordenadores difieren en el tipo y número de operaciones que soportan; también pueden tener diferente cantidad de registros, y distinta representación representación de los tipos de datos en memoria. Aunque Aunque la mayoría de las computadoras son capaces de cumplir esencialmente esencialmente las mismas funciones, la forma en que lo hacen difiere y los respectivos lenguajes ensambladores reflejan tal diferencia. Pueden existir múltiples conjuntos de mnemónicos o sintaxis de lenguaje ensamblador para un mismo conjunto de instrucciones, instanciados típicamente en diferentes programas ensamblador. En estos casos, la alternativa más popular es la provista por los fabricantes, y usada en los manuales del programa.
Código máquina (o lenguaje de máquina) El lenguaje de máquina está formado por instrucciones sencillas, que -dependiendo de la estructura del procesador- pueden especificar: •
Registros específicos para operaciones operaciones aritméticas, direccionamiento direccionamiento o control de funciones.
•
•
Posiciones de memoria específicas ( offset ). ). Modos de direccionamiento direccionamiento usados para interpretar operandos.
Las operaciones más complejas se realizan combinando estas instrucciones sencillas, que pueden ser ejecutadas secuencialmente secuencialmente o mediante instrucciones instrucciones de control de flujo. Las operaciones disponibles en la mayoría de los conjuntos de instrucciones incluye: •
mover o
o
llenar un registro con un valor constante mover datos de una posición de memoria a un registro o viceversa
o
escribir y leer datos de dispositivos
•
computar o
sumar, restar, multiplicar o dividir los valores de dos registros, colocando el resultado en uno de ellos o en otro registro
o
realizar operaciones binarias, incluyendo operaciones lógicas (AND/OR/XOR/NOT) (AND/OR/XOR/NOT)
o
comparar valores entre registros (mayor, menor, igual)
•
afectar el flujo del programa o
saltar a otra posición en el programa y ejecutar instrucciones allí
o
o
saltar si se cumplen ciertas condiciones (IF) saltar a otra posición, pero guardar el punto de salida para retornar (CALL, llamada a subrutinas)
Algunas computadoras incluyen instrucciones complejas dentro de sus capacidades. capacidades. Una sola instrucción compleja hace lo mismo que en otras computadoras puede requerir una larga serie de instrucciones, instrucciones, por ejemplo: •
•
•
salvar varios registros en la pila de una sola vez mover grandes bloques de memoria operaciones aritméticas aritméticas complejas o de punto flotante (seno, coseno, raíz cuadrada )
El nivel de lenguaje ensamblador tiene aspectos importantes de los niveles de microarquitectura, microarquitectura, en los
cuales se encuentra (ISA y sistema operativo) estos dos se utilizan para la traducción en lugar de la interpretación. interpretación. Algunas características del lenguaje se describen a continuación Los programas que sirven para traducir algún programa para el usuario se llama traductores, el lenguaje en que esta escrito el programa original original se llama lenguaje fuente, el lenguaje original que sea modificado se llama lenguaje objeto. Se usa la traducción cuando se cuenta con un procesador (ya sea hardware o un interprete) para el lenguaje objeto pero no para el lenguaje fuente, Si la traducción se realiza correctamente, correctamente, la ejecución del programa traducido dará exactamente exactamente los mismos resultados que habría dado la ejecución del programa fuente. Hay dos diferencias entre traducción e interpretación, interpretación, en la traducción no se ejecuta directamente el programa original, en el lenguaje fuente se convierte en un programa equivalente llamado programa objeto o programa binario ejecutable y este funciona solo cuando se ha acabado la traducción. El código máquina, un simple patrón de bits, es hecho legible reemplazando reemplazando valores crudos por símbolos denominados denominados mnemónicos. Se inventó para facilitar la tarea de los primeros programadores que hasta ese momento tenían que escribir directamente en código
binario. Inicialmente el código de ceros y unos (el programa) debía introducirse en una tarjeta perforada. La posición ocupada por cada punto equivalía a un "1" o a un "0" según hubiera o no una perforación. Lo cual suponía una forma casi idéntica en la que hoy se escriben los datos binaros en soportes tales como los CDs y DVDs. Mientras que una computadora reconoce la instrucción de máquina IA-32 10110000 01100001 para los programadores de microprocesadores x86 es mucho más fácil reconocer dicha instrucción empleando lenguaje ensamblador : movb 0x61,%al (que significa mover el valor hexadecimal valor hexadecimal 61 (97 decimal) al registro 'al'.) Cada instrucción de la máquina se transforma en una única instrucción en código simbólico. Pero además, para mejorar la legibilidad del programa, el código simbólico introduce instrucciones adicionales, que no corresponden a ninguna instrucción de la máquina y que proporcionan información. información. Se llaman "pseudoinstrucciones".
El código simbólico puede parecer de difícil acceso, pero es más fácil de recordar e interpretar que el binario o el hexadecimal. hexadecimal. Los lenguajes simbólicos no resuelven definitivamente el problema de cómo programar un ordenador de la manera más sencilla posible. Para utilizarlos, hay que conocer a fondo el microprocesador, los registros de trabajo de que dispone, la estructura de la memoria, y muchas cosas más. Además, el lenguaje ensamblador está muy ligado al microprocesador microprocesador para que sea posible escribir programas independientes independientes de la máquina en que van a ejecutarse. Este código simbólico no puede ser ejecutado directamente por un ordenador, por lo que es preciso traducirlo previamente. previamente. Pero la traducción es un proceso mecánico y repetitivo, que se presta a su realización por un programa de ordenador. Los programas que traducen código simbólico al lenguaje de máquina se llaman ensambladores ensambladores ("assembler", en inglés), porque son capaces de ensamblar el programa traducido a partir de varias piezas, procedimientos o subrutinas a código binario ("1" y "0") que entiende el procesador.
Relación entre el código binario y el lenguaje ensamblador
En el código binario se utilizan ceros y unos, mientras que el lenguaje ensamblador es una colección de símbolos mnemónicos que representan: operaciones, nombres simbólicos, operadores y símbolos especiales. La relación entre estos dos lenguajes sería que el binario es el lenguaje que la máquina entiende y el ensamblador se acerca mas lenguaje de esta. Manejo de la memoria: Direccionamiento Direccionamiento (interno y externo) El manejo de la memoria depende de que procesador tenga la máquina, entre los cuales a continuación se mencionan los siguientes: Memoria de Programa Memoria Externa de Datos Memoria Interna de Datos Registros de Funciones Especiales Memoria de Bit. El espacio de la Memoria de Programa contiene todas las instrucciones, datos, tablas y cadenas de caracteres (strings) usadas en los programas. Esta memoria se direcciona principalmente principalmente usando el registro de 16 bits llamado Data Pointer. El tamaño máximo de la Memoria de
Programa es de 64 Kbytes. La Memoria Externa de Datos contiene todas las variables y estructuras de datos que no caben en la memoria interna del Microprocesador. Esta memoria se direcciona principalmente principalmente por el registro de 16 bits Data Pointer , aunque también se puede direccionar un banco de Memoria Externa de Datos de 256 bytes usando los dos primeros registros de propósito general . El espacio de Memoria Interna de Datos funcionalmente es la memoria de datos más importante, ya que ahí es donde residen cuatro bancos de registros de propósito general; la pila o stack del programa; 128 bits de los 256 bits de un área de memoria direccionable por bit y todas las variables y estructuras de datos operadas directamente directamente por el programa. El tamaño máximo de la Memoria Interna de Datos es de 256 bytes. Contiene un espacio para los denominados Registros de Funciones Especiales destinado para los puertos de entrada/salida, temporizadores y puerto serie del circuito integrado. Estos registros incluyen al Stack Pointer; al registro de la palabra de estado del programa y al Acumulador. La cantidad máxima de Registros de Funciones Especiales es 128. Todos los Registros de Funciones Especiales tienen direcciones mayores a 127 y se ubican en los 128 bytes
superiores de la Memoria Interna de Datos. Estas dos áreas de la Memoria Interna de Datos se diferencian por el modo de direccionamiento usado para accesarlas. Los Registros de Funciones Especiales solo se pueden accesar usando el modo de direccionamiento Directo, mientras que los 128 bytes superiores solo se pueden accesar con el modo de direccionamiento Indirecto. Por otra parte, el espacio de Memoria de Bit se usa para almacenar variables y banderas de un bit. El tamaño máximo de la Memoria de Bit es de 256 bits, 128 de los bits comparten su espacio con 16 bytes del espacio de la Memoria Interna de Datos y los otros 128 bits lo hacen con los Registros de Funciones Especiales.
Ejemplos de lenguaje ensamblador Ejemplo 1
El siguiente es un ejemplo del programa clásico Hola mundo escrito para la arquitectura de procesador x86 (bajo
el sistema operativo DOS). .model small .stack .data Cadena1 DB 'Hola Mundo.$' .code
programa: mov ax, @data mov ds, ax mov dx, offset Cadena1 mov ah, 9 int 21h end programa
Ejemplo 2
Una selección de instrucciones para una computadora virtual) con las correspondientes correspondientes direcciones de memoria en las que se ubicarán las instrucciones. Estas direcciones direcciones NO son estáticas. Cada instrucción se acompaña del código ensamblador generado (código objeto) que coincide con la arquitectura de computador virtual, o conjunto de instrucciones ISA.
Dir. Etiqueta
Instrucción
Código objeto
2048
.begin .org 2048 .equ 3000 ld length,%
2064
be done
00000010 10000000 00000000 00000110 00000110
2068
addcc %r1,-4,%r1
10000010 10000000 01111111 11111100
2072
addcc %r1,%r2,%r4
10001000 10000000 01000000 00000010
2076
ld %r4,%r5
11001010 00000001 00000000 00000000
2080
ba loop
000100 000 10000 00 10111 10111111 11111111 11111011
2084
addcc %r3,%r5,%r3
10000110 10000110 10000000 100000 00 11000000 00000101
2088 done:
jmpl %r %r15+4,%r0
10000001 11000011 11100000 00000100
2092 length:
20
00000000 00000000 00000000 00010100
a_start
2096 2096 addr addres ess: s: a_st a_star artt
3000
Conclusión
.org a_start a:
00000000 00000000 00001011 00001011 10111000 10111000
El lenguaje ensamblador es un tipo de lenguaje de bajo nivel utilizado para escribir programas informáticos, y constituye la representación más directa del código máquina específico para cada arquitectura de computadoras legible por un programador.
Introducción
En este trabajo se dará a conocer en que consiste el sistema ensamblador sus ventajas y desventajas sus características características y la importancia de este.