algoritmos by aderly miranda

Elementos de Programaci´on. ETSIT. 1o C, Apuntes del profesor Juan Falguerasa 2001/02 19 de enero de 2003 a Estos apuntes no constituyen ning´ un compromiso sobre el contenido de la asignatura

3 Descripci´ on de algoritmos Contenido 3. Descripci´ on de algoritmos 3.1. Gram´ aticas de los lenguajes de programación . . . . . . . . 3.1.1. Componentes de un lenguaje formal . . . . . . . . . 3.1.2. Gram´ aticas. Jerarqu´ıa de Chomsky . . . . . . . . . . 3.1.3. La jerarqu´ıa de Chomsky de los Lenguajes Formales 3.1.4. Propiedades de las gram´ aticas . . . . . . . . . . . . . 3.1.5. Formas normales . . . . . . . . . . . . . . . . . . . . 3.1.6. Diagramas sint´ acticos . . . . . . . . . . . . . . . . . 3.2. Tipos de lenguajes de programación: lenguajes imperativos 3.2.1. Paradigmas de los lenguajes . . . . . . . . . . . . . . 3.2.2. El paradigma imperativo . . . . . . . . . . . . . . . 3.2.3. El paradigma declarativo . . . . . . . . . . . . . . . 3.2.4. Historia de los lenguajes de programación . . . . . . 3.2.5. El papel de los lenguajes de programación . . . . . . 3.2.6. Cualidades de los lenguajes . . . . . . . . . . . . . . 3.2.7. Dominios de las aplicaciones . . . . . . . . . . . . . 3.3. El teorema de las estructuras . . . . . . . . . . . . . . . . . 3.4. Las estructuras fundamentales de control de flujo . . . . . . 3.4.1. Secuencia . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2. Selecci´ on . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3. Iteraci´ on . . . . . . . . . . . . . . . . . . . . . . . . . 3.5. Pseudolenguaje (v. C1.0.1) . . . . . . . . . . . . . . . . . . 3.5.1. ALGORITMO . . . . . . . . . . . . . . . . . . . . . 3.5.2. DECLARACIONES . . . . . . . . . . . . . . . . . . 3.5.3. TIPOS . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.4. SUBALGORITMOS . . . . . . . . . . . . . . . . . . 3.5.5. ACCIONES . . . . . . . . . . . . . . . . . . . . . . . 3.5.6. Prioridad de operadores . . . . . . . . . . . . . . . . 3.5.7. Acciones . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.8. Ejemplos de modificaci´ on de variables . . . . . . . . 3.6. Diagramas de Control de Flujo . . . . . . . . . . . . . . . . 3.7. Nociones sobre reconocimiento de lenguajes . . . . . . . . . 3.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.1. Referencias de consulta . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Descripci´ on de algoritmos En los primeros temas se ha hecho una presentaci´ on hist´ orica/social, por un lado, cient´ıfica, por el otro de la inform´ atica. Socialmente los ordenadores han tenido una influencia, han evolucionado m´ as o menos r´ apidamente y han influido en otros terrenos, cient´ıficos o no.

1 2 2 3 5 6 6 7 7 8 8 9 10 12 13 14 14 15 15 16 17 18 18 18 19 20 20 21 21 21 21 22 25 26

3.1

GramÂ´ aticas de los lenguajes de programaciÂ´ on

En el capÂ´Äątulo anterior, se abordÂ´ o el apasionante tema de ÂżquÂé es capaz de resolver, cuÂ´ ales son los â&#x20AC;&#x153;lÂ´Äąmites intelectivosâ&#x20AC;? de la computaciÂ´ on resolviendo problemas? AsÂ´Äą, vez hecha una introducciÂ´ on externa, social, histÂ´ orica y fÂ´Äąsica de los computadores, hemos visto en el segundo tema hasta quÂé problemas podemos llegar a abordar con los computadores; con quÂé eficiencia y un modelo muy simple de mÂ´ aquina de computar, la mÂ´ aquina de Turing. En este tema, conocidos ya los lÂ´Äąmites de la computabilidad, el ordenador en sus principales caracterÂ´Äąsticas, nos introduciremos en la teorÂ´Äąa de los lenguajes, medios para comunicarnos con las mÂ´ aquinas; y los tipos de lenguajes. Veremos inicialmente las grandes lÂ´Äąneas en los lenguajes de programaciÂ´ on, lenguajes imperativos y declarativos, para tomar inmediatamente el camino de los primeros y dejar los u Â´ltimos. Presentaremos un sencillo teorema que nos permitirÂ´ a plantear definitivamente las necesidades de cualquier lenguaje que describa cualquier algoritmo. Veremos descritos algoritmos elementales mediante un lenguaje directo convenido, el pseudolenguaje, que nos mantendrÂ´ a independientes de cualquier lenguaje o dialecto concretos de programaciÂ´ on.

3.1.

GramÂ´ aticas de los lenguajes de programaciÂ´ on

Los lenguajes se rigen por sus gramÂ´ aticas. Dentro de este contexto, la GramÂática Formal es una herramienta que permite analizar y manipular la estructura de â&#x20AC;&#x153;conversaciÂónâ&#x20AC;?. Una GramÂática Formal especifica la estructura de un Lenguaje mediante la construcciÂón de una colecciÂón de reglas que pueden usarse sistemÂ´ aticamente para generar todas y cada una de las posibles comunicaciones legales entre los participantes. 3.1.1.

Componentes de un lenguaje formal

DefiniciÂ´ on 3.1 Un alfabeto es un conjunto finito no vacÂ´Äąo de sÂ´Äąmbolos indivisibles. Por ejemplo, el alfabeto anglosajÂ´ on consiste en 26 letras mayÂ´ usculas y 26 minÂ´ usculas. El castellano, de 28 de cada. Usualmente se denota un alfabeto mediante T . DefiniciÂ´ on 3.2 Una cadena ( string) sobre un alfabeto T es una secuencia finita de sÂ´Äąmbolos de T. El nÂ´ umero de sÂ´Äąmbolos de una cadena x es llamado su longitud, y se denota mediante |x|. Es conveniente la introducciÂ´ on de la cadena vacÂ´Äąa, denotada , que no contendrÂá absolutamente ningÂ´ un sÂ´Äąmbolo. La longitud de es 0. DefiniciÂ´ on 3.3 Sean x = a1 a2 . . . an e y = b1 b2 . . . bm dos cadenas. La concatenaciÂón de x e y, denotada por xy, es la cadena x = a1 a2 . . . an b1 b2 . . . bn . AsÂ´Äą, para una cadena x cualquiera, x = x = x. Para cualquier cadena x y n entero n â&#x2030;Ľ 0, diremos que xn es la cadena formada por la concatenaciÂón de x n veces. DefiniciÂ´ on 3.4 El conjunto de todas las cadenas sobre un alfabeto T se denota T â&#x2C6;&#x2014; y el conjunto de todas las subcadenas no vacÂ´Äąas sobre T se denota T + . El conjunto vacÂ´Äąo de cadenas se denota â&#x2C6;&#x2026;. DefiniciÂ´ on 3.5 Para cualquier alfabeto T , un lenguaje sobre T es un conjunto de cadenas sobre T . Los miembros de un lenguaje se llaman tambiÂén palabras del lenguaje. Los conjuntos L1 = {01, 11, 0110} y L2 = {0n 1n | n â&#x2030;Ľ 0} son dos lenguajes sobre el alfabeto binario {0, 1}. La cadena 01 estÂ´ a en ambos lenguajes, mientras que la 11 estÂá en L1 pero no en L2 . Dado que los lenguajes son sencillamente conjuntos, las operaciones estÂándard sobre conjuntos tales como uniÂ´ on â&#x2C6;Ş, intersecciÂ´ on â&#x2C6;Š y complemento A tambiÂén se aplican a los lenguajes. Para los lenguajes es u Â´til tambiÂén el introducir dos operaciones mÂás: concatenaciÂ´ on y cierre de Kleene. DefiniciÂ´ on 3.6 Sean L1 y L2 dos lenguajes sobre T . La concatenaciÂ´ on de L1 y L2 , denotada como L1 L2 es el lenguaje {xy | x â&#x2C6;&#x2C6; L1 , y â&#x2C6;&#x2C6; L2 }.

3.1

GramÂ´ aticas de los lenguajes de programaciÂ´ on

DefiniciÂ´ on 3.7 Sea L un lenguaje sobre T . Definimos L0 = { } y Li = LLiâ&#x2C6;&#x2019;1 para i â&#x2030;Ľ 1. El cierre de Kleene de L, denotado como Lâ&#x2C6;&#x2014; , es el lenguaje: [ Li Lâ&#x2C6;&#x2014; = iâ&#x2030;Ľ0

y el cierre positivo de Kleene, denotado como L+ , como el lenguaje: [ L+ = Li iâ&#x2030;Ľ1

En otras palabras, el cierre de Kleene de un lenguaje L consite en todas las cadenas que pueden ser formadas mediante la concatenaciÂón de palabras de L. Por ejemplo, si L = {0, 01}. entonces LL = {00, 001, 010, 0101} y Lâ&#x2C6;&#x2014; incluye todas las cadenas de dÂ´Äągitos binarios en las cuales cada 1 estÂá precedido de un 0. Lâ&#x2C6;&#x2014; es la misma que L+ excepto que L+ excluye . NÂótese que, para cualquier lenguaje L, Lâ&#x2C6;&#x2014; siempre contiene y L+ contiene si y sÂólo si L lo contiene. NÂótese ademÂás que T â&#x2C6;&#x2014; es en efecto el cierre de Kleene del alfabeto T cuando es visto como lenguage de palabras de longitud 1, y T + no es otro que el cierre positivo de T . 3.1.2.

GramÂ´ aticas. JerarquÂ´Äąa de Chomsky

Los componentes de una GramÂ´ atica Formal son sÂ´Äąmbolos y reglas. Las gramÂáticas contienen dos tipos bÂásicos de sÂ´Äąmbolos: terminales , que habrÂ´ a uno asignado a cada Palabra del Lenguaje; no terminales , que podrÂ´Äąan entenderse como las plantillas para las Frases del lenguaje. Cada plantilla admite usualmente nÂ´ umero muy alto de frases concretas. Cada sÂ´Äąmbolo terminal expresa la forma que habrÂ´ an de tener las frases. Hay ademÂás un sÂ´Äąmbolo especial reservado, el sÂ´Äąmbolo inicial I. En resumen, aunque todo lenguaje estÂá basado en un vocabulario, en el terreno de la GramÂática Formal, sus elementos no se llamarÂ´ an normalmente palabras sino sÂ´Äąmbolos (bÂásicos). Por otro lado a las secuencias de sÂ´Äąmbolos del lenguaje se le llamarÂán frases y serÂán correctas o incorrectas segÂ´ un estÂén bien o mal formadas dentro de la gramÂática, sintaxis o estructura del lenguaje. La GramÂ´ atica Formal no sÂ´ olo permite decidir si una cierta secuencia de palabras es una frase de ese lenguaje, sino que, tambiÂén, algo que es mÂás importante, dotan a la frase de una estructura que ayuda a encontrar su significado, ya que cada frase imprime un contexto a sus palabras. Al significado de las frases se le denomina semÂ´ antica y estÂá, naturalmente, ligado a la sintaxis. DefiniciÂ´ on 3.8 Una gramÂ´ atica es una cuÂ´ adrupla (T, N, P, I), donde: 1.

T es un conjunto finito no vacÂ´Äąo de terminales, llamado alfabeto.

N es un conjunto finito no vacÂ´Äąo (disjunto de T ) de variables o frases no terminales.

P es un conjunto finito de producciones o reglas de la forma Îą ::= Î˛ donde Îą â&#x2C6;&#x2C6; (T â&#x2C6;Ş N )â&#x2C6;&#x2014; N (T â&#x2C6;Ş N )â&#x2C6;&#x2014; y Î˛ â&#x2C6;&#x2C6; (T â&#x2C6;Ş N )â&#x2C6;&#x2014; . Dicho de otro modo, Îą es una cadena de terminales y noterminales conteniendo al menos un no terminal y Î˛ es una cadena de terminales y no terminales.

I â&#x2C6;&#x2C6; N es un no terminal especial llamado sÂ´Äąmbolo inicial.

3.1

GramÂ´ aticas de los lenguajes de programaciÂ´ on

Ejemplo 3.8.1 Sea G1 = ({0, 1}, {A, B, C, U }, P, A) donde P contiene las siguientes producciones: A ::= CB A ::= CU B ::= AU C ::= 0 U ::= 1 describe el conjunto {0n 1n | n â&#x2030;Ľ 1}. Ejemplo 3.8.2 Sea G2 = ({0, 1, 2}, {A, B}, P, I) donde P contiene las siguientes producciones: A ::= 0AB2 A ::= 2B ::= B2 0B ::= 01 1B ::= 11 describe el conjunto {0n 1n 2n | n â&#x2030;Ľ 0}. Ejemplo 3.8.3 Construir una gramÂ´ atica G3 que contenga las sentencias en espaË&#x153; nol. El alfabeto T contiene todas las palabras en espaË&#x153; nol. N contendrÂ´Äąa los no terminales, que coreesponderÂ´Äąan a los componenetes estructurales de las sentencias en espaË&#x153; nol, por ejemplo, <sentencia>, <sujeto>, <predicado>, <nombre>, <verbo>, <artÂ´Äąculo>, etc. El sÂ´Äąmbolo inicial podrÂ´Äąa ser <sentencia>. Algunas producciones tÂ´Äąpicas serÂ´Äąan: <sentencia> ::= <sujeto><predicado> <sujeto> ::= <nombre> <predicado> ::= <verbo><artÂ´Äąculo><nombre> <nombre> ::= dionisio <nombre> ::= algoritmo <verbo> ::= escribe <artÂ´Äąculo> ::= un Para poder explicar cÂ´ omo una gramÂática puede generar un lenguaje necesitaremos de los siguientes conceptos: DefiniciÂ´ on 3.9 Sea G = (T, N, P, I) una gramÂ´ atica. Una forma sentencia de G es cualquier cadena de ternimnales y no terminales que es una cadena sobre T â&#x2C6;Ş N . DefiniciÂ´ on 3.10 Sea G = (T, N, P, I) una gramÂ´ atica y Îł1 y Îł2 dos formas sentencia de G. Decimos que Îł1 deriva directamente a Îł2 , y se denota Îł1 7â&#x2020;&#x2019; Îł2 , si Îł1 = Ď&#x192;ÎąĎ&#x201E; y Îł2 = Ď&#x192;Î˛Ď&#x201E; y Îą ::= Î˛ es una producciÂ´ on de P . Por ejemplo, la forma sentencia 00A11 deriva directamente la sentencia 00CB11 en la gramÂática G1 y B2B2 deriva directamente BB22 en la gramÂática G2 de los ejemplos 3.8.1 y 3.8.2, respectivamente. DefiniciÂ´ on 3.11 Sean Îł1 y Îł2 dos formas sentencia de la gramÂ´ atica G. Decimos que Îł1 deriva Îł2 y se denota Îł1 7â&#x2020;&#x2019;â&#x2C6;&#x2014; Îł2 si existe una secuencia de (cero o mÂ´ as) formas sentencia Ď&#x192;1 , . . . , Ď&#x192;n tales que Îł1 7â&#x2020;&#x2019; Ď&#x192;1 7â&#x2020;&#x2019; . . . 7â&#x2020;&#x2019; Ď&#x192;n 7â&#x2020;&#x2019; Îł2 Por ejemplo, en la gramÂ´ atica G1 , A 7â&#x2020;&#x2019;â&#x2C6;&#x2014; 0011 ya que A 7â&#x2020;&#x2019; OB 7â&#x2020;&#x2019; 0B 7â&#x2020;&#x2019; 0AU 7â&#x2020;&#x2019; 0A1 7â&#x2020;&#x2019; 0OU 1 7â&#x2020;&#x2019; 00U 1 7â&#x2020;&#x2019; 0011 y en la gramÂ´ atica G2 , A 7â&#x2020;&#x2019;â&#x2C6;&#x2014; 001122 ya que A 7â&#x2020;&#x2019; 0AB2 7â&#x2020;&#x2019; 0AB2B2 7â&#x2020;&#x2019; 00B2B2 7â&#x2020;&#x2019; 0012B2 7â&#x2020;&#x2019; 0011B22 7â&#x2020;&#x2019; 001122

3.1

GramÂ´ aticas de los lenguajes de programaciÂ´ on

DefiniciÂ´ on 3.12 Sea G = (T, N, P, I) una gramÂ´ atica. El lenguaje generado por G, denotado por L(G), se define como: L(G) = {x | x â&#x2C6;&#x2C6; T â&#x2C6;&#x2014; , I 7â&#x2020;&#x2019;â&#x2C6;&#x2014; x} Las palabras en L(G) tambiÂén son denominadas sentencias de L(G). En los ejemplos, se ve claramente que L(G1 ) contiene todas las cadenas de la forma 0n 1n , n â&#x2030;Ľ 1 y L(G2 ) contiene todas las cadenas de la forma 0n 1n 2n , n â&#x2030;Ľ 0. Y aunque sÂólo hemos dado una definiciÂón parcial de G3 , sabemos que G3 contiene sentencias tales como â&#x20AC;&#x153;dionisio escribe un algoritmoâ&#x20AC;? y â&#x20AC;&#x153;algoritmo escribe un algoritmoâ&#x20AC;?, pero no sentencias tales como â&#x20AC;&#x153;un escribe un algoritmoâ&#x20AC;?. 3.1.3.

La jerarquÂ´Äąa de Chomsky de los Lenguajes Formales

La introducciÂ´ on de las gramÂ´ aticas formales data de los 40 [Pos43]. Aunque el estudio riguroso de los lenguajes mediante la gramÂ´ atica no comenzÂó hasta los 50 [Cho56]. Veremos ahora cÂómo varias restricciones en la forma de las producciones en las gramÂáticas pueden afectar la potencia de la gramÂática en sÂ´Äą y en la propia representaciÂón de los lenguajes. En particular, veremos cÂómo los lenguajes regulares y los lenguajes de patrones se pueden generar todos mendiente gramÂáticas con diferentes restricciones. Las gramÂ´ aticas pueden dividirse en cuatro clases mediante un gradual incremento en las restricciones en la forma de las producciones. Esta clasificaciÂón se debe a Chomsky [Cho56, Cho63] y es por esto que se la llama jerarquÂ´Äąa de Chomsky. DefiniciÂ´ on 3.13 Sea G = (T, N, P, I) una gramÂ´ atica. 1.

G es tambiÂ´en llamada una gramÂ´ atica de tipo 0 o gramÂ´ atica irrestringida. Sus producciones son del tipo (T â&#x2C6;Ş N )+ ::= (T â&#x2C6;Ş N )+

G es de tipo 1 o sensible al contexto si cada producciÂ´ on Îą ::= Î˛ en P es o bien una forma I ::= o satisface |Îą| â&#x2030;¤ |Î˛|.

G es de tipo 2 o libre de contexto si cada producciÂ´ on Îą ::= Î˛ en P satisface |Îą| = 1, esto es, Îą es un sÂ´ olo no terminal.

G es de tipo 3 o lineal o regular si cada producciÂ´ on tiene una de las tres posibles formas: A ::= aB

A ::= a

A ::=

donde A y B son no terminales y a es un terminal. A los lenguajes correspondientes a estas gramÂáticas se les llama de la forma correspondiente. Particularmente a un lenguaje de tipo 1 se le llama tambiÂén lenguaje sensible al contexto, mientras que a los de tipo 2 se les llama lenguajes libres de contexto. Los lenguajes de tipo 3 son lenguajes regulares, es decir, pueden ser generados por expresiones regulares, y viceversa. En los lenguajes libres de contexto, Îą serÂá sustituible por Î˛ sin importar el lugar en el que se encuentre. Las gramÂ´ aticas utilizadas por los analizadores sintÂácticos en los compiladores son de tipo 2. La notaciÂ´ on BNF, que veremos mÂ´ as adelante es una notaciÂón particular para gramÂáticas de tipo 2. Todos los lenguajes derivados de gramÂáticas de tipo 2 pueden ser parseados (anÂálizados y compilados), habiendo ademÂ´ as algunos subconjuntos de los mismos, usualmente utilizados en las definiciones de los lenguajes de programaciÂón que pueden ser parseados en forma especialmente eficiente. Las gramÂ´ aticas regulares, aunque no son lo suficientemente generales para describir la sintaxis de un lenguaje de programaciÂ´ on, sin embargo, estas gramÂáticas son ampliamente utilizadas para los analizadores lÂéxicos de los compiladores ya que describen las entidades bÂásicas que conforman un lenguaje de programaciÂ´ on. Los lenguajes descritos por una gramÂática de tipo 3 son fÂácil y eficientemente analizables y, en particular siempre se pueden describir mediante una mÂáquina de estados finitos.

3.1

GramÂ´ aticas de los lenguajes de programaciÂ´ on

Teorema 1 Para cada i = 0, 1, 2, la clase de tipo i de lenguaje contiene propiamente la clase de lenguajes de tipo i + 1. Como ejemplo, podemos demostrar que el conjunto {0n 1n | n â&#x2030;Ľ 1} es libre de contexto pero no regular y que los conjuntos {0n 1n 2n | n â&#x2030;Ľ 0} y {xx | x â&#x2C6;&#x2C6; {0, 1}â&#x2C6;&#x2014; } son sensibles al contexto pero no libres del contexto. Es, sin embargo un poco mÂás complicado construir un lenguaje que sea de tipo 0 pero no sensible al contexto. Las cuatro clases de lenguajes de la jerarquÂ´Äąa de Chomsky estÂán tambiÂén completamente caracterizadas en tÂérminos de mÂ´ aquinas de Turing y sus formas restringidas. Se sabe que un lenguajes de tipo 0 es exactamente aquÂél que es reconocido por mÂáquinas de Turing, los sensibles al contexto por mÂ´ aquinas de Turing funcionando en espacios lineales, los lenguajes libres de contexto, por mÂáquinas de Turing cuya cinta opere como una pila (llamadas autÂómatas push-down) y los lenguajes regulares son los que son reconocidos por mÂáquinas de Turing sin cinta ninguna (llamadas mÂáquinas de estados finitos o autÂ´ omatas de estados finitos). 3.1.4.

Propiedades de las gramÂ´ aticas

Dos gramÂ´ aticas G y G0 se dicen equivalentes si los lenguajes que generan, L(G) y L(G0 ) son iguales. Esta equivalencia no significa que la derivaciÂón sea la misma (tampoco, por lo tanto el Âárbol de parsing). Por ejemplo: G G0 A ::= Ax|y A ::= yB B ::= xB| Una gramÂ´ atica se dice ambigua si permite mÂás de una posible derivaciÂón para una misma expresiÂón. Por ejemplo: I ::= AA con A ::= x|xx da dos posibles formas de derivaciÂón para la cadena xxx. 3.1.5.

Formas normales

Las formas normales son mÂétodos de describir los lenguajes a travÂés de ciertas reglas. Uno de los usos mÂás importantes que tienen es el de demostrar las propiedades de los lenguajes. Pueden, a veces, no ser fÂ´ aciles de leer o comprender pero facilitan mucho mÂás el anÂálisis que presentaciones mÂás particulares. Cualquier lenguaje libre de contexto puede describirse mediante la Forma Normal de Chomsky (CNF) o la Forma Normal de Backus (BNF). La forma normal de Backus es algo mÂás legible que la de Chomsky. TambiÂén es llamada Forma Normal de Backus-Naur (ver el Â§ 3.2.4). BNF es un metalenguaje utilizado para describir sistemas de producciÂón que generen lenguajes libres de contexto. Los lenguajes generados utilizando BNF incluiran, naturalmente, un conjunto de terminales, de no terminales y una lista de producciones, y un sÂ´Äąmbolo inicial1 . Los terminales en BNF se indican de diversa forma segÂ´ un la bibliografÂ´Äąa. Nosotros utilizaremos letras minÂ´ usculas mientras que para los no terminales (variables) se utilizarÂán mayÂ´ usculas. AdemÂás BNF utiliza una serie de metasÂ´Äąmbolos que se han extendido mÂás allÂá de la teorÂ´Äąa de gramÂáticas, como por ejemplo, a manuales de todo tipo de lenguajes: SÂ´Äąmbolo ::= | ALGO algo

Significado se define como alternativamente no-terminal terminal

1 A veces en las notaciones BNF no se especifica claramente cuÂ´ al es el sÂ´Äąmbolo inicial, entendiÂ´ endose Â´ este por el grado de generalidad: el mÂ´ as general es el sÂ´Äąmbolo inicial.

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

Con el paso del tiempo el BNF se ha ampliado dando lugar a un lenguaje m´as legible mediante la inclusi´on de indicadores de iteraci´ on y grupos: S´ımbolo [algo] { algo } (tal | cual)

Significado cero o una aparici´on de ese algo cero o m´as apariciones de ese algo grupo; o bien tal o bien cual

Por ejemplo, una definici´ on de un identificador en el lenguaje de programación C, descrita en BNF ser´ıa: IDENT::=LETRA | IDENT LETRA | IDENT DIGITO con LETRA::= | [a..z] | [A..Z] y DIGITO::=[0..9] y usando EBNF: IDENT::=LETRA {LETRA | DIGITO} Algunas variantes de EBNF incluyen en forma de super´ındices y sub´ındices el m´ınimo y el máximo, respectivamente, de las posibles repeticiones. Por ejemplo {a}53 indica la posible repetición de la letra terminal a entre 3 y 5 inclu´ıdas veces. La notaci´ on EBNF evita la recursi´ on de BNF sustituyéndola por iteración. 3.1.6.

Diagramas sint´ acticos

Otra forma de describir las reglas sint´aciticas de un lenguaje son los diagramas de Conway. Los s´ımbolos m´ as importantes se representan en la Figura 1.

Símbolo terminal

Símbolo NO terminal concatenación Figura 1: Significado de algunos s´ımbolos de los diagramas de Conway

3.2.

Tipos de lenguajes de programaci´ on: lenguajes imperativos

Cualquier notaci´ on que se dé para la descripción de un algoritmo o una estructura de datos puede ser llamada lenguaje de programación. Naturalmente, sin embargo, no todos los lenguajes de programaci´ on se plantean para ser implementados en los ordenadores. Se han desarrollado e implementado cientos de lenguajes de programación diferentes. Ya en 1969 J. Sammet [Sam69] hace una lista de 120 lenguajes de programación ampliamente utilizados; y desde entonces se han desarrollado un buen pu˜ nado de ellos más. La mayor´ıa de los programadores, sin embargo, no se aventuran a utilizar m´ as que unos pocos de ellos (mientras menos mejor), quizás uno o dos. En la pr´ actica, en cada lugar de trabajo se acuerda el utilizar un lenguaje u otro (C, Ada, FORTRAN, Matlab), como sistema de desarrollo, simplificando después el intercambio de ideas y material entre los programadores. Sin embargo es interesante conocer las caracter´ısticas de los lenguajes de programaci´ on más importantes por distintas razones:

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

Mejorar habilidad en el desarrollo de algoritmos efectivos, ya que conociendo c´omo se implementan las t´ecnicas de programaci´ on que usamos, las utilizaremos mejor.

Aumentar el vocabulario de construcciones en programaci´on.

Disponer de m´ as y mejor conocidas alternativas a la hora de elegir un lenguaje de programaci´on.

Facilitar el aprendizaje de nuevos lenguajes.

Hacernos una idea de distintos estilos de presentar y estructurar los algoritmos, para mejorar nuestro estilo.

3.2.1.

Paradigmas de los lenguajes

Podemos clasificar los lenguajes de programaci´on seg´ un el modelo o paradigma, colecci´on de posibilidades abstractas, que lo caractericen. Ver la Figura 2.

Imperativo

Procedural

Estructurado en bloques

Basado en objetos

Orientado a objetos

Proceso paralelo

Paradigmas de los lenguajes de programación

Lógico Declarativo

Funcional Base de datos

Figura 2: Jerarqu´ıa de paradigmas de los lenguajes de programaci´ on

3.2.2.

El paradigma imperativo

Se caracteriza por facilitar la computación mediante cambios de estados en la máquina. Entendiendo por estado la configuraci´ on o valores tanto de la RAM, como de los diversos dispositivos variables que componen un ordenador. Bajo este paradigma es u ´til el ver la ejecución como una secuencia de fotogramas cada cual evidenciando todos los valores interesantes bajo el control del programa imperativo. Al comenzar el programa se dan una serie de datos en determinadas localizaciones de la memoria y es tarea del programa especificar la secuencia de cambios que han de hacerse sobre esta información para conseguir el estado final de la memoria deseado. Para conseguir esto el programa imperativo se sirve de estructuras de datos cuya implementación es bien conocida y condiciona la forma de los programas. Los programas imperativos dependen en mayor o menor grado de las operaciones realizables por el sistema operativo. El lenguaje FORTRAN fue el primer lenguaje imperativo con bloques de programa, que recog´ıan subrutinas, datos comunes, etc. Sin embargo de una manera plana, lo que lo excluyó de la calificación de estructurado en bloques. El término estruturado en bloques se refiere hoy d´ıa a la posibilidad de anidamiento de ámbitos, esto es, el que un bloque pueda ser encajado dentro de otro y contener su propio ámbito de variables sin interferencia alguna con el exterior. En los lenguajes estructurados por bloques, el procedimiento es el principal elemento de construcción. Ejemplos de lenguajes estructurados en bloques son el Ada, ALGOL60, Pascal. Un objeto en programaci´ on es un conjunto de elementos de información y de procedimientos para manejarla que forman un todo sobre el cual se puede trabajar ‘activando’ los procesos que

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

as´ı cambian de estado el objeto. Estos objetos capturan, pues, propiedades inherentes a entes complejos de la realidad y sirven para modelarla y facilitar su uso abstrayendo sus propiedades dentro del objeto. Para distinguir aquellos lenguajes que sólamente están basados en objetos de los que además poseen posibiliades de clases y herencia entre objetos, se utiliza el término, para éstos u ´ltimos, de orientados a objetos. As´ı mientras que el antiguo Ada 83 estaba sólamente basado en objetos, el Ada 95 está orientado a objetos, aunque para algunos no es a´ un totalmente orientado a objetos, como lo puede ser Smalltalk o Eiffel. El paradigma de la programaci´ on distribuida La programación concurrente se ha dividido en dos grandes categor´ıas: sistemas fuertemente y débilmente acoplados. El término distribuida se refiere a lenguajes para sistemas débilmente acoplados, como el que podr´ıa dar soporte a un grupo de empleados trabajando sobre una base de datos u ńica simultáneamente y comunicándose mediante el paso de mensajes a través de canales de comunicación tales como enlaces punto a punto redes de ´ area local (LAN). En este tipo de lenguajes no es necesaria la compartición de memoria pero s´ı hay que resolver otros tipos de problemas. Lenguajes como el Ada permiten la compartición de recursos mediante el mecanismo de rendevous. Otros lenguajes m´ as recientes permiten ambos tipos de enfoque, por ejemplo Occam, Linda, Concurent Prolog. 3.2.3.

El paradigma declarativo

Un lenguaje declarativo es aquel en el que se especifica una relación o función. Cuando se programa en forma declarativa no se hacen nunca asignaciones a variables, no existen las variables. El intérprete o compilador del lenguaje en particular gestiona la memoria de manera transparente al programador. Estos lenguajes son me más “alto nivel” que los lenguajes imperativos ya que el programador est´ a a´ un m´ as alejado del modelo de máquina u ordenador. Los tres paradigmas declarativos han sido tomados de la matemática: la lógica, la teor´ıa de funciones y el c´ alculo relacional. La programaci´ on l´ ogica se basa en un subconjunto del cálculo de predicados y presenta las acciones o sentencias en forma de cla´ usulas de Horn. El cálculo de predicados aporta axiomas y reglas de las que se pueden deducir nuevos hechos a partir de otros hechos dados. Una cla´ usula de Horn permite tan s´ olo deducir un hecho de cada sentencia. Un sistema de cla´ usulas de Horn permite un método mec´ anico particular de prueba llamado resoluci´ on. Un programa basado en la l´ ogica consiste en una serie de axiomas o hechos, reglas de inferencia y un teorema o consulta a comprobar. La salida será ‘cierto’ si los hechos apoyan la consulta, ‘falso’ en otro caso. Prolog es el modelo de este tipo de lenguajes, aunque existen diversas sintaxis y aproximaciones para su evaluaci´ on. La programaci´ on funcional Los lenguajes funcionales puros operan sólo sobre funciones. Una función siempre devuelve, y como m´ aximo un sólo valor, después de recibir una lista de parámetros, que pueden ser los resultados de las llamadas a otras funciones. No se permiten asignaciones a variables globales ni, los llamados, efectos laterales. Las funciones pueden incluso ser valores que pueden ser pasados a otras funciones y devolverse valores funcionales. Esto u ´ltimo permitirá a los programas funcionales modificarse a s´ı mismos, ‘aprender’. En la pr´ actica existen varios lenguajes funcionales y en casi todos ellos se permiten algunos efectos laterales, particularmente importantes, como los de la entrada y salida de datos, que implican la modificaci´ on de estados externos a las funciones. Como en el caso de la programación lógica existe un prototipo, el LISP, de lenguaje funcional, pero como en aquél, se incluyen en las implementaciones pr´ acticas muchas posibilidades no puristas.

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

El paradigma base de datos Las propiedades que distinguen a los lenguajes dise˜ nados para el manejo de las bases de datos son la persistencia y el control del cambio. Las entidades base de datos no desaparecen al terminar el programa, que una vez organizadas, son permanentes. Un sistema de gesti´ on de bases de datos incluye un lenguaje de definición de datos (DDL) para la descripci´ on de nuevos hechos o datos, y un lenguaje de manipulación de datos (DML) para la interacción con las bases de datos existentes. Los lenguajes de bases de datos pueden estar embebidos en otros lenguajes de programación para mayor flexibilidad. 3.2.4.

Historia de los lenguajes de programaci´ on

Los lenguajes de programaci´ on han evolucionado cont´ınuamente desde la aparición de los primeros en los 50. Las primeras versiones de FORTRAN y Lisp aparecieron durante los a˜ nos 50; Ada, C, Pascal, Prolog y Smalltalk en los 70; C++ y ML en los 80. Cuando en los 70, el departamento de defensa americano (DoD) realizó un estudio del estado de cosas encontró que se utilizaban m´ as de 500 lenguajes de programación en sus distintos proyectos; este fue un motivo para el desarrollo por parte del DoD del lenguaje Ada. Las primeras tecnolog´ıas en computación datan de los a˜ nos 30 a 40, antes de la Segunda Guerra Mundial. Estas primeras m´ aquinas fueron dise˜ nadas para resolver problemas numéricos y fueron pensadas simplemente como calculadores electrónicos. Naturalmente de esto derivó el que la mayor´ıa de las aplicaciones de entonces sean numéricas. A principios de los 50 comenz´ o a aparecer la notación simbólica. Grace Hopper dirigió un grupo en Univac que desarroll´ o el lenguaje A-0 y John Backus desarrolló el Speedcoding para el IBM 701. Ambos lenguajes fueron dise˜ nados para compilar expresiones aritméticas sencillas en código máquina ejecutable. El gran salto se dio de 1955 a 1957 cuando Backus dirigi´ o un grupo para desarrollar FORTRAN (FORmula TRANslator). Como en los lenguajes hasta entonces, FORTRAN estaba orientado a los cálculos numéricos, pero el objetivo se amplió con un lenguaje capaz de incluir estructuras de control, condicionales, ´ ordenes de entrada y salida, etc. Dado que hab´ıa poca confianza en que el lenguaje resultara competitivo frente al código desarrollado directamente a mano sobre las instrucciones del procesador (Ensamblador), se hizo un gran esfuerzo en conseguir una ejecución eficiente y se introdujeron varias ´ ordenes dise˜ nadas espec´ıficamente para el IBM 704. As´ı nos encontramos en el lenguaje FORTRAN conceptos como el salto aritmético a tres caminos, concepto curioso exclusivo de a aquél procesador que no se ha seguido posteriormente. No se trataba de un lenguaje ‘elegante’, pero en aquellos d´ıas, el concepto de ‘elegancia’ en la programación a´ un no se hab´ıa acu˜ nado. FORTRAN fue extremadamente u ´til; tanto que ha cambiado la programación desde entonces. FORTRAN ha sido revisado en 1958 (FORTRAN II) y pocos a˜ nos después (FORTRAN IV). FORTRAN IV se convirti´ o en un est´ andard en 1966 como FORTRAN 66 y se ha actualizado dos veces desde entonces: FORTRAN 77 FORTRAN 90. Sin embargo la candidad de código escrito para las antiguas versiones hacen d´ıficil evolucionar a los nuevos dialectos, que prácticamente sólo se pueden preocupar de ser compatibles con todas las posibilidades anteriores. Tras el éxito del FORTRAN y por miedo en Europa al dominio de IBM se organizó la GAMM (German society of applied mathematics) para el desarrollo de un lenguaje universal. En los Estados Unidos, la ACM (Association of Computing Machinery) también se propuso tal objetivo. Ambos comités se fundieron en uno bajo las directrices de Peter Naur y desarrolló el IAL (Internations Algorithmic Language). El nombre ALGOL (ALGOrtihmic Language) fue inicialmente rechazado, pero su uso oblig´ o a que oficialmente se aceptara: finalmente el lenguaje se llamó Algol 58. Se hizo una revisi´ on en el 60 que se llamó Algol 60 (con una menor en el 62) convirtiéndose en el estándard de los lenguajes de la programación académica de los 60 y principio de los 70. Mientras que uno de los objetivos del FORTRAN era la eficiencia, los objetivos del Algol fueron diversos: 1.

La notaci´ on deb´ıa ser parecida a la de las matem´aticas usuales.

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

Deber´ıa ser u ´til para describir algoritmos.

Deber´ıa ser compilable en c´ odigo m´aquina.

No deber´ıa estar ligado a ninguna arquitectura particular de computador.

Siendo estos unos objetivos ambiciosos para el a˜ no 1957, la independencia de la máquina hizo que Algol careciera oficialmente de instrucciones para introducir y presentar datos, debiendo éstas ser escritas para cada hardware en cada máquina. Esto, naturalmente conllevaba incompatibilidades entre los programas hechos en diferentes máquinas. La exigida cercan´ıa a la sintaxis matemática hizo que las llamadas a subrutinas fuesen meras expansiones de macros. Esto introdujo el concepto de llamada por nombre en el paso de parámetros, que es dif´ıcil de implementar en los compiladores. Aunque Algol no tuvo éxito comercial en los Estados Unidos, sólo algo en Europa, tuvo un gran impacto. Uno de sus herederos fue la versión de Jules Schwartz de SDZ del lenguaje IAL, JOVIAL (Jules’ Own Version of IAL), que se convirtió en un estándard para las aplicaciones de las fuerzas aéreas americanas. Backus edit´ o la definici´ on del lenguaje Algol en 1960 mediante una notación sintáctica compa´ rable a la gram´ atica libre de contexto desarrollada por Chomsky un a˜ no antes. Este fue el comienzo de la introducci´ on de la teor´ıa de las gramáticas formales a los lenguajes de programación. Debido al importante papel que tuvo Naur en el desarrollo del Algol, la notación empleada recibe el nombre de BNF, o Backus Naur Form. Otro ejemplo de la gran influencia del Algol fue el de Burroughs, un vendedor de ordenadores que se fusiona con Sperry Univac para formar Unisys, al descubrir los trabajos de un matemático polaco llamado Lukasiewicz. Lukasiewicz hab´ıa desarrollado una interesante, aunque no muy revolucionaria matem´ aticamente, nueva técnica que permit´ıa a las expresiones aritméticas ser escritas sin paréntesis mediante un potente proceso de evaluación basado en una pila. Este descubrimiento tuvo un gran efecto en la teor´ıa de compiladores. Usando el método de Lukasiewicz, Burroughs desarrolló el hardware del ordenador B5500 basado en una arquitectura de pilas e inmediatamente un compilador de Algol mucho m´ as r´ apido que ninguno de los hasta entonces existentes de FORTRAN. En este punto, la historia diverge. En el 60 se desarrolla el concepto de tipo definido por el usuario y ni FORTRAN ni Algol tienen tal capacidad. Simula 67, desarrollado por Nygaard y Dahl de Noruega introducen el concepto de clase en Algol. Esto dio a Stroustrup la idea para sus clases en C++ como una extensi´ on del C en los 80. Niklaus Wirth desarrolló el Algol-W a mediados de los 60 como una extensi´ on del Algol. Este dise˜ no tuvo un precario éxito, pero su Pascal dise˜ nado entre el 68 y el 70, se convirti´ o en el lenguaje de los computadores cient´ıficos de los 70. Hubo otro comité que intent´ o duplicar el éxito del Algol 60 con el Algol 68, pero el lenguaje fue radicalmente diferente y mucho m´ as complejo de comprender e implementar eficientemente. Con la introducci´ on de la l´ınea de los 360 en 1963, IBM desarrolló el NPL (New Programming Language) en sus laboratorios de Hursley en Gran Breta˜ na. Después de algunas quejas del English National Physical Laboratory, el nombre se cambió a MPPL (Multi-Purpose Programming Language), que fue abreviado a PL/I. PL/I mezcló las facilidades numéricas del FORTRAN con las capacidades de gesti´ on mercantil del COBOL. PL/I tuvo un éxito moderado en los 70 y ha sido hoy d´ıa totalmente reemplazado por el C y el Ada. BASIC fue un subconjunto del FORTRAN fácil de implementarse para ser interpretado en vez de compilado y de fácil aprendizaje, satisfaciendo las necesidades de c´ alculo del no cient´ıfico, se ha extendido mucho más allá de lo proyectado inicialmente. Lenguajes para los negocios Inmediatamente después de los lenguajes para el cálculo numérico surgieron los lenguajes para los negocios. Grace Hopper dirigió un grupo en Univac para desarrollar Flowmatic en 1955, cuyo objetivo era el desarrollo de aplicaciones para negocios utilizando expresiones lo m´ as naturales del lenguaje inglés. En el 59 el DoD promovi´ o un encuentro para el desarrollo del Common Business Language (CBL), que deber´ıa de ser un lenguaje orientado a los negocios con expresiones lo más inglesas

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

posible. Una subdivisi´ on de este grupo publicó en el 60 lo que ser´ıa el COBOL (COmmon Business Oriented Language). COBOL fue revisado en el 74 y en el 84. Hoy d´ıa se sigue utilizando. Lenguajes para la inteligencia artificial El interés en el desarrollo de lenguajes para desarrollo de IA (interés artificial) comenz´ o en los 50 con el IPL (Information Processing Language) por la Rand Corporation. IPL-V fue ampliamente conocido, pero se extendió poco porque ten´ıa unas especificaciones de muy bajo nivel de abstracción. El gran salto se dio cuando John McCarthy del MIT dise˜ nó el LISP (LIst Processing) para el IBM 704. El LISP 1.5 se convirtió en un estándard durante muchos a˜ nos. Recientemente Scheme y Common LISP han seguido esta evolución. El lenguaje LISP fue dise˜ nado como un procesador de listas de los lenguajes funcionales. El dominio usual de los problemas para LISP es la b´ usqueda. Particularmente el desarrollo de juegos ha sido un terreno propio del LISP dado que un programa de LISP usualmente puede desarrollar movimientos arb´ oreos (como listas enlazadas) y posteriormente moverse por el árbol buscando la estrategia óptima. Un paradigma alternativo fue también el del procesado de cadenas donde la solución habitualmente involucraba la transformación de los textos de un formato a otro. Máquinas traductoras autom´ aticas en las que cadenas de s´ımbolos eran sustituidas por otras, fueron también dominio del LISP. El lenguaje COMIT de Yngve del MIT fue un intento inicial para este tipo de trabajos. Cada instrucci´ on del programa era muy parecida a una regla de producción de un lenguaje de contexto libre y representaba un conjunto de posibles reemplazos que podr´ıan darse si la cadena se encontraba en los datos. Debido a que Yngve mantuvo su propiedad sobre el código, un grupo en la en los laboratorios de la AT&T Bell decidió desarrollar su propio lenguaje, que resultó ser el SNOBOL. Mientras que el LISP fue dise˜ nado para aplicaciones de procesado de listas de propósito general, el Prolog fue un lenguaje de propósito especial cuyas estructuras básicas de control y la estrategia de implementaci´ on se basaron en conceptos de l´ ogica matemática. Lenguajes para sistemas Debido a la necesidad de eficiencia, durante a˜ nos fue el ensamblador el lenguaje utilizado para el desarrollo de sistemas incluso mucho después de que otras áreas de aplicación utilizaran ya lenguajes de alto nivel. Se dise˜ naron muchos lenguajes para la programación de sistemas, tales como el CPL y el BCPL, pero nunca llegaron a una amplia expansión. El lenguaje C cambi´ o todo esto con su llegada con un entorno competitivo, el UNIX, totalmente escrito en C, durante el comienzo de los 70. Los lenguajes de alto nivel han demostrado ser efectivos en estas áreas, tanto como otros. 3.2.5.

El papel de los lenguajes de programaci´ on

Aunque inicialmente los lenguajes fueron desarrollados con el objetivo acuciante de la eficiencia, debido sobre todo al alto coste de los ordenadores (cientos de millones de pesetas) frente al de los programadores (dos millones de pesetas por a˜ no), teniendo que competir siempre con la efectividad de la programaci´ on directa sobre el hardware en ensamblador, la necesidad de conseguir programas correctos de unas 30.000 instrucciones, llevó a mediados de los 60 (con la llegada del FORTRAN, el COBOL, el LISP y el Algol) a un nuevo enfoque del problema. Los ordenadores se fueron haciendo m´ as baratos y los costes de la programación mayores. Esto forzó la necesidad de trasladar los programas escritos de unos ordenadores a otros y el mantenimiento de tales productos se convirti´ o también en un gran costo a˜ nadido. De manera que en vez de compilar grandes programas en grandes y caros ordenadores, la tarea de los lenguajes de alto nivel se convertir´ıa en falicilitar el desarrollo de programas correctos para la resolución de problemas áreas dadas de aplicaciones. En los 70, madura la tecnolog´ıa de los compiladores, t´ıpicamente se ten´ıa al FORTRAN para aplicaciones cient´ıficas, al COBOL para los negocios, al JOVIAL para las aplicaciones militares, al LISP para las de inteligencia artificial y para las aplicaciones empotradas en sistemas fijos, el Ada. Sin embargo ha habido una evoluci´ on natural de estos lenguajes debido a: 1.

La capacidad de los computadores, que ha aumentado enormemente en poco tiempo.

3.2

Tipos de lenguajes de programaci´ on: lenguajes imperativos

Las aplicaciones a las que se destinan los ordenadores, que se ha ampliado bastante.

Los m´etodos de programaci´ on, que han ido evolucionando para tener en cuenta nuevos conceptos relativos al ambiente de trabajo en grandes aplicaciones y al ambiente de uso de las mismas.

Las nuevas técnicas de implementación de los lenguajes que han introducido nuevas técnicas de programaci´ on.

Los estudios te´ oricos, especialmente la formalización matemática en la b´ usqueda de la corrección, han introducido nuevas técnicas de programación.

La estandarizaci´ on que ha promovido un fuerte conservacionismo en la evoluci´on de los lenguajes.

3.2.6.

Cualidades de los lenguajes

¿Qué hace que un lenguaje sea bueno? Los métodos de dise˜ no de los lenguajes a´ un tienen mucho que mejorar. Los motivos para el éxito o el fracaso de un lenguaje son muchas veces externos a ellos mismos, como por ejemplo, el caso de los lenguajes COBOL y Ada, promovidos por entidades poderosas. En otros casos este éxito se lo ha dado el apoyo por parte de diversos fabricantes, como le pas´ o al FORTRAN. A veces es sencillamente el unirlos a excelentes textos para describirlos, como le ocurri´ o al SNOBOL4 durante los 70. Mientras que el Pascal y el LISP se han visto apoyados por el estudio te´ orico que de ellos han hecho los estudiantes de dise˜ no de lenguajes a la vez que lo usaban. Independientemente de estos factores externos, lo que deber´ıa determinar si un lenguaje debiera sobrevivir ser´ıa: 1.

Claridad, simplicidad y unicidad. Que podr´ıamos resumir en integridad conceptual. La sintaxis del lenguaje afecta la facilidad de lectura de los programas con ´el escritos y la legibilidad de los programas es fundamental. Los lenguajes cr´ıpticos (como APL) o el uso de operadores ocultos (como el espacio en SNOBOL4) que alteran, sin uno verlos, el significado, son muy perniciosos en el mantenimiento de los programas.

Ortogonalidad, o independencia de cada construcci´on respecto de las otras de manera que se puedan combinar libremente y ser entendidas sin considerar los contextos de cada una.

Naturalidad para la aplicaci´ on a programar. El lenguaje FORTRAN tiene tanto ´exito en parte debido a que las expresiones matem´aticas se parecen mucho a las que se utilizan en las mismas matem´ aticas.

Apoyos para la abstracci´ on, permitiendo construir estructuras nuevas a las que se pueda referir mediante sintaxis sencillas y que incluyan todas las propidades de los objetos reales representados. Del Pascal surgi´ o el Ada y del C el C++ por su mayor soporte a la abstracci´on.

Facilidades para la verificaci´ on como base para la construcción de grandes programas fiables mediante el uso de estructuras sint´ acticas sencillas y de semánticas lo más simples posibles.

Entornos de programaci´ on adecuados y completos que faciliten la labor de los desarrolladores. Pocos lenguajes se definen inicialmente con este problema resuelto. En este sentido uno de los m´as completos ha sido Smalltalk; tambi´en Ada.

Portabilidad de los programas a los distintos sistemas mediante la minimizaci´on y el aislamiento de las partes m´ as dependientes del sistema particular para facilitar su localizaci´on y modificaci´ on f´ acil en los traslados.

Costo de uso, como criterio fundamental que incluye el costo de ejecución (necesidades de hardware y molestias en la instalaci´ on, etc.), de traslación a otros sistemas (mientras más fácil sea mayor el mercado que se abarca), costo de creación, prueba y uso (para la preparación del programador, etc.), costo de mantenimiento (muy variable con cada lenguaje).

3.3

El teorema de las estructuras

3.2.7.

Dominios de las aplicaciones

La elecci´ on del lenguaje depende fundamentalmente del dominio de la aplicación a realizar. Los lenguajes han ido evolucionando en los u ´ltimos 30 a˜ nos tanto por su propia evolución como por la aparici´ on de nuevos dominios y necesidades de los existentes. T´ıpicos dominios son los de los negocios, cient´ıficos, la construcci´ on de sistemas, Inteligencia Artificial, publicación electrónica (que ha hecho imprescindible en los u ´ltimos 20 a˜ nos), proceso de tareas automatizado, programación de la interacción mediante la World Wide Web, nuevos paradigmas de programación en desarrollo. Ver la tabla 1 Cuadro 1: Los lenguajes m´ as adecuados a los diferentes dominios

A˜ nos 60s

Hoy

3.3.

Aplicaci´ on Negocios Ciencias Sistemas IA Negocios Ciencias Sistemas IA Publicaci´ on Procesos Web N. Paradigmas

M´ as importantes COBOL FORTRAN Ensamblador LISP COBOL, Hojas de c´alculo FORTRAN, C, C++ C, C++ Lisp, Prolog procesadores de texto UNIX shell, Tcl, Perl HTML, Java ML, Smalltalk

Otros Ensamblador Algol, BASIC, APL JOVIAL, Forth SNOBOL C, PL/I, 4GLs BASIC, Pascal Pascal, Ada, Modula2 TEX, PostScript Marvel Perl, Tcl Eiffel

El teorema de las estructuras

El término de “Programaci´ on Estructurada” fue introducido por Dijkstra (entre 1965 y 1972) refiriéndose a la necesidad de una programación más metódica y rigurosa. Para unos significó codificar estructuradamente, con determinadas sentencias de control y criterios de estilo y documentación, mientras que para otros fue toda una nueva concepción general de dise˜ no y desarrollo de programas. Objetivos de la programaci´ on estructurada En cualquier caso, la programación estructurada (PE) intenta mejorar el proceso de la programación mediante una adecuada organización de los programas y una mejora de los lenguajes de programación, de forma que pudieran realizarse descripciones claras y precisas de las estructuras de datos y control. Esto lleva a programas más correctos, fáciles de leer y modificar y m´ as fácilmente verificables. Historia

Los momentos m´ as importantes de la PE son los siguientes:

1965 Dijkstra introduce el concepto de PE vágamente y sin demasiado éxito. 1966 Bohm y Jacopini definen un programa estructurado como un programa cuyo flujo de control pudiera expresarse usando s´ olo las tres estructuras básicas de control (secuencia, selección, iteración). De ah´ı probaron el “Teorema de las Estructuras” y suscitaron la polémica del GOTO m´ as adelante. Más adelante mostraremos estas estructuras de control de flujo. 1968 Dijkstra en la ACM publica un art´ıculo contra el GOTO, con resonancia hasta 1975. En 1974, Donald E. Knuth publica un art´ıculo titulado “Structured Programming with GOTO statements”.

3.4

Las estructuras fundamentales de control de flujo

´ Ultimas opiniones sobre goto En cualquier caso Mills (1972) opina que “los programas estructurados deben caracterizarse no simplemente por la ausencia de GOTOs, sino por la presencia de estructura. . . La teor´ıa de la PE se refiere a la conversión de diagramas de flujo arbitrariamente grandes y complejos a formas standard que puedan representarse mediante la iteración y anidamiento de varias estructuras l´ ogicas de control standard más peque˜ nas”. Para hacernos una idea de sus opiniones valgan los siguientes comentarios: Edsger Dijkstra’s Evaluations of Programming Languages (c. 1982) FORTRAN, “the infantile disorder”, by now nearly 20 years old, is hopelessly inadequate for whatever computer application you have in mind today: it is now too clumsy, too risky, and too expensive to use. PL/I – “the fatal disease” – belongs more to the problem set than the solution set. It is practically imposible to teach good programming to students that have had a prior exposure to BASIC: as potential programmers they are mentally mutilated beyond hope of regeneration. The use of COBOL cripples the mind; its teaching should, therefore, be regarded as a criminal offense. APL is a mistake, carried through to perfection. It is the language of the future for the programming techniques of the past: it creates a new generation of coding bums.

Programaci´ on descendente. Wirth Por otro lado, el paradigma de la “Programación Descendente” (PD o Stepwise Refinement) es de Wirth en 1971. Este proceso considera la programación como un proceso anal´ıtico que permite transformar especificaciones en programas. Wirth define ésto en 1974: “La PD es la formulaci´ on de programas como jerarqu´ıas, estructuras anidadas de sentencias, y objetos de computaci´ on”. Jerarquizaci´ on de la estructuraci´ on Para llegar a esta formulación jerárquica es necesario aplicar una serie de refinamientos sucesivos que van desde la especificación del problema hasta su resolución expresada en un lenguaje de programación detallando ya los pasos relativos al dispositivo en que se desarrolla.

3.4.

Las estructuras fundamentales de control de flujo

Las estructuras fundamentales de control de flujo son, como se dijo antes, al hablar del Teorema de Bohm y Jacopini, tres: secuencia, selección o decisión e iteración (repetición o bucle). Cualquier otra forma de control de la ejecución de operaciones se podrá, pues, convertir en éstas. La ventaja de identificar estas y exigir sólo el uso de estas está fundamentalmente en conocer as´ı rápidamente el comportamiento de los programas y en poderlos analizar mejor. 3.4.1.

Secuencia

Cuando un proceso directo, se puede realizar con la información que recibe sin necesidad de desviar los pasos y de una u ńica vez, el proceso es susceptible de ser ejecutado en una operación o, como máximo, en una secuencia de operaciones más sencillas que compongan la acción u ńica total. Los procesos secuenciales, cuando están compuestos por varias acciones, tienen la propiedad de que aquellas acciones se ejecutan cada una detrás de la anterior, nunca de forma simultánea (sino existir´ıa ‘paralelismo’, que es otro tema). Además, y como corolario de lo anterior, hasta que no se termina de ejecutar la instrucci´ on precedente, no se puede ejecutar la siguiente. Normalmente, en programaci´ on, las acciones de los procesos secuenciales se suelen escribir una debajo de la otra acabando, en la mayor´ıa de los lenguajes de programación, cada acción con un signo de punto y coma ‘;’. ... acción 1; acción que sigue a la 1; debo ser la acci´ on 3; ...

3.4

Las estructuras fundamentales de control de flujo

Como regla com´ un, los procesos secuenciales, compuestos de varias acciones simples que son una, continuación de otra, se dan cuando se conoce con precisi´ on el punto de partida y el de llegada. Por ejemplo, tengo dos n´ umeros y quiero obtener su media: se tienen dos n´ umeros y se quiere obtener la media sumar los dos n´ umeros guardando el resultado; tomar el resultado guardado antes y dividirlo por 2 guardando el poner el resultado anterior donde sea conveniente; La ejecuci´ on de estos pasos o acciones se hace temporalmente en orden, cada acción debe agotarse y los resultados de cada acci´ on se van obteniendo “cuando les toca su turno”. No es lo mismo: guardar en r la suma de a y b; guardar en s la suma de r y a; que guardar en s la suma de r y a; guardar en r la suma de a y b; La mayor´ıa de las programas de ordenador son secuencias de instrucciones a las que los programadores se acostrumbran a leer. La lectura es siempre de arriba a abajo y cada instrucción es una l´ınea que, una vez ejecutada, puede haber cambiado el valor o el ‘estado’ de todo el programa. Ese nuevo estado, tras cada acción es el que se encontrará el programador para la acción que venga detrás2 . Un ejemplo de algoritmo secuencial puede ser: c para diestros Algoritmo para abrir un envase TetraBrick Tomar y mantener el envase con la mano izquierda; Aplastar haciendo presión la esquina superior donde viene el dibujito de las tijeras; Doblar el cart´ on hacia un lado por la l´ınea punteada; Enderezar de nuevo el cart´ on; Rasgar el cart´ on por la l´ınea punteada en este ejemplo, el ser humano hace de intérprete y computador. Nótese que cada instrucci´ on de una secuencia será más o menos simple dependiendo del ‘ejecutor’. Se supone, en los algoritmos secuenciales que el ejecutor no fallará en ninguna de las ejecuciones de las acciones. 3.4.2.

Selecci´ on

¿Qué ocurre si pasa algo? Parece una pregunta ambigua, de hecho lo es, pues no hay referencia a nada si no se especifica qué es ese ‘algo’. En general, cada acción de una secuencia, como dijimos antes, puede ser ese ‘algo’ al que nos referimos. Esto es, nos preguntamos, ¿qué ocurre si alguna acción puede dar lugar a distintas formas de ejecutarse? Por ejemplo, si sencillamente tratamos de desarrollar un algoritmo para evaluar las dos raices de una ecuación de segundo grado, tendr´ıamos: dados a, b y c de ax2 + bx + c = 0 encontrar los 2 valores de x que lo satisfacen es un problema mal planteado, en general. Si yo tratase de resolver el problema con el mecanismo particular para el caso de dos raices reales, me podr´ıa encontrar con situaciones erróneas como que a = 0, b2 − 4ac < 0 ´ o a = b = 0, c 6= 0. 2 En los lenguajes declarativos esto no es as´ ı, al menos en teor´ıa, sino que lo que el programador hace es algo m´ as relajadamente, escribir, sin una necesidad tan estricta de orden, sus conocimienos, aserciones, sobre el problema y se deja al ordenador sacar las ‘conclusiones’. En programaci´ on, imperativa, es sin embargo esencial ‘ordenar’ al computador cada acci´ on, una debajo de la otra dici´ endole (como a un subnormal de CI 1) exactamente, qu´ e es lo que debe hacer. Por desgracia, los lenguajes imperativos son los m´ as eficientes y m´ as populares.

3.4

Las estructuras fundamentales de control de flujo

Para que los algoritmos tengan validez dentro de multiples situaciones es necesario que puedan tomar decisiones por s´ı mismos. En el ejemplo anterior tendr´ıamos Algoritmo para resolver CUALQUIER ecuaci´ on de segundo grado si a = b = 0 y c = 0 entonces hacer explicar que la ecuaci´ on es absurda; acabar este algoritmo ya aqu´ı; finsi si a = 0 entonces hacer soluci´ on x es -c/b acabar este algoritmo ya aqu´ı; finsi si b*b - 4*a*c < 0 entonces hacer soluci´ on x1 es (-b + i * Raiz(4*a*c-b*b)/(2*a); soluci´ on x2 es (-b - i * Raiz(4*a*c-b*b)/(2*a); sino soluci´ on x1 es (-b + Raiz(b*b-4*a*c)/(2*a); soluci´ on x2 es (-b - Raiz(b*b-4*a*c)/(2*a); finsi Este ejemplo se parece mucho a lo que es un programa de ordenador, tan sólo que hemos empleado un lenguaje m´ as relajado que el que se emplea en la mayor´ıa de los lenguajes de ordenador. En el ejemplo anterior se toman decisiones. La toma de decisiones permite al algoritmo ser algo más ‘inteligente’ siendo capaz de adoptar una secuencia de acciones u otra seg´ un la situación. Muchos problemas no se podr´ıa algoritmizar sino se hiciese uso de decisiones y esto es debido a que muchos problemas carecen de una solución u ńica, como le sucede al de las ra´ıces de la ecuación de segundo grado, planteado como problema general. La decisi´ on es la instrucci´ on que va a hacer los algoritmos menos mecánicos, alejándolos del t´ıpico uso que se hace de una calculadora, donde las decisiones no las puede tomar la máquina, sino que debe tomarlas el usuario, el humano. De hecho casi se podr´ıa medir la ‘inteligencia’ de un algoritmo, que no es otra que una ‘instantánea’ de la inteligencia del programador, como el n´ umero de decisiones en su programa. Por supuesto esto es sólo una aproximación superficial al tema. Evidentemente, la elecci´ on y el orden adecuado de las instrucciones también denotan mayor o menor ‘inteligencia’. Pero la variedad de respuestas de un algoritmo que admite multiples entradas da idea de un algoritmo ‘el´ astico’, ‘inteligente’. 3.4.3.

Iteraci´ on

Sin la iteraci´ on es imposible escribir ciertos algoritmos. Veamos un ejemplo: supongamos que queremos describir el proceso de sumar N n´ umeros distintos dados. Si sabemos cuántos n´ umeros tenemos, esto es, cu´ anto vale N y los n´ umeros en s´ı, parece que una secuencia de sumas bastar´ıa toma el primero como resultado; suma el segundo al resultado; suma el tercero al resultado; ... suma el N-simo al resultado; Pero, supongamos que no sabemos cuanto vale N . ¿Qué hacer? No tendr´ıamos forma de describir este proceso sin recurrir a la idea de repetir acciones hasta que se dé una cierta condición. Otro ejemplo, supongamos que tenemos que calcular el n´ umero e mediante un algoritmo numérico que utilice la serie de Taylor: 1 1 1 e = e1 = 1 + + + + . . . 1! 2! 3!

3.5

Pseudolenguaje (v. C1.0.1)

Normalmente, como sabemos, el uso de series polinómicas para aproximar una función está condicionado a la rapidez de convergencia de la serie, esto a cuántos términos de tal serie son necesarios para llegar a un valor aceptable de la función; y, esto, depende del valor de cada término, de manera que: hasta que no se tenga un término de menor valor que la precisi´ on buscada se deben seguir tomando términos. Existen muchos procesos en los que se deben ejecutar acciones mientras no se deje de dar una situaci´ on Ejemplos de tales algoritmos hay muchos: “caminar hasta alcanzar la acera” (ó, “mientras no se alcance la acera”, como se prefiera decir); “sacar monedas mientras no se rebase o iguale la cantidad solicitada”; “acumular términos mientras el valor absoluto del término sea superior a la precisión buscada”; etc. Los bucles, repeticiones o iteraciones son combinación de un grupo de acciones que se pretende que se ejecuten, llamado el cuerpo del bucle y de una condici´ on que se deberá cumplir (o dejar de cumplir), para que el cuerpo deje de ejecutarse. Gracias a esta combinación se pueden describir much´ısimos procesos comunes. Los ordenadores son capaces de ejecutar bucles, esto es, repetir un juego de acciones hasta que se deje o se cumpla una condición predeterminada. La comprensi´ on del mecanismo de los bucles es fundamental para avanzar ante problemas básicos de programaci´ on, que son irresolubles sin ellos. Al principio, sin embargo, son algo ‘extra˜ nos’ y dif´ıciles de comprender para los principiantes.

3.5.

Pseudolenguaje (v. C1.0.1)

Para describir una serie de operaciones es necesario conocer el dispositivo que las ejecutará. Sin embargo, independientemente de las acciones finales, estamos viendo que se pueden tener sentencias seguidas; condicionar la ejecución de grupos de sentencias y/o repetir la ejecución de grupos de sentencias. Por otra parte en los dispositivos programables como los ordenadores, vamos a utilizar lugares de memoria sobre los que actuar, leyéndolos y escribiendo sobre ellos. Esta información, datos variables que estar´ an en la memoria del ordenador podrá estar representando n´ umeros aritméticos, o c´ odigos de alg´ un otro tipo de información. Las posibilidades son ilimitadas. Para describir cada variable en un programa utilizaremos nombres inventados seg´ un el programa. Para controlar la forma de ejecución de las acciones utilizaremos palabras reservadas de alg´ un lenguaje. Inicialmente es pues conveniente establecer alg´ un tipo de codificación sencilla, con palabras fácilmente comprensibles del lenguaje natural: este es el pseudolenguaje. Expresiones del lenguaje natural que indiquen la forma de las acciones y del control de flujo del programa. Para las variables igualmente se establecen normas para comprender si estamos trabajando con contenidos aritméticos, valores constantes, códigos de letras ASCII, etc. 3.5.1.

ALGORITMO // Comentarios o bien detr´ as de // o bien /* entre */

Algoritmo identificador declaraciones Inicio acciones Fin. 3.5.2.

DECLARACIONES

Pueden ser de constantes, tipos, variables y funciones. Cada tipo de declaraci´ on ir´ a en su zona, previamente declarada CONST, TIPOS o VAR.

3.5

Pseudolenguaje (v. C1.0.1)

Todas las variables, tipos, constantes y funciones, deben ser declaradas antes de su uso. Las constantes, tipos y variables se pueden declarar varias a la vez, separando en la lista los identificadores por comas. Se pone antes el nombre del tipo de datos y después la(s) etiqueta(s) elegida(s) para nombrarla(s) (si son más de una, separadas por comas). Las variables pueden ser inicializadas en su declaración (ya estén definidas por separados o varias a la vez). Las constantes, como las “variables”, se declaran en la zona de CONSTantes pero siempre van inicializadas a su valor fijado. 3.5.3.

TIPOS

Simples predefinidos: Tipo Natural

S´ımbolo N

Entero

Real L´ogico

R B

Letra

Operadores + - * DIV(/) MOD(%) + - * DIV(/) MOD(%) ABS + - * / Y(&&) O(||) NO(!) CHAR ORD(N)

Para los tipos cuyos valores tienen todos predecesor y sucesor (ordinales), que son N, Z, B y C, tambi´ en se tiene PRED y SUCC.

Otros tipos: Enumeraci´on (identificaci´ on) de valores: Enumerado {CYAN, MAGENTA, AMARILLO, NEGRO} Colores; Arrays (vectores, matrices, hileras): <TipoBase> <nombre>[indiInicio..indiFinal]; // ej.: int cuenta[1..5] = {10, 4, 5, 5, -4}; Cadenas de letras: char cadena[] = "Hola mundo"; char *cadena = "Hola \"mundo\; char cadena[0..100]; // debe terminarse en \0 Registro Registro <declaraci´ onVariable> {<declaraci´ onVariable>} [<Casos> /* sustituyendo acciones por declaraciones */] finRegistro Puntero <TipoApuntado> *PTI; // NODO *ENLACE, *LINK; // N *arrPunt[1..10]; // array de 10 punteros (raro) NOTA: en pseudolenguaje, el contenido de las estructuras se puede copiar, sin embargo no los arrays. Ejemplos:

3.5

Pseudolenguaje (v. C1.0.1)

N *puntero_a_natural; //tipo puntero N array_natural[1..20]; //array de 20 naturales enteros No hacer varias declaraciones en una l´ınea. Utilizar definiciones de tipos y constantes previas. Esto hace m´ as legible y controlable el programa. 3.5.4.

SUBALGORITMOS

ALGORITMO [<TipoQueDevuelve>] identificador( {FormaDePaso <declarVariable>}) <declaraciones> inicio acciones fin identificador Si no devuelve nada se pondr´ a como <TipoQueDevuelve> nulo(void). FormaDePaso puede ser: E, S, o ES que corresponden a entrada, salida y entrada-salida. (NO OLVIDAR PONERLO). 3.5.5.

ACCIONES

Asignaci´ on: a = <expresi´ on>; L´ogica: ==, <, >, !=, <=, >=;

&&, ||, !, Y, O, NO

Selecci´on: si <expresi´ onBooleana> entonces acciones {sinosi <expresi´ onBooleana> entonces acciones} [sino acciones] finsi Iteraci´on: mientras <expresi´ onBooleana> hacer acciones finmientras o bien repetir acciones hasta que <expresi´ onBooleana> Casos especiales con tipos ordinales: Para (for): para <asignaci´ on> hasta <expresi´ on> [paso <constante>] hacer acciones finpara

3.6

Diagramas de Control de Flujo

Filtro (Casos): caso <expresi´ on> sea <rango> : acciones {<rango> : acciones} [sino: acciones] fincaso 3.5.6.

(* <rango> puede ser una lista de constantes *)

Prioridad de operadores

Los par´entesis ()

Operador NO(!) (y los operadores + - unarios -3, !fin)

Operadores multiplicativos: * / DIV MOD(%)

Operadores aditivos: + -

Operadores relacionales: < >= > >=

Operadores de igualdad: == !=

Operador AND&& ´ oY

Operador OR(||) u O

3.5.7.

Acciones

Entre las acciones la m´ as importante es la de asignaci´ on: <identVariable> = <expresi´ on>; La asignación es la operaci´ on m´ as importante de los lenguajes imperativos. En ella la parte derecha del operador =, podr´ a ser cualquier expresión (constante o variable) y será evaluada y asignada a la variable que haya a la izquierda del operador =. Naturalmente a la izquierda sólo puede haber el identificador de una variable adecuada. Como por ejemplo. Asignar, para 3.14 a la variable r: r= 3.14;, 3.5.8. r= y= i= s= y=

Ejemplos de modificaci´ on de variables 3.14; r; i + 1; /* incrementa en 1 el valor de la variable i */ s + n; /* aumenta en n el valor de s */ √ sin(3.14)*sqrt(4.0*z) + 1.0; /* y = sin(3,14) × 4z + 1 */

Ejercicio: ¿C´ omo intercabiar´ıa el contenido de dos variables? O sea, si la variable a y b tienen valores (100 y 200, respectivamente, por ejemplo), queremos realizar acciones para que al final a tenga el anterior contenido de b (200) y b el de a (100).

3.6.

Diagramas de Control de Flujo

Especialmente cuando los algoritmos tienen un flujo de control complicado o para evidenciar ciertas partes delicadas son muy utilizadas formas gráficas de representación en las que cada estructura de control viene reflejada por un s´ımbolo. Hace dos décadas se empleaban con más frecuencia que hoy y se utilizaban m´ as s´ımbolos, pero nosotros simplificaremos a los reflejados en la Figura 3.

3.7

Nociones sobre reconocimiento de lenguajes

Comienzo

Acción

acción de I/O

Decisión

Figura 3: Elementos m´ as comunes en los diagramas de flujo de datos. En muchos casos incluso se reducen al de Acci´ on y al de decisi´ on.

En él se ven, el s´ımbolo de Comienzo (Fig. 4), que indicará el comienzo o fin (es un terminador) de un proceso algor´ıtmico. L´ ogicamente el de comienzo tendrá una flecha de salida y el de Fin una de entrada.

Figura 4: S´ımbolo de comienzo o fin de un proceso.

El s´ımbolo de Acci´ on (Fig. 5), que junto con el de decisión son los más usados para todo. Cuando la acci´ on se quiere detallar con más subacciones que la compongan, se indica mediante alg´ un s´ımbolo convenido, y se desglosa en otra parte.

Figura 5: S´ımbolo de acci´ on de alg´ un tipo. En principio una acci´ on no descomponible, excepto que se indique lo contrario.

El de operaciones de entrada y salida (Fig. 5) puede ser más espec´ıfico indicando si es hacia una impresora, desde un teclado, hacia un disco, etc., pero esto es una convención amplia que se suele establecer en cada grupo de programadores por anticipado. Finalmente la bifurcaci´ on (Fig. 7), que es la más flexible, pudiendo bifurcarse hacia atrás o hacia adelante hacia otros puntos del algoritmo. Pero en programación estructurada sólo ser´ıa admisible una sencilla bifurcaci´ on hacia atras para indicar un bucle o una decisión hacia adelante indicando alternativas, siempre sin cruzar otras l´ıneas de bifurcaci´ on. Ver la Figura 8.

3.7.

Nociones sobre reconocimiento de lenguajes

Supongamos que tenemos un lenguaje generado por la siguiente gram´atica: G = N, T, A, R N = s´ımbolos con <> T = s´ımbolos sin <> A =< sentencia >

3.7

Nociones sobre reconocimiento de lenguajes

Figura 6: S´ımbolo para cualquier operaci´ on de entrada y salida. Se indica como una acci´ on especial dado que involucra un cambio en el control del programa.

Figura 7: S´ımbolo de bifurcaci´ on. En el caso de Fortran ten´ıa tres salidas pues las preguntas eran del tipo x < 0, x = 0 ´ o x > 0. A veces se ampl´ıa para m´ ultiples salidas cada una indicando una posible respuesta a la pregunta indicada.

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12)

<sentencia> ::= <identificador> <asignaci´ on><expresi´ on> <asignaci´ on> ::= = <expresi´ on> ::= <expresi´ on> <m´ as> <expresi´ on> <expresi´ on> ::= <expresi´ on> <por> <expresi´ on> <expresi´ on> ::= <n´ umero> <expresi´ on> ::= <identificador> <m´ as> ::= + <por> ::= * <n´ umero> ::= <d´ ıgito> {<d´ ıgito>} <d´ ıgito> ::= 0 | 1 | 2 | ...| 9 <letra> ::= a | b | c | ...| z <identificador> ::= <letra> {<letra> | <d´ ıgito>}

Las reglas de esta gram´ atica se pueden dividir en dos partes, obteniendo dos gram´aticas ‘complementarias’: los s´ımbolos terminales de la primera son los s´ımbolos no terminales de la segunda. Siendo la primera (1) (2) (3) (4) (5)

::= ::= ::= ::= ::=

identificador asignaci´ on <expresi´ on> <expresi´ on> m´ as <expresi´ on> <expresi´ on> por <expresi´ on> n´ umero identificador

y la segunda (1) (2) (3) (4) (5) (6) (7)

<asignaci´ on> ::== <m´ as> ::= + <por> ::= * <n´ umero> ::= <d´ ıgito> {<d´ ıgito>} <d´ ıgito> ::= 0 | 1 | 2 | ...| 9 <letra> ::= a | b | c | ...| z <identificador> ::= <letra> {<letra> | <d´ ıgito>}

x? =0

Situación?

Figura 8: Algunas variantes que indican bifurcaciones.

3.7

Nociones sobre reconocimiento de lenguajes

Supongamos ahora que en nuestro fichero fuente (programa escrito en nuestro lenguaje ejemplo) está escrita la siguiente frase: nuevo= viejo + razon * 23 Nuestro compilador deber´ a analizar esa frase (leerla y “entenderla”) y generar el código máquina u objeto correspondiente (s´ıntesis). En esquema, un compilador realiza una serie de fases como las representadas en la Figura en Programa fuente

A N Á L I S I S

S I N T E S I S

Análisis lexicográfico Análisis sintáctico

rutinas de errores

Análisis semántico gestión de tablas

generación de código intermedio

Tablas de símbolos otras tablas

Optimización de código Generación de código

Programa objeto

1 2 n

Enlazado o linkado

Ejecutable

Figura 9: Fases de un compilador

las que: An´ alisis lexicogr´ afico Utilizando la parte de la gramática que describe los s´ımbolos no términales directamente en funci´ on de los terminales, genera una serie interconectada de s´ımbolos, denominados ‘tokens’, para la fase siguiente. Además elimina comentarios, espacios en blanco, separadores, tabuladores, localiza s´ımbolos no en el alfabeto y demás errores lexicográficos que se detecten. An´ alisis sint´ actico A partir de los tokens anteriores analiza la estructura de las frases y comprueba la gramática del lenguaje. An´ alisis sem´ antico Comprueba que una frase, correcta sintácticamente, tiene sentido semántico. Por ejemplo, no se puede sumar un objeto de tipo ASCII a uno de tipo entero, aunque la expresi´ on de la suma, la frase, estuviese bien planteada. Generaci´ on de c´ odigo intermedio Se genera un código independiente de la máquina de destino. Este c´ odigo es a´ un de relativo alto nivel y fácil de generar para el lenguaje de trabajo. Depende de la arquitectura del compilador. En nuestro ejemplo:

3.8

Ejercicios

temp1= 23 temp2= id3 * temp1 temp3= id2 + temp2 id1= temp3 OptimizaciÂ´ on de cÂ´ odigo Se eliminan redundancias de operaciones y, quizÂás de datos, segÂ´ un se programe el compilador. Se hacen optimizaciones en los cÂálculos, bucles, etc. En nuestro caso: temp1= id3 * 23 id1= id2 + temp1 GeneraciÂ´ on de cÂ´ odigo Se genera, a partir del cÂódigo intermedio, probÂáblemente optimizado, el cÂódigo final para la mÂ´ aquina. En nuestro caso (pasÂ´ andolo a ensamblador, cercano al lenguaje mÂáquina): MOVE MUL MOVE ADD MOVE

id3, R1 23, R1 id2, R2 R1, R2 R1, id1

Enlazado o linkado Aunque ya no es una fase propiamente de la compilaciÂón, es la fase final de muchos compiladores para dejar el cÂódigo ejecutable. En ella se unen todos los ficheros objeto generados en diferentes etapas de compilaciÂón. En este enlazado se calculan las direcciones de cada rutina que quedarÂ´ a en cada diferente mÂódulo.

3.8.

Ejercicios

. 1 ÂżQuÂé lenguaje genera la gramÂ´ atica siguiente? G = {T, N, P, I} T = a, b N =S I=S P = S ::= ab|aP b| . 2 Dado el lenguaje L = {0m 1|m â&#x2030;Ľ 0}, encontrar la gramÂática, en notaciÂón BNF, que lo genera. . 3 Dado el lenguaje L = {an |n Ăˇ 3}, encontrar la gramÂática, en notaciÂón BNF, que lo genera.3 . 4 Dado el lenguaje L = {an bm |m > n}, encontrar la gramÂática, en notaciÂón BNF, que lo genera. . 5 Proponer una gramÂ´ atica en notaciÂ´ on BNF que genere el siguiente lenguaje: L = {anâ&#x2C6;&#x2019;1 bn+1 }. . 6 Construye la gramÂ´ atica que generarÂ´Äąa el lenguaje L = {an cb3n |n â&#x2030;Ľ 0}. . 7 DiseË&#x153; na una gramÂ´ atica que genere un lenguaje formado por palabras que contengan u Âńicamente las letras a y b en cualquir orden, pero de forma que en cada palabra haya el mismo nÂ´ umero de as que de bs. Por ejemplo, las palabras abab, aabb, babaab pertenecen al lenguaje, pero ababa no ya que en ella hay 3 apariciones de a y 2 de b. 3 El

sÂ´Äąmbolo a Ăˇ b indica que b divide a a.

REFERENCIAS

. 8 Definir en BNF o mediante diagramas sintácticos la gramática que genere las sentencias del siguiente lenguaje L = {an b2n c3n |n ≥ 0}. Las sentencias de este lenguaje son aquellas que están compuestas por una serie de letras a seguidas por el doble de letras b y terminadas por el triple de letras c; como por ejemplo abbccc, aabbbbcccccc, etc. . 9 Construir una gram´ atica capaz de generar un lenguaje en el que no existiesen las cadenas ‘abc’, pero s´ı cualesquiera otras de cualquier longitud. Por ejemplo, correcto: ‘xxaaacbbb’, incorrecto: ‘mnoabcquenoqueno’. 3.8.1.

Referencias de consulta

Para el tema de los tipos de lenguaje se ha seguido el cap´ıtulo primero de la excelente obra [PZ96] y tambi´en el primero de [AV97]. El cap´ıtulo 6 de [AV97] es una buena referencia para la teor´ıa de gram´aticas. El cap´ıtulo 2 de [Pit92] es totalmente aprovechable. As´ımismo el cap´ıtulo 3 de [Ben90].

Referencias [AV97] Doris Appleby and Julius J. VandeKopple. Programming Languages. Paradigm and Practice. McGraw-Hill, 2nd edition edition, 1997. [Ben90] J.P. Bennett. Introduction to Compiling Techniques. McGraw-Hill, 1990. [Cho56] N. Chomsky. Three models for the description of language. IRE Trans. Inf. Theory, 2(2):113–124, 1956. [Cho63] N. Chomsky. Handbook of Mathematical Psichology, chapter 2. Formal properties of grammars, pages 323–418. John Wiley, and Sons, New York, 1963. [Pit92]

Thomas Pittman. The Art of Compiler Design. Prentice-Hall International, Inc., 1992.

[Pos43] E. Post. Formal reductions of the general combinatorial decision problems. Am. J. Math., 65:197–215, 1943. [PZ96]

Terrence W. Pratt and Marvin V. Zelkowitz. Programming Languages. Design and Implementation. Prentice-Hall, 2nd. edition edition, 1996.

[Sam69] J. Sammet. Programming Languages: History and fundamentals. Prentice-Hall, 1969.

Juan Falgueras Dpto. Lenguajes y Ciencias de la Computaci´ on Universidad de M´ alaga Despacho 3.2.32