Page 1

VOLUME 1 • ISSUE2

DECEMBER 2011

Second Issue

Bilingual Journal

Journal of the SISOB Project ISSN : 2174-7911


Editor: Beatriz Barros Executive Editor: Inés Méndez Journal layout: Inés Méndez Place of edition: Málaga Publishing Entity: Departamento de Lenguajes y Ciencias de la Computación de la Universidad de Málaga ISSN: 2174-7911 Collaborators: • Universidad de Málaga • Consejería de Economía, Innovación y Ciencia de la Junta de Andalucía • Universität Duisburg-Essen • Institute for Research Organization, Hungarian Academy of Sciences • Frontiers Research Foundation • Fondazione Rosselli • Red de Indicadores de Ciencia y Tecnología • University of Ljubljana • Universidad de Granada Template courtesy of designfreebies.org (www.designfreebies.org) Editor: Beatriz Barros Editor ejecutivo: Inés Méndez Maquetación: Inés Méndez Lugar de edición: Málaga Entidad editora: Departamento de Lenguajes y Ciencias de la Computación de la Universidad de Málaga ISSN: 2174-7911 Colaboradores: • Universidad de Málaga • Consejería de Economía, Innovación y Ciencia de la Junta de Andalucía • Universität Duisburg-Essen • Institute for Research Organization, Hungarian Academy of Sciences • Frontiers Research Foundation • Fondazione Rosselli • Red de Indicadores de Ciencia y Tecnología • University of Ljubljana • Universidad de Granada Plantilla cortesía de designfreebies.org (www.designfreebies.org)

SISOB Consortium 2011-2013. The SISOB project is supported by the European Commission, call FP7-SCIENCE-IN-SOCIETY-2010-1, as a Collaborative Project under the 7th Framework Programme, Grant agreement no.: 266588

2


WELCOME TO

Bilingual Journal

CONTENT

CONTENIDO

4

Welcome

5

Bienvenida

6

Interview with Mario Albornoz

7

Entrevista a Mario Albornoz

13

Indicators and Measurements

13

Indicadores y medidas

18

Visualization for Supporting Scientific Information

18

Visualización como apoyo a la información científica

26

The Role and Impact of Researchers Mobility

27

El rol e impacto de la movilidad de los investigadores

31

Peer Reviewing

31

Revisión por pares

38

Information Extraction

39

Extracción de información

49

Generating Conceptual Maps from Web-Based Information

49

54

Second Plenary Meeting

Generación de mapas conceptuales a partir de información en la web

55

Third Plenary Meeting

54

Segunda reunión plenaria

56

Call for Papers: 23rd International Conference ACM Hypertext and Social Media

55

Tercera reunión plenaria

56

Call for Papers – 23 Edición de la Conferencia Internacional ACM de Hypertexto y Medios sociales

57

Call for Papers BRICK

58

Dissemination

57

Call for papers BRICK

59

Related Projects

58

Diseminación

59

Proyectos relacionados

3


WELCOME TO SISOBSERVER Dear Readers, As the SiSOB research team we have the pleasure to present the second issue of SiSOBserver. The journal is published twice a year and its purpose is to share the project’s results. We would like it to serve as a forum for exchanging ideas and experience with our readers, especially those involved in the processes of knowledge sharing. One of the authors who contributed to the present issue of the journal is Mario Albornoz, the coordinator of The Network for Science and Technology Indicators –Ibero-American and InterAmerican (RICYT) and the Observatory for Science, Technology and Society (OEI). In his article, Albornoz shows us his perspective on scientific information systems and their impact on science and society. In addition, the issue contains a contribution prepared by our partners at the Institute for Research Organization (IRO), which offers systemization of models, indicators and measures carried out with the aim of finding out the relationship between the existing solutions and scientific and technological dimensions. The authors discuss also models, indicators and measurements related to the SISOB platform, as well as development of new solutions, specially designed to match the needs of the project. Another interesting contribution is the work on

4

visualization as a tool for knowledge sharing in an intuitive and compact form, carried out at the University of Málaga. Thanks to visualization, we can represent large amounts of qualitative and quantitative data as graphs which are concise and easy-to-follow. The Rosselli Foundation (FR) provides us with the analysis of how researchers’ mobility stimulates scientific production and knowledge sharing--the key factors in any country’s scientific policy. The representative of the Andalusian Ministry of Economy, Science and Innovation (CICE) takes a closer look on the process of peer review, emphasizing the importance of tailoring it to researchers’ needs and putting quality above prestige and quantity. The last two articles talk about extracting information from the WWW, and generating contextual maps. The contributors are the University of Málaga and RICYT, respectively. To sum up, we believe that the above-mentioned material covers the work we are doing now within SiSOB. We hope that the remaining information, news and events will also be of interest to you, dear readers. As always, we are looking forward to your opinions and suggestions. Beatriz Barros


BIENVENIDOS Estimados lectores: El equipo investigador del Proyecto SISOB tenemos la satisfacción de presentar el segundo número de SISObserver, que tal como nos comprometimos al inicio de esta andadura contaría con una edición bianual con el objeto de difundir las tareas y los resultados obtenidos, al mismo tiempo que pretende erigirse como plataforma y foro para intercambiar ideas y experiencias con nuestros interlocutores, especialmente todos los agentes involucrados en el proceso de construcción y divulgación del conocimiento científico. En este número contamos con la inestimable aportación de Mario Albornoz, Coordinador de la RICYT y del Observatorio Interamericano de Ciencia, Tecnología e Innovación (OEI) que nos muestra su punto de vista acerca de los sistemas de información científica, su impacto en el propio sistema científico y, por supuesto en la sociedad en su conjunto. Junto a esta, se ha realizado una importante tarea de reflexión sobre los temas que en este momento se están desarrollando en el proyecto. En primer lugar, el trabajo de nuestros socios del Institute for Research Organization (IRO) se diri¬ge a la sistematización de modelos, indicadores y medidas, con el objetivo de descubrir la relación entre las aproximaciones existentes y las dimensiones respectivas de Ciencia y Tecnología, debatir sobre modelos, indicadores y medidas relevantes para la plataforma SISOB basados en las aproximaciones anteriores y, preparar el desarrollo de “aproximaciones ausentes” referidas a aspectos relevantes de SISOB.

lo suficientemente eficiente como para sintetizar y comprender cantidades de información de carácter cuantitativo y cualitativo. Desde la Fundación Rosselli (FR) plantean un análisis del impacto y el rol de la movilidad de los investigadores, como elemento de gran importancia para incentivar la producción científica y la transferencia de conocimiento y que, sin duda, debe ser una prioridad en las políticas científicas de los países y regiones. Desde la CEIC se analizan los procesos de revisión por pares, destacando la importancia de plantear una transformación y adecuación de estos procesos adaptándose a las necesidades reales de los investigadores, los cuales demandan procesos que primen la calidad, frente al “reconocido prestigio” y la cantidad. Los dos últimos artículos presentan desde el espacio de trabajo Web, tanto la extracción de información como la generación de mapas contextuales, trabajos que proceden de la Universidad de Málaga y la RICYT. En resumen, pensamos que estos contenidos recogen de forma bastante completa el trabajo que estamos desarrollando. De la misma forma, esperamos que el resto de informaciones, noticias, eventos, etc. sea de su interés. Por supuesto, quedamos a la expectativa de sus aportaciones y sugerencias para los próximos números. Como siempre: mantenemos nuestra puerta virtual abierta a todos ustedes!! Beatriz Barros

En segundo lugar, se presenta el trabajo realizado en la Universidad de Málaga acerca de la importancia de la visualización con el objeto de realizar una transmisión de conocimiento de forma intuitiva y condensada; para ello se ha de proporcionar un despliegue gráfico que ofrezca una representación

5


INTERVIEW WITH

MARIO ALBORNOZ AND RODOLFO BARRERE Mario Albornoz is a professor of Philosophy and an expert on policies for science, technology and higher education. He lived in Spain between 1976 and 1984, where he was a consultant to the Cabinet of Studies of the Higher Council for Scientific Research. In 1985 he was Director of Regional Centres of CONICET, and between 1986 and 1994 he was Secretary of Science and Technology of the University of Buenos Aires. He is a researcher for CONICET and coordinator of the Ibero-American Network of Science and Technology Indicators (RICYT). He also coordinates the program of the Ibero-American Observatory of Science, Technology and Society, belonging to the Organization of Ibero-American States (OEI). He is also a member of Centro REDES, and was its Head since its creation, in 2002, till 2007. He is the director of the Master’s Program on Management of Science, Technology and Innovation, jointly established by the National University of General Sarmiento, the Institute for Economic and Social Studies (IDES) and Centro REDES. In 2007, the OEI distinguished him with the award “Pensar en Español”, owing to his activities in favour of Ibero-American cooperation, and in 2008 the Kingdom of Spain awarded him the Officer Cross of the Order of Isabel la Católica. Rodolfo Barrere holds a PhD in Social Sciences from the National University of Quilmes (Argentina). Currently he is the director of the REDES centre and the technical secretary of the Network for Science and Technology Indicators Ibero-American and Inter-American (RICYT) He has participated and coordinated various research projects and acted as consultant to various international organizations such as OECD, UNESCO, IDB, World Bank and the European Union.

6


Mario Albornoz es catedrático en filosofía y experto en políticas científicas, tecnológicas y de educación superior. Ha vivido en España de 1976 a 1984, siendo consultor del Gabinete de Estudios del Consejo Superior para la Investigación Científica. En 1985 fue director de los centros regionales de CONICET, y entre 1986 y 1994 fue secretario de ciencia y tecnología en la Universidad de Buenos Aires. Es investigador de CONICET y coordinador de la Red Iberoamericana de Indicadores de Ciencia y Tecnología (RICYT). También coordina el programa del Observatorio Iberoamericano de la Ciencia, la Tecnología y la Sociedad, que pertenece a la Organización de los Estados Iberoamericanos (OEI). Mario Albornoz es también miembro del Centro REDES, y ha sido su director desde su creación, en 2002, hasta 2007. Es director del programa de Máster en Gestión de la Ciencia, la Tecnología y la Innovación, creado conjuntamente por la Universidad Nacional del General Sarmiento, el Instituto de Estudios Económicos y Sociales (IDES) y el Centro REDES. En 2007, el OEI le distinguió con el premio “Pensar en Español“, por sus actividades en favor de la cooperación Iberoamericana. En 2008 el Reino de España le premió con la Cruz de la Orden de Isabel la Católica. Rodolfo Barrere es doctor en ciencias sociales por la Universidad Nacional de Quilmes (Argentina). Actualmente es director del Centro REDES y secretario técnico de la Red Iberoamericana de Indicadores de Ciencia y Tecnología (RICYT). Ha participado y coordinado diversos proyectos de investigación y consultoría para distintos organismos internacionales como OCDE, UNESCO, BID, Banco Mundial y la Unión Europea.

ENTREVISTA A

MARIO ALBORNOZ Y RODOLFO BARRERE

7


“In some Latin American countries there is more capacity for managenent than of production of knowledge” Measuring science, surveying indicators and drawing relevant information from them about the state of a region as regards research and development (R&D) is a complex task. This is more so when the region is Latin America for heterogeneity is a main trait there. For example, some Latin American countries have a long tradition regarding management and scienti c production and others are at an embryonic stage. Furthermore, neither the region’s problems are the same for each country, nor the potential solutions to them. These topics are central to the present interview with Mario Albornoz, Coordinator of the Networks on Science and Technology Indicators (RICYT) and of the Ibero- American Observatory on Science, Technology and Society (CAEU-OEI), and with Rodolfo Barrere, Technical Secretary of RICYT and Director of Centro REDES. It has been sixteen years that the RICYT has brought all the Latin American countries together along with Spain and Portugal, to promote the development and utilisation of instruments for the measurement and analysis of science and technology (S&T) in Iberoamerica within a frame of international cooperation aiming at improving our knowledge about them and deepening their use as political instrument for decision making. The interviewees talked about the present of the policies in science, technology and innovation in the Latin American countries; their history along the twentieth and the beginning of the twentyrst century; the role of Brazil in the state of S&T in the continent; the difficulties to measure the social appropriation of knowledge; the relationship between science and means of communication; the relevance of the systems of scienti c information; the impact of the existence of repositories of research papers; and, among other topics, the necessity of strengthening the networks of international cooperation.

“En algunos países de América Latina hay más capacidad de gestión que de producción del conocimiento” Medir la ciencia, relevar indicadores y extraer de ellos información relevante sobre el estado de una región en materia de investigación y desarrollo (I+D), es una tarea compleja. Y más si la región es América Latina, donde la heterogeneidad es una característica primordial. Mientras algunos países de América Latina cuentan con una larga tradición en materia de gestión y producción cientí ca, también existen países pequeños y aún embrionarios en estas cuestiones. Los problemas que aquejan a la región no son iguales para todos, y lo mismo ocurre con las posibles soluciones a esos problemas. Sobre este eje gira el diálogo que mantuvo este medio con Mario Albornoz, coordinador de la Red de Indicadores de Ciencia y Tecnología (RICYT) y del Observatorio Iberoamericano de Ciencia, Tecnología y Sociedad (CAEU-OEI), y Rodolfo Barrere, secretario técnico de la RICYT y director del Centro REDES. Desde hace dieciséis años, la RICYT congrega a todos los países de América, junto con España y Portugal, para promover el desarrollo y el uso de instrumentos para la medición y el análisis de la ciencia y la tecnología en Iberoamérica, en un marco de cooperación internacional, con el objetivo de profundizar en su conocimiento y utilización como instrumento político para la toma de decisiones. A continuación, los entrevistados discuten sobre el presente de las políticas de ciencia, tecnología e innovación en los países latinoamericanos, su historia a lo largo del siglo XX y comienzos del siglo XXI, el rol de Brasil en la ciencia y la tecnología del continente, la di cultad de medir la apropiación social del conocimiento, la relación entre la ciencia y los medios de comunicación, la relevancia de los sistemas de información cientí ca, el impacto que han generado los repositorios de artículos de investigación y la necesidad de fortalecer las redes de cooperación internacional, entre otros temas.

8


Q: What is your opinion about the current situation of the scientific policies in Latin America? MARIO ALBORNOZ: There is a quintessential feature to bear in mind: that is, the great heterogeneity of the countries that make up the region. Proof of this diversity is, for example, the fact that almost ninety percent of the total Latin American investment in R & D is made by three countries, Brazil, Mexico and Argentina, whereas the remaining 10% is made by six countries of middle level: Venezuela, Colombia, Chile Uruguay, Peru, Costa Rica and, perhaps, also Panamá. As for the rest of the countries of the region, the production of scientific and technological knowledge is just beginning. On the other hand, Brazil alone accounts for more than twice the total investment in R&D in Latin America. It is worthy of notice that, regardless of the above-mentioned heterogeneity, S&T policies began

being implemented almost at the same time as the institutionalisation of these policies elsewhere in the world. During post-war years, the predominant thought in Latin America was linked to the theory of development, framework within which S&T held a place of privilege. Accordingly, very early many countries, notably the biggest, built institutions to promote S&T activities thereby enhancing these capacities, such as, for example, incentives granted to agricultural and livestock technologies. Since the early twentieth century, many countries in Latin America encouraged the creation of agricultural technological centres. In Argentina, the first experimental stations that accompanied the development of the region’s agricultural and livestock production were created in

1908. From the 1950s onwards, the biggest countries of the region started to establish technological institutes, such as, for example, the National Institute of Industrial Technology (INTI) and the National Institute of Agricultural and Livestock Technology (INTA), both Argentinian. Likewise, national boards for S&T began being created in most of the region’s countries. So intense were these developments that an expert in the field used to say that in Latin America there were more scientific politics than science. This was not entirely fair, though, for in those years many research groups capable of producing relevant and solid knowledge began to appear in the main public universities of the region.

P: ¿Cuál es su opinión acerca de la actualidad de las políticas científicas en América Latina? MARIO ALBORNOZ: Hay un rasgo esencial a tener en cuenta: la gran heterogeneidad de los países que componen la región. Prueba de esta diversidad es que casi el noventa por ciento de la inversión total de América Latina en I+D es realizada por tres países: Brasil, México y Argentina. El porcentaje restante se distribuye en una media docena de países de nivel intermedio: Venezuela, Colombia, Chile Uruguay, Perú, Cosa Rica y, quizás, también Panamá. Los demás se encuentran en una fase de producción de conocimiento científico y tecnológico todavía incipiente. Y de los tres primeros, por otra parte, Brasil por sí solo representa más de la mitad de la inversión latinoamericana. Otro punto importante a señalar es que, más allá de la heterogeneidad mencionada, las políticas de ciencia y tecnología son de antigua data.

Es decir, han comenzado a ser implementadas con muy poca diferencia de tiempo de lo que fue la institucionalización de las políticas en el resto del mundo. En los años de la posguerra el pensamiento predominante en América Latina estaba vinculado a la teoría del desarrollo, en cuyo marco la ciencia y la tecnología tenían un lugar de privilegio. De modo que muchos países, en especial los más grandes, potenciaron muy tempranamente sus capacidades científicas y tecnológicas al crear las instituciones pertinentes para realizar este tipo de actividades. El estímulo de la tecnología agropecuaria es un ejemplo de esto. Varios desde muy temprano en el siglo XX han impulsado la creación de centros tecnológicos dedicados al agro. En Argentina, ya a partir de 1908 empezaron a crearse las primeras estaciones experimentales

que acompañaron el desarrollo de la producción agropecuaria de la región. Luego, a partir de la década del cincuenta, los países más grandes fundaron algunos institutos tecnológicos, como por ejemplo el Instituto Nacional de Tecnología Industrial y el Instituto Nacional de Tecnología Agropecuaria, ambos argentinos. También comenzaron a ser creados, en casi todos los países, los consejos nacionales de ciencia y tecnología. Había ya mucho movimiento, al punto que un experto de aquellos años ironizaba que en América Latina había más políticas científicas que ciencia. Esto no era del todo justo, ya que en aquellos años también comenzaron a ser creados varios grupos de investigación capaces de crear un cúmulo de conocimiento interesante y sólido en las principales universidades públicas. 9


Q: And what happened next? MA: During the decades of the 1980s and 1990s much of the importance formerly attached to these policies was gone. At that time, there was a feeling of great disbelief basically because the model of development based on industrialisation through import substitution could not resist the transformation of the world economy unfolding since the 1970s. These were the years of the hegemony in the region of the principles of the Washington Consensus, namely, the reduction of the state, privatisations and complete trade liberalisation, among other policies, which form part of the neoliberal agenda; the consequence was a decrease in the growth rate. For example, Brazilians dub the decade of the 1980s ‘the lost decade’, meaning that it was a time when it was very hard to obtain funding for S&T projects. As for the whole region, the first years of the decade of the 1900s were in general of little activity. However, during the last years of the twentieth century a meaningful change began: on the one hand, the Latin American countries ended the neoliberal phase of their economic policies; on the other, the idea of mobilising the endogenous capacities to propel economic and social development gained strength. The emergence of new technologies was also a factor playing a part in this process. All this made the countries to bring to the fore their interest in scientific and technologic policies. However, there is one more factor that should be mentioned: in Latin America, on many occasions, these processes were inspired by exogenous components or imitative attitude. During those years, the international credit organisations, particularly the Inter-American Development Bank (IDB) and the World Bank, started granting loans to the govern-

10

ments of the region to help them strengthen their capabilities for knowledge production and management policies. The politics of innovation were, in great measure, created as a result of these sources of funding and with not much thought. In other words, not only did banks offered loans; they also indicated the type of instruments that had to be applied –the latter, especially in small countries with low capacity of negotiation. As a result, there was a sort of “mimetism” easy to be verified: nowadays, agencies, funding and other instruments aiming at development and innovation proliferate, even in countries where the scarcity of innovative entrepreneurs is a central feature. Today, the panorama is that debates and questions that influence scientific and technological policies in Latin America still need to be settled; in other words, they are still open. Bigger countries aside, it is possible to say that some countries have higher capacity of management of their S&T policies than of their production of knowledge. There is an important infrastructure that shows the effort being made in order to create bureaucratic channels to allow the promotion of activities, but that is almost all by now. RODOLFO BARRERE: Another “detail” is that the mimetic behaviour happens even in vis-à-vis countries of the same region. For example, nowadays it is appealing to have at the state’s disposal “sectorial funds”, like those created by Brazil to mobilise resources of the private sector. However, in many occasions, these resources are created with funding from the IDB, something that underplays one of their main characteristics.


P: ¿Qué ocurrió después? MA: Lógicamente, en las décadas del ochenta y del noventa hubo una retracción de la importancia que se le daba a estas políticas. Primó en esa época un gran descreimiento, fundamentalmente porque el modelo del desarrollo basado en la industrialización sustitutiva de importaciones no pudo resistir la transformación de la economía internacional propia de la década del setenta en adelante. Fueron los años de hegemonía en la región de los principios establecidos en el “consenso de Washington”: reducción del estado, privatizaciones, apertura total del comercio y otras cuestiones que integran la agenda del neoliberalismo. El resultado fue una reducción del crecimiento. Los brasileños, por citar un caso, llaman a los ochenta “la década perdida”, un tiempo en el cual se hizo muy difícil conseguir financiación para proyectos de ciencia y tecnología. Y en el conjunto de la región, los primeros años de los noventa también fueron épocas de escasa actividad. En los últimos años del siglo veinte, sin embargo, empezó a producirse un cambio significativo. Por una parte, los países latinoamericanos dieron por terminada la fase neoliberal de sus políticas económicas; y por otra, retomó fuerzas la idea de movilizar las capacidades endógenas para impulsar el desarrollo económico y social. También el surgimiento de las nuevas tecnologías tuvo mucho que ver en este proceso. Todo esto hizo que los países reflotaran su interés por las políticas científicas y tecnológicas, aunque habría que agregar otro factor relevante. En América Latina muchas veces estos procesos fueron inspirados por componentes exógenos o imitativos. Por esos años, los organismos internacionales de crédito comenzaron a conceder, sobre todo el Banco Interamericano de Desarrollo (BID) y el Banco Mundial (BM), muchos préstamos a los

gobiernos para que fortalecieran sus capacidades de producción de conocimiento y también de gestión de políticas. Las políticas de innovación fueron instaladas, en gran medida y sin mucha reflexión, a impulsos de estas fuentes de financiamiento. Es decir: los bancos no sólo entregaban dinero, sino que además, especialmente en países pequeños e incapacitados para negociar, indicaban el tipo de instrumentos que debían ser aplicados. De esta manera se dio un cierto mimetismo que es bastante fácil de verificar: hoy proliferan las agencias, los fondos y otros instrumentos que apuntan al desarrollo y la innovación, aún cuando en muchos de los países la carencia de empresarios innovadores es una característica prominente. El panorama general es que todavía resta dar un cierre a discusiones e incógnitas que no están saldadas y que influyen en las formas de las políticas científicas y tecnológicas latinoamericanas. Es un tema que permanece abierto, digamos. Si excluimos a los países grandes, todavía es posible decir que algunos países tienen más capacidad de gestión de políticas de ciencia y tecnología, que de producción del conocimiento. Hay una infraestructura importante que nos indica el esfuerzo que se está invirtiendo en generar canales burocráticos que permitan impulsar actividades, pero eso es casi todo por ahora. RODOLFO BARRERE: Otro detalle es que la mímesis se da incluso entre los países de la misma región. Ahora, por ejemplo, se ha hecho atractivo contar con “fondos sectoriales” como los creados por Brasil para movilizar recursos del sector privado, sólo que muchas veces estos nuevos fondos son creados con financiamiento del BID, lo que le quita uno de sus rasgos fundamentales. 11


Q: You just mentioned Brazil’s leadership in investment in R&D. Is the place that this country occupies in Latin America a consequence of the difference in magnitude compared to the rest of the countries of the region? RB: The fact that Brazil “invents” its own ways of funding research could be read as a signal that there is something additional, that Brazil is doing something differently. Some of Brazilian indicators are already beginning to show European-like results. Brazil is already emerging with a profile similar to that of the most developed countries. MA: In fact, the news these days is that Brazil has overtaken the United Kingdom as the world’s sixth economy. Regarding investment in S&T, Brazil is the only country of the Latin American and the Caribbean region that invests more than 1% of its GDP (Gross Domestic Product). Therefore, it, somehow, becomes pointless to differentiate quantitative from qualitative measurements given that, with rates like these, what is quantitative becomes qualitative. It is not about Brazil being stronger; it is about the fact that Brazil began to be different from the neighbouring countries. Brazilians have known this for some decades now; they modified the university structure, created a massive scholarship system, faced up to the deficit in human resources and solved it. It is a long-run effort that started many years ago. P: Acaba de mencionar el liderazgo abrumador de Brasil en materia de inversión en I+D. ¿El lugar que ocupa este país en América Latina se debe sólo a un diferencial de magnitud respecto de los demás? RB: El hecho de que Brasil “invente” sus propias formas de financiar las investigaciones puede ser tomado como una señal de que hay algo más, de que Brasil está haciendo algo distinto. Algunos de sus indicadores ya están empezando a arrojar resultados de nivel europeo. Brasil ya va asomando con un perfil que se asemeja a los de países de mayor desarrollo. MA: De hecho, la noticia de estos días es que Brasil ha desplazado a Inglaterra como la sexta economía del mundo. En materia de inversión en ciencia y tecnología es el único país de América Latina y el Caribe que invierte más del uno por ciento de su producto interno en I+D. De modo que ya no tiene mucho sentido diferenciar lo cuantitativo de lo cualitativo. Con estos índices lo cuantitativo ya es cualitativo. No se trata sólo de que Brasil sea más, cuanto que comienza a ser cualitativamente distinto a sus países vecinos. Esto los brasileños lo tienen muy claro desde hace décadas: reformularon su estructura universitaria, lanzaron un sistema de becas multitudinario, afrontaron su déficit en recursos humanos y lo superaron. Se trata de un esfuerzo de largo aliento, que viene desde hace años.

12


Q: What do you think about the social appropriation of knowledge in the region? P: ¿Cuál es su reflexión acerca de la apropiación social del conocimiento en la región?

MA: The debate about this question implies taking a position with respect to the fact that, in order for knowledge to be diffused, it is required that society has a proactive attitude that might allow it to appropriate that knowledge. The problem lies in that this is hardly verifiable through macro indicators. Indeed, it is possible to say that countries, particularly the most developed ones, invest in S&T because they seek to obtain economic, political and social benefits. Therefore, even though it is claimed that basic research is a “pure” and uninterested form of expanding the frontiers of knowledge and of acquiring further knowledge about the world, countries do not mobilise for such noble reasons. Therefore, not only should the success of these policies be measured by results, but also by the way in which results impact on society: whether or not enterprises become more innovative, whether or not the organisations of the civil society become more dynamic and whether or not the social policies become more effective. It would be very important to have a clear vision of the impact; however, this is difficult to be measured. The feeling, in general, is that the transference to society is not consistent with the effort, big or small, made to fund S&T activities. Nevertheless, it would be a mistake to ascribe such deficit in fundingto the S&T system given that there are many intermediaries in the path between laboratories and enterprises, municipalities or social organisa-

tions. There should be, for example, innovative entrepreneurs, yet they do not abound in Latin America; thus, there is a culture that has to be changed. And, although it is complicated in terms of measurements to have macro-level results, it is indeed not hard to come across good examples at the level of the entrepreneurial sector –public or private– improvements of the populations’ health or the performance of the agricultural and livestock sector, just to mention a few examples. On the other hand, there is a new phenomenon happening at the Latin American universities today: the entrepreneurship of the young graduates. Nowadays, there are many successful cases of technology -based industries that appear nearby the main universities of the region. This can lead to a new wave of more innovative entrepreneurs. Nevertheless, we still have to see how they evolve. Regarding the main scientific debates, such as the creation of mother cells, the desertification or the greenhouse effect, it can be said that something is changing in Latin America as public opinion has not been very much concerned about these topics until recently. Nowadays, our countries are experiencing important improvements regarding citizen involvement: people are more inclined to discuss the consequences of certain phenomena related to the advancement of knowledge.

MA: El debate sobre esta cuestión implica una toma de posición respecto a que el conocimiento, para ser difundido, requiere una actitud proactiva por parte de la sociedad que le permita apropiar ese conocimiento. El problema radica en que esto es difícilmente comprobable a través de indicadores macro. Sí se puede decir que los países, sobre todo los más avanzados, invierten en ciencia y tecnología porque quieren obtener beneficios económicos, políticos y sociales. Por lo tanto, aunque se reivindique la investigación básica como una forma “pura” y desinteresada de expandir las fronteras del conocimiento y de saber más acerca del mundo, los países no se movilizan por motivos tan nobles. De tal manera, el éxito de las políticas se debe medir no solamente por el resultado, sino por la forma en que este resultado impacta en la sociedad: si las empresas se hacen más innovadoras o no, si las organizaciones de la sociedad civil se vuelven más dinámicas y si las políticas sociales se vuelven más efectivas. Tener una visión clara de este impacto sería fundamental, pero es difícil de medir. En general, da la sensación de que no hay una transferencia a la sociedad acorde con el esfuerzo, grande o chico, que se haya realizado para financiar las actividades científicas y tecnológicas. Sin embargo, sería un error atribuir tal déficit de aplicación al sistema científico y tecnológico, porque en el camino del laboratorio a las empresas, a los

municipios o a las organizaciones sociales hay muchísimos otros actores intermediarios. Tiene que haber empresarios innovadores, por ejemplo, y esto no abunda en América Latina. Hay una cultura que se hace necesario cambiar. Y aunque en términos de medición sea complicado dar un resultado a nivel macro, uno sí puede encontrar experiencias virtuosas, tanto al nivel del sector empresarial, público o privado, como al nivel de mejoras en la salud de la población o en el rinde la producción agropecuaria, por mencionar algunos ejemplos. Hay, por otra parte, un movimiento creciente en las universidades latinoamericanas: el emprendedurismo de los jóvenes graduados. Se están produciendo muchas experiencias exitosas de empresas de base tecnológica que brotan alrededor de las principales universidades de la región. Esto puede dar lugar a una nueva ola de empresarios más innovadores, pero todavía hay que ver cómo evolucionan. En cuanto a los grandes debates científicos, la creación de células madre, la desertificación o el efecto invernadero, temas sobre los que la opinión pública latinoamericana no estaba muy preocupada hace algunos años, la situación está cambiando. En estos momentos se registran grandes avances en lo que hace a la participación ciudadana en nuestros países. Hay una mayor propensión a discutir acerca de las consecuencias de determinados fenómenos vinculados con el avance del conocimiento. 13


Q: What is the role played by means of communication? P: En ese sentido, ¿qué rol ocupan los medios de comunicación? MA: Some years ago, in a good deal of the Latin American press the only scientific news that one could find were articles about health topics. Today, scientific news has a growing presence and even some newspapers publish scientific supplements. The role of the media is vital because S&T affects us all, for good or for bad, and because we need channels through which information could circulate clearly, concisely and well explained for the citizens to be able to express their opinions and stand up for them.

MA: Hace algunos años, en buena parte de los periódicos latinoamericanos lo más parecido a una noticia científica que se encontraba era un artículo sobre algún tópico de salud. Hoy las noticias científicas tienen una relevancia creciente e incluso algunos medios ya cuentan con suplementos específicos. El papel de los medios es vital porque la ciencia y la tecnología nos afectan –para bien y para mal-, y porque necesitamos de canales por donde la información llegue clara, concisa y lo mejor explicada posible para que los ciudadanos puedan opinar y sostener posiciones.

RB: Also, there are two levels to bear into mind. On the one hand, there is the social appropriation on the part of the enterprises, basically the innovation, which is tangible and easy to grasp. However, when we turn our attention to society at large, to people’s expectations or their fears regarding a scientific phenomenon, we face a more complex corpus of information. It is customary to turn to opinion surveys, but in terms of measurement is a much more complex problem.

RB: Hay dos niveles a tener en cuenta. Por un lado está la apropiación social al nivel de las empresas, básicamente la innovación, que es más tangible y fácil de abarcar. Pero cuando vamos a la sociedad general, a sus expectativas o sus temores respecto de un fenómeno científico, ya estamos frente a un cúmulo de información más complejo, más mediado. Se suele recurrir a encuestas de opinión, pero en términos de medición es un tema mucho más complejo.

Q: What is the importance that the systems of scientific information have nowadays? And what is their strategic relevance for the region? RB: The systems of scienti c information are important to solve or attack problems associated with the management of politics. This is not exclusive for developed countries; on the contrary, if a country has only scarce resources at its disposal, it is even more necessary to be able to distribute scienti c information and use it in an efficient way. And this is in part achieved thanks to a proper structuration of the data collected through the systems of information. In Latin America, only few countries possess consolidated systems of information. The smallest countries hardly have any scienti c information at all, or, at the most, they only have access to some statistical information developed by a small group of people working half time. There, of course, are statistics that every single country must have irrespective of its size for it to be able to be compared with others countries at a regional and international level. This does not mean that all the countries must use the same battery of indicators and follow the same procedures of data collection. On many occasions, it happens that there is much mimetic behaviour involved as well, and the country ends up processing a certain amount of useless information. MA: Small countries have less capacity than bigger

14

countries to satisfy their own needs through research. In this context, relying on an efficient system of information can lead to nding better solutions, either through the distribution of resources or through a more mature and proactive search of technology developed elsewhere. On the contrary, in most developed countries the systems of information are strategically crucial because they provide a bridge with the resorts of the world’s S&T, thereby getting closer to new frontiers. Other aspect worthy of attention is that the world scienti c developments yield an amount of information which is usually available for free and can satisfy most of the demands of knowledge for a country to be able to develop its industry and satisfy its social needs. Therefore, learning to dive intelligently into that “ocean of knowledge” is a means of growth of rst magnitude. However, this takes us to a different problem: this “ocean of knowledge” is generally mediated by journals which, in our region, pose a pressing obstacle to be solved: the language barrier. The production of articles in Spanish and Portuguese suffers from many obstacles, such as their diffusion and collection in international databases. This is an issue that the region has to solve in some way; however, there are instruments to achieve this such as, for example, the platform SciELO.


RB: The effort should be oriented towards the strengthening of the national systems of publishers of scienti c journals. If a country does not have a collection of academic journals of high impact, the researchers of that country will probably end up sending their articles to more prestigious publications from abroad. In the end, this mixes up with problems inherent to the evaluation programmes. Publications bring together communities and produce new interlocutors, and it is here where their importance lies. It would be important to be able to rely on policies which, among other issues, pursue

publisher excellence at every stage, commit to the periodicity and keep an adequate peer assessment system. MA: Here, it is necessary to differentiate sciences. In the eld of social sciences, journals in Spanish or Portuguese have already achieved legitimacy. Yet, nothing similar has been achieved yet within the eld of hard or experimental sciences. Moreover, there are some Latin American journals published in English and included in the international databases to which local researchers grant less value when assessing them.

P: ¿Qué importancia tienen actualmente los sistemas de información científica? ¿Qué relevancia estratégica tienen para la región? RB: Son importantes para resolver o atacar problemas asociados a la gestión de políticas. Esto no es privativo de los países desarrollados, sino que, por el contrario, si uno dispone de recursos escasos resulta todavía más necesario poder distribuirlos y utilizarlos de manera e ciente. Y eso se logra, en parte, gracias a la correcta estructuración de los datos que se reúnen a través de los sistemas de información. En América Latina hay sólo unos pocos países con sistemas de información ya consolidados. Los países más chicos prácticamente carecen de información cientí ca o cuentan apenas con alguna estadística básica desarrollada por un grupo pequeño de gente que trabaja en una o cina a tiempo parcial. Hay estadísticas que todo país debe tener, más allá de su magnitud, para poder compararse con otros a nivel regional e internacional. Esto no quiere decir que todos los países deban usar la misma batería de indicadores y seguir los mismos procedimientos de recolección de datos. Muchas veces pasa que en esto último también hay mucho mimetismo, y así se termina elaborando un cúmulo de información que no dice nada. MA: En los países más incipientes, la capacidad de satisfacer las propias necesidades a través de la investigación es menor que en los países más grandes. En ese marco, contar con un e ciente sistema de información puede conducir a encontrar mejores soluciones, sea a través de una redistribución de los recursos o a partir de una búsqueda más madura y proactiva de tecnología desarrollada fuera del país. En los países más avanzados, en cambio, los sistemas de información son esenciales desde una perspectiva estratégica porque permiten contactarse con los resortes de la ciencia y la tecnología en el mundo y acercarse así a nuevas fronteras. Otro punto a tener en cuenta: la corriente cientí ca mundial genera un acervo de conocimientos que generalmente son de libre disponibilidad y pueden satisfacer la mayor parte de las demandas de conocimiento para que

un país pueda desarrollar su industria y satisfacer sus necesidades sociales. Por lo tanto, aprender a bucear inteligentemente en ese mar de conocimientos es una herramienta para el crecimiento de primera magnitud. Pero esto a su vez nos lleva a otro problema. Este acervo de conocimientos por lo general está mediatizado por revistas y journals que en nuestra región plantean un obstáculo acuciante a resolver: el campo idiomático. La producción de artículos en español y portugués tiene frente a sí muchas di cultades para su difusión y acumulación en bases de datos internacionales. Esto es algo que la región debe combatir de alguna manera, con la tranquilidad de que hay instrumentos para lograrlo: la plataforma SciELO, por ejemplo. RB: El esfuerzo debería estar dirigido a fortalecer los sistemas nacionales de edición de revistas cientí cas. Si un país no cuenta con un conjunto de revistas de calidad legitimada, los cientí cos de ese país probablemente terminen enviando sus artículos a publicaciones extranjeras con mayor prestigio. Esto se termina cruzando con los problemas inherentes a los programas de evaluación. Las publicaciones aglutinan comunidades, generan nuevos interlocutores. Allí radica su importancia. Sería importante contar con políticas que apoyen a las revistas a perseguir la excelencia editorial en todo momento, cumplir con la periodicidad de publicación y mantener un adecuado sistema de evaluación de pares, entre otras cuestiones. MA: Aquí hay que dividir por ciencias. En las ciencias sociales, las revistas en español o en portugués ya cuentan con una legitimidad merecida. Pero en el ámbito de las ciencias duras o experimentales eso aún no se ha conseguido. Más aún, hay algunas revistas latinoamericanas en idioma inglés, incluidas en las principales bases de datos internacionales y los propios cientí cos locales les reconocen menos valor, a la hora de realizar evaluaciones.

15


Q: How do you think that the existence of repositories could be compatible with the activity of the big publishers of scientific articles? P: ¿Cómo creen que podría conciliarse la existencia de repositorios con la actividad de las grandes editoriales de artículos científicos? RB: Repositories and publishers are two different things. A repository is a storage space for documents of particular characteristics; it does not rely on peer evaluation for them to be admitted or rejected. Therefore, there already is a crucial difference regarding the way scientific publications operate. The latter, through rigorous procedures of assessment, do offer a guarantee of quality and appropriateness of what they publish. I do not believe that repositories and big publishers compete against each other; they have different uses and publics. Repositories allow for a rapid access to documents, which, otherwise, would be difficult to accede; they also allow knowing the rate of the institutions’ scientific production, for example, the universities. Besides, unlike publishers of journals, repositories do not have to face certain types of costs. Nonetheless, it is a different kind of offer therefore, I do not believe that repositories would replace scientific publishing.

RB: Son cosas distintas. Un repositorio es un espacio de almacenamiento de documentos de características muy particulares. No cuenta con evaluación de pares para admitir o rechazar los documentos que se van ingresando, de modo que ya ahí hay una diferencia muy importante con la forma de operar de las revistas científicas, que sí ofrecen una garantía de calidad y pertinencia de lo que deciden publicar, a través de procedimientos de evaluación muy rigurosos. No creo que los repositorios y las grandes editoriales compitan. Tienen públicos y usos diferentes. Los repositorios permiten un rápido acceso a los documentos que de otro modo sería muy difícil consultar y permiten también dar cuenta de la producción científica de las instituciones; por ejemplo, de las universidades. Además se evitan algunos costos en los que sí recaen las revistas, pero se trata de una oferta distinta, por lo cual no creo que vayan a reemplazar a la edición científica.

Q: What is the place of the international cooperation in this context? P: ¿Qué lugar tiene la cooperación internacional en este contexto? MA: I would say that international cooperation plays a very relevant role in the evolution of modern scientific policies. Nowadays, scientific practice unfolds within the frame of interdisciplinary and inter-institutional groups of work created ad hoc around certain topics and projects. The emergence of networks of scientific collaboration and even of collaboration between heterogeneous actors is crucial for the advancement of knowledge. The Latin American countries need to promote the formation of networks both inside as well as outside national frontiers; this is the most adequate way of taking advantage of the experience gained in the most developed centres. Today, networks of research groups, networks of universities and inter- disciplinary networks are proliferating both at the Latin American and the Ibero- American level. There exist programmes that possess instruments to foster this tendency. For example, the OEI, through it Centre for University Studies (Centro de Altos Estudios Universitarios; CAEU), promotes networks of postgraduates. Also, the programme CYTED has created thematic research networks that have yielded very interesting results. The same can be said about the European Union that a while ago began to show interest in including Latin American researchers in their projects. In this way, the work of our researchers gains a much broader visibility, thus being able to reach to a much larger audience. 16

MA: Yo diría que cumple un papel muy relevante en la evolución de las modernas políticas científicas. La práctica científica se desenvuelve actualmente en equipos de trabajo interdisciplinarios e interinstitucionales, constituidos ad hoc en torno a determinados temas y proyectos. La formación de redes de colaboración científica, e incluso redes de colaboración entre actores heterogéneos, es una modalidad esencial para el avance del conocimiento. Los países latinoamericanos necesitan estimular la formación de redes, tanto dentro como fuera de sus fronteras; es la manera más adecuada de prosperar y de aprovechar la experiencia adquirida en centros más avanzados. Tanto a nivel latinoamericano como a nivel iberoamericano, ya están proliferando las redes de grupos de investigación, las redes interdisciplinarias y las redes de universidades. Hay programas que cuentan con instrumentos apropiados para fomentar esta tendencia. La OEI, por ejemplo, a través de su Centro de Altos Estudios Universitarios (CAEU) fomenta las redes de posgrado. También el programa CYTED ha formado redes temáticas de investigación que han arrojado resultados muy interesantes, lo mismo que la Unión Europea, que desde hace un tiempo ha empezado a mostrar preocupación por incluir a científicos latinoamericanos en sus proyectos. De esta manera el trabajo de nuestros científicos adquiere una visibilidad mucho más amplia y puede llegar a una buena parte de la humanidad.


17


Collaboration in nanotechnology through Social Network Analysis Rodolfo Barrere y Natalia Bas Rodolfo Barrere holds a PhD in Social Sciences from the National University of Quilmes (Argentina). Currently he is the director of the REDES centre and the technical secretary of the Network for Science and Technology Indicators Ibero-American and Inter-American (RICYT) He has participated and coordinated various research projects and acted as consultant to various international organizations such as OECD, UNESCO, IDB, World Bank and the European Union.

Natalia Bas received a PhD in History from University College London (U.K.). She also obtained a licentiate degree in History at the Universidad de Buenos Aires (Argentina) and a MA in the History of Race in the Americas at the University of Warwick (U.K.). She currently works as coordinator of the RICYT group for the SISOB project and holds a position of advisor to the Director of Science and Technology of the city of Buenos Aires’s government.

Rodolfo Barrere es doctor en ciencias sociales por la Universidad Nacional de Quilmes (Argentina). Actualmente es director del Centro REDES y secretario técnico de la Red Iberoamericana de Indicadores de Ciencia y Tecnología (RICYT). Ha participado y coordinado diversos proyectos de investigación y consultoría para distintos organismos internacionales como OCDE, UNESCO, BID, Banco Mundial y la Unión Europea.

Natalia Bas es doctora en Historia por la University College London (Reino Unido). También obtuvo una licenciatura en Historia en la Universidad de Buenos Aires (Argentina) y una maestría en Historia de la Raza en el continente americano en la Universidad de Warwick (Reino Unido). Actualmente trabaja como coordinadora del grupo de la RICYT para el proyecto SISOB y ocupa una posición de asesor del Director de Ciencia y Tecnología del gobierno de la ciudad de Buenos Aires.

Colaboración en nanotecnología a través del análisis de la red social Rodolfo Barrere y Natalia Bas The networks of scientific production in nanotechnology studied in the present report have been built upon publications in Science Citation Index (SCI), the main international bibliographical database. The volume of the nodes shows the number of publications in the field; the connections represent joint scientific publications; and the thickness of the lines shows the number of joint publications. The articles signed by more than one institution have been counted as a whole for each. The colours of the nodes have been assigned according to the country of the institution: red for Spain, black for Brazil, grey for Portugal, green for Mexico and blue for Argentina. Las redes de la producción científica en nanotecnología estudiadas en el presente informe se han construido sobre las publicaciones en el Science Citation Index (SCI), la principal base de datos bibliográficos internacionales. El volumen de los nodos/enlaces muestra el número de publicaciones en el campo, las conexiones representan publicaciones científicas conjuntas, y el grosor de las líneas muestra el número de publicaciones conjuntas. Los artículos firmados por más de una institución se han contabilizado en su totalidad para cada uno. Los colores de los nodos se han asignado en función del país de la institución: el rojo de España, el negro de Brasil, Portugal gris, verde y azul para México a la Argentina.

18


Given that the existing number of nodes and relationships is very extensive, hindering their visualization and analysis, pruning techniques have been applied. They consist of the application of algorithms that eliminate the less important links in the network leaving only the necessary minimum so as not to disconnect any node. The reason for this is that the weight of the resulting total of spans (in this case, the number of joint publications) is as great as possible. This provides the basic structure underlying a highly complex network. The result of the pruning techniques is a minimum spanning tree (MST) of a graph. In this case the Prim algorithm has been used.

The publication of joint articles is one of the ways that the integration of the Ibero- American knowledge space adopts. Changes in the general integration of the co-publication network may be quantified according to the density indicator, which shows the number of existing links over the total of potential links. Graph 1 shows the compared evolution of the density of the scientific production network in nanotechnology both of the world total and of the network made up by the total of IberoAmerican scientific production in nanotechnology between 2000 and 2007.

Graph 1: Nodes and desity of relations between countries

Note: Only countries with over 10 articles are included Source: Author´s graph from SCI-WOS data

Dado que el número actual de nodos y relaciones es muy extenso, lo que dificulta su visualización y análisis, se han aplicado técnicas de poda. Éstas consisten en la aplicación de algoritmos que eliminan los enlaces menos importantes en la red dejando sólo el mínimo necesario para que no se desconecten todos los nodos. La razón de esto es que el peso del total resultante de los tramos (en este caso, el número de publicaciones conjuntas) sea tan grande como sea posible. Esto proporciona la estructura básica subyacente a una la red de alta complejidad. El resultado de las técnicas de poda es una expansión mínima árbol (MST) de un gráfico. En este caso se ha utilizado el algoritmo de Prim.

La publicación de artículos conjuntos es una de las formas que adopta la integración del espacio iberoamericano del conocimiento. Los cambios en la integración general de la red de co-publicación puede ser cuantificada de acuerdo con el indicador de densidad, lo que muestra el número de enlaces existentes sobre el total de posibles vínculos. El gráfico 1 muestra la evolución comparada de la densidad de la red de producción científica en nanotecnología, tanto del total mundial y de la red formada por el total de la producción de la nanotecnología iberoamericana científica entre 2000 y 2007. 19


Graph 2: Network of countries with nanotechnology scientific production (2000) Note: Only countries with over 10 articles are included

While the density of the total of the world scientific production in nanotechnology was relatively stable, integration within the Ibero-American region was at a higher level, even registering growth despite some fluctuations. In 2000 the Ibero-American nanotechnology network had a density index of 0.21, that is to say, higher than the total of the world’s network (0.15). 2006 and 2007 show a decrease in the density of that network; however, its density was more than twice the density of the total world production. All this shows that Ibero-America works as a space of collaboration with a higher level of relationships than the world network average. Graphs 2, 3 and 4 show the place that Ibero-America occupied in the context of worldwide research on nanotechnology for the years 2000, 2005 and 2007, respectively.

20

In 2000, the United States (US) was the first node of the scientific production in nanotechnology worldwide. The US occupied this place as a result of the number of publications produced by the country and the fact that it is the centre around which the rest of the countries with scientific production in nanotechnology are situated. Some of these countries have direct radial relations with the US; others form nodes which, in turn, articulate new relations. In 2000, the main US scientific connection was with Germany (towards 2000, in the 3rd place in terms of the world’s number of publications); it is also worth noting the scientific connections between the US and France (5th place the same year). France, in turn, generated new relationships of collaboration with 6 countries of smaller production among which there was an IberoAmerican country, Chile.

Mientras que la densidad total de la producción científica mundial en nanotecnología se mantuvo relativamente estable, la integración en la región iberoamericana se encontraba en un nivel más alto, incluso registrando un crecimiento a pesar de algunas fluctuaciones. En el año 2000 la red de nanotecnología iberoamericana tuvo un índice de densidad de 0,21, es decir, más alto que el total de la red mundial (0,15). 2006 y 2007 muestran una disminución en la densidad de la red, sin embargo, su densidad es más del doble de la producción mundial total. Todo esto demuestra que Iberoamérica funciona como un espacio de colaboración con un mayor nivel de relaciones que el promedio de la red mundial. Los apartados 2, 3 y 4 muestran el lugar que ocupa Iberoamérica en el contexto de la investigación mundial en nanotecnología para los años 2000, 2005 y 2007, respectivamente.

En el año 2000, los Estados Unidos (EE.UU.) fueron el primer nodo de la producción científica en todo el mundo de la nanotecnología. Este lugar fue ocupado como resultado de la cantidad de publicaciones producidas por el país, tanto como para ser el centro alrededor del cual se sitúan el resto de los países con producción científica en nanotecnología relacionada. Algunos de estos países tienen relaciones directas radiales con los EE.UU.; mientras que otros, con forma de nodos, en torno a los que forman nuevas relaciones. En 2000, la principal conexión científica de EE.UU. fue con Alemania (hacia el año 2000, en el 3 º lugar en términos de número uno del mundo de publicaciones), también destaca la conexión científica entre los EE.UU. y Francia (5 º lugar el mismo año). Francia genera nuevas relaciones de colaboración con seis países de menor producción entre los que había un Iberoamericano, Chile.


Regarding the Ibero-American countries, it is possible to observe that Spain (and through Spain, Portugal) had direct scientific connections with the US. Other 6 Ibero- American countries had radial relations with the US: Brazil (which, in turn, produced scientific results in nanotechnology in collaboration with Cuba; and through Cuba, Colombia), Mexico, Argentina and Venezuela. En cuanto a los países iberoamericanos, se puede observar que España (y por España, Portugal) tenían conexiones directas de científicos con los EE.UU. Otros seis países iberoamericanos han tenido relaciones radiales con los EE.UU.: Brasil (que, a su vez, realiza la producción científica en nanotecnología en colaboración con Cuba y por Cuba, Colombia), México, Argentina y Venezuela.

Graph 3: Network of countries with nanotechnology scientific production (2005) Note: Only countries with over 10 articles are included Source: Author´s graph from SCI-WOS data

tific collaboration was experienced towards 2005. As shown in the graph, all the countries of the region (except Brazil and Mexico which were connected to this network through the US) were in the same branch of the tree, Spain being the connection with the main trunk. Spain connected to the US through France, connected the network of collaborations of 7 Ibero-American countries: Portugal, Argentina, As regards the Ibero- Venezuela, Cuba, ColomAmerican countries, the bia, Chile and, through the greatest density in scien- latter, Uruguay. Whereas the network of relationships among the different countries worldwide grew in complexity in 2005, the US kept its central role in the world’s network of joint publications. However, the number of countries connected through their scientific production increased. Likewise, Japan and Spain began to perform coordinating role with new links.

En 2005, mientras que la red de relaciones entre los diferentes países en todo el mundo crecieron en complejidad, los EE.UU. mantiene su papel central en la red mundial de publicaciones conjuntas. Sin embargo, el número de países conectados a través de su producción científica es creciente. Del mismo modo, Japón y España comenzaron a realizar funciones de coordinación con los nuevos enlaces. En cuanto a los países Iberoamericanos, la mayor densidad en la colabora-

ción científica se vivió hacia 2005. Como se muestra en el gráfico, todos los países de la región (con excepción de Brasil y México, que estaban conectados a esta red a través de los EE.UU.) se encuentran en la misma rama del árbol siendo España la conexión con el tronco principal. España, conectados a los EE.UU. a través de Francia, conectados a la red de colaboraciones de 7 países iberoamericanos: Portugal, Argentina, Venezuela, Cuba, Colombia, Chile y, a través de este último, Uruguay. 21


Last, in 2007 the US still occupied the central role in the world network of joint scientific publications. It closely related to Germany (node articulating 14 countries), Japan (articulating 3 countries), France (with relations with 11 countries), England (articulating 4 countries) and, to a lesser extent, China (connecting 3 countries). Other countries appeared connected to the central node in a radial way; some connected 1 country and most of them had direct relations of collaboration. As for the Ibero-American countries, on the one hand, 2007 showed a decrease in the density of their relationships of scientific production in nanotechnology and, on the other, a greater dispersion of their position in the world network. Likewise, the 5 Ibero-American countries continued producing their relations with the general network through France: Spain articulated scientific relations with Argentina and Uruguay, Chile and Portugal. However, the majority of the Ibero-American countries connected directly to the US: Brazil (and through it, Colombia), Mexico (and through it, Cuba), Venezuela and Peru.

Graph 4: Network of countries with nanotechnology scientific production (2007) Note: Only countries with over 10 articles are included Source: Author´s graph from SCI-WOS data

Por último, en 2007 los EE.UU. todavía ocupaban un papel central en la red mundial de publicaciones científicas conjuntas. Se estrecha relación con Alemania (nodo de articulación de 14 países), Japón (la articulación de tres países), Francia (con relaciones con 11 países), Inglaterra (la articulación de 4 países) y, en menor medida, China (que conecta tres países). Otros países parecían conectados al nodo central de una forma radial, algunos de ellos vinculados un país y la mayoría de ellos tenían una relación directa de colaboración. En cuanto a los países iberoamericanos, por un lado, en 2007 mostraron una disminución en la densidad de las relaciones de la producción científica en nanotecnología y, por otro, una mayor dispersión de su posición en la red mundial. Del mismo modo, los cinco países iberoamericanos siguieron produciendo sus relaciones con la red general a través de Francia: España articula las relaciones científicas con Argentina y Uruguay, Chile y Portugal. Sin embargo, la mayoría de los países iberoamericanos conectan directamente con los EE.UU.: Brasil (ya través de ella, Colombia), México (ya través de ella, Cuba), Venezuela y Perú. 22


Indicators and Measurements Sandor Soos y Judit Mosoni-Fried Sándor Soós, PhD is a research fellow at IRO HAS. He received his PhD degree in cognitive sciences (with a focus on science and technology studies) at Eötvös University, Budapest (ELU). Current research includes micro- and macrolevel analysis of science and technology (scientometrics, analysis of S&T, development of analytic methods, development of S&T services). Sándor Soós, (Doctor) es investigador en el IRO HAS, su doctorado, por la Universidad de Eötvös de Budapest (ELU), versa sobre ciencias cognitivas centrado especialmente en los estudios científicos y tecnológicos. Su investigación actualmente incluye análisis de la ciencia y la tecnologías a micro- y macro-niveles: cienciometría, análisis de CyT, desarrollo de métodos analíticos, desarrollo de servicios de CyT.

Indicadores y Medidas Sandor Soos y Judit Mosoni-Fried 23


Image taken from http://www.pptbackgrounds.net

The measurement of scientific activity has long been developing into a vivid discourse at the intersection of innovation and science policy studies, scientometrics, research evaluation and management science. Within established methodological frameworks many approaches have aimed to enrich, improve or critically revise the existing methods for the assessment and evaluation of science and technology. A strong tendency has been the incorporation of structural approaches, that is, network analysis and other tools for mapping the organization of the science system, into the toolbox of informed evaluation practices. Despite the rapid extension of the toolbox, however, little attention has been given to a systematic treatment of the various approaches and the dimensions of scientific activity they address. Since the SISOB platform is envisioned to provide new insight into the social and societal aspects of Science and Technology (S&T), our work for the detailed report on indicators and measurements [1] is targeted at the systematization of the models, indicators and measurements. The aim is three-fold: 1. to uncover the mapping between existing approaches and the respective dimensions of S&T, 2. to discuss models, indicators and measurements relevant for the SISOB platform based on (1), and 3. prepare the development of “missing approaches” addressing SISOB relevant aspects. The first part of our work provides an overview on the established framework for S&T measurement. The main focus is the shift from traditional input/output approaches to the applications of network analysis in evaluation and monitoring activities. Based on typical applications (“prototypes”), a taxonomy of network approaches is constructed, in terms of network type, network measures and indicators, including the exploitation of social networks, information networks and science maps (proximity networks) as well.

24


La medición de la actividad científica ha desarrollado un intenso discurso en el cual confluyen estudios políticos de ciencia e innovación, cienciometría, evaluación de la investigación y ciencias de la gestión. Se han propuesto muchas aproximaciones, dentro de marcos de trabajo metodológicos establecidos, para mejorar o revisar críticamente los métodos existentes para la evaluación de la ciencia y la tecnología. Existe una tendencia muy fuerte que apoya la incorporación de aproximaciones estructurales, esto es, análisis de redes y otras herramientas para trazar la organización del sistema científico con prácticas de evaluación informadas. A pesar de la rápida extensión de estas herramientas, se le ha prestado poca atención al tratamiento sistemático de varias aproximaciones y a las dimensiones de la actividad científica a las que se refieren. Dado que se ha previsto que la plataforma SISOB proporcione un nuevo punto de vista de los aspectos sociales de la Ciencia y la Tecnología (CyT), nuestro trabajo para el informe

de indicadores y medidas [1] se dirige a la sistematización de modelos, indicadores y medidas. El objetivo es triple: (1) descubrir la relación entre las aproximaciones existentes y las dimensiones respectivas de CyT, (2) debatir sobre modelos, indicadores y medidas relevantes para la plataforma SISOB basados en (1), y (3) preparar el desarrollo de “aproximaciones ausentes” referidas a aspectos relevantes de SISOB. La primera parte de nuestro trabajo proporciona una visión general del marco de trabajo establecido para las medidas de CyT. El objetivo principal es cambiar de las aproximaciones tradicionales tipo entrada/salida a las aplicaciones de análisis de redes en evaluación y monitorización de actividades. Basándose en aplicaciones típicas (“prototipos”), se construye una taxonomía de aproximaciones de redes en términos de tipo de red, medidas e indicadores de red, incluyendo la explotación de redes sociales, redes de información y mapas científicos (redes de proximidad).

Figura 1. Relación de niveles conceptuales, casos de estudio y modelos de prototipo.

Image taken from http://www.icesi.edu.co

25


The second part speciďŹ es the general scheme for the particular domains of the SISOB project, that is, for the three case studies under development:

Figure 1. Relation of concept levels, case studies and prototype models. Mobility. Mobility of researchers and research communities is an often prioritized policy goal, but less studied in necessary details. It is conceived as both (1) a social dimension of science production and (2) a social impact-conveying factor of S&T (c.f. academia-industry relations). Indicators for, and metrics based on different types of mobility networks are systematized, which are to be modelled as affecting the productivity of actor communities. A new set of dimensions is introduced to be incorporated as measurements, distinguishing different types of the phenomenon, including inter-institutional and virtual mobility. Knowledge sharing. Knowledge sharing has been modelled via several types of social and information networks. A detailed taxonomy of network indicators and measurements, parallel with their typical uses, is given for the knowledge sharing case based on Appendix A of D2.1 (Common network indicators). In this section, a novel framework is outlined, appropriating a much broader community of actors than that of within science models. This framework builds on multirelational network of artefacts (papers, prototypes, software etc.). Network models are enriched with an ontology of relations that gives way to a whole new set of measurements using existing metrics of network analysis. Peer review. With a few examples concerning conict of interest detection, network effects of the peer review process have rarely been subjected to analysis using de facto network models. The peer review application is concentrated around the measurements of (1) network effects on different types of cronyism, and (2) network effects on both the scientiďŹ c and public impact of actors of review networks. To this end, network indicators are interpreted for multi-relational networks linking authors, reviewers and editors. These indicators are combined with both reviewer assessments and bibliometric impact measures for actors (authors).

26


La segunda parte especifica el esquema general para dominios particulares del proyecto SISOB, esto es, para los tres casos de estudio a desarrollar: Movilidad. La movilidad de los investigadores y las comunidades investigadores es normalmente un objetivo priorizado políticamente, pero está estudiado en menor detalle de lo necesario. Se concibe como (1) una dimensión social de la producción científica y (2) un factor de transmisión de impacto social de la CyT (ej. relaciones academia-industria). Se sistematizarán indicadores y métricas basadas en diferentes tipos de redes de movilidad, modeladas para afectar la productividad de comunidades de actores. Se incorporará un nuevo conjunto de dimensiones para introducirlas como medidas, distinguiendo diferentes tipos de fenómenos que incluirán movilidad inter-institucional y virtual. Diseminación de conocimiento. La diseminación del conocimiento se ha modelado utilizando diferentes tipos de redes sociales y de información. Para la diseminación del conocimiento basándose en el apéndice A del entregable D2.1 del proyecto (Indicadores de red comunes) se proporciona

una taxonomía detallada de indicadores y medidas de redes, a la vez que sus usos típicos. En esta sección, se perfila un marco de trabajo nuevo, que aglutina una comunidad de actores mucho más amplia que las de los modelos científicos. Este marco de trabajo se construye sobre una red de artefactos multirelacional (artículos, prototipos, software, etc.). Los modelos de redes se enriquecen con una ontología de relaciones que proporciona un nuevo y completo conjunto de medidas utilizando métricas existentes de análisis de redes. Revisión por pares. Los efectos de los proceso de revisión por pares se han visto rara vez sujetos a análisis utilizando modelos de redes de facto, con la excepción de algunos casos de conflictos de interés. La aplicación de la revisión por pares se concentra al rededor de medidas de (1) efectos de red en diferentes tipos de amistades, y (2) efectos de red en el impacto científico y publico de actores de redes de revisión. Para este fin, los indicadores de redes son interpretados por redes multirelacionales que enlazan autores, revisores y editores. Estos indicadores se combinan con evaluaciones de los revisores e impacto bibliométrico de los actores (autores).

References / Referencias: [1] Detailed report on indicators and measurements, SISOB Project, Deliverable 4.1.

Image taken from http://www.itout.ca

27


VISUALIZATION FOR SUPPORTING SCIENTIFIC INFORMATION Beatriz Barros, Inés Méndez & Lorena Cazorla

Beatriz Barros received her PhD in Computer Science, Artificial Intelligence, in June 1999 from Universidad Politécnica de Madrid. She wrote her dissertation about automatic analysis of the collaborative processes. As an associate professor of the UNED (Distance Education University), she has been involved in European projects such as Divilab, Coldex and finally in the Network of Excellence Kaleidoscope. In 2006 she joined the University of Malaga, as a member of the IAIA research group (Investigation and Application of Artificial Intelligence). Currently, her main research lines include collaborative learning and virtual communities; she leads a research project entitled PATIO (patio.lcc.uma. es). Beatriz researches also social web, curricular management and scienciomentrics; she is the coordinator of the SISOB project (sisob.lcc.uma.es) and leads the project called SICA2 (sicaresearch.sica.es) in the Regional Ministry of Economy, Science and Innovation. Beatriz Barros es Profesora Titular de la Universidad de Málaga desde el año 2007, después de pasar por la Universidad Nacional de Educación a Distancia (PT, 2001) y la Universidad Politénica de Madrid. Obtuvo su doctorado en Informática (1999) en el Departamento de Inteligencia Artificial de la Universidad Politécnica de Madrid, y el de Ingeniero en Informática (1995) en la misma universidad. Como profesora de la UNED, se ha involucrado en proyectos europeos tales como Divilab, Coldex o el proyecto de la red de excelencia Kaleidoscope. En la actualidad desarrolla su trabajo en dos campos: aprendizaje colaborativo y comunidades virtuales, dirigiendo un proyecto de investigación llamado PATIO (patio.lcc.uma.es); y seb social, gestión curricular y cienciometría, coordinando el proyecto SISOB (sisob.lcc.uma.es) y dirigiendo el proyecto SICA2 (sicaresearch.sica.es) de la Consejería de Economía, Innovación y Ciencia.

VISUALIZACIÓN COMO APOYO A LA INFORMACIÓN CIENTÍFICA Beatriz Barros, Inés Méndez y Lorena Cazorla

28


Image taken from http://well-formed.eigenfactor.org

29


Thanks to the progress that has taken place in the field of information technology in the last years, both the general and specialized public (e.g. research centres) have gained access to huge quantities of information. However, such data are useless to the user unless he/she knows how to interpret them easily and effectively. Visualization should be understood as creating, through graphical means, visual representations of a concept, idea or a set of data that cannot be grasped or explained with the help of ordinary methods. Scientific visualization transforms abstract scientific data into image, for instance diagrams that represent mathematical functions or graphs that show communication networks (Friendly and Denis, 2009). The main purpose of information visualization is to share knowledge in an intuitive and condensed way. This is done through graphics capable of representing large amounts of quantitative and qualitative data in a clear and easy-to-follow way. Scientific visualization is an emerging interdisciplinary field which is now applied in the study of such diverse areas as man-machine interaction, graphic design, management, architecture, etc.

30


La visualización se define como la creación, utilizando medios artificiales, de una representación visible (estática odinámica) de un concepto, idea o grupo de datos que no podemos abarcar o alcanzar a ver por métodos comunes. La visualización científica se dedica a la transformación de datos científicos y abstractos a imágenes, por ejemplo el dibujo de diagramas para visualizar funciones matemáticas o grafos para representar una red de comunicaciones (Friendly and Denis, 2009). El objetivo básico de la visualización de la información es la transmisión de conocimiento de forma intuitiva y condensada; para ello se ha de proporcionar un despliegue gráfico que ofrezca una representación lo suficientemente eficiente como para sintetizar y comprender cantidades de información de carácter cuantitativo y cualitativo. La visualización científica como área de conocimiento e investigación, es un campo emergente e interdisciplinario que recientemente se está aplicando en estudios de dominios muy distintos: interacción hombre-máquina, diseño gráfico, gestión, arquitectura,etc. En su trabajo (Lengler and Eppler, 2007), Lengler y Eppler proponen una definición de método de visualización “A visualization method is a systematic, rule-

Image taken from http://well-formed.eigenfactor

31


Image taken from http://www.visualcomplexity.com/

In their work, Lengler and Eppler (2007) define visualization method as “a systematic, rule-based, external, permanent, and graphic representation that depicts information in a way that is conducive to acquiring insights, developing an elaborate understanding, or communicating experiences“. They also group the existing visualization methods into the following categories: • Data Visualization includes standard quantitative formats such as Pie Charts, Area Charts or Line Graphs. They are visual representations of quantitative data in schematic form (either with or without axes). (Lengler and Eppler, 2007). • Information Visualization, such as semantic networks or tree maps, is defined as the use of interactive visual representations of data to amplify cognition. (Lengler and Eppler, 2007). • Concept Visualization, like a concept map or a Gantt chart; these are methods to elaborate (mostly) qualitative concepts, ideas, plans, and analyses through the help of rule-guided mapping procedures. (Lengler and Eppler, 2007). • Metaphor Visualization, like metro map or story template are effective and simple templates to convey complex insights. Visual Metaphors fulfill a dual function, first they position information graphically to organize and structure it. Second they convey an insight about the represented information through the key characteristics of the metaphor that is employed. (Lengler and Eppler, 2007). • Strategy Visualization, like a Strategy Canvas or technology roadmap is defined “as the systematic use of complementary visual representations to improve the analysis, development, formulation, communication, and implementation of strategies in organizations.” This is the most specific of all groups, as it has achieved great relevance in management. (Lengler and Eppler, 2007). • Compound Visualization consists of several of the aforementioned formats. They can be complex knowledge maps that contain diagrammatic and metaphoric elements, conceptual cartoons with quantitative charts, or wall sized infomurals. (Lengler and Eppler, 2007).

32


based, external, permanent, and graphic representation that depicts information in a way that is conducive to acquiring insights, developing an elaborate understanding, or communicating experiences” y realizan una recopilación y categorización de los métodos de visualización existentes en forma de una taxonomía general: • Visualización de Datos incluye formatos cuantitativos estándar como gráficas de tarta, gráficas de área o gráficas de líneas. Son representaciones visuales para datos cuantitativos de forma esquemática (con o sin ejes). (Lengler and Eppler, 2007). • Visualización de la información, como redes esquemáticas o mapas de árboles, se define como el uso de representaciones visuales interactivas de datos, para amplificar la cognición. (Lengler and Eppler, 2007). • Visualización de conceptos, como un mapa conceptual o un diagrama de Gantt; éstos son métodos para elaborar la mayor parte de los conceptos cualitativos, ideas, planes y análisis, a través de la ayuda de procedimientos guiados por reglas. (Lengler and Eppler, 2007). • Visualización de metáforas, tales como metro-map o plantillas de historias, son plantillas simples y efectivas para transmitir conceptos complejos. Las metáforas visuales llevan a cabo una función doble, en primer lugar posicionan información de forma gráfica para organizarla y estructurarla. En segundo lugar, permiten comprender la información representada a través de características clave de la metáfora empleada. (Lengler and Eppler, 2007). • Visualización de estragegias, como lienzos de estrategias o mapas de tecnologías, se define como “el uso sintético de representaciones visuales complementarias para mejorar el análisis, desarrollo, formulación, comunicación e implementación de estrategias en las organizaciones”. Éste es el grupo más específico de todos, y ha conseguido una gran relevancia en la gestión. (Lengler and Eppler, 2007). • La Visualización compuesta consiste en varios de los formatos mencionados arriba. Pueden ser mapas de conocimiento complejos que tienen elementos diagramáticos y metafóricos, dibujos conceptuales con diagramas cuantitativos, o info-murales del tamaño de una pared. (Lengler and Eppler, 2007).

Image taken from http://www.visualcomplexity.com/

33


As visual representation of data and concepts may be very complex at times, there are people who specialize in rendering elaborate systems of information in a graphic form. One of them is Manuel Lima, the founder of VisualComplexity.com which “intends to be a unified resource space for anyone interested in the visualization of complex networks. The project’s main goal is to leverage a critical understanding of different visualization methods, across a series of disciplines, as diverse as Biology, Social Networks or the World Wide Web” (VisualComplexity.com) VisualComplexity.com is a great database of projects whose goal is to map intricate information structures. Many of these visual representations are very vivid and thus easy to understand. Some examples are shown below.

34


La representación de datos y conceptos puede llegar a ser muy compleja por lo que existen investigadores y profesionales dedicados al estudio de la representación visual de sistemas complejos. Un ejemplo lo encontramos en el proyecto VisualComplexity.com cuyo principal objetivo es la unificación, “VisualComplexity.com trata de ser un espacio de recursos unificados para cualquiera que esté interesado en la visualización de redes complejas. La meta del proyecto es influenciar una comprensión crítica de diferentes métodos de visualización, de entre una serie de disciplinas tan diversas como biología, redes sociales o internet.” (Manuel Lima, fundador de VisualComplexity). Junto a este, existen multitud de proyectos que abarcan otras áreas de conocimiento y que se adscriben a Visual Complexity, en el que se muestran diversos tipos de representaciones visuales estáticas y dinámicas para redes de datos complejas. Muchos de estos resultados son muy vistosos y resultan de gran utilidad para entender los conceptos que se representan con ellos, como por ejemplo, los que se muestran a continuación.

Image taken from http://moritz.stefaner.eu/projects/map%20your%20moves/

35


THE ROLE AND IMPACT OF RESEARCHERS MOBILITY Raimondo Iemma

Raimondo Iemma holds a Master’s degree in Management Engineering from the Polytechnic of Turin. He works as research assistant at Fondazione Rosselli and as Project Manager at COTEC (Italian think tank on technological innovation). He besides collaborates with the Triple Helix Association. He has been involved in several research projects both at European and local level. His interests cover Economics of Innovation and technological change, Information economics and Open Data models.

Raimondo Iemma tiene un Máster en Ingeniería de Gestión por la Politécnica de Turín. Trabaja como asistente investigador en la Fundación Roselli y como jefe de proyectos en COTEC. Por otro lado colabora con la Asociación Triple Helix. Raimondo Ienmma ha estado involucrado en diferentes proyectos de investigación, tanto europeos como nacionales. Sus intereses cubren la economía de la innovación y el cambio tecnológico, así como la economía de la información y los modelos Open Data.

EL ROL E IMPACTO DE LA MOVILIDAD DE LOS INVESTIGADORES Raimondo Iemma

Image taken from http://ierasmus.com

36


The importance of scientific knowledge and university research for economic growth and competitiveness is not a new concept. One of the main tasks of policy makers in the S&T field is indeed to design strategies in order to encourage scientific production and knowledge transfer. In this framework, the establishment of research networks and mobility of researchers across different countries becomes a major policy goal. Mobility is an important element in forming and embracing social networks and is believed to be vital to further scientific quality, research development and knowledge diffusion. Indeed, the concept of “mobility” needs to be further detailed. Image taken from http://www.graphicmania.net

The SISOB working group in charge of the case study (composed by researchers from the University of Turin and Fondazione Rosselli), is adopting four dimensions: Geographical Mobility (job transition to a different academic market), Sector Mobility (job transition from academia to industry or vice versa), Functional Mobility (job transition to a different function) and Career Mobility (job transition to a higher/lower position or to a more/less prestigious university). As a second perspective, the case study will cover a less traditional form of mobility, that we could label “Virtual Mobility”, i.e. the (rather frequent) existence of concurrent multiple affiliations for a single researcher. The aim is not only to assess the impact of researchers’ mobility on their performance, but also to evaluate the relationship between productivity and mobility within the diverse career moments, by identifying trends and causal relationship across time, as well as to describe migration patterns across universities, regions and sectors, in order to assess the impact of mobility on receiving and sending institutions and regions. How? By applying econometric analysis to panel data gathered from heterogeneous (in terms of disciplinary sector, country and type of data) repositories. Indeed, databases of grant-awarded researchers and curricular data are two key goldmines of information. Datasets from the Biotechnology and Biological Sciences Research Council (UK), the National Institutes of Health (US) and the Grants-in-Aid programme (Japan), containing thousands of records, are already under study in order to provide key results from three different geographical areas. Moreover, sets of researchers’ CVs are being collected, standardized and analyzed with the support of the University of Malaga, leader of the SISOB project. Further achievements will be soon available and will help us to better understand the role and impact of mobility in the scientific and societal playground, providing policy makers with brand new evidence on the subject.

37


La importancia del conocimiento científico y la investigación académica para el crecimiento económico y la competitividad, no es algo nuevo. Una de las principales tareas de los responsables políticos en el campo de la ciencia y la tecnología (S&T) es el diseño de estrategias para alentar la producción científica y la transferencia de conocimiento. En este marco, el establecimiento de redes de investigación y movilidad de investigadores entre diferentes países se vuelve un objetivo político importante. La movilidad es un elemento importante en la formación y la adopción de redes sociales, y se cree vital para desarrollar una mayor calidad científica, desarrollo de la investigación y difusión del conocimiento. Realmente, el concepto de “movilidad” tiene que especificado en más detalle. En SISOB, el grupo de trabajo responsable del caso de estudio de movilidad (compuesto por investigadores de la universidad de Turin y de Fondazione Rosselli), adoptan cuatro dimensiones: Movilidad Geográfica (transición de trabajo a un organismo académico diferente), Movilidad Sectorial (transición de trabajo desde la academia a la empresa o vice versa), Movilidad Funcional (transición de trabajo a una función diferente) y Movilidad de Carrera (transición de trabajo a un puesto de trabajo superior/inferior o a una universidad más/menos prestigiosa). Como segunda perspectiva, el caso de estudio cubrirá formas de movilidad menos tradicionales, que pueden etiquetarse como “Movilidad Virtual“, es decir, la (frecuente) existencia de múltiples afiliaciones concurrentes de un único investigador.

38

El objetivo es no sólo evaluar el impacto de la movilidad de los investigadores en su rendimiento, sino evaluar la relación entre la productividad y la movilidad en diversos momentos de su carrera, identificando tendencias y relaciones causales en el tiempo; también describir patrones migratorios entre universidades, regiones y sectores para evaluar el impacto de la movilidad en instituciones y regiones emisoras y receptores. ¿Cómo? Aplicando análisis econométrico para estudiar datos reunidos de repositorios heterogéneos (en términos de sector disciplinario, país y tipos de datos). Ciertamente, las bases de datos de investigadores becados y datos curriculares son dos minas de oro de información. El conjuntos de datos del Biotechnology and Biological Sciences Research Council (Consejo de Investigación de Ciencias Biológicas y Biotecnológias del Reino Unido), de los National Institutes of Health (Institutos Nacionales de Salud, EEUU) y del programa Grants-in-Aid (“Becas en Ayuda” de Japón) contienen miles de registros, y están siendo estudiados para proporcionar resultados clave en tres áreas geográficas diferentes. Más aun, se está llevando a cabo la recolección, estandarización y análisis de currículos de investigadores en la Universidad de Málaga, coordinadora del proyecto SISOB. Los consiguientes resultados estarán pronto disponibles y podrán ayudarnos a un mejor entendimiento del rol e impacto de la movilidad en el campo social y científico, proporcionando a los cargos políticos nuevas evidencias en este tema.


39


PEER REVIEWING Inés Méndez María Inés Méndez (PhD) belongs to the DGITE team, where she works as a technical adviser in European Projects and is an Associate Professor in the Journalism Department at the University of Seville. She has experience as a member of coordinting staff in the European Projects, in which SGUIT is partner, for example ERASTAR Regions (Space Technologies Applications and Research for the regions and medium-sized countries), NEREUS (the Network of European Regions Using Space Technologies), CreaMED (Fostering Creativity and Innovation in the Mediterranean Area as key elements for Regional Sustainable Development: CreaMED Alliance). At the university, her main areas of research are scientific and technological communication and journalism of quality. She participated in communication and dissemination tasks in several technical European projects.

REVISIÓN POR PARES Inés Méndez María Inés Méndez (Dra.) pertenece al equipo DGITE, en el cual trabaja como consejero técnico en materia de proyectos euroopeos; asímismo es profesora asociada en el departamento de periodismo de la Universidad de Sevilla. Ha tomado parte en la coordinación de proyectos europeos, en la que SGUIT es socio, por ejemplo ERASTAR Regions (Aplicaciones para tecnologías espaciales e investigación para las regiones y países de mediano tamaño), NEREUS (la red para las regiones europeas utilizando tecnologías espaciales), Crea-MED (fomentando la creatividad y la innovación en el área del Mediterráneo como elemento clave para el desarrollo regional sostenible: Alianza CreaMED). En la universidad, sus principales áreas de investigación son la comunicación científica y tecnológica y el periodismo de calidad. Como investigadora universitaria, posee una interesante experiencia tomando parte en las tareas de comunicación y diseminación de diversos proyectos técnicos europeos.

Image taken from http://www.juliencollinet.info

40


When we use the term “Peer review” we refer to a method of determining the quality, credibility and scientific rigor of a written work or a funding application. Peer review is usually performed by several experts in the given field. In academia, a publication qualifies for publication if it has been favourably peer-reviewed.

Some of them have to do with limited funds and publication space. If that is the case, only a small number of manuscripts can be published. It may also happen that a journal has few highquality manuscripts to choose from and accepts a number of less impressive works on condition that their authors will improve their quality.

How is it done? Peer-review is the process of subjecting a work or an idea to the scrutiny of one or more experts in the given field. They evaluate the work and suggest the ways of improving it. Then, they return the reviewed papers together with their comments and recommendations to the editor. Typically, most of the reviewers’ comments are eventually sent to the author(s). Reviewers usually propose one of the following: • Unconditional acceptance of a manuscript or a proposal. • Acceptance on condition that the author improves it in certain ways. • Rejection, but also encouragement to revise the manuscript and resubmit it. • Outright rejection. During the peer-review process, the role of reviewers is advisory and the editor does not have to accept their opinions. Although peer review may be very rigorous in terms of the quality of a given work, the final decision lies with the editor and is subject to restrictions.

Figure 1. Peer bp.blogspot.com).

review

(http://4.

Generally speaking, peer-review has more critics than defenders. We should pay attention what the first group has to say in order to make peer-review reliable and of high quality. Some sociologists of science claim that just a small number of people virtually control what is going to be published and their choices are often affected by their personal viewpoints. They are also critical of the fact that the well-established authors in a given field tend to be regarded as the best reviewers as opposed to the less-established ones. As a result, novel and little-known lines of research often meet with reluctance from the most prestigious publishers (Thomas Kuhn‘s well-known observations regarding scientific revolutions).

41


¿Qué entendemos por Revisión por Pares o Peer Reviewing? Cuando hablamos de Peer Reviewing nos estamos refiriendo al método utilizado para validar trabajos escritos y solicitudes de financiación con el fin de medir su calidad, factibilidad, rigor científico, etc. Realizado por un número de revisores con un rango y categoría similar a la del autor.

responden con una evaluación del trabajo, que incluye sugerencias sobre cómo mejorarlo, la cual es enviada al editor u otro intermediario (típicamente, la mayoría de los comentarios de los árbitros son reenviados a los autores). Las opciones propuestas son generalmente las siguientes:

¿Cuál es el procedimiento?

• Aceptación incondicional del manuscrito o de la propuesta. • Aceptación sujeta a las mejoras propuestas por el árbitro. • Rechazo, animando a los autores a revisar el documento y someterlo a revisión nuevamente. • Rechazo incondicional.

La revisión por pares somete un trabajo o idea al escrutinio de uno o más expertos en el área. Estos árbitros

Durante el proceso de revisión, el papel de los árbitros es consultivo, y el editor no tiene obligación formal de se-

En el ámbito científico y académico, generalmente, sólo se considera válida una publicación científica cuando ha pasado por un proceso de revisión por pares.

Image taken from http://www.juliencollinet.info

42


Even though peer-review is supposed to guarantee high quality of the submitted papers, it is not uncommon to find papers containing false results. Since reviewers assume that the submitted work is honest and professional, they may fail to address the fraud and such erroneous papers may still be published. This has to do with the real quality of scientific papers. If an author has had many of his papers published and his results are frequently cited by other

researchers, journals will continue publishing his works independently of their quality. That is why many authors believe that this must change and the quality must always come first. The-above mentioned critical voices show what peer review should be like. It is not just about an expert revising a paper so that it can be published in a high-impact journal. Peer review is a process that affects authors’ academic and research careers. The paper’s quality, impact and innovation must be

Image taken from http://www.juliencollinet.info

43


guir la opinión de los árbitros. Aun cuando la revisión por pares puede ser muy rigurosa en términos de las cualidades de un trabajo, la decisión de publicar o de financiar un trabajo recae al final sobre el editor y está sometida a algunas restricciones. Algunas de estas restricciones pueden venir de la mano, generalmente del espacio y el presupuesto, es decir si el espacio para publicar los trabajos es limitado (como por ejemplo en las conferencias científicas) o buen una gran diferencia entre las solicitudes de financiación y las propuestas presentadas. De forma contraria, puede ocurrir que una publicación no haya recibido suficientes trabajos claramente publicables y decida aceptar un mayor número de trabajos con aceptación condicionada.

Figura 1. Proceso de revisión por pares (http://4.bp.blogspot.com). Críticas a la revisión por pares: Cuando se realiza una evaluación de la revisión por pares, son pocas las

44

críticas favorables existentes en los foros de investigadores y tecnólogos. Generalmente el la vision que el sistema tiene de este procedimiento ha evolucionado con el tiempo, contando casi con más detractores que defensores. Debemos hacernos eco de los primeros para poder garantiza unos procesos realmente fiables y con garantías de calidad. Algunos autores vinculados a la Sociología de la Ciencia y la Tecnología se refieren al control y al poder que unos pocos expertos ejercen sobre la producción que finalmente será publicada. Control que, en ocasiones, suele venir aparejado a las preferencias de los evaluadores sobre las conclusiones presentadas por los autores de los textos. Por otra parte, también critican el poder y la influencia que ejerce el prestigio y el reconocimiento de los autores dentro de su área ( autores que al mismo tiempo suelen ser evaluadores en otras revistas) a la hora de valorar favorablemente un texto, frente a otro procedente de un investigador novel. En este último caso, la novedad y las nuevas líneas de trabajo suelen encontrar grandes reticencias en las publicaciones consagradas (observaciones de Thomas Kuhn sobre las revoluciones científicas.) Otros autores hablan de que, pese a las supuestas garantías de calidad que presenta la revisión por pares, es fácil encontrar ejemplos de falsificación de los resultados de impacto de los autores que, al no ser contrastados por los evaluadores, hacen que trabajos con, no excesiva calidad, superen los filtros más exigentes.


evaluated independently of the author’s prestige or his publications’ citation indices. There is no doubt that peer review is indispensable given the amount of scientiďŹ c results that are being produced and the need to disseminate them. However, it must favour quality and innovativeness if it is to contribute to the progress of science and technology.

45


Este aspecto está, como se ha comentado, relacionado con la calidad real de los trabajos. Directa o indirectamente, cuando un autor muestra unos índices de citación y un volumen de publicaciones alto, suelen ser aceptados los trabajos que se presentan independientemente de la calidad de los mismos. Desgraciadamente, son muchos los sistemas científicos que premian el volumen de publicaciones frente a la calidad de la misma. Por tanto, muchos autores defienden un cambio en cuanto a la valoración de determinados índices curriculares, primando la calidad frente a la calidad. Estos análisis nos muestran la importancia real de la revisión por pares, no se trata simplemente de la revisión de un texto por un experto que aporta comentarios y sugerencias a los autores para mejorar una publicación que aparecerá en una revista de impacto. Se

46

trata de un proceso altamente delicado que va a afectar a corto, medio y largo plazo a la evolución y desarrollo de la vida académica e investigadora de los autores que se someten al mismo. Los criterios e indicios de calidad, impacto e innovación deben ser, ante todo, los más importantes a la hora de evaluar positiva o negativamente un trabajo, independientemente del reconocido prestigio del autor, los índices de citación y publicación , etc. Es incuestionable que se ha hecho necesaria e imprescindible la revisión por pares, habida cuenta de la cantidad de textos y trabajos que se generan y que precisan la diseminación de calidad que garantizan las revistas de prestigio, pero esta revisión no debe obviar nunca aspectos tan básicos como la calidad y la novedad para hacer progresar la ciencia y la innovación de cualquier Sistema de I+D+i.


INFORMATION EXTRACCIÓN DE EXTRACTION INFORMACIÓN Information extraction in the WWW: technology and tools for problem solving. Eduardo Guzmán & Daniel López

Extracción de la información en la web, tecnología y herramientas para resolver la problemática.

Eduardo Guzmán y Daniel López

Eduardo Guzmán (PhD) is an Associate Professor in the Languages and Computer Science Department at the University of Málaga. He received his PhD with honors in Computer Science and Artificial Intelligence from the University of Málaga in 2005. His research interests include user modelling, intelligent learning environments, adaptive systems and web engineering and technologies.

Eduardo Guzmán (Doctor) es profesor asociado en el departamento de Lenguajes y Ciencias de la Computación de la Universidad de Málaga. Recibió su doctorado con honores por la Universidad de Málaga en 2005. Sus intereses de investigación incluyen modelado de usuarios, entornos de aprendizaje inteligentes, sistemas adaptativos e ingeniería web y de tecnologías.

Daniel López González (BEng (Comp)) is a technical engineer in computer management by Universidad Complutense de Madrid, with 4 years of professional experience as software developer. Proven competence in multiple programming languages and technologies.

Daniel López González (BEng (Compo)) es ingeniero técnico en informática de gestión por la Universidad Complutense de Madrid, con 4 años de experiencia profesional como desarrollador de software. Competencia demostra en múltiples lenguajes de programación y tecnologías.

47


browsers to search for and extract huge amounts of data manually.

Image taken from http://assortiment.kiev.ua

The World Wide Web is undoubtedly the biggest container of information that has ever been created in the human history; there is no library in the world that has even one millionth of the amount of information the WWW contains. This system of information based on hypertext allows us to access an infinite number of documents enriched with images and multimedia. The WWW is designed to be used with the so-called web browsers; friendly applications for visualizing documents which permit anyone with basic knowledge of computers to immediately access a vast network of information. However, the WWW can be exploited in many other ways; for instance, it can be seen as a massive source of data that can be processed in models, with the aim of making analysis or applications, or used in creating other information systems. As you can imagine, a web browser which has been originally created for the WWW is not appropriate for the task of extracting large numbers of information since it would not be feasible to make a group of people use web

48

There exist different tools and strategies for dealing with this welter of information. One of the biggest problems when extracting large amounts of information from the WWW isshortage of indicators or semantic metadata (Semantic Web), as well as lack of order or common structure. Such indicators could be superficially read by computer programs to find out what type of information a given document contains, and if there were some sort of order it would be possible to locate a large amount of information at the same time. Unfortunately, that is not the case and each document (website, PDF document, Word Document, etc) has its own order and lacks semantic metadata, which is why we have to create patterns for detecting information. We now face two challenges: to know what the information contained in a document means, and where it is located. Furthermore, there is another question we have to answer: where do we find these documents? We also have to differentiate between two big groups of documents: those written in natural language, and the semi-structured ones (which may contain blocks of information written in natural language) The first group of documents represents any text written by a given person in natural language. In this


La World Wide Web es con total seguridad el mayor contenedor de información jamás creado en la historia de la humanidad, ninguna biblioteca del mundo ha tenido ni la millonésima cantidad de información contenida en la web. Este sistema de información distribuida basada en el hipertexto permite a las personas acceder a in nidad de documentos enriquecidos con imágenes y contenido multimedia mediante una conexión a Internet.

Image taken from http://twitterkilledtheblogger.wordpress.com

La World Wide Web ha sido concebida para ser utilizada con los llamados navegadores web, aplicaciones amigables que visualizan los documentos de la web haciendo que cualquier persona con unos mínimos conocimiento informáticas tenga acceso a una vasta red de información de manera inmediata. Pero lo cierto es que la web como contenedor de información, puede ser explotada de otras muchas maneras, por ejemplo puede ser vista como una fuente masiva de datos e información para su posterior tratamiento en modelos propios con el objeto de realizar estudios, aplicaciones o simplemente para crear otros sistemas de información. Como se puede imaginar, el navegador web, la herramienta ideada en principio para la web, se vuelve estéril para en-

frentar esta tarea, ya que sería inviable poner a un grupo de personas con navegadores web para encuentren y extraigan la información requerida de forma manual, al menos si queremos una gran cantidad de datos. Para intentar resolver esta tarea existen diversas herramientas y estrategias que nos permiten atacar a este maremágnum de información. Porque uno de los grandes problemas a la hora de extraer información de manera masiva de la World Wide Web es la ausencia de indicadores o metadatos semánticos (Web Semántica), así como la carencia de orden o estructura común. Estos indicadores podrían ser leídos fácilmente por programas informáticos para saber qué tipo de información contiene el documento y de haber algún orden, también sería posible localizar la información rápidamente en todos los documentos que siguieran dicho orden. Sin embargo la realidad no es así y cada documento (página web, pdf, documento word, etc) tiene su propio orden y carece de metadatos semánticos por lo que hay que elaborar patrones para detectar la información. De este modo se nos presentan dos retos principales, saber que signi ca la información contenida en un documento y donde está localizada. Además, se nos presenta otro reto complementario si no disponemos de esos documentos, ¿dónde están encontrar esos documentos? Por otro lado, deberemos diferenciar dos grandes grupos de documentos, los escritos en lenguaje natural y los documentos semi-estructurados (dentro de un documento semi-estructurado

49


case we cannot follow any order, but we should make use of tools which are specially designed to process natural language. To extract information from natural language, the following tasks have to be performed: tokenization, sentence segmentation, grammar labelling, name

However, if we do not have documents and must look for them on the web, we should use the so-called web crawlers, which examine web documents by following links systematically and automatically. Here is a list of tools for dealing with problems that may occur when extracting massive quantities of information from the WWW. Location of documents in the WWW: · Crawler4j (http://code.google.com/p/ crawler4j/)

Image taken from http://www.dcs.co.uk

extraction, analysis and co-referentiality of names. The second group contains documents based on hypertext, most of which have been created by other computer programs in HTML format. Previously people would build their websites according to their needs and tastes, but today, in the era of dynamic WWW, big groups of documents from one place are created in the same way, with the same order and structure. To extract data from a group of documents, we should use reverse engineering to obtain their structure, and HTML parsers to locate and extract information (this process is known as Web scraping). Note that there are some web documents which require tools for processing natural language.

50

Crawler4j is a simple web crawler with open-source efficient license written in Java. CrawlerJ can search and check hundreds of document in no time. It offers a decision block to determine whether a given link should be visited or not, and another one for processing the content of a document. The crawler needs seed values (websites) to work. Document location and extraction for specific sites (scraping): · Web Harvest (http://web-harvest. sourceforge.net/) Web Harvest is an example of enduser software for data extraction from sites with specific structures. The software has his owns language for code extraction patterns. · JSOUP (http://jsoup.org/) JSOUP is a library written in Java that offers an HTML parser of real world documents and allows extracting infor-


podemos encontrarnos bloques de información escrita en lenguaje natural).

formáticos en formato HTML. Antiguamente cada persona hacía su web con la estructura que creía conveniente, Los primeros tipos de documentos re- pero hoy en día con la web dinámica, presentan cualquier texto escrito por grandes grupos de documentos de un una persona de manera natural, en este mismo sitio son creados de la misma caso no podremos agarrarnos a ningún manera con un mismo orden y estrucposible orden y deberemos hacer uso tura. de herramientas especí cas para el procesamiento de lenguaje natural (NPL). Para extraer datos de este grupo de documentos deberemos hacer uso de Las tareas necesarias para extraer in- la ingeniería inversa para obtener su formación en lenguaje natural son: la orden y utilizar lectores (parsers) de dotokenización, segmentación de frases, cumentos HTML para localizar y extraer etiquetado gramatical, extracción de la información (lo que se conoce como nombres, análisis y relación co-referen- Web scraping). Nótese que en docucial de nombres. mentos webs muy particulares deberemos hacer uso de herramientas para el El segundo grupo representa los docu- lenguaje natural. mentos basados en hipertexto, creados Se nos presenta otro reto si no tenemos en su mayoría por otros programas in- los documentos y tenemos que buscar-

51


Image taken from http://www.oblomovies.com

mation from documents with DOM and CSS selectors.

with HTML documents of WWW, also written in C#.

· SCRAPY (http://scrapy.org/)

· WATIR (http://watir.com/)

A high-level framework written in Python, used to crawl websites and extract structured data from them

Watir is an open-source library written in Ruby for automating web browsers. It clicks links, fills in forms, presses buttons, etc. Many web pages show their contents using Javascript, which makes the tools mentioned above useless as they can read only hypertext, not the text generated by JavaScript.

· HTMLAGILITYPACK pack.codeplex.com/)

(htmlagility-

Another parser like JSOUP that works

52


los en la WWW, este problema se aborda con la utilización de las llamadas arañas web (crawlers), un tipo de software que examina los documentos web, siguiendo los enlaces de una forma mecánica y automatizada.

para tareas de extracción de datos contra sitios con estructura especí ca. El software tiene su propio lenguaje para codi car los patrones de extracción. · JSOUP (http://jsoup.org/)

Image taken from http://www.intuidex.com

Listado de posibles herramientas para los diferentes problemas a la hora JSOUP es una librería escrita en Java de extraer información de manera ma- que ofrece un analizador de documensiva de la World Wide Web: tos HTML del mundo real y que permite extraer información de los documentos Localización de documentos en la mediante selectores DOM y CSS. World Wide Web: · SCRAPY (http://scrapy.org/) · Crawler4j (http://code.google.com/p/ crawler4j/) Framework de alto nivel escrito en Python para acometer tareas de scraCrawler4j es araña web bajo licencia li- ping. bre, rápida, e ciente y optimizada escrita en Java. Crawler4j permite navegar e · HTMLAGILITYPACK (htmlagilitypack. inspeccionar miles de documentos en codeplex.com/) poco tiempo, además proporciona un bloque de decisión para determinar si Otro parser HTML preparado para tradebemos visitar o no un enlace y otro bajar con los documentos de la web esbloque para tratar el contenido web crito en C#. o la dirección web obtenida del documento inspeccionado. El crawler nece- · WATIR (http://watir.com/) sita de valores semilla (sitios webs) para comenzar a funcionar. Watir es una librería escrita en Ruby para tareas de automatización de naveLocalización y extracción de documen- gadores web, permite pinchar enlaces, tos para sitios determinados (scraping): rellenar formularios, presionar botones, etc. Muchas páginas muestran conteni· Web Harvest (http://web-harvest.sou- do con JavaScript lo que deja inútiles rceforge.net/) las herramientas anteriores, ya que ésWeb Harvest es una aplicación nal tas solo leen el contenido del hipertex-

53


· Slavy:

GATE is an open-source platform for creating applications based on proSlavy is a library written in Python to cessing of information in natural lancreate information agents capable of guage. The main components of GATE searching for or extracting data from are: GATE EMBEDDED and GATE DEthe web. The agents can also commu- VELOPER. The first consists of GATE nicate with one another. At the moment nucleus (coded in JAVA) and can be the tool is not open-source. integrated into Java applications in the form of library. GATE DEVELOPER is, Processing natural language: however, a complete application which uses the GATE nucleus to process in· GATE (http://gate.ac.uk/): formation interactively. It can be viewed as an interactive tool to manually de-

Image taken from http://www.intuidex.com

54


to no lo que produce el código JavaScript contenido en el documento. · Slavy: Slavy es una librería escrita en Python para crear agentes de información capaces de navegar y extraer datos de la web, los agentes además pueden comunicarse entre sí entre otras muchas cosas. La herramienta de momento no está abierta al público pero se darán más detalles próximamente en el blog con una noticia dedicada a Slavy y sus posibilidades. Procesamiento del lenguaje natural: · GATE (http://gate.ac.uk/): Una plataforma de código abierto con herramientas para crear aplicaciones basadas en el procesamiento de la información en lenguaje natural. Los dos principales componentes de la plataforma GATE son: GATE EMBEDDED, GATE DEVELOPER. El primero consiste en el núcleo de GATE (codi cado en Java) y

es integrable en aplicaciones Java en forma de librería. GATE DEVELOPER, sin embargo, es una completa aplicación que utiliza el núcleo de GATE para tratar la información de manera interactiva. Puede verse como un panel de control previo a la automatización masiva para ir diseñando los patrones de extracción, en DEVELOPER podremos ver la información que hemos extraído en forma de marcados coloreados. Por último decir de GATE que tiene un alto grado de madurez y tiene tras su espaldas cientos de plugins para facilitar las tareas de la extracción de la información. · OpenNLP (http://incubator.apache. org/opennlp/): Se trata de otra herramienta libre para el NPL, soporta las tareas más comunes para abordar el problema, está escrita en Java y se presenta como una librería de sencilla integración. Sobra decir que está respaldada por Apache por lo que podemos hacernos una idea de su

55


GENERATING CONCEPTUAL MAPS FROM WEB-BASED FROM WEB-BASED INFORMATION Rodolfo Barrere & Lautaro Matas

Rodolfo Barrere graduated in Social Communication, throughout his career he has dedicated his work to production, management and analysis of scientific, technological and innovation information. As Technical Secretary of the Ibero-American Network on Science and Technology Indicators (RICYT), he has focused on the charateristics of indicators production in Ibero-American countries. He is developing his PhD thesis on the dynamics and evolution of the production of scientific and technological information. He has taken part in several research proyects funded by OECD, UNESCO, IADB, World Bank and the European Union. Rodolfo barrere es graduado en comunicación social, a lo largo de su carrera ha dedicado su trabajo a la prodcción del trabajo, a la gestión y análisis científicos y a la información tecnológica e innovativa. Como secretario técnico de la Red Iberoamericana de Indicadores de Ciencia y Tecnología (RICYT), se ha centrado en las características de la producción de indicadores en los países Iberoamericanos. En la actualidad está desarrollando su tesis doctoral en las dinámicas y evolución de la producción de información científica y tecnológica. Ha tomado parte en diversos proyectos de investigación financiados por el OECD, UNESCO, IADB, el World Bank y la Unión Europea.

GENERACIÓN DE MAPAS CONCEPTUALES A PARTIR DE INFORMACIÓN EN LA WEB Rodolfo Barrere y Lautaro Matas

56


In one of the previous posts we talked about the abundance of information that can be found on the internet and different ways of extracting it. We have also published a post about the possibilities offered by analysis and representation of networks. As far as the last topic is concerned, in 2009 Observatorio Iberoamericano de la Ciencia, la Tecnología y la Sociedad (CAEU-OEI) launched Intelligo, an online service which classifies and analyses scientific documents. Intelligo not only allows users to explore large quantities of information through maps, but also provides them with access to original documents. Intelligo uses techniques for natural language analysis to identify and extract the most relevant concepts from each document. The concepts are then linked to one another in accordance with occurrence contexts based on a semantic model built from the whole corpus. Intelligo has gathered a collection of about 500,000 documents. This num-

ber will keep growing as new repositories will be added. The following repositories already form part of Intelligo: Scielo, REDALYC, CLACSO, CSIC (Spain), Universidad de Granada (Spain) and USPTO patents. In the next section we briefly describe the stages of information processing offered by Intelligo: Data harvesting: implementation of extraction components according to the format of each data source in order to extract metadata and texts that feed subsequent stages of processing. Currently, we can use import sources OAI-PMH for institutional repositories, XML patents and JSON metadata from the Scielo.org platform. Information Extraction: the main input in this phase consists of the concepts taken from the documents (the whole text, a brief or a description). This stage is devoted to identifying and extracting concepts using natural language analysis techniques (in the original language of the country). Moreover, we extract the meta-

57


La abundancia de información en Internet y las problemáticas de su extracción ya fueron abordadas en un post anterior. Al mismo tiempo, las posibilidades ofrecidas por el análisis y representación de redes también fueron anteriormente descriptas en un post anterior del SISOBlog. En este contexto desde 2009, como una actividad del Observatorio Iberoamericano de la Ciencia, la Tecnología y la Sociedad (CAEU-OEI), se desarrolla Intelligo. Se trata de un portal que releva y analiza documentos científicos, tecnológicos y educativos y permite tanto la exploración de estos grandes volúmenes de información a través de mapas, como el acceso a los documentos en su fuente original. El explorador utiliza técnicas de análisis de lenguaje natural para identificar y extraer los conceptos más relevantes de cada documento. Los conceptos identificados son vinculados entre sí de acuerdo a los contextos de ocurrencia, sobre la base de un modelo semántico construido a partir de todo el corpus.

Bajo la órbita de exploración de Intelligo se reúnen hoy unos 500.000 documentos, número que seguirá creciendo a partir de la incorporación de nuevos repositorios. Entre los repositorios ya anexados se encuentran Scielo, REDALYC, CLACSO, CSIC (España), la Universidad de Granada (España) y patentes de la USPTO. A continuación se describen brevemente las etapas involucradas en el procesamiento de la información ofrecida en el portal: Cosecha de los documentos: de acuerdo a los formatos de cada fuente se implementan módulos para extracción de los metadatos y textos que alimentan a las etapas posteriores del procesamiento. Actualmente se cuenta con importación de fuentes OAI-PMH para repositorios institucionales, XML de patentes, metadata JSON de la plataforma Scielo. org. Extracción de información: el principal insumo son los conceptos provenientes del texto (completo, resúmen, descripción) de los docu-

Image taken from http://www.scrapingmaster.com

58


data available in each source. These metadata provide extra information about the areas that have been analyze Generation of the semantic model. On the basis of the extracted concepts and their occurrence contexts, we generate a new semantic model that allows modeling the semantic similarity between any pair of concepts given their occurrence in similar contexts. This model also allows modeling the similarity between documents and sets of concepts (topics) permitting the recovery of information given its semantic affinity. Each source of information generates a different model; in this way we can value the differences between areas, making it possible to see how a given topic is treated within different sets. Publication of web services: the data processed offline is stored in efficient data structures that feed web services, which in turn answer the queries of the final user through a friendly web interface. This data is provided in the following formats: Theme maps: Given a set of concepts defined by the user, we identify the related documents and concepts using clustering techniques to gener-

ate a graph that will show the clusters of topics and its relationships. This graph will be pruned and placed within spatial coordinates in order to be shown in the web interface. Metadata maps: Each data source has a set of metadata (people, institutions, classifiers) that are used to generate maps that provide complementary information about the userdefined topic. This allows us, for example, to know the main experts that publish within a given field of knowledge and their collaborations. Documents recovery: The recovered documents are shown according to the occurrence of words within the text (traditional recovery). Those documents which contain concepts related to the topic defined by the user are presented separately, according to the semantic model which has been previously computed. Therefore, Intelligo offers a new way of retrieving information. The website is available in: http:// www.explora-intelligo.info/ Authors: Rodolfo Barrere & Lautaro Matas

Image taken from http://www.ontotext.com

59


mentos. En esta etapa se identifican y extraen conceptos utilizando técnicas de análisis de lenguaje natural en los idiomas de la región (español, inglés y portugués). Además se extraen los metadatos disponibles en cada fuente que ofrecen información complementaria de los ámbitos analizados

rio, se identifican los documentos asociados y sus conceptos, con técnicas de clustering específicas se genera un grafo que da cuenta de las agrupaciones de temas y sus relaciones. El grafo es podado y ubicado en coordenadas espaciales para permitir su graficación a través del aplicativo web.

Generación del modelo semántico: en base a los conceptos extraídos y sus contextos de ocurrencia se genera un modelo semántico emergente, que permite modelar la cercanía semántica de cualquier par de conceptos en base a su ocurrencia en contextos similares. Este modelo además permite modelar la cercanía entre documentos y conjuntos de conceptos (temas) permitiendo la recuperación de información por afinidad semántica. Cada fuente de información genera un modelo distinto, de esta manera se pueden valorar las diferencias entre ámbitos pudiendo establecer comparaciones cualitativas, permitiendo apreciar como un mismo tema es tratado en distintas colecciones.

Mapa de metadatos: cada fuente provee un conjunto de metadatos (personas, instituciones, clasificadores) que son utilizados para generar mapas que brindan información complementaria sobre el tema definido por el usuario. Esto permite, por ejemplo, saber los principales expertos que publican en un tema y su relaciones de colaboración.

Publicación de servicios web: Los datos procesados offline se almacenan en estructuras de datos eficientes que alimentan los servicios web que atienden las consultas de los usuarios finales a través de un aplicativo web amigable, se proveen: Mapa de temas: dados un conjunto de conceptos definidos por el usua-

60

Recuperación de documentos: se ofrecen los documentos recuperados por la ocurrencia de las palabras en el texto (recuperación tradicional) y en forma separada se presentan los documentos que contienen conceptos afines al tema definido por el usuario de acuerdo a la aplicación del modelo semántico calculado previamente. De esta manera la herramienta ofrece también una forma novedosa de recuperar información. El sitio puede visitarse en http://www. explora-intelligo.info/ Autores: Rodolfo Barrere y Lautaro Matas


SECOND PLENARY MEETING The second plenary meeting of the SISOB project took place in Budapest between 30th and 31st of May 2011. The discussion focused on the definition of the conceptual model, with particular emphasis on the social aspects and new methods of measurement of social impact. Members of the project want to go beyond the traditional producer-consumer model and centre on a model called “Community”, which is much more suitable for the project from the point of view of policy definitions and traceability. As far as the partners’ tasks are concerned, the process of agglutinating was assigned to the CICE, who will define and determine scientific policies and the needs of those institutions which manage the knowledge about the impact of science in society; in this way we will know what to implement in the system.

Durante los días 30 y 31 de mayo se celebró en Budapest la segunda reunión plenaria del proyecto SISOB. Los aspectos más importantes de la reunión se centraron en la discusión sobre la definición del modelo conceptual, focalizado en los aspectos sociales y nuevos métodos de medida del impacto social. En este caso, se supera el tradicional modelo productor-consumidor, pasamos al modelo denominado Comunidad, mucho mas accesible desde el punto de vista de la definición de políticas y trazabilidad. Por otra parte, a la hora de definir sinergias y estrategias entre los socios, la principal tarea aglutinadora recayó en la CEIC, la cual debe definir y delimitar el tipo de política científica y las necesidades de las administraciones de conocimiento del impacto de la ciencia en la sociedad. De esta forma sabremos qué debemos pedirle al sistema.

61


THIRD PLENARY MEETING This plenary meeting was held in Seville (Spain) on November 17 th and 18th. The SiSOB partners presented the first prototypes of the analysis tools and discussed the progress of the conceptual model for each of the three case studies of the project: researcher mobility, knowledge sharing and peer reviewing. There was also a presentation of the tool designed for the visualization system, and the first graphics obtained through the use of this tool.

62

En la tercera reunión plenaria celebrada en Sevilla los días 17 y 18 de noviembre se presentaron los primeros prototipos de las herramientas de análisis, y el estado del desarrollo conceptual de los tres casos de estudio, el de movilidad, el de conocimiento compartido y el de revisión por pares. Junto a esto se presentó la herramienta diseñada para la visualización del sistema así como los primeros gráficos obtenidos.


CALL FOR PAPERS Call for Papers: 23rd International Conference ACM Hypertext and Social Media The ACM Hypertext and Social Media conference is a premium venue for high quality peer-reviewed research on hypertext theory, systems and applications. It is concerned with all aspects of modern hypertext research including social media, semantic web, dynamic and computed hypertext and hypermedia as well as narrative systems and applications. The ACM Hypertext and Social Media 2012 conference will focus on exploring, studying and shaping relationships between four important dimensions of links in hypertextual systems and the World Wide Web: people, data, resources and stories.

Image taken from http://www.autismgenome.org/

NEWS Call for Papers – 23 Edición de la Conferencia Internacional ACM de Hypertexto y Medios sociales La conferencia ACM de Hyipertexto y Medios sociales es un lugar privilegiado y un punto de encuentro de alta calidad para la investigación en revisión por pares basada en la teoría de hipertextos, sistemas y aplicaciones. Esta edición concierne a todos los aspectos de la investigación moderna en hipertextos, incluyendo medios sociales, web semántica, hipertextos dinámicos y computados, hipermedios, sistemas narrativos y aplicaciones. La conferencia ACM de Hyipertexto y Medios sociales de 2012 se centrará en explorar, estudiar y dar forma a las relaciones entre cuatro importantes dimensiones de enlaces en los sistemas hipertextuales y la world wide web: personas, datos, recursos e historias.

Image taken from http://www.stella-science.eu/

63


CALL FOR PAPERS Call for Papers BRICK - 5th annual workshop “The Organisation, Economics and Policy of Scientific Research”

Call for Papers BRICK 5º workshop anual: “La organización, economía y política de la investigación científica“

LEI & BRICK (University of Torino – Collegio Carlo Alberto) organise the 5th annual workshop“The Organisation, Economics and Policy of Scientific Research” on 27-28 April, 2012 at the Collegio Carlo Alberto in Moncalieri (Torino).

LEI & BRICK (Universidad de Turín - Colegio Carlo Alberto) organiza el 5º workshop anual “La organización, economía y política de la investigación científica“ los días 27 y 28 de abril (2012) en el Colegio Carl Alberto de Moncalieri (Turín).

The aim of the workshop is to bring together a small group of scholars interested in the analysis of the production and diffusion of scientific research from an economics, historical, organizational, and policy perspective.

El objetivo de este workshop es reunir a un puequeño grupo de investigadores interesados en el análisis de la producción y difusión de la investigación científica desde una perspectiva económica, histórica y política.

The workshop aims at including papers form various streams of research developed in recent years in and around the area of public and private scientific research: • Organisation of research activities in HE, PRO and private R&D labs. • Scientific careers & mobility. • Public and private funding of scientific research. • Spillovers from scientific research. • Science research networks. • Teaching and research interaction. • Special Session Academic Patenting in Europe: In cooperation with the ESF Research Networking Programme “Academic Patenting in Europe (APE-INV)”, we organize a special session on the empirical analysis of academic patenting and its economic and organizational implications.

64

NEWS

El workshop incluirá artículos de varias corrientes investigadoras desarrolladas en los últimos años que estén centradas en el área de la investigación científica pública y privada: • Organización de actividades de investigación en HE, PRO y laboratorios de I+D privados. • Carreras científicas y movilidad. • Financiación pública y privada de la investigación científica. • Excedentes de la investigación científica. • Redes de investigación científica. • Interacción de la docencia y la investigación. • Sesión especial de patentes académicas en Europa: en cooperación con el Programa de Interconexión de la Investigación ESF “Patentes académicas en Europa (APEINV)“, organizamos una sesión especial en el análisis empírico de las patentes académicas y sus implicaciones económicas y organizacionales


DISSEMINATION SISOB Web: http://sisob.lcc.uma.es

SISOBserver Web: http://sisobserver.lcc.uma.es/

SISOBlog: http://sisobproject.wordpress. com/ Image taken from http://www.fincadelia.com

SISOB Facebook Group: http://www.facebook.com/groups/sisob.project/

SISOB LinkedIn Group: http://www.linkedin.com/groups/SISOB-Observatorium-Science-in-Society4012457?trk=myg_ugrp_ovr

SISOB at Twitter: http://twitter.com/#!/SISOBproject

SISOB at YouTube: http://www.youtube.com/user/ SISOBproject?feature=mhee

SISOB Mendeley Profile: http://www.mendeley.com/profiles/ sisob-project/

Image taken from http://www.205sqn.aafc.org.

65


RELATED PROJECTS FP7 ACUMEN PROJECT (Academic Careers Understood through Measurement and Norms) http://research-acumen.eu ACUMEN is a European research project that began in March 2011. This FP7 project is a cooperation between several European research institutes. Professor Paul Wouters (CWTS – Leiden University) is the principal investigator. ACUMEN es un proyecto de investigación europeo que comenzó en marzo de 2011. Este proyecto del 7PM se produce en una colaboración entre diversos institutos de investigación europeos. El profesor Paul Wouters, de la Universidad de Leiden, es el investigador principal. FP7 LiquidPub PROJECT (Liquid Publications: Scientific Publications meet the Web) http://project.liquidpub.org/

The Liquid Publications Project is a Framework Program 7 (FP7) funded research project in the Future and Emerging Technologies (FET) – OPEN series. It ended with the project review on May 13th 2011. The aim of this project is to create a new paradigm to transform a scientific publication from a static artifact to a Liquid Publication that can take multiple forms, that evolves continuously, and is enriched by multiple sources. El proyecto del 7PM Liquid Publications está financiado dentro de las series OPEN-Tecnologías Futuras y Emergentes. Este proyecto finalizó con la revisión final el 13 de mayo de 2011. El objetivo de este proyecto es crear un nuevo paradigma que transforme las publicaciones científicas de artefactos estáticos a publicaciones líquidas, que pueden tomar múltiples formas, evolucionar continuamente y se enriquecen gracias a múltiples fuentes. FP7 ImREAL PROJECT (Immersive Reflective Experience-based Adaptive Learning) http://www.imreal-project.eu/

The ImREAL project is developing a novel type of learning experience. Innovative research from across Europe is being combined with state of the art commercial immersive learning environments to deliver a cost-effective learning experience aligned with the real world and in-tune with the learner’s cognitive abilities. El proyecto ImREAL está desarrollando una nueva experiencia de aprendizaje. Se combina la innovación científica con los entornos comerciales de aprendizaje más novedosos para prodcir una experiencia de aprendizaje efectiva, alineada con el mundo real y acorde a las habilidades cognitivas del aprendiz.

66


SISOB Consortium 2011-2013. The SISOB project is supported by the European Commission, call FP7-SCIENCE-IN-SOCIETY-2010-1, as a Collaborative Project under the 7th Framework Programme, Grant agreement no.: 266588 67

Journal of the SiSOB Project - Vol.2-Issue2  

The second issue of SiSOBserver journal whose main aim is to share knowledge about the project.

Advertisement