Revista Española de Documentación Científica, Vol.
34, No 3 (2011)

Estudios
José Pino-Díaz, Evaristo Jiménez-Contreras, Rosario Ruíz-Baños, Rafael Bailón-
Moreno. Evaluación de redes tecnocientíficas: la red española sobre Áreas Protegidas,
según la Web of Science. Vol. 34, No.3 (2011), pp. 301-333

Jose A. Senso, Amed Abel Leiva-Mederos, Sandor Eduardo Domínguez-Velasco.
Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol. Vol. 34, No.3
(2011), pp. 334-356

Jesús Robledano Arillo. Mejora del rango dinámico en la digitalización de
documentos desde una perspectiva patrimonial: evaluación de métodos de alto rango
dinámico (HDR) basados en exposiciones múltiples. Vol. 34, No.3 (2011), pp. 357-
384

Silvia Arano, Gemma Martínez, Marina Losada, Marta Villegas, Anna Casaldàliga,
Núria Bel. La comunidad «Recursos y datos primarios» de la Universitat Pompeu
Fabra: los repositorios institucionales como infraestructuras científicas: estudio de
caso. Vol. 34, No.3 (2011), pp. 385-407

Ernesto R. Gantman. La productividad científica argentina en Ciencias Sociales:
Economía, Psicología, Sociología y Ciencia Política en el CONICET (2004-2008).
Vol. 34, No.3 (2011), pp. 408-425

Notas y Experiencias
Rosario Arquero Avilés, Félix Del Valle Gastaminza, L. Fernando Ramos Simón,
Iuliana Botezán, Concepción Mendo Carmona, Rodrigo Sánchez Jiménez, Carlos
Tejada Artigas, Silvia Cobo Serrano, Andrea Sala Jiménez. Reutilización de la
información generada en el sector público español. Vol. 34, No.3 (2011), pp. 427-446

Manuela Moro Cabero. Certificación de calidad en los archivos. Análisis y
prospectiva. Vol. 34, No.3 (2011), pp. 447-460

Normas
María Elvira y Silleras. Preservación de los documentos digitales: Guía para
comenzar. ISO/TC 46/SC 11. Version española, octubre 2010. Vol. 34, No.3 (2011),
pp. 461-477


Noticias
Borja González-Albo. Workshop «New Research Lines in Informetrics». Vol. 34,
No.3 (2011), pp. 479-480

Teresa Abejón. XII Jornadas Españolas de Documentación. FESABID 2011. Vol. 34,
No.3 (2011), pp. 481-482

Elena Primo Peña, Concha Muñoz Tinoco, Jose Manuel Estrada Lorenzo. Crónica de
las XIV Jornadas Nacionales de Información y Documentación en Ciencias de la
Salud. Vol. 34, No.3 (2011), pp. 483-486

Armando Albert, Luis Plaza. Presentación del informe anual 2010 de ASEBIO. Vol.
34, No.3 (2011), pp. 487-488



Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 301-333, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
ESTUDIOS / RESEARCH STUDIES
Evaluación de redes tecnocientífi cas: la red española
sobre Áreas Protegidas, según la Web of Science.

José Pino-Díaz*, Evaristo Jiménez-Contreras**, Rosario Ruíz-Baños**,
Rafael Bailón-Moreno***
Resumen: Las relaciones de coocurrencia entre las palabras clave, los investigadores y las
revistas en los artículos científi cos de un dominio documental concreto confi guran una
red tecnocientífi ca que puede ser analizada y cartografi ada para conocer los nodos,
subredes y áreas de investigación estratégicas, relevantes o importantes. Se ha realiza-
do el análisis estratégico y el análisis dinámico, de traducción o de cambio, de la Red
de Investigación Española sobre Áreas Protegidas según la Web of Science en el pe-
ríodo 1981-2005. Producto de este análisis se han obtenido el Diagrama Estratégico y
el Mapa de Conocimiento Estratégico de la Red Tecnocientífi ca o Mapa CERT, los lis-
tados de investigadores y de revistas de importancia estratégica y la tabla de análisis
de actividad de las subredes. La red tecnocientífi ca analizada es una red bien estruc-
turada, en la que se han identifi cado veintidós subredes estratégicas de investigación.
El análisis de las redes tecnocientífi cas mediante técnicas de creación de nuevo cono-
cimiento a partir de bases de datos bibliográfi cas y de ingeniería y cartografía del
conocimiento supone un apoyo de primer orden a la toma de decisiones estratégicas
en Política Científi ca y en evaluación de la Ciencia y de la Tecnología.
Palabras clave: Redes científi cas y tecnológicas, áreas protegidas, espacios naturales pro-
tegidos, parques nacionales, parques naturales, vigilancia estratégica científi ca y tecno-
lógica, sistemas de conocimiento, gestión del conocimiento, evaluación de la actividad
científi ca y técnica, cartografía de la información, cartografía del conocimiento, mapas
de conocimiento estratégico de las redes tecnocientífi cas, mapas CERT.
Evaluation of techno-scientifi c networks: a Spanish network
on protected areas, according to the Web of Science

Abstract: Relationships of co-occurrence between keywords, researchers and journals in
the professional literature of a given domain can be analyzed and mapped to discover
*Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación. Uni-
versidad de Málaga.
**Departamento de Biblioteconomía y Documentación. Universidad de Granada.
***Departamento de Ingeniería Química. Universidad de Granada. Correo-e: jpinod@uma.es;
evaristo@ugr.es; rruizb@ugr.es; bailonm@ugr.es.
Recibido: 06-10-2010; 2.ª versión: 03-02-2011; aceptado: 14-02-2011.
301

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
their nodes, subnets, and strategic research areas. A strategic and dynamic analysis
was done of the Spanish Research Network on Protected Areas from 1981 to 2005, as
identifi ed by the Web of Science. This analysis has resulted in a Strategic Diagram and
a Strategic Knowledge Map of Techno-scientifi c Network or CERT Map, lists of researchers
and journals of strategic importance, and a table analyzing the activity of the subnets.
The techno-scientifi c network is well-structured, with twenty-two strategic subnets. Net-
work analysis using KDD techniques and engineering and knowledge mapping provides
top grade support for strategic decision-making in science policy and the evaluation of
science and technology.

Keywords: Scientifi c and technological networks, protected areas; national parks, knowledge
managemen,; scientifi c and technological evaluation, knowledge discovery in database,
KDD, information mapping, knowledge mapping, mapping strategic research networks,
strategic knowledge maps of techno-scientifi c network, CERT maps.

1. Introducción
La evaluación de redes de conocimiento científi co y tecnológico es una línea
de investigación desarrollada a partir de la teoría sociológica de generación de
conocimiento científi co Actor-Red. En ella confl uyen distintas disciplinas: creación
de nuevo conocimiento a partir de los documentos de las bases de datos
(knowledge discovery in databases, KDD), ingeniería del conocimiento y visua-
lización de la información. En la actualidad la evaluación de redes de conoci-
miento se benefi cia de la existencia de sistemas informáticos desarrollados para
transformar la información en conocimiento (Polanco, 2008), procesando de una
manera rápida y controlada ingentes conjuntos documentales y creando nuevo
conocimiento a partir de ellos. Los sistemas de conocimiento son de gran utilidad
para los equipos de inteligencia competitiva y de vigilancia tecnológica de las
organizaciones ya que proporcionan informes, diagramas, gráfi cos y mapas muy
apreciados en la toma de decisiones estratégicas. Este modus operandi, ya habi-
tual en las grandes organizaciones empresariales, es apenas empleado en la ac-
tualidad en el campo de actividad de la vigilancia estratégica científi ca y tecno-
lógica (VECT) de los órganos administrativos encargados de evaluar y diseñar las
políticas científi cas.
La Teoría Actor-Red, teoría sociológica sobre la Ciencia y la Tecnología en su
concepción más ortodoxa describe la producción de conocimiento científi co como
resultado de las relaciones que se establecen entre los actores humanos (cientí-
fi cos, tecnólogos, gestores, etc.) y no humanos (centros de investigación, revistas,
descriptores, patentes, etc.) (Callon y otros, 1986) (Callon, 1989) (Courtial, 1999).
Bruno Latour, uno de los principales impulsores de esta teoría, la defi ne como
Sociología de las Relaciones (Latour, 2005). Así cualquier red de la Tecnociencia
(Latour, 1983) está formada por un conjunto de actores y un conjunto de relacio-
nes establecidas entre ellos en un período temporal concreto. Con el tiempo los
actores y las relaciones cambian y dan lugar a nuevas redes y así se suceden
302 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
unos a otros a lo largo del período de análisis. Esta teoría también llamada So-
ciología de la Traducción (entendida traducción como conversión, transformación,
variación o cambio), estudia los cambios que se producen en las redes de cono-
cimiento tecnocientífi co. Estos cambios en las relaciones entre los actores tienen
como consecuencia la aparición, el fortalecimiento, el equilibrio, el debilitamiento
y la desaparición de actores en las redes (Ruíz-Baños, 1999). En el presente traba-
jo se emplea el concepto de «red tecnocientífi ca» tal como fue planteado por La-
tour en 1983, es decir, como la forma abreviada de «red de ciencia y tecnología».
La Teoría Actor-Red es útil para describir las complejas relaciones que se es-
tablecen en las redes de la Ciencia y la Tecnología, así como las de la Tecnocien-
cia (Echevarría y González, 2009), entendida ésta como una modalidad de la acti-
vidad científi ca y tecnológica fruto de la hibridación entre Ciencia y Tecnología.
El Análisis de Palabras Asociadas (Michelet, 1988) (Courtial y Michelet, 1990)
es una metodología que permite estudiar las redes tecnocíentífi cas en base a las
relaciones de coocurrencia producidas entre las palabras en los documentos, las
cuales pueden ser nombres de investigadores, palabras clave, títulos de revistas
científi cas y/o centros de investigación (actores humanos y no humanos de la
Teoría Actor-Red).
La Teoría de Grafos permite realizar una aproximación geométrica y visual a
las redes tecnocientífi cas, de manera que en el grafo de la red los actores pasan
a ser los nodos y las relaciones entre los actores los enlaces entre los nodos.
Para el trazado de grafos se han desarrollado diferentes algoritmos; entre ellos
se encuentran los llamados algoritmos dirigidos por fuerzas, que tratan de mo-
delizar el grafo como un sistema físico y buscan el equilibrio del mismo (Aiello
y Silveira, 2004). En este sistema físico los nodos se posicionan como resultado
del conjunto de fuerzas de atracción-repulsión existentes entre ellos (los nodos
relacionados se atraen, los no conectados se repelen).
Los sistemas de conocimiento son sistemas informáticos ideados para estudiar
y representar el conocimiento que los investigadores producen y difunden a tra-
vés de sus documentos con el objetivo de crear nuevo conocimiento útil para
la toma de decisiones, la defi nición de estrategias y la evaluación del estado de la
ciencia y la tecnología a un momento dado (Polanco, 1997). Siguen el proceso
KDD en sus diferentes fases y tienen su origen en los softwares cienciométricos
desarrollados para facilitar el análisis de grandes conjuntos documentales (Larrei-
na y otros, 2006). Copalred® (Bailón-Moreno, 2003) es un sistema de conoci-
miento basado en el análisis de palabras asociadas, que tiene su antecedente en
Leximappe®, software desarrollado por Whittaker, Law, Courtial y Bauin (Law y
otros, 1988) (Law y Whittaker, 1992). Leximappe® se ha mostrado útil en el aná-
lisis estratégico de las redes de conocimiento científi co y técnico (Callon y otros,
1991) (Ruíz-Baños, 1996). Leximappe® y Copalred® han sido empleados en el
estudio de grandes conjuntos documentales de diferentes disciplinas académi-
cas: Arqueología (Ruíz-Baños, 1997), Ingeniería Química (Jurado-Alameda y otros,
2002a) (Jurado-Alameda y otros, 2002b) (Bailón-Moreno y otros, 2006) o Fisiote-
rapia (García-Ríos, 2009).
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
303

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
La visualización de información textual mediante mapas cartográfi cos realiza-
dos con Sistemas de Información Geográfi ca (SIG), softwares desarrollados para
representar información espacial, es propuesta por Old (2001). Pino-Díaz y otros
(2009) realizan mapas cartográfi cos de dos y tres dimensiones de redes tecno-
científi cas a partir de las coordenadas de los nodos de los grafos de las redes.
Ambas técnicas utilizan la metáfora visual del paisaje para visualizar datos no
espaciales.
El objetivo de este trabajo es realizar el análisis estratégico y dinámico de la
Red Española de Investigación sobre Áreas Protegidas, según la Web of Science,
en el período 1981-2005, mediante el empleo del sistema de conocimiento Co-
palred®, el software de análisis de redes Pajek® y el SIG ArcView®. Fruto del
análisis se van a obtener el diagrama estratégico, los listados de investigadores y
de revistas estratégicas y los grafos y mapas de conocimiento estratégico de la
red tecnocientífi ca. Los resultados obtenidos van a constituir elementos de apoyo
de gran valor e interés para la evaluación científi ca y tecnológica de la red estu-
diada y para la toma de decisiones estratégicas en el ámbito de la Gestión y
Administración de los Espacios Naturales Protegidos (Parques Nacionales, Parques
Naturales, Reservas Naturales, etc.) en España.
2. Metodología
Se ha elegido como base de datos fuente la Web of Science de Thomson
Reuters. Se han seleccionado los artículos sobre Áreas Protegidas (búsqueda en
los campos de títle, abstract, author-keyword y keyword Plus de los términos:
natural reserve o natural preserve o national park o natural park o protected area
o protected natural area,
tanto singulares como plurales), del período 1981-2005,
provenientes de España, en SCI expanded, SSCI y Arts and Humanities.
El conjunto documental se ha procesado con el sistema de conocimiento Co-
palred® (Bailón-Moreno, 2003). Este sistema de conocimiento permite realizar el
control de autoridades como fase previa a la creación de los vocabularios maes-
tros; se ha realizado el control de las palabras clave, los autores y los títulos de
revistas.
Se ha realizado el análisis estratégico de todo el conjunto documental para
el período 1981-2005. Para realizar el análisis dinámico se ha dividido el período
general de 25 años en cinco periodos de cinco años cada uno; se han obtenido
las subredes de cada período y las traducciones o cambios producidos a lo largo
de los cinco periodos entre las subredes y entre los términos de dichas subredes.
Se ha preparado para cada registro un nuevo campo formado por las pala-
bras clave, los autores y la revista (al que se ha denominado campo PCAR), y se
han estudiado las ocurrencias y coocurrencias de los distintos términos en dicho
campo.
Se han fi jado en el sistema de conocimiento los umbrales de cálculo siguientes:
número mínimo de ocurrencias de cada término igual a cinco (cmin = 5) y nú-
i
304 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
mero mínimo de coocurrencias entre pares de términos igual a tres (cmin = 3).
ij
El índice de equivalencia o índice de asociación entre términos se ha calculado
de acuerdo a la expresión matemática (e = c2 /c × c ).
ij
ij
i
j
Se han obtenido tres listados de valores alfanuméricos: el listado de nodos
cuya ocurrencia es igual o mayor a cinco (c ), el listado de pares de nodos cuya
i
coocurrencia es igual o mayor a tres (c ) y el listado de índices de equivalencia
ij
o índices de asociación entre los pares de términos (e ).
ij
Para citar a la Red de Investigación sobre Áreas Protegidas según la Web of
Science se ha empleado la expresión abreviada Red WOS PCAR 53210 (1981-
2005), que incluye la procedencia de las bases de datos fuente (WOS), seguida
del nombre del campo de análisis (PCAR), seguido del número que indica el
análisis realizado en el sistema de conocimiento (53210, que indica que la míni-
ma ocurrencia de los términos elegida es 5, que la mínima coocurrencia entre
pares de términos elegida es 3, y que el tamaño elegido para las subredes pue-
de variar entre un mínimo de 2 y un máximo de 10 términos o nodos) y por
último el período de estudio (1981-2005).
Se puede considerar el grafo de una red tecnocientífi ca como un sistema fí-
sico que puede ser modelizado mediante el algoritmo de Kamada y Kawai (1989)
para que adopte una posición de mínima energía. A consecuencia de ello, y una
vez asignados a los enlaces los valores de sus índices de equivalencia o índices
de asociación, los términos o nodos unidos por los enlaces de mayor valor apa-
recen próximos, constituyendo agrupaciones o subredes que pueden ser identi-
fi cadas en el grafo de la red. Igualmente, las subredes entre sí también se posi-
cionan en la red formando agrupaciones, a las que se les ha denominado «áreas
de investigación».
Los listados obtenidos se han analizado y visualizado con el software de aná-
lisis de redes Pajek® (Batagelj y Mrvar, sf), tomando como algoritmo de visuali-
zación Kamada-Kawai y como opciones de dibujo del grafo, «los valores de las
líneas son similitudes» y «líneas de diferente ancho» (el valor de cada enlace o
línea se corresponde con su índice de equivalencia).
Se ha dibujado el grafo de la red y se han separado componentes; a conti-
nuación se han realizado sucesivas eliminaciones de los enlaces débiles en orden
creciente de su índice de equivalencia hasta obtener grupos o subredes con un
número de nodos igual o inferior a 10; así ha resultado que el valor mínimo de
los enlaces que han permanecido sin eliminar ha quedado fi jado en 1819 (el
índice de equivalencia adquiere valores entre 0, ausencia de relación, y 10.000,
relación plena). Por último, las áreas estratégicas de investigación se han obteni-
do gráfi camente agrupando las subredes conectadas por algún enlace (indepen-
dientemente del valor de éste).
Con este método gráfi co de visualización de las subredes se obtienen resul-
tados similares a los que se obtendrían en un sistema de conocimiento median-
te el empleo del algoritmo de clasifi cación por enlace simple.
A partir de las coordenadas de los nodos en el grafo del componente prin-
cipal se ha calculado su isobaricentro, al que se le ha denominado Centroide de
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
305

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
la Red. Se ha obtenido la centralidad de cada nodo, también denominada cen-
tralidad nodal, de la diferencia entre la unidad y la distancia euclídea del nodo
al Centroide (a mayor distancia euclídea del centroide, menor centralidad nodal).
Para realizar el Diagrama Estratégico de la red se han obtenido previamente
los valores de la centralidad y densidad medias normalizadas de las subredes. La
centralidad media normalizada de una subred se ha calculado como media de
los valores de centralidad de los términos o nodos que la componen (normali-
zados respecto al valor más elevado de centralidad nodal del conjunto de nodos
de la red). La densidad media normalizada de la subred se ha calculado como
la media de los valores de sus enlaces (normalizada respecto al valor más ele-
vado de densidad de subred del conjunto de subredes de la red).
Los mapas cartográfi cos se han realizado mediante el SIG ArcView® 3.2. Como
coordenadas (x, y) de los términos en los mapas se han tomado las coordenadas
(x, y) de los términos o nodos en el componente principal del grafo y como
coordenada (z) se han tomado los valores de la importancia absoluta de los tér-
minos de la red. Se ha defi nido el concepto de «importancia absoluta de un tér-
mino en la red tecnocientífi ca» como la suma de sus valores de centralidad nodal
normalizado y de densidad media normalizada de la subred a la que pertenece.
En estos mapas cartográfi cos se visualiza en planimetría la proximidad entre
los términos y la proximidad al Centroide (centralidad nodal). La mayor o menor
proximidad de los términos, de las subredes o de las áreas de investigación al
Centroide de la red indica su mayor o menor grado de relación con la temática
general del estudio (la investigación sobre áreas protegidas en España). En alti-
metría, la altitud de cada término indica su importancia absoluta en el conjunto
de la red. El SIG permite, además, obtener imágenes de la red en tres dimensio-
nes, lo cual facilita la interpretación de los mapas.
Se ha defi nido el concepto de «importancia estratégica de un término en la
red tecnocientífi ca» como la característica que toma el término por su pertenencia
a una subred tipifi cada estratégicamente de un modo u otro según haya sido
clasifi cada en uno de los cuatro cuadrantes del diagrama estratégico de la red.
Se ha denominado Mapa de Importancia Estratégica de la Red Tecnocientífi -
ca (Mapa I-VECT) el mapa cartográfi co al que se ha trasladado la información
del Diagrama Estratégico de la Red. En el mapa se indica mediante símbolos de
diferente forma y color si los términos pertenecen a subredes de investigación
del primer (subredes motor de investigación), segundo (subredes puente o cate-
gorizaciones), tercer (subredes especializadas o metodologías) o cuarto cuadran-
te (subredes nacientes o en destrucción).
3. Resultados
El conjunto documental de artículos sobre áreas protegidas de la Web of
Science publicados entre 1981 y 2005 y procedentes de España se compone de
560 registros en los que aparecen 1961 palabras clave, 1316 investigadores y 249
306 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
revistas. Las Revistas con un número de ocurrencias igual o mayor a cinco (nú-
mero mínimo de ocurrencias fi jado para realizar el análisis con el sistema de co-
nocimiento Copalred®) se pueden observar en la tabla I. Los Autores de la base
de datos documental con cinco o más ocurrencias se muestran en la tabla II.
TABLA I
Ranking de revistas de la base de conocimiento española sobre Áreas
Protegidas de la Web of Science (1981-2005) (número de ocurrencias igual
o mayor a cinco)
Rango
Ocu
Revista
Rango
Ocu
Revista
1
38
Biological Conservation
13
6
Journal of Applied Ecology
2
17
Hydrobiologia
14
6
Environmental Pollution
Science of the Total Envi-
3
13
15
6
Conservation Biology
ronment
Biodiversity and Conser-
Bulletin of Environmental
4
12
16
6
vation
Contamination
5
11
Journal of Zoology
17
5
Marine Biology
6
7
Wetlands
18
5
Mammalia
Marine Ecology-Progress
International Journal of En-
7
7
19
5
Series
vironmental Analytical
8
7
Landscape Ecology
20
5
Ibis
Journal of Vegetation Scien-
Forest Ecology and Mana-
9
7
21
5
ce
gement
Journal of Arid Environ-
10
7
22
5
Environmental Geology
ments
11
6
Journal of Wildlife Diseases
23
5
Cryptogamie Mycologie
Journal of Environmental
12
6
24
5
Acta Theriologica
Management
Red de Investigación WOS PCAR 53210 (1981-2005)
La Red WOS PCAR 53210 (1981-2005) está formada por 235 nodos o términos,
cada uno con un número de ocurrencias igual o superior a cinco y por 573 en-
laces entre los nodos (cada enlace con un valor de coocurrencia igual o mayor
a tres). La red está formada por dos Componentes (no conexos entre sí), un
Componente Principal (formado por 229 nodos) y uno Secundario (formado por
seis nodos), al que se le ha denominado «Capa, M.».
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
307

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
TABLA II
Ranking de autores de la base de conocimiento española sobre Áreas
Protegidas de la Web of Science (1981-2005) (número de ocurrencias igual
o mayor a cinco)
Rango
Ocu
Autor
Rango
Ocu
Autor
1
32
Delibes, M.
28
6
López, E.
2
22
Palomares, F.
29
6
Gómez-Ariza, J. L.
3
17
González, M. J.
30
6
Green, A. J.
4
16
Ferrer, M.
31
6
García-Rubies, A.
5
14
Hernández, L. M.
32
6
Fernández, N.
6
11
Serrano, L.
33
6
Fedriani, J. M.
7
10
Revilla, E.
34
6
Clemente, L. E.
8
10
Hiraldo, F.
35
6
Capa, M.
9
10
Ferreras, P.
36
6
Braza, F.
10
9
Toja, J.
37
6
Beltran, J. F.
11
9
Pérez, J. M.
38
6
Baos, R.
12
9
Novo, F. G.
39
6
Angeler, D. G.
13
9
Moreno, S.
40
5
Travaini, A.
14
9
Fernández, M. A.
41
5
Rojo, C.
15
9
Alvarez-Cobelas, M.
42
5
Rodrigo, M. A.
16
8
Zabala, M.
43
5
Querol, X.
17
8
Villafuerte, R.
44
5
Muñoz-Reinoso, J. C.
18
8
Sala, E.
45
5
Moreno, G.
19
8
Granados, J. E.
46
5
Montoro, R.
20
8
Barradas, M. C. D.
47
5
LLoret, F.
21
7
Zunzunegui, M.
48
5
Del Valls, T. A.
22
7
Sánchez-Carrillo, S.
49
5
Bermejo, M.
23
7
San Martín, G.
50
5
Baluja, G.
24
6
Soriguer, R. C.
51
5
Balbontin, J.
25
6
Ruíz-Martínez, I.
52
5
Aldama, J. J.
26
6
Rico, M. C.
53
5
Aguado, M. T.
27
6
Montes, C.
308 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804


Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
Subredes Estratégicas de Investigación
Se han obtenido veintidos subredes estratégicas de la Red WOS PCAR (vein-
tiuna subredes del Componente Principal y una subred del Componente Secun-
dario).
El Diagrama Estratégico obtenido es el que se representa en la fi gura 1. La
posición de las subredes en cada cuadrante es la siguiente:
FIGURA 1
Diagrama Estratégico de la Red WOS_PCAR_53210 (1981-2005)
(véase nota 2)
Subredes (en negrita) del cuadrante n.º 1 y términos o nodos (incluídos entre
paréntesis) que las forman. Se trata de las subredes próximas al objeto de estudio
y con nodos muy bien relacionados internamente, también denominadas subre-
des motor de investigación; subredes centrales y muy densas.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
309

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
Hemorrhagic disease («Villafuerte, R.», «Moreno, S.», Oryctolagus cuniculus
y hemorragic disease).
«Delibes, M.» («Delibes, M.», Linx pardinus, «Revilla, E.», «Palomares, F.», «Fe-
rreras, J. M.», «Fedriani, J. M.», «Aldama, J. J.» y «Beltrán, J. F.»).
• «Zunzunegui, M.» («Zunzunegui, M.», «Barradas, M. C. D.», shrubs y «Novo,
F. G.»).
• «Baos, R.» («Hiraldo, F.», «Baos, R.», «Montoro, R.» y arsenic).
• Zinc (cadmio, Pb, zinc, copper y soils).
• «Hernández, L. M.», («Baluja, G.», «Rico, M. C.», «Hernández, L. M.», «Gon-
zález, M. J.», «Fernández, M. A.» y Bulletin of Environmental Contamination
and Toxicology-R).
• «Sánchez Carrillo, S.» («Angeler, D. G.», «Sánchez Carrillo, S.», «Alvarez Co-
belas, M.», «Rodrigo, M. A.», «Rojo, C.» y Phytoplankton).
Subredes del cuadrante n.º 2 y nodos que las forman. Son las subredes próxi-
mas al objeto de estudio pero con nodos relacionados débilmente; subredes
centrales pero poco densas.
• Environmental pollution (revista) (contamination, Environmental Pollu-
tion-R).
• «Del Valls, T. A.» (Guadalquivir Estuary, Aznalcóllar mine toxic spill, pollu-
tion, Guadiamar River, SW-Spain, «Del Valls, T. A.», heavy metals, Science of
the Total Environment-R y Doñana National Park).
• «Balbontín, J.» («Balbontín, J.», Aquila adalberti, age y «Ferrer, M.»).
• «Gómez Ariza, J. L.» («Gómez Ariza, J. L.» y sequential extraccion).
• Mediterranean Sea (Mediterranean Sea y marine protected areas).
• Wetlands (revista) (Lakes y Wetlands-R).
Subredes del cuadrante n.º 3 y nodos que las forman. Son las subredes ale-
jadas del objeto de estudio pero con relaciones intensas entre los términos que
las forman; son subredes periféricas pero muy densas.
• «Bermejo, M.» («Bermejo, M.» y Gorilla gorilla)
• «Soriguer, R.C.» («Soriguer, R.C.», «Granados J.E.», y «Pérez, J.M.», «Ruíz Mar-
tínez, I.» y Sierra Nevada National Park) y
• «Capa, M.» («Capa, M.», «López, E.», «Sanmartín, G.», Shyllidae, Polychaeta y
Panamá)
Subredes del cuadrante n.º 4 y nodos que las forman. Subredes alejadas del
objeto del estudio y con relaciones débiles entre sus términos; son subredes pe-
riféricas y poco densas.
• «Lloret, F.» (fi re, «Lloret, F.» y Yellowstone National Park).
• «Braza, F.» («Braza, F.» y Cervus elaphus).
310
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804


Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
• Species richness (diversity y species richnees).
• «García Rubies, A.» («García Rubies, A.», marine reserves y assemblages).
• «Sala, E.» (coral reefs, «Zabala, M.», «Sala, E.», Marine Biology-R y populations
structure).
• «Moreno, G.», («Moreno, G.» y Cryptogamie Mycologie-R).
Áreas Estratégicas de Investigación
El Componente Principal de la Red WOS PCAR (1981-2005) consta de nueve
áreas estratégicas de investigación (véase fi gura 2, en ésta fi gura sólo aparecen
las áreas estratégicas del Componente Principal):
FIGURA 2
Áreas estratégicas de investigación del Componente Principal
de la Red WOS_PCAR_53210 (1981-2005) (véase nota 3)
1. Parque Nacional de Doñana.
2. «Álvarez Cobelas, M.».
3. «Sala, E.».
4. «Soriguer, R.C».
5. Mar Mediterráneo.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
311

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
6. «Moreno, G.».
7. «Bermejo, M.».
8. «Lloret, F.».
9. «Braza, F.».
1. Área de Investigación «Parque Nacional de Doñana». Esta área estratégica
de investigación tiene 10 subredes: Hemorrhagic disease, « Delibes, M.»,
«Zunzunegui, M.», «Baos, R.», Zinc, «Hernández, L. M.», « Environmental
Pollution-R», «Del Valls, T. A.», «Balbontín, J.»
y «Gómez Ariza, J. L.»:
• Elementos singulares de investigación (agrupados y diferenciados por
subred de pertenencia):
— Linx pardinus.
— Aquila adalberti y age.
— Orictolagus cuniculus y hemorrhagic disease.
— Shrubs.
— SW-Spain, Doñana National Park, heavy metals, pollution, Aznalco-
llar mine toxic spill, Guadalquivir Estuary y Guadiamar River.
— Contamination.
— Copper, zinc, cadmio, Pb y soils.
— Sequential extraction.
— Arsenic.
• Investigadores (agrupados y diferenciados por subred de pertenencia):
— «Delibes, M.», «Ferreras, P.», «Aldama, J. J.», «Beltrán, J. F.», « Fedriani, J. M.»,
«Palomares, F.» y «Revilla, E.».
— «Ferrer, M.» y «Balbotín, J.».
— «Villafuerte, R.» y «Moreno, S.».
— «Zunzunegui, J. M.», «Barradas, M. N.» y «Novo, F. G.».
— «Del Valls, T. A.».
— «Rico, M. C.», «Baluja, G.», «Hernández, L. M.», «Fernández, M. A.» y
«González, M. J.».
— «Gómez Ariza, J. L.».
— «Baos, R.», «Montoro, R.» y «Hiraldo, F.».
• Centros de Investigación (obtenidos de los artículos que corresponden
a la área):
— Consejo Superior de Investigaciones Científi cas (CSIC), Estación
Biológica de Doñana
— Universidad de Cádiz, Facultad de Ciencias del Mar, Departamento
de Química Física.
— Universidad de Sevilla, Facultad de Biología, Departamento de Bio-
logía Vegetal y Ecología.
312
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
— CSIC, Instituto de Química Orgánica, Departamento de Contamina-
ción Ambiental.
— Universidad de Huelva, Facultad de Ciencias Experimentales.
• Revistas en las subredes:
— Bulletin of Environmental Contamination and Toxicology.
— Environmental Pollution.
— Science of the Total Environment.
2. Área de Investigación «Álvarez Cobelas M.». Esta área está formada por
dos subredes «Sánchez Carrillo, S.» y «Wetlands (revista)»:
• Elementos singulares de investigación (diferenciados por subred de
pertenencia):
— Phytoplankton.
— Lakes.
• Investigadores:
— «Rojo, C.», «Rodrigo, M. A.», «Álvarez Cobelas, M.», «Sánchez Carrillo,
S.» y «Angeler, D. G.».
• Centros de Investigación:
— CSIC, Centro de Ciencias Medioambientales.
— Universidad de Valencia, Instituto Cavanilles de Biodiversidad y
Biología Evolutiva.
• Revista de la Área:
— Wetlands-R.
3. Área Estratégica de Investigación «Sala, E.». Esta área está formada por
tres subredes «Sala, E.», «García Rubies, A.» y Species richness:
• Elementos singulares de investigación (agrupados y diferenciados según
subred de pertenencia):
— Marine reserves y assemblages.
— Population structure y coral reefs.
— Diversity y species richness.
• Investigadores (diferenciados según subred de pertenencia):
— «García Rubies, A.».
— «Sala, E.» y «Zabala, M.».
• Revista de la Área:
— Marine Biology.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
313

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
• Centros de Investigación:
— CSIC, Centro de Estudios Avanzados de Blanes.
— Universidad de Barcelona, Facultad de Biología, Departamento de
Ecología.
— Universidad de las Islas Baleares, Laboratorio de Biología Marina.
4. Área de Investigación «Soriguer, R. C.»:
• Elemento singular de investigación:
— Sierra Nevada National Park.
• Investigadores:
— «Ruíz Martínez, I.», «Soriguer, R. C.», «Pérez, J. M.» y «Granados, J. E.».
• Centros de Investigación:
— CSIC, Estación Biológica de Doñana.
— Universidad de Jaén, Facultad de Ciencias Experimentales, Depar-
tamento Animales y Plantas, Biología y Ecología.
— Empresa de Gestión Medioambiental (Consejería de Medio Ambien-
te, Junta de Andalucía).
5. Área de Investigación «Mar Mediterráneo»:
• Elementos singulares de investigación:
— Mediterranean Sea y marine protected areas.
• Centros de Investigación:
— CSIC, Centro de Estudios Avanzados de Blanes.
— Universidad de Alicante, Departamento de Ciencias Ambientales y
Recursos Naturales, Unidad de Biología Marina.
— Universidad de Las Palmas, Facultad de Ciencias del Mar, Departa-
mento de Biología.
— Instituto Español de Oceanografía.
— CSIC, Instituto de Ciencias del Mar.
— Universidad de Barcelona, Departamento de Ecología.
6. Área de Investigación «Moreno, G.»:
• Investigador:
— «Moreno, G.».
• Centro de Investigación:
— Universidad de Alcalá de Henares, Departamento de Biología Vegetal.
314
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
• Revista:
— Crytogamie Mycologie.
7. Área de Investigación «Bermejo, M.»:
• Elemento singular de investigación:
— Gorilla gorilla.
• Investigadora:
— «Bermejo, M.»
• Centro de Investigación:
— Universidad de Barcelona, Facultad de Biología, Departamento de
Biología Animal, Vertebrados.
8. Área de Investigación «Lloret, F.»:
• Elemento singular de investigación:
— Fire y Yellowstone National Park.
• Investigador:
— «LLoret, F.».
• Centro de Investigación:
— Universidad Autónoma de Barcelona, Centro de Investigaciones
Ecológicas y de Aplicaciones Forestales.
9. Área de Investigación «Braza, F.»:
• Elemento singular de investigación:
— Cervus elaphus.
• Investigador:
— «Braza, F.».
• Centro de Investigación:
— CSIC, Estación Biológica de Doñana.
La subred «Capa, M.», única subred del Componente Secundario de la red,
constituye en sí otra área estratégica de investigación, denominada igualmente
«Capa, M.» (esta área no aparece en la fi gura 2, grafo de las áreas estratégicas de
investigación del Componente Principal):
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
315

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
Área Estratégica de Investigación, «Capa, M.»:
• Elementos singulares de investigación:
— Syllidae, Polychaeta y Panama.
• Investigadores:
— «Capa, M.», «San Martín, G.» y «López, E.».
• Centro de Investigación:
— Universidad Autónoma de Madrid, Departamento de Biología y Zoología,
Laboratorio de Biología Marina e Invertebrados.
La Área Estratégica de Investigación «Parque Nacional de Doñana» constituye
el núcleo central de la Red Tecnocientífi ca Española de Investigación sobre Áreas
Protegidas según la Web of Science. Es una área estratégica de investigación ac-
tiva en los tres últimos periodos de estudio (1991-2005), formada por nueve sub-
redes estratégicas que se sitúan en torno al Centroide de la red; cuatro encua-
drables en el campo de las Ciencias de la Vida (Hemorrhagic disease, «Delibes,
M.», «Zunzunegui, M.», «Baos, R.» y «Balbontín, J.»)
y cinco sobre contamina-
ción ambiental (Zinc, «Hernández, L. M.», «Environmental Pollution-R», «Del
Valls, T. A.»
y «Gómez Ariza, J. L.»). La importancia de esta área se justifi ca en
las investigaciones desarrolladas en el Parque Nacional de Doñana por investi-
gadores de la Estación Biológica de Doñana, de las Universidades periféricas al
área protegida [Universidad de Sevilla (Facultad de Biología, Departamento de
Biología Vegetal y Ecología), Universidad de Cádiz (Facultad de Ciencias del Mar,
Departamento de Química Física) y Universidad de Huelva (Facultad de Ciencias
Experimentales)] y del Departamento de Contaminación Ambiental del Instituto
de Química Orgánica (CSIC).
A la anterior le sigue en importancia la área estratégica «Álvarez Cobelas, M.»,
área activa en el último decenio de estudio (1996-2005), formada por dos subre-
des centrales (una densa y otra menos densa), dedicada al estudio de las zonas
húmedas (lakes y phitoplankton) y constituída por investigadores del Centro de
Ciencias Medioambientales del CSIC y del Instituto Cavanilles de Biodiversidad
y Biología Evolutiva de la Universidad de Valencia, que han publicado preferen-
temente en la revista Wetlands.
Como tercera área relevante aparece «Sala, E.», área formada por tres subredes
poco centrales y poco densas, con actividad investigadora sobre las reservas ma-
rinas y las poblaciones de peces asociadas a sus fondos. Está formada por inves-
tigadores del Centro de Estudios Avanzados de Blanes del CSIC, del Departamen-
to de Ecología de la Facultad de Biología de la Universidad de Barcelona y del
Laboratorio de Biología Marina de la Universidad de las Islas Baleares, que pu-
blican en la revista Marine Biology.
El resto de áreas estratégicas de investigación están constituídas por una sola
subred. «Mediterranean Sea» es una subred generalista (subred central y poco
316
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
densa) dedicada al estudio de las zonas marinas protegidas en el Mar medite-
rráneo. «Soriguer, R. C.» es una subred adyacente (periférica y densa) dedicada
al estudio de la especie «Capra pirenaica hispanica» en el Parque Nacional de
Sierra Nevada. «Bermejo, M» es una subred adyacente dedicada al estudio de la
especie «Gorilla gorilla». «Capa, M» es una subred adyacente dedicada al estudio
de la familia Syllidae de la clase Polichaeta en el Parque Nacional de Coiba (Pa-
namá). «Moreno, G.» es una subred no consolidada plenamente (periférica y poco
densa) dedicada a estudios criptogámicos y con publicación preferente en la
revista Cryptogamie Mycologie. «Lloret, F.» es una subred naciente (periférica y
poco densa) dedicada al estudio de los incendios forestales. «Braza, F.» es una
subred en desaparición (periférica y poco densa) dedicada al estudio del Cervus
elaphus.
Mapa de Conocimiento Estratégico de la Red Tecnocientífi ca (Mapa CERT)
El nuevo conocimiento obtenido del análisis estratégico de la red WOS PCAR
(1981-2005) se ha trasladado a un conjunto de mapas cartográfi cos que se pue-
den visualizar en dos o tres dimensiones. En la fi gura 3 se puede observar una
imagen 3D, con el centroide, y la leyenda del Mapa CERT realizado a partir de
los términos del Componente Principal de la red.
Análisis Dinámico de las Subredes de Investigación
Además del análisis estratégico de la red, realizado para el período total de
25 años, se ha realizado el análisis dinámico de la red durante cinco periodos
de cinco años (1.º período, 1981-1985; 2.º período, 1986-1990; 3.º período, 1991-
1995; 4.º período, 1996-2000; y 5.º período, 2001-2005). De dicho análisis diná-
mico se deduce que la Red Española de Investigación sobre Áreas Protegidas es
una red joven, de formación tardía, con subredes estratégicas de investigación
en sólo los tres últimos periodos de estudio.
Se observa que la Red WOS PCAR 53210 (1981-2005) posee dos subredes en
el período 1991-1995, trece en el período 1996-2000 y nueve en el período 2001-
2005. No se detecta una continuidad en el tiempo de las diferentes subredes, tan
solo la traducción «Populations» «Conservation» desde el 1991 hasta el 2000
(3.º y 4.º periodos); y las tres traducciones siguientes: «Delibes,M.» «Paloma-
res, F.»; «Patterns»
«Diversity» y «Succession» «Succession», desde el 1996
hasta el 2005 (4.º y 5.º periodos).
«Delibes, M.» es un término que forma parte de subredes estratégicas en los
tres últimos periodos. Aparece en el período 1991-1995 asociado al término «Do-
ñana National Park» de la subred «Doñana National Park»; da nombre a una
subred completa de diez nodos en el período 1996-2000 (subred «Delibes, M.»)
y en el período 2001-2005, junto con los términos «Palomares, F.» y «Lynx pardi-
nus», forma parte de la subred «Palomares, F.», que le acompañan provenientes
de la subred «Delibes, M.» del período anterior.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
317


JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
FIGURA 3
Imagen 3D dle Mapa CERT de Investigadores de la red WOS_PCAR_53210
(1981-2005)
Fuente: Elaboración propia.
«Populations» es un término que aparece en subredes de los tres últimos pe-
riodos. Aparece en el período 1991-1995 formando parte de la subred «Popula-
tions»,
constituída por los términos «Populations» y «SW Spain»; continúa en el
período 1996-2000 formando parte de la subred «Conservation», de ocho térmi-
nos, y sigue en el período 2001-2005 formando parte de la subred de diez tér-
minos «Doñana National Park» (junto con los términos «Oryctolagus cuniculus»
y «Conservation» que le acompañan de la subred «Conservation» del período
anterior).
«Doñana National Park», es un término que aparece en subredes de los tres
últimos periodos. Se inicia en el período 1991-1995 constituyendo una subred
junto al término «Delibes, M.»; continúa en el período 1996-2000 formando parte
de la subred de diez nodos «Doñana National Park» y permanece en el perío-
do 2001-2005 dando nombre a una nueva subred de diez nodos de igual nombre,
«Doñana National Park»; el término «Oryctolagus cuniculus» le acompaña en el
cambio 1996-2000 a 2001-2005.
318
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
«Aznalcóllar mine toxic spill» es un término que forma parte de la subred
«Heavy metals» del período 1996-2000 y de la subred «Doñaña National Park»
del período 2001-2005. En los dos periodos le acompaña el término «Heavy metals».
Análisis de actividad de las Subredes Estratégicas de Investigación
Para visualizar la actividad de las diferentes subredes estratégicas a lo largo
de los cinco quinquenios en los que se ha dividido el período de estudio (1981-
2005), se ha consultado la fecha de publicación de cada uno de los documentos
pertenecientes a cada una de las diferentes subredes estratégicas y se ha realiza-
do una tabla en la que se han coloreado los periodos en los que se ha publica-
do (véase tabla III).
TABLA III
Periodos de actividad de las Subredes Estratégicas Españolas de Investigación
sobre Áreas Protegidas de la Red WOS_PCAR_53210 (1981-2005)
Subredes
Periodos de mayor actividad
Áreas de
de
Red
investiga-
PC, A y R
investiga-
1981
1986
1991
1996
2001
ción
ción
1985
1990
1995
2000
2005
Hemorr-
Oryctolagus-cuniculus;
hagic
Hemorrhagic-disease; Mo-
disease
reno, S. y Villafuerte, R.
Delibes,M.; Lynx-pardin-
us; Palomares, F.; Ferre-
Delibes,
ras, P.; Revilla, E.; Beltran,
M.
J. F.; Fedriani, J. M. y Al-
dama, J. J.
Shrubs; Novo, F. G.; Ba-
Parque
Zunzune-
Web
rradas, M. C. D. y Zunzu-
Nacional
gui, M.
of
negui, M.
de
Science
Doñana
Hiraldo, F.; Arsenic; Baos,
Baos, R.
R. y Montoro, R.
Soils, Cadmium, Pb, Zinc
Zinc
y Copper
Hernández, L. M.; Gonzá-
lez, M. J.; Fernández, M.
Hernán-
A.; Bulletin-of-Environ-
dez, L. M.
mental-Contamination-
and-Toxicology; Rico, M.
C. y Baluja, G.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
319

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
TABLA III (continuación)
Subredes
Periodos de mayor actividad
Áreas de
de
Red
investiga-
PC, A y R
investiga-
1981
1986
1991
1996
2001
ción
ción
1985
1990
1995
2000
2005
Heavy-metals; Aznalco-
llar-mine-toxic-spill; Po-
Del Valls, llution; Guadiamar-River;
T. A.
Guadalquivir-Estuary; Del
Valls, T. A.; Doñana-Na-
tional-Park y SW-Spain.
Parque
Nacional
Environ-
Contamination y Environ-
de
mental
mental-Pollution-R
Doñana
Pollution-
R
Balbontín, Ferrer, M.; Aquila-adal-
J.
berti; Age y Balbontin, J.
Gómez
Gómez-Ariza, J. L. y Se-
Ariza, J. L.
quential-extraction.
Álvarez-Cobelas, M.;
Phytoplankton; Sánchez-
Sánchez
Álvarez
Carrillo, S.; Angeler, D.
Carrillo, S.
G.; Rodrigo, M. A. y Rojo,
Web
Cobelas,
C.
of
M.
Science
Wetlands-
Wetlands-R y Lakes.
R
Mediterra-
Mediterra-
Mediterranean-Sea y Ma-
nean Sea
nean Sea
rine-protected-areas.
Pérez,J.M.; Granados, J.
Soriguer,
Soriguer,
E.; Ruíz-Martínez, I.; Sie-
R. C.
R. C.
rra-Nevada-National-Park
y Soriguer, R. C.
Bermejo,
Bermejo,
Bermejo,M. y Gorilla-go-
M.
M.
rilla.
Capa, M.; Lopez, E; San
Capa, M.
Capa, M.
Martin,G.; Panama; Poly-
chaeta y Syllidae.
Fire; Yellowstone-Natio-
Lloret, F.
Lloret, F.
nal-Park y LLoret, F.
Braza, F. y Cervus ela-
Braza, F.
Braza, F.
phus.
320 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
TABLA III (continuación)
Subredes
Periodos de mayor actividad
Áreas de
de
Red
investiga-
PC, A y R
investiga-
1981
1986
1991
1996
2001
ción
ción
1985
1990
1995
2000
2005
Species
Diversity y Species rich-
richness
ness.
Marine-reserves; Assem-
García Ru-
blages y García-Rubies,
bies, A.
Web
Sala, E.
A.
of
Sala, E.; Zabala, M.; Co-
Science
ral-reefs; Marine-Biolo-
Sala, E.
gy-R y Population-struc-
ture.
Moreno,
Moreno,
Cryptogamie-Mycologie-R
G.
G.
y Moreno, G.
Subredes motor de investigación (centrales y densas).
Subredes generalistas (centrales y no densas).
Subredes adyacentes (no centrales y densas).
Subredes no consolidadas, nacientes o en desaparición (no centrales y no densas).
Revistas Estratégicas
Las revistas que pertenecen a subredes estratégicas son las que aparecen en
la tabla IV. En la tabla fi guran tres columnas: rango de la revista según sus ocu-
rrencias, número de ocurrencias y título de la revista.
TABLA IV
Revistas de importancia estratégica en la investigación española
sobre Áreas Protegidas de la Red WOS PCAR 53210, 1981-2005
Rango
Ocu
Revista

3
13
Science of the Total Environment

6

7
Wetlands
14
6
Environmental Pollution
16
6
Bulletin of Environmental Contamination
17
5
Marine Biology
23
5
Cryptogamie Mycologie
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
321

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
Investigadores Estratégicos
Los Investigadores que forman parte de subredes estratégicas son los que se
detallan en la tabla V. En ellas fi guran el Centro, Departamento, Grupo y líneas
de investigación del investigador (datos obtenidos de la web a la fecha de rea-
lización del presente trabajo).
TABLA V
Investigadores de importancia estratégica en la investigación española de
visibilidad internacional sobre áreas protegidas de la Red WOS PCAR 53210
(1981-2005) (véase nota 5)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Determinación de las condicio-
nes óptimas para el crecimiento
y acumulación de carotenoides
de interés industrial por microal-
gas. Búsqueda de mutantes de
Producción de
María Cruz
microalgas superproductores de
Compuestos de
Díaz
carotenoides de interés. Estudio
Interés Industrial
Antúnez-
del ciclo de vida de haematococ-
por Micro algas y
Barradas
cus pluvialis y su relación con la
Plantas.
síntesis de astaxantina. Estudio
de la regulación de la síntesis de
luteína y astaxantina en Chlore-
Biología Ve-
Universidad
lla. Papel del ciclo de las xanto-
getal y Eco-
de Sevilla
fi las.
logía
Francisco
Ecología de los sistemas litorales.
García Novo
– Dinámica de nutrientes en eco-
Ecologia de
sistemas acuáticos. – Estructura
Aguas Continen-
de las comunidades acuáticas. –
tales y Ecosiste-
Estrategias morfofi siológicas de
mas Terrestres; tipos funcionales. – morfología y
María
Limnolo gia; Ges-
ecofi siología de especies dioicas.
Zunzunegui
tión de Recursos Dinámica de arroyos tempora-
González
Naturales
les. Restauración de ecosiste-
mas. Limnologia de lagunas y
embalses.
Biología de la conservación y
C o n s e r v a -
cambio global e invasiones bio-
Sacramento
ción de la EBD-CSIC
Grupo Moreno
lógicas, biología evolutiva y eco-
Moreno
Biodiversi-
logía molecular y genética evolu-
dad
tiva
322 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
TABLA V (continuación)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Factores que determinan la dis-
tribución y las tendencias de las
especies de fauna, principalmen-
te de caza menor. Selección
sexual y caracteres sexuales se-
cundarios en la perdiz roja. Eco-
logía, dinámica de población y
gestión de poblaciones de cone-
Rafael
IREC (CSIC-
Gestión de la jos silvestres y perdices rojas.
Villafuerte
Ecología
U C L M - J C -
fauna: caza y Mejora de técnicas de gestión ta-
Fernández
CM)
conservación.
les como las repoblaciones de
conejos con fi nalidades tanto de
caza como conservación. Interac-
ción entre agricultura, gestión de
la caza y conservación de la bio-
diversidad: estudio y resolución
de confl ictos tales como el gene-
rado por interacciones predador-
presa
Gonzalo
Desarrollo de metodologías ana-
Baluja
líticas innovadoras en química
ambiental. Estudio de comporta-
Mario
miento de contaminantes tóxicos
Antonio
y persistentes en el medio am-
Fernández
biente, incluído el hombre.
Martín
Análisis Ins-
María José
trumental y
Química Am-
González
IQOG-CSIC
Q u í m i c a
biental
Carlos
Ambiental
Luis M.
Hernández
(†)
María del
Carmen
Rico
Raquel Baos
Ecología evolutiva, ecología del
Sendarrubias
comportamiento, ecología espa-
Biología de
cial de poblaciones, interaccio-
Biología de la
la Conserva-
EBD-CSIC
nes, demografía y dinámica de
Fernando
Conservación
ción
poblaciones, patrones de extin-
Hiraldo
ción, genética de la conserva-
Cano
ción.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
323

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
TABLA V (continuación)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Desarrollo de metodologías ana-
líticas convencionales y rápidas
para el análisis de elementos tra-
za tóxicos y sus especies quími-
cas. Transformaciones cualitativas
C o n s e r v a -
y cuantitativas de contaminantes
Rosa
ción y Cali-
Contaminación metálicos durante la elaboración
Montoro
IATA-CSIC
dad de los
metálica
y el almacenamiento. Ingestas de
Martínez
Alimentos
elementos traza tóxicos mediante
estudios de Dieta Total. Biodispo-
nibilidad de arsénico, mercurio y
sus especies mediante métodos
de digestión in vitro y cultivos
celulares.
Tomás
Oceanografía y Contaminación Marina. Procesos
Química Fí-
Universidad
Ángel del
contaminación de Transferencia a través de las
sica
de Cádiz
Valls Casillas
del litoral
Interfases del Mar.
Química y
José Luis
Ciencia de Universidad
Gómez-Ari-
los Materia-
de Huelva
za
les
Parque Na-
J. J. Aldama Centro de El cional de
(†)
Acebuche
Doñana
Juan
Fisiología y Universidad Estudio de Ver-
Francisco
Zoología
de Sevilla
tebrados
Beltrán Gala
Miguel
Ecología evolutiva, ecología del
Delibes de
comportamiento, ecología espa-
Castro
cial de poblaciones, interaccio-
Biología de
nes, demografía y dinámica de
Francisco
Biología de la
la Conserva-
poblaciones, patrones de extin-
Palomares
Conservación
ción
ción, genética de la conservación.
Fernández
EBD-CSIC
Eloy Revilla
Sánchez
Jose María
Interacciones entre especies.
Fedriani
Laffi tte
324 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
TABLA V (continuación)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Factores que determinan la distri-
bución y las tendencias de las
especies de fauna, principalmen-
te de caza menor. Selección
sexual y caracteres sexuales se-
Pablo
IREC (CSIC-
Gestión de la cundarios en la perdiz roja, gía,
Ferreras de
Ecología
U C L M - J C -
fauna: caza y dinámica de población y gestión
Andrés
CM),
conservación
de poblaciones de conejos silves-
tres y perdices rojas. Mejora de
técnicas de gestión tales como las
repoblaciones de conejos con fi -
nalidades tanto de caza como
conservación.
José Enrique
Estudio, manejo y recuperación
Granados
Egmasa
de las poblaciones de interés ci-
Torres
negético en Andalucía. Estudios
de agentes patógenos en ungula-
dos y lagomorfos silvestres. Ge-
Jesús María
nética de poblaciones de especies
Universidad
Pérez
Biología Ani-
cinegéticas. Genética de pobla-
de Jaén
Jiménez
mal, Biolo-
Biología de las ciones de artrópodos parásitos.
gía Vegetal y
especies cinegé-
Biología y ecología de especies
Ecología
ticas y plagas
cinegéticas y plaga.
Isidoro Ruíz
Martínez (†)
Ramón
Casimiro-
EBD-CSIC
Soriguer
Escofet
Evaluación de los efectos induci-
dos por el hombre en el medio
Miguel
Ecología de
Biogeoquímica ambiente en los ciclos biogeoquí-
Álvarez
CCM-CSIC
sistemas
de Ecosistemas
micos y estructura y función de
Cobelas
los ecosistemas acuáticos y te-
rrestres.
Ecosistemas
David
y recursos ICAM-UCLM
Ecología acuática
Angeler
naturales
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
325

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
TABLA V (continuación)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Maria
Biodiversidad del plancton dulce-
Antonia
acuícula. Variación espacio-tem-
Rodrigo
poral de las comunidades planc-
Alacreu
tónicas: Series temporales largas
de plancton y heterogeneidad es-
pacial de las metacomunidades.
Variación de las comunidades
planctónicas como efecto de los
Instituto Ca-
cambios globales. Ensamblado de
vanilles de
las comunidades y efectos del or-
Biodiversi-
den de invasión sobre la estabili-
dad y Biolo-
Universitat Grupo Ecología dad de la comunidad. Desensam-
gía Evolutiva. de Valencia Integrativa
blado de las comunidades o
Departamen-
Carmen
efecto de la pérdida de especies.
to de Micro-
Rojo
Mecanismos de interacción entre
biología y
García-Mo-
especies en el marco de la diná-
Ecología
rato
mica de auto-organización del

sistema. Competencia, depreda-
ción, omnivoría y alelopatía en-
tres especies co-ocurrentes en los
sistemas acuáticos. Estudio de re-
des trófi cas (desde la dinámica de
su topología hasta el modelo de
función).
Evaluación de los efectos induci-
dos por el hombre en el medio
Salvador
Ecología de
Biogeoquímica ambiente en los ciclos biogeo-
Sánchez
CCM-CSIC
sistemas
de Ecosistemas
químicos y estructura y función
Carrillo
de los ecosistemas acuáticos y te-
rrestres.
Conservación y desarrollo soste-
nible en ecosistemas tropicales
africanos. Estudio del comporta-
miento social del gorila de llanu-
ra (Gorilla g. gorilla) en particular,
Magdalena
Universitat
Biología Ani-
y de los grandes simios en gene-
Bermejo
de Barcelo-
mal
ral, que ha permitido avanzar en
Espinet
na
una línea de desarrollo sostenible
basada en el ecoturismo. Se está
siguiendo la evolución de las po-
blaciones que han sido diezma-
das por el ébola.
326 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
TABLA V (continuación)
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
A u s t r a l i a n
Sistemática y fi logenia de Sabelli-
R e s e a r c h M u s e u m , Marine Inverte- da (Polychaeta).
María Capa
and Collec-
Sydney, Aus-
brates
tions
tralia
Eduardo
López
García
Universidad
Biología
A u t ó n o m a
Guillermo
de Madrid
San Martín
Biología Marina
Peral
Javier
Fisiología y Universidad Conservación de
Balbontín
Zoología
de Sevilla
la Biodiversidad
Arenas
Biología de la conservación y
C o n s e r v a -
Miguel
Cambio Global e Invasiones Bio-
ción de la
Grupo Miguel
Ángel Ferrer
EBD-CSIC
lógicas Biología Evolutiva y Eco-
Biodiversi-
Ferrer
Baena
logía Molecular y Genética Evo-
dad
lutiva.
Conocer la organización y funcio-
namiento de los ecosistemas ben-
tónicos marinos y los mecanismos
que los regulan. La fusión de mo-
Investigación de dernas técnicas moleculares con
Enric Sala
Ecología Ma-
Biodiversidad y
CEAB-CSIC
estudios biológicos y ecológicos
Gamito
rina
Ecología del tradicionales, permiten tener una
Bentos Marino
aproximación amplia, que va des-
de el nivel molecular al de orga-
nismos, poblaciones, comunida-
des y ecosistemas.
Mikel
Universidad
Zabala
Ecología
de Barcelo-
Ecología Marina
Limousin
na
Prevención del riesgo de incendio
forestal. Estudio y modelización
del régimen de incendios. Fuegos
Francisco
de copas y modelos de combus-
CREAF-UAB
Incendios
Lloret Maya
tibles. Efecto del fuego sobre las
plantas. Recuperación de la fauna
después de incendios. Gestión de
zonas quemadas.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
327

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
Departamen-
Investigador
Centro
Grupo
Líneas de investigación
to
Conocer la organización y funcio-
namiento de los ecosistemas ben-
tónicos marinos y los mecanismos
que los regulan. La fusión de mo-
Investigación de
Antonio
dernas técnicas moleculares con
Ecología Ma-
Biodiversidad y
García
CEAB-CSIC
estudios biológicos y ecológicos
rina
Ecología del
Rubies
tradicionales, permiten tener una
Bentos Marino
aproximación amplia, que va des-
de el nivel molecular al de orga-
nismos, poblaciones, comunida-
des y ecosistemas.
Gabriel
Micología
Biología Ve-
Universidad
Moreno
getal
de Alcalá
Horcajada
Estudios de campo experimentales
en la ecología comportamental de
aves y, en menor grado, mamífe-
ros (principalmente ungulados).
Etología y
Ecología evolutiva y de comporta-
C o n s e r v a -
miento, evolución de señales de
Francisco
ción de Re-
EBD-CSIC
Etología
comunicación, coevolución entre
Braza Lloret
cursos Natu-
parásitos y sus hospedadores, re-
rales.
des sociales y desarrollo social hu-
mano. Conservación de especies
amenazadas (como el Ibis eremi-
ta), control de especies invasoras
(Hormiga argentina) ...
Nota:
EBD-CSIC: Estación Biológica de Doñana (Consejo Superior de Investigaciones Científi cas).
IREC (CSIC-UCLM-JCCM): Instituto de Investigación en Recursos Cinegéticos (Consejo Superior de Investi-
gaciones Científi cas, Universidad de Castilla La Mancha y Junta de Comunidades de Castilla La Mancha).
IQOG-CSIC: Instituto de Química Orgánica (Consejo Superior de Investigaciones Científi cas).
IATA-CSIC: Instituto de Agroquímica y de Tecnología de los Alimentos (Consejo Superior de Investigaciones
Científi cas).
EGMASA: Empresa de Gestión Medioambiental (Consejería de Medio Ambiente, Junta de Andalucía).
CCM-CSIC: Centro de Ciencias Medioambientales (Consejo Superior de Investigaciones Científi cas).
ICAM-UCLM: Instituto de Ciencias Ambientales (Universidad de Castilla la Mancha).
CEAB-CSIC: Centro de Estudios Avanzados de Blanes (Consejo Superior de Investigaciones Científi cas).
CREAF-UAB: Centro de Investigaciones Ecológicas y Aplicaciones Forestales (Universidad Autónoma de
Barcelona).
328 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
4. Conclusiones
Las subredes tecnocientífi cas están formadas por términos que han estableci-
do entre sí durante el período de estudio relaciones cognitivas (palabra clave/
palabra clave, palabra clave/investigador o palabra clave/revista), relaciones de
colaboración (investigador/investigador) o de publicación (investigador/revista)
que pueden ser muy intensas en un corto período o menos intensas pero per-
manentes a lo largo del tiempo. La acción conjunta de todas esas diferentes re-
laciones de asociación entre los términos va a determinar la situación de cada
uno en la red, es decir, su centralidad. Los términos mejor relacionados van a
aparecer próximos entre sí constituyendo subredes; éstas, a su vez, también se
van a situar en la red según su similitud, constituyendo áreas de investigación.
La densidad de cada grupo o subred va a venir dada por la fortaleza de los en-
laces entre los términos que la forman. Centralidad y densidad son los parámetros
que van a determinar la posición estratégica del grupo o subred en el diagrama
estratégico de la red. En consecuencia, en el análisis estratégico de redes tecno-
científi cas la pertenencia de un término a una subred o grupo estratégico es
fruto del número y tipo de relaciones cognitivas o enlaces que establece con el
resto de términos a lo largo del tiempo y de la fortaleza de esos enlaces; se
comprueba, por ejemplo, como de los cincuenta y tres investigadores de la red
tecnocientífi ca (investigadores de cinco o más ocurrencias y que forman pares
de tres o más coocurrencias con otros nodos) sólo cuarenta y tres pueden ser
considerados como investigadores estratégicos.
El análisis estratégico y dinámico de la Red Tecnocientífi ca Española de In-
vestigación sobre Áreas Protegidas permite dirigir y graduar las acciones en in-
vestigación, innovación y desarrollo hacia las áreas y subredes según su posición
estratégica en la red. Entre las acciones futuras de gestión podría interesar apoyar
la conversión de subredes periféricas y densas en subredes motor de investiga-
ción, incentivando las relaciones externas de las primeras, fortalecer las subredes
generalistas, fomentando las relaciones internas, y apoyar las subredes nacientes
o no consolidadas.
Los informes, listados, grafos y mapas fruto del análisis estratégico y dinámi-
co de la Red WOS PCAR 53210 (1981-2005) sobre Áreas Protegidas pueden ser
empleados en la evaluación estratégica científi ca y tecnológica de los actores de
la investigación (palabras clave, investigadores o revistas), ya que caracterizan y
sitúan a cada término según su importancia absoluta o su importancia estratégi-
ca en la red.
Los Mapas de Conocimiento Estratégico de la Red Tecnocientífi ca, Mapas
CERT, facilitan el proceso de toma de decisiones ya que proporcionan imágenes
estratégicas, «metáforas visuales de paisaje» del dominio científi co y tecnológico
analizado, que permiten asimilar gran cantidad de información relevante e im-
portante de una manera rápida y comprensible. En ellos los términos se posicio-
nan referenciados al Centroide de la Red según su centralidad (medida de su
similitud con el objeto de estudio, en el caso que se presenta la «Investigación
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
329

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
española sobre áreas protegidas recogida por la Web of Science durante 1981-
2005») y en altura según su importancia absoluta en la red. La información visual
se complementa con una simbología que traslada el Diagrama Estratégico de la
Red al mapa cartográfi co, de modo que en él los diferentes términos aparecen
caracterizados según su importancia estratégica.
Los resultados obtenidos en el presente trabajo nos permiten considerar que
la evaluación de redes tecnocientífi cas mediante su análisis estratégico y dinámi-
co y la visualización de sus grafos y Mapas CERT puede ser de gran utilidad en
política científi ca y en evaluación de la Ciencia y la Tecnología en el campo de
la administración y gestión de los espacios naturales protegidos en España.
5. Bibliografía
Aiello, A., y Silveira, R. I. (2004): Trazado de grafos mediante métodos dirigidos por fuer-
zas: revisión del estado del arte y presentación de algoritmos para grafos donde los
vértices son regiones geográfi cas. http://www-ma2.upc.edu/rsilveira/pubs/MScThesis.
pdf [consultado el 3 de abril de 2010].
Bailón-Moreno, R. (2003): Ingeniería del conocimiento y vigilancia tecnológica aplicada
a la investigación en el campo de los tensioactivos. Desarrollo de un modelo ciencimé-
trico unifi cado.
Granada: Tesis doctoral. Universidad de Granada.
Bailón-Moreno, R.; Jurado-Alameda, E., y Ruíz-Baños, R. (2006): The scientifi c network of
surfactants: structutal analysis. Journal of the American Society for Information Scien-
ce and Technology,
57 (7). 847-850.
Batagelj, V., y Mrvar, A. (s.f.) Networks/Pajek: Program for Large Network Analysis. http://
vlado.fmf.uni-lj.si/pub/networks/pajek/ [consultado el 4 de abril de 2010].
Callon, M. (1989): La science et ses réseaux: gènese et circulation des faits scientifi ques.
París: Découverte.
Callon, M.; Courtial. J., y Turner, W. (1991): La méthode Leximappe: un outil pour l’analyse
stratégique du développement scientifi que et technique. En B. Vinck, Gestion de la
recherche: nouveaux problèmes, nouveaux outils,
(207-277), Editions Bruxelles.
Callon, M.; Law, J., y Rip, A. (1986): Mapping the dynamics of science and technology:
Sociology of science in the real world, Londres: McMillan Press LTD.
Courtial, J. P. (1999): Analyse dynamique des representations sociales des chercheurs: le
cas de l’autisme. Papers on Social Representations, (8), 3.1-3.22.
Courtial, J. P., y Michelet, B. (1990): A mathematical model of development in research
fi eld. Scientometrics, 19 (1-2), 127-141.
Echevarría, J., y González, M. I. (2009): La Teoría del Actor-Red y la tesis de la Tecno-
ciencia. Arbor Ciencia, Pensamiento y Cultura, (738), 705-720.
García-Ríos, M. C. (2009): El paradigma de la fi sioterapia a través de un estudio cienci-
métrico, Granada: Tesis doctoral, Universidad de Granada.
Jurado-Alameda, E.; Bailón-Moreno, R., y Ruíz-Baños, R. (2002a): Evaluación a través del
análisis de palabras asociadas (I). Aplicación a la evaluación de la investigación cien-
tífi ca y técnica. Ingeniería Química, (388), 141-149.
330 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
Jurado-Alameda, E.; Bailón-Moreno, R., y Ruíz-Baños, R. (2002b): Evaluación a través del
análisis de las palabras asociadas (II). Evaluación de la investigación en el campo de
los tensioactivos. Ingeniería Química, 177-184.
Kamada, T., y Kawai, S. (1989): An algorithm for drawing general undirected graphs. In-
formation Processing Letters, (31), 7-15.
Larreina, S.; Hernando, S., y Grisaleña, D. (enero-febrero de 2006): La evolución de la
inteligencia competitiva: un estudio de las herramientas cienciométricas. Puzzle: Re-
vista Hispana de Inteligencia Competitiva.
http://redalyc.uaemex.mx/redalyc/
pdf/548/54852001.pdf [consultado el 3 de abril de 2010].
Latour, B. (1983): Give me a Laboratory and I Will Raise the World. En K. Knorr-Cetina,
y M. Mulkay, Science observed: Perspectives on the Social Study of Science. Londres:
Sage.
Latour, B. (2005): Reassembling the Social. An introduction to Actor-Metwork Theory.
Oxford: Oxford University Press.
Law, J., y Whittaker, J. (1992): Mapping acidifi cation research: a test of the co-word me-
thod. Scientometrics, 23 (3), 417-461.
Law, J.; Bauin, S.; Courtial, J. P., y Whittaker, J. (1988): Policy and the mapping of scien-
tifi c change: a co-word analysis of research into enviromental acidifi cation. Sciento-
metrics,
14 (3-4), 251-264.
Michelet, B. (1988): L’analyse des associations. PhD Thesis. París: Université de París, 7.
Old, J. (2001): Utilizing Spatial Information Systems for Non-Spatial-Data Analysis. Scien-
tometrics, vol. 51 (3), 563-571.
Pino-Díaz, J.; Jiménez-Contreras, E.; Ruíz-Baños, R., y Bailón-Moreno, R. (2009): Visuali-
tation des acteurs-reseaux a travers les cartes SIG. Seminario VSST´09 (Vigilancia
estratégica científi ca y tecnológica)
(1-19). Nancy (Francia).
Polanco, X. (1997): Infometría e Ingeniería del Conocimiento: Exploración de Datos y
Análisis de la Información en vista del Descubrimiento de Conocimientos. En Jarami-
llo, H., y Albornoz, M. (editores) El universo de la medición: La perspectiva de la
Ciencia y la Tecnología.
COLCIENCIAS, CYTED, RICYT. Tercer Mundo Editores. Bo-
gotá, Colombia.
Polanco, X. (2008): Transformer l’information en connaissance avec STANALYST. Cadre
conceptuel et Modèle. Encontros Bibli: Revista Electrónica Biblioteconomia y Ciencia
de la Informaçao,
n.º esp., 1.º sem., 76-91.
Ruíz-Baños, R. (1997): Ciencimetría de redes. Análisis de la Investigación Internacional
sobre Arqueología mediante el método de las palabras asociadas (1980-1993). Tesis
Doctoral. Granada: Universidad de Granada.
Ruíz-Baños, R. (1996): Leximappe una efi caz herramienta informática para descibir la es-
tructura de las redes del conocimiento científi co. Sistemas de Información. Balance
de 12 años de jornadas y perspectivas de futuro,
791-796, Cáceres: Fesabid.
Ruíz-Baños, R. (1999): Las traducciones dinámicas de las series temáticas. Propuesta de
una clasifi cación. La Representación y la organización del conocimiento en sus distin-
tas perspectivas: su infl uencia en la recuperación de la información: actas del IV
Congreso ISKO-España,
211-216. Granada, España.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
331

JOSÉ PINO-DÍAZ, EVARISTO JIMÉNEZ-CONTRERAS, ROSARIO RUÍZ-BAÑOS, RAFAEL BAILÓN-MORENO
6. Notas
1. El desarrollo en los años ochenta de la Sociología de las Ciencias y Téc-
nicas, Sociología de la Traducción o Sociología de las Asociaciones por Michel
Callon y Bruno Latour (Centre de Sociologie de l’Innovation, Paris) a partir de
recursos conceptuales, entre otros, de Michel Serres (Filosofía de las Ciencias) y
de David Bloor (Sociología del Conocimiento), tiene su exponente en la Teoría
Actor-Red (ANT en inglés), según la cual, en la construcción social de un hecho
científi co intervienen entidades humanas y no humanas y el proceso continuo
de transformación o traducción de las relaciones establecidas entre tales entidades
da como resultado una red en continuo cambio; entendida ésta como una malla
formada por nudos (actores) enlazados entre sí (relaciones que establecen entre
ellos). Estos cambios en las relaciones tienen como consecuencia la aparición, el
fortalecimiento, el equilibrio, el debilitamiento y la desaparición de los actores.
El sistema de conocimiento Copalred© permite visualizar el proceso de traducción
en las redes tecnocientífi cas mediante el análisis dinámico de las mismas.
2. El diagrama estratégico (fi gura 1), es un diagrama cartesiano que se em-
plea para clasifi car a las subredes estratégicas en función de su rango de centra-
lidad (eje de abscisas) y de su rango de densidad (eje de ordenadas). Según el
cuadrante en el que se sitúan, éstas pueden ser: cuadrante n.º 1, subredes de
altas centralidad y densidad (subredes motor de investigación); cuadrante n.º 2,
subredes de alta centralidad y baja densidad (subredes puente o categorizacio-
nes); cuadrante n.º 3, subredes de baja centralidad y alta densidad (subredes
especializadas o metodologías), y cuadrante n.º 4, subredes de bajas centralidad
y densidad (subredes nacientes o en destrucción). Así resulta que las subredes
de mayor centralidad y densidad son las subredes mejor situadas en la red y las
de mayor pertinencia con el objeto del estudio.
3. En la fi gura 2, se observan las áreas estratégicas de investigación. Se han
obtenido agrupando las subredes estratégicas similares. Cada subred está consti-
tuída por términos, los cuales pueden ser palabras clave, investigadores o revis-
tas (en la fi gura los términos aparecen nombrados por su número de identifi ca-
ción). Se puede observar la posición que ocupan las diferentes áreas y subredes
estratégicas entorno al centroide o isobaricentro del grafo del Componente Prin-
cipal de la Red.
4. En la fi gura 3, se observa una imagen 3D del Mapa CERT del Compo-
nente Principal de la Red (el mapa real está realizado sobre formato A3). En
planimetría se visualiza la similitud entre los términos (proximidad entre ellos) y
la centralidad (proximidad al centroide). La agrupación de términos constituye
subredes o grupos estratégicos y la agrupación de subredes áreas estratégicas. La
mayor o menor cercanía de los términos, de las subredes o de las áreas de in-
vestigación al centroide indica su mayor o menor grado de relación con la temá-
tica general del estudio («Investigación sobre áreas protegidas en España»). En
altimetría se visualiza, mediante una escala de color de tintas hipsométricas, la
importancia absoluta de cada término (suma de su centralidad y de su densidad,
332 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804

Evaluación de redes tecnocientífi cas: la red española sobre Áreas Protegidas...
en valores normalizados). Si sobre el Mapa CERT se indica mediante símbolos de
diferente forma y color la importancia estratégica de los términos de las subredes
de investigación se obtiene el Mapa de Importancia Estratégica (Mapa I-VECT).
5. En la tabla V en las columnas Departamento, Centro, Grupo y Línea de
investigación fi guran los datos de los autores obtenidos en la web a la fecha de
realización del artículo.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 301-333, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.804
333

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 334-356, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
Modelo para la evaluación de ontologías.
Aplicación en Onto-Satcol

Jose A. Senso*, Amed Abel Leiva-Mederos**, Sandor Eduardo Domínguez-
Velasco**
Resumen: Se analizan los referentes teóricos y conceptuales de la evaluación de ontolo-
gías para conocer los procedimientos utilizados en la evaluación de estos sistemas y
establecer nuevas pautas para calibrar el sistema ontológico empleado por el progra-
ma Satcol, especializado en Ingeniería de Puertos y Costas. En el trabajo se describen
las características de la ontología Onto-Satcol y se evalúa la misma mediante el uso
de varios indicadores (léxicos, de recuperación de información y de la estructura sin-
táctica). Mediante un experimento llevado a cabo por 6 expertos, y con la ayuda de
la herramienta Protex, se identifi can inconsistencias semánticas, estructurales y errores
en la organización del conocimiento de dicha ontología.
Palabras clave: Ontologías, evaluación de ontologías, ontologías de dominio, análisis,
evaluación de ontologías, Ingeniería de puertos y costas.
A model for ontology evaluation. The case of Onto-Satcol
Abstract: This paper analyzes the conceptual and theoretical framework for the evaluation
of ontologies, in order to understand the procedures used in the evaluation of these
systems and to establish new guidelines for evaluating the system employed by the
ontological program, SATCOL, that specializes in Port and Coastal Engineering. This
paper describes the characteristics of the Onto-SATCOL ontology and evaluates it by
using several indicators (lexical, information retrieval, and syntactic structure). Through
an experiment conducted by six experts aided by the tool, Protex, semantic and structural
inconsistencies are identifi ed, as are errors in the ontology’s organization of knowledge.

Keywords: Ontologies, Ontology Evaluation, Domain ontologies, Ontological analysis and
evaluation, port engineering, coastal engineering.
1. Introducción
En la representación del conocimiento es cada vez más común el uso de las
ontologías como herramientas que permitan relacionar los conceptos que apare-
cen dentro de un área de conocimiento. Estas especifi caciones formales cuentan
con varios mecanismos y fases para ser construidas, así como múltiples proyec-
* Departamento de Biblioteconomía y Documentación. Universidad de Granada.
** Universidad Central «Marta Abreu» de Las Villas, Cuba. Correo-e: jsenso@ugr.es; amed@uclv.
edu.cu
Recibido: 25-07-2010; 2.ª versión: 30-07-2010; aceptado: 20-10-2010.
334

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
tos y publicaciones que respaldan la validez de todas las metodologías propues-
tas. En general, de todas ellas se puede concluir lo mismo: no hay un único
camino para construir una ontología, pero el producto resultante debe ser con-
secuente con los orígenes que lo propiciaron.
Al mismo tiempo, y de casi forma natural, surge la necesidad de evaluar lo
realizado. La mayoría de metodologías empleadas para la creación de las onto-
logías también incluyen un apartado dedicado a la evaluación del resultado. Pero,
en casi todos los casos, esta evaluación está excesivamente mediatizada por el
sistema empleado en la formalización [por ejemplo, methontology (Fernández-
López y otros, 1997)] o, directamente, no informa sobre cómo debe llevarse a
cabo, pero sí indica la necesidad de ello [como sucede con Uschold (Uschold y
King, 1995)], o es demasiado subjetiva [caso, por ejemplo, de la propuesta de
Grunninger (Grunninger y Fox, 1995)].
Por otra parte, hay que recordar que una de las claves del éxito de las onto-
logías se encuentra en la posibilidad que ofrecen para su reutilización. Es decir,
emplear total o parcialmente otra/s ontología/s para adaptarla/s a la nueva que
se está creando. Si bien es cierto que cada ontología responde a una manera
diferente de contemplar o comprender el estado de un conocimiento concreto,
no es menos evidente que los conceptos, conceptos son, y siempre es posible
emplear sólo elementos determinados en función de las necesidades (capturar la
taxonomía principal o tratar la ontología origen únicamente como base termino-
lógica, obviando otras propiedades, axiomas, instancias, etc., para la ontología
destino son las dos soluciones más comunes). Sea cual sea la opción, siempre
es necesario realizar una evaluación de las ontologías candidatas con el fi n de
averiguar cuál se adapta mejor a los requerimientos.
En la actualidad existen diversos mecanismos o métodos que permiten evaluar
ontologías (Evermann y Fang, 2010; Staab, 2004). Los trabajos de Gómez-Pérez
(Gómez Pérez, 1994) apuntan hacia la existencia de varias formas de evaluación
de recursos ontológicos desde el punto de vista industrial, cognitivo y con el
empleo de técnicas matemáticas generalmente conocidas como métricas. Varios
proyectos de nivel ontológico (Yu y otros, 2009) han sido objeto de evaluación
mediante el empleo de diversas técnicas y presupuestos teóricos, encaminados
a evaluar esencialmente la expresión, la precisión, los problemas de diseño y las
inconsistencias semánticas.
Una de las aplicaciones que se han desarrollado en el campo de la organi-
zación del conocimiento por medio de ontologías es Satcol (Leiva-Mederos y
otros, 2009). Se trata de una aplicación que permite realizar procesos de minería
de texto con los documentos de un corpus concreto, facilitando la creación de
relaciones de acuerdo a la estructura gramatical y conceptual que presenten. Este
programa emplea a un conjunto de autómatas que se encargan de la modelación,
el análisis documental y la simulación del comportamiento de resumidores. Para
llevar a cabo ese trabajo se emplea Onto-Satcol, ontología formada por una es-
trategia cognitiva y otra semántica que sirve para expresar las relaciones semán-
ticas, interpersonales y de guía en el trabajo de los agentes.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
335

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
Al ser Satcol una herramienta para representar información en el terreno de
la Ingeniería de Puertos y Costas, provoca que la ontología resultante sea «dife-
rente» al resto en cuanto a diseño y desarrollo. El hecho de no contar esta dis-
ciplina con diccionarios especializados y la ausencia de una teoría específi ca
debido a la juventud de esta parcela del conocimiento, obligan a buscar métodos
diferentes para la evaluación de la ontología. Onto-Satcol no posee los cánones
clásicos (a nivel conceptual) de diseño ontológico como otros modelos de onto-
logías. Su estructura responde a la desambiguación del conocimiento generado
en disímiles terrenos, entre los que se encuentran: medio ambiente, costas, puer-
tos, ingeniería de caminos y canales.
Con Onto-Satcol se pretendió solucionar el problema de integrar los conoci-
mientos que eran necesarios para la ingeniería de Puertos y Costas y contribuir
así a la construcción de un sistema sumista que se apoyara en la semántica de
la ontología para extraer, desambiguar y recuperar información.
Este artículo tiene como objetivo mostrar los pasos seguidos en la evaluación
de la ontología Onto-Satcol, empleando para ello algunas métricas y principios
específi cos desarrollados pensando en las características concretas de este sistema.
De esa forma, además de medir su efi cacia, estaremos mostrando una metodo-
logía diferente para evaluar ontologías que se puede unir a las comentadas an-
teriormente.
2. Los métodos de evaluación de ontologías
Los modelos de evaluación de ontologías poseen diversas aplicaciones, de
acuerdo a la ontología en cuestión que se esté analizando. Las formas de evaluar
los sistemas ontológicos se han basado esencialmente en la semántica externa
de las ontologías, la precisión de los modelos cognitivos, la estructura del cono-
cimiento representado así como en medidas basadas en los criterios de exhaus-
tividad y precisión (Kent, 1955) clásicos de la recuperación de información.
Los autores han decidido agrupar los métodos esenciales de evaluación en
función a la fi losofía principal que motiva dicha evaluación (básicamente recu-
perar información, costo que supone su implementación, uso de métricas mate-
máticas y análisis de la taxonomía creada) para, después, pasar a describir el mo-
delo que servirá de base a la ontología Onto-Satcol. Teniendo en cuenta que el
objetivo de este texto no es el de establecer una clasifi cación de sistemas y mé-
todos, algo que por otra parte ya ha sido propuesto en otros artículos que tratan
ese tema de manera monográfi ca, como los de Brank (Brank y otros, 2005), Obrst
(Obrst y otros, 2007) o Hartmann (Hartmann y otros, 2005), no se seguirá un
esquema lingüístico o semántico en su listado, ni por supuesto un recorrido ex-
haustivo, sino que se desarrollará sobre parámetros de practicidad, ya que no to-
dos los métodos han sido igual de documentados ni implementados, por eso aquí
mencionaremos únicamente aquellos que cuentan con información sufi ciente y
clara, y que, además, hayan sido empleados con éxito en proyectos concretos.
336 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
2.1. Empleo de criterios clásicos en la recuperación de información
La primera variante utiliza dos métricas estándar en la recuperación de infor-
mación para valorar la ontología: precisión (proporción de material relevante
recuperado —bien por medio de clases o subclases, bien por medio de objetos
asociados a éstas, etc.— del total de objetos recuperados) y exhaustividad (ca-
pacidad de la ontología para recuperar objetos —clases, subclases, documentos,
etc.— relevantes del total de objetos relevantes almacenados en la ontología). En
la mayoría de trabajos que han aplicado estos criterios se ha contemplado tanto
la dimensión semántica, inherente a cualquier ontología, como la más pura ver-
tiente de recuperación de información.
La aportación más interesante en este tipo de trabajos la presenta Zhang
(Zhang y otros, 2008) quien defi ende una relación puramente semántica del con-
cepto de precisión, dentro de la posición y evaluación de mapas ontológicos.
Para evaluar dichos mapas él y sus colaboradores comparan los criterios neta-
mente semánticos con otros valores normalizados y simétricos.
Otro aspecto que caracteriza las evaluaciones realizadas a partir de estos cri-
terios es la multiplicidad de variantes que, tanto precisión como exhaustividad,
pueden aportar, y que son comentados en diversas contribuciones, en la línea
de la defendida por Ramos (Ramos y otros, 2009) que presenta una variante para
calcular la exhaustividad y la precisión basada específi camente en las capacidad
semántica de la ontología y su operatividad en determinado corpus. Sin embargo,
las fórmulas con las que trabaja son las típicas de estos dos criterios, y los valo-
res resultantes deberían ser completados con la medida de F, que sirve para
corregir el error de la distancia que se produce en aquellos casos en los que la
exhaustividad y la precisión se compensan.
Un sistema que emplea un mecanismo parecido, y que presenta ese mismo
inconveniente es Evalexon (Spyns, 2005), que trabaja de manera conjunta con la
ontología y el corpus sobre el que ésta se ha generado. Emplea diversas técnicas
de minería de texto para realizar una evaluación más conceptual que lingüística,
ya que se preocupa más de cómo de apropiados son los términos escogidos para
representar conceptos, en función de la frecuencia con la que esos términos
aparecen tanto en la ontología como en el corpus.
El principal problema que presentan estos métodos de evaluación es la ne-
cesidad de un entrenamiento previo de los observadores, para que puedan va-
lorar las conclusiones de manera objetiva. En muchas ocasiones, los resultados
no son los más factibles, debido a que tanto precisión como exhaustividad son
dos cuestiones que se deben interpretar desde el punto de vista de la persona
que interactúa con el sistema. El no contar con un criterio formal (expresado en
cantidades) o una visión semántica clara (expresada por medio de la posición
que existe entre el objeto que se obtiene y lo que el usuario necesita) son los
principales hándicaps del empleo exclusivo de este método.
La segunda variante emplea las posibilidades que ofrece el modelo de espa-
cio vectorial (Salton y otros, 1975) dentro de una ontología y un corpus de tex-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
337

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
to. En este modelo de evaluación, que se denomina ontología de ajuste (ontolo-
gy fi t) y que fue propuesto por Brewster (Brewster y otros, 2004), se emplea una
ontología base, que es comparada con la ontología que se desea generar. La idea
sobre la que se construye ese sistema es el de evaluar el corpus de los textos
empleados en la creación de la ontología en relación con las instancias de dicha
ontología, construyendo un cluster que permita valorar el nivel de consistencia
semántica alcanzado.
Los resultados deberían revelar si la metodología empleada para el diseño de
la ontología ha sido la idónea, o si el corpus con el que se ha trabajado cumple
con los estándares correctos, pero no se centra demasiado en valorar el nivel de
recuperación de información obtenido, o las inconsistencias semánticas (taxono-
mías mal formadas, errores en la ubicación de las clases, axiomas mal declarados,
descripciones simplistas de las clases por el uso incorrecto de anotaciones, etc.).
Un ejemplo claro de difi cultad a la hora de aplicar esta técnica se produjo en el
análisis de Wordnet (http://wordnet.princeton.edu/), donde existen instancias
declaradas en diferentes partes de la ontología con evidente relación semántica
entre ellas, pero sin que dicha relación esté explicitada de forma alguna (Fell-
baum, 1998). Según este sistema de evaluación, esa ontología tenía problemas
metodológicos de construcción debido a ese tipo de relaciones, ya que era de-
tectado como un problema estructural, cuando precisamente era uno de los fuer-
tes de esta herramienta terminológica.
2.2. Sistemas centrados en el costo
A nadie se le escapa que el proceso de construcción de una ontología, inde-
pendientemente del modelo escogido (desde cero, con herramientas para la ob-
tención automática, o semi-automática desde información textual, desde modelos
entidad/relación, aprendizaje, etc.), es posiblemente el más costoso, desde todos
los puntos de vista, dentro de la representación del conocimiento. Tanto es así,
que existen numerosos sistemas que hacen especial hincapié en este apartado
cuando se evalúa una ontología. En ocasiones, demasiado.
Teniendo en cuenta que existe una estrecha relación entre la ingeniería de
software y la construcción de ontologías (dependiendo del modelo escogido para
la creación se pueden llegar a solapar diversas etapas), no son pocos los autores
que han defendido la idea de adoptar sistemas híbridos basados en ambos. Así
por ejemplo, Ontocom (Paslaru Bontas y Mochol, 2005) usa el sistema Cocomo
(Constructive Cost Model) como principio para construir un mecanismo de eva-
luación de ontologías. Emplea para ello la unión de tres metodologías propias
de la ingeniería de procesos, como son top-down, parametric y expert-based
(Boehm, 1981) para analizar el costo de construcción, mantenimiento y reutiliza-
ción de la ontología teniendo en cuenta valores tales como el número de perso-
nas involucradas en la construcción, cantidad de horas dedicadas, tamaño de la
ontología, etc.
338 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
El principal problema que presentan este tipo de sistemas se localiza en la
total ausencia de análisis de la estructura taxonómica creada, la semántica apor-
tada, las relaciones entre las propiedades, los axiomas, etc.
2.3. Basados en métricas
Aquí recopilamos aquellos sistemas que utilizan diferentes cálculos, general-
mente con base matemática, para valorar diversos aspectos de la ontología. Éste
es el caso, por ejemplo, del modelo propuesto por Yao (Yao y otros, 2005), don-
de se emplean un determinado número de métricas de cohesión específi camen-
te creadas para su uso en ontologías. Están basadas en diferentes teorías mate-
máticas y analizan, fundamentalmente, la profundidad de la descripción en
función del número de clases principales, subclases, notaciones formales, pro-
fundidad media del árbol taxonómico, etc. Para llevar a cabo su propuesta se
evaluaron varias ontologías con licencia creative commons por medio de un par-
ser xml denominado OMP (Ontology Metrics Parser). Para la fase fi nal del expe-
rimento se empleó a 18 evaluadores con dilatada experiencia en el proceso de
creación de ontologías, no tanto en la materia que era representada en dichas
herramientas.
Otros sistemas de evaluación también emplean métricas diferentes, y, además,
con objetivos distintos. Así, por ejemplo, OntoMetric (Lozano-Tello y Gómez-
Pérez, 2004), se centra más en analizar la posible reutilización de la ontología
que la calidad de la misma. Para ello utiliza la jerarquía de procesos analíticos
(Analytic Hierachi Process, AHP) como criterio para adoptar procesos de negocio
a los ontológicos, analizando el contenido representado en la ontología, el len-
guaje con que la ontología es implementada, la metodología con la que se llevó
a cabo la construcción de la ontología, el software empleado y el costo de uso
del sistema.
En total, este sistema analiza 160 características diferentes, convirtiéndose en
una de las metodologías más exhaustivas. Quizá el principal problema que ten-
ga es que, en ocasiones, está demasiado centrada en la reutilización de la onto-
logía, y no en la evaluación como herramienta para la recuperación de informa-
ción. En ese sentido, cabe destacar el trabajo de Sabou (Sabou y otros, 2006),
que emplea un conjunto de variables muy parecidas a las de OntoMetric, pero
orientadas hacia ese aspecto. Destaca el análisis que realizó sobre el conocido
motor de búsqueda Swoogle (http://swoogle.umbc.edu/).
2.4. Sistemas basados en el análisis de jerarquías
Mediante este análisis, basado en la comparación, se facilita el estudio de la
estructura conceptual de una ontología concreta para observar los posibles erro-
res de exhaustividad y precisión, además de otro tipo de restricciones. Emplea
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
339

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
como medida de evaluación el cálculo de distancias y la similaridad entre clases
de las ontologías analizadas.
En esencia, compara una ontología con otra —que se considera como la «on-
tología ideal» o perfecta, que no necesariamente de ser de la misma temática,
pero sí debe contar con similares características en cuanto a estructura y profun-
didad en la representación— asignando valores de 0 a 1 a cada una de las clases
e instancias de ambas. Estos valores son los que se emplean para delimitar la
distancia entre nodos, determinando el nivel léxico que existe entre las dos re-
presentaciones. Cuando más se aproximen a cero más iguales serán las ontologías
y, por tanto, más cercana a la ontología ideal estará la creada.
Es un mecanismo parecido al empleado en OntoClean (Guarino y Welty, 2002)
que, además de establecer criterios de selección de ontologías a partir de una
taxonomía base, analiza la posible existencia de problemas de inconsistencia
semántica y/o estructural. Se centra especialmente en las propiedades defi nidas
en la ontología, sobre todo las relaciones «is a» y «part of», lo que en ocasiones
conlleva evaluaciones demasiado simplistas si la ontología es conceptualmente
muy amplia.
2.5. Otros sistemas de evaluación
En alguna de las metodologías comentadas anteriormente se hablaba de la
existencia de observadores que, generalmente al fi nal del proceso, se encargaban
de aplicar los criterios de calidad. Existen otras opciones, como por ejemplo, que
sobre estos observadores recaiga un peso mayor. Aunque no suele ser muy ha-
bitual, por el elevado nivel de subjetividad que implica, no es menos cierto que
existen experiencias basadas en esta idea.
En el trabajo de Fernández-Breis (Fernández-Breis y otros, 2009) se utiliza un
sistema basado en la ISO 9126 que, aunque está pensada para la evaluación de
la calidad del software, los autores logran adaptar al mundo de las ontologías,
reconvirtiendo los 10 criterios generales de esta ISO en aspectos específi cos del
análisis de aspectos internos, externos y de uso de las ontologías. Una vez con-
feccionada la plantilla, 8 alumnos de doctorado realizan la evaluación de dos
versiones diferentes de una ontología especializada en biología.
Resulta evidente que, en este tipo de métodos, el peso que debe soportar la
evaluación se encuentra sobre un terreno excesivamente subjetivo. Además de
mencionar que criterios relacionados con la calidad y la cantidad de clases y sus
relaciones no son analizados con la profundidad que se requiere. Algo que, por
otra parte, no sucede con el sistema propuesto por Gangemi (Gangemi y otros,
2005), quien emplea una meta-ontología (se trata de una propuesta meta-teórica
sobre cómo se debe realizar la evaluación tanto de la ontología como de las
anotaciones que incluya), denominada O y una ontología específi ca para la eva-
luación y validación, llamada oQual, que es la que incluye los parámetros a
aplicar.
340 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
Hemos dejado para el fi nal los métodos experimentales llevados a cabo por
Evermann (Evermann y Fang, 2010), quien evalúa la ontología desde un para-
digma cognitivo, muy apegado a los principios del desarrollo de aplicaciones.
3. Errores frecuentes en el diseño de ontologías
Independientemente del esquema escogido para evaluar la ontología, lo nor-
mal es que se presente al fi nal un listado de errores, que pueden ser achacados
a su creación, implementación en el sistema de información, disonancia entre el
objetivo y lo realizado, etc. La importancia de éste determinará al fi nal el nivel
de operatividad alcanzado con la misma. La tipología de errores en el diseño de
ontologías va desde los fallos en la taxonomía y diseño, hasta equivocaciones en
la semántica conceptual, en la postura estructural y en los axiomas que se de-
claran. Todas estas cuestiones son las causantes de los posibles bajos resultados
cuando se realizan operaciones contra estos sistemas.
Son múltiples los errores que comprometen el desarrollo exitoso de una on-
tología. En el trabajo de Fahad (Fahad y Abdul Qadir, 2008) se describe un sin-
número de anomalías en el diseño ontológico. Dichos errores de diseño y concep-
ción pueden clasifi carse como simples errores de construcción, pues evidencian
problemas en el diseño de las instancias y en la construcción de las clases del
sistema ontológico. Otros autores, Staab, por ejemplo (Staab, 2004), analizan los
problemas de construcción de las ontologías y los ponen en relación con los re-
sultados que acarrean estos fallos. Recogemos a continuación la relación de erro-
res más comunes, a partir de lo expuesto por Faha (Fahad y Abdul Qadir, 2008),
Staab (Staab, 2004), Ning (Ning y Shihan, 2006), Maedche (Maedche y otros, 2003)
y nuestra propia experiencia:
• Errores de ubicación: Se producen cuando no se tienen en cuenta la dis-
posición correcta de las clases y se solapan estas, principalmente por la
existencia de cruces entre nodos y estructuras conceptuales (Ning y Shihan,
2006). Suele suceder cuando una misma clase es defi nida como una sub-
clase y como una superclase al mismo tiempo en diferentes niveles de je-
rarquía de la ontología. Este tipo de errores se producen cuando, a la hora
de construir las relaciones semánticas, no se realizan análisis lingüísticos
y/o terminológicos de los conceptos, provocando una estructuración del
conocimiento débil o poco coherente.
• Errores de distribución. Suele aparece cuando, a la hora de estructurar el
conocimiento, los procesos creados se realizan desde una base netamente
clasifi catoria. Es en ese momento cuando se puede producir una excesiva
dependencia (genérico/específi co o «tipo de» y «subtipo de») entre las clases
y las subclases (Ning y Shihan, 2006). Como resultado de este error apare-
cen clases que están mutuamente atadas a subclases disjuntas (Qadir y
Noshairwan, 2007). Otra inconsistencia de este problema está en la frag-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
341

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
mentación de una clase en muchas subclases, sin tener en cuenta que las
instancias de las subclases no necesariamente tienen que pertenecer a
las subclases que se han declarado.
• Errores de inconsistencia semántica. Se produce al desarrollar una jerarquía
de nodos para un concepto erróneo. Es decir, cuando en la jerarquía apa-
recen conceptos que no pertenecen a la clase principal. La razón principal
de este error es el poco conocimiento semántico y terminológico del área
del conocimiento con la que se está trabajando.
• Clases y clasifi caciones incompletas. En ocasiones se presta muy poca aten-
ción a elementos muy importante en la descripción, en la anotación y en
la conceptualización de la ontología, cuestión que favorece la ambigüedad
y entorpece la construcción de herramientas de razonamiento. Esto reper-
cute en clases o clasifi caciones poco documentadas.
• Omisión de conocimiento disjunto. Errores que ocurren cuando existe un
gran número de clases y subclases, y en su creación se obvia la inclusión de
axiomas, que tienen determinado grado de disjunción. Según Qadir (Qadir
y Noshairwan, 2007) estos errores aparecen en la fase de diseño debido a
la falta de conexión entre el desarrollador y los usuarios, lo que hace que
se obtengan resultados catastrófi cos.
• Omisión de conocimiento por falta de exhaustividad. Se produce cuando
los constructores de la ontología no crean restricciones de integridad, de-
clarando de forma arbitraria particiones y subclases de un mismo concepto.
Con esto se deja en el aire la capacidad de exhaustividad del sistema, con-
duciendo a la redundancia.
• Errores de redundancia. La repetición de conceptos, lo que evidencia la
falta de un plan en la confección de las taxonomías de base del sistema,
como apunta Fahad (Fahad y Abdul Qadir, 2008).
• Errores en la poca especifi cación o delimitación de las propiedades de los
componentes del sistema. Esto produce que el razonamiento se vea poco
desarrollado, ya que se da una misma defi nición a todo, desde el punto de
vista formal y conceptual.
• Errores por falta de exhaustividad en la declaración de etiquetas. Este error
está muy asociado a la construcción de inferencias en las ontologías que
generan su estructura usando OWL. Las etiquetas que deben ser desarro-
lladas o declaradas tienen que tener sufi cientes elementos y atributos para
detallar correctamente un dominio, y contribuir a que los conceptos puedan
estar asociados a determinadas propiedades. En algunos sistemas ontológi-
cos se pasa por alto esta propiedad, lo que hace que los modelos de razo-
namiento se vean desarticulados. Los problemas esenciales que se describen
por este error son del tipo IFPO (Omisión de las Propiedades), es decir,
que si no se declaran estos valores el sistema sólo identifi ca un único valor
para un concepto y una sola clave en la base de datos.
• Errores por no describir correctamente el conocimiento. Lo que acarrea
que no se reconozca exactamente qué elemento se está declarando en
342 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
cada concepto, ya que no hay defi niciones exactas para subclases y sus
relaciones con los conceptos (Maedche y Staab, 2002). Esto obliga a
una necesaria descripción de reglas que proporcionen criterios esencia-
les para la interacción con nuevos conceptos (Kuhn, 1979) que se creen
en las subclases y sus relaciones, es decir, obliga a generar modelos de
axiomas, complementaciones y restricciones para el trabajo con la onto-
logía.
• Errores de redundancia en las extensiones. Aparece cuando se describe un
concepto como disjunto con otro concepto de la misma jerarquía (Kuhn,
1979; Maedche y Staab, 2002).
4. Evaluación de Ontol-Satcol
Onto-Satcol es una ontología desarrollada para formalizar parte del conoci-
miento asociado al dominio de la Ingeniería de Puertos y Costas. Su nacimiento
viene provocado por dos motivos: como herramienta para un sistema de desam-
biguación de textos científi cos, y para dar respuesta a la necesidad de paliar el
desigual aumento de información en lo que se refi ere a la existencia de herra-
mientas terminológicas que faciliten la recuperación de información (taxonomías,
tesauros y ontologías) dentro de esta área.
La Ingeniería de Puertos y Costas es un ejemplo de este último problema.
Aunque se trata de una disciplina relativamente nueva, mezcla de la clásica In-
geniería de Caminos, Canales y Puertos y las ingenierías oceánica y naval, la
notable evolución científi ca que ha experimentado debida al desarrollo de nuevas
técnicas de construcción, explotación y gestión de estructuras y recursos marinos
no ha sido sufi ciente como para que exista una formalización de las estructuras
de conocimiento que representen los procedimientos, defi niciones, objetos y
metaconocimiento que en ella se llevan a cabo.
Esto es fácilmente comprobable si se realiza una consulta simple sobre dos
tipos de herramientas de ontologías, buscando por los términos —en español y
su correspondiente en inglés— más representativos relacionados con cuatro dis-
ciplinas escogidas de forma aleatoria dentro de la Ingeniería (Agrícola, Geológi-
ca, Aeronáutica y Civil) a la que sumamos la Ingeniería de Puertos y Costas. El
resultado será, por tanto, el número total de clases dentro de las ontologías que
tratan, de una manera u otra, aspectos relacionados con dichas disciplinas y, por
tanto, que permitan representar el conocimiento inherente a ellas. Para esta sen-
cilla demostración se emplean diversas herramientas:
• Buscadores de fi cheros OWL y, en general, cualquier tipo de lenguaje para
ontologías:
— Swoogle (http://swoogle.umbc.edu/).
— Falcons (http://iws.seu.edu.cn/services/falcons/conceptsearch/index.jsp).
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
343

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
— Intellidimension (http://www.semanticwebsearch.com/query/?st=yss=ar
chitectureygo=search).
— Dr Watson (http://watson.kmi.open.ac.uk/editor_plugins.html).
• Repositorios de ontologías:
— OwlSight Ontology Repository (http://pellet.owldl.com/ontology- browse).
— OpenOntology Repository (http://ontolog.cim3.net/cgi-bin/wiki.
pl?OpenOntologyRepository).
— Tones (http://owl.cs.manchester.ac.uk/repository/).
Los resultados, plasmados en la fi gura 1, demuestran la poca formalización que
tiene la disciplina de Ingeniería de Puertos y Costas, al menos en «formato onto-
logía», en relación con el resto dentro de su misma área de actuación. Como es
bien sabido, no existen herramientas similares que permitan realizar este tipo de
búsquedas sobre tesauros.
FIGURA 1
Número de clases y subclases en ontologías sobre ingeniería
Esta búsqueda demuestra que nuestra ontología es única en su tipo, al menos
para los buscadores especializados. Con el fi n de evaluar Onto-Sactol se utiliza-
ron diversas métricas, sobre todo aquellas que facilitaran la evaluación de su
diseño y aplicación en los procesos extractivos y semánticos.
344 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
Se trata de una ontología de elevado nivel de complejidad, tanto por la te-
mática como por su desarrollo. Posee 6.284 conceptos en español y 23.546 ins-
tancias, formalizadas en OWL, al igual que los 89 axiomas que facilitan la estruc-
turación del conocimiento. Esta ontología posee, además, imágenes que están
asociadas a los conceptos, así como una estructura conceptual que deriva rela-
ciones paradigmáticas con un elevado nivel de complejidad, parecido a Wordned
y EuroWordned.
Los términos de la ontología están asociados a subclases que enuncian su
estructura semántica (término, sustantivo, adjetivo, homónimo, merónimo, hipó-
nimo, hiperónimo, etc.). Cada término defi nido como clase principal tiene aso-
ciada una propiedad que se denomina translate, es decir, un conjunto de equi-
valencias para ese término en inglés y alemán. Se prefi rió este camino al uso de
las anotaciones con el fi n de enriquecer las futuras búsquedas en otros idiomas.
A la vez, cada término tiene asociada una imagen, almacenada en el sistema
junto a su anotación, defi nida por las siguientes etiquetas:
Connotativo: información sobre lo que connota el objeto.
Denotativo: elementos que facilitan declarar aquellas características que se
declaran en la imagen: dimensiones, estado físico, técnica de reproducción
y obtención, etc.
Palabras clave.
URL: ubicación donde se encuentra ese archivo.
Autor: responsable del documento y de su información.
Datos onomásticos: personalidades, etc., incluidas en la imagen.
Datos topográfi cos: lugar físico de donde se ha tomado la imagen.
El sistema ontológico trabaja con textos estructurados en RDF Schema, y con
etiquetas que están en consonancia con la ontología, con lo que se facilita que
un sistema automático (generalmente llevado a cabo por autómatas) realice ac-
ciones concretas en el documento (localizar nuevos documentos, conectar enla-
ces a clases, etc.) (véase fi gura 2).
La ontología cuenta también con un modelo de desambiguación de textos aso-
ciado a partir de las palabras que se marcan en el texto. Dicho modelo, empleado
también para la recuperación de la información, se implementó con un sistema de
anotación constituido por el conjunto de metadatos Dublin Core junto a otro grupo
de etiquetas creadas ad-hoc que tienen como fi nalidad el facilitar los procesos de
recuperación, extracción, desambiguación y equivalencia semántica de los textos.
Este elevado nivel de complejidad obliga a que los procesos de evaluación de
la aplicación sean desarrollados de forma diferente a los propuestos hasta la fecha,
y ya comentados en el apartado 2 de este artículo. Se ha desarrollado un conjun-
to de medidas o métricas construidas a partir de las necesidades de los disímiles
procesos que asume esta gran ontología. Los indicadores de análisis de la ontología
se han desarrollado a partir de las mismas métricas que se conocen, pero se les
ha dado una connotación especial para adaptarlas a la aplicación que se desarrolla.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
345

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
FIGURA 2
Estructura sintáctica de los documentos de la ontología en RDF visualizada
a través del editor XMLSpy
5. Indicadores para la evaluación: análisis
Los indicadores para la evaluación de esta ontología están pensados para eva-
luar los objetivos de la misma dentro de un sistema de extracción y desambigua-
ción de textos, con el fi n de introducir mejoras para futuras aplicaciones y sistemas.
Para evaluar la ontología se han declarado indicadores léxicos, de recuperación
de la información, de la estructura sintáctica y una fase de constatación.
5.1. Indicadores
léxicos
Miden la calidad del léxico en lo referente a la cobertura temática, exhausti-
vidad de la anotación, redundancias semánticas, taxonomías ambiguas, capacidad
de desambiguación y capacidad de traducción. A continuación se declaran las
ecuaciones y la explicación de cada indicador:
346 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
Cobertura temática: una ontología tiene cobertura temática sufi ciente si for-
maliza la mayoría de los conceptos de la esfera del conocimiento que represen-
ta. En el caso de los sistemas que simbolizan una materia o conocimiento nuevo
habría que verifi car cuál es el nivel de alcance de la ontología en cuanto a con-
ceptos dentro de esta ciencia nueva. Se desarrolla con la fórmula Ct = CCO/CCM,
donde CCM representa las temáticas y CCO es la cantidad de conceptos que po-
see la ontología.
Exhaustividad de la anotación: valora el nivel de las anotaciones y su va-
lor semántico en el momento de representar la información. La fórmula emplea-
da es: EA = CNC/CN, donde EA es la exhaustividad de la anotación, CNC es la
cantidad de notas correctas y CN es la cantidad de notas de la ontología. Se en-
tiende que una anotación es correcta cuando describe correctamente el objeto al
que está asociado o cuando cumple de manera efi caz la función para la que se
creó, ya que hay anotaciones que no necesariamente deben servir para defi nir
conceptos. Dado que esta comprobación es un trabajo arduo y de difícil auto-
matización, se puede emplear una muestra representativa en lugar del análisis
de la ontología completa. Cuanto más se aproxime el resultado a 1 mejor des-
crita estará la ontología.
Redundancias semánticas: la fórmula usada es: RSE = CCA/CCO, donde
RSE son las redundancia semánticas, CCA la cantidad de conceptos ambiguos y
CCO representa a la cantidad de conceptos de la ontología. Se entiende que un
objeto es ambiguo cuando no está claramente defi nido su uso, no está bien ubi-
cado en la categoría que le corresponde, o cuenta con una descripción vaga. El
objetivo es que haya cero redundancias semánticas.
Capacidad de desambiguación: se calcula con la fórmula CDA = NTDA/NTD,
donde CA es capacidad de desambiguación, NTDA es el número de etiquetas
desambiguadas en un documento y NTD responde al número de etiquetas mar-
cadas en el documento. Para su aplicación se calcula la sumatoria de cada resul-
tado de cada etiqueta desambiguada, entre las etiquetas de cada uno de los do-
cumentos de la colección de estudio declarado.
Capacidad de traducción: es la capacidad que tiene el sistema de realizar
equivalencia en el texto con aquellos términos que poseen una etiqueta como
marca (en nuestro caso, esa propiedad es «translate»). Se denota aquí como CT =
= CTT/CTE, donde CTT es la cantidad de términos traducidos dividido entre la
cantidad de términos equivalentes (CTE). No se trata de una capacidad excesi-
vamente desarrollada en las ontologías, pero que se consideró importante en
función de los objetivos del proyecto dentro del cual se enmarca Onto-Satcol.
5.2. Indicadores de recuperación de información
Estos indicadores miden la efectividad de la ontología para recuperar infor-
mación relevante para el usuario, a partir de las medidas clásicas de recuperación
de la información: precisión y exhaustividad. Dado que estas medidas están pen-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
347

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
sadas para evaluar la recuperación de información, hemos desarrollado una va-
riación con el fi n de que se pueda adaptar específi camente a la ontología que
estamos analizando.
Precisión en la recuperación de documentos: esta medida estudia la ca-
pacidad del sistema para recuperar documentos relevantes a una petición de los
usuarios. La fórmula es PrecD = CDR /CDO, donde CDR es la cantidad de docu-
mentos recuperados y CDO la cantidad de documentos en la ontología.
Precisión en la recuperación de documentos de tipo 2: es la capaci-
dad de la ontología de devolver imágenes relativas a algún elemento lingüístico,
y se calcula con PrecD2 = CIR /CIO, donde CIR es la cantidad de imágenes re-
cuperadas y CIO es la cantidad de imágenes que han sido descritas en la onto-
logía.
Exhaustividad: es la proporción de material relevante recuperado, del total
de objetos relevantes de la ontología, y se calcula con la fórmula ExausD = DR/
/CDOst, donde DR es la cantidad de objetos relevantes a la solicitud y CDOst, es
la cantidad de objetos que existen sobre ese tema en la ontología.
5.3. Indicadores para la evaluación de la estructura sintáctica
Para evaluar la ontología a nivel sintáctico utilizamos Protex, una herramien-
ta desarrollada específi camente para este sistema de información. Protex (Domí-
guez, 2010) está desarrollado a partir de un algoritmo que genera un parser y
un analizador sintáctico escrito en Phyton, permitiendo la visualización de los
elementos de una taxonomía al igual que las herramientas Case (Computer Aided
Software Engineering) desarrolladas a tales efectos. El objetivo de esta fase del
análisis es la localización de incumplimientos en los estándares ontológicos como
OWL (Ontology Web Language), RDF (Resource Description Framework) y DAML
(Darpa Agent Markup Lenguaje). Protex fue creado con la fi nalidad de permitir
localizar los siguientes errores:
• Identifi cación de solapamiento en el desarrollo de clases
• Localización de conceptos vacíos
• Omisión de conocimiento disjunto
• Omisión de conocimiento por falta de exhaustividad
• Conceptos mal formulados
5.4. Adecuación de los requerimientos
Como en todo sistema ontológico que se evalúa, siempre se hace imprescin-
dible valorar los resultados del proceso. Para ello es obligatorio decidir si la on-
tología cumple claramente con los estándares internacionales y si los resultados
que arroja la investigación empírica tiene la validez necesaria para ser tomados
348 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
en cuenta De lo contrario habrá que comenzar desde el inicio para valorar las
defi ciencias.
6. Experimento
Para llevar a cabo la evaluación se han escogido a 6 expertos en el tema de
la Ingeniería de Puertos y Costas. En otros métodos, como los comentados an-
teriormente en el apartado 2, se suele elegir principalmente a expertos en onto-
logías antes que a expertos del área de conocimiento. Entendemos que esa opción
aporta una visión excesivamente sesgada de la evaluación, muy centrada en la
ontología y poco en el grado de concreción de la organización del conocimien-
to plasmada, y por eso hemos optado por esta otra. Ellos serán los que analiza-
rán los documentos y la estructura semántica de la ontología, y verifi carán la
precisión y la exhaustividad de cada una de las preguntas empleando los indi-
cadores anteriormente descritos. Para llevar a cabo su trabajo emplearon Protex
ya que, por un lado permite la navegación dentro de la ontología, y por otro
tiene implementados gran parte de los indicadores propuestos en este modelo,
por lo que puede generar los informes necesarios para proceder a la evaluación.
7. Resultados
7.1. Indicadores
léxicos
Se valoran a partir de los datos aportados por los observadores, analizando el
nivel de cobertura temática alcanzado en los nodos principales de la ontología.
Cada experto anota el número de nodos temáticos que cree se corresponden con
el dominio que representa. Los resultados han sido calculados de forma individual
para cada uno de los procesos, añadiendo una variación en la fórmula básica para
el cálculo fi nal. El cálculo de la cobertura temática (Ct = CCO/CCM) será la media
de resultados aportados por cada observador (Ct1=CCOb1/CCM). En nuestro caso,
el resultado fi nal ha sido 0,7 lo que indica que sólo un 70 % de los conceptos re-
lativos a ese dominio están representados conceptualmente en esa ontología (véa-
se tabla I). En parte es lógico este resultado, ya que la ontología está todavía en
proceso de creación, y aún no se ha terminado de vaciar una parte del corpus. La
inclusión de los conceptos que faltan implica, además, el establecimiento de rela-
ciones con los que ya existen, la creación de axiomas para facilitar su comporta-
miento y añadir la correspondiente anotación para la descripción y posterior recu-
peración. Por ejemplo, se constató con este indicador que una de las clases menos
desarrolladas era «Procesos naturales» (fi gura 3), que aglutina todos aquellos pro-
cesos que lleva a cabo la propia naturaleza, y que no ha sido estudiada del todo
en esta fase de creación de la ontología. Esto sucede especialmente con los «suce-
sos bióticos», la «abrasión», los «procesos hidrodinámicos» y los «eventos hidrológicos».
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
349


JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
TABLA I
Indicadores de Evaluación Léxica
Indicadores
Valor
Cobertura temática
0,7
Exhaustividad de la anotación
0,16
Redundancias semánticas
0,15
Capacidad de desambiguación
0,88
Capacidad de traducción
0,78
FIGURA 3
Representación gráfi ca de los nodos principales de la ontología por medio
de la herramienta Jambalaya
Aquellas clases que cuentan con muchas subclases ofrecen una representación formada por muchos cuadros
pequeños. Por el contrario, los cuadros grandes —caso de «procesos naturales», que aparece abajo a la derecha
y ampliado abajo a la izquierda— se muestran como un gran cuadrado vacío, lo que implica una mala repre-
sentación de la clase.
350 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
Para el cálculo de la exhaustividad en la anotación los expertos dividieron la
ontología en 6 secciones, y tenían como objetivo valorar todas las notas que no
estaban correctas. De las 23.546 instancias sólo 376 estaban correctas, lo que otorga
un valor de 0,16. Esto indica que las anotaciones no son efi cientes, lo que puede
impedir una buena recuperación de la información y provocar una baja relevancia.
Una parte de esas instancias son ejemplos de clases (por ejemplo, los diferentes
grados con los que se mide un terremoto en la escala Richter, o las denominacio-
nes para el oleaje —marejadilla, marejada, gruesa, arbolada, montañosa— en la
escala Douglas) y otra parte pueden ser clases que, con el fi n de agilizar las con-
sultas, en ocasiones se convierten en instancias, aunque su naturaleza siga siendo
la de clase. Esta técnica se emplea sólo en aquellas consultas en las que no sea
necesario inferir conocimiento, puesto que cuando una clase se convierte en ins-
tancia pierde la mayoría de las relaciones que la conectan con el resto de clases.
Para analizar las redundancias de signifi cado se utilizó la estructuración Sen-
se de la herramienta PROTEX, la cual brindó a los expertos la posibilidad de
visualizar los nodos para determinar, mediante etiquetado, aquellas redundancias
semánticas. El índice resultante fue de 0,15, lo que indica que el nivel de repre-
sentación en una buena cantidad de términos es relativamente bajo. Ese nivel de
ambigüedad conceptual es muy importante, y posiblemente esté debido a la ex-
tensión de la ontología, lo que nos indica que es necesario hacer cambios en la
estructura de la misma con el fi n de tener mejores resultados. No obstante, de-
pendiendo del nivel de profundidad de los nodos se observaba una varianza
evidente en cuando a la ambigüedad se refi ere. Esto podía ser debido a que
algunas subáreas de conocimiento estaban mal representadas, pero no todas (fi -
gura 3). Por ese motivo realizamos un test de desambiguación.
Con el fi n de conocer si la ontología se podría emplear como herramienta para
desambiguar textos especializados se han seleccionado 50 documentos de ese tipo
debidamente etiquetados con RDF. En cada uno de ellos se han marcado palabras
clave, así como verbos, sustantivos, adjetivos y frases semánticas. Los textos fueron
sometidos a desambiguación, por medio de la opción correspondiente de la he-
rramienta Protex. De las 890 palabras marcadas en cada texto se desambiguaron
789, con un nivel de desambiguación de 0,88, lo que indica que el sistema es
bastante fi able en cuanto a desambiguación y trasformación del corpus.
Para el estudio de la capacidad de traducción se analizaron 50 textos, en los
cuales aparecían 150 marcas de equivalencia, que permitieron la traducción de
118 términos, lo que evidencia que se consigue un índice elevado de traducción,
0,78, en función de la muestra.
7.2. Precisión en la recuperación de documentos
Para analizar este indicador se pidió a los expertos que realizaran 15 búsquedas
en el sistema y que midieran la relevancia de los documentos recuperados. Con el
fi n de difi cultar más el proceso, y aumentar el riesgo de ruido, las consultas estaban
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
351

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
formadas por un único término. El resultado fue que de los 2.890 documentos de
media recuperados, 2.345 de media eran relevantes, evidenciando un elevado nivel
de relevancia, un valor medio de 0.81. En cuanto a la recuperación de docu mentos
de tipo dos, es decir, material no textual, se recuperaron todas las imágenes del
sistema para las 15 peticiones, aportando un valor de 1. Esto indica que el sistema
es confi able en lo que respecta a precisión cuando recupera material no textual.
7.3. Indicadores de evaluación de la estructura sintáctica
La herramienta empleada para estos cálculos, Protex, descubrió la existencia
de 26 clases que poseen un nombre diferente, pero un contenido (expresado en
la anotación) similar, por tanto, se solapan. Se han visualizado 69 conceptos va-
cíos, es decir, con errores de signifi cado, eso crea problemas semánticos y hace
más compleja la taxonomía. En la ontología se han encontrado 89 errores al tra-
tar conocimiento disjunto y 67 conceptos macro, que poseen igual número de
sub-conceptos con igual estructura jerárquica. De igual forma aparecen 67 pro-
blemas por conceptos mal descritos por falta de calidad en la exhaustividad en
la descripción de los documentos (tabla II). Para solucionar de manera automa-
tizada estos problemas se está analizando la posibilidad de integrar en el sistema
ORE-Tool (Ontology Repair and Enrichment), de la Universidad de Leipzig, que
permite depurar inconsistencias y crear axiomas de manera automática.
TABLA II
Problemas de sintaxis y semántica. Se muestra el número de clases
que han presentado problemas después del cálculo realizado con Protex
y el porcentaje que supone esas clases erróneas con respecto al número total
de clases de la ontología
Conceptos
Conocimiento
Conceptos
Descripciones
Clases solapadas
vacíos
disjunto
macro
erróneas
0,11
0,14
0,11
0,11
0,04
69
89
67
67
26
Este experimento no puede terminar hasta que no exista una verifi cación de
la exactitud de los datos y la calidad de los mismos. Para ello se decidió formu-
lar algunas preguntas que facilitarán la detección de los conceptos, la traducción
y la desambiguación. Estas preguntas fueron las siguientes:
1. ¿Cuáles son los efectos que produce la marea en la costa de Cantabria?
2. ¿Cuáles son las centrales azucareras más contaminantes de Cuba?
3. ¿Con qué sustancia química se hace la espectrografía de gases?
352 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
4. ¿Cuáles son las zonas geográfi cas de menor desarrollo portuario?
5. ¿Cuál es la traducción del término «rompiente de derrame» en alemán?
6. ¿Cuál es su contexto de aplicación?
7. ¿Cuántas imágenes de derrame de petróleo existen en la ontología?
Los resultados de estas preguntas demostraron valores muy similares a los
observados durante los experimentos, con lo que queda demostrada la veracidad
de la información proporcionada por el experimento. Las respuestas a estas inte-
rrogantes fueron contestadas por la ontología con los siguientes niveles (tabla III).
TABLA III
Nivel de respuesta del sistema en la fase de adecuación
Exhaustividad
Precisión
Pregunta 1
0,5
0,832
Pregunta 2
0,3
0,901
Pregunta 3
0,5
0,700
Pregunta 4
0,7
0,892
Pregunta 5
0,1
0,823
Pregunta 6
0,1
0,992
Pregunta 7
0,2
0,657
8. Conclusiones
Estamos ante un modelo de evaluación de ontología que, si bien emplea con-
ceptos clásicos en el desarrollo de las ontologías, también aporta nuevos paráme-
tros para el quehacer de las evaluaciones de estos sistemas. Máxime si represen-
tan el conocimiento de dominios noveles, construidos a partir de otras disciplinas.
Los dos principales problemas detectados en los sistemas de evaluación em-
pleados en la actualidad se centran en un exceso de peso por parte de las apor-
taciones de los observadores, y en contar con una visión centrada únicamente
en una o dos dimensiones del problema ontológico. El modelo propuesto aquí
emplea diferentes criterios para evaluar parámetros relacionados con cuestiones
léxicas (midiendo la cobertura temática, la anotación, las redundancias semánticas,
la capacidad de desambiguación y la de traducción), de recuperación de infor-
mación y de la estructura sintáctica. Es decir, que se aporta una visión que con-
templa las tres dimensiones de una ontología.
Este modelo de evaluación ha permitido desarrollar nuevas formas de reco-
nocer en la ontología patrones de relevancia semántica y establecer equivalencias
para la traducción y desambiguación.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
353

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
Aunque el proceso de evaluación de la ontología no se suele contemplar en
muchas de las metodologías para la construcción de ontologías, los resultados
de la evaluación permiten conocer los errores del sistema antes de su puesta en
marcha, por lo que entendemos que debería de formar parte de ésta, favorecien-
do la construcción por medio de la retroalimentación.
Por otra parte, pensamos que queda patente la necesidad de contar con he-
rramientas que faciliten el proceso de evaluación. Si bien es cierto que en la
mayoría de métodos propuestos este apartado no se suele tocar demasiado, es
impensable realizar el proceso de la evaluación de manera manual. En nuestro
caso la aplicación Protex, creada específi camente para este proyecto, se ha per-
fi lado como un instru mento fundamental en el marcado automático de errores
en la ontología y la visualización de los nodos y los conceptos. Esto ha facilita-
do la eliminación de inconsis tencias semánticas, estructurales y ambigüedades en
los conceptos de la ontología.
Como trabajo futuro, y no necesariamente relacionado con el proceso de
evaluación, será imprescindible seguir desarrollando la ontología Onto-Satcol, ya
que ha quedado patente que cuenta con numerosas inconsistencias semánticas
que ponen el peligro su puesta en marcha dentro de un sistema de mayor cala-
do. Por otra parte, se hace necesario minimizar su complejidad, ya que puede
ser causante de un hecho que no ha sido contemplado en esta evaluación, pero
que se planteará en una revisión del modelo propuesto. Se trata del tiempo que
el sistema tarda en dar respuesta a las preguntas de los usuarios.
Es evidente que existen y existirán muchas formas para evaluar las ontologías.
Sin embargo será necesario que estos mecanismos de evaluación vayan en bus-
ca de análisis integrales de los sistemas ontológicos, de manera que los mismos
puedan ser valorados en su totalidad. Las ontologías de dominios de conocimien-
to nuevo tienen que buscar mejores formas de presentación para que su repre-
sentación cognitiva sea cada vez más apegada a las necesidades de los futuros
usuarios. Es por ello que en los nuevos métodos de evaluación el usuario fi nal
debe tener una marcada interacción en los procesos evaluativos.
9. Agradecimientos
Este artículo forma parte del proyecto de investigación FFI2008-06080-C03-01,
subvencionado por el Ministerio de Ciencia e Innovación, España.
10. Bibliografía
Boehm, B. W. (1981): Software Engineering Economics. New York; Prentice-Hall.
Brank, J.; Grobelnik, M., y Mladenic, D. (2005): A survey of ontology evaluation techniques.
Paper presented at the SIKDD 2005 at multiconference IS 2005, Ljubljana, Slove nia.
http://eprints.pascal-network.org/archive/00001198/01/BrankEvaluationSiKDD2005.pdf.
354 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Modelo para la evaluación de ontologías. Aplicación en Onto-Satcol
Brewster, C.; Alani, H.; Dasmahapatra, S., y Wilks, Y. (2004): Data Driven Ontology Eva-
luation. Paper presented at the Proceedings of the Language Resources and Evaluation
Conference (LREC 2004),
Lisboa, Portugal.
Domíguez, S. (2010): PROTEX (Version beta) [Lematizador]. Santa Clara, Cuba: Universidad
Central de las Villas, Departamento de automática.
Evermann, J. E., y Fang, J. (2010): Evaluating ontologies: Towards a cognitive measure of
quality. Information Systems, vol. 35, 391-403.
Fahad, M., y Abdul Qadir, M. (2008): A Framework for Ontology Evaluation. Paper pre-
sented at the Supplementary Proceedings of the 16th International Conference on
Conceptual Structures (ICCS’08),
Toulouse, France. http://ftp.informatik.rwth-aachen.
de/Publications/CEUR-WS/Vol-354/p59r.pdf.
Fellbaum, C. (1998): WordNet – An Electronic Lexical Database. Massachusetts: MIT-Press.
Fernández-Breis, J. T.; Egaña Aranguren, M., y Stevens, R. (2009): Quality evaluation fra-
mework for bio-ontologies. Paper presented at the ICBO: International Conference on
Biomedical Ontology,
Buffalo: New York.
Fernández-López, M.; Gómez-Pérez, A., y Juristo, N. (1997): Methontology: from ontolo-
gical art towarads ontological engineering. Paper presented at the Spring Symposium
on Ontological. Engineering of AAAI,
California.
Gangemi, A.; Catenacci, C.; Ciaramita, M., y Lehmann, J. (2005): A Theoretical Framework
for Ontology Evaluation and Validation.
Gómez Pérez, A. (1994): Some Ideas and Examples to Evaluate Ontologies. Conference
paper at an IEEE Event.
Grunninger, M., y Fox, M. S. (1995): Methodology for the Design and Evaluation of On-
tologies. Paper presented at the Workshop on Basic Ontological Issues in Knowledge
Sharing, IJCAI-95,
Montreal.
Guarino, N., y Welty, C. (2002): Evaluating Ontological Decisions with OntoClean. Com-
munications of the ACM, vol. 45 (2), 61-65.
Hartmann, J.; Spyns, P.; Giboin, A.; Maynard, D.; Cuel, R.; Suárez-Figueroa, M. C., y otros.
(2005): D1.2.3 Methods for ontology evaluation, Knowledgeweb.
Kent, A. (1955): Machine literature searching. VIII. Operational Criteria for Designing In-
formation Retrieval Systems. American Documentation, vol. 6 (2), 93-101.
Kuhn, T. (1979): The structure of scientifi c revolutions. Chicago: University of Chicago Press.
Leiva-Mederos, A.; Senso, J. A.; Domínguez-Velasco, S., e Hípola, P. (2009): An Automat
for the Semantic Processing of Structured Information. Paper presented at the Inter-
national Conference on Intelligent Systems Design and Applications.

Lozano-Tello, A., y Gómez-Pérez, A. (2004): ONTOMETRIC: A method to choose the
appropriate ontology. Journal of Database Management, vol. 15 (2).
Maedche, A.; Motik, B.; Stojanovic, L.; Studer, R., y Volz, R. (2003): Ontologies for Enter-
prise Knowledge Management. EEE Intelligent System, 26-34.
Maedche, A., y Staab, S. (2002): Measuring Similarity between Ontologies. Paper presen-
ted at the In: Proc. of the European Conference on Knowledge Acquisition and Ma-
nagement – EKAW-2002,
Madrid: Spain.
Maiga, G., y Ddembe, W. (2008): A Systems Approach to User Evaluation of Biomedical
Ontologies Paper presented at the First International Workshop on Ontologies in In-
teractive Systems.

Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788
355

JOSE A. SENSO, AMED ABEL LEIVA-MEDEROS, SANDOR EDUARDO DOMÍNGUEZ-VELASCO
Ning, H., y Shihan, D. (2006): Structure-Based Ontology Evaluation. Paper presented at
the International Conference on e-business on Engineering.
Obrst, L.; Werner, C.; Inderjeet, M.; Ray, S., y Smith, B. (2007): The Evaluation of Ontolo-
gies: Toward Improved Semantic Interoperability. En C. J. O. Baker & K.-H. Cheung
(Eds.), Semantic Web: Revolutionizing Knowledge Discovery in the Life Sciences: Springer.
Paslaru Bontas, E., y Mochol, M. (2005): A Cost Model for Ontology Engineering. En
F. U. Berlin (Ed.).
Qadir, M., y Noshairwan, W. (2007): Warnings for Disjoint Knowledge Omission in On-
tologies. Paper presented at the Second International Conference on internet and Web
Applications and Services (ICIW07).

Ramos, E.; Núñez, H., y Casañas, R. (2009): Esquemas para evaluar ontologías únicas para
un dominio de conocimiento. Revista Venezolana de Información, Tecnología y Co-
cocimiento,
vol. 6 (1), 57-71.
Sabou, M.; López, V.; Motta, E., y Uren, V. (2006): Ontology Selection:Ontology Evaluation
on the Real Semantic Web. Paper presented at the WWW2006, Edimburgo.
Salton, G.; Wong, A., y Yang, C. S. (1975): A Vector Space Model for Automatic Indexing.
Communications of the ACM, vol. 18 (11), 613-620.
Spyns, P. (2005): EvaLexon: Assessing triples mined from texts. Bruselas.
Staab, S. (2004): Why Evaluate Ontology Technologies? Because It Works! IEEE Intelligent
Systems.
Uschold, M., y King, M. (1995): Towards a Methodology for Building Ontologies. Works-
hop on Basic Ontological Issues in Knowledge Sharing.
Yao, H.; Mark, A.; Orme, M., y Etzkorn, L. (2005): Cohesion Metrics for Ontology Design
and Application. Journal of Computer Science, vol. 1 (1), 107-113.
Yu, J.; James, A. T., y Tam, A. (2009): Requirements-oriented methodology for evaluating
ontologies. Information Systems, vol. 34, 766-791.
Zhang, T.; Xu, D., y Chen, J. (2008): Application-oriented purely semantic precision and
recall for ontology mapping evaluation. Knowledge-Based Systems, vol. 21, 794-799.
356 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 334-356, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.788

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 357-384, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
Mejora del rango dinámico en la digitalización
de documentos desde una perspectiva patrimonial:
evaluación de métodos de alto rango dinámico (HDR)
basados en exposiciones múltiples

Jesús Robledano Arillo*
Resumen: Uno de los principales problemas de calidad en la digitalización de documen-
tos, especialmente de carácter gráfi co, es la falta de rango dinámico en los dispositivos
de captura. Una posible vía de trabajo para evitarlo es la aplicación de técnicas de
alto rango dinámico (HDR) basadas en la fusión de múltiples capturas tomadas a di-
ferentes exposiciones. Si se demuestra la idoneidad de estas técnicas en el contexto
del patrimonio documental, podrían obtenerse capturas digitales de gran calidad con
el empleo de equipamiento de menor coste y fácilmente asequible para instituciones
con pocos recursos económicos. En este trabajo se realiza una aproximación teórica
y experimental al concepto y métodos de evaluación de la calidad en la digitalización
de documentos, la incidencia en la calidad del rango dinámico, y la viabilidad del uso
de técnicas HDR en la digitalización de documentos con valor patrimonial.
Palabras clave: digitalización de documentos, fotografía, rango dinámico, alto rango di-
námico (HDR), calidad, evaluación de calidad, patrimonio cultural.
Dynamic range improvement in document digitization from a cultural
heritage perspective: assessment of high dynamic range (HDR)
methods based on multiple exposures

Abstract: One of the main quality problems in document digitization, especially with
graphic documents, is the low dynamic range of the capture devices. A possible way to
avoid this problem is to apply high dynamic range (HDR) techniques based on multiple
exposures. If these techniques prove to be suitable for the digitization of documents in
the context of cultural heritage, it should be possible to obtain high quality digital
captures while employing lower cost equipment, affordable enough for institutions with
limited resources. In this paper we offer a theoretical and experimental approach to the
concept and methods involved in the quality assessment of document digitization, the im-
pact of dynamic range on image quality, and the viability of HDR techniques in the
context of cultural heritage.

Keywords: document digitization, photography, dynamic range, high dynamic range
(HDR), quality, quality assessment, cultural heritage.
* Departamento de Biblioteconomía y Documentación. Universidad Carlos III de Madrid. Correo-e:
jroble@bib.uc3m.es.
Recibido: 09-11-2010; 2.ª version: 21-02-2011; aceptado: 24-02-2011.
357

JESÚS ROBLEDANO ARILLO
1. Introducción
Este artículo presenta, de forma sintética, el contenido del informe de inves-
tigación realizado tras el trabajo que aquí divulgamos, por lo que recomendamos
el acceso a este informe a los lectores interesados en una descripción en mayor
profundidad de los conceptos técnicos, metodología, aplicaciones y resultados1.
El objeto de estudio son las técnicas de mejora del rango dinámico en las cap-
turas digitales de documentos que se caracterizan por tener un elevado margen
de densidades.
En digitalización de documentos, el margen de densidades es una variable
que representa el rango de intensidades de luz —valores de radiancia— que se
refl ejan o transmiten desde las superfi cies a digitalizar. El rango dinámico del
dispositivo de captura es un parámetro físico que representa la capacidad del
dispositivo para poder registrar correctamente ese rango de intensidades de luz
en una imagen digital. El registro correcto de márgenes de densidades altos en
una imagen digital requiere el empleo de dispositivos de digitalización que cuen-
ten con un alto rango dinámico; pero los dispositivos de captura digital con
rangos dinámicos muy altos tienen un elevado coste, desbordando en muchas
ocasiones la capacidad adquisitiva de instituciones que deben hacer frente a la
digitalización de determinados tipos de documentos que requerirían este tipo de
herramientas, como son los documentos fotográfi cos u obras de arte. En caso
de no poder disponer de ellas, se hace preciso acudir al empleo de técnicas de
mejora del rango dinámico como alternativa. Estas técnicas introducen métodos
de captura y procesamiento digital que permiten extender el rango dinámico del
dispositivo, de forma que se puedan obtener unos niveles de calidad en las imá-
genes digitales de los documentos similares a los que se obtendrían con los dis-
positivos de mayor coste. Por ello, creemos necesario dar a conocer las técnicas
de mejora de rango dinámico entre los profesionales de la custodia y difusión
del patrimonio documental y artístico, así como proponer pautas para su aplica-
ción que estén amparadas en resultados de investigación rigurosos, de tal mane-
ra que muchas de las instituciones que actualmente están digitalizando fondos
patrimoniales puedan benefi ciarse.
Dentro de las técnicas de mejora del rango dinámico, una vía interesante de
trabajo para el campo de la digitalización de patrimonio documental son aquellas
que podemos englobar dentro de lo que se suele denominar como Alto Rango
Dinámico o, de forma abreviada, como HDR (High Dynamic Range). Estas técni-
cas se basan en la fusión en una única imagen digital de varias capturas tomadas
con diferentes valores de exposición. Mediante HDR se hace posible incrementar
el rango dinámico en dispositivos de captura que permiten variar el nivel de ex-
1 El informe puede ser accedido en el Archivo Abierto de la Universidad Carlos III de Madrid.
URI: http://e-archivo.uc3m.es/handle/10016/9515. Todos los fi cheros de imagen digital aplicados
en el estudio pueden ser accedidos en la siguiente URL: http://rayuela.uc3m.es/~jroble/HDR/ima-
genes.htm.
358
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
posición óptica —la cantidad de luz que incide sobre el sensor— durante la toma
de la imagen. A lo largo de este estudio, vamos a denominar de forma abreviada
como HDR a las imágenes obtenidas por este procedimiento y LDR (Low Dynamic
Range
– Bajo Rango Dinámico) a las imágenes obtenidas mediante una única ex-
posición aplicando procedimientos convencionales de captura y proceso no HDR.
Las técnicas de HDR aplicadas a la captura y registro de imágenes cuyos
márgenes de intensidades de luz desbordan la capacidad de los equipos conven-
cionales se vienen empleando, cada vez más en los últimos años, en fotografía
digital, tanto en el campo amateur como profesional; también han sido objeto
de amplia atención por parte de la comunidad científi ca. Podemos encontrar
descritas técnicas HDR con esta fi nalidad desde los comienzos de la tecnología
de la imagen digital, con una alta producción de trabajos científi cos desde me-
diados de la década de 1990 (Burt y Kolczynski, 1993; Debevec y Malik, 1997;
Mann y Picard, 1995); aunque este tipo de intentos, en lo que respecta a proce-
dimientos de captura automáticos, se iniciaron hacia mediados del siglo XIX, pocos
años después de la invención y difusión de la fotografía físico-química (McCann,
2008). Nos encontramos ya en nuestros días con una tecnología HDR aplicada a
la imagen digital lo sufi cientemente madura y con varios productos comerciales
o de uso libre de gran calidad. Sin embargo, no hemos detectado planteamientos
sistemáticos para su utilización en el campo de la digitalización de patrimonio
documental, ni siquiera para la mejora de la captura digital de documentos que
debido a sus características gráfi cas intrínsecas no se capturan correctamente con
dispositivos convencionales o de coste asequible.
La digitalización del patrimonio documental debe regirse por unos requisitos
que garanticen la máxima fi delidad en el registro de información gráfi ca, por ello,
el uso de cualquier técnica debe ser minuciosamente estudiada para garantizar
el cumplimiento de aquellos. La fi nalidad del trabajo que aquí presentamos es
tratar de determinar la viabilidad de las técnicas HDR ante casos de documentos
que presentan amplios márgenes de densidades y, en consecuencia, para los que
es difícil o muy costoso encontrar dispositivos que permitan conseguir capturas
de calidad sin emplear este tipo de técnicas. Hemos validado su idoneidad em-
pleando conjuntamente parámetros de medida y métricas objetivas junto a eva-
luación visual subjetiva. A través de nuestro trabajo también proponemos una
metodología que puede ser apropiada para investigar la validez de las técnicas
HDR en el campo de la digitalización del patrimonio documental y utilizamos
esta metodología para la evaluación de una aplicación HDR concreta.
Debido a la amplia variedad de productos para generar imágenes HDR en el
mercado, hemos seleccionado uno de los más utilizados, por estar integrado en
el conocido y extendido editor profesional de imágenes Adobe Photoshop CS;
en concreto la función Combinar para HDR de la versión CS4. Vamos a abordar
el empleo de HDR con documentos cuyos márgenes de densidades no son muy
altos, no más de 2,6 D. No obstante, estos márgenes de densidades permiten
cubrir buena parte del patrimonio documental y artístico custodiado en archivos,
bibliotecas y museos; especialmente aquellos documentos de soporte opaco que
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
359

JESÚS ROBLEDANO ARILLO
se capturan mediante luz refl ejada: fotografías, documentos manuscritos e impre-
sos y obras de arte sobre papel, pergamino, tela y soportes similares.
En este estudio nos movemos en el contexto de la calidad de las digitaliza-
ciones de documentos. En los últimos años asistimos a una amplia producción
científi ca en el campo del control de calidad de dispositivos de captura digitales,
que de forma gradual está incorporándose en el contexto de la digitalización de
patrimonio documental (Frey y Reilly, 2006; Berns y Frey, 2006; Williams, 2002;
Williams, 2003; Kenney y Rieger, 2000; Stelmach, 2010). Un ejemplo de aplicación
real en este campo lo tenemos en las especifi caciones técnicas de NARA (U.S.
National Archives and Records Administration) (Puglia y otros, 2004) o en el GAP
Analysis
(Still Image Working Group, 2010), en los que se han llegado incluso a
identifi car aquellos aspectos tecnológicos relacionados con el control de calidad
en las digitalizaciones de patrimonio documental que deben ser mejorados y
recibir más atención por parte de la comunidad científi ca. Otro trabajo relevante
al respecto lo tenemos en el campo de la normalización de métodos y cartas de
control, donde es especialmente activo el Grupo ISO/TC42. De este grupo han
emanado importantes estándares (ISO, 2000; ISO 2003a; ISO, 2003b; ISO, 2004a;
ISO, 2004b; ISO, 2009a; ISO, 2009b; Loebich y Wueller, 2001; Williams, 2003). En
este sentido, es importante la iniciativa para la creación de una carta unifi cada
estandarizada a partir de la cual se puedan evaluar todos los parámetros físicos
relevantes para medir la calidad de un dispositivo de captura: la Universal Test
Target
(Wueller y otros, 2009). La investigación en métodos de evaluación de
rendimiento en equipamiento de captura digital de imágenes se ha visto incre-
mentada signifi cativamente en los últimos años desde los campos de la Ciencia
y Tecnología de la Imagen (Wueller, 2006; Loebich y otros, 2007). Todo este tra-
bajo ha dado sus frutos también como implementación y comercialización de
paquetes de aplicaciones software y cartas de control normalizadas para poder
realizar de forma relativamente sencilla la evaluación, tales como IE Analyzer de
Image Engineering2, Golden Thread de Image Science Associates3 e Imatest4.
2. El problema de un rango dinámico insufi ciente
para la calidad de la digitalización
El rango dinámico se calcula restando las densidades óptica máxima y míni-
ma que el dispositivo de captura puede registrar con calidad. La densidad óptica
alude a la capacidad de una superfi cie para retener parte de la luz que incide
sobre ella, y se expresa como:
Densidad óptica = –log del factor de transmisión o de refl exión
10
2 Sitio Web en http://www.image-engineering.de/index.php?option=com_content&view=article
&id=137&Itemid=50.
3 Sitio Web en http://www.imagescienceassociates.com/.
4 Sitio Web en http://www.imatest.com/.
360
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
siendo el factor de transmisión el cociente entre el fl ujo luminoso que transmite
un cuerpo transparente y el fl ujo incidente, y el factor de refl exión el cociente
entre el fl ujo luminoso refl ejado por un cuerpo opaco y el fl ujo incidente.
En general, el rango dinámico de un dispositivo de captura idóneo para la
digitalización de la superfi cie de un documento debe ser igual o mayor que el
rango de densidades de esa superfi cie. El rango o margen de densidades se cal-
cula mediante la resta de la máxima y mínima densidad óptica de la superfi cie
a capturar. Los problemas de calidad en las imágenes debidos a escasez de ran-
go dinámico pueden ser realmente graves: o bien no se captura toda la informa-
ción gráfi ca del documento, o parte de esta información queda registrada de
forma defectuosa, limitándose en gran medida las posibilidades de uso posterior
de las imágenes digitales.
Los principales defectos que muestran las imágenes capturadas con poco rango
dinámico son la posterización y el recorte tonal de luces o sombras; ambos suelen
presentarse de forma conjunta. La posterización —también denominada como ar-
tefactos de cuantización— se produce cuando un conjunto determinado de valores
tonales diferenciados —intensidades de luz— adyacentes o cercanos, tomados de
una escena o documento a capturar digitalmente, se intenta representar mediante
un número más reducido de valores digitales en la imagen resultante de su cap-
tura; esto es, la entrada de valores tonales en el dispositivo de captura es mayor
que su salida en la imagen digital. Como resultado de la posterización, las grada-
ciones tonales sutiles de una imagen se ven sustituidas por zonas de tono unifor-
me a modo de bandas o manchas de extensión variable, que se pueden hacer bien
visibles al ojo humano si su incidencia es alta. La posterización no es algo que
afecta sólo a capturas digitales a bajas profundidades de bits (8 bits o menos por
canal de color); desgraciadamente, es frecuente incluso que se produzca en las
capturas digitales a altas profundidades de bits, como es el caso de las imágenes
de prueba realizadas para este estudio, que han sido capturadas a 16 bits por cada
canal de color RGB. En este tipo de capturas la posterización se produce cuando
zonas importantes de información gráfi ca de la imagen original se capturan con
valores tonales excesivamente oscuros para el límite de rango dinámico concreto
del dispositivo de captura que se está usando. El sensor del dispositivo de captu-
ra recibe de esas zonas menos luz y las registra, consiguientemente, subexpuestas
y posterizadas. La posterización de las zonas tonales más oscuras se produce en
los dispositivos digitales debido a la asignación lineal de bits a los diferentes rangos
de intensidad de luz que se aplica durante el momento de la conversión analógi-
ca digital, a pesar de que la información luminosa decrece de forma logarítmica
con la exposición. Esto provoca que un rango tonal determinado, a medida que
se va llevando a las zonas de sombra durante la captura, se vaya comprimiendo
con respecto a la escala lineal de asignación de bits y, consecuentemente, recibien-
do menor número de bits para su descripción, y, por tanto, habiendo una menor
posibilidad de que se le asignen valores tonales en la imagen digital fi nal.
Además, al efecto de la posterización hay que sumar el recorte tonal provo-
cado por la escasez de rango dinámico, que se produce en los tonos de sombra
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
361


JESÚS ROBLEDANO ARILLO
cuya escasa intensidad de luz desborda la capacidad de detección del sensor: la
información gráfi ca correspondiente a esos tonos desaparece en el registro de la
imagen quedando registrado un único valor para esas zonas. Si a estos dos pro-
blemas sumamos la mayor incidencia de ruido al aplicarse a la imagen las co-
rrecciones de gamma y de contraste necesarias para su visualización, la calidad
de la captura quedará seriamente en entredicho.
Para mejorar la comprensión de los defectos que queremos medir incluimos
la fi gura 1, que muestra la comparativa de la captura de una zona con informa-
ción tonal de alta densidad de una fotografía junto con los parches más densos
de la escala de parches de densidad Q13 de Kodak. La primera fi la muestra la
captura subexpuesta, con dos valores de exposición menos de lo que le corres-
pondería; la segunda fi la muestra lo mismo pero con una exposición normal. Los
defectos aparecen señalados. En la exposición normal hay posterización, pero su
incidencia es menor que en la subexposición, debido a que el sensor del dispo-
sitivo de captura recibe más luz de las zonas de alta densidad.
FIGURA 1
Comparativa de incidencia de problemas de rango dinámico en función de
diferentes valores de exposición
362
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
3. La aportación de las técnicas HDR
El HDR se basa en realizar diferentes imágenes de la escena o documento a
digitalizar. Cada imagen se realiza con un valor de exposición distinto, de forma
que se asegure que cualquier nivel de intensidad de luz de la captura quede
registrado con calidad sufi ciente al menos en alguna de ellas. A partir de este
conjunto de imágenes se calcula una nueva imagen con un rango dinámico muy
amplio. La posterización y recorte de información en las zonas más oscuras se
evita aprovechando su mejor descripción, gracias a una mayor asignación de bits,
en las imágenes que son sobreexpuestas en la captura.
Para el almacenamiento del fi chero máster HDR, que es producto de la fusión
de las múltiples exposiciones, se usan formatos específi cos que permiten registrar
en una única imagen HDR toda la información capturada en las diferentes tomas.
Su profundidad de bits puede llegar a ser muy alta, como en el caso del TIFF
de coma fl otante, hasta 96 bits. Las imágenes representadas en estos fi cheros no
son visibles directamente en monitores convencionales debido a su limitada razón
de contraste y gama de colores, por lo que es necesario emplear lo que se de-
nomina como métodos de compresión de luminancias o de mapeo tonal (tone
mapping
) y de mapeo de gama (gamut mapping) (Mantiuk y otros, 2005). Me-
diante el mapeo tonal las imágenes pasan a una versión LDR para su visualización
e impresión, con una profundidad de bits de 16 u 8 bits por canal. Es durante
el proceso de mapeo cuando se selecciona del total de tonos de luz y color cap-
tados en el rango dinámico aquellos que van a ser incluidos en el margen de
densidades y espacio de color del dispositivo de visualización o impresión.
4. Metodología
4.1. Primera fase. Captura digital y procesado HDR y LDR
Hemos utilizado una cámara fotográfi ca digital réfl ex de formato pequeño de
gama media-alta, en concreto la Canon EOS 5D. Se trata de un modelo de cá-
mara de coste medio, profesional, con una relación calidad/precio equilibrada y
asequible, típica de centros o instituciones con pocos recursos. Las capturas se
han realizado en fi cheros con formato RAW nativo de la cámara, que posterior-
mente han sido procesados en un editor Adobe Photoshop CS4, mediante el
plugin Adobe Camera RAW.
Se han digitalizado dos grupos de documentos (denominados, respectivamen-
te, grupo 1 y grupo 2). De cada grupo se han hecho dos capturas (denominadas,
respectivamente, imagen 1 e imagen 2). Las capturas del primer grupo contienen:
• Carta Q13 y carta Q14, ambas de Kodak, para la evaluación del rendimien-
to en el registro tonal mediante los parámetros físicos de rango dinámico,
gamma, contraste y ruido.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
363

JESÚS ROBLEDANO ARILLO
• Carta Colorchecker mini de X-rite, para la evaluación del rendimiento en el
registro del color.
• Dos cartas para prueba MTF, para la evaluación del rendimiento en el re-
gistro del detalle espacial de forma objetiva mediante la aplicación de una
función MTF.
• Carta PM-189, construida de acuerdo a las recomendaciones de la norma
ANSI (ANSI/AIIM, 1988), para la evaluación del rendimiento en el registro
del detalle espacial de forma subjetiva, mediante evaluación visual.
Las capturas del segundo grupo contienen elementos de control y testigos
con unas características gráfi cas comunes a documentos típicos de patrimonio
documental gráfi co fotográfi co:
• Carta de acuerdo al estándar IT.8 refl ectante de Kodak.
• Carta Colorchecker mini.
• Cartas Q13 y Q14 de Kodak.
• Fotografías en blanco y negro modernas, con un margen de densidades
típico, ligeramente superior a 2 D.
• Fotografía en monocromo histórica, de principios del siglo XX, iluminada a
mano con anilinas.
• Fotografías en color cromógeno contemporáneas.
• Testigo con un amplio margen de densidades, consistente en una diaposi-
tiva en color capturada como si fuera material refl ectante. Este testigo per-
mite medir el comportamiento del HDR en zonas de densidad muy altas
pero con mucho detalle gráfi co espacial.
Los procedimientos fotográfi cos seleccionados para las muestras son habitua-
les en muchos fondos fotográfi cos patrimoniales. Se ha pretendido incorporar en
las capturas de prueba elementos que permitan evaluar visualmente y objetiva-
mente los diferentes parámetros de rendimiento que se han incluido en el estudio.
La duplicación de capturas que se hace en cada uno de los grupos corresponde
a la necesidad de cotejar que el rendimiento de la técnica HDR sea constante
captura a captura, y, por consiguiente, los resultados consistentes.
Por cada una de las imágenes de cada grupo se ha generado una versión en
HDR, producto de la fusión de ocho tomas realizadas con diferentes valores de
exposición. Las exposiciones se han separado entre sí por un Valor de Exposición
(un paso de diafragma). Estas capturas se ajustan bien al ratio de contraste de las
imágenes de prueba con mayor margen de densidades, que es de aproximada-
mente 400:1. El formato de los fi cheros HDR es TIFF de coma fl otante de 32 bits
por canal de color. A partir de cada uno de los cuatro fi cheros HDR máster, se ha
generado una versión LDR con mapeo tonal a 16 bits por canal de color RGB. A
estas versiones las denominamos Mapeadas HDR. La función de las versiones ma-
peadas es poder evaluar los parámetros físicos de forma objetiva y subjetiva. El
mapeo tonal se ha hecho desde el mismo programa Adobe Photoshop CS4, utili-
364
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
zando el operador de mapeo Exposición y gamma, con los parámetros gamma 1
y exposición 0,50. Estos valores generan una curva de contraste que arroja valores
adecuados para la generación y aplicación de un perfi l de color ICC sobre la base
de la carta Colorcheckr. Se ha elegido este operador de mapeo porque deriva en
una mayor fi delidad entre el documento físico digitalizado y la representación
visual obtenible a partir de esa imagen, al aplicar sólo procesamientos lineales.
Se ha capturado, además, una versión LDR convencional, de una única toma
fotográfi ca, de cada uno de los cuatro grupos de captura. Estas capturas se han
realizado con un valor de exposición típico para la digitalización de documentos:
para densidad de gris del 18 % de refl ectancia. El formato de estos nuevos más-
teres LDR es TIFF a 48 bits. El objetivo los másteres LDR es cotejar el rendimien-
to en calidad de las capturas LDR convencionales de una única toma con el
rendimiento en calidad de sus correspondientes imágenes LDR derivadas por
procedimiento de mapeo tonal desde las versiones HDR generadas con múltiples
tomas. De esta forma podremos evaluar la ganancia en calidad de la técnica HDR
frente a la captura no HDR y la incidencia que aquella puede tener en cuanto a
fi delidad en el registro del detalle gráfi co de los documentos.
Se ha aplicado gestión de color tanto a las imágenes LDR mapeadas desde
HDR como a las imágenes capturadas directamente como LDR, generándose un
perfi l ICC de color a partir de la carta Colorchecker incluida en las imágenes. La
gestión de color se ampara bajo el supuesto de un comportamiento uniforme del
dispositivo y procesado de captura en todas las sesiones de captura en las que
se usa un mismo perfi l ICC, por lo que no es recomendable aplicar de forma
conjunta gestión de color y técnicas de mapeo tonal basadas en procesamientos
no lineales. Como hemos comentado más arriba, la técnica de mapeo tonal apli-
cada se basa en ajustes lineales, por lo que podríamos considerar que tenemos
consistencia al menos dentro de cada imagen. Bajo esta hipótesis, hemos hecho
las pruebas de error en la codifi cación de color generando un perfi l ICC perso-
nalizado para cada una de las imágenes.
4.2. Segunda fase. Aplicación de parámetros físicos
y subjetivos visuales
Para la evaluación comparada —en cuanto al rendimiento en el registro de
la información gráfi ca de los documentos originales— de las imágenes LDR de-
rivadas de HDR frente a sus correspondientes capturas LDR convencionales de
una única toma, hemos empleado parámetros físicos que pueden medirse de
forma objetiva y automatizada y, también, de forma subjetiva a través de cotejo
visual por un experto humano. Los parámetros físicos han sido:
Rango dinámico
Se han venido utilizando múltiples métodos para medir el rango dinámico,
con mayor o menor objetividad (Wueller, 2002); la propia ISO ha publicado un
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
365

JESÚS ROBLEDANO ARILLO
estándar específi co para escáneres (ISO, 2004b). En este estudio hemos usado el
método aplicado por el programa Imatest, que ofrece una función sufi cientemen-
te fl exible para el cálculo del rango dinámico: mide el rango dinámico en valores
de exposición (EV) y con diferentes niveles de calidad en función de la propor-
ción de ruido.
Ruido
La norma ISO 157391 defi ne el ruido como variaciones indeseadas en la res-
puesta de un sistema de imagen (ISO, 2003b). En este trabajo no nos interesa
tanto medir el ruido del dispositivo empleado, sino determinar cómo varía la
incidencia del ruido en el procesado HDR frente al procesado convencional LDR.
Una explicación detallada de las métricas para la medición del ruido lo tenemos
en el propio estándar ISO (ISO, 2003b) y en otros trabajos que lo desarrollan
(Kleinmann y Wueller, 2007). Hemos utilizado una métrica de ruido que presen-
ta una buena correlación con la percepción visual humana de este problema: la
medida de ruido para el canal de luminancia como porcentaje de la diferencia
de valores de píxel, entre el parche más oscuro y el más claro, correspondiente
a un margen de densidades de 1,5 D (Koren, 2010b). La medida se basa en los
parches de densidad de la carta Q13 y arroja un promedio del ruido total de la
imagen.
Espectro de ruido
La gráfi ca del espectro de ruido que hemos empleado nos muestra el ruido
en función del valor de frecuencia espacial. Estos datos evidencian el efecto que
determinados procesamientos de la imagen digital, como la posible aplicación
de fi ltros de paso bajo —antialiasing y antirruido— en la cámara digital o duran-
te el procesado RAW, pueden tener en la captación del detalle espacial fi no.
Estos procesados pueden causar la pérdida de detalle espacial fi no en áreas uni-
formes de la imagen o que presenten detalle caracterizado por altas frecuencias
espaciales y poco contraste. Creemos útil usar este parámetro para comprobar si
el procesado HDR aplicado en las imágenes de prueba implica algún procedi-
miento que puede derivar en la eliminación de patrones gráfi cos semejantes al
ruido, y que pueden estar presentes en zonas de imágenes fotográfi cas con gra-
no o en zonas que muestren determinadas texturas de grano fi no. La eliminación
del ruido implicaría la pérdida o reducción de este tipo de información tonal y
de detalle espacial, que evidentemente, no sería adecuada en una digitalización
patrimonial.
Capacidad resolutiva
El término capacidad resolutiva se utiliza para referir la potencia de un siste-
ma óptico o de registro de imágenes resolviendo detalle espacial de pequeño
366
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
tamaño. Para medir la capacidad resolutiva hemos empleado la métrica MTF
(Modulation Transfer Function). Esta métrica ha tenido y tiene un amplio uso
en Ingeniería Óptica, Fotografía e Ingeniería de Imagen para la evaluación del
rendimiento de ópticas y dispositivos de registro y reproducción de imágenes.
Además, ha sido estandarizada por ISO, tanto para la evaluación de escáneres
como de cámaras fotográfi cas digitales (ISO, 2000; ISO, 2003; ISO, 2004) y está
ampliamente documentada en múltiples trabajos teóricos y experimentales sobre
evaluación de calidad en imágenes fotográfi cas digitales. MTF es una función
que expresa cómo se transfi ere el contraste existente en el límite de dos áreas
colindantes, de muy alta y muy baja densidad respectivamente. Hemos aplica-
do la MTF al escaneado de una carta de tipo ISO 12233 Slanted-edge Spatial

Frequency
.
Antes de aplicar la MTF, hemos calculado los valores óptimos y límite para
el rendimiento en la función MTF en un contexto de captura con un sensor di-
gital basado en la discretización de la imagen en puntos, como es el sensor CMOS
de la cámara empleada para las pruebas. Para ello, hemos aplicado la siguiente
ecuación, donde intentamos incorporar la incertidumbre derivada de la diferente
probabilidad de alineación o no alineación del detalle espacial de pequeño ta-
maño en las celdillas fotosensibles del sensor, donde se proyecta la imagen cap-
tada por el sistema óptico de la cámara digital, en función de la resolución es-
pacial de captura que se emplee:
C = (R/50,8)/F
donde C indica los ciclos por milímetro —los pares de línea en una carta de re-
solución de pares de línea por milímetro o ciclos de densidad en una carta de
resolución con patrón sinusoidal— que deben quedar bien resueltos a diferen-
tes valores de resolución espacial de captura en el dispositivo digital de regis-
tro de imágenes; R es una variable que expresa la resolución espacial de cap-
tura en píxeles por pulgada que se está evaluando; 50,8 es una constante cuya
inclusión permite distribuir de forma proporcional los píxeles capturados por
cada pul gada lineal entre cada una de las líneas que se toma como referencia
de tamaño de detalle fi no en una carta de resolución de pares de líneas por
milímetro — dividiendo el valor de resolución en píxeles por pulgada por esa
constante podemos conocer los píxeles que corresponden a cada línea de la
carta—; F es un factor de calidad que permite resolver la incertidumbre en la
alineación del detalle espacial fi no contra las celdillas fotosensibles (píxeles)
del sensor, incorporando a la medida tres situaciones de calidad: Baja, Buena
y Excelente. El factor Bajo equivale a la frecuencia de Nyquist, esto es, al valor
de resolución espacial que se está aplicando, el sensor sólo dispone de un píxel
para cada línea de la carta. La probabilidad de que ese píxel coincida de forma
exacta con una línea de la carta es muy baja, por lo que se estima que hay una
alta probabilidad de mala calidad en el registro del detalle fi no que podría ser
bien registrado a ese valor de resolución espacial. El factor Bueno equivale a
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
367

JESÚS ROBLEDANO ARILLO
que el sensor utiliza 1,5 píxeles para cada línea de la carta, lo que incrementa
considerablemente la probabilidad de alineación correcta del detalle de una
línea con un píxel; Excelente equivale a que el sensor emplea 2 píxeles para
cada línea de la carta, con lo que la probabilidad de coincidencia de al menos
un píxel completo en cada línea de la carta es del 100 %, asegurándose el re-
gistro correcto de todas las líneas de la carta, salvo en casos de un penoso
rendimiento del sistema óptico del dispositivo de captura o un enfoque erróneo
durante ésta.
Aplicando la ecuación anterior, hemos derivado los valores de rendimiento
para la prueba MTF a 246,55 píxeles por pulgada, el valor de resolución espacial
de captura de las imágenes de prueba con carta para MTF, que mostramos en la
tabla I. Como podemos observar, hemos correlacionado en la tabla los valores
de MTF con la escala de calidades en que se basan los factores de calidad en la
ecuación anterior.
TABLA I
Valores de rendimiento para la prueba MTF a 246,55 píxeles por pulgada
Baja calidad
Buena calidad
Calidad excelente
(MTF 20 %)
(MTF 50 %)
(MTF 60 %-70 %)
Pares de líneas mm.
4,85
3,24
2,43
Líneas por pulgada
246
164
123
Para la evaluación visual de la capacidad resolutiva hemos usado la carta

PM-189.
Aberración cromática lateral
Se trata de un problema propio de los defectos de los sistemas ópticos que
se acoplan a los dispositivos de captura, pero que pueden ser magnifi cados por
el procesamiento digital aplicado durante el procesado RAW y HDR. En la abe-
rración cromática lateral las diferentes longitudes de onda que conforman el
espectro de los colores de la imagen enfocan en el mismo plano, pero con des-
plazamientos laterales respecto del eje central. Este fenómeno se manifi esta bajo
la forma de halos de color alrededor de zonas de borde y alto contraste repre-
sentadas en la imagen. La métrica de la aberración cromática lateral escogida es
la del área en píxeles de la aberración cromática. Lo hemos medido mediante el
programa Imatest, que detecta automáticamente la aberración de la zona de alto
contraste marcada y la mide. La escala de valores de referencia para la calidad
en este parámetro la hemos tomado de la propuesta por el mismo programa:
menos de 0,5, no signifi cativo; entre 0,5 y 1, menor; entre 1 y 1,5, moderado;
1,5 o superior, severo.
368
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
Error en la codifi cación de color
Para la evaluación objetiva y subjetiva de rendimiento en la codifi cación de
color, a las imágenes de la carta Colorcheckr representadas en las versiones HDR
y LDR, una vez convertidas al espacio Adobe RGB, les hemos aplicado diversas
métricas estandarizadas para la medida de la diferencia o distancia entre colores
a partir de su representación codifi cada, encuadrables en lo que se denomina
Color Encoding Error. En concreto, hemos manejado las métricas Delta E y Del-
ta C sobre el espacio de color perceptual e independiente CIELAB. Los datos que
arrojan estas métricas han sido utilizados, en concreto, para cotejar de forma
comparada la consistencia de los métodos de procesamiento HDR y LDR, con la
fi nalidad de poder determinar si el HDR permite conseguir una consistencia y
proximidad de color en una reproducción similar al LDR, mediante la interme-
diación de la tecnología de gestión de color, o no.
La evaluación subjetiva se ha incluido, a modo de refuerzo de las pruebas
objetivas, para determinar la corrección de la apariencia de las imágenes repro-
ducidas en cuanto a contraste y color, así como la apreciación visual de artefac-
tos que distorsionan la representación de los elementos gráfi cos de los documen-
tos en la imagen digital, tales como posterización, recortes tonales, pérdida de
detalle espacial fi no y ruido.
Los parámetros físicos sólo han sido aplicados al primer grupo de dos imá-
genes, el que contiene cartas para la medición objetiva de los parámetros físicos.
El segundo grupo contiene muestras para la evaluación subjetiva visual, que han
sido complementadas con carta para evaluación objetiva o subjetiva de rango
dinámico y contraste.
5. Resultados y discusión
5.1. Capacidad resolutiva y aberración cromática lateral
5.1.1. Resultados de las medidas objetivas de parámetros
Las gráfi cas que mostramos a continuación son las ofrecidas por el propio
programa Imatest a partir de los datos derivados tras aplicar las funciones indi-
cadas sobre dos regiones de la digitalización resultante de la carta: una región
vertical y otra horizontal. En la fi gura 2 representamos datos precisos de MTF en
las regiones medidas, en másteres HDR y LDR, mediante los gráfi cos resumen
generados por el propio Imatest.
En la fi gura 3 hemos refl ejado datos más precisos de aberración cromática en
ambas regiones, en másteres HDR y LDR.
En el máster HDR se detecta una cierta pérdida de resolución: el valor para
MTF50 % ponderado es inferior al que debería: 2,75 ciclos por milímetro (Cy/mm)
frente a los 3,24 esperados; el valor para MTF20 % también es más bajo que el
esperado. La diferencia con el valor esperado a MTF50 % no es muy alta, aproxi-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
369

JESÚS ROBLEDANO ARILLO
FIGURA 2
Datos MTF
Primera región HDR
Primera región LDR
madamente 0,5 Cy/mm. A frecuencia Nyquist (un píxel por línea) el valor MTF
es ligeramente superior a 10 % en ambos sentidos, horizontal y vertical, salvo en
la medida vertical de la segunda región. Esto indica que la capacidad resolutiva
límite del HDR se ha mantenido, pudiendo registrar de forma visible detalles de
un grosor igual al del píxel a la resolución de captura empleada para la imagen,
por lo que no hay merma en la representación del detalle espacial más pequeño
representable por la cámara digital y objetivo empleado a esa resolución espacial
de captura. En el caso de la aberración cromática en HDR, nos movemos justo
por debajo del valor 0,5, por lo que su afectación no es signifi cativa. En el más-
ter LDR no se detecta ninguna pérdida de resolución: el valor para MTF50 %
ponderado coincide prácticamente con el valor esperado (3,33 Cy/mm frente a
370
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
FIGURA 2 (continuación)
Segunda región HDR
Segunda región LDR
3,24 Cy/mm esperados). En la primera región medida, en la versión LDR, se dan
valores por encima del valor esperado, lo que puede estar indicando un mínimo
aumento artifi cial de nitidez en el procesado de la cámara y RAW. Este aumento
de nitidez se ha perdido durante el procesado HDR, al incorporar éste un mínimo
suavizado de contraste en altas y bajas frecuencias espaciales, algo que ha sido
detectado también en las pruebas visuales complementarias que hemos incluido
en el estudio. En el caso de la aberración cromática, en la versión LDR nos mo-
vemos también por debajo del 0,5, por lo que su afectación no es tampoco sig-
nifi cativa, salvo en la segunda zona en el lado horizontal. El LDR arroja también
valores mejores de afectación de la aberración cromática lateral, aunque nos si-
tuamos en ambos másteres en valores no signifi cativos a esta resolución espacial.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
371





JESÚS ROBLEDANO ARILLO
FIGURA 3
Datos sobre aberración cromática
Primera región HDR
Primera región LDR
5.1.2. Resultados de la evaluación subjetiva de parámetros
de capacidad resolutiva
La evaluación subjetiva se ha realizado a ambos grupos de imágenes de prue-
ba. Su objetivo no es sólo contrastar los resultados de los métodos objetivos de
medición, sino también valorar la consistencia en el rendimiento del procesa-
miento HDR de una imagen a otra imagen. Se han evaluado dos zonas de la
carta PM-189: el texto impreso a diferentes tamaños y los patrones axiales de
pares de líneas por milímetro. La selección de estas dos zonas se debe a que
incluyen dos elementos importantes de información de los documentos: letras y
372
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816



Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
FIGURA 3 (continuación)
Segunda región HDR
Segunda región LDR
trazos fi nos que pueden estar presentes en una amplia gama de medios: manus-
critos, dibujos, grabados, fotografías, pinturas, textos de imprenta, etc. Es preciso
ser muy cautelosos con la evaluación visual de la capacidad resolutiva mediante
patrones gráfi cos de líneas, debido a que por debajo de la resolución de Nyquist
(un píxel por línea) surgen muarés que pueden engañar fácilmente al observador,
haciéndole creer que hay líneas bien resueltas donde no las hay. Los muarés se
presentan como patrones gráfi cos de interferencia, y son resultado de la ruptura
del patrón a evaluar ante una resolución espacial insufi ciente. Tanto las pruebas
en HDR como en LDR arrojan unos buenos resultados en la comparativa visual
de textos y pares de líneas. No notamos visualmente la merma de MTF que evi-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
373

JESÚS ROBLEDANO ARILLO
denciaban las pruebas objetivas. Los textos son legibles en HDR y LDR. El HDR
se muestra también consistente en cuanto a capacidad resolutiva en las diferen-
tes capturas realizadas.
A continuación, hemos evaluado detalles de las fotografías del grupo 2 que
muestran zonas de altas frecuencias espaciales. Hemos elegido zonas de detalle
donde la afectación por falta de rango dinámico sea mínima, ya que aquí no
estamos evaluando problemas tonales, sino de capacidad resolutiva. En las zonas
evaluadas de las fotografías, salvo algo de posterización y ruido en LDR, no hay
diferencia alguna en la captación del detalle espacial fi no relevante entre HDR y
LDR; pero en las densidades más altas sí hemos detectado mayor ruido y poste-
rización, que alteran no sólo la reproducción tonal y de color, sino también la
representación del detalle fi no. En zonas de detalle espacial con densidades más
altas, el detalle en LDR se ve distorsionado, con una incidencia directamente
proporcional a la de afectación de los problemas de rango dinámico. Esta apre-
ciación parece evidenciar que el uso de dispositivos de rango dinámico inferior
al margen de densidades de los documentos a escanear puede provocar, incluso
aunque la capacidad resolutiva sea alta, distorsión y pérdida de detalle espacial
de pequeño tamaño, especialmente en zonas de altas frecuencias espaciales.
5.2. Representación
tonal
5.2.1. Evaluación
objetiva
Mostramos en la fi gura 4 datos precisos sobre el rendimiento tonal en los
parámetros ruido, espectro de ruido y rango dinámico, en másteres HDR y LDR.
La afectación de ruido es menor en HDR, Y = 0,23 contra Y = 0,43. Esto se
reproduce en todos los canales de color. Pero hemos de considerar que en HDR
no se han contado los dos últimos pasos que son los más ruidosos. Si nos ate-
nemos a la comparativa de los parches anteriores a estos dos no captados en
HDR, el nivel de ruido es menor siempre en HDR, por debajo de 0,5 siempre.
Los tres últimos pasos de densidad del LDR evidencia una cantidad de ruido muy
alta, inaceptable, por lo que no podemos considerar estos tres pasos dentro del
rango dinámico de la captura si aplicamos unos criterios patrimoniales rigurosos.
Por ello, el rango dinámico en la versión LDR habría que reducirlo a 1,6 D, sien-
do incluso cuestionable la aceptación del paso de densidad anterior al máximo
aceptado. En HDR todos los parches detectados están muy por debajo del 0,5
de ruido. También hemos detectado una pérdida ligera de contraste en HDR
frente a LDR, lo que puede propiciar una menor acentuación del ruido en las
zonas de sombra. Esto lo detectamos mediante el gráfi co Density Response, que
representa la OECF. La OECF (Función de Conversión Opto-Electrónica) correla-
ciona la densidad óptica de cada parche de la carta Q13 con los valores prome-
diados de luminosidad de los píxeles que describen esos parches, tras los ajustes
de contraste propios del procesado de los fi cheros RAW y del HDR. Si nos fi ja-
374
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
mos en este gráfi co, en la versión LDR podemos observar un aumento de con-
traste mediante una ligera curva en S. En HDR se ha suavizado el contraste du-
rante el proceso de mapeo tonal y durante la fusión de imágenes tomadas a
diferentes valores de exposición.
Las representaciones gráfi cas del espectro de ruido evidencian que la caída
de la gráfi ca es más brusca en el caso de HDR. No obstante, en ambas gráfi cas
se muestra una caída del ruido a medida que decrece la frecuencia espacial, lo
que parece refl ejar que se ha incluido procesamiento antirruido y antialiasing
durante el procesado RAW o, previamente, en los circuitos de la cámara. Esta
caída debería manifestarse como un cierto suavizado de contraste en zonas con
texturas fi nas de bajo contraste, que tendría que ser, de acuerdo a la mayor brus-
quedad de la caída de la gráfi ca, mayor en HDR. Este hecho ha sido contrastado
visualmente durante la evaluación subjetiva, donde hemos apreciado zonas con
este tipo de texturas que, aunque no se pierden, sí bajan su contraste y se hacen
menos aparentes al ojo.
5.2.2. Evaluación
subjetiva
Se han evaluado aspectos como la diferenciación de los pasos de densidad
de la carta Q13, la presencia visible de ruido, posterización y recortes tonales.
En todas las capturas se diferencian perfectamente los 20 parches de densidad
de la carta Q13. Aunque el contraste es mayor en las LDR, debido a la pérdida de
rango dinámico, a la peor identifi cación y representación de los tres últimos par-
ches más densos, y a una curva gamma menor. Hemos de destacar, asimismo, la
alta consistencia en los resultados de unas capturas a otras de las mismas cartas
de prueba.
La evaluación visual de los tres últimos parches de densidad ampliados nos
ha llevado a la conclusión de que no se observa posterización ni ruido visible
en ninguna de las versiones HDR, habiendo una gran consistencia en los resul-
tados de las dos capturas. En cuanto a las dos versiones LDR, hemos observado
posterización y ruido muy visibles en ambas capturas, con distorsión de detalle
en los tres últimos parches de densidad de la carta Q13. Hemos profundizado
más en este aspecto, evaluando detalles escogidos de zonas más densas en las
fotografías representadas en el segundo grupo de capturas, tanto en color como
en blanco y negro. Los resultados de esta evaluación demuestran que tanto en
los detalles de color como en blanco y negro, podemos observar una alta inci-
dencia de posterización y ruido en LDR, con gran distorsión y pérdida del deta-
lle en las densidades más altas. Estos problemas no los apreciamos en HDR.
Estas pruebas refl ejan una pérdida de información tonal muy visible en las imá-
genes LDR, que puede ser crítica para la digitalización de fotografía, tanto en
color como en blanco y negro, y sobre base opaca y traslúcida; pues estas den-
sidades son muy comunes en esta clase de materiales.
De cara al posible uso de la cámara digital empleada, mediante técnicas LDR
o HDR, para la digitalización de materiales con mayores márgenes de densidad
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
375



JESÚS ROBLEDANO ARILLO
FIGURA 4
Rendimiento tonal
HDR. Rango dinámico, ruido y espectro de ruido/Pasos de densidad detectados y ruido
LDR. Rango dinámico, ruido y espectro de ruido/Pasos de densidad detectados y ruido
376
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816



Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
que los representados en las cartas Q13 y Q14, nos interesa también evaluar el
comportamiento de ambas técnicas en zonas con densidades superiores a 1,95
D. Para ello, hemos capturado detalles de zonas de densidad en torno a 2,6 D,
que mostramos en la fi gura 5.
FIGURA 5
Detalles en zonas de densidad en torno a 2,6 D
HDR. Segundo Grupo 1. Detalle de fotografía con densidad en torno 2,6 D
LDR. Segundo Grupo 1. El mismo detalle anterior
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
377

JESÚS ROBLEDANO ARILLO
El resultado es muy evidente: LDR no capta detalle a esas densidades, y pre-
senta mucho ruido, posterización y recorte tonal. También se demuestra que el
rango dinámico de la versión HDR supera en mucho el margen de densidades
de la carta de densidades Q13 analizada. Parece que con las técnicas HDR se
puede mejorar muchísimo el rendimiento tonal de un dispositivo con escaso
rango dinámico y que HDR no implica merma en la representación del detalle,
al menos hasta estos valores de densidad máxima que estamos manejando en el
estudio y con la técnica de mapeo tonal empleada.
5.3. Color
5.3.1. Evaluación
objetiva
Presentamos en la fi gura 6 los datos obtenidos en las pruebas colorimétricas
mediante los gráfi cos aportados por el programa Imatest que hemos empleado
para las medidas de color. Los gráfi cos muestran la distancia de color en el plano
de crominancia a*b* del espacio CIELAB (Koren, 2010a). También se ha calculado
la media (Mean) de todos los errores de color, el valor máximo (max) y el valor
medio de saturación (Mean camera chroma). Estos datos aparecen en la parte de
arriba a la derecha de cada gráfi co. Valores medios de saturación por encima del
100 % indican un aumento de la saturación general de la imagen digital con res-
pecto a la saturación ideal de los colores de la carta de prueba. Un exceso de
saturación podría signifi car la pérdida de detalles en zonas de color altamente sa-
turados en el documento, por lo que es interesante también valorar este aspecto.
En cuanto a saturación, HDR y LDR arrojan resultados similares, con un aumento
muy ligero de la saturación que es muy poco perceptible. En cuanto a precisión me-
dida sobre la carta Colorcheckr, las diferencias en los valores medios y máximos en-
tre ambas versiones son tan mínimas —siempre inferiores a la unidad— que pode-
mos despreciarlas, tanto en métrica Delta E como Delta C. Los gráfi cos muestran
un patrón de error de color prácticamente idéntico entre ambas versiones. No pode-
mos considerar que LDR presente mayor precisión en color que HDR, ni viceversa.
5.3.2. Evaluación
subjetiva
El cotejo visual original/reproducción digital se ha realizado en una cabina
de visualización normalizada, con un monitor marca EIZO, calibrado, caracteri-
zado y ajustado en cuanto a temperatura de color e intensidad de punto blanco
de forma coordinada con las condiciones de visualización de la cabina. Para ello
hemos seguido estándares y recomendaciones profesionales para cotejo visual
de imágenes, especialmente el estándar ISO 3664:2009.
La apariencia visual subjetiva es prácticamente idéntica en reproducción tonal
y contraste entre HDR y LDR. La apariencia de color en ambas muestras, HDR y
LDR, es muy similar, salvo algunas diferencias en color, que se perciben como co-
378
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
lores que no tienen exactamente el mismo grado de saturación o tono. En las ver-
siones LDR la diferencia en contraste y saturación es mayor en la apreciación visual,
con el agravante de que la imagen LDR no puede ser igualada en cuanto a aparien-
cia con el original manteniendo una calidad visual aceptable; el bajo rango dinámico
de la cámara digital empleada lo impide. En cambio, la igualación de apariencia
se ha solucionado satisfactoriamente en la versión HDR mapeada tonalmente.
6. Conclusiones
Es importante concienciar a los profesionales que tienen responsabilidad so-
bre la digitalización de patrimonio documental, especialmente patrimonio foto-
gráfi co y pictórico, de la necesidad de contar con dispositivos de captura que
permitan el rango dinámico necesario para capturar el margen de densidades de
los documentos. Tanto el rango dinámico del dispositivo, con los ajustes y pará-
metros de captura a aplicar, como el margen de densidades de los documentos
deben ser medidos antes de la captura, debiendo ser el primero al menos igual
o, preferiblemente, superior al segundo. En su defecto, se deberá seleccionar una
técnica HDR adecuada para aquellos documentos en los que se estime que el
rango dinámico del dispositivo es insufi ciente, mediante pruebas que evalúen
el rendimiento en el registro de información tonal, cromática y detalle espacial.
En las pruebas realizadas en este estudio, no hemos detectado diferencia en
la capacidad resolutiva de las imágenes HDR frente a las LDR con el método de
procesamiento HDR empleado. En ambos tipos de imágenes hemos podido re-
gistrar con el mismo nivel de calidad aquellos detalles espaciales de tamaño
pequeño o grande que son registrables por el dispositivo de captura digital em-
pleado con la confi guración de captura elegida.
El HDR mejora muy signifi cativamente el rango dinámico de dispositivos de
captura con escaso rango dinámico, como son las cámaras réfl ex digitales; posi-
bilita que se puedan capturar documentos con amplios márgenes de densidades,
más allá de la propia capacidad del dispositivo, permitiendo el registro correcto
de información tonal, espacial y cromática sin defectos graves de calidad, tales
como ruido alto, posterización y recorte tonal en zonas de luces o de sombras.
No se han detectado diferencias signifi cativas entre HDR y LDR en cuanto a la
calidad de registro de color, empleando métricas estandarizadas para la medida de
error de color; tampoco en cuanto a la percepción subjetiva de proximidad origi-
nal/imagen visualizada en un monitor con condiciones de entorno de visualización
controladas. En cuanto a la viabilidad de uso de perfi les ICC, tampoco se ha de-
tectado ningún problema, pero es recomendable, a la espera de estudios que
aborden con más profundidad este aspecto, que los perfi les se realicen sobre una
carta de color, apta para su creación, digitalizada en el mismo acto de captura del
documento, pues el procesado HDR puede incluir ajustes no lineales que hacen
perder la consistencia en la reproducción de la carta entre escaneado y escaneado
o dentro de zonas distintas en cuanto a contenido gráfi co de la misma imagen.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
379





JESÚS ROBLEDANO ARILLO
FIGURA 6
Gráfi cos comparativos de datos de distancia de color en las digitalizaciones
Primera región HDR
Primera región LDR
Creemos que es necesaria una investigación más pormenorizada al respecto, ana-
lizando la respuesta de la gestión de color ante colores presentes en los documen-
tos a escanear que estén alejados, en cuanto a luminosidad o cromaticidad, de los
colores normalizados de la carta empleada para hacer el perfi l de color.
Las pruebas realizadas evidencian que hay consistencia en el procesado HDR
—con el método captura multiexposición, fusión y mapeo que hemos aplicado—
de imagen a imagen. Por consiguiente, se podría conseguir consistencia en la
380
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816





Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
FIGURA 6 (continuación)
Segunda región HDR
Segunda región LDR
calidad de resultados para la digitalización de un fondo completo. No obstante,
convendría hacer más pruebas con una muestra más amplia, que contemplase
diferentes tipos de medios y documentos.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
381

JESÚS ROBLEDANO ARILLO
Gracias al uso de técnicas HDR, con una cámara fotográfi ca digital de coste
medio-bajo, hemos podido obtener, perfectamente reproducido, un rango diná-
mico en torno a 2,6 D, que equivale a 8,6 diafragmas (f/stop); no ofreciendo esta
cámara, con técnicas de digitalización LDR, más de 1,7 D o 5,6 diafragmas con
calidad sufi ciente. Por ello, creemos que la técnica de HDR presentada y anali-
zada en este estudio es utilizable en la digitalización de patrimonio documental
en situaciones en las que no se cuente con sufi cientes recursos para el escanea-
do de documentos con amplios márgenes de densidad, pero con una serie de
matizaciones.
En primer lugar, hay que considerar que los resultados de este estudio no son
extensibles más allá del margen de densidades de los documentos y cartas de
prueba, con una densidad máxima de 2,6 D. Estos márgenes de densidades no
son problemáticos para la técnica de mapeo tonal que hemos empleado, menos
agresiva y apta para posibilitar una interpretación facsímil de un documento fo-
tográfi co que otras; pero con márgenes de densidades mayores, esta técnica podría
no dar los mismos resultados, debiéndose optar por otras más agresivas con la
información gráfi ca del documento. Para densidades y márgenes de densidades
mayores a los incluidos en este estudio recomendamos hacer pruebas adicionales,
donde se demuestre la idoneidad de éste u otros procedimientos de HDR.
En segundo lugar, hay que contar con los problemas de efi ciencia añadidos
al HDR: el mayor consumo de tiempo para la captura y procesado de la imagen,
el tener que manejar y gestionar múltiples fi cheros de gran tamaño, la necesidad
de un control minucioso en el momento de generar el mapeo —que exigiría un
control visual de todas las imágenes—, la necesidad de involucrar más recursos
en las digitalizaciones, y un control de calidad más exhaustivo. Este problema
de efi cacia puede hacer más aconsejable acudir a equipamientos de alto coste
que ofrezcan un rango dinámico sufi ciente cuando los lotes de documentos a
digitalizar sean muy voluminosos.
7. Bibliografía
ANSI/AIIM MS44-1988 (1988): Recommended Practice for Quality Control of Image Scanners.
Artmanna, U., y Wueller, D. (2008): Noise Reduction vs. Spatial Resolution. Proceedings
of SPIE, vol. 6817, 68170A.
Berns, R. S., y Frey, F. S. (2005): Direct Digital Capture of Cultural Heritage-Benchmarking
American Museum Practices and Defi ning Future Needs. Rochester; Rochester Institu-
te of Technology, Munsell Color Science Laboratory [en línea]. Disponible en http://
www.cis.rit.edu/museumSurvey/documents/Benchmark_Final_Report_Web.pdf [fecha
de consulta 5/08/2010].
Burt, P. J., y Kolczynski, R. J. (1993): Enhanced image capture through fusion. Proceedings
of the ICCV, 173-182.
Debevec, P. E., y Malik, J. (1997): Recovering high dynamic range radiance maps from
photographs. Proceedings of ACM SIGGRAPH, 369-378.
382
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Mejora del rango dinámico en la digitalización de documentos desde una perspectiva patrimonial...
Frey, F., y Reilly, J. M. (2006): Digital Imaging for photographic collections: foundations
for technical standards. (2.ª ed.) Rochester; Image Permanence Institute [en línea].
Disponible en http://www.imagepermanenceinstitute.org/shtml_sub/digibook.pdf [fe-
cha de consulta 25/08/2010].
ISO 12233:2000 (2000): Photography – Electronic still-picture cameras – Resolution mea-
surements.
ISO 16067-1:2003 (2003a): Photography – Spatial resolution measurements of electronic
scanners for photographic images – Part 1: Scanners for refl ective media.
ISO 15739:2003 (2003b): Photography – Electronic still picture imaging – Noise measurements.
ISO 16067-2:2004 (2004a): Photography – Electronic scanners for photographic images –
Spatial resolution measurements – Part 2: Film scanners.
ISO 21550:2004 (2004b): Photography – Electronic scanners for photographic images –
Dynamic range measurements.
ISO 14524:2009 (2009a): Photography – Electronic still-picture cameras – Methods for
measuring opto-electronic conversion functions (OECFs).
ISO 3664:2009 (2009b): Graphic technology and photography – Viewing conditions.
Kenney, A. R., y Rieger Y. O. (2000): Moving Theory into Practice: Digital Imaging for
Libraries and Archives. Mountain View, CA: Research Libraries Group.
Kleinmann, J., y Wueller, D. (2007): Investigation of two methods to quantify noise in
digital Images based on the perception of the human eye. Proceedings of SPIE, the
International Society for Optical Engineering
, vol. 6494, 64940N.1-64940N.12.
Koren, N. (2010a): Running Imatest SFR [en línea]. Disponible en http://www.imatest.com/
docs/sfr_instructions2.html [fecha de consulta 5/08/2010].
Koren, N. (2010b): Noise in photographic images [en línea]. Disponible en http://www.
imatest.com/docs/noise.html [fecha de consulta 5/08/2010].
Koren, N. (2010c): Using Colorcheck [en línea]. Disponible en http://www.imatest.com/
docs/colorcheck.html [fecha de consulta 5/08/2010].
Loebich, C., y Wueller, D. (2001): Three Years of Practical Experience in Using ISO Stan-
dards for Testing Digital Cameras. Proceedings of the Image Processing, Image Quali-
ty, Image Capture Systems Conference
(PICS-01), Montréal, Quebec, Canada, abril,
22-25, 2001, IS&T 2001, 257-261.
Loebich, C.; Wueller, D.; Klingen, B., y Jaeger, A. (2007): Digital Camera Resolution Mea-
surement Using Sinusoidal Siemens Stars. En: Martin, R. A; DiCarlo, J. M; Sampat, N.
(Eds.). Digital Photography III, edited by Proceedings of SPIE-IS&T Electronic Imaging,
SPIE, vol. 6502 [en línea]. Disponible en http://www.image-engineering.de/images/
pdf/conference_papers/resolution_measurement.pdf [fecha de consulta 5/08/2010].
Mann, S., y Picard, R. (1995). Being «undigital» with digital cameras: Extending dynamic
range by combining differently exposed pictures. Proceedings of IS& T, 46th annual
conference
, 422-428.
Mantiuk, R.; Daly, S.; Myszkowski, K., y Seidel, H.-P. (2005): Predicting visible differences
in high dynamic range images – model and its calibration. Human Vision and Elec-
tronic Imaging X, IST/SPIE’s 17th Annual Symposium on Electronic Imaging
, vol. 5666,
204-214 [en línea]. Disponible en http://www.mpi-inf.mpg.de/~mantiuk/papers/man-
tiuk05PredVisDiff.pdf [fecha de consulta 25/08/2010].
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816
383

JESÚS ROBLEDANO ARILLO
McCann, J. J. (2008): Perceptual rendering of HDR in painting and photography. Preprint
of 6806-30 paper in SPIE/IS&T Electronic Imaging Meeting, San Jose, January, 2008
[en línea]. Disponible en http://web.me.com/mccanns/Color/Color_Reproduction_
fi les/08EI%206806-30.pdf [fecha de consulta 25/08/2010].
Puglia, S.; Reed, J., y Rhodes. E. (2004): U.S. National Archives and Records Administration
(NARA) – Technical Guidelines for Digitizing Archival Materials for Electronic Access:
Creation of Production Master Files- Raster Images [en línea]. Disponible en http://
www.archives.gov/preservation/technical/guidelines.pdf. [fecha de consulta 26/08/2010].
Stelmach, M. (2010): Evaluating digital image performance device capability and image
quality. Presentation by Michael Stelmach at an August, 2010 workshop sponsored by
CENDI, FLICC and FADGI [en línea]. Disponible en http://www.digitizationguidelines.
gov/stillimages/documents/Evaluating_Digital_Imaging-2010.pdf [fecha de consulta
25/08/2010].
Still Image Working Group (2010): GAP Analysis. Updated 01/12/2010 [en línea]. Dispo-
nible en http://www.digitizationguidelines.gov/stillimages/documents/Gap_Analysis.
pdf [fecha de consulta 25/08/2010].
Williams, D. (2002): Image quality metrics. RLG Diginews, vol. 4 (4) [en línea]. Disponible
en http://www.worldcat.org/arcviewer/1/OCC/2007/08/08/0000070511/viewer/fi le1806.
html [fecha de consulta 24/08/2010].
Williams, D. (2003): Debunking of Specsmanship: Progress on ISO/TC42 Standards for
Digital Capture Imaging Performance. IS&T’s 2003 PICS Conference, 77-81 [en línea].
Disponible en http://www.i3a.org/wp-content/uploads/2008/03/debunking_specsman-
ship.pdf [fecha de consulta 5/08/2010].
Wueller, D. (2002): Measuring Scanner Dynamic Range. PICS 2002: Image Processing,
Image Quality, Image Capture Systems Conference. Portland, Oregon, April 2002,

163-166.
Wueller, D. (2006): Image Engineering digital camera tests (White Paper) [en línea]. Dis-
ponible en: https://noppa.tkk.fi /noppa/kurssi/as-75.2122/luennot/AS-75_2122_kamera-
mittaukset.0.pdf [fecha de consulta 5/08/2010].
Wueller, D.; Dormolen, H. Van, y Jansen, V. (2009): Universal Test Target Technical Spe-
cifi cation [en línea]. Disponible en: http://www.universaltesttarget.com/download/
UTT%20technical%20specs.pdf [fecha de consulta 25/08/2010].
384
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 357-384, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.816

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 385-407, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
La comunidad «Recursos y datos primarios»
de la Universitat Pompeu Fabra: los repositorios
institucionales como infraestructuras científi cas:
estudio de caso

Silvia Arano*, Gemma Martínez*, Marina Losada**, Marta Villegas*, Anna
Casaldàliga** y Núria Bel*.
Resumen: El artículo presenta una primera aproximación a la publicación en acceso abier-
to de datos resultantes de la investigación en el área de humanidades. Describe el
estudio de caso implementado en el repositorio institucional de la Universitat Pompeu
Fabra, a partir de la creación de dos colecciones con datos, una para los anexos pre-
sentes en las tesis y otra para las herramientas y recursos lingüísticos. Finalmente se
analiza la experiencia realizada y se extraen algunas conclusiones respecto a la utili-
zación de los repositorios como infraestructuras.
Palabras clave: datos de investigación, datos primarios, repositorios, infraestructuras cien-
tífi cas, humanidades, lingüística aplicada, Universitat Pompeu Fabra.
The community «resources and primary data» of the Universitat
Pompeu Fabra: institucional repositories as scientifi c infrastructures:
a case study

Abstract: This article presents an initial approach to open access publication of research
data from the humanities. It is a case study of the creation of two data collections at
the institutional repository of the Universitat Pompeu Fabra, one containing the annexes
of doctoral theses and the other, language tools and resources. Finally, we analyze the
experience and draw conclusions regarding the use of repositories as infrastructure.

Keywords: research data, repositories, scientifi c infrastructure, humanities, applied
linguistics, Universitat Pompeu Fabra.
«The coolest thing to do with your data will be thought of by someone else...»
(CRIG, 2008)
* Institut Universitari de Lingüística Aplicada.
** Biblioteca UPF, Universitat Pompeu Fabra. Barcelona. Correo-e: silvia.arano@upf.edu;
gemma.martinez@upf.edu; marina.losada@upf.edu; marta.villegas@upf.edu; anna.casaldaliga@upf.edu;
nuria.bel@upf.edu.
Recibido: 09-02-2010; 2.ª versión: 04-03-2011; aceptado: 20-03-2011.
385

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
1. Introducción
En la actualidad, tanto el quehacer cotidiano como también el de las activi-
dades culturales, económicas, sociales y de investigación se han visto revolucio-
nados por el desarrollo de las tecnologías de comunicación e información. Los
recientes avances en materia de digitalización creciente de datos, conjuntamente
con la progresiva virtualización de los entornos de trabajo, han cambiado tanto
la forma de procesar, acceder y distribuir los datos, como la forma de relacionar-
se entre las propias personas. Especialmente en el ámbito científi co y académico,
se está produciendo una migración de los espacios físicos de trabajo hacia los
espacios virtuales, donde el concepto de e-ciencia se comienza a consolidar y
pone de manifi esto la necesidad de generar infraestructuras científi cas de sopor-
te adecuadas para trabajar y preservar grandes volúmenes de datos en forma
virtual y colaborativa, las llamadas e-infraestructuras. Este cambio de modalidad
en cuanto a la forma de realizar investigación, también denominado el «cuarto
paradigma» (Hey, 2009), no es privativo de las ciencias básicas sino que también
involucra a las humanidades y ciencias sociales.
La implementación de una infraestructura científi ca requiere de un largo pro-
ceso de planifi cación y desarrollo, donde se necesitan gran cantidad de recursos
humanos y económicos. Los benefi cios más evidentes son para la comunidad aca-
démica y científi ca, ya que permite a diferentes investigadores encontrar y reunir
gran cantidad de datos, trabajar sobre datos ajenos resultantes de otra investigación,
generar nuevo conocimiento a partir de ellos y, además, facilitar el trabajo en un
entorno colaborativo, preservando la integridad y autoría de los datos. De esta
manera los datos se usan, se reutilizan y se combinan, incrementando la produc-
tividad y la capacidad de correlación a una escala nunca vista con anterioridad.
Asimismo, existen otros colectivos benefi ciados tales como los proveedores de da-
tos, las entidades públicas de fi nanciación, el sector de innovación empresarial e
industrial, el sector político y el público en general. Todos ellos tienen la posibili-
dad, a través del uso de la infraestructura científi ca y con diferentes objetivos, de
acceder, depositar y utilizar los datos publicados en una infraestructura científi ca.
En defi nitiva, una infraestructura científi ca es un conjunto de instalaciones,
medios técnicos y servicios necesarios, tanto para permitir el acceso, uso y reuti-
lización de los datos, como para garantizar la autoría e integridad de los mismos.
Esta amplia conceptualización de infraestructura permite considerar como tal,
elementos tan diversos como redes, grids, aplicaciones y recursos informáticos,
bancos de trabajo experimentales, centros de supercomputación, repositorios y
comunidades virtuales. Si bien todos los elementos mencionados se pueden en-
tender como subtipos de infraestructuras científi cas, no todos tienen las mismas
funciones, por ejemplo los grids se orientarían más hacia la generación de pla-
taformas colaborativas de investigación, en tanto que los repositorios se consti-
tuirían en instalaciones para preservar y difundir en acceso abierto datos e infor-
maciones resultantes de la investigación.
386 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
El presente artículo constituye una primera aproximación a la publicación en
acceso abierto de datos resultantes de la investigación del área de humanidades,
a partir del análisis de la capacidad de un repositorio institucional (RI) como
infraestructura científi ca para publicarlos. A partir de dicha refl exión, se plantea
un estudio de caso que tiene como objetivos: a) describir la puesta en marcha
de una comunidad para datos primarios y recursos provenientes de la investiga-
ción en el RI de la Universitat Pompeu Fabra (e-Repositori: Repositori Digital de
la UPF); b) analizar las implicaciones de gestión que tiene dicha implementación,
tanto para el personal encargado de la administración del repositorio como para
los propios investigadores involucrados.
De acuerdo con los objetivos anteriormente mencionados, el estudio de caso
se desarrolla en tres apartados. En el primer apartado, se realiza una breve in-
troducción a la situación de los repositorios institucionales y sus contenidos. En
el segundo, se presenta la investigación realizada por el grupo de Tecnologías
de los Recursos Lingüísticos (TRL) del Instituto Universitario de Lingüística Apli-
cada (IULA) en el marco del proyecto europeo CLARIN. En el tercero, se desa-
rrollan las características del repositorio institucional y se describe la implemen-
tación de dos nuevas colecciones dedicadas a los datos primarios y recursos
resultantes de la investigación. Finalmente se presentan las conclusiones y pers-
pectivas de investigación futuras.
2. Estudio de caso
2.1. Los repositorios institucionales y sus contenidos
Según datos de directorio OpenDoar [http://www.opendoar.org/index.html],
gestionado por la Universidad de Nottingham, a enero del 2011 existen 1847
repositorios registrados, de los cuales 1508 son institucionales, cantidad que re-
presenta un 82 % de los repositorios existentes a nivel internacional. España no
es ajena a esta tendencia internacional, teniendo 55 RIs censados sobre un total
de 68 repositorios, lo cual representa un 81 % de los repositorios españoles re-
gistrados en el directorio OpenDoar.
Si bien en sus orígenes los RIs se planteaban casi como bibliotecas digitales
compuestas por una diversa tipología de objetos digitales, su implementación
real se basaba fundamentalmente en materiales de producción científi ca e insti-
tucional. Esta tipología gradualmente se ha ampliado para dar cabida a materia-
les tales como presentaciones a congresos, recursos educativos y docentes, ma-
teriales multimedia, programas de ordenador y datos de investigación. Sin
embargo, aún existe una clara tendencia hacia el predominio de los objetos di-
gitales de tipo publicación (artículos de revista, tesis, working papers, informes
de proyectos, etc.), en detrimento de otros formatos menos comunes como ma-
teriales multimedia, programas de ordenador, patentes o datos.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
387

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
A nivel internacional, como se muestra en el siguiente gráfi co, entre el 40 y
64 % de los RIs tienen en depósito los materiales tradicionalmente asociados con
la producción científi ca, en cambio los que incorporan materiales menos tradi-
cionales rondan entre el 1 y 4 %. Cabe mencionar también, que los RIs que in-
corporan recursos educativos y docentes y materiales multimedia presentan una
incidencia media, alcanzando porcentajes entre el 15 y 23 %. (fi gura 1)
FIGURA 1
Content Types in OpenDOAR Repositories – Worldwide
Fuente: OpenDOAR.
La situación en España no escapa a dichas pautas de contenido, teniendo una
fuerte presencia los contenidos digitales tales como artículos y tesis doctorales a
texto completo, además de working papers, presentaciones a congresos y mono-
grafías. (fi gura 2)
También se registran resultados similares en relación con el resto de tipos de
documentos menos tradicionales, los cuales presentan volúmenes más bajos de
depósito. Lo más signifi cativo es que los objetos digitales tales como programas
de ordenador o datos primarios no aparecen diferenciados en las tipologías de
materiales depositados, aunque posiblemente dada su baja incidencia numérica
puede ser que hayan sido incluidos en el ítem «Otros».
2.1.1. Los datos de investigación en los RIs
La investigación como actividad intelectual genera una gran cantidad de datos
de diversa naturaleza y origen, además de las conocidas publicaciones e informes
científi cos.
388 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
FIGURA 2
Cantidad y tipo de objetos digitales en los repositorios españoles:
años 2007-2008
Fuente: Melero, R. y otros (2009). Situación de los RIs en España: informe 2009.
Dicha heterogeneidad reúne bajo la común denominación de datos de inves-
tigación (RIN, 2008), o simplemente datos o datos primarios, materiales tan dis-
pares como:
• Experimentos científi cos.
• Modelos y simulaciones (donde se incluyen tanto el modelo con sus meta-
datos asociados, como los datos generados por el propio modelo).
• Observaciones (donde los datos usualmente constituyen un registro úni-
co e irremplazable, como pueden ser formularios, censos, registros de vo-
tos, etc.).
• Datos derivados (resultantes del proceso o combinación de datos sin pro-
cesar (raw data) con otros tipos de datos).
• Datos referenciales (p.e. secuencias genómicas, estructuras químicas, etc.).
• Material complementario (también de índole diversa, entendiéndose como
parte del paquete informativo de los datos de investigación. P.e.: instruc-
ciones de codifi cación, guías para entrevistadores, gráfi cos de los datos
recolectados, instrumentos para la recolección de datos, diccionarios, etc.
(Green, MacDonald y Rice, 2009).
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
389

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
De esta amplia gama de materiales, aquellos que no son textuales y escritos,
como por ejemplo estructuras químicas, programas de ordenador o bases de
datos tienen una incipiente incorporación al contenido de los RIs.
Específi camente, la incorporación de los datos de investigación en infraes-
tructuras científi cas de acceso abierto ha tenido una fuerte expansión en los úl-
timos años, gracias al desarrollo de iniciativas ofi ciales y proyectos emprendidos
en diversos países con la participación de organismos gubernamentales y univer-
sidades.
En el Reino Unido, proyectos tales como eBank UK (2003-2007) y DISC-UK
DataShare (2007-2009), lograron poner de manifi esto la necesidad de disponer
de datos primarios en plataformas de acceso abierto, de relacionar dichos datos
con otros productos generados durante el proceso de investigación y de promo-
ver buenas prácticas comunes en diferentes instituciones (Rice, 2007). En defi ni-
tiva, hicieron afl orar la necesidad de aunar esfuerzos y experiencias con el fi n
de optimizar los servicios actuales de los RIs para incorporar los datos de inves-
tigación.
A partir del año 2008 en Australia comienzan a consolidarse las iniciativas
relacionadas con la gestión de los datos de investigación, con la fundación del
Australian National Data Service (ANDS) en acuerdo con la Monash University.
Los proyectos llevados a cabo, tanto por universidades como por entes públi-
cos, tenían la misión común de promover la creación y el fortalecimiento de
infraestructuras institucionales para datos de investigación, el desarrollo de ser-
vicios específi cos por disciplina para nutrir las comunidades nacionales de inves-
tigación y la optimización en la recolección, administración y gestión de datos y
metadatos.
En Estados Unidos se encuentra uno de los recursos de referencia en la pu-
blicación de datos primarios de investigación en acceso abierto, el Genbank, base
de datos de secuencias genéticas en funcionamiento desde 1982. Actualmente el
Genbank es gestionado por el National Institutes of Health (NIH) y trabaja cola-
borativamente con el DNA DataBank of Japan (DDBJ) y el Laboratorio Europeo
de Biología Molecular (European Molecular Biology Laboratory, EMBL), constitu-
yendo un recurso de gran prestigio entre los investigadores del área para difun-
dir los resultados primarios de sus investigaciones. Según datos de diciembre de
2010, dicha base de datos cuenta con 129.902.276 secuencias genéticas disponi-
bles para su consulta en acceso abierto (NCBI, 2010).
Entre los años 2005 y 2008, también comienza a crecer y consolidarse el vo-
lumen de datos de investigación como contenido en los RIs académicos. En el
informe del proyecto Making Institutional Repositories in A Collaborative Learning
Environment
(MIRACLE) desarrollado entre los años 2005 y 2008, se atribuye
dicho crecimiento al incremento del control institucional en el cumplimiento del
protocolo de depósito de los datos de investigación por parte del alumnado
(Markey y otros, 2007). Más recientemente, los proyectos emprendidos a nivel
de universidades, se orientan hacia la gestión de datos (data management) en
consonancia con los lineamientos sugeridos por la National Science Foundation
390 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
(NSF) en materia de publicación de datos de investigaciones fi nanciadas con di-
nero público. Por ejemplo, universidades tales como University of California,
University of Idaho
o University of Virginia, incluyen apartados específi cos en sus
sitios web con información práctica sobre la publicación de datos de investiga-
ción para los investigadores de sus comunidades académicas.
En julio del 2010, se ha dado a conocer en España una iniciativa pionera en
la publicación en acceso abierto de datos de investigación. A instancias de la
Estación Experimental Aula DEI (EEAD), instituto del Consejo Superior de Inves-
tigaciones Científi cas (CSIC) dedicado a la investigación en el sector agrícola, se
ha iniciado una colección denominada «Conjuntos de datos» en el RI Digital CSIC
(CSIC, 2010). Esta nueva colección contiene la base de datos SPEIbase con un
nuevo índice de sequía, el Standarized Precipitation-Evapotranspiration Index,
donde se incluyen los datos mensuales (desde enero de 1900 a la actualidad) y
cubre la totalidad de la superfi cie terrestre (exceptuando los polos) con una dis-
tribución en rejilla de 0,5º de latitud y longitud. La mencionada colección ofrece
para la consulta en abierto la SPEIbase en tres formatos distintos: texto, binario
y NetCDF (Network Common Data Form, formato específi co para la publicación
de datos atmosféricos).
Si bien las experiencias presentadas no son las únicas emprendidas en estos
países, como tampoco a nivel internacional, tienen como denominador común
evidenciar el creciente interés de las universidades e instituciones públicas por
hacer visible los resultados del proceso de investigación, contribuyendo de esta
forma a la consolidación de infraestructuras donde se accedan a los datos de
investigación en forma abierta.
Los RIs brindan una excelente oportunidad para dar un paso adelante en dar
acceso en abierto a los datos de investigación, posibilitando una tipifi cación y
descripción especializada de dichos datos y promoviendo la elaboración de ma-
nuales que fomenten las buenas prácticas en el desarrollo e implementación de
colecciones digitales con estos contenidos.
2.2. El proyecto CLARIN
Desde el año 1994 el Instituto Universitario de Lingüística Aplicada (IULA) es
un centro de investigación y formación de investigadores en el contexto de la
lingüística aplicada y, en particular, en las temáticas de especialización de los
investigadores del centro. Teniendo como marco la lingüística aplicada, los gru-
pos de investigación del Instituto trabajan en temas que, bajo distintas perspec-
tivas, se construyen en torno a cuatro ejes principales: comunicación, información,
lenguaje y tecnologías aplicadas. Específi camente, el grupo de Tecnologías de
los Recursos Lingüísticos (TRL) trabaja en la creación, desarrollo y aplicaciones
de las tecnologías relacionadas con la adquisición, producción, formalización,
gestión, validación y evaluación de los recursos lingüísticos necesarios en sistemas
de Procesamiento del Lenguaje Natural y Lingüística Computacional.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
391

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
El grupo TRL participa, desde el año 2004, en diversos proyectos competitivos
europeos tales como: Common Language Resources and Technologies Infrastruc-
ture
(CLARIN); CLARA Initial Training Network for Common Language Resources
and their Applications,
ambos dedicados a la creación de infraestructuras para la
investigación en humanidades y ciencias sociales; Platform for the Automatic,
Normalized Annotation and Cost-Effective Acquisition of Language Resources for
Human Language Technologies
(PANACEA); y Fostering Language Resources Net-
work
(FlaReNet).
De estos cuatro proyectos, el proyecto CLARIN es el marco bajo el cual se
plantea la iniciativa de la publicación en acceso abierto de los resultados de in-
vestigación como parte indispensable de una infraestructura para las humanidades
y ciencias sociales en general. CLARIN, fi nanciado por el 7PM de la Unión Eu-
ropea, se encuentra en el fi nal de su primera fase de carácter preparatorio (2008-
2010), donde se busca planifi car detalladamente la construcción de una infraes-
tructura científi ca, con una estimación de costos reales, defi nición del uso de la
red, identifi cación de los centros que la componen y de los recursos y las tec-
nologías que aseguren su funcionamiento estable. En las fases siguientes, se lle-
vará a cabo la construcción de la plataforma CLARIN y el desarrollo de prototipos
de aplicaciones (segunda fase), como también su posterior consolidación y ex-
plotación (tercera fase) (Bel y otros, 2008).
El objetivo de CLARIN, siguiendo el modelo de las infraestructuras promovi-
das por la e-ciencia en otras disciplinas, es el establecimiento de un escenario
adecuado que permita acceder a recursos lingüísticos existentes (textos e infor-
mación lingüística entendidos como datos de investigación), instrumentos para
su análisis y explotación. La infraestructura CLARIN se basa en la interacción de
los conceptos de tecnología grid, metadatos y servicios web. La tecnología grid
proporcionará un contexto de trabajo colaborativo donde se garantice la intero-
perabilidad de las aplicaciones y el acceso a los recursos lingüísticos, los meta-
datos permitirán la identifi cación y ubicación de dichos recursos, en tanto que
los servicios web posibilitarán su explotación. El desarrollo del entorno de tra-
bajo propuesto por CLARIN contribuiría a evitar el problema de la difi cultad de
conocer la existencia de recursos, herramientas y tecnologías lingüísticas y, por
tanto, evitar también la consecuente problemática que presenta para su visibili-
dad, acceso y disponibilidad.
2.2.1.
The Harvesting Day y el e-Repositori de la UPF
Esta problemática vinculada a la visibilidad, acceso y disponibilidad de los
recursos, herramientas y tecnologías lingüísticas no es un tema nuevo. Como
exponen Parra y otros (2009) en su artículo, a lo largo del tiempo se han ido
desarrollando diferentes iniciativas que buscan subsanar estos inconvenientes.
Es así que experiencias como el proyecto europeo European National Acti-
vities for Basic Language Resources (ENABLER) en el año 2003, el propio proyec-
to CLARIN, el catálogo universal de la European Language Resources Association
392 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
(ELRA), el registro del German Research Center for Artifi cial Intelligence (DFKI
GmbH), o la encuesta realizada por la Fostering Language Resources Network
(
FlaReNet), tienen como denominador común la preocupación por la identifi ca-
ción, descripción y acceso de los tecnologías, herramientas y recursos lingüísticos.
Temas tales como: altos costos de mantenimiento y gestión, difi cultad de acceso
a los datos de identifi cación y descripción, utilización no uniforme de esquemas
de metadatos, documentación no sistemática, e inestabilidad en el acceso y dis-
ponibilidad, permiten componer el mosaico de difi cultades existentes.
Las soluciones probadas hasta el momento no han proporcionado mejoras
sustanciales pero una posible vía de solución que va ganando adeptos es el for-
talecimiento del uso de los metadatos por parte de los proveedores de herra-
mientas, tecnologías y recursos lingüísticos. Una activa utilización de los metada-
tos permitiría obtener una descripción homogénea y unifi cada que pueda ser
automáticamente recolectada por los diversos catálogos y observatorios del área
y así ser descubierta por otros investigadores interesados.
Con esta fi nalidad el grupo TRL, como participante del proyecto CLARIN, ha
promovido dos estrategias. Por una lado una iniciativa denominada The Harves-
ting Day
realizada para facilitar la autogestión tanto en la descripción de recursos
y herramientas lingüísticas con metadatos como para su publicación en acceso
abierto para una posterior recolección automática. Y por otro la utilización del
RI de la UPF para la difusión en acceso abierto de datos primarios, recursos y
herramientas lingüísticas generadas en la propia universidad.
La iniciativa The Harvesting Day se sustenta en la realización de cuatro accio-
nes básicas: el establecimiento de un conjunto de metadatos mínimos; la descrip-
ción de recursos y herramientas lingüísticas de acuerdo con dicho conjunto de
metadatos; el archivo de estas descripciones en un formato XML (susceptible de
ser recopilado e interpretado automáticamente); y la implementación de una in-
fraestructura de fácil instalación que permita la recolección automática de las
descripciones de acuerdo con el protocolo OAI-PMH.
Cabe aclarar que el conjunto de metadatos mínimo no es un esquema propio
de metadatos, sino que es una versión simplifi cada de un esquema de metadatos
ya establecido en el área de los recursos lingüísticos, el de ENABLER, que a su
vez es compatible con otros esquemas de metadatos tales como ISOcat (del pro-
yecto CLARIN), OLAC y LREC-Map.
Adherirse a The Harvesting Day es tan sencillo como conectarse a su sitio
web [http://www.theharvestingday.eu/] y completar un formulario en línea por
cada recurso y/o herramienta lingüística que se tenga. Una vez se completa el
formulario se salva la información y se descarga un archivo XML que se guar-
da en el ordenador del proveedor. Si estos datos se quieren ubicar en acceso
abierto para su recolección automática, se debe descargar una aplicación au-
toejecutable que permite al proveedor instalar un servidor propio. En el año
2010, los días 21 de julio y 21 de setiembre, fueron realizadas dos campañas
de recolección automática de descripciones de recursos y herramientas lingüís-
ticas.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
393

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
La utilización del e-Repositori de la UPF [http://repositori.upf.edu/] para la
difusión de datos primarios, recursos y herramientas lingüísticas generadas en la
propia universidad tiene dos fi nalidades complementarias. En primer lugar, bus-
ca estudiar la capacidad del repositorio institucional como infraestructura cientí-
fi ca para disponer de dichos materiales resultantes de la investigación. En segun-
do lugar, intenta posicionar como producto de la investigación a dichos objetos
digitales, hasta ahora medianamente visibles a través de la página web del insti-
tuto de investigación correspondiente, en el caso de recursos y herramientas, o
encapsulados en otros objetos digitales, como es el caso de los datos primarios
de investigación de los anexos de las tesis.
2.3. La comunidad «Recursos y datos primarios de investigación»
El proyecto del RI de la UPF (e-Repositori) comienza su funcionamiento pú-
blico el 19 de mayo de 2009, tras un proceso de desarrollo llevado a cabo por
la Biblioteca y el Servicio de Informática de la Universitat Pompeu Fabra. En
enero del presente año, el e-Repositori da acceso a 4.613 ítems depositados.
La misión del e-Repositori es recoger, difundir y preservar la producción in-
telectual en formato digital que resulta de la actividad académica e investigadora
de la universidad, las revistas científi cas y las publicaciones institucionales. Dicha
iniciativa complementa las funciones del Portal de Producción Científi ca (PPC),
que tiene entre sus objetivos el de contribuir a la visibilidad de la producción
científi ca de la UPF.
El RI incluye objetos digitales en acceso abierto tanto recolectados de los
repositorios consorciados que están funcionando, como documentación introdu-
cida directamente por la institución. El contenido en el RI se organiza a partir de
espacios virtuales, denominados comunidades, en los cuales se agrupan los ma-
teriales digitales de acuerdo a su ámbito (docencia, investigación, vida universi-
taria, contenidos institucionales) y también a su tipología (artículos de revista,
tesis, working papers).
Las comunidades que forman en la actualidad el e-Repositori son las siguientes:
Docencia: reúne materiales docentes e informes sobre docencia producidos
por el profesorado y el personal de administración y servicios. Estos materiales
también se encuentran disponibles en Materials Docents en Xarxa (MDX), repo-
sitorio cooperativo del Consorcio de Bibliotecas Universitarias de Cataluña (CBUC).
Investigación (artículos, congresos, libros): incluye documentos resultantes de
la investigación como son artículos de revista, libros, comunicaciones, ponencias
o pósters presentados en jornadas y congresos, etc.
Investigación (tesis): incluye las tesis doctorales leídas en la universidad. Tam-
bién se encuentran disponibles en Tesis doctorales en red (TDR), repositorio
cooperativo gestionado por el Consorcio de Bibliotecas Universitarias de Catalu-
ña (CBUC) y el Centro de Supercomputación de Cataluña (CESCA).
394 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
Investigación (working papers, PFC, etc.): documentos de investigación como
working papers, informes de investigación, artículos aún no publicados (preprints),
comunicaciones de congresos, proyectos de fi n de carrera, memorias técnicas,
etc. También se encuentran disponibles en Recercat: Dipòsit de la Recerca a Ca-
talunya.
Revistas científi cas: artículos de las revistas científi cas publicadas por la uni-
versidad o con su colaboración. También se encuentran disponibles en RACO:
Revistes Catalanes amb Accés Obert.
Contenidos institucionales: documentación institucional y/o administrativa de
la universidad (memorias, informes, discursos, conferencias, etc.)
Vida universitaria: documentos y materiales audiovisuales resultado de las
actividades socioacadémicas y de participación de los estudiantes de la univer sidad.
La implementación de una nueva comunidad en el e-Repositori, dedicada a la
publicación de datos de investigación, es el resultado de la conjunción de intere-
ses de dos colectivos institucionales. Por un lado, el interés por parte de los pro-
fesionales encargados de la gestión del RI que buscan tanto dotarlo de la máxima
variedad de contenidos institucionales (con el objetivo de ofrecer a la comunidad
académica en general una visión completa de la producción científi ca e institucio-
nal de la UPF) así como también el acceso y la preservación a largo plazo dicha
producción. Por otro lado, el interés de un grupo de investigación de la UPF pre-
ocupado también por asegurar el acceso y la preservación de los datos resultan-
tes de la investigación, pero, además, con idea de facilitar la validación de dichos
datos, incrementar la visibilidad de los resultados de las investigaciones así como
posibilitar la búsqueda y recuperación por parte de otros investigadores (de la
propia universidad o de la comunidad académica en general).
Para lograr que el conjunto de ambos intereses, distintos pero complementa-
rios, confl uyeran en una misma propuesta, se llevaron a cabo una serie de en-
trevistas donde se puntualizaron marcos comunes de acción y pautas para el
trabajo colaborativo. Fruto de esta tarea de gestión y trabajo colaborativo entre
ambos colectivos se implementa la creación de la comunidad «Recursos y datos
primarios de investigación».
La experiencia piloto de publicar los datos de investigación en acceso abier-
to se inicia con la creación de dos colecciones de materiales generados a partir
de las actividades de investigación del IULA, pero la idea de futuro es que otros
departamentos, institutos u órganos de la universidad sumen sus resultados de
investigación, y así mostrar otro aspecto más sobre la investigación desarrollada
en la UPF a la comunidad académica en general.
Las dos nuevas colecciones tienen contenidos relativos a la investigación, ya
sean datos primarios, recursos o herramientas lingüísticas o de áreas afi nes, pero
con un origen diferente: las tesis doctorales y los proyectos de investigación.
No obstante, cabe aclarar que existen dos limitaciones relacionadas con el
proyecto CLARIN que afectan desde el punto de partida la implementación de
ambas colecciones.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
395

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
La primera limitación la constituye la temporalización prevista para la realiza-
ción del estudio de caso, que se encuentra ligada al calendario de plazos del
proyecto CLARIN el cual acaba su fase preparatoria en diciembre de 2010. De-
bido a esta restricción temporal no se ha podido proponer una adaptación, para
obtener una estructura más en consonancia con los nuevos contenidos, en la
confi guración del programa del e-Repositori.
La segunda limitación la constituye la propia especialización de los recursos
y herramientas lingüísticas. Si bien el programa de gestión (DSpace) del e-Re-
positori permite la adición de otro esquema de metadatos complementario, los
tiempos de implementación de esta solución exceden la temporalización previs-
ta para la realización del presente estudio de caso. El uso de un esquema de
metadatos de amplia difusión, como el Dublin Core, es una garantía de intero-
perabilidad en la recolección automática de datos, pero también presenta una
faceta negativa en la descripción y recuperación de información con requeri-
mientos temáticos especializados. Para solventar dicho desajuste se planteó el
mapeo de ambos esquemas de metadatos, con la consecuente pérdida de espe-
cifi cidad en la descripción y recuperación especializada de los datos de inves-
tigación.
El resultado del mapeo se muestra en la siguiente tabla:
TABLA I
Mapeo entre esquema de metadatos CLARIN y Dublin Core
Clarin
Dublin Core
Resource Title
Title
Url
Identifi er
Organization
Publisher
Language
Language
Format
Format
Resource Type
Type
Lexicon Type
Type
Corpus Type
Type
Domain
Subject
Information Contained
Subject
Annotation Level Type
Subject
Operations
Subject
396 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834


La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
Las celdas de la tabla marcadas con fondo gris contienen los metadatos CLARIN
que no tienen equivalencia con los metadatos Dublin Core. Sin embargo, se ha
adaptado el mapeo para que se redireccionaran hacia otros metadatos semántica-
mente compatibles. El metadato que se ha encontrado más apropiado para incluir
dicha información, en el esquema Dublin Core, es el de palabra clave (dc.subject).
Dado el carácter especializado de los metadatos CLARIN, se ha agregado automá-
ticamente, mediante script, una etiqueta que identifi ca el tipo de información es-
pecifi cada en el valor del metadato. Las etiquetas de especifi cación agregadas a los
metadatos son: Information Contained, AnnotationLevel y Operations. (fi gura 3).
FIGURA 3
Impresión de pantalla del registro en el repositorio institucional: recurso
lingüístico (formato ampliado). Metadatos con etiquetas de especifi cación en
los valores
Se puede acceder al esquema completo de metadatos en la siguiente direc-
ción: [http://theharvestingday.eu/schemas/clarin_bamdes-1.1.xsd].
El estudio de la implementación y desarrollo de ambas colecciones se realiza
teniendo en cuenta los siguientes ítems: contenido, proceso de incorporación,
formato de visualización, resultados y propuestas de mejora.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
397

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
2.3.1. La colección «IULA. Herramientas y recursos»
Contenido
Es una colección donde se recopilan los recursos y herramientas generadas
por los diferentes grupos de investigación del IULA en los proyectos de investi-
gación llevados a cabo. Se encuentran recursos y herramientas tales como corpus
lingüísticos (orales y escritos), gestores de diccionarios, vocabularios, plataformas
de trabajo, gestores de índices y mapas conceptuales, herramientas para proce-
samiento lingüístico, etc. Actualmente la colección cuenta con 34 ítems.
Dichas herramientas y recursos, además de incorporarse como colección en
el RI, ya estaban accesibles desde la página principal del sitio web del Instituto
en el apartado «Recursos. IULA» [http://www.iula.upf.edu/recurs06ca.htm]. Asimis-
mo, los ítems de esta colección también constituyeron la materia prima para la
participación en la iniciativa Harvesting Day, para lo cual se describieron siguien-
do el esquema de metadatos propuesto por el proyecto CLARIN. Por consiguien-
te, se realizó la descripción de cada uno de los recursos y herramientas a través
del formulario web y se generaron los archivos XML que fueron guardados en
el servidor del grupo de investigación TRL para su futura recolección automática.
Proceso de incorporación
Dado que las herramientas y recursos incluidos en la colección ya estaban
descritos según el esquema de metadatos CLARIN (para participar en la iniciativa
Harvesting Day, véase apartado 2.2.1), fue necesaria la creación de un script para
gestionar las equivalencias de mapeo con Dublin Core.
Tras pasar el script de mapeo se generaron los archivos XML que permitieron
la recolección automática de metadatos compatible con el esquema Dublin Core.
Formato de visualización
La visualización de las entradas en el RI tiene dos formatos: el primero, por
defecto, con un conjunto de metadatos básico y el segundo, disponible en la
opción «Mostrar el registro completo del documento», con un conjunto de meta-
datos más amplio.
Los metadatos visibles en el formato básico, como se muestra en la fi gura 4,
son: título, fecha, citación (donde se exportan los datos al programa de citación
bibliográfi ca Ref Works) y el vínculo que enlaza con el recurso o herramienta en
cuestión.
En cambio los metadatos visibles en el formato ampliado, como se muestra
en la fi gura 5, son: fecha (de publicación, de modifi cación, de incorporación y
de disponibilidad), identifi cador persistente Handle, descripción (procedencia),
formato, lengua (código ISO), editor, materia, título, tipo y el vínculo que enlaza
con el recurso o herramienta en cuestión.
398 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834


La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
FIGURA 4
Impresión de pantalla de un registro del repositorio institucional: recurso
lingüístico (formato básico)
Cabe destacar que las etiquetas de especifi cación agregadas al valor del me-
tadato dc.subject son recuperables tanto a través de la opción de búsqueda como
por el índice predeterminado de materias. Por tanto, las especifi caciones temáticas
que se habían mapeado del esquema de metadatos CLARIN a Dublin Core cons-
tituyen una mejora en la visibilidad, búsqueda y recuperación de dichos recursos.
Resultados y propuestas de mejora
Los objetos digitales de la colección tienen tres características fundamentales:
presentan un conjunto de datos diferente de identifi cación, la ubicación física no
se encuentra en el servidor del repositorio institucional y los derechos de autor
no están identifi cados.
Tener un conjunto de datos de identifi cación atípico produce vacíos de in-
formación en los recursos de búsqueda predeterminados en el RI. Por ejemplo,
en los recursos y herramientas lingüísticas se produce una situación poco común
a nivel documental, dada su naturaleza, pues no cuentan con un autor identifi -
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
399


SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
FIGURA 5
Impresión de pantalla de un registro del repositorio institucional: recurso
lingüístico (formato ampliado)
cado. Esta situación provoca que dichos objetos digitales no incluyan el metada-
to necesario para que tengan presencia tanto en las opciones de búsqueda (sim-
ple y avanzada) como en los índices predeterminados del RI, entre los cuales
fi gura el de autores. Una posible mejora para incrementar las opciones de recu-
peración de este tipo de objetos digitales seria ampliar la lista de índices prede-
terminados, por ejemplo, con la adición de un índice por tipología (a partir del
metadato dc.type), debido a la importancia que adquiere dicho metadato para
recuperar contenido en colecciones digitales cada vez más diversifi cadas.
Con relación a que la ubicación física no se encuentre en el servidor del RI, sino
en servidores nativos en donde fueron generados y funcionan, implica una cierta
sombra de duda sobre su persistencia y accesibilidad. No obstante, conjuntamente
con el personal de gestión del repositorio, se tuvo en cuenta que son recursos y
herramientas con un probado funcionamiento y uso por parte de la comunidad in-
vestigadora, por lo cual no se darían de baja de los servidores nativos. Como proyec-
ción de futuro, a nivel institucional, quizá se debería plantear la necesidad de con-
tar con un servidor dedicado a los datos y aplicaciones generadas en la universidad.
400 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
La identifi cación imprecisa de los derechos de autor tiene su explicación en
que dichos recursos y herramientas fueron generados para realizar un uso libre
de ellos, pero esta condición no fue refl ejada en una declaración de derechos de
autor o licencia de uso explícita y de libre acceso. Esta «ausencia» aparente de
derechos puede ser el punto de partida para debatir, a nivel institucional, sobre
cómo deben publicarse este tipo de objetos digitales, los recursos y herramientas
lingüísticas y si es posible aplicar licencias Creative Commons, Scientifi c Commons
o si es necesario crear un grupo específi co de licencias.
2.3.2. La colección «IULA. Datos primarios de las tesis doctorales»
Contenido
Las tesis son materiales que tienen gran importancia a nivel de producción
científi ca debido a que son trabajos realizados a partir de una investigación ori-
ginal y especializada, cuya fi nalidad última es aportar nuevos conocimientos a
un área temática específi ca. Si bien su acceso, difusión y preservación ya tienen
un camino consolidado en el ámbito de los RIs (y repositorios cooperativos), los
contenidos accesibles son principalmente el texto completo acompañado de una
descripción donde no fi guran los materiales anexos, los cuales generalmente re-
producen los datos generados durante el transcurso de la investigación.
Quizá no todas las tesis contienen anexos con datos primarios susceptibles
de publicar, ya sea por la naturaleza del contenido de la tesis o por los derechos
de autor de terceras partes, pero en cualquier caso, de existir dichos materiales
se quedan fuera de los circuitos actuales de acceso, difusión y preservación de
la producción científi ca en acceso abierto.
El IULA, a diciembre de 2010, cuenta con 39 tesis doctorales defendidas. Para
la inclusión de los anexos en la colección del repositorio se fi jaron como condi-
ciones:
a) Que los anexos fueran herramientas o recursos lingüísticos o de áreas
afi nes con capacidad para ser reutilizados por otros investigadores.
b) Que no estuvieran sujetos a derechos de autor de terceros.
Teniendo en cuenta ambos criterios, fi nalmente se solicitó la autorización
a ocho autores de tesis doctorales. Se les envió una carta, de estructura similar a
la que se envía para el depósito de las tesis en el repositorio cooperativo de
tesis electrónicas Tesis doctorales en Red (TDR), donde se indicaba expresamen-
te sobre que anexos se solicitaba la autorización para publicarlos en el RI. Luego
de realizar dicha gestión se obtuvieron seis respuestas positivas.
Los anexos que se incluyen en el estudio de caso son un código fuente de pro-
grama, dos bases de datos Access y cuatro interfaces en HTML de consulta. Una
de las tesis tiene dos anexos incluidos en el estudio, una base de datos y una in-
terfaz HTML de acceso a datos primarios. Actualmente la colección incluye 6 ítems.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
401

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
Proceso de incorporación
Debido a que dichos objetos digitales se encontraban en el CD-ROM adjunto
de las tesis, como tarea previa se recuperaron los archivos que constituían los
anexos que podían formar parte del estudio. Dada su variada tipología, a suge-
rencia del personal encargado de la gestión del repositorio, se incluyó el con-
junto de archivos que conformaba un anexo determinado en un solo archivo zip,
el cual fue publicado en el RI. Además de dicho archivo comprimido, el personal
encargado de la gestión del repositorio, incluiría un enlace para ejecutar la apli-
cación directamente en los casos en que fuera necesario, por ejemplo, en las
interfaces HTML de consulta a los datos primarios.
Cada uno de los anexos fue introducido en el e-Repositori de forma manual,
a través del formulario de entrada de datos.
Formato de visualización
La visualización de las entradas en el RI tiene dos formatos habilitados, el
primero por defecto, con un conjunto de metadatos básico y el segundo dispo-
nible en la opción «Mostrar el registro completo del documento», con un conjun-
to de metadatos más amplio.
Los metadatos visibles en el formato básico, como se muestra en la fi gura 6,
son: título, autor, descripción, fecha, citación (donde se exportan los datos al
programa de citación bibliográfi ca Ref Works), identifi cador persistente Handle,
mención de derechos y enlace al fi chero publicado.
En tanto, los metadatos visibles en el formato ampliado, como se muestra en
la fi gura 7, son: fecha (de publicación, de modifi cación, de incorporación y de
disponibilidad), identifi cador persistente Handle, descripción, descripción (pro-
cedencia), formato, lengua (código ISO), mención de derechos, título, tipo, pa-
labras clave y enlace al fi chero publicado.
Cabe recordar, que los metadatos presentes en ambos formatos de visualiza-
ción (básico y ampliado), son recuperables tanto por la opción de búsqueda
(simple y avanzada) como por los índices predeterminados (en el caso de me-
tadatos relativos a los autores, títulos, materias y fecha de publicación). Destaca
la posibilidad de realizar búsquedas por los valores del metadato dc.type, con lo
cual se incrementa la posibilidad de recuperar concretamente datos primarios
entre la diversidad de contenidos posibles del RI.
Resultados y propuestas de mejora
Los anexos de las tesis incluidos en el estudio son objetos digitales de dife-
rente naturaleza y con distintos formatos: código fuente en Perl, intefaces HTML
y bases de datos Access, que se encuentran guardados en el CD-ROM de anexos
que incluyen las tesis doctorales.
402 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834


La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
FIGURA 6
Impresión de pantalla de un registro del repositorio institucional: anexo tesis
doctoral (formato básico)
Debido a que son materiales digitales con formatos y tipos no tradicionales
en la producción científi ca en general, se debería contar, además de las posibi-
lidades de búsqueda (simple y avanzada), con índices predeterminados de otros
metadatos más útiles para la recuperación, por ejemplo dc.type.
De la misma forma, motivado por su diversa naturaleza y formato, sería ade-
cuado agregar metadatos al formato básico de visualización, por ejemplo la des-
cripción. Dicho elemento descriptivo ayudaría a la comprensión de objetos digi-
tales con una cierta complejidad dada por su carácter especializado.
3. Conclusiones y perspectivas de futuro
Los RIs comienzan a consolidar su presencia como infraestructuras científi cas
de la mano de la progresiva publicación de datos de investigación en abierto.
Muestra de ello son los múltiples proyectos e iniciativas emprendidos tanto a
nivel institucional como gubernamental en diversos países, de los cuales hemos
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
403


SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
FIGURA 7
Impresión de pantalla de un registro del repositorio institucional:
anexo tesis doctoral (formato ampliado)
mencionado una breve muestra (eBank UK, DISC-UK DataShare, Australian Na-
tional Data Service
, Genbank, CSIC). La realización del presente estudio de caso
pretende contribuir de forma práctica, al desarrollo y diversifi cación de los RIs
en su papel de infraestructura científi ca de apoyo para la visibilidad, acceso y
gestión de la producción científi ca institucional, cualquiera que sea su formato.
Es evidente que con la implementación de las colecciones se han obtenido be-
nefi cios, pero también se han abierto nuevas incógnitas y problemáticas por resolver.
En el ámbito de los benefi cios obtenidos de esta iniciativa, en primer lugar
cabe mencionar el logro de hacer visibles y accesibles los datos, recursos y he-
rramientas de investigación como parte de la producción científi ca de la UPF. De
otro modo, en el mejor de los casos para recursos y herramientas, solamente
estarían presentes en las páginas web de los grupos de investigación, y, en el
peor de los casos, para los datos primarios de investigación, seguirían ocultos en
los CD-ROMs anexos a las tesis.
En segundo lugar, también reporta un benefi cio la asignación de un identifi -
cador Handle al ser incluidos en el RI datos primarios y recursos lingüísticos, con
el cual se ayuda a su persistencia y accesibilidad a largo plazo. Sin embargo, aún
404 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
queda refl exionar sobre el tema de la ubicación física de los recursos y herra-
mientas lingüísticas, las cuales se encuentran en los servidores nativos donde
fueron creadas y son utilizadas. En este sentido, en parte también dependiendo
de la suma de otras áreas disciplinarias de la institución a dicha iniciativa, se
debería estudiar la posibilidad de contar con un servidor propio para los datos
y aplicaciones generadas en la universidad.
Por último, también es un benefi cio la posibilidad de recolectar automática-
mente, por parte de otros repositorios, las descripciones de tales materiales. Esto
facilita la difusión y conocimiento de este tipo de producción científi ca, incre-
mentando las posibilidades de reutilización en otras investigaciones.
Como problemática de base a resolver, se presenta la fl exibilización de la
confi guración de los programas gestores de los repositorios. En general, dichos
programas cuentan con una confi guración ligada al depósito de objetos digitales
de tipo publicación o multimedia, característica que los limita en la actualidad
debido a la diversifi cación de contenidos que puede albergar un RI. Particular-
mente en el presente estudio de caso, la estructura del programa gestor del re-
positorio (el e-Repositori) vincula tanto los formularios de entrada de datos como
los metadatos de búsqueda e índices predeterminados al esquema de metadatos
Dublin Core representando una difi cultad. Dicha restricción constituye una limi-
tación importante para la publicación en abierto de los datos de investigación,
recursos o herramientas, que debido a su carácter fuertemente especializado ne-
cesitan de una descripción con mayor detalle, para así propiciar su búsqueda y
recuperación por parte de otros investigadores de la misma área temática.
Otro tema sobre el cual es necesario realizar un análisis profundo, es la iden-
tifi cación compleja de los derechos de autor en relación con los objetos digitales
que no son publicaciones. Actualmente, con las posibilidades de publicación en
acceso abierto, los investigadores deben plantearse la necesidad de establecer los
derechos y tipos de licencia que sus datos primarios, recursos o herramientas
tienen para que puedan ser reutilizados en otras investigaciones. Si bien el equi-
po de trabajo de personas encargadas de la gestión del e-Repositori también
cuenta con especialistas en derechos de autor, es necesario que esta cuestión sea
refl exionada tanto a nivel institucional como por los propios creadores, los in-
vestigadores, estableciendo pautas y protocolos sobre la posibilidad de adjudicar
licencias Creative Commons, Scientifi c Commons o, si es necesario, crear un gru-
po específi co de licencias.
Una última cuestión para refl exionar y debatir es el tema de los formatos de
los datos primarios. Actualmente estos datos quedan relegados en los CD-ROMs
anexos a las tesis, razón por la cual no existe una real preocupación por su acce-
sibilidad más allá de la consulta del propio CD-ROM. Con las posibilidades que se
abren si dichos datos se incorporan a los RIs, es necesario planifi car las formas en
las cuales se puede garantizar la accesibilidad a largo plazo de dichos contenidos.
Esta es la razón por la cual los futuros protocolos, que pauten la presentación de
las tesis y sus anexos, deben tener en cuenta la gestión de los datos primarios
tanto para su inclusión en la tesis como para su posterior incorporación a un RI.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
405

SILVIA ARANO, GEMMA MARTÍNEZ, MARINA LOSADA, MARTA VILLEGAS, ANNA CASALDÀLIGA y NÚRIA BEL
Sin embargo, más allá de la existencia de cuestiones que no son fáciles de
solventar, sí existen ciertas medidas que pueden adoptarse a mediano plazo y
que posibilitarían la resolución de algunas de ellas.
Dada la posibilidad de publicar datos de investigación, recursos y herramien-
tas en el RI, sería benefi cioso revisar la política de depósito de materiales digi-
tales en el e-Repositori, como también las normativas de depósito de trabajos de
fi nal de carrera y tesis doctorales. En ambos protocolos sería necesario detallar
cómo deben ser las estructuras, formatos y licencias de explotación, en un len-
guaje claro y sencillo, previendo posibles lagunas de conocimiento técnico de
los investigadores.
En función del éxito y acogida de la implementación de una comunidad en
el RI de la UPF para los datos de investigación, se podría comenzar a pensar a
nivel institucional en la implementación de diversas soluciones. A modo de ejem-
plo, el estudio de caso propone la implementación de una estructurada federada
de repositorio y catálogos o bases de datos por áreas temáticas a nivel institu-
cional, para garantizar, por un lado, los temas de accesibilidad, persistencia y
seguridad, y, por otro, la necesidad de descripciones detalladas para favorecer la
búsqueda y recuperación en entornos especializados.
Como primera medida a adoptar se propone el fortalecimiento del RI de cara
a que mejore el tratamiento de datos y aplicaciones, además de los contenidos
actuales de texto y multimedia. Dicha mejora garantizaría la persistencia, accesi-
bilidad y seguridad en torno a la gestión de datos y aplicaciones a nivel institu-
cional, a la vez que permitiría acceder a una descripción básica de cada ítem
según el esquema de metadatos Dublin Core. Paralelamente, cada área discipli-
naria de la institución podría contar con catálogos propios donde se pudieran
describir en forma detallada y con esquemas de metadatos especializados los da-
tos y aplicaciones específi cas del área, para incrementar las opciones de búsque-
da y recuperación por parte de otros investigadores del área en cuestión. Cada
área disciplinaria actuaría como un agente intermediario (broker), donde propor-
cionaría el entorno adecuado para realizar búsquedas especializadas, pero también
se utilizaría el RI para otorgar el acceso a los datos o aplicaciones. De esta forma,
se podrían satisfacer tanto las preocupaciones institucionales de gestión de dichos
objetos digitales, como las de los investigadores de la búsqueda y recuperación
especializadas, en defi nitiva del descubrimiento por parte de otros investigadores
de su producción científi ca de datos primarios, recursos y aplicaciones.
La realización del presente estudio de caso solamente ha abordado algunas de
las cuestiones que involucra utilizar un RI para la publicación de datos primarios,
recursos y herramientas en acceso abierto. Aún quedan cuestiones por resolver y
se perciben nuevos temas a tratar, tales como la integración de los repositorios
en otras infraestructuras científi cas, la concienciación de la importancia de la asig-
nación de metadatos para posibilitar la búsqueda y recuperación por parte de
otros investigadores así como la necesidad de preservar y conservar institucional-
mente a largo plazo los datos primarios y la determinación de los roles y respon-
sabilidades de los encargados e interlocutores de la gestión de dichos datos.
406 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834

La comunidad «Recursos y datos primarios» de la Universidad Pompeu Fabra...
4. Agradecimientos
Este trabajo ha sido desarrollado en el marco del proyecto CLARIN, proyecto
co-fi nanciado por el Ministerio de Ciencia y Tecnología (ACI2009-0995) de Espa-
ña, por la Generalitat de Catalunya, y por la Unión Europea (FP7-INFRASTRUC-
TURES-2007-1-212230).
5. Bibliografía
Bel, N.; Bel, S.; Espeja, S.; Marimon, M., y Villegas, M. (2008): El proyecto CLARIN: una
infraestructura de investigación científi ca para las humanidades y las ciencias sociales.
Digithum (10). http://www.uoc.edu/digithum/10/dt/esp/bel_bel_espeja_marimon_vi-
llegas.pdf [consulta: 20 de noviembre de 2010].
CSIC (2010): La investigación en abierto: dos nuevas colecciones en Digital.CSIC. CSIC
Abierto (1), 1-5. http://hdl.handle.net/10261/26261 [consulta: 28 de octubre de 2010].
CRIG (2008): JISC Common Repository Interfaces Group (CRIG). http://www.ukoln.ac.uk/
repositories/digirep/index/CRIG [consulta: 26 de noviembre de 2010].
Green, Ann; Macdonald, S., y Rice, R. (2009): Policy-making for Research Data in Reposi-
tories: A Guide: version 1.2. Londres: JISC, 40. http://www.disc-uk.org/docs/guide.pdf
[consulta: 28 de octubre de 2010].
Hey, T.; Tansley, S., y Tolle, K. (eds.) (2009): The Fourth Paradigm: Data-Intensive Scien-
tifi c Discovery. Redmond Wash: Microsoft Research, 252. http://research.microsoft.com/
en-us/UM/redmond/about/collaboration/fourthparadigm/4th_PARADIGM_BOOK_
complete_HR.pdf [consulta: 28 de octubre de 2010].
Markey, K.; Rieh, S. R.; St. Jean, B.; Kim, J., y Yakel, E. (2007): Census of Institutional
Repositories in the United States: MIRACLE Project Research Findings. Washington, D.C.;
Council on Library and Information Resources, 167. http://www.clir.org/pubs/reports/
pub140/contents.html [consulta: 28 de octubre de 2010].
Melero, R.; Abadal, E.; Abad, F., y Rodríguez-Gairín, J. M. (2009): Situación de los reposito-
rios institucionales en España: informe 2009 [s.I.]; Grupo de investigación Acceso Abier-
to a la Ciencia, 54. http://hdl.handle.net/10261/11354 [consulta: 28 de octubre de 2010].
NCBI (2010): NCBI-GenBank Flat File Release 181.0. Distribution Release Notes. Bethesda:
National Library of Medicine. ftp://ftp.ncbi.nih.gov/genbank/gbrel.txt [consulta: 19 de
enero de 2011].
Parra, C.; Villegas, M., y Bel, N. (2009): The Basic Metadata Description (BAMDES) and
TheHarvestingDay.eu: Towards Sustainability and Visibility of LRT. Proceedings Seven-
th Conference on International Language Resources and Evaluation (LREC’10)
, 49-53.
Valletta, Malta: ELRA. http://www.lrec-conf.org/proceedings/lrec2010/workshops/W20.
pdf [consulta: 20 de noviembre de 2010].
Rice, R. (2007): DISC-UK Datashare Project: Building Exemplars for Institutional Data Re-
positories in the UK. IASSIST Quarterly, 31 (3/4), Fall & Winter 2007, 21-27. http://
www.iassistdata.org/downloads/iqvol313rice.pdf [consulta: 28 de octubre de 2010].
RIN (2008): Stewardship of digital research data – principles and guidelines. Londres: RIN.
15. http://www.rin.ac.uk/system/fi les/attachments/Stewardship-data-guidelines.pdf
[consulta: 28 de octubre de 2010].
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 385-407, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.834
407

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 408-425, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
La productividad científi ca argentina en Ciencias
Sociales: Economía, Psicología, Sociología y Ciencia
Política en el CONICET (2004-2008)

Ernesto R. Gantman*
Resumen: Este trabajo analiza una base de datos elaborada por el autor a partir de los
curriculum vitae de 414 investigadores argentinos en economía, sociología, ciencia po-
lítica y psicología con afi liación institucional en el Consejo Nacional de Investigaciones
Científi cas y Técnicas (CONICET). Se examinan los patrones de publicación de dichos
investigadores, revelándose diferentes patrones por disciplina científi ca. Además, se
presenta un análisis de regresión multivariado, cuyos resultados indican que el lugar
de formación doctoral de los investigadores está asociado en forma positiva y estadís-
ticamente signifi cativa al circuito de revistas científi cas en las que los mismos publican.
Palabras clave: productividad científi ca, Ciencias Sociales, Argentina, países en desarrollo.
Scientifi c productivity of Social Sciences in Argentina: Economics,
Psychology, Sociology, and Political Science in the CONICET
(2004-2008)

Abstract: This study analyses a dataset elaborated by the author, using as sources the CVs
of 414 Argentine researchers in economics, sociology, political science, and psychology
affi liated with the Consejo Nacional de Investigaciones Científi cas y Técnicas (CONICET).
The fi ndings indicate that the researchers’ publication patterns vary across the different
scientifi c disciplines. Moreover, a multivariate regression analysis reveals that the place
where the researchers’ doctoral studies occurred has a positive and statistically signifi cant
association with the circuit of scholarly journals in which they choose to publish.

Keywords: scientifi c productivity, social sciences, Argentina, developing countries.
1. Introducción
Es una creencia ampliamente aceptada que las ciencias sociales tienen carac-
terísticas idiosincrásicas distintivas de acuerdo a su origen nacional o regional. No
suele hablarse de una química alemana como diferente a una química italiana o
estadounidense, pero sí es posible pensar en una sociología francesa, una socio-
logía anglo-americana o una sociología latinoamericana (Sztompka, 2009). Más
* Universidad de Buenos Aires. Universidad de Belgrano. Argentina. Correo-e: ernesto.gantman@
comunidad.ub.edu.ar.
Recibido: 27-12-2010; 2.ª versión: 09-05-2011; aceptado; 11-05-2011.
408

La productividad científi ca argentina en Ciencias Sociales...
allá de eventuales diferencias en contenido, marcos teóricos o enfoques metodo-
lógicos, las características nacionales de la producción en ciencias sociales tienen
un correlato en diferentes hábitos de publicación por parte de los científi cos que
las practican. Así, Hicks (2004) en su distinción entre distintas literaturas en las
ciencias sociales señala que hay un corpus internacional y un corpus local de
publicaciones en revistas científi cas con referato. En este sentido, el hecho de que
la producción de los científi cos sociales que no se desempeñan en instituciones
del mundo anglosajón no se vea adecuadamente representada en las bases de
datos internacionales que recopilan información sobre la producción en revistas
científi cas genera un problema (Narvaez-Berthelemot y Russell, 2001; Sancho, 1992;
Sanz et al. 2002; Van Leeuwen et al., 2001). Las bases internacionales no resultan,
entonces, muy útiles a la hora de evaluar la producción de los científi cos sociales
que no pertenecen al mundo anglosajón. El análisis bibliométrico de la cobertura
de publicaciones científi cas en bases internacionales como el Social Sciences Ci-
tation Index (SSCI) demuestra que este problema resulta especialmente grave en
las ciencias sociales (Archambault et al, 2006; Archambault y Larivière, 2010; Kahn,
2010). Este sesgo de la cobertura de publicaciones locales implica la invisibilidad
de los investigadores en ciencias sociales que trabajan en países en desarrollo. En
el caso de los mismos, la ausencia de visibilidad puede deberse a diversos moti-
vos: baja calidad de las publicaciones científi cas locales o problemas propios de
la administración de dichas revistas, como la falta de fondos para sostener una
periodicidad de aparición adecuada (Vessuri, 1995).
Si la producción en ciencias sociales nacionales de países no anglosajones no
está adecuadamente refl ejada en lo que Shenhav y Kamens (1991) han denomina-
do el núcleo institucionalizado de la producción científi ca, resulta importante cuan-
tifi car, en casos particulares, cuál es el nivel de participación en la literatura inter-
nacional (supuestamente de superior calidad) frente al grado de participación en
la literatura local. Sin embargo, los estudios descriptivos de los patrones de publi-
caciones de investigadores de países en desarrollo (por ej., Molteni y Zulueta, 2002;
Sanz Casado y Conforti, 2005) son bastante escasos. Por ello, en este trabajo se
intenta responder a esta cuestión a través del análisis empírico, utilizando datos de
curriculum vitae de investigadores en ciencias sociales de un país en desarrollo, la
República Argentina. Dicha estrategia metodológica permite obtener más informa-
ción que la usualmente disponible en las bases científi cas internacionales (Gaillard,
1992; Dietz y otros, 2003). Por otra parte, esta fuente de recolección de datos per-
mite, adicionalmente, abordar otro interrogante relacionado: ¿qué factores explican
la elección geográfi ca de revistas científi cas por parte de los investigadores?
2. Material y metodos
A partir de información proveniente del sitio web del Consejo Nacional de
Investigaciones Científi cas y Técnicas (CONICET) de la República Argentina se
obtuvieron datos de las publicaciones realizadas por 414 investigadores afi liados
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
409

ERNESTO R. GANTMAN
a dicha institución: 199 de la disciplina sociología (clasifi cación KS5), 76 de eco-
nomía (clasifi cación KS6), 57 de psicología (subdisciplina 5300 y desagregadas)
y 83 de ciencia política y relaciones internaciones (subdisciplina 5400 y desagre-
gadas). Esta información surge de los curriculum vitae resumidos de los investi-
gadores, recopilados de la citada fuente (www.conicet.gov.ar) en febrero y mar-
zo de 2011. Se escogieron dichas áreas porque se considera que pueden tener
un importante grado de internacionalización (entendida como presencia en re-
vistas internacionales) y, por tanto, ser más relevantes para comparar la orienta-
ción de la producción en términos de publicaciones locales vs. internacionales
(Russell y Ainsworth, 2010). En cambio, no se recopilaron datos de áreas disci-
plinarias como historia, ya que ésta tiene una clara orientación al conocimiento
local y, consecuentemente, podría ser esperable una reducida participación a
nivel internacional. En el caso de sociología, el área incluye también a demogra-
fía, pero se las considera áreas de conocimiento afi nes y se presume que tienen
perfi les muy similares, por lo cual la agregación de las mismas no constituye un
problema. En el caso de economía, el área considerada contiene otras dos dis-
ciplinas, ya que se trata de economía, ciencias de la gestión y administración
pública, pero la proporción de investigadores pertenecientes a dichas disciplinas
es mínima. Naturalmente, existe cierto nivel de arbitrariedad en la asignación o,
más precisamente, la auto asignación de los investigadores a áreas disciplinarias,
ya que sus áreas de actuación en ocasiones son multidisciplinarias (por ej.: so-
ciólogos que publican en revistas de historia, expertos en administración pública
que fi guran en el área de ciencias políticas, etc.), pero se ha preferido respetar
el criterio de demarcación disciplinaria del CONICET.
Los datos recopilados corresponden a la totalidad de investigadores cuya in-
formación sobre publicaciones fi guraba en la base de datos de acceso público
del CONICET, abarcando científi cos sociales de todas las categorías de revista:
asistente, adjunto, independiente, principal y superior. Al respecto, cabe señalar
que la categorización de investigadores se realiza a partir de un proceso de eva-
luación interna y sólo aquellos con mérito sufi ciente son promocionados a una
categoría más elevada. La antigüedad en la carrera de investigadores también es
importante para el cambio de categoría, como surge del artículo 39 del estatuto
que reglamenta la carrera de investigador científi co del CONICET (Decreto Ley
20.464/73, modifi cado por leyes 22.140 y 24.729). A los efectos comparativos,
nuestro análisis desagrega la información sobre productividad según categoría de
revista de los investigadores, consolidándose en una sola categoría las de prin-
cipal y superior (que tienen un número muy reducido de miembros). En defi ni-
tiva, esta clasifi cación marca una diferenciación en el nivel de antigüedad o ex-
periencia de los investigadores, que podría tener infl uencia en su productividad.
Es pertinente realizar algunas precisiones sobre la representatividad de la mues-
tra. Según las últimas cifras disponibles (datos ofi ciales a diciembre de 2008), el
total de investigadores en ciencias sociales en la República Argentina era de 9989
(cifra que incluye tanto los que poseen dedicación exclusiva como parcial a di-
chas tareas). De acuerdo al tamaño total de la muestra y considerando un nivel
410
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
de confi anza de 95 %, se obtendrían resultados representativos con un margen de
error de 4,71 %. No obstante, la representatividad debe ser calculada por disci-
plina, por las variaciones existentes entre las mismas. Para economía, con 1.411
investigadores a nivel país, se obtendrían resultados representativos con un in-
tervalo de confi anza de 10,94; sociología con 1.099 investigadores tiene un tama-
ño de muestra más representativo con un intervalo de confi anza de 6,29, mientras
que en psicología, con 1.170 investigadores, los resultados son signifi cativos con
un intervalo de 12,67. No hay datos para estimar la representatividad en el caso
de la ciencia política. En cualquier caso, estos niveles de representatividad no
son adecuados ya que la población de comparación es menor, debido a que hay
un alto porcentaje de investigadores en ciencias sociales que se dedican en for-
ma parcial a dichas tareas (Wainerman, 1999). Por otra parte, como los investiga-
dores en este estudio no han surgido de un muestreo aleatorio, sino que forman
parte de la carrera de investigador científi co del CONICET, puede concluirse que
la muestra está sesgada hacia los más productivos del sistema, además de res-
tringirse a quienes tienen dedicación plena a la investigación. En consecuencia,
las muestras no serían enteramente representativas del científi co social argentino
promedio, pero según su tamaño, podrían considerarse representativas de los
más productivos del sistema.
Cabe señalar al respecto que los investigadores considerados en la muestra
tienen, en la mayor parte de los casos, afi liación institucional en universidades
argentinas públicas o privadas, pero su afi liación al CONICET garantiza que se
trata de investigadores full-time. De hecho, la carrera de investigador científi co en
el CONICET tiene precisamente por objetivo garantizar dicha dedicación. Creado
en 1958, para promover el desarrollo de la actividad científi ca en la República
Argentina, el CONICET es una agencia pública que otorga becas y subsidios a
investigadores, además de contar con un escalafón de investigadores científi cos
que disfrutan de ventajas como la seguridad de la dedicación full-time y una re-
muneración acorde a ella, mientras pertenezcan al mismo. Para acceder a integrar
este cuerpo de investigadores, se atraviesa un estricto proceso de selección.
En encuestas realizadas entre miembros de la comunidad científi ca local, el
CONICET fi gura como la entidad con mayor prestigio en el campo de la investi-
gación académica (CONICET, 2006). Por otra parte, en términos de productividad,
debe señalarse que los científi cos afi liados al CONICET produjeron en 2004 un
70 % del total de publicaciones científi cas indexadas en SCI de autores afi liados a
instituciones argentinas (CAICYT, 2005). Lo anterior sugiere que es razonable pen-
sar que la muestra de científi cos obtenida podría considerarse sesgada hacia los
más productivos del sistema. Afi rmación que se sustenta, además, en el hecho de
que la evaluación para promoción en la carrera de investigadores del CONICET
se basa en criterios de productividad tanto en calidad como en cantidad.
De la producción de los investigadores se relevaron los siguientes datos:
1. Publicaciones de artículos en revistas científi cas, diferenciando según la
localización geográfi ca de las revistas (locales, de otros países de Améri-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
411

ERNESTO R. GANTMAN
ca Latina, españolas, francesas y resto) y el idioma de la publicación (de
cualquier país pero publicadas en inglés, considerado lingua franca de
la ciencia). En este último caso, además, se agregó una subcategoría:
publicaciones en inglés indexadas en el SSCI (Social Sciences Citation
Index), lo que responde a la intención de identifi car los artículos publi-
cados en revistas científi cas que presumiblemente tienen mayor índice de
impacto a nivel internacional (Jiménez Contreras, 1992; Giannoni, 2008;
Morillo y otros, 1999).
2. Libros publicados como autor o editor, según lugar o idioma de publica-
ción (publicados localmente, publicados en idioma inglés, publicados en
países de América Latina o publicados en otros países en lenguas distin-
tas al inglés).
3. Capítulos de libros, también clasifi cados según lugar e idioma de publi-
cación.
Las reseñas bibliográfi cas publicadas en revistas con referato no se han con-
siderado en el análisis. Los working papers también fueron excluidos del análisis.
A los efectos de verifi car la integralidad de los datos suministrados en los
curriculum vitae que fi guran en el sitio web del CONICET, se cruzaron los mis-
mos con datos de los respectivos investigadores obtenidos de otras fuentes (C.V.
de sitios web de universidades, etc.). El período considerado en el análisis co-
rresponde a la producción de los años 2004 a 2008. En algunos casos, los C.V.
incluyen publicaciones anteriores, pero se eligió el período citado porque repre-
senta en forma mas completa la producción de los investigadores (en otros años,
podrían registrarse omisiones). Para establecer las características de las publica-
ciones periódicas mencionadas en los C.V. de los investigadores, se recurrió a
diversas fuentes, como los sitios web de las mismas y los listados de publicacio-
nes suministrados por Thomson International.
Por último, se obtuvo información sobre las universidades en las cuales los
investigadores completaron su doctorado. Como este dato no fi guraba en los C.V.
disponibles en el sitio del CONICET, se utilizaron otras fuentes de información
como páginas de universidades o publicaciones de los propios investigadores.
El análisis descriptivo de datos contiene las medias por tipo de publicación
y categoría de investigador, así como los promedios consolidados de todas las
categorías. A los efectos de evitar distorsiones en la productividad media por
investigador debidas a valores extremos en cada una de las disciplinas (científi cos
excepcionalmente productivos en los totales de algunas categorías), fueron ex-
cluidos de la muestra aquellos investigadores cuya productividad se ubicaba a
mayor distancia que tres desvíos estándar de la media. El número de outliers fue
de 13, quedando la muestra fi nal compuesta por 401 investigadores.
También se presenta un análisis de regresión multivariado que toma como
variables dependientes distintas categorías de publicaciones: artículos por lugar
de publicación y libros locales. Como variables independientes se utilizan dum-
mies
según el país de obtención del doctorado (la categoría base de comparación
412
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
es el doctorado local). Dada la naturaleza discreta de dichas variables dependien-
tes, se ha utilizado un modelo de recuento de datos con una regresión binomial
negativa. Los resultados se han obtenido mediante la utilización del software
STATA 10.0.
3. Resultados
En la tabla I se detalla la producción de los investigadores argentinos en eco-
nomía en el período de referencia (2004-2008). Los datos corresponden a la
producción media del período, por lo cual a los efectos de obtener medias anua-
les hay que dividir por cinco. Como puede observarse, en materia de artículos
predomina la producción en revistas locales, mientras que la producción en re-
vistas en inglés es la categoría que le sigue. Las publicaciones en revistas lati-
noamericanas tienen una media ligeramente inferior, que supera a la de las pu-
blicaciones en revistas españolas o francesas. La media de publicaciones en inglés
en revistas indexadas en el SSCI (0,70) corresponde a un 28,80 % de las publica-
ciones locales y a un 14 % del total de artículos. Cabe puntualizar que el SSCI
indexa en ciencias sociales algunas revistas publicadas en otros idiomas, por lo
cual la visibilidad de los investigadores argentinos en dicha base de datos es, en
realidad, mayor. De hecho, la revista argentina Desarrollo Económico fue indexa-
da durante el período de referencia (Luna-Morales y Collazo-Reyes, 2007). Cal-
culando el índice de internacionalización como producción media en revistas
internacionales sobre producción media total, obtenemos a nivel consolidado un
valor de 51,40 %. La proporción de publicaciones a nivel regional (revistas loca-
les más las de otros países de América Latina sobre total de publicaciones) as-
ciende a 68 %.
La producción de libros tiene relevancia como modo de difundir las investi-
gaciones de economistas argentinos, pero es inferior a la de artículos en revistas
locales. La mayor parte de estos libros han sido publicados localmente, aunque
se verifi ca también una mínima producción de libros en inglés. En materia de
capítulos en libros, puede señalarse que el número promedio de capítulos en
libros locales es levemente menor al número de artículos en revistas locales. Hay
también producción de capítulos en libros publicados en el exterior.
Comparando la producción por categorías de investigador, se aprecia que, en
general, las categorías superiores son más productivas en artículos en revistas
locales y de países latinoamericanos así como en libros locales, aunque la rela-
ción no sea monótonamente creciente.
La producción en sociología se informa en la tabla II. El número de artículos
en revistas locales es nuevamente la categoría predominante. En segundo lugar,
aparecen los artículos publicados en revistas de América Latina. Las revistas en
inglés ocupan el tercer lugar. A continuación, aparecen las publicaciones en re-
vistas españolas y luego las revistas francesas. Es importante puntualizar, sin
embargo, que la proporción de publicaciones en revistas en inglés indexadas en
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
413

ERNESTO R. GANTMAN
otal
T

3,93
7,5
(3,91)
2,43
(2,50)
3,04
(2,84)
3,82
(2,64)
(5,49)
oría
os
o
Otr
0,23
(0,65)
0,17
(0,39)
0,25
(0,74)
0,18
(0,60)
0,31
(0,87)
En
0,5
inglés
0,23
(0,65)
0,39
(0,78)
(0,98)
1,36
(1,63)
1,94
(2,43)
Capítulos de libr
Ar-
gent.
0,51
(1,13)
0,43
(1,08)
0,46
(0,98)
0,27
(0,65)
0,88
(1,59)
ador según categ
= 16).
n
Ar-
2
gent.
2,28
(2,72)
1,43
(2,25)
1,83
(2,08)
(2,28)
4,38
(3,52)
estig
v

otal
T

1,47
1,5
(1,63)
1,04
(1,55)
(1,64)
1,27
(1,35)
2,19
(1,80)
os
0
0
Otr
0,02
(0,16)
0,09
(0,30)
0,06
(0,25)
os
En
0,19
0,13
0,12
0,5
Libr
inglés
(0,66)
(0,34)
(0,34)
(1,26)
= 11), principal y superior (
n
Ar-
0
00
gent.
0,05
(0,23)
0,08
(0,28)
0,13
(0,34)
oducción media por in
Ar-
gent.
1,20
1,5
(1,53)
0,91
(1,56)
1,29
(1,57)
1,18
(1,40)
(1,55)
ABLA I
T

licación) (2004-2008)
otal
5
T
(3,96)
3,13
(1,77)
5,29
(4,85)
5,64
(4,43)
6,81
(3,62)
= 24), independiente (
n
os
0
0
0
Otr
0,01
(0,11)
0,06
(0,25
ña
Espa-
0,22
0,43
0,04
0,36
0,06
y tipo de pub
(0,67)
(0,94)
(0,20)
(0,92)
(0,25)
= 23), adjunto (
entinos en economía (pr
n
g
evistas
0
0
0,15
0,25
0,31
Franc.
(0,49)
(0,61)
(0,70)
es ar
Am.
Latina
0,97
(1,62)
0,26
(0,54)
1,33
(2,18)
0,82
(1,17)
1,56
(1,67)
ador
Artículos de r
En
1
inglés
SSCI
0,70
(1,11)
0,74
(1,14)
0,55
(1,15)
(1,18)
0,44
(0,73)
= 74), asistentes (
estig
n
v
En
inglés
1,22
(1,62)
1,17
(1,40)
1,21
(1,91)
2,09
(1,92)
0,69
(0,95)
Ar-
gent.
2,43
(2,74)
1,26
(1,60)
2,46
(3,08)
2,36
(2,80)
4,13
(2,83)
oducción de in
Pr

Categoría
Notas: todas las categorías (
odas
T
Media
Desv.st.
Asistente
Media
Desv.st.
Adjunto
Media
Desv.st.
Independ.
Media
Desv.st.
Principal y su-
perior
Media
Desv.st.
414
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
otal
T

4,50
(3,52)
3,63
(2,67)
4,10
(3,40)
5,62
(3,50)
6,52
(4,80)
oría
os
o
Otr
0,45
(0,94)
0,18
(0,43)
0,60
(1,12)
0,38
(0,70)
0,87
(1,39)
En
inglés
0,24
(0,63)
0,14
(0,46)
0,23
(0,62)
0,35
(0,65)
0,43
(0,95)
Capítulos de libr
Ar-
gent.
0,69
(1,34)
0,42
(1,01)
0,58
(0,97)
0,88
(1,15)
1,52
(2,56)
ador según categ
= 23).
n
Ar-
4
gent.
3,11
(2,75)
2,89
(2,49)
2,69
(2,72)
(2,95)
3,70
(3,05)
estig
v

otal
T

1,43
(1,52)
0,86
(1,00)
1,28
(1,29)
2,15
(1,89)
2,39
(1,97)
os
0
Otr
0,07
(0,36)
0,08
(0,27)
0,03
(0,17)
0,30
(0,88)
os
En
0
0,02
0,02
0,01
0,03
Libr
inglés
(0,12)
(0,12)
(0,12)
(0,17)
= 34), principal y superior (
n
Ar-
gent.
0,05
(0,27)
0,02
(0,12)
0,04
(0,20)
0,15
(0,50)
0,04
(0,21)
oducción media por in
Ar-
gent.
1,29
(1,39)
0,75
(0,88)
1,20
(1,26)
1,97
(1,60)
2,04
(1,87)
ABLA II
T

licación) (2004-2008)
otal
T

5,37
(3,38)
4,65
(3,17)
5,46
(3,08)
6,12
(4,04)
6,04
(3,60)
= 70), independiente (
n
os
Otr
0,14
(0,40)
0,09
(0,29)
0,21
(0,54)
0,09
(0,29)
0,13
(0,34)
ña
Espa-
0,34
0,23
0,50
0,26
0,26
y tipo de pub
(0,79)
(0,72)
(0,94)
(0,67)
(0,54)
= 65), adjunto (
entinos en sociología (pr
n
g
evistas
0,27
0,37
0,14
0,32
0,26
Franc.
(0,65)
(0,89)
(0,39)
(0,59)
(0,54)
es ar
Am.
Latina
1,29
(1,73)
0,98
(1,19)
1,34
(1,74)
1,65
(2,10)
1,48
(2,27)
Artículos de r
ador
En
inglés
SSCI
0,24
(0,88)
0,08
(0,27)
0,36
(1,29)
0,26
(0,67)
0,30
(0,70)
= 192), asistentes (
estig
n
v
En
inglés
0,48
(1,15)
0,20
(0,40)
0,54
(1,50)
0,74
(1,11)
0,74
(1,29)
Ar-
gent.
2,85
(2,33)
2,77
(2,32)
2,71
(2,10)
3,06
(2,44)
3,17
(2,89)
oducción de in
Pr

Categoría
Notas: todas las categorías (
odas
T
Media
Desv.st.
Asistente
Media
Desv.st.
Adjunto
Media
Desv.st.
Independ.
Media
Desv.st.
Principal y su-
perior
Media
Desv.st.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
415

ERNESTO R. GANTMAN
el SSCI respecto a las publicaciones en revistas locales es bastante baja, apenas el
8,42 % a nivel consolidado de categorías. El nivel de internacionalización ascien-
de al 46,95 % de la producción. Sin embargo, dicha cifra está compuesta princi-
palmente por las publicaciones en revistas latinoamericanas que corresponden a
un 24 % del total. Las publicaciones en inglés cubren un modesto 8,.94 % del
total y sólo el 4,47 % corresponde a publicaciones en inglés indexadas en el SSCI.
Al igual que en el caso de los economistas, la producción de los sociólogos
argentinos se vehiculiza de manera importante a través de libros, algo que ya se
había puntualizado con relación a las ciencias sociales (Kishida y Matsui, 1997).
A nivel consolidado, la relación entre libros publicados sobre artículos en revis-
tas locales es de 0,45. Por otra parte, es importante señalar que los libros se
publican principalmente a nivel nacional, representando las publicaciones inter-
nacionales cifras muy bajas. Los capítulos en libros publicados localmente cons-
tituyen la categoría de mayor producción de los sociólogos argentinos, pero su
número no es demasiado superior al de los artículos en revistas nacionales, ape-
nas 3,11 contra 2,85. El número de capítulos en libros publicados en otros países
es bastante menor.
Analizando comparativamente la producción por categorías, vemos que las
categorías superiores tienen, en general, mayor producción de artículos (aunque
no en todas las categorías de artículos) y, particularmente, de libros publicados
localmente. Esto último podría obedecer al mayor prestigio de los investigadores
en la disciplina, lo cual les otorga un rol de gatekeepers dentro de la sociología
local.
La tabla III presenta los resultados para los investigadores en ciencia política.
Los mismos, en general, son bastante similares a los obtenidos en el caso de los
sociólogos. En materia de artículos, predominan las publicaciones locales (58,89 %
del total), registrándose una proporción muy baja de artículos en inglés indexa-
dos en el SSCI (2,75 % del total). A diferencia del caso de los sociólogos, el nú-
mero de capítulos de libro (3,18) es levemente inferior al de artículos en revistas
locales (3,27). Se observa también que el número de libros locales publicados
aumenta en forma monótonamente creciente con la categoría de revista, lo que
también se verifi ca en el caso de los sociólogos.
La producción de los investigadores en psicología muestra que la categoría
de mayor producción corresponde a artículos en revistas locales (tabla IV). Sigue
a continuación el número de artículos en revistas latinoamericanas y luego en
revistas españolas. El número de capítulos en libros locales es bastante inferior
al número de artículos en revistas locales (apenas el 37,8 % de este último). Los
capítulos de libros no son un modo de difusión importante en esta disciplina, al
menos en comparación con los artículos (el total de capítulos representa sólo el
26,35 % del total de artículos).
Se observa que el número promedio de artículos en revistas locales aumenta
según la categoría de investigador, al igual que el número de artículos en revistas
españolas. Aunque no en forma monótonamente creciente, también hay un aumen-
to del número de capítulos de libros según la categoría y del número de libros
416
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
otal
oría
T
4,60
(3,22)
3,03
(1,82)
4,71
(2,82)
6,47
(3,62)
5,77
(4,38)
os
o
Otr
0,38
(0,82)
0,17
(0,39)
0,33
(0,70)
0,66
(1,11)
0,61
(1,19)
En
inglés
0,38
(1,01)
0,17
(0,39)
0,29
(0,69)
0,60
(1,80)
0,77
(1,24)
Capítulos de libr
ador según categ
Ar-
gent.
0,65
(0,98)
0,24
(0,51)
0,79
(1,18)
0,87
(1,13)
1,08
(0,95)
= 13).
estig
n
v
Ar-
gent.
3,18
(2,58)
2,44
(1,72)
3,29
(2,07)
4,33
(2,94)
3,31
(4,01)
otal
T

1,48
(1,74)
0,52
(0,69)
1,71
(1,55)
1,93
(1,71)
2,69
(2,66)
os
Otr
0,09
(0,32)
0,07
(0,26)
0,08
(0,41)
0,13
(0,35)
0,08
(0,28)
os
En
0
0,05
0,08
0,13
Libr
inglés
(0,22)
(0,28)
(0,35)
= 15), principal y superior (
n
oducción media por in
Ar-
00
gent.
0,09
(0,32)
0,17
(0,48)
0,13
(0,35)
0,08
(0,28)
Ar-
gent.
1,26
(1,58)
0,45
(0,69)
1,38
(1,28)
1,53
(1,68)
2,53
(2,37)
ABLA III
T

licación) (2004-2008)
otal
T

5,46
(4,00)
4,72
(2,96)
4,50
(3,28)
8,20
(5,24)
5,77
(4,58)
= 24), independiente (
n
os
Otr
0,17
(0,49)
0,21
(0,56)
0,13
(0,34)
0,20
(0,56)
0,15
(0,55)
ña
Espa-
0,42
0,34
0,38
0,93
0,08
y tipo de pub
(1,12)
(0,72)
(0,82)
(2,12)
(0,28)
= 29), adjunto (
evistas
n
0,14
(0,49)
0,24
(0,70)
0,08
(0,41)
0,07
(0,26)
0,08
(0,28)
entinos en Ciencia política (pr
Franc.
g
Am.
Latina
1,11
(1,52)
1,07
(1,51)
1,04
(1,43)
1,13
(1,19)
1,31
(2,14)
es ar
Artículos de r
En
ador
inglés
SSCI
0,15
(0,73)
0,07
(0,26)
0,04
(0,20)
0,53
(1,60)
0,08
(0,28)
= 81), asistentes (
n
estig
1
v
En
inglés
0,36
(1,15)
0,14
(0,44)
0,13
(0,34)
(2,45)
0,54
(0,66)
Ar-
gent.
3,27
(2,72)
2,72
(2,08)
2,75
(2,52)
4,87
(3,68)
3,61
(2,57)
oducción de in
Categoría
Notas: todas las categorías (
Pr
odas
T
Media
Desv.st.
Asistente
Media
Desv.st.
Adjunto
Media
Desv.st.
Independ.
Media
Desv.st.
Principal y su-
perior
Media
Desv.st.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
417

ERNESTO R. GANTMAN
otal
T

2,77
(2,51)
1,95
(1,70)
3,44
(3,27)
2,36
(2,29)
4,29
(2,14)
oría
os
o
Otr
0,26
(1,15)
0,05
(0,22)
0,69
(2,02)
0,29
(0,76)
En
00
inglés
0,19
(0,48)
0,10
(0,31)
0,25
(0,45)
0,57
(0,98)
Capítulos de libr
Ar-
gent.
0,20
(0,53)
0,20
(0,52)
0,13
(0,34)
0,27
(0,65)
0,29
(0,76)
ador según categ
= 7).
n
Ar-
gent.
2,13
(1,71)
1,60
(1,54)
2,38
(1,63)
2,09
(1,81)
3,14
(1,95)
estig
v

otal
T

0,72
(1,34)
0,25
(0,64)
0,44
(1,09)
1,54
(1,75)
1,43
(1,90)
os
Otr
0,04
(0,19)
0,06
(0,25)
0,14
(0,38)
os
En
0
0
00
Libr
inglés
= 11), principal y superior (
n
Ar-
000
00
gent.
0,04
(0,19)
0,06
(0,25)
0,09
(0,30)
oducción media por in
Ar-
gent.
0,65
(1,21)
0,25
(0,64)
0,31
(0,79)
1,45
(1,75)
1,29
(1,60)
ABLA IV
T

licación) (2004-2008)
otal
14
T
10,51
(6,62)
7,15
(4,44)
10,19
(5,23)
(8,99)
15,43
(5,80)
= 16), independiente (
n
os
0
Otr
0,11
(0,42)
0,05
(0,22)
0,19
(0,54)
0,29
(0,76)
ña
Espa-
1,39
0,70
1,75
1,82
1,86
y tipo de pub
(2,06)
(0,80)
(1,98)
(3,54)
(1,46)
= 20), adjunto (
entinos en psicología (pr
n
g
evistas
0
0,15
0,10
0,09
0,71
Franc.
(0,74)
(0,45)
(0,30)
(1,89)
es ar
Am.
Latina
2,22
(2,55)
1,11
(1,33)
2,19
(1,83)
4,18
(3,99)
2,43
(2,30)
Artículos de r
ador
En
inglés
SSCI
0,88
(1,49)
0,75
(1,16)
1,38
(1,82)
0,18
(0,40)
1,29
(2,21)
= 54), asistentes (
estig
n
v
En
inglés
1,01
(1,56
0,90
(1,21)
1,56
(1,97)
0,27
(0,47)
1,29
(2,21)
Ar-
gent.
5,63
(4,98)
4,30
(4,66)
4,505
(4,23)
7,63
(6,14)
8,86
(3,72)
oducción de in
Pr

Categoría
Notas: todas las categorías (
odas
T
Media
Desv.st.
Asistente
Media
Desv.st.
Adjunto
Media
Desv.st.
Independ.
Media
Desv.st.
Principal y su-
perior
Media
Desv.st.
418
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
(aunque los investigadores de la categoría consolidada principal y superior tienen
un número de libros levemente inferior al de la categoría inmediata anterior).
En la tabla V, se presentan algunos indicadores comparativos de categorías
seleccionadas en las cuatro disciplinas. En general, los valores son muy similares
para artículos en publicaciones locales, total de artículos y total de libros, excep-
to en el caso de la psicología, que muestra un patrón distinto de publicaciones
con un número de artículos que duplica o casi duplica al de las otras disciplinas,
y un número menor de libros publicados. En materia de artículos en inglés, no
obstante, la economía supera a la psicología (1,22 contra 1,01), aunque los psi-
cólogos tienen un número de artículos en inglés indexados en el SSCI ligeramen-
te superior al de los economistas (0,88 contra 0,70). La economía es la disciplina
con un mayor grado de internacionalización (51,40 %) seguido por la sociología,
la psicología y la ciencia política, aunque en valores absolutos la mayor produc-
tividad de artículos a nivel internacional corresponde a los psicólogos.
Por otra parte, es de destacar el carácter regional (local más resto de Améri-
ca Latina) de la producción de la sociología con 82,68 % del total y la ciencia
política (80,22 %). En cambio, la economía, si bien tiene carácter predominante-
mente regional, presenta un porcentaje menor (68 %). Específi camente, la econo-
mía muestra una mayor orientación hacia el mundo anglosajón y mayor visibili-
dad dentro del conjunto de publicaciones de más impacto internacional, mientras
que la sociología y la ciencia política tienen un carácter más local y regional. La
psicología se ubica en una posición intermedia en términos porcentuales, aunque
en valores absolutos de producción de artículos en inglés tiene una presencia
similar a la economía.
Por último, se han comparado los valores de las medias de producción por
investigador en las distintas disciplinas entre sí a través del test de Mann-Whitney,
indicándose en la tabla las diferencias que presentan signifi catividad estadística.
Así, por ejemplo, se concluye que la media de artículos publicados en inglés y
en revistas en dicho idioma indexadas en el SSCI es estadísticamente diferente
entre economía y sociología y entre economía y ciencia política, pero no así en-
tre economía y psicología. En general, salvo este último caso, los patrones de
producción de los investigadores en psicología son signifi cativamente diferentes
de los del resto de las disciplinas. Además, no se observa en las categorías de la
tabla V ninguna diferencia signifi cativa entre la productividad media de los so-
ciólogos y los investigadores en ciencia política, lo cual revela que en el ámbito
argentino resultan disciplinas afi nes en sus patrones de publicación.
Otra forma de acercarse al fenómeno de la internacionalización de la produc-
ción científi ca es analizando la formación recibida por los investigadores. En tal
sentido, cabría esperar que investigadores formados en el extranjero tengan mayor
propensión a publicar en el circuito dentro del cual se formaron. La vinculación,
y posiblemente causalidad, entre formación obtenida en el extranjero y producti-
vidad a nivel de publicaciones internacionales ya había sido notada para el caso
de los investigadores en economía por García et al. (1999). Del mismo modo,
García Romero (2002) demuestra la importancia de la formación predoctoral para
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
419

ERNESTO R. GANTMAN
centaje
53,57
9,61
8,37
21,12
74,69
46,72
90,28
del total
ciencia
Por
e
)
e
)
e
)
e
)
,
,
e
)
,
e
)
e
)
,
,
,
d
d
,
Psicología
d
,
,
d
d
d
d
d
d
c
,
c
,
c
,
c
,
c
,
c
,
e
)
e
)
c
,
sociología,
Media por
investigador
1,01 (
0,88 (
5,63 (
2,22 (
7,85 (
4,91 (
10,51 (
0,065 (
0,72 (
, signif. sociología-psicología,
) difer
d
centaje
58,89
6,56
2,75
20,33
80,22
40,11
84,15
del total
Por
es en economía,
e
)
e
)
e
)
e
)
,
,
,
e
)
,
e
)
e
)
e
)
e
)
b
b
b
b
Ciencia política
ador
1,11 (
2,19 (
5,46 (
1,26 (
1,48 (
Media por
investigador
3,27 (
0,36 (
0,15 (
4,38 (
estig
v

, signif. economía-psicología, (
= 54).
n
centaje
53,07
8,94
4,47
24,02
82,68
46,93
90,21
c
) difer
del total
Por
c
ología (
)
)
)
)
ABLA V
d
d
d
)
d
)
)
)
)
T
oducción de in
Sociología
,
,
,
d
,
d
d
d
d
a
a
a
a
= 81), psi
< 0,05.
p
1,29 (
2,52 (
5,37 (
1,29 (
1,43 (
n
Media por
investigador
2,85 (
0,48 (
0,24 (
4,44 (
c
a (
política y psicología (2004-2008)
c
ias políti
centaje
48,6
24,4
14,0
19,4
68,0
51,4
81,63
es selectos de pr
del total
c
i
e
n
Por
, signif. economía-ciencia política, (
c
)
)
)
c
)
,
b
b
,
Economía
b
,
,
c
)
b
c
)
c
)
c
)
= 192),
) difer
b
,
a
a
,
c
)
n
(
a
a
5 (
0,97 (
2,57 (
1,20 (
1,47 (
Media por
investigador
1,22 (
0,70 (
2,43
3,40 (
c
iología (
o de indicador

-
ativ
= 74), so
n

catividad estadística para test de MAnn-Whitney:
oducción
onomía (
. signif. economía-sociología, (
ec
ipo de pr
, signif. ciencia política-psicología.
T
) difer
Análisis compar
Notas:
(
a
Criterio de signifi
otal de artículos
otal de libros
Artículos en revistas locales
Artículos en revistas en in-
glés
Artículos en revistas en in-
glés indexadas en SSCI
Artículos en revistas latinoa-
mericanas
Artículos en revistas regio-
nales (locales + resto de
América Latina)
Artículos en revistas inter
nacionales
T
Libros nacionales
T
(
e
) difer
420 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
la productividad posterior. No obstante, no hay estudios que vinculen la formación
doctoral con la orientación de las publicaciones a distintos circuitos internacionales.
Para analizar esta relación, se ha realizado un análisis multivariado tomando como
variables independientes los lugares de obtención del doctorado y considerando
como variables dependientes distintas categorías de publicaciones, básicamente
artículos y libros locales (por su escaso número no se consideró la publicación de
libros en otros países). Los resultados de la regresión se detallan en la tabla VI.
TABLA VI
Regresión binomial negativa de la productividad de investigadores argentinos
en economía, sociología, psicología y ciencias políticas (2004-2008)
Arts. rev.
Arts. rev.
Libros
Variables indepen-
Arts. rev.
Arts. rev.
Arts. rev. Arts. rev.
Am.
en inglés
naciona-
dientes
locales
en inglés
Francés
España
Latina
SSCI
les
1,332
0,307
–0,635
–1,117
–2,013
–0,880
0,125
Constante
(0,061)
(0,088)
(0,137)
(0,175)
(0,202)
(0,140)
(0,087)
–0,582***
–0,537**
1,040***
1,025**
–0,821
–1,260**
–0,041
Doct. USA
(0,184)
(0,269)
(0,322)
(0,410)
(0,763)
(0,569)
(0,239)
–0,890***
–0,713*
1,002**
0,935*
–0,185
–1,317*
–1918***
Doct. Reino Unido
(0,264)
(0,378)
(0,425)
(0,545)
(0,787)
(0,788)
(0,619)
–0,602***
–0,558*
0,230
0,124
2,118***
–0,018
0,340
Doct. Francia
(0,205)
(0,300)
(0,396)
(0,513)
(0,356)
(0,422)
(0,243)
0,162
0,473*
–0,377
–0,875
–0,385
1,778****
0,185
Doct. España
(0,197)
(0,267)
(0,495)
(0,726)
(0,778)
(0,349)
(0,275)
–0,416**
0,637***
–0,500
–1,522*
0,472
0,033
0,098
Doct. Am. Latina
(0,194)
(0,235)
(0,457)
(0,812)
(0,508)
(0,410)
(0,252)
–0,273
–0,575
0,692*
0,769
–0,127
0,532
–0,014
Doct. otros países
(0,237)
(0,373)
(0,453)
(0,570)
(0,790)
(0,459)
(0,324)
Log. likelihood
–823,19
–567,20
–385,93
–273,84
–171,77
–314,98
–527,04
Parámetro alpha
0,55
0,94
2,22
3,59
1,41
1,83
0,76
Notas: n = 363, * p < 0,10, ** p < 0,05, *** p < 0,01, **** p < 0,001, desvío standard entre paréntesis.
Para dicho análisis, la muestra es menor a la considerada en el análisis de
productividad porque no fue posible obtener datos sobre la universidad en que
completaron su formación doctoral algunos investigadores (véase la distribución
en la tabla VII). Además, en los casos en que el doctorado fue obtenido en co-
tutela (típicamente entre una universidad francesa y la Universidad de Buenos
Aires), se lo considera como local.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
421

ERNESTO R. GANTMAN
TABLA VII
Investigadores por lugar de formación doctoral
Lugar de formación doctoral
Número
Porcentaje
Doctorado en USA
34
9,37
Doctorado en el Reino Unido
18
4,96
Doctorado en Francia
27
7,44
Doctorado en España
22
6,06
Doctorado en países de América Latina (*)
28
7,71
Doctorado en otros países (**)
17
4,68
Doctorado local
217
59,68
Total
363
100
Notas: n = 363.
(*) Brasil (17), México (10), Venezuela (1).
(**) Holanda (6), Alemania (4), Italia (3), Bélgica (2), Suecia (1), Canadá (1).
En este análisis, la categoría base es el doctorado local, por lo cual los coefi -
cientes deben interpretarse como la medida en que obtener un doctorado en una
de las localizaciones mencionadas aumenta o disminuye la probabilidad de efec-
tuar determinadas publicaciones con relación a los investigadores que tienen un
doctorado local. Así, tener un doctorado en USA, el Reino Unido, Francia o paí-
ses latinoamericanos reduce la productividad en publicaciones locales en forma
estadísticamente signifi cativa. Respecto a las publicaciones en revistas de países
de América Latina, se aprecia que, consistentemente con nuestra expectativa,
poseer un doctorado en países de América Latina tiene un efecto positivo y es-
tadísticamente signifi cativo sobre la productividad en tales revistas. Tener un
doctorado en España también afecta positivamente la productividad en revistas
latinoamericanas, mientras que la formación doctoral en USA, Francia y el Reino
Unido tiene también un efecto signifi cativo pero negativo. En el caso de las re-
vistas en inglés, sólo tienen efectos estadísticamente signifi cativos y positivos el
doctorado en USA, Reino Unido y otros países. Los resultados son similares cuan-
do se trata de publicaciones en inglés indexadas en el SSCI. Los efectos estadís-
ticamente signifi cativos positivos respecto a la categoría base corresponden a
doctorados en USA y el Reino Unido, en tanto que la formación doctoral en un
país latinoamericano tiene un efecto signfi cativo pero negativo. En el caso de las
revistas francesas, el resultado es esperable ya que sólo tiene efecto signifi cativo
y positivo el haber obtenido un doctorado en Francia. En lo atinente a las publi-
caciones en revistas españolas, los resultados con signifi catividad estadística co-
rresponden a doctorados en España (efecto positivo) y en USA y el Reino Unido
422 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
(efecto negativo). Respecto a las publicaciones de libros en Argentina, la única
variable con efecto estadísticamente signifi cativo y negativo es la obtención de
un doctorado en el Reino Unido. En general, estos resultados sugieren que exis-
te un interés por parte de quienes se formaron en distintos países en seguir par-
ticipando en los circuitos de publicaciones de los mismos. Posiblemente, esto
obedezca tanto a razones de índole lingüística como al establecimiento de redes
de colaboración con investigadores de su lugar de formación doctoral.
4. Conclusión
El presente trabajo avanza sobre la literatura que alerta sobre el bajo nivel de
presencia en las principales bases de datos científi cas de investigadores en cien-
cias sociales de países en desarrollo, al cuantifi car su productividad, tanto en
revistas locales como en revistas internacionales, así como en otros tipos de me-
dios de difusión de investigaciones. A partir del caso de la República Argentina,
evaluado a través de la recopilación de datos de publicaciones de un conjunto
de académicos, se demuestra y cuantifi ca la preponderancia de publicaciones en
revistas científi cas locales. Los resultados indican, además, que esto es depen-
diente del tipo de disciplina considerada, ya que dentro de las ciencias sociales
hay disciplinas que tienen un mayor perfi l de apertura al circuito de publicacio-
nes anglosajón, siendo pertinente en este sentido el ejemplo de la economía. La
sociología y la ciencia política, por el contrario, manifi estan un mayor carácter
localista o, más específi camente, regionalista. La psicología, por su parte, eviden-
cia un patrón de publicaciones distinto a las anteriores, con una mayor produc-
ción de artículos en revistas científi cas. Esta disciplina tiene en términos porcen-
tuales una amplia participación regional, pero también presencia en publicaciones
científi cas en inglés.
Por último, otro hallazgo importante es la existencia de un nexo entre la
elección geográfi ca de las publicaciones por parte de los investigadores y su

lugar de formación doctoral, lo cual no es algo exclusivo de quienes publican
en revistas en inglés sino que se verifi ca con publicaciones efectuadas en otros
idiomas.
Si bien no son muchos los estudios empíricos que posibilitan el análisis com-
parativo, algunos trabajos sugerirían que la tendencia a publicar en el ámbito
latinoamericano es común entre científi cos de la región, como demuestran Ves-
suri y otros (2001) en el caso de Venezuela. Además, y estrictamente en el caso
de la economía, Faria (2000) encuentra una baja participación de economistas
brasileños en revistas internacionales. No obstante, y especialmente teniendo en
cuenta la importancia que últimamente se asigna a la visibilidad internacional de
las ciencias sociales de países en desarrollo (Díaz Escoto y otros, 2010; Dwyer,
2009), serían necesarios nuevos análisis similares de otros países en desarrollo
para evaluar el grado de importancia de la literatura orientada a la difusión local
frente a aquella orientada a una audiencia internacional.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
423

ERNESTO R. GANTMAN
5. Bibliografía
Archambault, E.; Vignola-Gagne, E.; Côté, G, Larivière, V., y Gingras, Y. (2006): Bench-
marking scientifi c output in the social sciences and humanities: The limits of existing
databases. Scientometrics, vol. 68 (3), 329-342.
Archambault, E., y Larivière, V. (2010): The limits of bibliometrics for the analysis of the
social sciences and humanities literature. En: International Social Science Council,
World Social Sciences Report: Knowledge Divides, UNESCO, París.
CAYCIT – Centro Argentino de Divulgación Científi ca y Tecnológica (2005): Producción
científi ca argentina en Science Citation Index 2004. http://www.caicyt.gov.ar/bases-
de-datos-e-indicadores/documentos-1/produccionconicet_2004.pdf (con acceso
15.04.2011).
CONICET – Consejo Nacional de Investigaciones Científi cas y Técnicas (2006): 50 años
del CONICET y la historia de la ciencia en Argentina. CONICET, Buenos Aires.
Díaz Escoto, A.; Navarro, E., y Ramírez Godoy, M. E. (2010): Contribución científi ca de
México a la psicología entre los años 1995-2008 con base en el Social Sciences Cita-
tion Index de ISI Web of Knowledge, Biblioteca Universitaria, vol. 13 (1), 16-35.
Dierz, J. S.; Chompolov, I.;Bozeman B.; Lane, E., y Park, J. (2003): Using the curriculum
vitae to study the career paths of scientists and engineers: An exploratory assessment.
Scientometrics, vol. 49 (3), 419-442.
Dwyer, T. (2009): On the Internationalization of Brazilian Academic Sociology. En: Bu-
rawoy, M.; Chang, M.; Hsieh, M. F. (eds.), Facing An Unequal World: Challenges for
a global sociology
, vol. 1, Academia Sinica, Taipei: Taiwan.
Faria, J. R. (2000): The research output of academic economists in Brazil. Economia Apli-
cada, vol. 4 (1), 95-113.
Gaillard, J. (1992): Use of publication lists to study scientifi c production and strategies of
scientists in developing countries. Scientometrics, vol. 23(1), 57-73.
García, P.; Montañés, A., y Sanz, E. (1999): La investigación en economía en España: mer-
cado nacional ¿versus? mercado internacional. Revista de Economía Aplicada, vol. 7
(20), 167-187.
García Romero A. (2002): Ensayos sobre Evaluación de la Investigación: Efectos de los
Programas Predoctorales y Postdoctorales, Tesis doctoral, Universidad Autónoma de
Madrid.
Giannoni, D. (2008): Medical writing at the periphery: The case of Italian journal editorials.
Journal of English for Academic Purposes, vol. 7 (2), 97-107.
Hicks, D. (2004): The four literatures of social science. En: Moed, H.; Glänzel, W.; Schmoch,
U. (eds.), Handbook of quantitative science and technology research. Kluwer, Dordrecht.
Jiménez Contreras, E. (2002): Las revistas científi cas: el centro y la periferia. Revista Espa-
ñola de Documentación Científi ca, vol. 15 (2), 174-82.
Kahn, M. (2010): Measure for measure: quantifying the social sciences. En International
Social Science Council, World Social Sciences Report: Knowledge Divides. UNESCO,
París.
Kishida, K., y Matsui, S. (1997): International publication patterns in social sciences: a
quantitative analysis of the IBSS fi les. Scientometrics, vol 40 (2), 277–298.
424 Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829

La productividad científi ca argentina en Ciencias Sociales...
Luna-Morales, M. E., y Collazo-Reyes, F. (2007): Análisis histórico bibliométrico de las
revistas latinoamericanas y caribeñas en los índices de la ciencia internacional: 1961-
2005. Revista Española de Documentación Científi ca, vol. 30 (4), 523-543.
Narvaez-Berthelemot, N., y Russell, J. M. (2001): World distribution of social science jo-
urnals: A view from the periphery. Scientometrics, vol. 51 (1), 223-239.
Ministerio de Ciencia, Tecnología e Innovación Productiva de la República Argentina
(2009): Indicadores de ciencia y tecnología argentina, 2008, Buenos Aires.
Molteni, V., y Zulueta, M. A. (2002): Análisis de la visibilidad internacional de la produc-
ción científi ca argentina en las bases de datos Social Sciences Citation Index y Arts
and Humanities Citation Index en la década de 1990-2000: estudio bibliométrico. Re-
vista Española de Documentación Científi ca
, vol. 25 (4), 455-465.
Morillo, F.; Fernández, M., y Gómez, I. (1999): Evolution of Spanish journals in the inter-
national scene. Research Evaluation, vol. 8 (2), 71-76.
Russell, J., y Ainsworth, S. (2010): Social science research in the Latin American and the
Caribbean regions in comparison with China and India. En International Social Scien-
ce Council, World Social Sciences Report: Knowledge Divides. UNESCO, París.
Sancho, R. (1992): Misjudgments and shortcomings in the measurement of scientifi c acti-
vities in less developed countries. Scientometrics, vol 23 (1), 221-233.
Sanz, E.; Castro, F.; Povedano, E.; Hernández, A.; Martín, C.; Morillo-Velarde, J.; García-
Zorita, C.; de la Nuez, J., y Fuentes, M. (2002): Creación de un índice de citas de
revistas españolas de humanidades para el estudio de la actividad investigadora de los
científi cos de estas disciplinas. Revista Española de Documentación Científi ca, vol. 25
(4), 443-454.
Sanz Casado, E., y Conforti, N. (2005): Análisis de la actividad científi ca de la Facultad de
Humanidades de la Universidad de Mar del Plata, durante el período 1998-2001. Re-
vista Española de Documentación Científi ca
, vol. 28 (2), 196-205.
Shenhav, Y., y Kamens, D. (1991): The «costs» of institutional isomorphism in non-Western
countries. Social Studies of Science, vol 21 (3), 427-545.
Sztompka, P. (2009): One Sociology or Many? En. S. Patel (ed.), The ISA Handbook of
Diverse Sociological Traditions, Sage, Los Angeles.
Van Leeuwen, T. N.; Moed, H. F.; Tijssen, R. J.; Visser, M. S., y Van Raan, A. (2001): Lan-
guage biases in the coverage of the Science Citation Index and its consequences for
international comparisons of national research performance. Scientometrics, vol. 51 (1),
335-346.
Vessuri, H. (1995): Recent strategies for adding value to scientifi c journals in Latin Ame-
rica. Scientometrics, vol 34 (1), 139-161.
Vessuri, H.; Martínez Larrechea E., y Estévez, B. (2001): Los científi cos sociales en Vene-
zuela. Perfi l bibliográfi co e implicaciones de política, Cuadernos del Cendes vol. 18
(48), 89-121.
Wainerman, C. (1999): El rey está desnudo: acerca de la formación de postgrado en ciencias
sociales. Boletín Informativo – Consejo de Profesionales en Sociología, vol. 1 (5), 4-5.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 408-425, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.829
425

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 427-446, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
NOTAS Y EXPERIENCIAS / NOTES AND EXPERIENCES
Reutilización de la información generada en el sector
público español

Rosario Arquero Avilés*, Félix Del Val e Gastaminza*, L. Fernando Ramos Simón*,
Iuliana Botezán*, Concepción Mendo Carmona*, Rodrigo Sánchez Jiménez*,
Carlos Tejada Artigas*, Silvia Cobo Serrano*, Andrea Sala Jiménez*
Resumen: Se presenta el análisis de los resultados del cuestionario dirigido a los organis-
mos del sector público español con la fi nalidad de caracterizar la información gene-
rada por dicho sector susceptible de reutilización, y se analiza el proceso de generación,
difusión y comercialización de la misma en el marco de la Ley española 37/2007, de
16 de noviembre, sobre reutilización de la información del sector público (Directiva
2003/98/CE del Parlamento Europeo y del Consejo, de 17 de noviembre de 2003.
Palabras clave: Información publica, reutilización de información, administración pública.
Re-use of public sector information from the perspective
of the Spanish public administration

Abstract: This article analyzes the results of a questionnaire directed to public sector bodies,
which sought to characterize public sector information that could be re-used and to
study the way in which it is produced, disseminated and commercialized, all in relation
to Spain’s Law 37/2007 and EU Directive 2003/98/CE, both addressed to the re-use of
public sector information.

Keywords: Public information, information re-use, public administration.
1. Introducción
La información generada por la administración pública tiene un interés indu-
dable para las empresas, en cuanto a que supone un importante activo para la
toma de decisiones en sus ámbitos de actuación, contribuyendo, por tanto, al cre-
* Universidad Complutense de Madrid. Facultad de Ciencias de la Documentación. Departamen-
to de Biblioteconomía y Documentación. MADRID, España. Correo-e: http://multidoc.rediris.es/ppo/
index.php; publidoc@ccdoc.ucm.es.
Recibido: 09-12-10; 2.ª versión: 18-01.2011; aceptado: 20-05-2011.
427

ROSARIO ARQUERO AVILÉS Y OTROS
cimiento económico y a la creación de empleo. Asimismo es un recurso vital
para los ciudadanos como elemento de transparencia democrática. La Directiva
2003/98/CE, de 17 de noviembre de 2003, del Parlamento Europeo y del Conse-
jo, relativa a la reutilización de la información del sector público, surge sobre esa
base y se adoptó con el objetivo de explotar el potencial de información del
sector público y superar las barreras de un mercado europeo fragmentado esta-
bleciendo unos criterios homogéneos, asentados en condiciones equitativas, pro-
porcionadas y no discriminatorias para el tratamiento de la información suscep-
tible de ser reutilizada por personas físicas o jurídicas.
La directiva ofrece una primera defi nición de reutilización de información
pública al considerar «... el uso de documentos que obran en poder de organis-
mos del sector público por personas físicas o jurídicas con fi nes comerciales o
no comerciales distintos del propósito inicial que tenían esos documentos en la
misión de servicio público para la que se produjeron.»
En la exposición de motivos ofrece una serie de razonamientos en los que
se explican las causas de índole económica y social que motivan la propuesta.
Las líneas argumentales básicas son las de explotar el potencial de la información
del sector público y superar las barreras de un mercado europeo fragmentado.
En concreto, se destacan los siguientes aspectos:
• La sociedad de la información y del conocimiento afecta a la vida de todos
los ciudadanos, al permitirles contar con nuevos medios y productos para
acceder y adquirir el conocimiento. La creación y difusión de contenidos
digitales constituye por ello un potente motor del crecimiento, la competi-
tividad y el empleo. La reutilización de la información del sector público
contribuirá al logro de esos objetivos.
• El sector público recoge, trata y difunde gran cantidad de información:
— Información comercial y fi nanciera.
— Jurídica y administrativa.
— Geográfi ca, sobre tráfi co, turística, etc.
• Para los ciudadanos y las empresas resultará de gran interés disponer de
esta información a través de Internet, además, facilitará la comunicación
con las administraciones públicas y la participación en el proceso demo-
crático.
• Esta información es esencial para muchos productos de información digital.
Se trata de un activo importante en el sector de contenidos digitales, un
sector que ya da empleo a cuatro millones de ciudadanos.
• La integración de las economías europeas generará una demanda de pro-
ductos y servicios de información paneuropea. En la actualidad, la creación
de este tipo de productos y servicios choca con unas normas y prácticas
diferentes en cada Estado, lo que crea incertidumbre sobre las condiciones
de uso a los organismos públicos, a las empresas y a los ciudadanos.
428
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
• Al establecer un conjunto mínimo de normas comunes se crearán las con-
diciones que harán posible la creación de productos para toda la Unión.
Al mismo tiempo, los organismos públicos podrán contar con unos criterios
comunes cuando reciban solicitudes de reutilización de la información.
• La Directiva no afectará negativamente el acceso a los documentos por parte
de los ciudadanos, ni modifi cará las actuales normas de acceso a los documen-
tos de los Estados miembros. Asimismo, la directiva pretende favorecer el
logro de los objetivos del mercado interior defi nido en el art. 95 del Tratado.
• Por último, en cuanto a los precios y el problema de tarifi cación de la in-
formación del sector público, la cuestión se debate entre un modelo de
bajo coste como el aplicado en Estados Unidos en el que las tarifas no su-
peran los costes marginales de reproducción y difusión y otros modelos de
recuperación de costes utilizados en Europa. La propuesta tiene en cuenta
que algunos organismos públicos dependen de los ingresos procedentes de
la venta de sus recursos para fi nanciar parte de sus actividades, por lo que
no impone modifi cación en esas políticas, pero insta a los organismos pú-
blicos a que adopten el enfoque del coste marginal de reproducción y di-
fusión cuando sea posible.
La incorporación de la Directiva al ordenamiento jurídico español tiene lugar
a través de la Ley 37/2007, de 16 de noviembre, sobre reutilización de la infor-
mación del sector público. La Ley considera reutilización el uso de documentos
que obran en poder de las Administraciones y organismos del sector público,
por personas físicas o jurídicas, con fi nes comerciales o no comerciales, siempre
que dicho uso no constituya una actividad administrativa pública. Excluye del
concepto el intercambio de documentos entre Administraciones y organismos
del sector público en el ejercicio de las funciones públicas que tengan atribuidas.
Con objeto de revisar la aplicación de la Directiva y resaltar el potencial de
reutilización de esta información en la era digital, la Comisión presentó en 2009
una Comunicación en la que ponía en evidencia la existencia de una serie de
barreras para el acceso y empleo de la información pública, citando específi ca-
mente la existencia de acuerdos exclusivos, prohibidos expresamente por la Di-
rectiva y determinaba poner en marcha una investigación sobre el alcance de
tales acuerdos en el verano de 2009.
Esta investigación fue encargada a distintos organismos e investigadores de
diversos países de la Unión Europea y, en concreto, el estudio de la situación
española fue objeto de un contrato entre la Comisión y el Grupo Publidoc, diri-
gido por el profesor de la Universidad Complutense de Madrid D. L. Fernando
Ramos Simón. Como resultado de esa investigación, los análisis realizados en
ocho países de la Unión Europea, publicados en el Portal de la Sociedad de la
Información de la Comisión, y de los cuales publicamos aquí el análisis de los
datos obtenidos desde la óptica de las administraciones públicas relativos a Es-
paña, han tratado de identifi car la permanencia de determinadas barreras al ac-
ceso y empleo de los datos públicos, en un doble sentido:
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
429

ROSARIO ARQUERO AVILÉS Y OTROS
• Nivel real de conocimiento de la Directiva y grado de concienciación ad-
quirido sobre el potencial de la actividad reutilizadora.
• Posibles prácticas discriminatorias, actuaciones monopolísticas o falta de
transparencia y claridad en la apertura de dichos recursos.
El estudio ha sido realizado por el Grupo Publidoc de la Universidad Com-
plutense de Madrid (UCM) y en él se establecen similares recomendaciones a las
plasmadas en los restantes estudios de Austria, Bélgica, Dinamarca, Francia, Italia,
Polonia y República Checa, centradas en reforzar la divulgación de los benefi cios
socioeconómicos de la apertura de la información del sector público y potenciar
la difusión de las actuaciones derivadas de la Ley 37/2007, de 16 noviembre.
2. Material y métodos
Se presenta en el trabajo el análisis de los resultados de la administración de
un cuestionario dirigido a los organismos del sector público y que ha tenido
como fi nalidad caracterizar la información del sector público español susceptible
de reutilización y analizar el proceso de generación, difusión y comercialización
de la misma en el marco de la Ley española 37/2007, de 16 de noviembre, sobre
reutilización de la información del sector público (Directiva 2003/98/CE del Par-
lamento Europeo y del Consejo, de 17 de noviembre de 2003, relativa a la reuti-
lización de la información del sector público).
Hemos de señalar que la realización de este cuestionario, se enmarca en un
trabajo de investigación más amplio que tenía como objetivo identifi car situacio-
nes que constituyeran acuerdos exclusivos o pudieran, potencialmente, ser con-
siderados como tales en el contexto de la Directiva 2003/98/CE. Los principales
resultados de dicho trabajo de investigación se publicaron en el informe «PSI:
Identifi cation of Potential Exclusive Agreements – Spain/Final Report», elaborado
en 2010 por el Grupo Publidoc. Ahora bien, dado que el formato y las caracte-
rísticas de publicación de los informes elaborados para la Comisión Europea por
los distintos países (cuya relación presentamos en la sección «Estudios sobre
Acuerdos exclusivos elaborados para la Comisión Europea», en el apartado «Fuen-
tes y bibliografía»), no contemplaba la publicación de los resultados concretos
del cuestionario a organismos de la Administración Pública, nos parece relevan-
te difundir, expresamente en este trabajo, los hallazgos derivados de la realización
del cuestionario dirigido a organismos del sector público en España y que cons-
tituyen resultados originales de la investigación.
En virtud de lo señalado, hemos de poner de manifi esto que, en el caso es-
pañol, se ha utilizado un cuestionario semiestructurado de 24 preguntas que se
engloban en cuatro bloques. En el primer bloque se abordan las condiciones
iniciales para la reutilización de la información del sector público en cada orga-
nismo. Las preguntas se centran en indagar las características de la producción
y de la política de difusión, distribución y, en su caso, venta, de la información
430
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
potencialmente reutilizable. En el segundo bloque se analizan las características
de la información que es generada y distribuida con fi nes de reutilización (tipo-
logías y clases de información, procedencia de la misma, formatos, profesionales
que participan en su generación, solicitud, tasas o precios públicos y público
objetivo de dicha información). En el tercer bloque se indaga sobre los acuerdos
de explotación y las condiciones de uso de la información reutilizable (existencia
de acuerdos de reutilización, existencia de acuerdos exclusivos e información
disponible sobre acuerdos exclusivos y requisitos y condiciones de uso de dicha
información). Finalmente, se incorpora un cuarto bloque para la inclusión de los
datos de clasifi cación del organismo.
El diseño de la encuesta se ha sustentado:
• En la discusión y análisis por parte del Grupo de Investigación Publidoc
para la identifi cación de las dimensiones del cuestionario y la elección de
la tipología de preguntas, formato de respuestas, estructuración en los blo-
ques mencionados, selección del público objetivo de la encuesta y proce-
dimientos de administración de la misma.
• En el análisis de cuestionarios utilizados en estudios previos sobre reutili-
zación de información del sector público y en la adaptación de su orienta-
ción y contenido al contexto español.
El grupo de investigación envió el cuestionario a 101 organismos del sector
público que representaban los seis grandes sectores del mercado de la informa-
ción pública en los que se han basado todos los estudios sobre acuerdos exclu-
sivos elaborados para la Comisión Europea y cuya relación se presenta en el
apartado «Fuentes y bibliografía». La distribución según estos sectores se ha ba-
sado en una descripción del mercado de la información pública en términos de
actividad, tanto en la producción y difusión de los activos de información (sector
público) como en la reutilización de la misma (sector privado). Para determinar
la importancia de cada sector, se analizaron los datos relativos a la disponibilidad
de productos y activos de información del sector público (en síntesis, bases de
datos, conjuntos de datos y publicaciones ofi ciales tanto de la Administración
General del Estado como de las Comunidades Autónomas). El análisis de dispo-
nibilidad de dichos productos y activos de información se sustenta en un estudio
detallado sobre el concepto de activos de información pública que se realizó en
un trabajo previo (Ramos Simón y otros, 2009).
El cuestionario se envió por e-mail e iba precedido de un protocolo de pre-
sentación (con una explicación del mismo) así como una carta de la Comisión
Europea en la que se invitaba a participar en el estudio y que mostraba el apo-
yo de dicha institución a Publidoc, como grupo de investigación encargado de
su realización.
El envío del cuestionario se complementó con llamadas telefónicas para so-
licitar información adicional, localizar a la persona adecuada o para entrevistar
directamente al personal y completar el cuestionario. La tabla I muestra un es-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
431

ROSARIO ARQUERO AVILÉS Y OTROS
quema de la tasa de respuesta y el número de cuestionarios enviados por secto-
res de mercados de información.
TABLA I
Cuestionarios enviados por sectores del mercado de la información pública
y ratios de respuesta
Sectores del mercado de la información
Cuestionarios
Respuestas
%
pública
enviados
recibidas
Negocios/Información económica
38
17
44,74
Información geográfi ca
7
4
57,14
Información legal
13
6
46,15
Información meteorológica
3
3
100
Datos sociales
34
13
38,24
Información de transportes
6
4
66,67
Total
101
47
46,53
3. Resultados y discusión
3.1. Condiciones iniciales de reutilización de información
del sector público
La mayoría de las instituciones que han respondido afi rman ser conscientes
de la existencia de un mercado de reutilización de la información que producen
(90,48 %), sólo un porcentaje muy pequeño no tiene conciencia de ello (9,52 %).
En relación con la cuestión anterior, sorprende que sólo el 58,54 % disponga
de una política de difusión de la información que produce.
La información susceptible de reutilización se difunde preferentemente a tra-
vés de la Web institucional y, en menor medida, a través de folletos informativos
y correos electrónicos, en este orden. En el apartado «Otros medios u otros We-
bsites», destacan las sedes electrónicas de instituciones públicas en general, in-
tranets e incluso el correo ordinario (tabla II).
A pesar de la mayoritaria respuesta afi rmativa a la primera cuestión planteada
sobre la existencia de un mercado de reutilización de la información que producen
los organismos del sector público, la casi totalidad de los encuestados no muestran
información relativa a la normativa nacional o comunitaria que regula la reutilización
de la información del sector público (una referencia explícita a la Ley 37/2007, de
16 de noviembre, sobre reutilización de la información del sector público), sólo
un 10,26 % ofrecen información sin la posibilidad de enlazar con la URL de la nor-
ma referida y ninguna institución manifi esta ofrecer el enlace a la ley (tabla III).
432
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
TABLA II
Medios específi cos a través de los que se difunde la existencia de información
susceptible de reutilización
%
Total
E-mail.
45
18
Folletos informativos.
55
22
Internet (a través de su propia página Web).
87,5
35
A través de la página Web de otra/s entidad/es (indique su denominación
25
10
y su URL) o a través de otros medios.
Organismos que han respondido a esta pregunta: 40.
TABLA III
Existencia de una referencia explícita a la Ley 37/2007, de 16 de noviembre,
sobre reutilización de la información del sector público
%
Total
Sí, con URL a la ley.
0
0
Sí, sin URL.
10,26
4
No.
89,74
35
Total
100
39
A la luz de las respuestas recibidas, la mayor parte de los organismos del
sector público (67,5 %) no distribuyen o venden directamente sus productos in-
formativos con fi nes comerciales.
En relación con las respuestas afi rmativas de la pregunta anterior (el 32,5 %),
el 76,92 % de los organismos del sector público distribuye o vende directamente
sus productos de información (tabla IV). El resto de los organismos han creado
una entidad específi ca. Como tales, se indican los Centros de Publicaciones y se
incluyen de forma específi ca la Ofi cina de Patentes y Marcas y el Museo Nacio-
nal del Prado Difusión S. L.
3.2. Características de la información generada y distribuida
con fi nes de reutilización
Los tres sectores de mercado que encabezan la relación de dominios de in-
formación generada para ser reutilizada son el de los datos sociales, la informa-
ción económica y la información legal. Hemos de señalar que el sector de la
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
433


ROSARIO ARQUERO AVILÉS Y OTROS
TABLA IV
Vía a través de la que realizan la venta o distribución de productos
de información a reutilizadores o empresas con fi nes comerciales
%
Total
El organismo del sector público vende o distribuye directamente la infor-
76,92
10
mación.
Se ha creado una entidad específi ca para vender nuestra información.
23,08
3
Total
100
13
información económica se señala también, expresamente, como decisivo en el
mercado de la información pública en Italia y Francia (la sección «Estudios sobre
Acuerdos exclusivos elaborados para la Comisión Europea», en el apartado «Fuen-
tes y bibliografía»). En menor medida, se genera y distribuye en España informa-
ción, con fi nes de reutilización (fi gura 1), sobre transportes, meteorológica e
información geográfi ca (en contraste, según se deriva del análisis de los informes
correspondientes, en Italia, Francia y Alemania esta última categoría de informa-
ción constituye un sector líder en sus mercados de información pública).
Destaca la gran variedad de clases y formatos de presentación de información
que ofrece el sector público a sus potenciales reutilizadores (véanse tabla V y
fi gura 2). Como otras tipologías de información generada se señalaron, en sínte-
FIGURA 1
Dominios de información generada en los organismos públicos
para su reutilización
434
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
sis, las siguientes: información y material audiovisual, documentación parlamen-
taria, documentación para la formación, información cultural, normas técnicas y
datos de opinión. En lo referente a formatos adicionales de presentación de la
información generada para su reutilización se designaron adicionalmente: pro-
gramas y fi cheros informáticos, carteles, artículos científi cos y libros.
TABLA V
Clase de información generada para su reutilización
%
Respuestas
Datos hidrográfi cos
8,11
3
Datos históricos
27,03
10
Energía
13,51
5
Estadísticas culturales
16,22
6
Estadísticas de ciencia y tecnología
24,32
9
Estadísticas de consumo
13,51
5
Estadísticas de educación
5,41
2
Estadísticas de empleo
8,11
3
Estadísticas de la Administración Pública
21,62
8
Estadísticas de población
8,11
3
Estadísticas económicas e industriales
16,22
6
Estadísticas sociales
18,92
7
Estado de las carreteras
2,70
1
Estado del tráfi co
5,41
2
Fotos aéreas
16,22
6
Información cartográfi ca
24,32
9
Información catastral
8,11
3
Información de direcciones
13,51
5
Información fi nanciera
10,81
4
Información geológica
5,41
2
Información sanitaria y estadística
8,11
3
Información topográfi ca
8,11
3
Jurisprudencia
10,81
4
Legislación
21,62
8
Licitaciones
27,03
10
Patentes y marcas
8,11
3
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
435


ROSARIO ARQUERO AVILÉS Y OTROS
TABLA V (continuación)
%
Respuestas
Previsiones climatológicas
8,11
3
Registros de empresas
10,81
4
Sector primario (agricultura, pesca, etc)
10,81
4
Telecomunicaciones
5,41
2
Transporte público
8,11
3
Otras tipologías
40,54
15
Organismos que han respondido a esta pregunta: 37
FIGURA 2
Formatos de presentación de la información generada
para su reutilización
La información que generan, distribuyen y comercializan los organismos del
sector público con fi nes de reutilización procede mayoritariamente de la propia
administración pública (fi gura 3) y, en menor medida, es generada por los ciu-
dadanos, las empresas y otras entidades sin ánimo de lucro.
En el proceso de elaboración de la información reutilizable participa una am-
plia gama de profesionales procedentes del ámbito de las Ciencias Sociales y Ju-
rídicas, del ámbito Bio-sanitario y de la Ingeniería. Específi camente, los profesio-
nales de la información y documentación se designan como pieza clave en dicho
proceso (fi gura 4). En la categoría de respuesta «Otros» a esta pregunta de res-
436
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825



Reutilización de la información generada en el sector público español
FIGURA 3
Procedencia de la información generada, distribuida y/o comercializada para
su reutilización
puesta múltiple, se ha hecho referencia explícita a la participación en dicho pro-
ceso de los siguientes profesionales: ingenieros, veterinarios, meteorólogos, fotó-
grafos, geólogos, fi lólogos, historiadores, biólogos, sociólogos, jueces y magistrados.
FIGURA 4
Profesionales que participan en el proceso de generación de información
reutilizable
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
437


ROSARIO ARQUERO AVILÉS Y OTROS
No se evidencia la existencia de un mercado de reutilización de la informa-
ción del sector público, ya que es este mismo sector el principal demandante
(fi gura 5) y, además, otro dato destacable es que más de la mitad de los orga-
nismos consultados no tienen establecidas tasas o precios públicos de los pro-
ductos que ofrecen. Asimismo, la entrada en vigor de la Ley 37/2007, de 16 de
noviembre, sobre reutilización de información del sector público, no ha supues-
to un incremento del número de respuestas a las solicitudes de información de
potenciales reutilizadores de la información del sector público.
FIGURA 5
Demandantes de la información potencialmente reutilizable
Los reutilizadores de la información generada por los organismos del sector
público que han participado en el estudio se localizan fundamentalmente: en
todas las Comunidades Autónomas del Estado español, en los países de la Unión
Europea y en Iberoamérica. Dichos reutilizadores se pueden agrupar en los
siguientes ámbitos: consultoras, editoriales jurídicas, medios de comunicación,
organismos del sector público del ámbito español y europeo y Universidades.
3.3. Acuerdos de explotación y condiciones de uso
de la información reutilizable
A tenor de las respuestas proporcionadas por los organismos del sector público,
no existen acuerdos exclusivos. En este sentido, es rotunda la respuesta negativa
(91,89 %) y el desconocimiento de su existencia. Sin embargo, contestan afi rmati-
vamente un 20 % de los encuestados sobre disponibilidad de información pública
438
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
acerca de términos de licencias (10 %) e información general de los acuerdos (10 %);
el resto de organismos no tienen disponible esta información o lo desconocen.
Del análisis de los informes realizados en otros países europeos (es el caso
de Alemania, Austria, Bélgica, Dinamarca, Polonia y República Checa) se deriva
como conclusión la inexistencia de acuerdos exclusivos. En cambio, en el estudio
de Francia se han detectado dos posibles acuerdos exclusivos y en el caso de
Italia se han identifi cado un total de 7 potenciales acuerdos exclusivos.
Sobre las condiciones de uso de la información reutilizable o los acuerdos
para la reutilización, con el mismo número de respuestas se sitúan quienes las
ofrecen a través de las páginas Web y quienes alegan que la ofrecen previa so-
licitud (tabla VI). En la categoría de respuesta abierta para indicar otras vías de
difusión se incluyen los Centros de Documentación.
TABLA VI
Vías a través de las que está disponible la información que se ofrece sobre
acuerdos o condiciones de uso de la información potencialmente reutilizable
%
Respuestas
La información está disponible en la Web del organismo.
66,67
16
Se ofrece la información previa solicitud.
66,67
16
Está disponible a través de otras vías, por favor, precise cuáles.
33,33
8
Organismos que han respondido a esta pregunta: 24.
Ningún órgano del Sector Público que ha participado en el estudio está dis-
puesto a facilitar documento alguno que contenga acuerdos exclusivos.
En la pregunta abierta a otros comentarios sobre reutilización de la informa-
ción del Sector Público, de las respuestas ofrecidas emanan tres aspectos intere-
santes:
• No hay política de coordinación de la información para su reutilización, ni
tampoco conciencia de que haya de haberla.
• Varias instituciones trabajan en estos momentos en el desarrollo de la le-
gislación.
• Tienen condiciones claras para la reutilización de la información.
4. Conclusiones y recomendaciones
Del estudio realizado en el contexto español se deriva una conclusión incues-
tionable: el desconocimiento en profundidad de la Ley 37/2007 de 16 de noviem-
bre, sobre reutilización de información del sector público y de todas las poten-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
439

ROSARIO ARQUERO AVILÉS Y OTROS
cialidades que se pueden derivar de la misma. De dicha conclusión emana una
recomendación que se sintetizaría en la necesidad de defi nir una política activa
de difusión y comunicación del contenido y de las implicaciones de la Ley. A
tenor del análisis de las conclusiones derivadas del estudio de la situación descri-
ta en los informes de otros países europeos, podemos encontrar un claro parale-
lismo. Así, en el caso de Polonia se hace referencia al conocimiento limitado del
contenido de la Directiva que tienen los propios representantes del sector públi-
co que han participado en el estudio. Igualmente, en el caso de Italia se pone de
manifi esto que el conocimiento de la regulación europea sobre reutilización de la
información pública es muy limitado. El informe alemán señala que la reacción
general que se deriva de la encuesta realizada revela un alto grado de falta de
conciencia sobre las políticas de reutilización de la información del sector público.
Al desconocimiento de la normativa sobre reutilización de la información se
une la ausencia de una política de difusión de la reutilización de la información
que debería conducir a una defi nición de iniciativas y acciones encaminadas a
establecer mecanismos que garanticen la puesta en marcha de una estrategia de
concienciación de la importancia de una difusión de la información con fi nes de
reutilización. La relevancia de la puesta en marcha de dicha estrategia de con-
cienciación adquiere mucho más peso si se tiene en cuenta que, tras la realización
de la investigación, no se ha evidenciado la existencia de un mercado de reuti-
lización de la información del sector público en nuestro país ni se ha detectado
la conciencia entre los productores de las posibilidades y de las oportunidades
que se podrían derivar de la potenciación de este mercado de la información del
sector público. En virtud de esta situación, se imponen la necesidad de potenciar
y defi nir medidas concretas para la creación y el desarrollo de este mercado como
fuente de fi nanciación y sostenimiento del sector público y como uno de los
motores de la economía española. En comparación con la situación española
descrita, del análisis de los informes de otros países europeos, sí podemos infe-
rir la existencia de un mercado de reutilización de la información del sector pú-
blico. En este sentido, en el informe italiano se incorpora una conclusión sobre
la propia estructura del mercado de la información pública, de carácter diverso
según el sector que se analice. Así, por ejemplo, se pone de manifi esto que el
número de competidores en ciertos ámbitos (ejemplo, la información meteoro-
lógica) es menor que en otros sectores (es el caso de la información económica
y geográfi ca). En el caso francés, se subraya la existencia de barreras para la libre
competencia del mercado de la información pública del sector público, especial-
mente en los dominios de la información geográfi ca y económica y en el infor-
me alemán se señala el ámbito de la información geográfi ca como líder en el
mercado de la información pública en Alemania.
Hemos de señalar que una de las grandes difi cultades en la realización del
estudio se ha relacionado la siguiente situación: en ningún organismo del sector
público participante en el estudio se ha encontrado un responsable y/o interlo-
cutor para las cuestiones relacionadas con la reutilización de la información. En
esta línea, consideramos que sería muy recomendable la creación, en cada orga-
440
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
nismo del sector público, de una fi gura que asumiera las funciones propias de
responsable y/o interlocutor en materia de reutilización (por ejemplo, en el in-
forme de la República Checa se destaca que la mayoría de los organismos del
sector público respondieron a la encuesta a través de sus departamentos legales).
En este sentido, consideramos que, más allá de su relevancia en la participación
específi ca en esta encuesta, la existencia de este interlocutor en materia de reuti-
lización contribuiría a potenciar y desarrollar este mercado con vistas a facilitar
la labor de los potenciales reutilizadores de la información del sector público.
Finalmente, hemos de destacan que de la realización de todos los informes
se deriva la conclusión común de su contribución a la difusión de las políticas
de reutilización de la información del sector público y a la necesidad de crear
conciencia para fomentar el desarrollo de este sector con el fi n último de la crea-
ción de empleo en este ámbito.
5. Fuentes y bibliografía
Legislación citada
Directiva 2003/98/CE del parlamento europeo y del consejo de 17 de noviembre de 2003
relativa a la reutilización de la información del sector público. Diario Ofi cial de la
Unión Europea L 345 de 31/12/2003, 0090-0096. http://tinyurl.com/26spd2e [consul-
tado el 1 de diciembre de 2010].
Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector públi-
co. BOE n.º 276 de 17/11/2007, 47160-47165. http://tinyurl.com/yax6dyr [consultado
el 1 de diciembre de 2010].
Comisión de las Comunidades Europeas (2009): Comunicación de la comisión al parla-
mento europeo, al consejo, al comité económico y social europeo y al comité de las
regiones: reutilización de la información del sector público – Revisión de la Directiva
2003/98/CE – Bruselas, 7.5.2009 COM(2009) 212 fi nal. http://tinyurl.com/25ca8xe
[consultado el 1 de diciembre de 2010].
Estudios sobre Acuerdos exclusivos elaborados para la Comisión Europea
A9 Consulting (2010): PSI: Identifi cation of Potential Exclusive Agreements in Denmark.
Cities on Internet Association (2010): PSI: Identifi cation of potential Exclusive Agreements,
Poland.
DLA Piper UK LLP (2010): Country report assessment on exclusive PSI re-use arrangements
in Belgium.
EPMA – Agentura pro evropské projekty a management (2010): PSI: Identifi cation of po-
tential Exclusive Agreement, Czech Republic.
GEOkomm IPEAG (2010): Public Sector Information (PSI): Identifi cation of potential Ex-
clusive Agreements – Germany.
GRUPO PUBLIDOC-UCM (2010): PSI: Identifi cation of Potential Exclusive Agreements,

Spain/Final Report.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
441

ROSARIO ARQUERO AVILÉS Y OTROS
Preslmayr Rechtsanwälte O. G., y Dr. Rainer Knyrim (2010): Study PSI: Identifi cation of
potential Exclusive Agreements, Austria.
T33 Snc (2010): Study PSI: Identifi cation of potential Exclusive Agreements, Italy.
Virginie Boillet, V., y Guerre, L. (2010): Psi re-use: Identifi cation of potential exclusive
agreements France Report.
Todos ellos pueden localizarse en: http://tinyurl.com/39f9l35 [consultado el 1 de diciem-
bre de 2010].
Bibliografía especializada
Ramos Simón, L. F.; Mendo Carmona, C., y Arquero Avilés, R. (2009): La producción in-
formativa y documental del Estado: hacia un inventario de los recursos públicos.
Revista Española de Documentación Científi ca, enero-marzo, vol. 32 (1), 40-59.
6. ANEXOS
6.1. Relación de organismos del sector público a los que se envió
el cuestionario
Información económica
Agencia de Desarrollo Económico de la Rioja
Agencia de Innovación y Desarrollo de Andalucía
Agencia del Conocimiento y de la Tecnología
Agencia Gallega de Desarrollo Rural
Banco de España
Centro Español de Metrología
Comisión Nacional del Mercado de Valores
Consejería de Medio Ambiente, Vivienda y Ordenación del Territorio de la Comunidad de Madrid
Consejo de Cámaras de Comercio e Industria de Castilla y León (COCICYL)
Consejo Superior de Cámara de Comercio
Ente Vasco de la Energía (EVE)
Fundación Española para la Innovación de la Artesanía
Fundación INCYDE
Generalitat Valenciana
Instituto Catalán de Crédito Agrario
442
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
Información económica
Instituto Catalán de Finanzas
Instituto de Contabilidad y Auditoria de Cuentas
Instituto de Desarrollo Económico
Instituto de Fomento
Instituto de la Vid y el Vino de Castilla-La Mancha (VICAM)
Instituto de Turismo de España (TURESPAÑA)
Instituto Gallego de la Calidad Alimentaria
Instituto Geológico y Minero
Instituto Madrileño de Investigación y Desarrollo Rural, Agrario y Alimentario de la Comunidad
de Madrid (IMIDRA)
Instituto Murciano de Investigación y Desarrollo Agrario y Alimentario (IMIDA)
Instituto Nacional de Estadística (INE)
Instituto Nacional de Técnica Aeroespacial (INTA)
Instituto para la Diversifi cación y el Ahorro de la Energía (IDAE)
Instituto Tecnológico de Aragón (ITA)
Junta de Castilla y León
Ministerio de Ciencia e Innovación
Ministerio de Economía y Hacienda
Ministerio de Fomento
Ministerio de Industria, Turismo y Comercio
Ministerio de Medio Ambiente y Medio Rural y Marino
Ministerio de Vivienda
Ofi cina Española de Patentes y Marcas
Registro Mercantil
Registro Mercantil Central (Decanato de Madrid del Colegio de Registradores)
Información geográfi ca
Centro Nacional de Información Geográfi ca (CNIG)
Instituto Español de Oceanografía
Instituto Geográfi co Nacional
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
443

ROSARIO ARQUERO AVILÉS Y OTROS
Información legal
Agencia de Protección de Datos
BOE
Comunidad de Madrid
Congreso de los Diputados
Consejo de Estado
Consejo General del Poder Judicial
Junta de Castilla y León
Comunidad Autónoma de La Rioja
Ministerio de Justicia
Ministerio de la Presidencia
Información social
Agencia Antidroga
Agencia de Evaluación de Tecnologías Sanitarias de Andalucía
Agencia Nacional de Evaluación de la Calidad y Acreditación (ANECA)
Biblioteca Nacional
Centro de Investigaciones Sociológicas (CIS)
Consejo de Seguridad Nuclear
Defensor del Pueblo
Dirección General del Catastro
Gobierno de Aragón
Gobierno de España
Gobierno de Navarra
Instituto Asturiano de Estadística
Instituto Canario de Seguridad Laboral
Instituto Cántabro de Seguridad y Salud en el Trabajo
Instituto de Estadística de la Comunidad de Madrid
444
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Reutilización de la información generada en el sector público español
Información social
Instituto de Estadística de las Islas Baleares
Instituto de Estudios Ceutíes
Instituto de Estudios Riojanos
Instituto de la Juventud
Instituto de la Mujer
Instituto de Mayores y Servicios Sociales (IMSERSO)
Instituto Madrileño de Administraciones Públicas (IMAP)
Instituto Nacional de Administración Pública
Instituto Navarro para la Igualdad
Instituto Vasco de Administración Pública (IVAP)
Junta de Extremadura
Ministerio de Asuntos Exteriores y Cooperación
Ministerio de Cultura
Ministerio de Educación
Ministerio de Igualdad
Ministerio de Política Territorial
Ministerio de Sanidad y Política Social
Ministerio del Interior
Museo Nacional del Prado
Región de Murcia
Región de Murcia: Servicio de Publicaciones y Estadística
Senado
Xunta de Galicia
Información sobre transportes
ADIF
AENA
Centro de Estudios y Experimentación de Obras Públicas (CEDEX)
Consorci de l’Autoritat del Transport Metropolità (ATM)
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825
445

ROSARIO ARQUERO AVILÉS Y OTROS
Información sobre transportes
Departamento de Interior del Gobierno Vasco
Dirección General de Tráfi co
Ferrocarriles de la Generalitat de Catalunya (FGC)
Información meteorológica
Agencia Estatal de Meteorología (AEMET)
Euskalmet / Dirección de Meteorología y Climatología Gobierno Vasco
Servei Meteorològic de Catalunya
446
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 427-446, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.825

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 447-460, 2011
ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
Certifi cación de calidad en los archivos.
Análisis y prospectiva

Manuela Moro Cabero*
Resumen: Análisis del alcance de la certifi cación en la práctica archivística. Descrip-
ción del proceso certifi cador, de la normativa específi ca utilizada para ello y de los
organismos certifi cadores, con el fi n de mostrar su funcionamiento y difundir fuen-
tes y agentes que intervienen en la certifi cación de Archivos. Contextualización de
la certifi cación en el modelo de gestión de documentos —serie ISO 30300—, siste-
ma de gestión para los documentos, con el objetivo de difundir sus principios y
estructura donde se regula su certifi cación. Valoración del impacto de la certifi cación
sobre el mantenimiento de sistemas de gestión documental efi cientes en las organi-
zaciones. El método analítico-descriptivo es utilizado en el estudio, cuyos resultados
son: descripción del(los) objeto(s) y proceso de certifi cación en el Archivo. Presen-
tación del proyecto de certifi cación regulado en la serie de normas ISO 30300 sobre
sistemas de gestión documental: objeto, proceso y agentes implicados. Refl exión
sobre el impacto del proceso certifi cador de la actividad de archivar en las organi-
zaciones.
Palabras claves: Certifi cación, gestión de documentos, ISO 15489:2001, serie ISO 30300.
Certifi cation in archival practice: analysis and outlook
Abstract: An analysis of the reach of certifi cation in archival practice. The article descri-
bes the certifi cation process and the specifi c standards used in it, as well as the agen-
cies responsible for certifi cation. The purpose is to show how the process works and to
make known the sources and agents involved in archival certifi cation. Certifi cation
is contextualized within the records management model (ISO 30300: Manage-
ment Systems for Records), in order to promote this model’s principles and structure
for regulating certifi cation. There is an assessment of the impact of certifi cation on
maintaining effi cient records management systems in organizations. The analytical-
descriptive method used in the study results in a description of the object(s) and archi-
val certifi cation process. This presentation of a project of certifi cation of a re cords
management system according to ISO 30300 —object, process and agents invol-
ved— concludes with a refl ection on the impact of the certifi cation process on orga-
nizations.

Key words: Certifi cation, records management, ISO 15489:2001, SERIE ISO 30300.
*Universidad de Salamanca, Facultad de Traducción y Documentación. Correo-e:moroca@usal.es.
Recibido: 08-11-2010; 2.ª versión: 21-03-2011; aceptado: 23-03-2011.
447

MANUELA MORO CABERO
1. Introducción
La certifi cación en los Archivos, con mayúscula (Heredia, 2007), se circuns-
cribe a la certifi cación del logro de la calidad, en sistemas y servicios, así como
de personas. Mientras que la certifi cación de la calidad y el reconocimiento de
la excelencia es práctica habitual en diferentes países, no lo es tanto la certifi ca-
ción de personas. La certifi cación de los sistemas de gestión de documentos no
se ha llevado a cabo de modo expreso, siendo efectuadas evaluaciones relacio-
nadas, únicamente, con objetivos de calidad o de excelencia. El interés manifes-
tado por la comunidad archivística sobre la calidad y su certifi cación es paralelo
al interés mostrado por las organizaciones, dado que el Archivo, inmerso en su
estructura, es considerado un sistema o un servicio sobre el que demostrar su
efi ciencia. La literatura archivística dispone de numerosos referentes sobre la ca-
lidad provenientes de diferentes escuelas de pensamiento archivístico (Brumm,
1996; Moro Cabero,1997 y 2009; Roberge, 2002; Núñez Fernández, 2007: Duff y
Mckemmish, 2000, etc.)
La Asociación Española de Normalización (AENOR, 2010) defi ne la certifi ca-
ción como «la acción llevada a cabo por una entidad independiente de las partes
interesadas mediante la que se manifi esta que una organización, producto, pro-
ceso o servicio, cumple los requisitos defi nidos en unas normas o especifi caciones
técnicas
». Se trata de una acción en la que se implica a una entidad indepen-
diente y que es de carácter voluntario. El reconocimiento de la capacidad o do-
tación de autoridad de «esa entidad independiente» se denomina acreditación. La
acreditación es un proceso de autorización, mediante el cual un organismo cer-
tifi cador (entidad independiente que testifi ca) se somete a evaluación y es reali-
zado por un organismo de acreditación único para cada país. Tanto para la rea-
lización de las certifi caciones como para las acreditaciones debe adoptarse un
método normalizado.
En este estudio se pretenden contextualizar la práctica de certifi cación de la
calidad en el Archivo. Para ello, se analizará el proceso certifi cador y la relación
de normas sobre las que se regula, así como la naturaleza y competencia de los
agentes que intervienen en el proceso. Se argumentará sobre la proyección de
futuro de la certifi cación en sistemas de gestión documental. El debate se funda-
menta en el análisis de los borradores de la serie ISO 30300 sobre sistemas nor-
malizados de gestión documental. Finalmente se pretende aportar una refl exión
sobre el valor que la certifi cación implica en el ejercicio de archivar y, más con-
cretamente, en los organismos de producción del objeto archivado.
El método utilizado es analítico-descriptivo basado en la revisión de recursos
bibliográfi cos, normativos y legislativos. Los resultados obtenidos son fruto de
una sistematizada refl exión de carácter prospectivo.
El ensayo se estructura en un primer epígrafe en el que se contextualiza la
actividad certifi cadora en la comunidad archivística para demostrar su alcance,
naturaleza y práctica habitual. Destinamos un segundo enunciado al análisis de-
tallado del proceso certifi cador y a la descripción de la normativa básica así como
448
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
de los principales agentes. Conocido el contexto y comprendido el proceso cer-
tifi cador se aborda la proyección certifi cadora en los sistemas de gestión de do-
cumentos. Para ello se analiza el rol de la certifi cación en el nuevo modelo de
gestión de documentos (ISO 30300). Finalmente, se presentan a modo de con-
clusión algunas refl exiones sobre el valor e impacto de la certifi cación en el
Archivo.
2. Calidad y contexto certifi cador en los archivos
La simplifi cación de la estructura normativa sobre calidad, serie ISO 9000:2000,
así como el surgimiento de los premios de reconocimiento de la excelencia en
los años 90 son signifi cativos para que las organizaciones muestren mayor interés
por la calidad, incluidos los Archivos. Actualmente, muchos son los centros y sis-
temas de archivos que están inmersos en la implantación de sistemas de calidad
o en la verifi cación de su excelencia mediante la adopción de modelos de exce-
lencia. Calidad y excelencia forman parte habitual de los valores y la misión de
buen número de organizaciones. Se trata de un modelo de gestión basado en un
enfoque sistémico, de procesos y orientado hacia sus clientes: capital humano,
clientes-usuarios, proveedores, terceras partes e interesados. Aunque la fi nalidad
de estos modelos es la de alcanzar (o aproximarse a) la calidad total en procesos
de producción o de servicio, en la administración de agentes así como en la ca-
lidad de vida laboral en la organización, el método para su consecución difi ere:
constatamos un modelo basado en normas (serie ISO 9000) y otro, de reconoci-
miento de la excelencia, centrado en la autoevaluación de la gestión estructura-
da en criterios y subcriterios mediante su cuantifi cación (Modelo de la Fundación
Europea para la Gestión de la Calidad, EFQM).
El modelo basado en normas ISO exige sensibilización, formación, diseño,
implementación, evaluación de un sistema de gestión de calidad. El éxito de su
adopción radica en su fundamentación como sistema normalizado de gestión
(MSS) estructurado en el dominio conceptual (ISO 9000, vocabulario y principios),
el control de requisitos (ISO 9001), su implantación (ISO 9004) y su certifi cación
(ISO 19011:2002; ISO 17021:2011). Este modelo ha sido seguido por numerosos
archivos, aportamos algún ejemplo del Estado Español, como es el caso del Ar-
chivo de la Diputación de Alicante (desde el 2001), el Archivo Universitario de
la Universidad Complutense (2008) o el Archivo Nacional de Cataluña (desde
2004).
El modelo basado en el reconocimiento de la excelencia difi ere del anterior
en estructura y alcance, ya que NO se basa en normas y se centra en la autoeva-
luación y la mejora continuada. Se fundamenta en la lógica reder: resultados (aque-
llo que la organización consigue), enfoque (aquello que la organización piensa
hacer y las razones para ello), despliegue (aquello que realiza la organización
para poner en práctica el enfoque), evaluación y revisión (aquello que hace la
organización para evaluar y revisar el enfoque y despliegue). El resultado cuan-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
449

MANUELA MORO CABERO
tifi cado de la secuencia reder se materializa en un cuadro de indicadores de
mando integral (liderazgo, políticas y estrategias, procesos, colaboradores y re-
cursos, personas), que nos ayudan a conocer a través de los resultados obtenidos
(en clientes, personal, sociedad y rendimiento fi nal de la organización) si se está
creando el futuro deseado. Su retroalimentación se activa mediante la innovación
y el aprendizaje. Ejemplo de adopción en España de este modelo lo hallamos en
el Sistema de Archivos de Castilla y León, cuya cabecera del sistema ha adapta-
do una herramienta de medición al contexto archivístico (2006) y mantiene un
ejemplo de gestión con sello de calidad reconocido como es el caso del Archivo
Histórico Provincial de León (AHPLe). Un segundo ejemplo lo representa el Ar-
chivo Universitario de Castilla La-Mancha, que en el 2004 obtuvo su primer re-
conocimiento EFQM.
Los citados modelos (EFQM-Normalizado) no son incompatibles. De hecho,
son signifi cativas las instituciones que adoptan un modelo basado en el recono-
cimiento de la excelencia y con posterioridad, implementan un modelo norma-
lizado de certifi cación o viceversa. El AHPLe ha implementado un sistema de
gestión basado en la norma UNE-EN-ISO 9001:2000 y ha recibido el reconoci-
miento EFQM de excelencia 300+. El primer modelo se fundamenta en el cum-
plimiento y verifi cación de la conformidad a las normas, el segundo, pretende
demostrar el cumplimiento de los criterios contenidos en los modelos (EFQM o
adaptaciones en el marco de las Administraciones públicas, tales como el mode-
lo del Marco Común de Evaluación-CAF y el Modelo de evaluación, aprendizaje
y mejora-EVAM). Los criterios (y sus subcriterios) componentes de estos prototi-
pos conforman las divisiones (y subdivisones) en las que se analiza el modo de
gestión. Estos últimos, permiten la comparación del logro en los servicios o uni-
dades aplicadas, puesto que el conjunto de subcriterios es cuantifi cable median-
te datos y ratios obtenidos de mediciones de percepciones, rendimiento y de
indicadores clave o de resultados. La implementación de un modelo de recono-
cimiento de la excelencia, a nuestro entender, resulta de gran utilidad, para la
adopción del modelo basado en normas.
Ambos modelos contribuyen a orientar el trabajo archivístico hacia un fi n
estratégico para las organizaciones; si bien, mientras que en uno han venido uti-
lizándose, únicamente, conceptos de mención y de reconocimiento (EFQM y
adaptaciones), en el otro se utiliza el concepto de certifi cación. Este hecho ha
sido modifi cado recientemente, dado que es posible certifi car el modelo EFQM
y sus adaptaciones. De hecho, mediante resolución (2009) se regula su procedi-
miento.
La evaluación de la gestión de los servicios en los centros universitarios ha
sido acometida mediante versión adaptada EFQM, siendo promovida por diferen-
tes planes nacionales de evaluación de la calidad a través de la ANECA — Agencia
Española de Evaluación de la Calidad— o en algunas CC.AA. por las agencias
específi cas competentes.
La práctica de certifi cación en los archivos españoles no sólo afecta a su mo-
delo de gestión, sino que se expande a otros compromisos de calidad específi cos
450
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
como son los compromisos de servicio en los archivos de Administraciones Pú-
blicas. Dicho compromiso de calidad requiere la adopción de una metodología
específi ca cuyo resultado es una herramienta denominada Carta de servicios, le-
gislada mediante Real Decreto (España, 2005) y dotada de un método de elabo-
ración (2006), en cuya guía se especifi ca el procedimiento, en su caso, de certi-
fi cación.
En suma, los archivos han asumido modelos certifi cados de gestión de la
calidad y excelencia en los sistemas de gestión y en los servicios prestados. De
hecho, la atracción por la calidad es observable en las disposiciones que los sis-
temas de archivos recogen en sus planes de actuación, donde la calidad es un
foco de interés y un elemento de proyección estratégica (Junta de Castilla y León,
2010). A este respecto, existiendo una práctica certifi cadora de sistemas, produc-
tos y servicios, es comprensible la propuesta certifi cadora del sistema de gestión
para los documentos que incluye la nueva normativa ISO 30300, aspecto que
analizaremos en el enunciado 4, una vez comprendidos los procesos de acredi-
tación y de certifi cación.
3. El proceso de acreditación y de certifi cación
3.1. La acreditación de entidades de certifi cación
Los conceptos de certifi cación y acreditación permiten entender la secuencia
del proceso de autorización y responsabilidad en la certifi cación dado que, una
entidad propone un sistema de gestión o producto-servicio a un organismo in-
dependiente para su certifi cación; Lógicamente, la autoridad debe ser regulada y
para ello existen normas de certifi cación y de acreditación. Tres son los tipos de
normas aplicadas de modo coordinado aunque empleadas con fi nalidades dis-
tintas: a) normas de acreditación; b) normas de certifi cación, y c) normas de
evaluación o auditoría. Detallemos la secuencia para cada una de ellas.
a) Normas de acreditación
La norma ISO/IEC 17021:2011 regula los requisitos para los organismos que
realizan la auditoría y la certifi cación de sistemas de gestión. En ella se establecen
los requisitos para un adecuado funcionamiento de las entidades certifi cadoras
de modo competente, coherente e imparcial, responsable, confi dencial y trans-
parente, permitiendo dar respuesta a posibles quejas. Siguiendo estos preceptos,
en el contexto de la seguridad de la información ha sido editada una normativa
de auditoría y certifi cación: ISO/IEC 27006:2007, aunque en la anterior norma se
recogen pautas generales aplicables a cualquier sistema de gestión. Dos son las
normas enunciadas, por tanto, que se encuentran activas y que son utilizadas por
el organismo de acreditación único nombrado en cada país (España: ENAC–En-
tidad Nacional de Acreditación).
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
451

MANUELA MORO CABERO
b) Normas de certifi cación
Los organismos acreditados para realizar las auditorías de certifi cación, me-
diante equipos de auditores operan auditando el cumplimiento de determinadas
normativas. Las entidades auditoras disponen de normas de evaluación y certifi -
cadoras. En el caso de los sistemas de calidad y medioambiente se ha utilizado
la normativa ISO 19011:2002 en la que se regulan directrices para auditar los
sistemas de gestión de calidad y de gestión medioambiental, incluyendo en las
mismas pautas para el establecimiento del programa auditor, la implementación
de dicho programa y su seguimiento y revisión. Directrices específi cas sobre el
programa y plan auditor han sido regulados en la norma ISO/IEC 17021:2011.
De igual modo, para evaluar los sistemas de seguridad de la información se uti-
liza la normativa ISO/IEC 27006.2007, anteriormente citada, donde se recogen
directrices con idéntico fi n de facilitar y avalar el proceso auditor.
c) Normas de evaluación.
Los organismos que soliciten la certifi cación, deberán demostrar el cumpli-
miento de la normativa de requisitos del sistema de gestión (calidad, medioam-
biente, seguridad de la información, etc.). Una vez comprobado, serán certifi ca-
dos. Lógicamente, la normativa a verifi car será la específi ca a los entornos de
gestión que se pretenden certifi car (calidad, ambiental, seguridad) y/o servicios
(disposiciones de cumplimiento para carta de servicios).
Para fi nalizar, resumimos la secuencia del proceso de acreditación como sigue:
una entidad única en cada país (AENOR, etc.), regulada su creación y funciona-
miento en un marco legislativo, acredita organismos, tomando en consideración
las directrices de la norma ISO/IEC 17021:2011 (en el caso de sistemas, productos
y personas). Las entidades acreditadas tienen competencia para certifi car la con-
formidad de normas. Estos organismos pueden certifi car calidad, seguridad de la
información, gestión ambiental, etc., y en estudio, gestión documental. A tal efec-
to, proceden tomando en consideración las directrices de la norma ISO 19011:2002,
en las actuaciones de certifi cación de calidad y de gestión medioambiental, y de
la norma ISO 27006:2007 para las actuaciones de seguridad de la información, otras
directrices para los sistemas de gestión se incluyen igualmente en ISO/IEC 17021:2011.
Se estudia la valoración de la norma ISO/IEC 17021 para su aplicación en la ges-
tión documental. Los organismos certifi cadores evalúan la conformidad del cum-
plimiento de la normativa de calidad (serie ISO 9000), seguridad de la información
(serie ISO 27000) y, en proyecto, la gestión documental (serie ISO 30300)
3.2. El proceso certifi cador de la conformidad
Una consulta rápida a la Web de cualquier entidad certifi cadora incluye las
etapas del proceso certifi cador. En detalle, son numeradas como sigue: 1. Selec-
ción del organismo certifi cador; 2. Cumplimentado de documentos (formularios)
452
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
de solicitud; 3. Revisión de la documentación del centro por el organismo certi-
fi cador; 4. Visita previa (opcional; no todos los organismos la realizan) a la cer-
tifi cación; 5. Auditoría de certifi cación; 6. Presentación de acciones correctoras;
7. Concesión de certifi cado, y 8. Auditorías de seguimiento y de renovación.
De acuerdo con Santiago Palom (1998), dichas etapas pueden ser agrupadas
en 3 fases signifi cativas: fase de solicitud de la certifi cación, fase de auditoría y
fase de certifi cación.
En la primera fase (etapas 1-3), se selecciona el organismo certifi cador, con-
siderando criterios objetivos —datos operativos— y subjetivos —empatía, imagen,
etc.—. Elegido el organismo certifi cador, es preciso cumplimentar la documenta-
ción de solicitud, en la que se especifi can datos genéricos de la institución, per-
sona de contacto, normativa por la que se certifi ca, actividades y productos cu-
biertos por el sistema, ubicaciones físicas del organismo, organigrama general y
otros datos de interés para el proceso. En esta fase será revisada la documenta-
ción del centro por el organismo certifi cador quién informa al respecto señalan-
do las contradicciones.
En la segunda fase (etapas 4 a 6), se designan los auditores o equipo auditor
y se realiza (a petición) una visita previa o de contacto, en la que se revisa la
documentación demostrativa de la implantación del sistema de gestión y de su
funcionamiento. Los auditores en esta fase ejecutan la auditoría, propiamente
dicha, destacando tres etapas:
a) Etapa de reunión inicial con la dirección del centro para intercambiar
expectativas y guía de trabajo avanzando posibles resultados con objeto
de evitar generación de falsas expectativas.
b) Etapa de obtención de evidencias para verifi car el estado de implantación
del sistema y negociar las resoluciones de algunas disconformidades. La
tarea fi nal, se centrará en redactar un informe previo que se utilizará como
elemento de diálogo en la etapa fi nal.
c) Etapa de reunión fi nal donde se informa sobre la situación verifi cada. El infor-
me será empleado como documento de referencia. Los auditores informarán
sobre la situación aunque carecen de capacidad para otorgar la certifi cación.
Esta petición será trasladada al Comité de Evaluación del Organismo Cer-
tifi cador, quien, a raíz del informe de los auditores, estimará su certifi cación.
En la tercera fase (etapas 7 y 8), si se cumplen los requisitos de evaluación,
la entidad recibe la certifi cación que lógicamente, debe ser celebrada como un
éxito para el Archivo y la organización. Finalmente, el organismo que concede
la certifi cación debe asegurarse de que el sistema se mantiene conforme y, por
tanto, suele realizar visitas a los centros certifi cados de seguimiento (anuales), de
renovación (antes de los 3 años cumplidos de la concesión del certifi cado) y
extraordinarias, ante hechos o eventos concretos como una denuncia expresa.
Finalmente, señalamos que las certifi caciones de las cartas de servicios se
enunciaban y regulaban en la parte II de la Guía de elaboración de cartas de
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
453

MANUELA MORO CABERO
servicios (2006, p.45 y ss.) promovida por la AEVAL- Agencia de Evaluación de
la Calidad. Desde el 2009, su Consejo Rector ha reglamentado la certifi cación de
las cartas de servicios de las organizaciones de la Administración Pública (2009).
De hecho, en la página Web de la AEVAL (2010) se especifi ca el alcance de la
certifi cación como sigue:
«El procedimiento de certifi cación no se realiza únicamente sobre el contenido
de la Carta en sí, sino también sobre la metodología que se ha seguido para su
elaboración y el trabajo desarrollado a tal efecto, sobre el cumplimiento de los
compromisos de calidad y el seguimiento de los indicadores considerados en la
misma y sobre el establecimiento de los criterios para su revisión periódica».
4. La
certifi cación de sistemas de gestión documental
La normalización de sistemas de gestión documental es de responsabilidad
del Subcomité Técnico 11 sobre gestión de documentos y Archivos (SC11), inte-
grante del Comité Técnico 46 de ISO, quien ha desarrollado el código de buenas
prácticas ISO 15489 (2001). El éxito en la adopción del código animó al SC11,
en el 2007, a la concreción de una nueva propuesta de reconocimiento de un
sistema de gestión para los documentos (Bustelo; 2009). ISO ha aceptado dicho
marco normativo de sistemas de gestión (MSS); cuyo alcance y estructura difi ere,
lógicamente, del código de buenas prácticas, como la serie denominada ISO 30300.
Su estructura operativa se conforma por un conjunto de normas (estructura típi-
ca de un MSS) perfi lándose un modelo normalizado de sistemas de gestión para
los documentos. El contexto ISO MSS es específi co de determinadas series de sis-
temas de seguridad, de calidad, de gestión medioambiental, de transportes, etc.
De hecho, el Join Technical Coordination Group for MSS (JTCG) pretende coor-
dinar, terminología, fundamentos, estructura y marco de acreditación y certifi ca-
ción de dichas normas.
El modelo normaliza el sistema de gestión y se comprende como el provee-
dor de un conjunto de procesos y de herramientas que permiten de modo veri-
fi cable y sistemático el control organizacional en un entorno de producción ba-
sado en buenas prácticas de gestión. El modelo MSR (Management System for
Records) es aplicable en cualquier organización con independencia del tamaño
y modelo empresarial adoptado. Posibilita el establecimiento de políticas y de
objetivos de gestión documental, defi niendo funciones y distribuyendo respon-
sabilidades; apuesta por la construcción de una arquitectura de procesos siste-
máticos y la medición y evaluación de objetivos y rendimiento de los mismos;
Asegura, además, la conformidad con los requisitos documentales, mediante la
incorporación y mantenimiento de mecanismos de revisión y mejora continuada
(ISO/DIS 30301:2010).
El éxito de este reconocimiento MSS está en consonancia con el grado de
relaciones que mantiene con otros modelos MSS (requisitos documentales de sis-
temas normalizados de gestión de la calidad, gestión ambiental, gestión de se-
454
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
guridad de la información, etc.) Las analogías y sinergias son cuantiosas, facili-
tando su empleo y comprensión. Entre las sinergias destacamos: el
reconocimiento ISO y, por tanto, su proyección internacional; el carácter facul-
tativo de su adopción como código de buenas prácticas; la estructura normativa
similar (principios y vocabulario, requisitos, directrices de implantación, pautas
de evaluación, acreditación y de certifi cación); el método de gestión; la impor-
tancia otorgada al análisis y gestión del riesgo; el enfoque a procesos, la orien-
tación hacia la mejora continuada; la correlación de los requisitos de evidencia
documental, etc. Entre sus sinergias destacamos el rol colaborador o de soporte
mutuo que implica este sistema de gestión documental respecto al cumplimiento
de los requisitos de verifi cación y de evidencia basados en un riguroso soporte
documental. Un segundo foco sinérgico es su coordinación hacia una termino-
logía, fundamentación, estructura y normativa común de acreditación y certifi ca-
ción, simplifi cando su comprensión y favoreciendo su empleo y asimilación. En
suma, su particular reconocimiento como sistemas normalizados de gestión (MSS).
Bajo el título «Management system for records – MSR» el sistema normalizado
de gestión documental se conforma como serie ISO 30300 con dos productos
muy avanzados cuya edición se estima para el segundo semestre del 2011 (Bus-
telo y Ellis, 2010):
a) Una norma de principios y vocabulario, codifi cada como ISO 30300 (bo-
rrador FDIS). En ella se explica la concepción, los principios, la aplicación
MSR así como la estructura de la serie ISO 30300 y su proyección.
b) Una norma de especifi cación de requisitos, codifi cada como ISO 30301
(borrador FDIS). En ella se detalla el contexto organizacional, directrices
sobre liderazgo y requisitos. Se incluyen varios anexos signifi cativos sobre:
relaciones entre normas MSS, relación de procesos y controles, lista de
parámetros de autoevaluación.
En la introducción de estos borradores se hace referencia a otros proyectos
de norma. Estos son codifi cados como:
• ISO 30302. Guía de implantación del MSR.
• ISO 30304. Guía de autoevaluación del sistema.
• ISO 30303. Esta codifi cación estaría destinada a regular requisitos del procedi-
miento certifi cador y de acreditación en un proceso evaluador de tercera par-
te. En ella se detallarán los requisitos para la auditoría y certifi cación de sis-
temas de gestión documental, siempre y cuando no se estimen oportunas las
directrices de las normas mencionadas con anterioridad ISO 19011:2002 e ISO/
IEC 17021:2011, tomando en consideración los objetivos de trabajo del JTCG.
Al MSR se vinculan a nivel operativo informes técnicos y normas orientadas
a regular la gestión de metadatos, el proceso de digitalización, la migración, el
análisis del trabajo, las normas ISO 15489:2001, etc.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
455

MANUELA MORO CABERO
5. Análisis del valor e impacto de la certifi cación en el archivo
El propósito de un sistema de gestión de documentos se detalla en el borra-
dor de la norma ISO/DIS 30300 (2010) bajo el objetivo de crear y controlar los
documentos de modo sistemático y verifi cable, de tal forma que permita el cum-
plimiento de requisitos de carácter legislativo y normativo (conformidad marco
legislativo, procedimental y normativo), operativo (continuidad de negocio, ges-
tión de riesgos, prevención de desastres, organización del trabajo, etc.) y cultural,
referido al logro de las expectativas de usuarios y de la corporación. Benefi cios
del modelo vinculados al propósito son subrayados igualmente por Bustelo y
Ellis (2010).
En el borrador se detalla su alcance a todo tipo de organización que desee
lógicamente el aseguramiento de un sistema de gestión documental así como la
conformidad a sus políticas de gestión. De igual modo, se pretende demostrar
mediante la «autoevaluación y autodeclaración (informe-interno) o confi rmación
del informe interno por terceras partes o parte externa a la organización, o cer-
tifi cación de su MSR por una organización externa
» (2010, 1)
Considerando, dicho alcance, afi rmamos que el valor de la certifi cación de
un sistema de gestión documental es en primer lugar, el de demostrar la implan-
tación de un sistema de gestión documental como recurso que revierte en múl-
tiples benefi cios para la organización, dado que al menos se asegura el cumpli-
miento de los requisitos de gestión documental y de las expectativas de los
usuarios y otras partes interesadas y afectados. Un sistema de gestión documen-
tal certifi cado contribuye a tener un rendimiento más satisfactorio de la organi-
zación y colabora con la orientación hacia el cliente que toda organización de-
fi ende para mantenerse competitiva.
En segundo termino, cabe señalar que, mediante la certifi cación, se asegura
la conformidad a un modelo de gestión de documentos normalizado y de reco-
nocimiento internacional. Se trata de refl exionar sobre el prestigio de adopción
de una norma que, además, es compatible con otros modelos de gestión norma-
lizados de reconocido crédito. La certifi cación ubica al sistema de gestión docu-
mental en una posición de fortaleza y de visibilidad ante la organización, inci-
diendo en el incremento de una imagen más favorable del Archivo y del
profesional en toda la organización.
En un tercer orden, se demuestra la conformidad a las políticas de gestión
documental, consensuadas y aprobadas por la organización y acordes con el
modelo MSR, contribuyendo de este modo a una adecuada organización y buen
gobierno. En este orden, las políticas de gestión documental pueden y deben de
ser coordinadas con otras políticas de gestión orientadas al cumplimiento de otros
modelos de gestión. Este hecho, permite acrecentar la cohesión de modelos de
gestión mediante sus estrechas interrelaciones en materia de gestión documental.
La certifi cación de un MSR dignifi ca el signifi cado mismo de archivar, ubicán-
dolo en idéntico plano a acciones tales como hacer calidad, alcanzar sostenibili-
dad, lograr seguridad, etc.
456
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
Señalamos, en esta conjetura de valor, la importante aportación que un mo-
delo certifi cado signifi ca en la mejora de los sistemas de trabajo, puesto que la
certifi cación asegura una adaptación continuada a los nuevos requisitos de ges-
tión documental. De hecho, la mera implantación de la norma exige la obser-
vancia de directrices sobre la gestión, el despliegue de una arquitectura de pro-
cesos para hacerlas factibles y la elaboración de herramientas generales y
específi cas de gestión.
La certifi cación predispone al Archivo, con sus revisiones y actualizaciones
periódicas, a una continua aclimatación al cambio en los contextos productivos,
siendo dichas revisiones testimonios certeros de su capacidad de adaptación.
La certifi cación favorece la existencia de una sólida documentación demos-
trativa de la planifi cación, diseño, implementación y control del sistema sobre
la que se apoyará el proceso certifi cador. La necesidad de documentar deriva de la
necesidad de demostrar, mediante evidencias, la conformidad del sistema de
gestión documental respecto a los requisitos regulados en dichas normas.
Un aspecto que debe ser altamente valorado es el potencial que supone la
certifi cación como factor mercadotécnico. La simbología asociada a la certifi cación
es utilizada en todas las organizaciones como un excelente activo.
La certifi cación repercutirá sobre las competencias y desarrollo profesional
del archivero así como sobre su grado de motivación y satisfacción. El archivero
se enfrenta a retos novedosos, aumentando el grado de su visibilidad en la or-
ganización. Las competencias profesionales exigidas contribuirán a predisponer
al profesional hacia la innovación.
El factor certifi cador ha contribuido y contribuye a demostrar la diferencia
entre organismos y, por tanto, puede convertirse en un activo estratégico ante
determinadas decisiones o valoraciones de la Administración Pública ante gestio-
nes, contratas, subvenciones, ayudas, etc.
Finalmente señalamos, un último valor, aunque no por ello, menos importan-
te, el grado de compromiso y de expectación que los procesos de certifi cación
conllevan entre todos los agentes que intervienen y, especialmente, entre los
implicados. Expectativas de mejora, concienciación de los problemas y compro-
miso hacia el trabajo bien hecho inciden en un rendimiento mayor para el per-
sonal, los clientes y la organización.
6. Conclusiones
Hemos presentado el contexto certifi cador de los Archivos, destacando la
labor certifi cadora asociada a modelos de administración de sistemas de gestión
de la calidad. Se ha diferenciado un modelo de reconocimiento de la excelencia
bastante extendido en los archivos españoles basado en la autoevaluación y fun-
damentado en la lógica reder, así como otras herramientas adaptadas para Ad-
ministraciones públicas. Han sido expuestas las principales divergencias y sus
relaciones como modelos no excluyentes.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
457

MANUELA MORO CABERO
Se ha referenciado el compromiso de calidad que los archivos públicos es-
pañoles deben demostrar y su posibilidad de certifi cación, mostrando las fuentes
donde el método es especifi cado para la obtención de las «cartas de servicios»
como ejemplo de compromiso de calidad de los servicios ofrecidos en el Archivo.
Se ha resaltado la ausencia de un modelo específi co de certifi cación de los
sistemas de gestión documental y se ha analizado su proyección de futuro me-
diante el modelo normalizado desarrollado en el seno de ISO, en el marco de
reconocimiento como un MSS, y de próxima edición, codifi cado como serie ISO
30300. Han sido enunciadas las principales analogías y sinergias existentes entre
series MSS —sistemas normalizados de gestión—, en un intento de soslayar su
correlación y compatibilidad. Se ha incidido, además, en que el modelo serie ISO
30300 no obliga a una certifi cación. La elección es facultativa y ofrece modelos de
aproximación, mediante la autoevaluación, muy similares a los procedimientos
adoptados por los modelos de reconocimiento de la excelencia, donde evaluación
interna y externa o de tercera parte se confrontan hacia un informe fi nal evaluador.
Se ha descrito el proceso certifi cador y su inherente proceso de acreditación
que le confi ere autoridad formal para la actividad de certifi car. Han sido presen-
tadas normas y agentes implicados en ambos procesos y detallada la secuencia de
operaciones relativas a cada uno de ellos. Se ha enunciado el interés que el JTCG
mantiene en coordinar y simplifi car el proceso estudiando esta posibilidad, asegu-
rando procedimientos similares a los acometidos para otros sistemas de gestión.
Han sido enumerados algunos de los cuantiosos valores que creemos, impli-
ca la certifi cación de los sistemas de gestión de documentos para una organiza-
ción. Se ha acompañado cada aspecto valorado de una referencia de impacto de
naturaleza cualitativa. Lógicamente, una valoración cuantitativa sólo será posible
con un estudio más profundo sobre sus efectos, aunque de momento, circunscri-
ta a la calidad. Un análisis del impacto de la certifi cación de sistemas de gestión
documental debe esperar. Es preciso, igualmente, no desestimar ciertos inconve-
nientes del tipo: costes, complejidad de procedimientos, difi cultades tanto en la
motivación como en el reconocimiento de debilidades documentadas y su correc-
ción (Jonquieres, 2010: 67) La certifi cación de sistemas de gestión de documentos
esta muy próxima de ser una realidad. La serie ISO 30300, aceptada por ISO como
modelo de gestión estandarizado, se muestra como lo que es: un abanico inter-
minable de oportunidades para el archivero creativo, dotado de la capacidad de
apreciar la innovación en un entorno orientado hacia la mejora continuada.
7. Referencias
Aenor (2010). La certifi cación de Aenor. El valor de la Confi anza. (En línea) [consultado
el 27 de octubre de 2010], de: http://www.aenor.es/aenor/certifi cación/procesos/pro-
ceso_certifi cación_aneor.asp].
Aenor: UNE-EN-ISO 19011:2002. Directrices para la auditoría de los sistemas de gestión
de la calidad y/o ambiental. Madrid: autor. (En fase de revisión. Consultado borrador).
458
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Certifi cación de calidad en los archivos. Análisis y prospectiva
Aenor: UNE-EN-ISO/IEC 17021:2006. Evaluación de la conformidad. Requisitos para los
organismos que realizan la auditoría y la certifi cación de sistemas de gestión. Madrid:
Autor. Revisión en inglés actualizada ISO/IEC 17021:2011 (Referenciada bajo ISO).
Aenor: UNE-EN-ISO 9000:2005. Sistemas de gestión de calidad. Fundamentos y vocabu-
lario. Madrid: Autor.
Aenor: UNE-EN-ISO 9001:2008. Sistemas de gestión de calidad. Requisitos. Madrid: Autor.
Aenor: UNE-EN-ISO 9004:2009. Gestión para el éxito sostenido de una organización. En-
foque de gestión de la calidad. Madrid.
Aenor (2008): UNE-Gestión de documentos y evidencias electrónicas. CD-ROM, Madrid
(Recopila normativa UNE-ISO 15489).
AEVAL. (2006): Guía para el desarrollo de las cartas de servicio. Madrid. Autor. [En línea)
[consultado el 20 de octubre de 2010] de: http://www.aeval.es/comun/pdf/calidad/
Guia_CARTAS_2009.pdf.
AEVAL (2009): Resolución del 29 de julio del Consejo Rector de la AEVAL por el que se
aprueba el procedimiento de certifi cación de cartas de servicios. BOE 194, 12/08/2009.
AEVAL (2009): Resolución de 18 de junio de 2009, del Consejo Rector de la Agencia Es-
pañola de Evaluación de las Políticas y la Calidad de los Servicios por la que se
aprueba el procedimiento de certifi cación de nivel de excelencia de los órganos de
las Administraciones Públicas. BOE 169, 14/07/2009.
Brumm, Eugene K. (1995): Managing records for ISO 9000 compliance. Milwaukee, ASQC.
Bustelo Ruesta, C. (2009): La gestión de documentos y las evidencias en la organización.
Del plano operativo al plano estratégico: una propuesta desde la normalización. Re-
vista Española de Documentación Científi ca,
32 (4), 157-165.
Bustelo Ruesta, C., y Ellis, J. (2010): Better Record=Better Business. Using ISO 30300 in
the strategic Management of your organization. NEN Managementseminar-Informatie-
houding, La Haya, 29-10-2010. http://www.nen.nl/web/Werken/NEN-Managementse-
minar-Informatiehuishouding.htm.
Duff, W., y McKemmish, S. (2000): Metadata & ISO 9000 compliance. IMJ, 34 (1).
España (2005). Real Decreto 951/2005, de 29 de julio, Por el que se establece el marco
general para la mejora de la calidad en la Administración General Del Estado. (BOE,
3/09/2005).
Heredia Herrera, A. (2007): ¿Qué es el archivo? Gijón: Trea, pp. 19 y ss.
ISO (2010): ISO/DIS 30300:2010. Management system for records – Fundamentals and
vocabulary. Ginebra.
ISO (2010): ISO/DIS 30301:2010. Management system for records – Requirements. Gi-
nebra.
ISO/IEC 27006: 2007 «Information Tecnhnology – Security techniques – Requirements for
bodies providing audit. And certifi cation of information security management systems»
Ginebra.
ISO (2011): ISO 17021:2011. Conformity assessment. Requirements for bodies providing
audit and certifi cation for management systems. Ginebra.
Jonquiére, M. (2010): Manual de auditoría de los sistemas de gestión. Madrid: Aenor.
Junta de Castilla y León (2006): Manual para la implantación de un sistema de gestión
de calidad en un archivo. Valladolid. [En línea] (recuperado el 29 de octubre de 2010)
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815
459

MANUELA MORO CABERO
de: http://www.archivoscastillayleon.jcyl.es/web/jcyl/binarios/55/998/MANUAL_CALI-
DAD,1.pdf?blobheader=application/pdf;charset%3DUTF-8&blobnocache=true.
Junta de Castilla y León (2010): III Plan de intervención en el patrimonio documental de
castilla y León (2010-2015). BOCYL,37, 24/02/2010. (En línea) [consultado el 29 de
octubre de 2010] de: http://www.archivoscastillayleon.jcyl.es/web/jcyl/ArchivosCasti-
llaYLeon/es/Plantilla100Detalle/1253861401355/_/1267296087729/Comunicacion.
Moro Cabero, M. (1997): El archivo de empresa. Un recurso a considerar desde la pers-
pectiva TQM (Total Quality Management), Revista General de Información y Docu-
mentación,
7 (2), 257-275.
Moro Cabero, M. (2009): El código (ISO 15489:2001) y el fuero (normativa ISO 9000): la
importancia de gestionar documentos en entornos de gestión de calidad. En Home-
naje a Isabel de Torres Ramírez: Estudios de Documentación dedicada a su memoria,

Universidad de Granada, 517-540.
Núñez Fernández, E. (2007): Archivos y normas ISO. Gijón:Trea.
Palom Rico, S.: ISO 9000 (1998): El proceso de certifi cación paso a paso. Barcelona: Granica.
Roberge, M. (2002): L’essentiel de la gestion documentaire. Québec: Gestar.
460
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 447-460, 2011. ISSN: 0210-0614. doi: 10.3989/redc.2011.3.815

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 461-477, 2011
ISSN: 0210-0614.
NORMAS / STANDARDS
Preservación de los documentos digitales: Guía para
comenzar. ISO/TC 46/SC 11. Version española,
octubre 2010

Traducción de María Elvira y Silleras1
Digital records preservation: Where to start guide. ISO/TC 46/SC 11.
Spanish version, October 2010

Este documento ha sido elaborado por el ISO TC 46/SC 11/WG 7 – el grupo
de trabajo de ISO responsable de Records Management Digital Records Preser -
vation. Cualquier recomendación o sugerencia para el futuro desarrollo del do-
cumento o nuevas referencias bibliográfi cas serán bienvenidas, y deberán remi-
tirse al coordinador del grupo de trabajo a la dirección paulm@corconcepts.co.za.
Esta publicación está disponible gratuitamente en el sitio web de ISO/TC 46/
SC 11 http://isotc.iso.org/livelink/livelink?func=ll&objId=8800112&objAction=bro
wse&sort=name

Sumario
1. Introducción
1.1. Destinatarios
1.2. Propósito
1.3. Resultados
1.4. Conceptos
1.5. Retos
2. ¿Por qué preocuparse de preservar los documentos digitales?
3. ¿Qué acciones deberían realizarse?
4. ¿Cómo debería elaborar un plan de preservación?
4.1. ¿Qué es un plan de preservación?
4.2. ¿Cuál es el alcance y la estructura del plan?
4.3. ¿Qué documentos se incluyen en el plan?
1 Agradezco profundamente a Assumpció Estivill y Alice Keefer las muchas correcciones que
han aportado a esta traducción.
461

Normas
4.4. ¿Cómo se relaciona el plan con las políticas/estrategias?
4.5. ¿Quién es el responsable del plan de preservación?
4.6. ¿Cuáles son los retos técnicos específi cos?
4.7. El reto de los metadatos
4.8. Período de retención y requisitos de acceso
4.9. ¿Cuáles son las cuestiones no técnicas?
4.10. Momentos críticos de la or ganización
5. ¿Funcionará mi plan a lar go plazo?
5.1. Introducción
5.2. ¿Tendría que actualizar mi plan periódicamente?
5.3. ¿Cómo puedo estar seguro de que mi plan funciona?
5.4. ¿He realizado las acciones de preservación correctas?
6. ¿Dónde encontrar ayuda?
7. Lista de referencias y trabajos en curso sobre preservación digital
1. Introducción
1.1. Destinatarios
Los destinatarios previstos son las personas, los grupos o las unidades de una
organización encargados del desarrollo de planes de preservación de documen-
tos digitales.
Se dirige a gestores de or ganizaciones, profesionales de la documentación,
de los archivos y de la infor mación y las tecnologías, a gestores del riesgo y au-
ditores de la infor mación y a otras personas encar gadas de crear y mantener
documentos en nombre de la organización. Esta guía no se dirige a los expertos
en preservación digital. A yudará a quienes están involucrados en la gestión de
información personal y a los proveedores de tecnología de documentos digitales.
1.2. Propósito
Las organizaciones están creando, recibiendo y gestionando documentos di-
gitales de for ma creciente. Las buenas prácticas de gestión de documentos re-
quieren que se apliquen las mismas reglas y principios a todos los documentos
independientemente del soporte o el for mato. Sin embargo, los documentos en
formato digital tienen algunas características únicas que exigen que se realicen
acciones concretas para asegurar que conserven su valor todo el tiempo que sean
necesarios. El propósito de esta Guía es proporcionar directrices para el desarro-
llo de un plan de preservación.
La «Guía dónde empezar», se basa en los conceptos establecidos en las partes
1 y 2 de la norma ISO 15489 y debe aplicarse en conjunción con ésta. Los
requisitos
aplicables que ya se han incluido en ISO 15489 no se duplican en este documento.
462
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
1.3. Resultados
Los resultados son:
• Entender los aspectos concretos de la preservación de los documentos di-
gitales.
• Guiar el desarrollo del plan de preservación.
• Contribuir a salvaguardar los documentos digitales a lo largo del tiempo de
forma fi able.
• Proporcionar referencias y enlaces a lo que ocurre en otros lugares.
1.4. Conceptos
Los conceptos clave sobre la preservación de los documentos digitales son
los siguientes:
• La naturaleza única de los documentos digitales.
• La funcionalidad de los sistemas de documentos digitales.
Defi nición de documento digital
Un documento digital es infor mación registrada en un for mato que requiere
un ordenador para procesarla y que, además, se ajusta a la defi nición de docu-
mento. La aplicación de esta guía se limita a los documentos en for mato digital
como los creados con herramientas de ofi mática como procesadores de texto u
hojas de cálculo.
Naturaleza única de los documentos digitales
El contenido de un documento digital existe en un for mato electrónico que
no se puede interpretar sin el uso de software (programa de ordenador) para
proporcionar el contenido al usuario. Por ejemplo, los contenidos de la corres-
pondencia escrita con un procesador de textos no se pueden leer sin usar este
sistema. Los elementos que for man el documento incluyen:
• Los datos o contenido propiamente dicho.
• El formateado y los caracteres de control que, en general, no son visibles
para el usuario.
• Los metadatos sobre el documento.
El tipo de infor mación de la correspondencia puede requerir diferentes tec-
nologías para hacerla comprensible y presentarla al usuario. El contenido puede
tener imágenes incrustadas además del texto, y cada uno de los tipos de conte-
nido puede necesitar diferente software para recrearlo con precisión.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
463

Normas
La información puede contener enlaces a información externa (como enlaces
a sitios web). Sin tecnología e infraestructura adicionales, la información a la que
se refi eren estos enlaces podría no estar disponible.
Los metadatos son una parte esencial de un documento digital y, aún, la to-
talidad o una parte de estos metadatos podría estar almacenada separadamente
del documento.
Funcionalidad de los sistemas de documentos digitales
Los documentos digitales se pueden crear usando diferentes sistemas de or -
denador como procesadores de texto, hojas de cálculo, sistemas para sectores de
negocios y correo electrónico. La estructura y naturaleza de estos sistemas varía
mucho, y aunque pueden crear y gestionar documentos, en general no se han
diseñado teniendo en cuenta la preservación.
En algún momento los documentos se pueden transferir de los sistemas con
los que se crearon a sistemas diseñados para almacenarlos y gestionarlos a lar go
plazo. Estos sistemas especializados están diseñados de manera que los docu-
mentos no se puedan alterar y se puedan aplicar funcionalidades, como sistemas
de clasifi cación y nor mas de retención y eliminación, y se puedan almacenar
todos los metadatos asociados.
1.5. Retos
La mayoría de los documentos actuales o bien han «nacido» en for mato digi-
tal o bien se han convertido al for mato digital mediante alguna transfor mación
tecnológica. Los documentos digitales tienen diferencias fundamentales respecto
a los tradicionales; así es que necesitan un tratamiento especial para preservar
su integridad a lo lar go del tiempo. Estas características únicas de los documen-
tos digitales requieren acciones únicas de preservación.
Las organizaciones deberían saber que las acciones para la preservación di-
gital comienzan idealmente con la creación del documento. En otras palabras,
cuanto antes se inician en el proceso las actividades de preservación, mayor es
la seguridad de que los documentos cumplen los requisitos de fi abilidad, inte-
gridad, autenticidad y usabilidad.
La naturaleza única de los documentos digitales comporta una serie de retos
que se deben considerar si se quiere que los documentos se conserven a lo lar -
go del tiempo. Estos retos a menudo se presentan mucho antes de que expire
el período de retención de los documentos. Los principales retos son:
• Obsolescencia y degradación del for mato físico (soporte).
• Obsolescencia del formato del fi chero.
• Obsolescencia del software (sistema operativo, etc.).
• Obsolescencia del hardware.
464
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
Obsolescencia y degradación del formato físico (soporte)
Los documentos digitales están almacenados en soportes tecnológicos que,
con el tiempo, son susceptibles de daño y degradación potencial. El daño puede
ser producido por unas condiciones de almacenamiento, un procedimiento de
tratamiento o un mantenimiento del equipo de lectura inadecuados. Además, el
cambio rápido de la tecnología de los soportes de almacenaje comporta, normal-
mente, su obsolescencia en un período de tiempo relativamente corto.
Obsolescencia del formato de fi chero
El reto del for mato se agrava por el hecho de que los datos se representan
mediante programas de software. Estos programas solamente pueden leer e in-
terpretar datos que están en un for mato específi co de fi chero. Los proveedores
de software actualizan constantemente sus sistemas para añadirles nuevas fun-
cionalidades y esto hace que los for matos más antiguos corran el riesgo de no
poder ser leídos con los nuevos sistemas de software.
Obsolescencia del software
Relacionado con el reto anterior está el hecho de que los mismos programas
de software se vuelven obsoletos, con lo cual convierten en inútil el for mato del
fi chero. La obsolescencia del software puede afectar a los programas de aplica-
ción o a los sistemas operativos en los que funciona la aplicación. La obsoles-
cencia de cualquiera de estas platafor mas podría comportar que los documentos
no se pudieran consultar.
Obsolescencia de hardware
Mientras que el soporte físico podría mantenerse aún en buenas condiciones,
la tecnología para leer los soportes podría no existir en el futuro. Como en el
reto del software, en el hardware se están produciendo nuevos avances que
proporcionan tecnologías más rápidas y robustas. A medida que avanzan las tec-
nologías del hardware, también puede cambiar la forma en la que la información
se almacena y recupera, y los soportes más antiguos podrían quedar inutilizados.
2. ¿Por qué preocuparse de preservar los documentos
digitales?
Mientras los documentos digitales crean claramente retos únicos, en la esen-
cia de la preservación está la exigencia de que el documento se conserve inde-
pendientemente de su for mato. El siguiente extracto de ISO 15489 pone de ma-
nifi esto el fundamento y la importancia de la función de preservación.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
465

Normas
«Los documentos contienen infor mación que constituye un recurso valioso y
un activo importante de la or ganización. La adopción de un criterio sistemático
para la gestión de documentos resulta esencial para las or ganizaciones y la so-
ciedad, a fi n de proteger y conservar los documentos como evidencia de sus
actos. Un sistema de gestión de documentos se convierte en una fuente de in-
formación sobre las actividades de la or ganización que puede servir de apoyo a
actividades posteriores y a la toma de decisiones, a la vez que garantiza la ren-
dición de cuentas frente a las partes interesadas presentes y futuras. Los docu-
mentos permiten a las or ganizaciones:
• Realizar sus actividades de una manera ordenada, efi caz y responsable.
• Prestar servicios de un modo coherente y equitativo.
• Respaldar y documentar la creación de políticas y la toma de decisiones a
nivel directivo.
• Proporcionar coherencia, continuidad y productividad a la gestión y la ad-
ministración.
• Facilitar la ejecución efi caz de actividades en el seno de la or ganización.
• Garantizar la continuidad en caso de desastre.
• Cumplir los requisitos legales y reglamentarios incluyendo las actividades
archivísticas, de auditoría y de supervisión.
• Proporcionar protección y apoyo en litigios incluyendo la gestión de riesgos
en relación con la existencia o ausencia de actividades realizadas en la or -
ganización.
• Proteger los intereses de la or ganización y los derechos de los empleados,
los clientes y las partes interesadas actuales y futuras.
• Apoyar y documentar las actividades de investigación y desarrollo actuales
y futuras, las realizaciones y los resultados, así como la investigación his-
tórica.
• Proporcionar evidencia de actividades corporativas, personales y culturales.
• Establecer una identidad corporativa, personal y cultural.
• Mantener la memoria corporativa, personal o colectiva.»
(ISO 15489-1 Información y documentación – Gestión de documentos – Par-
te 1 General, Capítulo 4 «Benefi cios de la gestión de documentos»)
En otras palabras, los documentos sobre toma de decisiones, acciones, acuer-
dos y transacciones están entre los documentos que una sociedad democrática
debe conservar para asegurar la rendición de cuentas del gobier no y de las em-
presas a sus ciudadanos, a las partes interesadas y a los clientes. Dado que actual-
mente los documentos digitales se utilizan de manera amplia, se han convertido
en una categoría habitual de pruebas solicitada en los procedimientos judiciales
y en las auditorías. Así pues, es esencial que todos los tipos de documentos di-
gitales estén adecuadamente clasifi cados, archivados y preservados, de forma que
se encuentren cuando se necesitan y que se pueda probar su autenticidad, inte-
gridad y fi abilidad.
466
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
3. ¿Qué acciones deberían realizarse?
El siguiente resumen identifi ca las actividades importantes que se deberían
iniciar. Todas las actividades que se detallan en esta sección se deberían encargar
formalmente a individuos o grupos de la or ganización.
Se debería establecer una rutina fi able para asegurar que los documentos se
incorporan regularmente al sistema de preservación. Esta rutina tiene que ser la guía
para garantizar un tratamiento coherente de los documentos desde el
momento en que
se obtienen del sistema de creación. La rutina se debería diseñar de manera que sólo

se aplicara a los documentos que se han identifi cado para ser preservados.
Los documentos se deberían almacenar en un entor no seguro independien-
temente del formato o soporte
Las opciones de preservación se deberían identifi car como un elemento clave
de la estrategia. En el caso de diferentes tipos de documentos, soportes o formatos,
podrían ser válidas distintas opciones. En general, las opciones disponibles
incluyen:
• La conversión a nuevos for matos/plataformas (hardware y software).
• La migración a nuevos soportes.
• La emulación.
Hay que guardar el registro histórico de todas las acciones de gestión y ad-
ministración relativas a los documentos digitales.
Hay que identifi car e implementar las rutinas necesarias para asegurar la au-
tenticidad y fi abilidad de los documentos de manera verifi cable.
Se debe llevar a cabo de manera regular la vigilancia de los desarrollos téc-
nicos, las técnicas de conversión y las nor mas pertinentes.
Se debe elaborar un modelo aceptado de conceptos y utilizarlo como base
para el programa de preservación.
Hay que desarrollar e implementar un esquema aceptable de metadatos. Es
fundamental capturar todos los metadatos asociados, transferirlos a los nuevos
formatos o sistemas y asegurar su almacenamiento.
4. ¿Cómo debería elaborar un plan de preservación?
4.1. ¿Qué es un plan de preservación?
Un plan de preservación es un plan para preservar una colección concreta o
una parte de una colección de objetos digitales, teniendo en cuenta:
• Las políticas de preservación.
• Las obligaciones legales.
• Las limitaciones de la or ganización.
• Las limitaciones técnicas.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
467

Normas
• Las necesidades de los usuarios.
• Los objetivos de la preservación.
El plan describe el contexto de la preservación, las estrategias de preservación
evaluadas (como la migración, la conversión y la emulación) y la decisión resul-
tado de una estrategia, incluida su justifi cación. Además, un plan de preservación
defi ne una serie de acciones de preservación que la institución responsable debe
realizar como respuesta a un riesgo identifi cado en un conjunto concreto de ob-
jetos o documentos digitales (llamado colección).
El plan defi ne un procedimiento bien documentado de las acciones necesarias
para garantizar el acceso y uso a lar go plazo de la colección. El plan de preser -
vación incluye:
• El contexto de la preservación.
• La estrategia de preservación seleccionada.
• Los resultados de la evaluación de diferentes alter nativas de preservación
y la decisión.
• Las funciones y responsabilidades para el plan de preservación y su segui-
miento.
• Los motivos que iniciaran la ejecución del plan.
• El coste (tal vez estimado) de realización del plan de preservación:
— El coste de preparar el plan de preservación.
— El coste de ejecutar el plan de preservación.
El plan de preservación debería asegurar que todos los documentos, cual-
quiera que sea su formato y soporte de almacenamiento, se conserven con el fi n
de acceder a ellos posterior mente. Los documentos digitales se diferencian de
los tradicionales en que la cadena de bits digitales en sí no es sufi
ciente para
que el documento digital se pueda utilizar .
A fi n de salvaguardar la autenticidad de los documentos digitales a lo lar go
de su vida útil, los planes de preservación requieren que se utilicen sistemas de
preservación que combinen la tecnología y los procedimientos or ganizativos.
Los planes de preservación deberían garantizar, como mínimo, que los docu-
mentos digitales:
• Se puedan buscar y estén disponibles para el acceso de manera puntual.
• Sean interpretables (usabilidad, presentación, representación, visualización,
cifrado).
• Se puedan recuperar, incluidos los metadatos correspondientes.
• Estén protegidos contra la pérdida de derechos como la propiedad intelec-
tual, la confi dencialidad y los derechos de autor .
• Estén disponibles para que las personas autorizadas accedan a ellos mien-
tras sean necesarios.
468
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
• Se haga el control de la calidad de las provisiones de acceso (disponibili-
dad, puntualidad, entrega, historial de uso).
El plan de preservación debería abarcar todas las actividades, desde la plani-
fi cación inicial, las actividades de preservación, el seguimiento y las evaluaciones
periódicas.
4.2. ¿Cuál es el alcance y la estructura del plan?
El plan de preservación debería incluir todos los procesos y procedimientos
utilizados para la preservación de los documentos digitales. Ello debería per mitir
que la or ganización implementara procesos fi ables de preservación digital, de
acuerdo con su política general de gestión documental.
• La capacidad de demostrar la autenticidad, fi abilidad y usabilidad de un
documento digital.
Los procesos y procedimientos para la preservación digital deberían incluir:
• La determinación de qué documentos se deben mantener en formato digital.
• La implementación de calendarios de eliminación.
• La identifi cación de los formatos y soportes de almacenamiento (por ejem-
plo, ópticos, magnéticos) de los documentos digitales.
• La gestión de los requisitos de metadatos adicionales para documentos di-
gitales.
• La implementación de acciones de preservación necesarias para garantizar
la fi abilidad y autenticidad de los documentos digitales.
• El cumplimiento de los requisitos legales y reglamentarios, específi cos para
los documentos digitales en cada jurisdicción.
• La identifi cación y gestión de los riesgos asociados a la obsolescencia tec-
nológica.
• Las revisiones periódicas y los requisitos de auditoría.
Estos procesos y procedimientos deben asegurar que la preservación de las
características esenciales de los documentos digitales, junto con las características
adicionales relacionadas con los procesos de preservación.
4.3. ¿Qué documentos se incluyen en el plan?
Normalmente, los documentos que corren el riesgo de obsolescencia tecno-
lógica se deben incluir en el plan de preservación. Los documentos identifi cados
como susceptibles de riesgo se deberían revisar en función del período de re-
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
469

Normas
tención requerido y de la vida prevista de la platafor ma informática de almace-
namiento.
4.4. ¿Cómo se relaciona el plan con las políticas/estrategias?
Las organizaciones con buenas estrategias y políticas de gestión de documen-
tos dispondrán de calendarios de conservación aprobados para todos los docu-
mentos. Estos calendarios fi jarán las necesidades legales, reglamentarias y corpo-
rativas para la retención de los documentos a lo lar go del tiempo. Un plan de
preservación permitirá el acceso a los documentos durante todo el período de
retención, aún cuando el software de almacenamiento y las tecnologías de hard-
ware se vuelven obsoletos o insostenibles.
4.5. ¿Quién es el responsable del plan de preservación?
Las responsabilidades del desarrollo y control del plan de preservación de-
berían ser asumidos por el responsable de los documentos corporativos, con el
asesoramiento del personal de tecnologías de la información (IT). El asesoramien-
to del personal de IT debería incluir planes para cualquier cambio del software
usado para acceder a los documentos y de las tecnologías de almacenamiento.
Cuando hay que implantar un plan de preservación, el personal siguiente
debería estar representado en el proyecto de conversión/migración:
• El equipo de gestión de la organización (para aprobar el presupuesto y los
recursos).
• El personal de tecnologías de la información (IT) (para implementar el pro-
ceso).
• Los responsables de la gestión documental (para asegurar que los docu-
mentos permanecen auténticos, etc.).
• Los usuarios (para asegurar que los documentos convertidos/migrados son
accesibles).
• Los auditores (para asegurar la auditoría de los procesos una vez
fi nalizados).
Es importante destacar que un plan de preservación digital no puede crearse
e implementarse aisladamente. Un aspecto clave en el desarrollo del plan debe-
ría ser la colaboración con las diferentes partes inter nas y externas implicadas.
4.6. ¿Cuáles son los retos técnicos específi cos?
Los aspectos técnicos generales que hay que gestionar se detallan en la Sec-
ción 1.5. – Retos. En esta sección se tratan los aspectos siguientes:
470
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
• Obsolescencia de los soportes.
• Obsolescencia del formato de fi chero.
• Obsolescencia del software.
• Obsolescencia del hardware.
La obsolescencia de los soportes incluye la imposibilidad de extender o man-
tener los soportes de almacenamiento debido a la falta de medios adicionales o
piezas de repuesto. Este aspecto también incluye aquella situación en la cual la
tecnología de almacenamiento tiene que ser reemplazada por nuevos soportes
de almacenamiento más efi cientes, más rentables y más rápidos.
La obsolescencia del for mato de fi chero es generalmente el resultado de la
actualización o substitución del software de visualización del documento.
La obsolescencia del software puede ser el resultado del cambio de paquetes
ofi máticos, por ejemplo, cuando se cambia el software de correo electrónico MS
Outlook Express por MS Outlook.
Normalmente, la obsolescencia del hardware es consecuencia de reemplazar
de piezas importantes del equipo de IT , especialmente los sistemas de almace-
namiento. Por ejemplo, podría ser resultado de reemplazar tecnologías de alma-
cenamiento magnéticas u ópticas por soluciones en línea de red de área de al-
macenamiento (on-line Storage Area Network).
4.7. El reto de los metadatos
Mantener los metadatos importantes durante el proceso de conversión/migración
puede ser un reto. Por ejemplo, al transferir documentos de un sistema de alma-
cenamiento a otro, el campo «fecha de almacenamiento» es a menudo reemplaza-
do por la fecha en la que los documentos se almacenan en el nuevo soporte. Este
hecho puede tener como consecuencia la pérdida potencial de la fecha original de
almacenamiento, a no ser que se ponga una atención especial para mantenerla.
Así pues, como parte del proyecto de conversión/migración, se deberían
identifi car los metadatos que hay que retener y tomar las medidas necesarias para
facilitar esta retención.
También puede ser necesario crear nuevos metadatos para proporcionar la
identifi cación de los procesos de conversión/migración que se han realizado con
los documentos almacenados.
4.8. Período de retención y requisitos de acceso
Cuando se planifi ca un proyecto de conversión/migración, se debería consi-
derar el período de tiempo de retención de los documentos.
Cuando los documentos han superado el período de retención es apropiado
eliminarlos como parte del proceso de conversión/migración. Es importante re-
tener los registros de estas eliminaciones.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
471

Normas
Cuando los documentos están próximos al fi n de su período de retención, se
debería decidir sobre si será necesario acceder a ellos (o se prevé que será ne-
cesario) antes de eliminarlos. Es probable que la valoración del riesgo indique
que la inclusión de estos documentos en el proyecto de conversión/migración
no sea rentable.
4.9. ¿Cuáles son las cuestiones no técnicas?
Además de las cuestiones técnicas tratadas anteriormente, a menudo hay tam-
bién aspectos no técnicos que hay que considerar . En esta sección se tratan al-
gunas de estas cuestiones.
Personal
En general, los proyectos de conversión/migración requieren recursos adicio-
nales de los que nor malmente dispone la organización. Además de los recursos
IT (incluyendo el personal y los sistemas de prueba disponibles) para crear y
mantener operativo el software necesario para poner en marcha y controlar el
proyecto, también será necesaria la implicación de los usuarios para valorar cómo
los nuevos sistemas se integrarán en las prácticas habituales. Asimismo, durante
la fase de comprobación del proyecto, también se pueden necesitar recursos
tecnológicos y humanos adicionales, y también como parte del equipo que su-
pervisa el proyecto globalmente.
Gestión
Antes del proyecto de conversión/migración será necesario mantener conver-
saciones para asegurar que se dispone de la fi nanciación y los recursos adecua-
dos para poder concluir satisfactoriamente el proyecto.
En los proyectos de conversión/migración la fi nanciación puede ser un pro-
blema. Los costes tales como la disponibilidad de los sistemas de pruebas y los
ocasionados por los cambios de procedimientos quizá no se consideraron cuan-
do se calcularon los requerimientos de presupuesto.
La formación del personal en las actividades y los sistemas de preservación
puede ser un aspecto importante. Como la preservación rara vez se considera
como una cuestión operativa cotidiana, se requerirán intervenciones de formación
concretas de manera regular.
Seguimiento
El seguimiento del sistema de gestión documental, tanto durante el proyecto
de conversión/migración como después, será importante para un resultado satis-
factorio. Este control debería incluir la valoración de cómo se usan los nuevos
sistemas y de la confi anza del usuario en ellos.
472
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
Autenticidad
¿Las partes implicadas (por ejemplo, gestión, personal informático y usuarios)
confían en que el proceso de conversión/migración no comprometerá la auten-
ticidad, fi abilidad y accesibilidad de los documentos? Esta confi anza sólo se con-
seguirá mediante la implementación de un plan de preservación adecuado, acep-
tado por todas las partes interesadas antes de su puesta en marcha.
4.10. Momentos críticos de la organización
Entre los momentos críticos de la or ganización que podrían desencadenar
acciones de preservación están los siguientes:
• La migración del sistema infor mático a nuevas platafor mas de software/
hardware.
• La introducción de nuevos tipos de sistemas de almacenamiento.
• La introducción de nuevos for matos de almacenamiento de fi cheros.
5. ¿Funcionará mi plan a largo plazo?
5.1. Introducción
Es importante que una organización defi na un plan de preservación para los
documentos digitales que están registrados en un sistema de gestión documental.
El plan de preservación está diseñado para asegurar que los documentos man-
tienen sus características de autenticidad, fi abilidad, integridad y disponibilidad a
largo plazo.
5.2. ¿Tendría que actualizar mi plan periódicamente?
El plan de preservación per mite que la or ganización asegure que sus docu-
mentos se preservan de manera adecuada, independientemente de los avances
tecnológicos en el hardware y el software. Las or ganizaciones deberían revisar y
actualizar sus planes de preservación anualmente para benefi ciarse de los nuevos
desarrollos y cambios tecnológicos.
Durante la revisión anual, la organización debería identifi car los cambios tec-
nológicos que podrían dar como resultado cambios en los propios documentos
y determinar si hay que actualizar el plan de preservación. Es aconsejable prever
el impacto del cambio tecnológico en los documentos que hay que preservar
.
De esta manera, la organización puede asegurar que el plan de preservación está
actualizado y, así, evitar pérdidas de documentos debidas a los cambios tecno-
lógicos.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
473

Normas
5.3. ¿Cómo puedo estar seguro de que mi plan funciona?
Los documentos digitales son complejos por naturaleza y la tecnología usada
para crearlos y gestionarlos está en constante evolución. Así pues, no es posible
garantizar que un plan concreto será efectivo a lar go plazo.
Sin embargo, hay sufi ciente experiencia para sugerir que la adopción de
procedimientos de preservación basados en estándares de sistemas y prácticas
generalmente aceptadas dará como resultado documentos adecuadamente pre-
servados2. El plan de preservación debería defi nir procedimientos y controles
que se puedan evaluar con relación a su rendimiento y efectividad en la pre-
servación de los documentos digitales. Estos procedimientos y controles deberían
incluir:
• Formatos y soportes en uso.
• Copias de seguridad y su revisión.
• Análisis permanente de los riesgos.
• Control de calidad de los documentos y sistemas.
• Seguridad, acceso y legibilidad.
Cada organización debería designar personal encar gado de estos controles,
fi jar los procesos preestablecidos que hay que usar y asegurar que los procesos
se siguen rutinariamente. El resultado de estos controles debería documentarse
de manera que el plan se pueda modifi car cuando los controles actuales ya no
sean efectivos.
5.4. ¿He realizado las acciones de preservación correctas?
Aunque la organización nunca pueda estar completamente segura de haber
llevado a cabo todas las acciones de preservación correctas, puede estar razo-
nablemente segura del éxito si se siguen principios, métodos y procedimientos
sólidos avalados por profesionales de la gestión documental y los sistemas de
información.
En cualquier caso, la organización debería tener expertos que puedan evaluar
los avances tecnológicos y los riesgos que comportan en relación con la preser -
vación de los documentos digitales. Estos expertos deberían conocer los están-
dares del sistema de la organización y así ser capaces de determinar la necesidad
de actualizar el plan y las acciones de preservación.
Con los controles en su lugar y la percepción constante de los cambios tec-
nológicos y su impacto en la preservación de los documentos, la or
ganización
puede estar razonablemente segura de que está realizando las acciones de pre-
servación apropiadas.
2 Véase la sección 7 para una breve lista de estándares y prácticas reconocidas.
474
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
6
¿Dónde encontrar ayuda?
La Sección 7 de esta publicación es una lista de referencias bibliográfi cas y
detalles de algunos trabajos existentes en el área de la preservación digital. La
lista de referencias proporciona datos adicionales y orientación. No pretende ser
exhaustiva y se ha actualizado a partir de los conocimientos de los miembros del
Comité en octubre de 2010. Puesto que se está investigando en este campo, se
pide a los usuarios que nos infor men de las novedades al respecto. Para la di-
rección de contacto, por favor , vea la primera página de esta publicación.
7. Lista de referencias y trabajos en curso
sobre preservación digital
General
Open Archival Information System (OAIS). http://ssdoo.gsfc.nasa.gov/nost/isoas/overview.
html.
Dutch Digital Preservation knowledge bank website. http://en.archief.nl/knowledge-base/
digital-preservation.
Digital Preservation Coalition. http://www.dpconline.or g/graphics/index.html.
Digital Preservation Coalition Preservation Handbook. http://www.dpconline.or g/advice/
preservationhandbook.
Digital preservation tutorial from the Inter-University Coalition for Political and Social Re-
search. http://www.icpsr.umich.edu/dpm/dpm-eng/eng_index.html.
Digital Curation Centre (UK). http://www.dcc.ac.uk/.
National Library of Australia: Preserving Access to Digital Infor mation. http://www.nla.
gov.au/padi/.
National Digital Information Infrastructure and Preservation Program, Library of Congress,
USA. http://www.digitalpreservation.gov/.
NARA’s Electronic Records Archive project. http://www.archives.gov/electronic_records_ar-
chives/index.html.
Digital Preservation, Digital Library Federation. http://www.diglib.or g/preserve.htm.
Online Computer Library Center. http://www.oclc.org/digitalarchive/support/default.htm.
Formatos de fi chero
GDFR (Global Digital For mat Registry): Proporciona servicios sostenibles y distribuidos
para almacenar, encontrar y distribuir información representativa sobre formatos digi-
tales. http://www.gdfr.info/.
PRONOM: Sistema de infor mación en línea sobre for matos de fi cheros de datos y los
programas de software que los gestionan. Desarrollado originalmente para facilitar el
acceso y la preservación a largo plazo de los documentos electrónicos de los National
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
475

Normas
Archives del Reino Unido, PRONOM está actualmente disponible como un recurso
para cualquiera que necesite acceder a este tipo de infor mación. http://www.natio-
nalarchives.gov.uk/pronom/.
TIFF 6.0 Specifi cations. http://partners.adobe.com/asn/developer/pdfs/tn/TIFF6.pdf.
PDF/A specifi cation. http://www.pdfa.org/doku.php.
JPEG2000 specifi cation. hhttp://www.jpeg.org.
Repositorios digitales
Nestor criteria: Catalogue of Criteria for T rusted Digital Repositories, version 2. http://
fi les.d-nb.de/nestor/materialien/nestor_mat_08_eng.pdf.
Center for Research Libraries: T rustworthy Repositories Audit & Certifi cation: Criteria and
Checklist Hhttp://www.crl.edu/sites/default/fi les/attachments/pages/trac_0.pdf.
Library and Archives Canada: T rusted Digital Repository: La cantidad de infor mación di-
gital está creciendo en todos los campos de manera rápida, lo que plantea cuestiones
cruciales de preservación. Nuestro capital intelectual, que se plasma en recursos edu-
cativos, científi cos, públicos, culturales y en otros recursos intelectuales, está cada vez
más en peligro por la volatilidad de los objetos digitales y el rápido desarrollo de la
tecnología de la infor mación. http://www.collectionscanada.gc.ca/digital-initiatives/
012018-4000.01-e.html.
Space data and information transfer systems: Open archival infor mation system. Referen-
ce model, ISO 14721:2003. http://www.iso.or g/iso/iso_catalogue/catalogue_tc/catalo-
gue_detail.htm?csnumber=24683.
Metadatos de preservación
Library of Congress, USA
PREMIS (Preservation Metadata): Diccionario de datos y esquemas XML correspondientes
para los metadatos básicos de preservación que son necesarios para facilitar la preser-
vación a largo plazo de los materiales digitales. http//www.loc.gov/standards/premis.
Metadata Encoding Transmission Standard (METS). http://www.loc.gov/standards/mets/.
Simple Rights Schema: Extensión del esquema METS para la declaración de derechos.
http://www.loc.gov/standards/mets/news080503.html.
Data Dictionary for Administrative Metadata for Audio, Image, T ext, and Video Content
to Support the Revision of Extension Schemas for METS. http://lcweb.loc.gov/rr/mo-
pic/avprot/extension2.html.
Online Computer Library Center USA
A Metadata Framework to Support the Preservation of Digital Objects. http://www.oclc.
org/research/projects/pmwg/pm_framework.pdf.
Digital Archive Metadata. http://www.oclc.or g/support/documentation/pdf/da_metadata_
elements.pdf.
476
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614

Normas
Global Digital Format registry. http://hul.harvard.edu/gdfr/.
Preservation Metadata for Digital Objects: A Review of the State of the Art. http://www.
oclc.org/research/projects/pmwg/presmeta_wp.pdf.
PREMIS (Preservation Metadata Implementation Strategies). http://www.oclc.org/research/
projects/pmwg/.
Digital Archive Metadata. http://www.oclc.or g/support/documentation/pdf/da_metadata_
elements.pdf.
Otros
Flexible and Extensible Digital Object Repository Architecture (FEDORA). http://fedora-
project.org/get-fedora.
National Library of New Zealand, Metadata Standard Framework, Preservation Metadata.
http://www.natlib.govt.nz/catalogues/library-documents/preservation-metadata-revised.
Valoración de las necesidades de metadatos en proyectos de digitalización
Adobe’s Extensible Metadata Platfor m (XMP) – también las aplicaciones locales. http://
www.adobe.com/products/xmp/main.html.
Perspectiva técnica
Glosarios de términos técnicos
Technical Advisory Service for Images. http://www.tasi.ac.uk/glossary/glossary_technical.
html.
Almacenamiento y preservación digital
Conversion Specifi cations, American Memory, Library of Congress. http://memory.loc.gov/
ammem/techdocs/conversion.html.
NDLP Project Planning Checklist, Library of Congress. http://lcweb2.loc.gov/ammem/prj-
plan.html.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 461-477, 2011. ISSN: 0210-0614
477

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 477-486, 2011
ISSN: 0210-0614.
NOTICIAS / NEWS
Workshop «New Research Lines in Informetrics»
El pasado día 16 de mayo tuvo lugar en el Centro de Ciencias Humanas y
Sociales (CCHS) del Consejo Superior de Investigaciones Científi cas (CSIC) el
seminario «New Research Lines in Informetrics», organizado por Isidro Aguillo,
director del Laboratorio de Cibermetría del CCHS-CSIC (http://internetlab.cindoc.
csic.es). En él participaron como ponentes el profesor Paul Wouter, actual direc-
tor del Centre for Science and Technology Studies (CWTS) de la Universidad de
Leiden (http://www.socialsciences.leiden.edu/cwts/), y el propio Isidro Aguillo.
El profesor Paul Wouters, abrió la sesión con una lección bajo el título «New
trends in metrics research for evaluation» en la que expuso la actual situación de
la evaluación científi ca y la Bibliometría, y los retos a los que deben enfrentarse.
Asimismo, presentó el proyecto Academic Careers Understood through Measure-
ment and Norms
(ACUMEN).
Entre los retos a los que, según el profesor Wouters, se enfrenta la evaluación
científi ca en la actualidad, está el hecho de que ésta sea utilizada como una he-
rramienta de gestión en todos los sentidos; que considere el impacto social, y no
sólo el científi co; así como la necesidad de mejorar la evaluación a nivel indivi-
dual. Para ello apuntó la necesidad de mejorar determinados aspectos de los
indicadores utilizados para la evaluación científi ca, tales como el desarrollo de
indicadores más complejos; que éstos evolucionen desde una perspectiva des-
criptiva a una analítica; que contemplen las múltiples dimensiones de la ciencia;
y que permitan la realización de valoraciones ex-ante.
De esta forma, los puntos que considera como esenciales para el desarrollo
de la Bibliometría, y que están establecidos en la agenda del propio CWTS, son
los siguientes:
• El análisis de las implicaciones y mecanismos de la cultura de la citación.
• Los fundamentos matemáticos de los indicadores.
• Análisis de redes y mapas de la ciencia.
• Indicadores de impacto social.
• Inclusión de nuevas fuentes de datos (citando explícitamente la Web).
En el debate que surgió tras su exposición destacó la necesidad de que la
evaluación científi ca debe realizarse en función de la misión de la unidad de
análisis que se esté valorando, y la necesidad de utilizar un conjunto de indica-
dores para la obtención de un resultado adecuado.
479

Noticias
Asimismo, presentó uno de los proyectos de investigación en los que actual-
mente está trabajando, y que pretende mejorar la evaluación científi ca que se
realiza a nivel individual, debido a la discrepancia entre los actuales métodos de
valoración y las más amplias funciones socio-económicas de la investigación
científi ca. El proyecto Academic Careers Understood through Measurement and
Norms
(ACUMEN), con el patrocinio del séptimo programa marco de la Unión
Europea, y la participación de diversas instituciones europeas (e israelíes) tiene
como objetivo desarrollar guías de buenas prácticas, creando portfolios fl exibles
para la evaluación de investigadores individuales en los que se combinen diver-
sos indicadores cuantitativos y cualitativos (curriculum vitae, indicadores biblio-
métricos, indicadores cibermétricos, y evaluación de expertos (peer review)).
Por su parte, Isidro Aguillo, expuso el proyecto Open Access Infrastructure
for Research in Europe (OpenAire) (www.openaire.eu), en el que él mismo par-
ticipa, mediante la presentación «OpenAire: Building web indicators for the EU
OA repository
». En ella, explicó como este proyecto en el que participan institu-
ciones científi cas de la Unión Europea, pretende fomentar el Acceso Abierto en
Europa, mediante la elaboración de una guías sobre Open Access y la creación
de un portal que sirva de pasarela a los servicios de la red de repositorios en el
que incluir todo tipo de resultados de investigación (no sólo artículos científi cos,
sino también informes, pre-prints, presentaciones a congresos, etc.), para que
estén disponibles para el resto de la comunidad científi ca; permitiendo, al mismo
tiempo obtener estadísticas de uso. En este sentido, Aguillo centró su disertación
en explicar la metodología y las difi cultades a la hora de generar indicadores
cibermétricos basados en los documentos depositados en los repositorios.
Borja González-Albo
Grupo ACUTE-IEDCYT-CCHS-CSIC
480
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 477-486, 2011
ISSN: 0210-0614.
XII Jornadas Españolas de Documentación.
FESABID 2011

Del 25 al 27 de mayo de 2011 se celebraron en Málaga las XII Jornadas Es-
pañolas de Documentación organizadas por FESABID con el título general «Una
profesión, un futuro». En esta edición, las jornadas españolas compartían sede y
programa con las XVI Jornadas Bibliotecarias de Andalucía y con la Conferencia
Anual europea EBLIDA-NAPLE.
En cuanto la prospectiva de nuestra profesión, tema principal de las jornadas,
en la conferencia inaugural y en la sesión específi ca dedicada a la evolución
profesional, los ponentes identifi caron una serie retos y tendencias que debemos
considerar los profesionales de la información si queremos seguir siendo com-
petentes y relevantes. Se señaló especialmente la necesidad de adaptarse a un
cambio en las tecnologías, especialmente a los dispositivos móviles (e-readers,
ipads, ‘smart’ phones, etc.), y se destacó también la necesidad de analizar y trans-
formar las percepciones de los usuarios. Estos aún identifi can las bibliotecas
únicamente con un lugar con libros y, por otra parte, cuando buscan información
en internet prefi eren la rapidez, la inmediatez y la facilidad a la fi abilidad, la
pertinencia y la exactitud.
En diferentes sesiones se indicó que es necesario cambiar estas percepciones
de los usuarios fomentando la alfabetización en información, crítica para el fu-
turo de la profesión pero también para la enseñanza y el aprendizaje en general.
Además, hubo tres foros sectoriales dedicados específi camente a ALFIN y al di-
seño de competencias en información y documentación en la educación superior.
Dos de estos foros estaban organizados por docentes de la red de centros y de-
partamentos universitarios españoles de información y documentación, y un ter-
cero se dedicó a prácticas de ALFIN en bibliotecas universitarias andaluzas.
En el seminario de análisis dedicado a «linked data» y en el taller sobre agre-
gación de contenidos en Europeana se abordó la adaptación de los productos
de información a los estándares de la web semántica (linked open data, SKOS
para vocabularios normalizados, uso de GeoLinked Data, etc.). Todas las expe-
riencias y proyectos presentados se referían fundamentalmente a catálogos de
bibliotecas o repositorios.
Especialmente interesante fue el seminario de análisis «El Archivo de Internet.
Bibliotecas que piensan en el futuro», que permitió comparar tres proyectos es-
pañoles. La intervención del coordinador y las preguntas de los asistentes abrie-
ron un intenso debate sobre los criterios a seguir para seleccionar la información
disponible en la web que merece ser archivada.
Tanto en las jornadas españolas como en la conferencia europea tuvo también
un gran protagonismo el tema del impacto del libro electrónico en el sector de
la información. Asimismo, se presentaron experiencias interesantes de fomento
481

Noticias
del uso de las bibliotecas universitarias con dispositivos móviles. En la conferen-
cia NAPLE-EBLIDA hubo una sesión titulada «e-innovation, e-books and new on-
line services in libraries» en la que se expusieron muchos datos estadísticos na-
cionales así como experiencias de diferentes países europeos. Fue una sesión
muy completa en la que se analizó el tema desde múltiples puntos de vista: es-
tadísticas de implantación de los e-reader y otros dispositivos de lectura, datos
de uso, intereses y expectativas de los usuarios, nuevos modelos de negocio
editorial, ventajas e inconvenientes de estos modelos para las bibliotecas, etc.
A lo largo de las jornadas se hizo patente que la adaptación de los profesio-
nales de la información al nuevo contexto tecnológico está relacionada con el
desarrollo de habilidades para un mundo conectado socialmente mediante la
web. En el seminario «información en movimiento: la web móvil en 60 minutos»
y en los talleres «las bibliotecas se hacen oir: podcasting sonoro para el fomento
de la lectura» y «reputación on-line y community management» se pudo constatar
que los profesionales deben ‘salir del mostrador’: seguir las conversaciones de
los usuarios en la red; hacer podcasts que se puedan descargar en diferentes
dispositivos; y estar atentos a la explosión de los dispositivos móviles.
Aunque el impacto de la crisis económica en el sector de la información solo
se analizó como tema principal en un foro sectorial, a lo largo de todas las jor-
nadas se aludió a las difi cultades debidas a los recortes presupuestarios. En este
sentido, cabe recordar que entre las conclusiones de estas XII Jornadas fi gura la
conveniencia de afrontar la crisis económica como una oportunidad para racio-
nalizar servicios y presupuestos, buscando alianzas y sinergias.
Los profesionales vinculados a unidades de información con características
específi cas pudieron analizar tendencias e intercambiar experiencias en diferentes
foros sectoriales: archivos, información y documentación ambiental, bibliotecas
de museos, información y documentación parlamentaria, contenidos y archivos
audiovisuales, o situación del documentalista musical.
El seminario dedicado a la deontología profesional y la mesa redonda sobre
asociacionismo incidieron en la necesidad de reforzar la presencia y el recono-
cimiento social de los profesionales de la información.
Como en anteriores ediciones, las Jornadas Españolas de Documentación se
complementaron con la Feria Documat 2011, un foro idóneo para que los asis-
tentes a las jornadas conozcan las novedades en productos y servicios información
que ofrecen distintas empresas y organizaciones del sector.
Teresa Abejón
CCHS-CSIC
482
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614


Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 477-486, 2011
ISSN: 0210-0614.
Crónica de las XIV Jornadas Nacionales
de Información y Documentación
en Ciencias de la Salud

Los días 13, 14 y 15 de abril se celebraron en la milenaria ciudad de Cádiz
(ahora bicentenaria, preparando los fastos de las Cortes de Cádiz, aquellas que
trajeron los primeros aires de libertad a la España del XIX) las XIV Jornadas Na-
cionales de Información y Documentación en Ciencias de la Salud «Bibliosa-
lud 2011», organizadas por la Biblioteca Virtual del Sistema Sanitario Público de
Andalucía (BV-SSPA), bajo el auspicio de la Consejería de Salud de la Junta
de Andalucía.
Este año se cumplían los 25 años desde que se organizaron las Primeras Jor-
nadas en Santander (1986) y la presente edición, cuyo lema ha sido «25 años
proyectando futuro», ha querido ser una muestra de lo que se ha avanzado en
este período de tiempo (desde cuando las bibliotecas no tenían revistas electró-
nicas, no se usaba Internet, no existían ni twitter, ni facebook y la arroba era una
medida de peso de nuestros abuelos), así como la expresión de la continua mi-
rada al futuro, que hace que los profesionales vayamos adaptándonos a los cam-
bios tecnológicos y sociales y aceptando nuevos retos. Precisamente, han sido
las nuevas tecnologías una de las características distintivas de estas últimas Jor-
nadas: no sólo porque fueron retransmitidas en directo (vía Internet) sino porque
una cohorte de voluntarios/as bibliotecarios/as se dedicaron con esmero a «tuitear»
(con gran participación de público, tanto presente como remoto) cuantas mesas,
presentaciones y comunicaciones se llevaron a cabo.
Con motivo de este aniversario, la BV-SSPA ha editado un libro conmemora-
tivo «La Contribución de las Jornadas Nacionales de Información y Documentación
en Ciencias de la Salud (1986-2009) a la consolidación de la documentación mé-
dica en España. Un acercamiento Histórico», cuyos autores son Guillermo Olagüe
de Ros, Verónica Juan Quilis y Olga González Díaz, y que fue repartido a los
asistentes. Este volumen va a ser distribuido entre las bibliotecas de Ciencias de
la Salud y las instituciones interesadas pueden solicitarlo a la BV-SSPA.
483

Noticias
Las Jornadas «Bibliosalud» están dirigidas a los profesionales de la Información
y Documentación en Ciencias de Salud y tienen el enorme mérito de que no las
gestiona de forma continuada ninguna organización científi ca ni profesional. Se
han mantenido estos 25 años por el interés y el trabajo de todo el colectivo de
bibliotecarios de Ciencias de la Salud españoles, que ha ido pasando el testigo
de la organización de una institución a otra a lo largo de todo este período (San-
tander, Barcelona, Sevilla, Bilbao, Palma de Mallorca, Madrid, Granada, Santiago
de Compostela, Cáceres, Málaga, Tarrasa, Zaragoza, Oviedo y Cádiz), alternando
en la organización bibliotecas de hospitales, bibliotecas universitarias, bibliotecas
de consejerias de salud, etc., contando con el apoyo de asociaciones profesionales
locales y de la SEDIC. En la web del «museo bibliosalud» se pueden consultar las
actas de las Jornadas anteriores http://www.museobibliosalud.net
Previamente a la inauguración ofi cial de las Jornadas, y como viene siendo
habitual en los últimos años (Zaragoza, Oviedo, etc.), se impartieron 10 sesiones
formativas y talleres sobre temas muy variados que incluyeron aplicación de
nuevas herramientas de la web en el trabajo de las bibliotecas biomédicas (mas-
hups, referencia virtual, Citeulike, Prezi, Drupal y DSpace), nuevas áreas de tra-
bajo (evaluación de la actividad científi ca, asesoramiento sobre como publicar
con impacto en revistas científi cas, gestión de repositorios y acceso abierto) y
nuevas formas de marketing de las unidades de información. A tenor de lo con-
curridos que estuvieron y de los docentes que los impartieron, fueron una de las
apuestas más celebradas y con mayor éxito de las Jornadas.
La Jornada que, todo sea dicho de paso, se llevó a cabo en un edifi cio que
en estos tiempos sería considerado políticamente incorrecto —la Antigua Fábrica
de Tabacos de Cádiz—, pero que remozado y restaurado, resultó ser un marco
incomparable (¡vaya auditorio!), con vistas al mar y a los trasatlánticos que reca-
lan en la bahía repletos de turistas.
La conferencia inaugural fue impartida por el profesor de la Universidad de
Granada Guillermo Olagüe Ros y versó sobre el internacionalismo científi co, la
globalización informativa y los nuevos escenarios y protagonistas en el desarro-
llo de la documentación biomédica.
Los 29 pósteres se presentaron en una sesión publica en la que actúo como
relator José Manuel Estrada, que fue realizando comparaciones de los temas trata-
dos con películas muy conocidas. De esta forma, todos los oyentes pudieron co-
nocer, de forma amena y concisa, los contenidos, objetivos, resultados y propues-
tas innovadoras de todos y cada uno de los pósteres. Las temáticas fueron variadas,
combinando tanto aspectos tradicionales como tecnológicos, formativos o biblio-
métricos. Los hubo que trataban de forma general la situación de las bibliotecas
(evolución, estándares, servicios) o que estudiaban las colecciones de sus fondos
(usabilidad, gestión descentralizada, selección de recursos) o proponían la creación
de nuevos recursos con recientes herramientas (repositorios con DSpace). Uno de
los temas más concurrentes en los pósteres, y que refl eja el espíritu de modernidad
y actualización constante de las bibliotecas de ciencias de la salud, fue el tecno-
lógico, con trabajos que hablaban de la web 2.0, rss, blogs, twitter o widgets.
484
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614

Noticias
En las 4 sesiones de debate se discutieron temas candentes en la profesión,
como nuestro papel como facilitadores del acceso a la información a nuestros
usuarios, las políticas y recomendaciones de acceso abierto en el ámbito biosa-
nitario, la comunicación social en biomedicina y la arquitectura y usabilidad de
sitios web, como una forma de seducir a los usuarios. Fueron moderadas, res-
pectivamente, por Jesús Tramullas, Remedios Melero, Didac Margaix y Antonio
Hernández y dieron pie a buen número de refl exiones, discusiones y comentarios
acerca de los temas y aspectos que más nos preocupan en las bibliotecas de sa-
lud hoy en día: el acceso a la información y la interacción con nuestros usuarios.
Para tener conocimiento del «buen hacer», los proyectos, los avances, las coope-
raciones y las preocupaciones de bibliotecarias y bibliotecarios, sirvieron las 25 co-
municaciones presentadas (en cuatro sesiones de comunicaciones libres), en las que
se habló de las redes bibliotecarias, la especialidad de enfermería, la investigación,
el uso de revistas electrónicas, la formación de usuarios, la gestión de la colección, el
impacto bibliométrico, los servicios bibliotecarios, las redes sociales, la gestión
de imágenes, la difusión de la información, etc.). Un refl ejo de que las bibliote-
cas de salud, hoy por hoy, no son una foto fi ja, sino que están en movimiento.
La conferencia de clausura «Cuando el pasado es el presente y el presente es
el futuro», corrió a cargo de José Antonio Merlo, director del Servicio de Archivos
y Bibliotecas de la Universidad de Salamanca, que «autotuiteó» su propia inter-
vención, y que aportó las claves de nuestro presente/futuro: formación constan-
te, competencias, relaciones y actitud.
En defi nitiva, sin renegar de nuestro pasado «más tradicional», las bibliotecas
de ciencias de la salud, a tenor de lo presentado, visto, discutido u oído en estas
Jornadas, intentamos no perder el tren de la modernidad y apostamos, como
otras muchas bibliotecas de nuestro entorno, por las nuevas tecnologías, que nos
acercan más y más a nuestros usuarios.
Por último, y en el aspecto lúdico, quien vaya o regrese a Cádiz, no deje de
visitar la Torre Tavira, ¡toda una sorpresa!
Y, a continuación, algunas cifras:
• Hemos sido 186 congresistas.
• En el seno de las jornadas 12 profesionales han impartido 10 sesiones for-
mativas y talleres.
• El Comité Organizador ha estado formado por 7 personas y el Comité Lo-
cal por 5 personas.
• La Secretaria Ejecutiva ha estado formada por 3 grupos de trabajo y 29
personas.
• El Comité Científi co ha estado integrado por 16 miembros, de 8 CCAA.
• El Comité de Honor ha sido presidido por su Alteza Real Princesa de As-
turias Dña. Letizia Ortiz Rocasolano y formado por un presidente de CA, 2
ministras, 2 consejeros, una alcaldesa y un rector.
• Se han celebrado 4 sesiones de debate con 16 ponentes, 4 dinamizadores,
4 relatores y 4 relatores de twitter.
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614
485

Noticias
• Se han presentado 29 pósteres, en 4 pantallas y en una sesión pública con
un relator.
• Se han leído 25 comunicaciones en 4 sesiones con 4 moderadores.
• Han colaborado 10 entidades publicas y privadas y otras 6 entidades pa-
trocinadoras.
• Se han presentado 10 empresas expositoras.
• Ha habido 4 presentaciones comerciales.
• Se han impartido dos conferencias «magistrales»: una de inauguración y otra
de clausura.
• Hemos tomado un cóctel de bienvenida, 5 cafés, 2 comidas y celebrado
una cena de clausura.
• Nos hemos alojado en 6 hoteles ofrecidos por la organización.
• Hemos acudido en tren, en avión y en coche propio.
• Las jornadas han tenido presencia en las redes sociales (Twitter, Facebook,
Delicious, Flickr y Slideshare).
• Las sesiones se han trasmitido en directo por streaming, y han tenido 1.135
conexiones.
• La cuenta de las jornadas en Twiter ha tenido 526 seguidores, y se han
utilizado 12 hastags que han generando 1.424 tweets.
• El perfi l en Facebook ha tenido 187 seguidores.
• Nos hemos hecho una foto de «familia» y se han colgado en fl ickr 216 fotos
de todas las sesiones y en Vimeo 4 videos.
Para más información sobre estas XIV Jornadas Nacionales (por ejemplo, los
vídeos de las sesiones) puede acudir raudo y presto a la página ofi cial: http://
www.jornadasbibliosalud.net/
Bibliografía
Juan Hernandez Morales. Bibliosalud 2011 en la red. Slideshare, 2011 http://www.slides-
hare.net/bibliosalud2011/estadisticas-redes-sociales-bibliosalud-2011 (acceso el 13 de
junio de 2011).
Bibliosalud 2011. 25 años proyectando futuro (XIV Jornadas Nacionales de Información
y Documentación en Ciencias de la Salud, Cádiz, 13 a 15 de abril de 2011). Sevilla:
Biblioteca Virtual del Sistema Sanitario Publico de Andalucía, 2011.
Elena Primo Peña
Biblioteca Nacional de Ciencias de la Salud, Instituto de Salud Carlos III
Concha Muñoz Tinoco
Biblioteca. Hospital Universitario Ramón y Cajal
Jose Manuel Estrada Lorenzo
Biblioteca. Agencia Laín Entralgo
486
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614

Revista Española de Documentación Científi ca,
34, 3, julio-septiembre, 477-486, 2011
ISSN: 0210-0614.
PRESENTACIÓN DEL INFORME ANUAL 2010
DE ASEBIO

La presentación del Informe ASEBIO 2010 que elabora anualmente la Asocia-
ción Española de Bioempresas, sobre el estado y evolución de la Biotecnología
en España, tuvo lugar el 10 de mayo 2011 en el auditorio de la sede central del
Consejo Superior de Investigaciones Científi cas en Madrid.
La elección de la sede para esta presentación está más que justifi cada por la
importante participación que el CSIC, y en particular algunos de sus centros e
institutos, como el Centro Nacional de Biotecnología, desempeñan en el desa-
rrollo de la biotecnología en España, tanto a nivel científi co como en el desarro-
llo de tecnologías en forma de patentes y creación de spin-offs. Por otra parte,
el Instituto de Estudios Documentales sobre Ciencia y Tecnología del CSIC vie-
ne dedicando una atención especial al estudio de la producción científi ca y el
desarrollo tecnológico de la biotecnología en nuestro país y el nivel de la mis-
ma en el contexto internacional. Como resultado de estos estudios se pueden
destacar varias publicaciones en revistas internacionales, así como las contribu-
ciones a los informes periódicos de la Fundación Genoma España y a la publi-
cación de carácter colectivo Radiografía de la Investigación Pública en España,
gracias al esfuerzo de la Red de Estudios Políticos, Económicos y Sociales sobre
la Ciencia, la Tecnología y la Innovación
constituida por investigadores del pro-
pio CSIC.
Es evidente que la presentación del Informe ASEBIO 2010 interesa tanto al
sector productivo como a la comunidad científi ca dedicada a la Biotecnología,
tanto desde el punto de vista experimental como desde el punto de vista de los
análisis de la ciencia.
El acto de presentación del Informe estuvo inicialmente presidido por el Pre-
sidente de ASEBIO D. José María Fernández Sousa-Faro, acompañado por los
dos vicepresidentes, D. Carlos Buesa y D. Jaime Costa y por el director del Co-
mité Científi co Asesor D. Emilio Muñoz, que moderó después de las palabras de
presentación del Dr. Fernández Sousa, una mesa compuesta por los Directores
del INE, el Parque Científi co de Madrid y los directores de I+D de Merck (bio-
tecnología) y Sylentis.
En sus palabras el presidente destacó que según los datos del módulo de
biotecnología de la Encuesta sobre Innovación en las empresas del año 2009 del
Instituto Nacional de Estadística (INE), la cifra de negocios del sector alcanzo los
53.152 millones de € en 2009, lo que supone un gran incremento sobre el año
anterior así como el incremento del 16,2 % observado en el número de empresas
que realizan actividades relacionadas con la biotecnología y que asciende a 1095
en 2009. De estas empresas 400 están dedicadas principal o exclusivamente a la
biotecnología lo que supone un aumento superior al 30 % respecto al año anterior.
487

Noticias
En las distintas presentaciones se informó sobre la situación y los últimos
avances y tendencias de la biotecnología en España. La percepción general del
sector según el Dr. Muñoz es positiva si bien el índice «temperatura del sector»
que defi ne esta percepción es algo inferior al del año 2009.
En el capítulo de la propiedad industrial presentado por D. Antonio Díaz los
procedimientos de búsqueda empleados han identifi cado 324 patentes biotecno-
lógicas con titulares españoles de las que casi la mitad corresponden al CSIC y
125 a empresas asociadas a ASEBIO.
Estas cifras siguen considerándose inferiores a lo que cabria esperar de la
capacidad científi ca de nuestro país y no presentan ningún avance respecto de
las del año anterior excepto en lo que se refi ere a las solicitudes en la OEPM
española que se han duplicado desde 2007.
La creación de 57 nuevas empresas biotecnológicas en nuestro país en el año
2010 se considera muy positiva a pesar de la situación restrictiva por la que atra-
viesa la economía.
Un conjunto de medidas de mejora en forma de incentivos fi scales dirigidas
a la I+D+i para empresas que inviertan una parte importante de su facturación
y se encuentren en pérdidas, a sido uno de objetivos de ASEBIO para equipa-
rarnos a lo que ya ocurre en otros países europeos.
El acto de clausura lo presidió la Ministra de Ciencia e Innovación Dª. Cris-
tina Garmendia que en su intervención presentó un balance de las principales
actuaciones de su Ministerio, destacando la aprobación de la esperada Ley de la
Ciencia, la Tecnología y la Innovación
que, según sus palabras, marcara un pun-
to de infl exión para nuestro sistema de I+D+i. También destacó la introducción
en la legislación española la fi gura de la Joven Empresa Innovadora y la obliga-
ción de desarrollar medidas específi cas para su protección e impulso.
Manifestó su apoyo a que las capacidades del sistema público de I+D puedan
servir de palanca a la investigación que realizan nuestras empresas y a que, con
la única limitación que marquen las leyes, se favorezca la participación del ca-
pital privado en la investigación pública.
Finalmente, y a pesar de un escenario macroeconómico adverso, la Ministra
expresó su satisfacción por el hecho de que el sector de la biotecnología haya
experimentado crecimientos de dos dígitos en los principales indicadores reco-
gidos en el informe ASEBIO 2010.
Armando Albert y Luis Plaza
IEDCYT-CSIC
488
Rev. Esp. Doc. Cient., 34, 3, julio-septiembre, 477-486, 2011. ISSN: 0210-0614

Document Outline