Tesauro no domínio da comunicação científica: aplicação do modelo integrado de Cervantes
Thesaurus in the field of Scientific Communication: application of the Cervantes integrated model
Tesauro en el ámbito de la Comunicación Científica: aplicación del modelo integrado Cervantes
Thésaurus dans le domaine de la communication scientifique: application du modèle intégré de Cervantes
Andreza Pereira Batista1 Francisca Clotilde de Andrade Maia2 Saul Rodrigues Alcântara3
Autor para Correspondência
Andreza Pereira Batista
E-mail: andrezapereira@alu.ufc.br
ORCID: https://orcid.org/0000-0002-5621-402X
Submetido em: 14/03/2023 Aceito em: 28/05/2023 Publicado em: 30/12/2023
1 Mestranda pelo Programa de Pós-Graduação em Ciência da Informação da Universidade Federal do Ceará (PPGCI-UFC).
2 Mestranda em Ciência da Informação pelo Programa de Pós-Graduação em Ciência da Informação da Universidade Federal do Ceará (PPGCI-UFC).
3 Graduando em Biblioteconomia pela Universidade Federal do Ceará.
4 Doutor em Ciência da Informação pela Universidade Estadual Paulista (UNESP). Docente do Departamento de Ciências da Informação e do Programa de Pós-Graduação em Ciência da Informação (PPGCI-UFC) da Universidade Federal do Ceará.
Pesquisa sobre a aplicação do Modelo Integrado de Construção de Tesauros de Cervantes, na área de domínio da Comunicação Científica. Tem como objetivo a construção de um tesauro para o domínio da Comunicação, em específico o subdomínio Comunicação Científica a partir da utilização do modelo Metodológico Integrado de Cervantes (2009). Utiliza como metodologia a pesquisa bibliográfica; emprega para a construção da Linguagem Documentária o modelo supracitado de Cervantes; e utiliza como ferramenta para a estruturação do tesauro o software TemaTres. Para a extração dos termos e delimitação do subdomínio, faz uso do artigo científico “Comunicação científica: reflexões sobre o conceito”, de autoria de Caribé (2015), e do Dicionário de Biblioteconomia e Arquivologia para a verificação dos termos. A coleta dos dados resultou em 307 termos da área em estudo, sendo os termos centrais e que contêm maior peso semântico “Científica”, “Ciência” e “Comunicação”, seguidos de “Conhecimento”, “Educação”, “Compreensão” e “Pública”. Apresenta como resultado a construção do Tesauro em Comunicação Científica. Conclui que a aplicação do modelo proposto por Cervantes permitiu a análise sistemática e a conseguinte elaboração do tesauro no subdomínio da Comunicação Científica. Entende que a construção do tesauro na temática supracitada, bem como a descrição de seu processo, facilidades e limitações encontradas, contribui para a compreensão de estudantes de Biblioteconomia e áreas afins dos conceitos e procedimentos dos sistemas de organização do conhecimento, em especial, dos tesauros.
Research on the application of the Integrated Model of Thesaurus Construction of Cervantes, in the domain area of Scientific Communication. Its objective is the construction of a thesaurus for the domain of Communication, specifically the sub-domain Scientific Communication from the use of the Integrated Methodological Model of Cervantes (2009). It uses bibliographic research as methodology; it employs the aforementioned Cervantes' model for the construction of the Documentary Language; and uses the TemaTres software as a tool for structuring the thesaurus. For the extraction of the terms and the delimitation of the sub-domain, it makes use of the scientific article "Comunicação científica: reflexões sobre o conceito", authored by Caribé, and the Dictionary of Librarianship and Archivology for the verification of the terms. The data collection resulted in 307 terms
from the area under study, being the central terms and those with greater semantic weight "Scientific", "Science" and "Communication", followed by "Knowledge", "Education", "Understanding" and "Public". It presents as a result the construction of the Thesaurus on Scientific Communication. It concludes that the application of the model proposed by Cervantes allowed the systematic analysis and the consequent elaboration of the thesaurus in the subdomain of Scientific Communication. It believes that the construction of the thesaurus on the aforementioned theme, as well as the description of its process, facilities and limitations encountered, contributes to the understanding of library science students and related areas of the concepts and procedures of knowledge organization systems, especially thesaurus.
Investigación sobre la aplicación del Modelo Integrado de Construcción de Tesauros de Cervantes, en el ámbito del dominio de la Comunicación Científica. Su objetivo es la construcción de un tesauro para el dominio de la Comunicación, específicamente el subdominio Comunicación Científica a partir del uso del Modelo Metodológico Integrado de Cervantes (2009). Utiliza como metodología la investigación bibliográfica; emplea el citado modelo cervantino para la construcción del Lenguaje Documental; y utiliza el software TemaTres como herramienta para la estructuración del tesauro. Para la extracción de los términos y delimitación del subdominio, hace uso del artículo científico "Comunicação científica: reflexões sobre o conceito", de autoría de Caribé, y del Diccionario de Biblioteconomía y Archivología para la verificación de los términos. La recolección de datos resultó en 307 términos del área en estudio, siendo los términos centrales y de mayor peso semántico "Científico", "Ciencia" y "Comunicación", seguidos por "Conocimiento", "Educación", "Comprensión" y "Público". Presenta como resultado la construcción del Tesauro sobre Comunicación Científica. Concluye que la aplicación del modelo propuesto por Cervantes permitió el análisis sistemático y la consecuente elaboración del tesauro en el subdominio de Comunicación Científica. Entiende que la construcción del tesauro sobre el tema mencionado, así como la descripción de su proceso, facilidades y limitaciones encontradas, contribuye a la comprensión de los estudiantes de bibliotecología y áreas afines de los conceptos y
procedimientos de los sistemas de organización el conocimiento, en especial de los tesauros.
Recherche sur l'application du Modèle Intégré de Construction de Thésaurus de Cervantes, dans le domaine de la Communication Scientifique. Son objectif est la construction d'un thésaurus pour le domaine de la Communication, plus précisément le sous-domaine de la Communication Scientifique à partir de l'utilisation du Modèle Méthodologique Intégré de Cervantes (2009). Il utilise la recherche bibliographique comme méthodologie, le modèle de Cervantes pour la construction du langage documentaire et le logiciel TemaTres comme outil de structuration du thésaurus. Pour l'extraction des termes et la délimitation du sous-domaine, il utilise l'article scientifique "Scientific Communication : reflections on the concept", rédigé par Caribé (2015), et le Dictionary of Librarianship and Archivology pour la vérification des termes. La collecte de données a donné lieu à 307 termes du domaine étudié, qui sont les termes centraux et qui contiennent le plus grand poids sémantique "Scientifique", "Science" et "Communication", suivis de "Connaissance", "Éducation", "Compréhension" et "Public". Il présente le résultat de la construction du thésaurus sur la communication scientifique. Il conclut que l'application du modèle proposé par Cervantes a permis l'analyse systématique et l'élaboration conséquente du thésaurus dans le sous-domaine de la communication scientifique. Il comprend que la construction du thésaurus sur le thème susmentionné, ainsi que la description de son processus, des facilités et des limites constatées, contribue à la compréhension des étudiants en bibliothéconomie et des domaines connexes des concepts et des procédures des systèmes d'organisation des connaissances, en particulier des thésaurus.
INTRODUÇÃO
No enquadramento das práticas biblioteconômicas, a organização e representação da informação são áreas basilares no
processo de recuperação de dados pelos usuários. Nesse sentido, as Linguagens Documentárias (LD) assumem o papel de permitir que tal ação ocorra de modo a fazer cumprir o objetivo dos bibliotecários: facilitar o acesso informacional a quem dela necessite. Assim, a construção de uma LD para organizar áreas específicas do conhecimento torna-se fundamental neste processo.
Neste sentido, este artigo objetiva construir um tesauro para a área do conhecimento ‘Comunicação’, especificando-se a ‘Comunicação Científica’, em que realizamos a delimitação do subdomínio para garantia literária dos termos e noções admitidas para a composição da LD a partir do artigo ‘Comunicação científica: reflexões sobre o conceito’ de Rita de Cássia do Vale Caribé, pesquisadora considerada referência na área em questão.
Optamos por essa delimitação de domínio devido à experiência prévia e aproximação dos autores com leituras e outras atividades relacionadas a essa temática. Em determinados momentos, houve a necessidade de tomar decisões em relação aos termos coletados, como quando haviam termos idênticos, mas que se distinguiam quanto ao número, singular ou plural, e assim, decidimos por manter o termo que apareceu mais vezes na coleta de dados.
Atribuímos o pequeno número de termos verificados após a coleta e a classificação ao fato do dicionário utilizado ser uma obra publicada em 2008 e que, portanto, de acordo com nossa percepção empírica, não teria incorporado em seus termos as discussões teóricas acerca da área de Comunicação Científica dos últimos quinze anos.
INFORMAÇÃO, DOCUMENTO E LINGUAGENS DOCUMENTÁRIAS: ALGUNS CONCEITOS
A organização da informação é um tópico essencial na Biblioteconomia e na Ciência da Informação, de modo que definir o termo ‘informação’ é indispensável e ao mesmo tempo uma tarefa complexa. Muitos autores utilizam-se de conceitos diferentes para informação, assim, Le Coadic (1996, p. 5) a considera como:
[…] um conhecimento inscrito (gravado) sob a forma escrita (impressa ou numérica), oral ou audiovisual. A informação comporta um elemento de sentido. É um significado transmitido a um ser consciente por meio de uma mensagem inscrita em um suporte espacial-temporal: impresso, sinal elétrico, onda sonora, etc. Essa inscrição é feita graças a um sistema de signos (a linguagem), signo este que é um elemento da linguagem que associa um significante a um significado: signo alfabético, palavra, sinal de pontuação.
Para o autor, a informação pode estar tanto sob a forma escrita, oral ou audiovisual. Além disso, ela acomoda o sentido, que é atribuído e transmitido por um ser consciente mediante mensagens inscritas em determinados suportes. Essa inscrição, segundo o autor, é feita por meio de um determinado sistema de signos, que se constituem como elementos da linguagem e que podem ser um signo alfabético, uma palavra ou um sinal de pontuação. Consideramos, assim, a definição de informação como dados em contexto, carregados de sentido, que necessitam de uma análise do indivíduo e que exigem a mediação humana.
A partir do conceito apresentado, podemos falar sobre uma parte crucial na organização da informação no universo desta pesquisa: as linguagens documentárias. Elaborada com diversos propósitos, desde as mais simples até às mais complexas, das mais gerais para as mais específicas, sua organização em forma de representação auxiliam os bibliotecários e diversos outros
profissionais no processo de recuperação da informação, pois, segundo Cintra, Tálamo, Lara e Kobashi (1994, p. 23), elas foram “[…] construídas para indexação, armazenamento e recuperação da informação e correspondem a sistemas de símbolos, destinadas a ‘traduzir’ os conteúdos dos documentos”.
Nessa perspectiva, Maimone (2020, p. 424) compreende que o uso de tais linguagens “[...] no cenário da Ciência da Informação intenta resolver problemas como polissemia, ambiguidade, redundância com o objetivo de possibilitar a recuperação da informação de forma padronizada”, relacionada a representação unívoca dos dados.
Isto posto, temos então a base da prática organizacional que tem o intuito de representar e recuperar a informação, e é nesse contexto que os tesauros se originam a partir das classificações facetadas, pautando-se na preocupação com o controle do vocabulário (Cintra; Tálamo; Lara; Kobashi, 1994). Vemos que enquanto linguagens documentárias como a Classificação Decimal de Dewey (CDD) ou a Classificação Decimal Universal (CDU) são empregadas para organizar e recuperar a informação, os tesauros, por sua vez, são utilizados para prover a um autor ou autora o controle de vocabulário. De acordo com Ferreira e Maculan (2020, p. 248):
No desenvolvimento do tesauro, há de destacar, porém, a necessidade de se avaliar o contexto de uso, as necessidades de informação dos usuários e os propósitos da revisão para que os procedimentos adotados possam ser efetivos.
Além disso, segundo Martines, Moreira e Almeida (2022), os sistemas de organização do conhecimento precisam estar alinhados às problemáticas advindas dos avanços e das inovações científicas,
em que o tesauro é aplicado para estabilizar os conceitos sociais, científicos, políticos e históricos, nas mais diversas práticas de registro do conhecimento, como classificar e indexar. Os autores apontam, ainda, que o tesauro se constitui de redes semânticas capazes de oferecer condições aos usuários determinar os termos mais indicados ou não para determinados fins.
Retornando ao entendimento de Ferreira e Maculan (2020), os tesauros têm o objetivo de promover a padronização terminológica de um domínio, tendo em vista a representação do conhecimento e a recuperação da informação nas diferentes fontes, tais como bases de dados, catálogos, índices, entre outros. Desse modo, as autoras defendem que sua principal função é o estabelecimento de uma linguagem unívoca e livre de ambiguidade para possibilitar o compartilhamento entre os diferentes sujeitos existentes no processo de comunicação, a saber: documentos, bibliotecários, sistema de recuperação propriamente dito e usuários.
Ao auxiliar no controle de vocabulário entre outros usos, um tesauro não pode ser viabilizado sem um sistema nocional, visto como essencial para um melhor controle dos termos, pois Cintra, Tálamo, Lara e Kobashi (1994, p. 35) explicam que “[…] ausência de um sistema de noções devidamente sistematizado, inviabiliza o empreendimento de dar forma a um conjunto de palavras”, e isto ocorre em razão de esbarrar “[…] em dificuldades advindas da falta de compreensão ou da compreensão incorreta das possibilidades de relacionamento entre termos”, materializando-se em sistemas de noções que se expressam em relações hierárquicas e não- hierárquicas.
Os sistemas nocionais passam a demonstrar os tipos de relações dos termos com outros sinônimos, com termos
equivalentes, com seus campos de estudo e aplicação e com sua estrutura de hierarquização, sendo assim, possível indicar e especificar determinados termos dentre outros.
A partir das noções de geral/particular e de todo/parte, a análise das relações hierárquicas mostra, pelo menos, três tipos característicos: as relações genéricas, as relações específicas e as relações partitivas, que como os nomes indicam, marcam relações de gênero, portanto globais ou gerais, relações de espécie, logo particulares e relações de parte de um todo (Tálamo; Lara; Kobashi, 1994, p. 37).
À vista do que foi apresentado, elaboramos a figura 1 que resume os conceitos apresentados de modo a permitir sua visualização a partir das relações com as linguagens documentárias.
Fonte: elaborado pelos autores com base em Cintra, Tálamo, Lara e Kobashi (1994).
Por fim, é possível perceber que as linguagens documentárias apresentam nuances que as tornam instrumentos precisos na organização e representação da informação. Seus conceitos e
sistematização propiciam o desenvolvimento de relações conceituais e lógicas que auxiliam o usuário no seu uso. Entretanto, para que tal funcionamento seja possível, há a necessidade de ferramentas auxiliares na sua construção, como veremos adiante.
PROCEDIMENTOS METODOLÓGICOS
Esta pesquisa se caracteriza como bibliográfica, uma vez que é desenvolvida “[…] com base em material já elaborado, constituído principalmente de livros e artigos científicos” (Gil, 2002, p. 44). Para a construção do referencial teórico utilizamos a revisão de literatura narrativa, a partir da consulta de livros obtidos no acervo da Biblioteca de Ciências Humanas (BCH) da Universidade Federal do Ceará (UFC) e artigos recuperados em bases de dados especializadas da área, como a Base de Dados em Ciências da Informação (BRAPCI). Para o desenvolvimento da LD utilizamos o Modelo de Construção de Tesauros, de Cervantes (2009). Para tal, consultamos o artigo científico denominado ‘Comunicação científica: reflexões sobre o conceito’ publicado em 2015 e com a autoria da pesquisadora Rita de Cássia do Vale Caribé, para a delimitação do subdomínio e
extração dos termos.
Gil (2002, p.44) assegura que livros de referência “[…] são aqueles que têm por objetivo possibilitar a rápida obtenção das informações requeridas”, diante de tal afirmação, escolhemos o Dicionário de Biblioteconomia e Arquivologia, cuja a autoria é de Murilo Bastos Cunha e Cordélia Robalinho de Oliveira Cavalcanti, publicado no ano de 2008, para realizar a verificação dos termos, tendo em vista que não foi encontrado pelos autores um dicionário especializado na área de Comunicação Científica.
Para a construção do Tesauro foi utilizado o software TemaTres que se insere como um instrumento para a construção de LDs e “[…] permite gerenciar, publicar, compartilhar e reutilizar ontologias, taxonomias, tesauros e listas de valores” e enquadra-se como uma das ferramentas de apoio à elaboração de linguagens documentárias de apoio à própria gestão do conhecimento (Instituto Brasileiro de Informação em Ciência e Tecnologia, [20--], online).
Desenvolvido pelo argentino Diego Ferreyra, é um software de código aberto para a web livre, em que não é necessário o pagamento de licença aos desenvolvedores, além da publicação da linguagem finalizada ser completamente online. O gerenciamento de representações formais do conhecimento é realizado mediante o cadastro e distribuição de termos e noções de uma determinada área do conhecimento. Dentre seus principais recursos encontram-se a edição de termos, de notas e dos recursos de gerenciamento.
A ferramenta é multilíngue, com seus recursos disponíveis principalmente em inglês, apesar de muitas funcionalidades já estarem traduzidas para o português e permite a exportação dos dados armazenados em diversos formatos, como texto (.txt) e Portable Document Format (PDF). Além disso, sua estrutura pode comportar desde pequenos glossários e vocabulários de noções multi-hierárquicas. Portanto, seu uso na construção de uma LD do tipo tesauro permite uma melhor visualização da informação a ser disponibilizada.
Cervantes (2009) afirma que a construção de um tesauro é uma atividade, em sua essência, intelectual, e que é realizada mediante o seguimento de diferentes etapas que podem variar a depender da necessidade da área em questão. Dessa forma, com base em pesquisas realizadas na literatura científica e na identificação das
etapas mais referenciadas, a autora propõe um Modelo Integrado para a Construção de Tesauros (quadro 1) para orientar a construção de tesauros, que é dividido em uma sequência lógica de cinco etapas: Trabalho preliminar; Método de compilação; Registro de termos; Verificação de termos e Forma de apresentação de um tesauro.
Fonte: Cervantes (2009, p. 163).
A primeira etapa, Trabalho preliminar, consiste nas orientações gerais sobre o uso de equipamento automático de processamento de dados. Nesta etapa estão presentes a escolha do domínio e da língua a ser utilizada no tesauro, a delimitação do subdomínio, o estabelecimento dos limites de extensão da pesquisa terminológica temática e a consulta a especialista do domínio ou subdomínio para obter contribuições a respeito da seleção pelo corpus de pesquisa.
A segunda etapa, Método de compilação, orienta acerca da abordagem de compilação a ser utilizada, além da coleta do corpus
do trabalho para compilação dos termos, define a determinação da árvore de domínio ou estrutura conceitual da área, e a expansão da representação do domínio adotado.
A terceira etapa, Registro de termos, apresenta as formas de coleta e a classificação dos termos a serem utilizados no tesauro a partir do corpus determinado.
A quarta etapa, Verificação de termos, trata da admissão e exclusão de termos e também da especificidade. Demonstra a verificação, classificação e a confirmação de termos, na qual cada conceito é reavaliado para possível adequações, a elaboração de definições/nota de escopo que orientam sobre o significado de determinados conceitos, o uso de vocabulários de especialidade para o estabelecimento de relações entre descritores e relações entre descritores e não descritores, e por fim, a organização dessas relações.
A quinta etapa, Forma de apresentação de um tesauro, é constituída pelo trabalho de apresentação do tesauro, ou seja, a demonstração sistemática e em ordem alfabética dos descritores. A aplicação de cada uma das respectivas etapas apresentadas pelo modelo de Cervantes e os resultados obtidos com o modelo são discutidos no tópico a seguir.
APLICAÇÃO DO MODELO DE CONSTRUÇÃO DE TESAUROS DE CERVANTES (2009) NO DOMÍNIO DA COMUNICAÇÃO CIENTÍFICA
Etapa A: Delimitação do subdomínio
Esta etapa corresponde ao intitulado “Trabalho Preliminar”, apresentado no quadro 1 acima, e que corresponde a quatro fases, de acordo com Cervantes (2009), a saber:
Consulta a especialista da área/subárea de especialidade, em que se busca a obtenção de contribuições quanto à escolha de corpus representativo para a coleta de termo.
Cervantes (2009) afirma que essas etapas são estabelecidas em consonância com a literatura especializada, sendo um trabalho de ordem intelectual, já que é “[…] fato que as etapas para a construção de tesauros vão desde a definição da área de especialidade; passam por etapas que dizem respeito a método de compilação; registro; verificação de termos; até a etapa que trata da forma de apresentação do tesauro”. Essas etapas podem sofrer ajustes ou adaptações conforme a necessidade que se apresentar.
Dessarte, como domínio e língua do Tesauro definimos a ‘Comunicação’ com a coleta de termos em português, restringindo- se a subárea ‘Comunicação Científica’. Como parâmetro de delimitação do domínio e subdomínio, escolhemos o periódico Informação & Sociedade: Estudos, da Universidade Federal da Paraíba (UFPB), publicado desde 1991 de modo ininterrupto. Possui abrangência nacional e internacional, com adoção da estrita revisão por pares.
Por conseguinte, dentro desse periódico, escolhemos o v. 25,
n. 3, de 2015, da área de Ciência da Informação, determinando-se como subdomínio o artigo Comunicação Científica: reflexões sobre o conceito, de autoria da doutora em Ciência da Informação pela Universidade de Brasília (UNB), Rita de Cássia do Vale Caribé, professora-adjunta Faculdade de Ciência da Informação da mesma instituição. Trata-se de um relato de pesquisa, proveniente de sua tese de doutorado (Comunicação científica para o público leigo, de 2011), no qual a autora explora diversos conceitos da temática principal do artigo.
A escolha deste relato deu-se por ser utilizado como bibliografia comum a diversos artigos que versam a respeito da comunicação científica no contexto da Ciência da Informação. Assim, pode trazer termos comuns a autores que estudam a área.
Etapa B: Estabelecimento dos limites da pesquisa terminológica temática e Coleta do corpus do trabalho terminológico
Esta etapa corresponde ao denominado “Método de Compilação”, correspondente a três fases:
finalidade reunir a documentação necessária para a compilação dos termos do tesauro em desenvolvimento, com suas respectivas documentações e normas terminológicas, textos da área, entre outros, que sejam fundamentais para a compilação dos termos. Cervantes (2009) citando Tálamo (1997) propõe três grandes fontes de coleta para engradar os modos indutivos e dedutivos da construção do tesauro: i) A tabela de classificação; ii) A literatura especializada; e iii) O conhecimento da equipe e dos usuários.
O estabelecimento da árvore do domínio diz respeito à categorização da estrutura conceitual da área ou subárea de especialidade. Segundo Cervantes (2009, p. 167), “[…] representa o conjunto nocional que tem a função de situar a área ou subárea de especialidade a ser estudada”, e que se deve, antes de estabelecer a estrutura conceitual, consultar documentos especializados.
Expansão da representação do domínio escolhido relaciona-se à expansão da representação da área escolhida, no qual é necessário o auxílio de especialistas do domínio ou subdomínio para direcionar e verificar os resultados obtidos nos itens anteriores.
Tendo em vista o exposto, os limites da pesquisa terminológica foram os termos coletados na literatura especializada, com enfoque no artigo Comunicação Científica: reflexões sobre o conceito, de Rita de Cássia do Vale Caribé, apresentado anteriormente. Além disso, os autores possuem conhecimentos acerca do subdomínio escolhido, possibilitando a determinação dos termos no processo de coleta. A coleta dos termos resultou em 307 termos da área, em que o documento “A” refere-se ao artigo de Caribé, já explicitado no
escopo do texto, conforme exemplo no quadro 2, abaixo:
Nº | Termos | Quant. | Docum. |
1 | Comunicação científica | 1 | A |
2 | Conhecimento | 1 | A |
3 | Comunicação | 1 | A |
4 | Comunicação científica | 1 | A |
5 | Comunicação científica | 1 | A |
6 | Comunicação da informação | 1 | A |
7 | Métodos | 1 | A |
8 | Pares | 1 | A |
9 | Público leigo | 1 | A |
10 | Difusão científica | 1 | A |
Fonte: elaborado pelos autores, 2023.
Ressalta-se, entretanto, que esses termos correspondem até a página 97 do artigo utilizado para a construção do tesauro, que possui 16 páginas (p. 79-104). Logo, o escopo deverá ser bem maior com o acréscimo das sete páginas restantes.
Etapa C: Classificação, verificação e confirmação dos termos
A etapa de classificação, verificação e confirmação dos termos consiste na admissão ou exclusão de termos com base na sua especificidade como já citado anteriormente. A classificação dos termos é realizada, segundo Cervantes (2009), com base no corpus do trabalho terminológico. A verificação dos termos, segundo Cavati Sobrinho (2014, p. 85) é a etapa que “[…] admite e/ou exclui, de acordo com sua especificidade, […] termos e o uso do vocabulário de especialidade para estabelecer as relações entre os descritores e sua organização”. A verificação é feita com base na consulta dos
termos em linguagens controladas, tais como dicionários, tesauros etc. e a confirmação dos termos diz respeito à ratificação dos termos que irão compor a estrutura do tesauro, conforme apresentado no quadro 3.
Nº | Termos | Quant. | Docum. | Dicionário |
1 | Acadêmicos | 1 | A | 0 |
2 | Alfabetização científica | 13 | A | 0 |
3 | Alfabetização em ciências | 1 | A | 0 |
4 | Analfabetização científica | 1 | A | 0 |
5 | Artigos | 1 | A | 0 |
6 | Artigos especializados | 1 | A | 0 |
7 | Atitude científica | 1 | A | 0 |
8 | Atividade científica | 1 | A | 0 |
9 | Bancos de dados | 1 | A | 1 |
10 | Bibliotecas | 1 | A | 1 |
Fonte: elaborado pelos autores, 2023.
Utilizamos para a confirmação o Dicionário de Biblioteconomia e Arquivologia de Murilo Bastos da Cunha e Cordélia Robalinho de Oliveira Cavalcanti, lançado em 2008. Sua escolha foi determinada por ser um dicionário voltado para a área de Biblioteconomia, que tradicionalmente trabalha com as linguagens documentárias, particularmente os tesauros.
Etapa D: Forma de apresentação do Tesauro
Na apresentação dos tesauros, Cervantes (2009), citando Tálamo (1997), a define como uma identificação sistemática e alfabética dos termos. Nessa parte sistemática, os termos
encontram-se relacionados de acordo com as categorias ou classes e são apresentados sob forma de lista em ordem alfabética. Ainda citando Tálamo (1997), Cervantes (2009) fala de uma separação das relações entre os termos dentro de três principais classes, que são Relações Equivalentes, Hierárquicas e Associativas, e dentro dessa divisão, as relações são comumente abreviadas para uma melhor utilização.
Nas relações equivalentes, verificamos quais termos podem ou não serem utilizado no lugar do termo preferido, segundo Cervantes (2009, p. 49), no “[…] caso da sinonímia utilizada na construção de tesauros, consideramos que são sinônimos quando dois termos carregam a possibilidade funcional de se substituírem um ao outro”. Em relações hierárquicas, a autora afirma que (2009, p. 48) são apresentados “[…] níveis de superordenação e subordinação entre as noções, que elas podem ser genéricas, específicas ou partitivas e constituem a estrutura principal de um tesauro no sentido vertical (esquema de árvore)”.
Por último, temos as relações associativas, as quais Cervantes (2009, p. 48) define que “[…] operam no nível de sinonímia e da polissemia e estabelecem as remissivas com a finalidade de encaminhar o usuário para os termos preferidos pelo sistema”. A autora (2009, p. 50) apresenta ainda as relações entre os termos com abreviaturas pois, “[…] são convenções reconhecidas que aparecem em diversos tesauros publicados e possuem valor mnemônico óbvio”, observando-os no quadro 4.
RELAÇÕES DE EQUIVALÊNCIA | RELAÇÃO HIERÁRQUICA | RELAÇÃO ASSOCIATIV A |
TGM = Termo genérico. Maior de uma | ||
USE = precede o | hierarquia | |
TG = Termo Genérico | ||
termo preferido | ||
TGP = Termo Genérico Partitivo | TR = Termo | |
Relacionado | ||
TE = Termo Específico | ||
UP = precede | ||
TEG = Termo Específico Genérico | ||
termo não- | ||
preferido | ||
TEP = Termo Específico Partitivo |
Fonte: Cervantes (2009, p. 51), adaptado pelos autores.
As relações são feitas destacando não apenas o termo em si, mas os tipos de relações que o mesmo possui, como é mostrado no exemplo abaixo englobando o domínio estabelecido para o presente tesauro, a Comunicação Científica:
Alfabetização em Ciências USE Alfabetização científica
Conforme dito na metodologia, foi utilizado o software TemaTres para a construção do tesauro, e a partir dele, montamos o tesauro de forma tradicional, ou seja, alfabética e sistêmica, possibilitando sua consulta por outros softwares de computador.
Durante a construção, foram feitas as relações de termos preferido e não preferidos, termos gerais, específicos e relacionados.
Assim, estabelecemos as relações de lógica na hierarquia entre as noções determinadas para o tesauro, haja vista o conhecimento empírico acerca da temática. O tesauro final foi elaborado levando em consideração o peso semântico dos termos dentro do artigo escolhido, mesmo que estes não constem no dicionário selecionado para a verificação. Esses pesos se encontram demonstrados na figura 2, tendo as noções “Comunicação” e “Científica” como predominantes no domínio do artigo base utilizado.
Fonte: elaborado pelos autores, 2023.
A partir do que foi exposto, percebemos que “Científica”, “Ciência” e “Comunicação” constituem os termos centrais do tesauro, com maiores pesos semânticos, seguidos de “Conhecimento”, “Educação”, “Compreensão”, “Pública”. Desse modo, compreendemos que a Comunicação Científica está diretamente
relacionada com a concepção de compreensão de conhecimento por seu público, e que para tal ação ser concretizada, são necessários mecanismos de sistematização da área. O resultado dessas decisões a partir do que foi apresentado se encontram descritos no Tesauro em Comunicação Científica no apêndice A.
CONSIDERAÇÕES FINAIS
A construção do Tesauro por meio da aplicação do modelo de Metodológico Integrado de Cervantes (2009) permitiu uma análise sistemática para essa elaboração dentro do domínio da Comunicação Científica. Pelas etapas serem descritas individualmente pela autora, sua aplicação não foi complexa, embora um pouco demorada de início. É perceptível que esse modelo pode ser utilizado no âmbito de qualquer área do conhecimento, dentro de seus respectivos domínios e subdomínios.
Todavia, sentimos certas dificuldades na definição dos pesos semânticos dos termos coletados para a composição do sistema nocional do domínio escolhido. Além disso, houve demora na localização de um dicionário específico que pudesse ser utilizado na verificação dos termos, o que optamos por uma da área de Biblioteconomia para tal ação.
Para mais, encontramos alguns problemas na organização do tesauro no software TemaTres, que abrange, inicialmente, o download do programa, com trouxe uma série de dificuldades na sua instalação. O login no sistema também pode dificultar a organização quando se acessa em outros suportes além do que foi instalado primordialmente. Seu uso, apesar de intuitivo, traz contratempos no que se relaciona à tradução de algumas partes do software, pois há
a mistura de diversos idiomas ao português. A exportação dos formatos também poderia ser melhor definida para o usuário ter consciência de qual será aquele que mais irá se adequar a suas necessidades.
Apesar das dificuldades narradas, o TemaTres tem vantagens ao facilitar o estabelecimento de relações entre termos, bem como evitar duplicidades e possibilitar a visualização macro do desenvolvimento do tesauro, tornando-o interativo e de fácil identificação de possíveis erros. Além disso, proporcionou constante reflexão acerca da área de domínio escolhida, o que se torna positivo pois permite que o autor do tesauro se utilize de seu raciocínio já estabelecido para considerar e refletir sobre as relações a serem criadas entre os termos, contribuindo com o avanço de seu repertório intelectual sobre o assunto.
Assim, na construção de tal repertório, os tesauros são ferramentas essenciais para possibilitar ao usuário acesso a uma terminologia de um domínio do conhecimento, de modo que ele tenha condições de reconhecer os termos mais apropriados para alcançar seus objetivos, e pela comunicação científica ser uma área que perpassa por todos os campos da ciência, a construção de tesauro específico para o supracitado subdomínio auxilia tanto na organização dos conceitos da área quanto na confiabilidade dos sistemas de informação.
Isso posto, entendemos que a construção do tesauro de Comunicação Científica, temática ímpar para a comunidade acadêmica, e por meio do software TemaTres, com a descrição de seu processo e etapas, bem como a apresentação das facilidades e limitações encontradas, têm a capacidade de contribuir para a compreensão de tais temas e para a formação de estudantes de
graduação de Biblioteconomia, Ciência da Informação e áreas afins, que versam sobre as respectivas temáticas de comunicação da ciência e dos conceitos e procedimentos adotados nos sistemas de organização do conhecimento, em especial, nos tesauros.
REFERÊNCIAS
CARIBÉ, R. C. V. Comunicação científica: reflexões sobre o conceito. Informação & Sociedade, João Pessoa, v. 25, n. 3, p. 89-104, 2015. Disponível em: https://periodicos.ufpb.br/ojs2/index.php/ies/article/view/23109.
Acesso em: 10 jan. 2021.
CAVATI SOBRINHO, H. A representação documentária do domínio da economia: análise de estruturas de representação em linguagens documentárias e documentos específicos de economia. 2014. 148 f. Tese (Doutorado) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, 2014. Disponível em: https://repositorio.ufc.br/handle/riufc/19139. Acesso em: 28 maio 2023.
CERVANTES, B. M. N. A construção de tesauros com a integração de procedimentos terminográficos. 2009. 198 f. Tese (Doutorado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2009.
CINTRA, A. M. M.; TÁLAMO, M. F. G. M.; LARA, M. L. G.;
KOBASHI, N. Y. Para entender as linguagens documentárias.
São Paulo: Polis: APB, 1994. 72 p.
CUNHA, M. B.; CAVALCANTI, C. R. O. Dicionário de
2021.
FERREIRA, A. C.; MACULAN, B. C. M. D. S. Metodologias para revisão e atualização de tesauros: mapeamento da literatura.
em: 31 maio 2023.
FERREYRA, D. TemaTres. [S. l.], 2019. Disponível em: https://www.vocabularyserver.com/doubts. Acesso em: 15 jan. 2021.
GIL, A. C. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002. 176 p.
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E
TECNOLOGIA (Brasil). Grupo de Pesquisa sobre Tecnologias para Gestão da Informação. TemaTres. [S.l.], [20--]. Disponível em: http://labcoat.ibict.br/portal/?page_id=238. Acesso em: 30 nov.
2020.
LE COADIC, Y. F. A ciência da informação. Brasília, DF: Briquet de Lemos, 1996.
MAIMONE, G. D. Informação e conhecimento: insumos para o trabalho organizativo em Ciência da Informação. Informação & Informação, Londrina, v. 25, n. 3, p. 423-436, 2020. Disponível em: https://brapci.inf.br/index.php/res/v/149486. Acesso em: 31 maio 2023.
MARTINES, A. R.; MOREIRA, W.; ALMEIDA, C. Do signo ao
tesauro: contribuições de três correntes da linguagem. Ciência da Informação, [s.l.], v. 51, n. 1, p. 2022. Disponível em: https://brapci.inf.br/index.php/res/v/193887. Acesso em: 31 maio 2023.
APÊNDICE A – TESAURO EM COMUNICAÇÃO CIENTÍFICA
A | |
Acadêmicos TE: Especialistas TR: Professor Alfabetização científica UP: Alfabetização em ciências TR: Analfabetização científica Alfabetização em ciências USE: Alfabetização científica | Artigos TE: Artigos especializados TR: Canais formais de comunicação TR: Ciclo da comunicação TR: Periódicos especializados Artigos especializados TT: Artigos TG: Artigos |
Analfabetização científica TR: Alfabetização científica | Atitude científica TT: Pesquisador TG: Pesquisador |
Atividade científica TR: Ciência | |
B | |
Bancos de dados | Bibliotecas |
TR: Bibliotecas | TR: Bancos de dados |
TR: Livros | |
TR: Pesquisa | |
C | |
Campo científico TT: Ciência TG: Ciência | Comunicação científica TE: Comunicação da informação TE: Comunicação de informação científica e tecnológica TE: Disseminação científica TE: Divulgação científica TR: Comunicação pública da ciência TR: Jornalismo científico Comunicação da informação TT: Comunicação científica TG: Comunicação científica Comunicação de informação científica e tecnológica TT: Comunicação científica TG: Comunicação científica Comunicação pública da ciência TR: Comunicação científica |
Canais formais de comunicação TR: Artigos | |
Ciclo da comunicação TR: Artigos | |
Ciência TE: Campo científico TR: Atividade científica TR: Ciência e tecnologia TR: Ciências básicas TR: Cultura científica TR: Princípios científicos | |
Ciência e tecnologia TR: Ciência |
Ciências básicas TR: Ciência Cientistas USE: Pesquisador Colégios invisíveis TR: Pares Competências UP: Conhecimento Compreensão pública da ciência TT: Popularização Científica TG: Popularização Científica Comunicação TE: Processos de comunicação TE: Receptores | Comunidade científica TR: Pares Congressos TT: Eventos científicos TG: Eventos científicos Conhecimento USE: Competências Conhecimento científico TR: Conhecimento científico e tecnológico Conhecimento científico e tecnológico TR: Conhecimento científico TR: Tecnologia Cultura científica TR: Ciência |
D | |
Desenvolvimento científico e tecnológico TR: Impactos da ciência TR: Tecnologia Difusão científica UP: Difusão do conhecimento Difusão do conhecimento USE: Difusão científica Disseminação científica TT: Comunicação científica TG: Comunicação científica | Divulgação científica TT: Comunicação científica UP: Divulgar a ciência TG: Comunicação científica Divulgar a ciência USE: Divulgação científica |
E | |
Editores TT: Periódicos especializados TG: Periódicos especializados Educação científica UP: Educação de ciências Educação de ciências USE: Educação científica Especialistas TT: Acadêmicos TG: Acadêmicos | Eventos científicos TE: Congressos TE: Seminários TE: Simpósios Extrapares TT: Pares TG: Pares |
I |
Impactos da ciência TR: Desenvolvimento científico e tecnológico Informação científica TE: Informações científicas e tecnológicas | Informações científicas e tecnológicas TT: Informação científica TG: Informação científica Intrapares TT: Pares TG: Pares |
J | |
Jornalismo científico TR: Comunicação científica | |
L | |
Linguagem especializada USE: Linguagens científicas Linguagens científicas UP: Linguagem especializada TE: Textos científicos | Livros TR: Bibliotecas |
M | |
Métodos TE: Métodos científicos TE: Métodos de pesquisa Métodos científicos TT: Métodos UP: Métodos da ciência TG: Métodos | Métodos da ciência USE: Métodos científicos Métodos de pesquisa TT: Métodos TG: Métodos TR: Revisões de literatura |
P | |
Pares UP: Público especializado TE: Extrapares TE: Intrapares TR: Colégios invisíveis TR: Comunidade científica Percepção pública da ciência TT: Popularização Científica TG: Popularização Científica Periódicos especializados TE: Editores TR: Artigos Pesquisa TR: Bibliotecas Pesquisador UP: Cientistas TE: Atitude científica | Popularização Científica UP: Vulgarização da ciência TE: Compreensão pública da ciência TE: Percepção pública da ciência TR: Público leigo Princípios científicos TR: Ciência Processos de comunicação TT: Comunicação TG: Comunicação Professor TR: Acadêmicos Público especializado USE: Pares Público leigo TR: Popularização Científica |
R | |
Receptores TT: Comunicação TG: Comunicação | Revisões de literatura TR: Métodos de pesquisa |
S | |
Seminários TT: Eventos científicos TG: Eventos científicos | impósios TT: Eventos científicos TG: Eventos científicos |
T | |
Tecnologia TR: Conhecimento científico e tecnológico TR: Desenvolvimento científico e tecnológico | Textos científicos TT: Linguagens científicas TG: Linguagens científicas |
V | |
Vulgarização da ciência USE: Popularização Científica |