top of page

Os tesauros como ferramentas de padronização terminológica


O crescimento contínuo das publicações seja em suportes eletrônicos ou impressos aliado à crescente demanda por esses materiais, acarretou aos profissionais da informação o desafio de armazenar, tratar e disponibilizar as informações contidas nessas publicações.


Tesauro

Para que isso aconteça é necessário que medidas de padronização sejam adotadas, visando controlar e recuperar de forma precisa e eficaz toda e qualquer informação solicitada pela comunidade usuária interessada, acerca da importância do uso de métodos pré-definidos de trabalho Chiavenato, (1987) apud Silva, Duarte e Oliveira, (2004: p. 3) afirma que “os fatores determinantes para avaliação do desempenho são os padrões, podendo ser tangíveis ou intangíveis, vagos ou específicos, mas sempre relacionados com o resultado desejado”.


No que diz respeito á Ciência da Informação a máxima proposta por Chiavenato, se faz presente em muitas de suas atividades cotidianas, códigos como o AACR2 (Código de Catalogação Anglo Americano 2), padrão Dublin Core, tabelas de classificação como a Classificação Decimal de Dewey (CDD), Classificação Decimal Universal (CDU) entre outros nasceram com o intuito de padronizar dados e procedimentos e assim facilitar a recuperação dos materiais, entretanto quando pensamos em termos descritores para esses materiais é encontrada uma realidade um tanto complexa devido a diversidade léxica inerente ao ser humano pois a mesma palavra pode apresentar diversas definições quando em contextos diferentes como bem analisou Capurro e Hjorland, (2007):


É bem sabido que as definições não são verdadeiras ou falsas, mas sim, mais ou menos produtivas. De certo modo as pessoas são livres para definir termos como quiserem, mas na realidade, as definições delas podem encontrar problemas. Nas brincadeiras das crianças, uma cadeira pode ser definida como uma mesa e vice versa. Isto funciona enquanto as crianças lembram e obedecem suas próprias decisões e não aplicam suas convenções na comunicação com estranhos. (CAPURRO e HJORLAND, 2007, p. 151)



Eventos semelhantes aos descritos pelo autores podem ocorrer quando elaboramos uma pesquisa em um Sistema de Recuperação da Informação (SRI) podendo este ser modernos repositórios digitais, softwares de bibliotecas ou uma simples planilha em Excel


Exemplo: em um SRI executamos uma pesquisa sobre as propriedades nutricionais da manga e recuperamos informações de vestuário que descrevem as mangas da vestimenta adequada para a execução de determinada função, isso ocorre quando o administrador do SRI não se atenta para as ambiguidades que um termo possa apresentar.


Do mesmo modo podem haver ocasiões em que o fator de problemas sejam os sinônimos ou as traduções:


Exemplo: podemos pesquisar sobre TANGERINAS e usar o termo MEXERICA, ou buscar informações relativas a DIREITOS AUTORAIS e utilizar o descritor COPYHIGHT.


Em ambos os casos existe a possibilidade de haver falhas na recuperação da informação uma vez que o termo empregado para a busca não condiz com o utilizado pelo indexador.


Nesse contexto, a presente pesquisa discorrerá sobre a utilização de tesauros como ferramenta de padronização terminológica, visando assim proporcionar aos profissionais da Informação uma alternativa sólida para as questões de eficiência na recuperação da informação.


Tesauros são:


Uma lista estruturada de termos associados empregada, por analistas de informação e indexadores, para descrever um documento com a desejada especificidade, em nível de entrada, e para permitir aos pesquisadores a recuperação da informação que procura (CAVALCANTI, 1978, p. 196 apud NAKAYAMA, 1986, p. 16)



A definição abaixo melhor se adéqua ao atual contexto:


Tesauro é uma linguagem especializada, normalizada, pós-coordenada, usada com fins documentários, onde os elementos linguísticos que a compõem – termos, simples ou compostos – encontram-se relacionados entre si sintática e semanticamente. (CURRAS, 1995, apud, MOREIRA; ALVARENGA e OLIVEIRA, 2004)


Em suma, tesauros são ferramentas de normalização terminológica que organizam uma determinada área do conhecimento, genérica e semanticamente convertendo a linguagem natural que é a utilizada no cotidiano em linguagem documentária, que é a forma linguística empregada no processo de indexação, se utilizando de metodologias de categorização, análise conceitual, relacionamentos conceituais e descrição dos termos.


Os tesauros são estruturados de maneira que o termo possa ser apresentado em três formas, a saber: taxonomia ou categorização, alfabética e planigráfica, esse artigo se aprofundará na primeira e segunda forma de apresentação deixando a terceira para uma próxima ocasião dada a sua particularidade.


Taxonomia ou categorização, mentalizada por Ranganathan na década de 1920, baseia-se em dividir os conceitos em grandes classes com o interesse de organizar o conhecimento de forma semântica, ou seja, de modo que o usuário deste sistema visualize os termos dentro de suas categorias:


Podemos ver que as categorias têm uma capacidade de estrutura: não apenas estruturam, de fato, todos os nossos elementos de conhecimento e unidades do conhecimento; elas fornecem, ao mesmo tempo, por este meio, o esqueleto, os ossos e tendões para estruturar todo o nosso conhecimento. Com seu uso consciencioso, então, o corpo do nosso conhecimento pode se manter unido, pode se mover, pode se manter flexível - e pode crescer organicamente (DAHLBERG, 1978 p. 34, apud Campos e Gomes, 2006, p. 355)



No arranjo alfabético as relações terminológicas mostram-se de maneira clara, pois enquanto na taxonomia somente as relações lógicas como a de gênero e espécie ou termo geral (TG) e termo específico (TE) podem ser observadas claramente, na alfabetação estas continuam dispostas em menor representatividade, entretanto acrescidas de particularidades como os relacionamentos ontológicos que segundo o IBICT, (1990) são indiretas e tratam os conceitos de forma individual, que sempre devem padronizados por siglas, como, para relações de equivalências ou sinonímia UP (usado para), termo genérico partitivo (TGP), termo específico partitivo (TEP), termo associado (TA) entre outros, sobre isso o Instituto Brasileiro de Ciência e Tecnologia (IBCT), endossa:


Esta ordem é prática: permite que se localize rapidamente o termo desejado. No entanto, quando o tesauro se apresenta unicamente sob esta forma fica difícil, de imediato, perceber os princípios de classificação subjacentes, bem como o grau de intensidade dos termos. Fica, também, mais lento localizar as entradas relativas aos termos mais genéricos ou mais específicos, pois eles se encontram distribuídos na ordem alfabética. (IBICT, 1990 p. 57, grifos meus)


É importante ressaltar que no arranjo alfabético todas as relações semânticas são recíprocas, ou seja, comunicam-se dinamicamente.


Além dos padrões explicitados no arranjo dos tesauros, sua principal característica e diferencial positivo é o seu padrão de unicidade do descritor, tendo em vista que a palavra é a menor unidade léxica e seu significado é dependente do contexto ao qual se encontra, ela, quando isolada, pode expandir sua capacidade de significação, sendo assim é necessário que haja um controle de palavras, inibindo assim as ambiguidades, sobre isso o IBICT complementa:


"A partir de alguns princípios, escolhe-se uma determinada palavra ou expressão para representar um único conceito, ou ideia. Quando isso se dá isto se dá não tem-se mais uma “palavra” mas um “termo”. Dito de outra maneira, o termo equivale a um conceito + uma designação." (IBICT, 1990 p. 15)


Pode haver ocasiões em que uma única palavra é utilizada em diferentes contextos dentro de uma área do conhecimento, como por exemplo, o termo TRADUÇÃO que na Biblioteconomia pode ser empregado a uma característica de um documento (A Letra escarlate: TRADUÇÃO de Christian Schwartz) ou ao segundo procedimento inserido no processo de indexação (1ºanalise conceitual 2º TRADUÇÃO). A esse fenômeno denominado polissemia, o IBICT, (1990) aconselha o uso de um contextualizador, isto é um termo posto entre parenteses que defina a real intenção daquele descritor naquele contexto, este recurso garante a diferenciação dos conceitos e a eliminação das ambiguidades, exemplo, TRADUÇÃO (PROCESSO) TRADUÇÃO (DOCUMENTO)


Conforme Serra, (2011), outros pontos abordados são, siglas que sempre devem ser transcritas por extenso, exemplo, AVC USE ACIDENTE VASCULAR CEREBRAL,termos em idiomas variados, como: Surf USE SURFE, expressões, gírias e jargões entre outros.


Nessas condições podemos afirmar que os tesauros podem ser utilizados visando atender as necessidades de padronização dos termos descritores utilizados tanto para a indexação quanto e, sobretudo para busca de itens em um sistema de recuperação da informação (SRI), pois cobrem dada área do conhecimento neutralizando a sinonímia e as ambiguidades e assegurando assim a monossemia por meio de redes de relacionamentos como gênero-espécie, causa-efeito, oposição ou negação entre outras minimizando assim situações como o ruído (recuperação de itens não correspondentes com a solicitação formulada no momento da busca), silêncio (documentos que existem no acervo, porém não recuperados no momento da busca) e maximizando conjunções como a revocação, ou seja, a quantidade satisfatória de itens relevantes à pesquisa e a precisão que se refere à qualidade de itens pertinentes à questão formulada no momento da busca.


Como trata-se de uma ferramenta que analisa um determinado domínio, a terminologia determinada pode com o tempo tornar-se obsoleta ou incompleta, cabe pois aos administradores desse SRI, estarem atentos as evoluções da área e realizar as devidas manutenções nos tesauros.

Referências


CAMPOS, Maria Luiza Almeida; GOMES, Hagar Espanha. Metodologia de elaboração de tesauro conceitual: a categorização como princípio norteador. Perspectivas em Ciência da Informação. Belo Horizonte, v. 11, n. 3. set./dez., 2006. Disponível em: <http://www.scielo.br/scielo.php?pid=S1413 99362006000300005&amp;script=sci_arttext&gt;>. Acesso em: 01 ago. 2011.

CAPURRO, Rafael; JHORLAND, Birger. O conceito de informação. Perspectivas em Ciência da Informação. [S.l], v. 12, n. 1, p. 148-207. Disponível em: <http://www.scielo.br/pdf/pci/v12n1/11.pdf&gt> Acesso em: 08 out., 2011.

INSTITUTO BRASILEIRO DE INOVAÇÃO CIÊNCIA E TECNOLOGIA. Manual de elaboração de tesauros monolíngües. Brasília, 1990.

NAKAYAMA, Haruka. Tradução e adaptação de tesauros. Ciência da Informação. Brasília, v. 15, n. 1, p.15-25, jan./jun., 1986.

SERRA, Maria Edith Giusth. Tesauro. São Paulo, 2011.

SILVA, W. L. V; DUARTE, F. M; OLIVEIRA, J. M. Padronização: um fator importante para a engenharia de métodos. Qualit@s Revista Eletrônica. [s.l], v. 3, n. 1, p. 1-5, jan/jun. 2004. Disponível em: &lt; http://revista.uepb.edu.br/index.php/qualitas/article/view/35/27&gt; Acesso em: 25 jun., 2013.


Posts Recentes
Postagens recentes
Busca por Tags
bottom of page