LOPES, Ilza Leite. Uso de linguagens
controlada e natural em base de dados. Base
Scielo. Disponível em: http://www.scielo.br/pdf/ci/v31n1/a05v31n1.pdf
1. Qual a diferença entre linguagem natural e
controlada/artificial?
Linguagem natural é aquela adotada no discurso
comum, na fala sem preocupação com o controle terminológico adotado. É a
linguagem utilizada pelo autor, por exemplo. Já a linguagem controlada ou
artificial é aquela desenvolvida com o objetivo de estabelecer o controle
terminológico dos conceitos com o objetivo de evitar a polissemia na indexação. Pode ser definida como um
conjunto de regras pré-estabelecidas, que adotam termos autorizados para uso
pelo sistema para que os resultados de uma busca de documentos em um sistema de
recuperação da informação seja relevante.
1. O que são facetas?
São representações de qualquer entidade complexa, a
partir de certo número de perspectivas. São considerados aspectos arranjados de
forma a descrever um objeto.
2. Por que as autoras
mencionam que os conhecimentos
acumulados sobre como organizar bibliotecas e como tratar informação não estão
sendo devidamente aproveitados no contexto digital?
Aparentemente,
as teorias e técnicas desenvolvidas pela biblioteconomia ao longo dos anos, não
vêm sendo amplamente aplicadas e ou adaptadas para o contexto das bibliotecas
digitais. Isso ocorre, principalmente, no que diz respeito ao uso de estruturas
de representação e organização do conhecimento. Observa-se que as bibliotecas
digitais não proporcionam a mesma eficácia das bibliotecas tradicionais no que
se refere à recuperação da informação. Podemos dizer que bibliotecas digitais
são, na maioria dos casos, meros sistemas executores de consultas, que devem
ser formuladas e objetivadas por seus usuários.
3. Como a
classificação facetada pode contribuir na recuperação da informação de acordo
com o texto?
As facetas possibilitam um esquema
organizacional multidimensional que, com o uso de ferramentas disponíveis em
ambiente digital e na Web, pode ser facilmente consultado e navegado em suas
diversas dimensões, de modo que todos os benefícios das classificações
facetadas podem ser aproveitados nestes ambientes.
1.
Responda, com suas palavras, a importância da mineração de textos no âmbito da
RI.
O uso da
ferramenta de mineração de textos sempre trará maior quantidade de itens
bibliográficos do que a lista de palavras-chave utilizada na indexação manual,
e assim poderá apoiar na construção de tesauros. O profissional da informação
terá a possibilidade de escolher palavras-chave com maior segurança e que venham a trazer maior precisão para o
usuário recuperar a informação.
2. Aponte
as vantagens e desvantagens entre realizar a indexação manual (feita pelo
bibliotecário) e a indexação por mineração de textos.
VANTAGENS
|
Indexação manual
|
Por mineração de textos
|
- A habilidade do indexador de
contextualizar, relacionar palavras,
usar a abstração, bem como decidir quais termos serao usados para identificar
o conteúdo dos documentos para sua
posterior recuperação.
|
- Maior rapidez no processo de
indexação.
- Pode complementar e aperfeiçoar o
processo de indexação manual.
|
DESVANTAGENS
|
- Processo de indexação mais lento.
- Custo mais alto.
|
- Necessita do profissional da
informação para a escolha das palavras chaves geradas pela mineração de
textos.
|
3. O que é índice de precisão e por que foi escolhido
esse índice na pesquisa para verificar a qualidade da RI?
É a taxa de documentos úteis recuperados pelo sistema no
total dos documentos recuperados pelo sistema. Esse índice foi escolhido para
avaliar, em termos percentuais, o desempenho de um protótipo com aplicação de
mineração de textos, confeccionado para ser o espelho da amostra selecionada da
base do Infohab na qual os documentos são indexados manualmente.
BRASCHER,
M; CAFÉ, L. Organização da informação ou organização do conhecimento? In:
ANCIB, São Paulo, 2008. Anais...,
2008.
1.
Qual a diferença entre organização da informação e organização do conhecimento,
de acordo com as autoras?
Para
as autoras do artigo, Lígia Café e Marisa Brascher, o processo de organização
do conhecimento se aplica a unidades do
pensamento (conceitos). A OC visa à
construção de modelos de mundo que se constituem em abstração da realidade.
Já
a organização da informação, para as autoras, se aplica às ocorrências
individuais de objetos informacionais. Compreende a organização de um conjunto
de objetos informacionais para arranjá-los sistematicamente em coleções, neste
caso a OI em bibliotecas, museus, arquivos tradicionais ou eletrônicos,
envolvendo os processos de representação descritiva e temática de uma obra.
CAMPOS, Maria Luiza de Almeida; GOMES, Hagar
Espanha. Organização de domínios de conhecimento e os princípios
ranganathianos. Perspect. Cienc. Inf., Belo Horizonte, v. 8, n. 2, p.
150-163, jul./dez. 2003.
1)
O que são
assuntos básicos e assuntos isolados, para Ranganathan?
Assuntos
básicos são os assuntos principais e assuntos isolados são assuntos específicos
dentro do assunto principal.
2)
O que é
faceta para Ranganathan?
Para Ranganathan facetas são manifestações das
próprias categorias dentro de uma área do conhecimento; é um termo genérico
usado para denotar algum componente que, pode ser um assunto básico ou um
isolado, de um assunto composto, tem função de formar renques, termos e
números.
3)
Qual a
diferença entre renque e cadeia?
Renques são classes
formadas a partir de uma única característica de divisão, formando séries
horizontais. Cadeias são séries verticais de conceitos, em que cada conceito tem
uma característica a mais ou a menos, conforme a cadeia seja descendente ou
ascendente.
NEVES, Dulce
Amélia de Brito; DIAS, Eduardo Wense; PINHEIRO, Ângela Maria Vieira. Uso de
estratégias metacognitivas na leitura do indexador. Ci. Inf., Brasília,
v. 35, n. 3, p. 141-152, set./dez. 2006.
1. O que
é protocolo verbal no âmbito da indexação e para que serve?
É uma técnica metodológica
qualitativa para extração de informações acerca de como os sujeitos realizam e
desenvolvem atividades cognitivas. No texto, o protocolo verbal é usado
solicitando aos sujeitos que estão lendo um texto, que façam
paradas ao longo da leitura e relatem, em voz alta, o que estão pensando. Serve
para possibilitar a obtenção de relatos individuais da própria cognição durante
a execução de uma tarefa ou à medida que esteja sendo relembrada.
2. Qual a diferença entre cognição e metacognição,
com base no texto?
A
cognição é compreendida como os processos mentais inconscientes de uma pessoa,
ou seja, a exemplo do leitor, ao ler, ele ativa o cérebro inconscientemente,
esse ativamento se chama de cognição. Já a metacognição refere-se ao
gerenciamento consciente sobre um fenômeno cognitivo pelo indivíduo, melhor
dizendo, o estudo, direcionamento do processo inconsciente.
PINTO, V. B. Indexação documentária: uma forma de representação do conhecimento
registrado. Perspect. Cienc. Inf., Belo Horizonte, v. 6, n. 2, p. 223 -
234, jul./dez. 2001.
1.
Explique o processo de indexação, evidenciando e conceituando este processo, de
acordo com o texto.
A
indexação consiste em um conjunto de atividades que visam identificar nos
documentos descritores acerca dos conteúdos dos mesmos. Estes descritores
posteriormente serão traduzidos para uma linguagem documentária e serão
utilizados como pontos de acesso ao documento, permitindo ao usuário a
recuperação da informação. As etapas que representam o nível de indexação são: - análise conceitual: etapa em que se desenvolve a leitura dos
documentos, identificando e extraindo conceitos que representem o conteúdo do
documento; - tradução: etapa em que se comparam os termos em linguagem natural
extraídos do documento aos de uma linguagem controlada, fazendo-se as
adequações necessárias; -
controle de qualidade: etapa de desambiguação das palavras, organização e
normalização de índices.
2.
Explique os três modos de indexação de acordo com o texto, apontando suas
vantagens e desvantagens.
Existem
três tipos de indexação: manual (humana), mecânica e por último a indexação
semi-automática, a qual integra a indexação manual e mecânica:
a) Indexação manual: este tipo de indexação é a realiza pelos humanos.
Baseia-se na intuição dos indexadores. Suas vantagens são: adotada em países de
1º e 3º mundo, engloba o contexto em que a obra está inserida, oferece maior
precisão e, com isso, resultados mais precisos e relevantes para os usuários.
Suas desvantagens: custo elevado, fraca coerência intra e entre
indexadores, dificuldade para escolha de grande quantidade de
conceitos;
b) Indexação mecânica: este tipo de indexação é realizada por
ferramentas da informática, sem interferências de indexadores humanos. Suas
vantagens são: agilidade na indexação e baixo custo por ser uma atividade
automática. Suas desvantagens são: não engloba o contexto em que a obra está
sendo indexada, o que
pode provocar baixa relevância e uso exclusivo de linguagem natural através da
extração automática das palavras usadas pelo autor, sem adoção de controle de
vocabulário.
c) Indexação humana e mecânica: neste tipo de indexação inicialmente é
feita a indexação automática e posteriormente um indexador humano analisa os
descritores e faz os ajustes necessários. Vantagens: agilidade na
indexação e maior produtividade no processo de indexa. Desvantagens: não
existem porque a união dos dois modelos é o mais recomendado já que une, tanto
a especificidade do indexador, quanto à agilidade da máquina.
3.
Conceitue e diferencie exaustividade de especificidade de acordo com suas
vantagens e desvantagens.
A
indexação exaustiva objetiva extrair do documento o maior número de conceitos
possíveis, visando à representação de todo o conteúdo da obra, de modo
genérico. Embora este tipo de indexação retorne um grande número de conceitos
ao usuário, no processo de recuperação da informação poderão ocorrer muitos
ruídos. Quando mais exaustiva for à indexação maior será o seu custo porque
demanda mais tempo no processo. Já a indexação específica objetiva descrever o conteúdo
do documento com profundidade. Ela leva em consideração apenas os conceitos
específicos tratados no documento. Este tipo de indexação amplia a precisão na
recuperação da informação, porém, aumenta o silêncio, visto que conteúdos não
descritos poderiam ser utilizados para sanar as necessidades informacionais de
usuários.
#fim!