Printer Friendly

Organizacao e representacao de conhecimento de temas de pesquisa.

1. Introducao

Na era do conhecimento, os processos de pesquisa, desenvolvimento e inovacao, devido ao alto grau de complexidade e multi, inter e transdisciplinaridade tematica, tem sido executados, cada vez mais, por meio das chamadas redes de conhecimento (Torres, Pierozzi, Pereira & Castro, 2011). Boa parte do conhecimento gerado nessas redes costuma ser explicitado em linguagem natural e, via de regra, textualmente, constituindo um volume enorme de documentos impressos ou digitais. Neste ultimo formato, os documentos sao disponibilizados amplamente em ambiente Web ou bases de dados, cujo acesso e facilitado pelas tecnologias da informacao e comunicacao (TIC).

Os mapas semanticos, construidos por meio de analises de coocorrencia de palavras, sao usados para entender a estrutura cognitiva de um dominio do conhecimento (Cahlik, 2000; Salvador & Lopez-Martinez, 2000). Esses mapas sao gerados a partir de diferentes fontes textuais, incluindo palavras extraidas de titulos de artigos, palavras-chave declaradas pelos autores ou descritores atribuidos pelo editor, que estao registrados e indexados em bases de dados como a Elsevier Scopus e a Clarivate Web of Science. Atualmente, essas bases oferecem excelentes recursos bibliometricos para os usuarios interessados em exploracao e reuso de dados, informacoes e conhecimento.

O poder computacional para recuperacao e analise desses conteudos esta prontamente disponivel para os usuarios analisarem redes com grandes quantidades de documentos (Zhao & Strotmann, 2008). Por outro lado, grande quantidade de informacao requer

O uso de ferramentas avancadas para viabilizar sua analise (Shiffrin & Borner, 2004), organizacao e sua ressignificacao em outros contextos.

Historicamente, essas solucoes nao surgiram sem grande esforco. Dada a falta de recursos de computacao, os primeiros estudos, naturalmente, tendiam a se concentrar em pequenas iniciativas e foram, com algumas excecoes, academicos por natureza. No entanto, o esforco para analisar grandes quantidades de documentos e obter respostas diminuiu consideravelmente, acompanhando o aumento da disponibilidade de dados em formato digital e o aumento exponencial do poder computacional, que incluem algoritmos avancados para visualizacao da informacao e analises qualitativas.

Essas praticas configuram as chamadas competencias analiticas (Levine, Strother-Garcia, Hirsh-Pasek, & Golinkoff, 2017) de uma organizacao e representam o conjunto de metodologias e ferramentas para reuniao e analise de grandes volumes de informacao com objetivo de criacao de inteligencia (1) . Atualmente, as competencias analiticas resgatam um referencial teorico e metodologico multidisciplinar, que envolve, entre as principais abordagens, temas como visualizacao da informacao, sistemas de organizacao do conhecimento (SOC), mineracao de dados e de textos, processamento em linguagem natural (PLN), linguistica de corpus e terminologias, mapas e estruturas conceituais, alem de modelagens matematica e estatistica.

O objetivo deste artigo e apresentar e descrever uma metodologia de mapeamento de dominios de conhecimento, cuja execucao permite o alinhamento de varias ferramentas tendo-se como resultado, sistemas de organizacao de conhecimento como recursos para facilitar a elaboracao de sistemas de conceitos, expressoes de busca e significacao da informacao recuperada. O texto esta estruturado, apos esta breve introducao, com o referencial teorico, que aborda os principais conceitos que sustentam o trabalho, com a metodologia proposta, um exemplo pratico, conclusoes e referencias bibliograficas.

2. Referencial Teorico

Sistemas de organizacao do conhecimento (SOC) se referem a um termo generico usado para abordar uma ampla gama de itens (taxonomias, tesauros, esquemas de classificacao e ontologias), que foram concebidos com diferentes propositos, em momentos historicos distintos. Os SOC sao caracterizados por diferentes estruturas e funcoes especificas, variados modos de se relacionar com a tecnologia e empregados em uma pluralidade de contextos por diversas comunidades. No entanto, o que todos eles tem em comum e o fato de terem sido projetados para apoiar a organizacao do conhecimento e da informacao visando facilitar o gerenciamento e a recuperacao. Para torna-lo acessivel e utilizavel (por agentes humanos ou tecnologicos), o conhecimento precisa, de fato, ser organizado de alguma maneira (Soergel, 2008), algo que, dada a grande quantidade de producao cientifica e cultural, tornou-se cada vez mais importante nos ultimos anos.

A visualizacao de dominios do conhecimento tem como objetivo revelar as areas da comunicacao cientifica, conforme refletidos na literatura cientifica publicada e nas trajetorias de citacao realizadas por pesquisadores em suas publicacoes. Ha de fato uma conexao importante entre a visualizacao de dominios e o que Hjorland (1997) chamou de analise de dominio. A visualizacao fornece tecnicas de habilitacao para analise de dominio, especialmente em areas de conhecimento multidisciplinares e de rapida evolucao. O campo de visualizacao de dominio tambem tem sido chamado de cientografia (Garfield, 1994), embora este termo nao pareca ser amplamente utilizado.

Os avancos na visualizacao da informacao tem sido significativamente impulsionados pela pesquisa de recuperacao de informacao, cujo problema central tem sido como melhorar a sua eficiencia e a sua eficacia. De um modo geral, quanto mais um usuario souber sobre seu espaco de pesquisa, maior sera a probabilidade de sua pesquisa ser eficaz. Muitos sistemas de visualizacao de informacoes descrevem a estrutura semantica geral de uma colecao de documentos. Os usuarios podem usar essa visualizacao estrutural como base para navegacao e pesquisa subsequentes.

A selecao de uma unidade de analise e o passo inicial para explorar qualquer dominio do conhecimento, seguido pelas perguntas a serem respondidas. Essa premissa do processo vai ao encontro do espaco conceituai de Gardenfors (2014). Este autor forneceu caracterizacoes precisas de varias categorias ontologicas tais como: um objeto e representado por uma sequencia de pontos em um conjunto de espacos conceituais; uma propriedade por uma regiao em um espaco conceituai; um conceito por uma sequencia de regioes em um conjunto de espacos conceituais.

As unidades de analise mais comuns no mapeamento de literatura sao periodicos, documentos, autores e termos descritivos ou palavras-chave. Cada um apresenta diferentes facetas de um dominio e facilita diversos tipos de analise. Por exemplo, um mapa de periodicos pode ser usado para obter uma visao macro da ciencia (Bassecoulard & Zitt, 1999), mostrando as posicoes relativas e as relacoes entre as principais disciplinas.

Em muitas situacoes, as pessoas utilizam palavras com a finalidade de pesquisar assuntos, conceitos ou ideias. A intencao e recuperar informacoes que possibilitem o entendimento conceituai a partir do significado das relacoes que se estabelecem com os termos recuperados na pesquisa. A analise dos dados oriundos de metadados dos documentos indexados em uma base de referencias bibliograficas torna-se essencial para gerenciar, localizar, interpretar ou usar outros dados ou uma fonte desses dados. Os metadados de uma referencia bibliografica nao residem no objeto de informacao, mas no seu relacionamento com outro objeto informacional e, mais especificamente, no seu uso. Nesse sentido, a organizacao do conhecimento se destina a atender as seguintes necessidades (Soergel, 2008): apoiar o pensamento, a construcao de sentido, a integracao do conhecimento e a descoberta de novos conhecimentos e lacunas por pessoas e programas de computador; fornecer um roteiro semantico para um individuo e promover o entendimento compartilhado, melhorar a comunicacao em geral e a colaboracao; apoiar a aprendizagem e a assimilacao de informacao; suportar a exibicao significativa e bem estruturada de informacoes; fornecer a base conceituai para sistemas baseados em conhecimento; suportar interoperabilidade sintatica e semantica e a preservacao de significado ao longo do tempo; fornecer informacoes sobre termos, conceitos e outras entidades a leitores, escritores e tradutores para ajuda-los a compreender o texto, a conceituar um topico e a encontrar o termo adequado.

Contudo, os metodos e as tecnologias de visualizacao de dados e informacoes e de analise de redes podem ser associados a estudos bibliometricos e cientometricos e se revelam muito eficazes em processos de recuperacao da informacao e de descoberta de conhecimento em corpora textuais.

Devido ao enorme volume de dados e informacoes publicado e disponivel atualmente, ferramentas computacionais para o mapeamento, a organizacao, a representacao, a analise e o reuso desses conteudos documentais tem sido desenvolvidas e embutidas em metodologias que abrangem busca e recuperacao de informacoes, analises quantitativas e qualitativas, categorizacoes e classificacoes de assuntos, de topicos ou de tematicas. Assim, como as redes sociais que os produzem, dados, informacoes e conhecimento podem, igualmente, ser organizados em redes ou sistemas de conceitos. Esse processo envolve as premissas que conteudos informacionais podem ser representados pelos conceitos ali incluidos, que, por sua vez, podem ser representados pelos termos que os denotam, conforme a Teoria do Conceito (Dahlberg, 1978). Finalmente, os termos e suas inter-relacoes num conteudo textual, primariamente frequencia e coocorrencia, podem ser mapeados no formato de redes, constituindo um sistema de conceitos, inclusive com atribuicoes semanticas para qualificar tais relacoes.

0 campo de visualizacao de informacao avancou muito nos ultimos anos, trazendo novas tecnicas para a analise grafica da literatura, de patentes, de genomas e outros tipos de conteudos informacionais (Chen & Song, 2017). No entanto, e preciso lembrar que, enquanto a visualizacao pode ser critica para o entendimento e a cognicao humanos, ela e simplesmente uma janela para as analises rigorosas, muitas vezes multidimensionais, que formaram a base da informatica por muitos anos. Nesse sentido, o mapeamento nao se refere apenas a tela de visualizacao, mas tambem as tecnicas subjacentes de mineracao, analise de dados e reconhecimento de padroes ou propriedades especificas dos elementos que compoem o sistema conceituai envolvido. Mapear dominios de conhecimento, entao, toma como sua entrada assuntos aparentemente diversos de analises, incluindo e integrando: analises de redes (por exemplo, web, redes sociais, redes livres de escala e caminhos metabolicos); linguisticas; conceituais (dominio, conteudo, discurso, assunto); de extracao de topicos; de citacoes, coautorias, coocorrencia de palavras-chave; indicadores (metadados) de ciencia e tecnologia; tecnicas de visualizacao.

O principal objetivo do mapeamento de dominios de conhecimento e fornecer subsidios de analise para o especialista quanto para o nao-especialista. Para o nao-especialista, o mapeamento fornece um ponto de entrada em um dominio, por possibilitar a obtencao de conhecimento nos niveis macro e micro. Para o especialista, o mapeamento fornece uma validacao de percepcoes e um meio de investigar rapidamente tendencias e novas informacoes, incoerencias e divergencias, tanto quanto convergencias. No entanto, ate mesmo o especialista pode se surpreender com os desenvolvimentos na periferia de sua percepcao. O mapeamento e a exploracao interativa fornecem contextos para tais surpresas.

Varios metodos de mapeamento, organizacao e representacao do conhecimento partem da logica que nao existe gestao do conhecimento, mas, na pratica, o que se conduz e uma variedade de atividades de trabalho que viabilizem o compartilhamento de informacoes (Wilson, 2002). Dessa forma, enquanto representante convencional do conhecimento explicitado, o documento e a unidade de analise mais comum, porque pode ser usado para mapear um campo cientifico ou tecnico especifico e o seu desenvolvimento. Cocitacao e coocorrencia de termos sao os dois tipos mais comuns de analise, e muitas vezes levam a diferentes agrupamentos. Nos niveis mais refinados, as tecnicas de cocitacao agrupam documentos por paradigma cientifico, ou pela mesma questao de pesquisa e hipoteses, ao passo que as comunidades de coocorrencia de termos sao de natureza mais topica.

0 mapeamento em redes de termos de indexacao revela a estrutura cognitiva de um campo (Callon & Law, 1983). Ha algum debate sobre se a analise conjunta deve ser usada para estudos de dinamica da ciencia (Leydesdorff, 1997). As abordagens mais confiaveis visam combinar tecnicas de palavras coocorrentes com analises de citacoes (Noyons, Moed & Luwel, 1999). Tecnicas mais avancadas, usando algoritmos sofisticados para agrupar e relacionar topicos, sao uma grande promessa para estudos dinamicos (Griffiths & Steyvers, 2004; Erosheva, Fienberg & Lafferty, 2004).

3. Metodologia para o mapeamento conceituai

Este item apresenta a metodologia proposta para o mapeamento conceituai de dominios de conhecimento (Moresi, Pierozzi Junior, Oliveira, & Brandao, 2019) e no item 4 e apresentado um exemplo utilizando o tema inteligencia artificial na educacao.

Questoes como gestao da informacao e do conhecimento, descoberta de conhecimento, inteligencia e planejamento estrategicos e estudos de prospeccao antecipativa passaram a ser relevantes no desenvolvimento institucional das organizacoes, independente dos setores aos quais elas se vinculam (governamentais, academicos, terceiro setor, entre outros). Essa onda de crescentes e diversos interesses, objetivos e estrategias institucionais se converte no insumo principal para a sistematizacao proposta no modelo descrito na Figura 1, visando o mapeamento, a organizacao e a representacao de dominios de conhecimento especificos.

O processo se constitui de quatro etapas: mapeamento do dominio do conhecimento; codificacao do conhecimento; aplicacao de linguistica de corpus e de processamento de linguagem natural; e representacao do conhecimento.

O mapeamento do dominio do conhecimento se refere a definicao do espaco do conhecimento humano a ser modelado no processo. No entanto, isso nao significa um corte e um isolamento desse dominio de conhecimento: tal delimitacao e um exercicio conceituai para identificacao e reconhecimento da tematica a ser explorada e posterior analise de contextos, propositos, estrategias, tendencias, oportunidades, desafios, etc., vinculados a essa tematica. Essa etapa pode ser executada a partir de escolha pessoal das tematicas ou envolver equipes de trabalho, por meio de dinamicas sociais presenciais ou virtuais. Os dados podem ser coletados por meio de tecnicas como brainstormings, entrevistas, questionarios, leituras, entre outras.

A codificacao do conhecimento se refere a conversao do conhecimento tacito um formato explicito, especificamente, em "textualizacao", ou seja, transposicao de audios, videos ou qualquer outro formato em que o conhecimento tenha sido registrado, para um formato textual, reunindo o maior conteudo possivel referente as tematicas que ainda nao se apresente nessa forma como, por exemplo, as discussoes socializadas em sessoes de brainstormings ou paineis. Nessa etapa, utilizam-se tecnicas diversas de registro, documentacao e transcricao e sao reunidos os documentos que comporao o corpus a ser processado na etapa que se segue.

Na sequencia, as aplicacoes de linguistica de corpus e de processamento de linguagem natural se realizam em tres fases: construcao, compilacao e limpeza dos documentos selecionados para a composicao do corpus textual para analise. Essa fase tambem inclui:

- a transformacao de arquivos PDF ou em outros formatos, para o padrao TXT, que e o mais adequado ao processamento computacional utilizado nas fases seguintes;

- a extracao semiautomatica de candidatos a termos com o emprego de softwares contendo algoritmos para essa extracao com base em metricas de frequencia e coocorrencia de palavras ou expressoes (n-gramas) no corpus, utilizando o software VOSviewer;

- o mapeamento terminologico em que se recomenda um alinhamento terminologico dos candidatos a termos obtidos na fase anterior com recursos lexicos disponiveis e referentes as tematicas definidas para a analise.

A representacao do conhecimento se propoe a produzir os artefatos explicitados textualmente. Recomenda-se novamente uma validacao pelos especialistas de dominio, pois a intencao e gerar os produtos finais do processo de modelagem e analise. Duas fases podem ser executadas tanto em sequencia como de forma independente uma da outra:

- desenvolvimento e aplicacao de sistemas de organizacao do conhecimento que se refere a elaboracao de um formato de representacao diferente do textual linear. Dessa forma, desde formatos unidimensionais, como listas de termos, ate os mais elaborados em estrutura e funcionalidade, como as ontologias, podem ser elaborados. Nessa fase, ainda, desenvolvem-se aplicacoes dos SOC para diversos processos de Gestao da Informacao e do Conhecimento como, por exemplo, taxonomias navegacionais multifacetadas, que podem ser empregadas na construcao de expressoes booleanas de busca em bases de dados ou, ainda, estruturas conceituais como as redes semanticas que podem ser representadas no software yEd (yWorks, 2019);

- execucao de gestao terminologica com o emprego de ferramentas e tecnicas de gestao terminologica como, por exemplo, identificacao de contextos visando definir os termos associados a tematica delimitada no inicio do processo. 0 software livre e-Termos (Oliveira, 2009) e recomendado pois foi construido especificamente para esse fim, incluindo a operacionalizacao de praticamente todas as 4 etapas deste processo. Alem disso, o e-Termos tambem atende as funcionalidades de um repositorio de dados terminologicos.

Adicionalmente, alguns pontos especificos de operacionalidade do processo descrito acima, merecem um olhar mais atencioso: na escolha das tecnologias de suporte ao processo, baseados no exercicio empirico de realizacao de mapeamento, organizacao e representacao do conhecimento, algumas ferramentas metodologicas e alguns softwares revelaram-se bastante adequados.

O software VOSviewer tem se revelado muito satisfatorio, oferecendo excelentes funcionalidades de edicao e visualizacao de sistemas de conceitos. O bom desempenho de extracao automatica de termos deve ser atestada pelos especialistas de dominio que reconhecem nos termos propostos pelo software as formas lexicais apropriadas para os conceitos, referendando a Teoria do Conceito (Dahlberg, 1978), que embasa a concepcao do processo aqui apresentado. Alem disso, o software que se propoe a elaborar graficamente um panorama do dominio analisado, fornece metricas associadas a terminologia que viabiliza analises e abordagens relacionadas a analise de redes (centralidades, comunidades) e as geometrias do conhecimento, mais especificamente aos conceitos recentes de "espaco conceituai" (Gardenfors, 2014) e "esfera semantica" (Levy, 2011).

0 VOSviewer, alem das funcionalidades de organizacao e visualizacao de dados e informacoes, exporta os dados numericos em formatos interoperaveis o que viabiliza, a partir dos arquivos de mapa de termos e de arestas para reconstruir as triplas "conceitorelacao-conceito" do sistema de conceitos gerado.

A rede pode ser importada para o software yEd, que possibilita a representacao visual original obtida no VOSviewer e a edicao no formato de grafos com inclusao/exclusao de termos/conceitos (nos) e de relacionamentos (arestas) e, igualmente pode ser visualizada por meio de variados layouts que proporcionam novos insights cognitivos. Outra funcionalidade muito util do yEd e a possibilidade de elaborar recortes do sistema de conceitos, mais uma vez motivando outros insights cognitivos e empoderando o processo aqui apresentado na construcao de ressignificacao dos dados e informacoes ou, em outras palavras, na construcao de inteligencia.

4. Exemplo pratico

Atualmente, a educacao emprega varios metodos para ensino e aprendizagem, que utilizam tecnologias da informacao e comunicacao, visando adaptar e melhorar a experiencia do estudante. Os softwares educacionais, por exemplo, permite a criacao de inumeras ferramentas com o objetivo de melhorar os processo de ensino e aprendizagem. Uma alternativa para a criacao desse tipo de ferramentas e a inteligencia artificial, que e um campo de estudos multidisciplinar, originado da computacao, da engenharia, da psicologia, da matematica e da cibernetica. O seu principal objetivo e construir sistemas que apresentem comportamento inteligente e desempenhem tarefas com um grau de competencia equivalente ou superior ao de um especialista humano (Nikolopoulos, 1997).

Quando aplicada a Educacao, os metodos de IA podem ser usados para obter e representar conhecimento em processos de ensino e aprendizagem, oferecendo as ferramentas necessarias aos professores para reunir evidencias de maneira sistematica, detalhada e incremental em apoio as suas praticas pedagogicas.

Alguns fundamentos importantes para a adocao da perspectiva da contribuicao metodologica da IApara a Educacao foram estabelecidos Bundy (1986), que a categorizou em tres tipos: (i) IA basica, com o objetivo de explorar tecnicas computacionais para simular o comportamento inteligente, (ii) IA aplicada, focada em usar as tecnicas existentes de IA para criar produtos para atender necessidades do mundo real e (iii) ciencia cognitiva com foco no estudo da inteligencia humana ou animal por meios computacionais. Essa distincao permanece crucial na medida em que permite uma definicao mais precisa da IA na educacao, trazendo a tona a dependencia entre as tecnologias inteligentes e educacionais projetadas e a finalidade, o contexto e o design do seu uso (Mark, & Greer, 1993).

Apos esta conceituacao sobre IA na Educacao, foi realizada uma pesquisa na base Elsevier Scopus utilizando a expressao - education AND "artificial intelligence". 0 objetivo foi a recuperacao de forma mais abrangente. Entao, a pesquisa resultou em 51.768 documentos, no periodo de 1970 a 2020. A Figura 2 apresenta a evolucao dos quantitativos de documentos publicados no periodo. Observa-se que o pico de publicacoes ocorreu em 2017.

Os metadados da pesquisa bibliografica foram lidos pelo VOSviewer (Waltman, van Eck, & Noyons, 2010) e selecionada a opcao de coocorrencia de palavras-chave do autor. O software recuperou 73.533 palavras-chave. Foi selecionada a opcao de ocorrencia de pelo menos 50 vezes e sem emprego do arquivo de tesauros para o controle do vocabulario. A rede resultou em 359 palavras-chave, 4 clusters e 14.028 arestas.

Para melhorar a visualizacao da coocorrencia de palavras foi elaborado um arquivo de Tesauros, em que os termos genericos (metodologia, tecnologia, software, etc) foram eliminados e os termos com mesmo significados, mas com ortografias diferentes, foram atribuidos a um unico termo. Por exemplo, termos no singular e no plural, foram direcionados para apenas um deles. A rede de coocorrencia de palavras-chave foi gerada outra vez, mas com o arquivo de Tesauros e pelo menos 50 ocorrencias, resultando em 152 termos, 5 clusters e 3.557 arestas. A Figura 3 apresenta uma visualizacao da coocorrencia de termos das referencias recuperadas na pesquisa bibliografica.

Nota-se que os seguintes termos se destacam: education, e-learning, machine learning, teaching/learning strategies, intelligent tutoring systems, artificial intelligence, active learning, collaborative learning, entre outros. Contudo, alguns termos com baixa frequencia devem ser observados por oferecerem oportunidades de pesquisa, tais como: learning design, mainfold learning, problem-based learning, robotics, augmented reality, improving classroom teching, etc.

Para aprofundar a analise dos dados, foi usado o Gephi, um software de codigo aberto para exploracao e manipulacao de redes. A rede gerada pelo VOSviewer foi salva no formato GML para ser importado pelo Gephi, cujos modulos podem importar, visualizar, filtrar, manipular e exportar diversos tipos de redes (Bastian, Heymann, & Jacomy, 2009). Foram calculadas as metricas de grau medio, classe de modularidade e centralidade de autovetor.

A Figura 4 mostra o grafo resultante. Observa-se que alguns topicos se destacam: education, higher education, e-learning, collaborative learning, artificial intelligence. As arestas com maior espessura revelam o forte relacionamento entre estes topicos.

Contudo, o Gephi possui uma funcionalidade de Laboratorio de Dados, onde e possivel extrair informacoes sobre as metricas de redes. A Tabela 1 apresenta as 15 palavraschave com maiores centralidades de autovetor.. Observa-se que o termo com maior centralidade de autovetor e o e-learning.

A identificacao dos clusters foi realizada a partir da analise dos termos em cada comunidade. A Tabela 2 apresenta os termos de cada cluster.

Em seguida, as listas de termos e de arestas foram exportadas em formato CSV e recuperadas em uma planilha Excel, para serem analisadas no yEd (2), que e um software livre para edicao de grafos. Devido a limitacao de representacao do yEd, foram selecionadas as 30 palavras-chave mais relevantes sobre o tema e obtida a visualizacao dos termos artificial intelligence e education. O espaco conceituai e apresentado na Figura 5. E importante ressaltar que a inteligencia artificial na educacao nao pode ter foco apenas na tecnologia. Deve-se entender como a tecnologia podera sustentar novas estrategias de ensino e aprendizagem.

5. Discussao

A exploracao de um dominio do conhecimento, utilizando um espaco conceituai (Gardenfors, 2014), possibilita a visualizacao de relacoes entre palavras-chave representadas pelos conceitos ali incluidos (Dahlberg, 1978). Para a definicao da expressao de busca, e importante que o dominio tematico a ser analisado seja conceituado com foco na abrangencia da recuperacao de referencias bibliograficas.

No exemplo apresentado, foi recuperado uma grande quantidade de referencias, o que tornou inviavel a interpretacao dos resultados sem o auxilio de ferramentas computacionais. Outro ponto a destacar e que os metadados das referencias bibliograficas podem ser organizados em redes ou sistemas de conceitos. O mapeamento de coocorrencia de palavras-chave, por meio de analise de redes e da utilizacao de vocabulario controlado, constitui um sistema de conceitos que e muito util na analise de um dominio tematico (Moresi et al, 2019).

Para o mapeamento do tema inteligencia artificial e educacao, foram utilizados os recursos do VOSviewer, para a leitura dos metadados dos documentos, do Gephi, para o calculo das metricas de redes, e do yEd, para a representacao do espaco conceituai do dominio tematico. Os resultados mostraram que foram identificados 5 subdominios que constituem o tema analisado: tecnologia educacional, educacao, inteligencia artificial, sistemas inteligentes e assuntos pedagogicos. Esse ponto e importante, porque a tecnologia deve ser vista como meio enquanto a educacao como fim. Isso significa que as estrategias de ensino e aprendizagem deverao evoluir com o apoio da inteligencia artificial.

6. Conclusoes

O objetivo deste artigo foi apresentar e descrever uma metodologia de mapeamento de dominios de conhecimento utilizando ferramentas computacionais, que facilitam a elaboracao de sistemas de conceitos, expressoes de busca e significacao da informacao recuperada. O exemplo apresentado mostra a importancia da abrangencia de uma pesquisa bibliografica para a recuperacao de referencias.

Assim, as melhorias e o aumento das opcoes de visualizacao dos dados e informacoes, assim como a agregacao de recursos de semantica computacional, trazem novas possibilidades de insights cognitivos para o reconhecimento de padroes em sistemas conceituais complexos. Dessa forma, as solucoes relatadas no presente artigo aumentam a aplicabilidade e o uso efetivo de dados e informacoes em processos envolvendo o desenvolvimento e aplicacoes de inovacoes em Ciencia & Tecnologia, apontando tendencias, oportunidades e desafios em contextos mais organizados de dominios do conhecimento.

Em nivel mais operacional, as solucoes metodologicas e tecnologicas aqui apresentadas trazem facilidades nos processos de reuniao, processamento, compartilhamento e disseminacao do conhecimento, explorando o potencial de linguagens hibridas e complementares de representacao. Isso permite uma melhor apreensao desses conteudos informacionais em diversos niveis de reuso.

Como perspectivas futuras de pesquisa, sugere-se que sejam exploradas outras unidades de analise bibliometrica tais como redes de citacao, de cocitacao e de acoplamento bibliografico de documentos. Estes tipos de analises podem revelar fronteiras de pesquisa, bem com a estrutura cognitiva de um dominio tematico.

Referencias

Bassecoulard, E., & Zitt, M. (1999). Indicators in a research institute: A multi-level classification of scientific journals. Scientometrics, 44 (3), 323-345.

Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. In: Proceedings of the Third International ICWSM Conference, 361-362.

Bundy, A. (1986). What kind of field is artificial intelligence? In: DAI Research Paper No.305. Department of Artificial Intelligence, University of Edinburgh.

Mark, M.A., & Greer, J. (1993). Evaluation methodologies for intelligent tutoring systems. Journal of Artificial Intelligence in Education, 4,129-153.

Cahlik, T. (2000). Comparison of the maps of science. Scientometrics, 49(3), 373-387.

Callon, M., & Law, J. (1983). From translations to problematic networks: An introduction to co-word analysis. Social Science Information, 22,191-235.

Chen, C, &Song, M. (2017). Representing Scientific Knowledge: The Role of Uncertainty. Springer International Publishing.

Clauser, J., & Weir, S. M. (1976). Intelligence research methodology: An introduction to techniques and procedures for conducting research in defense intelligence. Washington: Defense Intelligence School.

Dahlberg, I. (1978). Teoria do conceito. Ciencia da informacao, 7(2), 101-107.

Erosheva, E., Fienberg, S., & Lafferty, J. (2004). Mixed-membership models of scientific publications. In Proceedings of National Academy of Sciences of the United States of America, 101, 5220-5227.

Gardenfors, P. (2014). The Geometry of Meaning: Semantics Based on Conceptual Spaces. Cambridge, MA: MIT Press.

Garfield, E. (1994). Scientography: Mapping the tracks of science. Current Contents: Social & Behavioural Sciences, 7(45), 5-10.

Griffiths, T. L., & Steyvers, M. (2004). Finding scientific topics. In Proceedings of National Academy of Sciences of the United States of America, 101, 5228-5235.

Hjorland, B. (1997). Information seeking and subject representation: an activity-theoretical approach to information science. Westport: Greenwood Press.

Levine, D., Strother-Garcia, K., Hirsh-Pasek, K., & Golinkoff, R. M. (2017). Names for things... and actions and events: following in the footsteps of Roger Brown. In Fernandez, E. M., & Cairns, H. S. (Ed.) (2017). The Handbook of Psycholinguistics. Hoboken, NJ: John Wiley & Sons, Inc.

Levy, P. (2011). The semantic sphere: computation, cognition, and information economy. Hoboken, NJ: John Wiley & Sons, Inc.

Leydesdorff, L. (1997). Why words and co-words cannot map the development of the sciences. Journal of American Society of Information Science, 48,418-427.

Moresi, E. A .D., Pierozzi Junior, L, Oliveira, L. H. M., & Brandao, A. M. (2019). Organizacao e representacao de conhecimento: incrementos metodologicos e tecnologicos para o mapeamento conceituai. Atas do 80 Congresso Ibero-Americano em Investigacao Qualitativa 2019, Lisboa, Portugal, 3, 269-278.

Nikolopoulos, C. (1997). Expert systems: introduction to first and second generation and hybrid knowledge based systems. New York: Marcel Dekker, Inc.

Noyons, E. C. M., Moed, H. F., & Luwel, M. (1999). Combining mapping and citation analysis for evaluative bibliometric purposes: a bibliometric study. Journal of American Society of Information Science, 50,115-131.

Oliveira, L. H. M. (2009). E-TERMOS: Um ambiente colaborativo web de gestao terminologica. (Tese de Doutorado em Ciencia da Computacao), Instituto de Ciencias Matematicas e de Computacao, Universidade de Sao Paulo, Sao Paulo.

Salvador, M. R., & Lopez-Martinez, R. E. (2000). Cognitive structure of research: Scientometric mapping in sintered materials. Research Evaluation, 9,189-200.

Shiffrin, R. M., & Borner, K. (2004). Mapping knowledge domains. In Proceedings of the National Academy of Sciences of the United States of America, 101 (Suppl 1), 5183-5185.

Soergel, D. (2008). Digital Libraries and Knowledge Organization Systems. In Kruk, S. (Ed.) (2008). Semantic Digital Libraries. Berlin: Springer.

Torres, T. Z., Pierozzi Jr, L, Pereira, N. R., &De Castro, A. (2011). Knowledge management and communication in Brazilian agricultural research: An integrated procedural approach. International Journal of Information Management, 31(2), 121-127.

Waltman, 1., van Eck, N. J., & Noyons, E. C. M. (2010). A unified approach to mapping and clustering of bibliometric networks. Journal of Informetrics, 4 (4), 629-635.

Wilson, T. D. (2002). The nonsense of knowledge management. Information Research, 8(1), 1-8.

Yworks (nd). yEd Graph Editor: High-quality diagrams made easy. Retrieved from https://www.yworks.com/products/yed.

Zhao, D., & Strotmann, A. (2008). Evolution of research activities and intellectual influences in information science 1996-2005: Introducing author bibliographic-coupling analysis. Journal of the American Society for Information Science and Technology, 59 (13), 2070-2086.

Eduardo Amadeu Dutra Moresi (1,3), Ivo Pierozzi Junior (2), Leandro Henrique Mendonca de Oliveira (2), Alessandra de Moura Brandao (3)

moresi@ucb.br; emoresi@cgee.org.br; ivo.pierozzi@embrapa.br; leandro.oliveira@embrapa.br; abrandao@cgee.org.br

(1) Universidade Catolica de Brasilia, QS 07 Lote 01 EPCT Bloco N, 71966-700, Brasilia, DF, Brasil

(2) Afiliacao do Autor Dois, Morada, Codigo postal, Localidade, Pais

(3) Centro de Gestao e Estudos Estrategicos, Morada, Codigo postal, Localidade, Pais

(1) "Inteligencia e a informacao avaliada" (Clauser & Weir, 1976)

(2) Disponivel em: https://www.yworks.com/products/yed

Recebido/Submission: 12/07/2019

Aceitacao/Acceptance: 22/08/2019

DOI: 10.17013/risti.33.63-77
Tabela 1 - Termos mais relevantes por centralidade de autovetor

Termo                         Cluster                     Grau

e-learning                    1. Educational technology   148
education                     2. Education                130
teaching/learning strategies  2. Education                128
collaborative learning        1. Educational technology   125
intelligent tutoring systems  4. Intelligent systems      120
higher education              1. Educational technology   114
mobile learning               1. Educational technology    97
machine learning              3. Artificial intelligence  107
artificial intelligence       3. Artificial intelligence   99
active learning               5. Pedagogical issues        99
learning management systems   1. Educational technology    91
human computer interaction    2. Education                 91
gamification                  2. Education                 89
serious games                 2. Education                 91
massive open online courses   1. Educational technology    89

Termo                         Centralidade de Autovetor

e-learning                    1,0000
education                     0,9361
teaching/learning strategies  0,9266
collaborative learning        0,9141
intelligent tutoring systems  0,8750
higher education              0,8588
mobile learning               0,7707
machine learning              0,7646
artificial intelligence       0,7636
active learning               0,7624
learning management systems   0,7221
human computer interaction    0,7220
gamification                  0,7156
serious games                 0,7125
massive open online courses   0,7089

Tabela 2 - Palavras-chave de cada cluster

Cluster          Cluster

                 blended learning; cognitive load; collaborative
                 learning; computer supported collaborative learning;
                 context-awareness; crowdsourcing; e-assessment;
                 e-learning; educational technology; facebook;
                 formative assessment; higher education; hybrid
                 learning; informal learning; inquiry-based learning;
                 instructional design; knowledge
1. Educational   sharing; learning analytics; learning design; learning
   technology    environments; learning management systems; learning
                 objects; learning outcomes; learning styles; lifelong
                 learning; massive open online courses; mobile
                 learning; mobile technology; open educational
                 resources; peer assessment; personalized learning;
                 recommender systems; social learning; social media;
                 social networking; social networks; student
                 performance; technology-enhanced learning; twitter;
                 ubiquitous learning; virtual laboratory; virtual
                 learning environments; virtual worlds; web 2.0;
                 web-based learning. ambient intelligence; assistive
                 technology; augmented reality; cognition;
                 communication; creativity; design education; design
                 thinking; digital libraries; education; educational
                 games; educational robotics; edutainment; ethics; game
                 design; game-based learning; gamification; human
                 computer interaction; human factors; human-robot
                 interaction;
2. Education     information security; information technology;
                 innovation; interaction design; language learning;
                 learning Technologies; mixed reality; mobile
                 application; mobile devices; multimidia; participatory
                 design; robotics; serious games; special education;
                 storytelling; teacher education; teaching/learning
                 strategies; ubiquitous computing; user experience;
                 user interface; user-centered design; virtual reality.
                 academic performance; artificial intelligence; big
                 data; case-based reasoning; data Science; databases;
                 decision making; deep learning; dimensionality
                 reduction; ensemble learning; expert systems; extreme
                 learning machine; face recognition;
3. Artificia]    incremental learning ;industry 4.0; information
   intelligence  extraction; intelligent systems; nternet of things;
                 knowledge acquisition; knowledge Discovery; knowledge
                 engineering; knowledge management; machine learning;
                 manifold learning; multi-agent systems; neural
                 networks; q-learning; reinforcement learning; speech
                 recognition; transfer learning.
                 adaptive hypermedia; authoring tools;
                 computer-assisted instruction; computer-mediated
                 communication; elementary education; evaluation
                 methodologies; improving
4. Intelligent   classroom teaching; intelligent tutoring systems;
   systems       interactive learning environments; item response
                 theory; media in education; metacognition; pedagogical
                 agents; primary education; secondary education;
                 self-regulated learning; student model; student
                 modeling; user modeling; web-based education.
                 active learning; computational thinking; computer
                 supported learning; computing
5. Pedagogical   education; constructivism; cooperative learning;
   issues        critical thinking; experiential learning; flipped
                 classroom; pedagogical issues; problem-based learning;
                 project-based earning; student engagement; teacher
                 training.
COPYRIGHT 2019 AISTI (Iberian Association for Information Systems and Technologies)
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2019 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Moresi, Eduardo Amadeu Dutra; Junior, Ivo Pierozzi; de Oliveira, Leandro Henrique Mendonca; Brandao,
Publication:RISTI (Revista Iberica de Sistemas e Tecnologias de Informacao)
Date:Sep 1, 2019
Words:6068
Previous Article:Estudio de las opiniones de los futuros maestros sobre el uso de los videojuegos como recurso didactico a traves de un analisis cualitativo.
Next Article:Prevencao e enfrentamento da violencia de genero por meio de jogos educativos: uma revisao de escopo.
Topics:

Terms of use | Privacy policy | Copyright © 2020 Farlex, Inc. | Feedback | For webmasters